Επεξεργασία εικόνας
Επεξεργασία εικόνας ονομάζεται κάθε μορφή αλγοριθμικής επεξεργασίας, ανάλυσης και χειρισμού ψηφιακών δεδομένων εικόνας ή βίντεο, όπως και το σχετικό επιστημονικό πεδίο της πληροφορικής. Στην επεξεργασία εικόνας, τόσο η είσοδος όσο και η έξοδος των υπολογισμών είναι δεδομένα εικόνας / βίντεο (έγχρωμα, ασπρόμαυρα ή σε αποχρώσεις του γκρίζου). Από την επεξεργασία εικόνας εκπορεύονται επίσης και αλγόριθμοι ανάλυσης / κατανόησης εικόνας[1], αλλά εκεί υφίσταται επικάλυψη με το συγγενές γνωστικό πεδίο της τεχνητής νοημοσύνης ονόματι μηχανική όραση. Μεγάλο μέρος του επιστημονικού υποβάθρου της επεξεργασίας εικόνας παρέχεται από την επεξεργασία σήματος, καθώς η ψηφιακή εικόνα μπορεί να θεωρηθεί δισδιάστατο χωρικό σήμα και το βίντεο τριδιάστατο χωροχρονικό σήμα.
Τύποι επεξεργασίας
[Επεξεργασία | επεξεργασία κώδικα]- Γεωμετρικές μετατροπές: Αλλαγή στο μέγεθος ολόκληρης ή τμήματος της εικόνας, περιστροφή, παραμόρφωση, αλλαγή προοπτικής, αλλαγή ανάλυσης (σε ψηφιογραφικές εικόνες) κτλ.
- Χρωματικές μετατροπές και διορθώσεις: Αλλαγή των χρωματικών τόνων μιας εικόνας, ρύθμιση φωτεινότητας, αντίθεσης, αλλαγή του χρωματικού χώρου (μοντέλου), π.χ. από RGB σε CMYK.
- Συμπίεση και μετατροπή της μορφής αποθήκευσης μιας εικόνας στον υπολογιστή (file conversion), π.χ. από μορφή .jpg σε μορφή .tif.
- Εφαρμογή φίλτρων με στόχο τη βελτίωση της ποιότητας της εικόνας ή τον τονισμό γνωρισμάτων της (αφαίρεση αμυχών, εξάλειψη φαινομένου «κόκκινων ματιών» από εικόνες προσώπων, ανίχνευση ακμών και τονισμός των περιγραμμάτων, μείωση θορύβου κτλ).
- Ανάμιξη δύο ή περισσότερων εικόνων ώστε να αποτελούν μία (φωτομοντάζ).
- Κατάτμηση της εικόνας σε περιοχές, με στόχο τον καθορισμό των τομέων ενδιαφέροντος στην εικόνα (Regions of Interest, ROI). Ενδεικτικά, μπορεί να γίνει δυαδική κατάτμηση σε προσκήνιο και παρασκήνιο.
- Αποκατάσταση, με στόχο την εξαγωγή μίας «ορθής» εκδοχής της εικόνας από μία ενθόρυβη / θολωμένη / παραμορφωμένη εικόνα εισόδου.
Ανεξάρτητα από την κατηγορία επεξεργασίας, όπως αναφέρθηκε πιο πάνω, η διαδικασία σχεδίασης και υλοποίησης των αλγορίθμων επεξεργασίας απαιτεί πολύ καλές γνώσεις μαθηματικών. Το σύγχρονο, έτοιμο λογισμικό επεξεργασίας απαλλάσσει, φυσικά, το χρήστη από την ανάγκη να διαθέτει αυτές τις γνώσεις[2].
Εφαρμογές και σχέση με άλλα επιστημονικά πεδία
[Επεξεργασία | επεξεργασία κώδικα]- Γραφιστική
- Φωτογραφία
- Επεξεργασία εικόνας για ιατρικούς σκοπούς
- Ανάλυση μικροσκοπικών παρατηρήσεων
- Ταυτοποίηση προσώπων (σύγκριση στα χαρακτηριστικά προσώπου, δακτυλικών αποτυπωμάτων κτλ.)
- Εφαρμογές στην τεχνητή νοημοσύνη: μηχανική όραση
Σε σχέση με άλλα, συγγενή γνωστικά πεδία, η ψηφιακή επεξεργασία εικόνας διαφοροποιείται ως εξής:
- Η ψηφιακή επεξεργασία εικόνας εξετάζει αλγορίθμους οι οποίοι δέχονται ως είσοδο εικόνες / βίντεο και παράγουν ως έξοδο εικόνες / βίντεο.
- Τα γραφικά υπολογιστή εξετάζουν αλγορίθμους οι οποίοι δέχονται ως είσοδο συμβολικές περιγραφές οπτικών σκηνών και παράγουν ως έξοδο εικόνες / βίντεο (με ή χωρίς αλληλεπίδραση με τον χρήστη).
- Η μηχανική όραση εξετάζει αλγορίθμους οι οποίοι δέχονται ως είσοδο εικόνες / βίντεο και παράγουν συμβολικές περιγραφές των εν λόγω οπτικών σκηνών.
Παραπομπές
[Επεξεργασία | επεξεργασία κώδικα]- ↑ Πολυτεχνική Σχολή Delft Ολλανδίας
- ↑ Πληροφορική Γυμνασίου, Δαμιανάκης, Τζαβάρας, Μαβόγλου, Νταντουρής, εκδ. ΟΕΔΒ, Αθήνα 2000
Πηγές
[Επεξεργασία | επεξεργασία κώδικα]- Ψηφιακή Επεξεργασία Εικόνας, Πήτας Ι., 2010