Χειμερινό Εξάμηνο 2013-2014 Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση 4 η Παρουσίαση : Επεξεργασία Εικόνας Διδάσκων: Γιάννης Ντόκας
Εισαγωγή στις Έννοιες των Εικόνων Στο χώρο των πολυμέσων χρησιμοποιείται ο όρος εικόνα ή γραφικά για να περιγράψει ένα σχέδιο, ένα διάγραμμα, ένα πίνακα ζωγραφικής, μία φωτογραφία. Η εικόνα έχει γίνει απαραίτητο στοιχείο κάθε σύγχρονης εφαρμογής ανεξάρτητα από το αν η ίδια αποτελεί ή όχι θεματικό αντικείμενο της εφαρμογής, οπότε εκ των πραγμάτων ο ρόλος της είναι πρωτεύων. Άλλωστε είναι πασίγνωστο ότι μια εικόνα αξίζει όσο χίλιες λέξεις. Τα γραφικά στοιχεία στην οθόνη μπορούν συνήθως να αλλάζουν μέγεθος κλιμακωτά, να χρωματίζονται, να γίνονται διαφανή, να τοποθετούνται μπροστά ή πίσω από άλλα αντικείμενα, ακόμα και να καθορίζεται το αν είναι ορατά ή αόρατα. Η ενσωμάτωση γραφικών σε μία εφαρμογή πολυμέσων δεν είναι απαραίτητη μόνο για την περιγραφή του πληροφοριακού υλικού αλλά υποστηρίζει επιπλέον και την αλληλεπίδραση χρήστηεφαρμογής.
Ορισμός Εικόνας
Ορισμός Εικόνας
Εισαγωγή στις Έννοιες των Εικόνων
Ψηφιοποίηση Χρήση frame grabber Κάθε δείγμα i(n1,n2) ονομάζεται στίγμα (pixel) Kάθε στίγμα αναπαράγεται από b bits
Χρήση Εικόνων Φωτογραφίες θεματικού αντικειμένου Γραφικές παραστάσεις Εικονική Πραγματικότητα Τρισδιάστατα γραφικά
Περιοχές Ψηφιακής Επεξεργασίας Εικόνας Βελτίωση της ποιότητας της εικόνας Shape Description Region Analysis Texture Analysis Motion Analysis Compression 3D Analysis and Representation Storage
Δειγματοληψία Η εικόνα πρέπει να μετατραπεί σε ψηφιακή ώστε να μπορεί να υποστεί ψηφιακή επεξεργασία Λαμβάνουμε ισαπέχοντα δείγματα της συνάρτησης f(x,y) στις διευθύνσεις x και y. Η πυκνότητα με την οποία θα ληφθούν τα δείγματα καθορίζεται και στην περίπτωση αυτή (δισδιάστατη συνάρτηση στο χώρο) από το θεώρημα δειγματοληψίας: Η απόσταση δύο διαδοχικών δειγμάτων στο επίπεδο (x,y) θα πρέπει να είναι μικρότερη από την ημιπερίοδο των ταχύτερων εναλλαγών συχνότητας της συνάρτησης f(x,y).
Ψηφιακή Εικόνα Η εικόνα αποτελεί μία πηγή πληροφορίας. εικόνα ακίνητη (φωτογραφία) κινούμενη (τηλεόραση) Επίσης: ασπρόμαυρη έγχρωμη. Μαθηματική περιγραφή του περιεχομένου της: f f(x,y) Στην ουσία η f περιγράφει την αμαύρωση της εικόνας σε κάθε θέση (x,y).
Θόρυβος Καταγραφής
Δομή Εικόνας Η ψηφιακή εικόνα αποτελείται από μικρές κουκίδες τα εικονοστοιχεία (pixels). Ασπρόμαυρη εικόνα: Κάθε ένα εικονοστοιχείο είναι ένα δείγμα από τη συνάρτηση f(x,y) που αντιστοιχεί στην αναλογική εικόνα. Τα λευκά εικονοστοιχεία αντιστοιχούν στο 255 ενώ τα μαύρα στο 0. Η ψηφιακή εικόνα παριστάνεται μαθηματικά ως η κβαντισμένη σε πλάτος συνάρτηση: n1 και n2 αντιστοιχούν στις διακριτές χωρικές μεταβλητές x και y. Έγχρωμη εικόνα: σε κάθε θέση (n1,n2) η f έχει τρεις τιμές, τιμές των χρωμάτων κόκκινο, πράσινο και μπλε το σήμα είναι διακριτό και ως προς το χρόνο (t n3):
Γεωμετρία Η κατανομή της πληροφορίας (βαθμός αμαύρωσης ή χρώμα) στο επίπεδο (x,y). Ο προσανατολισμός των συντεταγμένων σε μία ψηφιακή εικόνα μπορεί να είναι αυθαίρετος. συνήθως η αρχή των συντεταγμένων (n1,n2)=(1,1) λαμβάνεται στην επάνω αριστερή γωνία της εικόνας Κάθε ένα εικονοστοιχείο έχει τις δικές του συντεταγμένες. Συνεπώς μία εικόνα που έχει M εικονοστοιχεία στη διεύθυνση n1 και N στη διεύθυνση n2, περιέχει συνολικά Ν Μ εικονοστοιχεία.
Εικόνα versus Κείμενο 500 λέξεις των 5 χαρακτήρων κατά μέσο όρο και κωδικοποίηση 8-bit ανά χαρακτήρα 5*500*8=20000 bits Μια εικόνα 640 Χ 480 pixels Μαυρόασπρη=>640 Χ 480 Χ 1=307200=37.5 KByte Αποχρώσεων του γκρί με βάθος χρώματος 8 bit=> 640 Χ 480 Χ 8=2457600 = 300 KByte Έγχρωμη=> 640 Χ 480 Χ 8 Χ 3=900 ΚByte
Είδη Ψηφιακών Εικόνων
Αναπαράσταση Εικόνας (1) Γενικά Διτονικές εικόνες (bitonal)-μαύρο/άσπρο Εικόνες συνεχούς τόνου Κλίμακες Γκρίζου Έγχρωμες Βασικές αποφάσεις Αριθμός γραφικών στιγμάτων (pixels-picture elements) Βάθος χρώματος (δυνατές τιμές-intensity values για κάθε γραφικό στίγμα) Άλλες αποφάσεις Μέγεθος (βαθμός και αλγόριθμος συμπίεσης), τύπος (format) αποθήκευσης
Αναπαράσταση Εικόνας (2) bit=2 επίπεδα 2bit=4 επίπεδα 8bit=256 επίπεδα
Παλέτα Χρωμάτων Ο αριθμός των αποχρώσεων που μπορεί να αποδώσει κάθε εικονοστοιχείο εξαρτάται από τον αριθμό των bit που χρησιμοποιούνται εσωτερικά για την περιγραφή του χρώματος 1 bit -> άσπρο, μαύρο 1 byte -> 256 χρώματα 2 byte -> 65536 χρώματα 3 byte -> 16777216 χρώματα
Ανάλυση Εικόνας Αναφέρεται στην πυκνότητα τοποθέτησης των γραφικών, όταν μιλάμε για εικόνες, ή στην πυκνότητα τοποθέτησης των κρυστάλλων όταν μιλάμε για οθόνες Μέτρηση: Dot per inch Εάν μια εικόνα έχει ανάλυση 72 dpi, τότε μπορεί να εμφανίσει 72 X 72 = 5184 pixels Όσο μεγαλύτερη είναι η ανάλυση μιας εικόνας τόσο περισσότερη πληροφορία (pixels) περιέχει
Bitmap versus Vector
Χαρτογραφικές Εικόνες (Bitmap) Αποθηκεύουν μια σειρά τιμών που παριστάνουν την πληροφορία χρώματος για το κάθε εικονοστοιχείο Η αναπαραγωγή γίνεται προβάλλοντας στην οθόνη την πληροφορία χρώματος Μεγένθυνση=>Μείωση η ανάλυση παρουσίασης
Διανυσματικές Εικόνες (Vectors) Δημιουργούνται από ειδικά προγράμματα διανυσματικού ή γραμμικού σχεδίου. Αποτελούνται από ένα σύνολο γραμμών και γεμισμάτων τα οποία, αφού συνενωθούν, δίνουν την αίσθηση της συμπαγούς εικόνας Βασίζονται σε ειδικά μαθηματικά μοντέλα σχεδίασης Δυνατότητα μεγέθυνσης της εικόνας χωρίς παραμορφώσεις. Μικρότερο μέγεθος Δυνατότητα ευκολότερης επεξεργασίας
ΣΥΓΚΡΙΣΗ Είδος Εικόνας Χρήσεις Πλεονεκτήματα Χαρτογραφικές Εικόνες συνεχούς τόνου, π.χ. Φωτογραφίες Ιστοσελίδες Υψηλός βαθμός φωτορεαλισμού στην απόδοση της εικόνας Διανυσματικές Σε περιπτώσεις εικόνων που λίγα σχετικά χρώματα που χρειάζεται να παρουσιαστούν σε διάφορες αναλύσεις Ανεξάρτητες από την ανάλυση Ομαλή αναπαράσταση καμπυλών Μικρό μέγεθος αρχείου
Βασικά Μεγέθη Ανάλυση (resolution): Εκφράζει την πυκνότητα των εικονοστοιχείων της εικόνας σε κάθε διάσταση και μετριέται σε σημεία ανά ίντσα (dots per inch, dpi). Χρωματικό βάθος (color depth): Ως βάθος χρώματος ορίζεται ο αριθμός των bits που χρησιμοποιούνται για την αποθήκευση πληροφορίας μιας κουκίδας και σχετίζεται με τον αριθμό των χρωμάτων που είναι διαθέσιμα για την δημιουργία μιας εικόνας.
Συνήθεις Τιμές Ανάλυσης Οθόνης Ανάλυση Οθόνης Pixels Οριζόντια Pixels Κάθετα Τεχνικός Χαρακτ. 640 Χ 480 640 480 VGA 800 Χ 600 800 600 SVGA 1024 Χ 768 1024 768 SVGA 1280 Χ 1024 1280 1024 SVGA
Διαμορφώσεις Αποθήκευσης Εικόνων (1) RIFF (Resource Interchange Image Format) Αποθηκεύει και άλλα στοιχεία πέρα από την ανάλυση και το βάθος χρώματος (π.χ. Δημιουργός, Ημερομηνία, Σχόλια κτλ) Βάση Δεδομένων ΒΡΙΜ Βάση Δεδομένων Παρόμοια μορφή με το RIFF Επιπλέον και ιστορικό (διαδικασία παραγωγής ή τροποποίησης)
Διαμορφώσεις Αποθήκευσης Εικόνων (2) Postscript: Αναπτύχθηκε το 1984 από την Adobe Ήταν η πρώτη φορά που οι γραμματοσειρές κέρδισαν την προσοχή του κοινού Λειτουργικότητα: Ενσωμάτωση υψηλής ποιότητας κειμένου, γραφικών και εικόνων Γλώσσα προγραμματισμού (πολύ ευέλικτη, Μεταβλητές, δομές ελέγχου και αρχεία) Postscript Επιπέδου-1:1980 Μεταβλητό μέγεθος γραμματοσειρών Πρόβλημα: δεν υπήρχαν πρότυπα για το γέμισμα των άκρων των γραμμάτων=>μέτρια ποιότητα Postscript Επιπέδου-2: Γέμισμα υψηλής ποιότητας Μεγαλύτερος αριθμός γραφικών Εισαγωγή βάθους χρώματος εξαρτημένων και μη εξαρτημένων συσκευών ΜΕΤΑΒΑΣΗ ΣΤΟ: PORTABLE DOCUMENT FORMAT (PDF)
Διαμορφώσεις Αποθήκευσης Εικόνων (3) Graphics Interchange Format (GIF) Αναπτύχθηκε από την CompuServe το 1987 Στόχος: Η ανταλλαγή εικόνων σε μηχανές ανεξάρτητες πλατφόρμας Κύρια Συστατικά: κεφαλή (ταυτοποίηση και έκδοση) εφαρμογή (το λογισμικό λειτουργίας της εικόνας) Δεδομένα ουρά (bit ελέγχου) Συμπίεση: Lempel-Ziv-Algorithm Περιορίζει πρότυπα ακολουθιών bit που εμφανίζονται συχνά Κωδικοποίηση μεταβλητού μεγέθους Μέγεθος παλέτας χρωμάτων: 256 Σχόλιο Καλοσχεδιασμένο πρότυπο για ακολουθίες εικόνας Πολύ συνηθισμένο στο Internet GIF89a Περιλαμβάνει πολλές εικόνες σε ένα αρχείο Οι εικόνες εναλλάσονται στην οθόνη με γρήγορο ρυθμό (animation)
Διαμορφώσεις Αποθήκευσης Εικόνων (4) Tagged Image File Format (TIFF) Αναπτύχθηκε από τις εταιρίες Aldus Co. και Microsoft Λειτουργικότητα Να υποστηρίζει ανταλλαγή εικόνας ανεξάρτητα από την πλατφόρμα της μηχανής Ευρεία αποδοχή και χρήση από scanner και fax (H πληροφορία να αποθηκεύεται ασυμπίεστη χωρίς απώλεια) Κύρια Συστατικά: Βασικό μέρος (περιορισμοί για τον τρόπο απεικόνισης από τις συσκευές και τα προγράμματα προβολής Περιορισμοί για την χρωματική απεικόνιση Συμπίεση Πολλαπλά χρωματικά μοντέλα Δυαδικές εικόνες Αποχρώσεις του γκρι RGB Σχόλιο: το πρότυπο TIFF ενδείκνυται για προεπισκόπηση αρχείων για προσπέλαση ασυμπίεστων εικόνων
Διαμορφώσεις Αποθήκευσης Εικόνων (5) BitMap (BMP) Συχνή χρήση σε συστήματα Windows (Π.χ. Paint) Βασίζεται στο μοντέλο RGB Κατά κανόνα, χωρίς συμπίεση της αρχικής εικόνας Βάθος χρώματος: 1,4,8 ή 24 bit Στα 4 ή 8 bit εφαρμόζεται συμπίεση κωδικοποίησης μήκους διαδρομής 2 τμήματα Επικεφαλίδα Μέγεθος, βάθος χρώματος Δεδομένα Τιμή ανά pixel ανά γραμμή
Διαμορφώσεις Αποθήκευσης Εικόνων (6) JPEG (Joint Photographics Expert Group) Διατηρεί όλη την ποικιλία των RGB χρωμάτων Μικρό μέγεθους αρχείων Χρήση αλγορίθμων συμπίεσης (Απωλεστική Συμπίεση-Lossy Compression)
Στοιχεία Θεωρίας Χρωμάτων (1) Οι ακτινοβολίες που γίνονται ορατές από το ανθρώπινο μάτι κυμαίνονται [400 nm-700 nm] Όταν οι ακτινοβολίες με μήκος κύματος μεταξύ αυτών των ορίων προσπίπτουν στο ανθρώπινο μάτι προκαλούν χρωματικές αισθήσεις ανάλογες με το μίγμα συχνοτήτων που περιέχουν Το ανθρώπινο μάτι περιέχει 2 κατηγορίες κυττάρων Τους κώνους Τους ράβδους
Στοιχεία Θεωρίας Χρωμάτων (2) Το πλήθος των κώνων στο ανθρώπινο μάτι είναι περίπου 6-7 εκατομμύρια, συγκεντρωμένα στο κέντρο του αμφιβληστροειδούς χιτώνα Κάθε κώνος αντιδρά σε ένα περιορισμένο εύρος συχοτήτων επιτρέποντας στο μάτι να διακρίνει χρωματικές λεπτομέρειες. Οι ράβδοι είναι 75-100 εκατομμύρια και είναι διασκορπισμένοι στην περιφέρεια του αμφιβληστροειδούς Είναι ευαίσθητα σε μικρά επίπεδα έντασης του φωτός επιτρέποντας στην περιφερειακή όραση να εντοπίζει κίνηση ή μορφές σε αρκετά χαμηλό φωτισμό.
Βασικά χαρακτηριστικά χρώματος (1) Ακτινοβολία (Radiance) είναι το συνολικό ποσό ενέργειας που εκπέμπεται από την πηγή φωτός. Μετράται σε Watts. Φωτεινότητα (Luminance) είναι μία εκτίμηση του ποσού της ενέργειας που φτάνει στον παρατηρητή. Μετράται σε lumens (lm). Λαμπρότητα (Brightness) είναι ένας υποκειμενικός παράγοντας. Εμπεριέχει το στοιχείο της φωτεινότητας (Intensity), που είναι ο αχρωματικός παράγοντας. Τα επίπεδα του γκρι είναι κλίμακα μέτρησης της έντασης.
Βασικά χαρακτηριστικά χρώματος (2) Απόχρωση (χροιά) (Hue) αντιπροσωπεύει το επικρατέστερο χρώμα έτσι όπως το αντιλαμβάνεται ο παρατηρητής. Καθαρότητα (κορεσμός) (Saturation) αναφέρεται στην καθαρότητα του χρώματος, σε σχέση με το ποσό άσπρου φωτός με το οποίο αναμειγνύεται. Λαμπρότητα (Brightness) είναι ένας υποκειμενικός παράγοντας. Εμπεριέχει το στοιχείο της φωτεινότητας (Intensity), που είναι ο αχρωματικός παράγοντας. Τα επίπεδα του γκρι είναι κλίμακα μέτρησης της έντασης.
Θεωρία Χρώματος (1) Βασικά Χρώματα Κόκκινο (Red) Πράσινο (Green) Μπλε (Blue) Συμπληρωματικά χρώματα Κυανό (Cyan) Μωβ (Magenta Κίτρινο (Yellow)
Θεωρία Χρώματος (2) Βασικά χρώματα Συμπληρωματικά χρώματα
Χρωματικά Μοντέλα RGB (1) Περιγράφεται η χρωματική ένταση κάθε κουκίδας χρησιμοποιώντας τρία χρωματικά κανάλια. Έχει βρεθεί ότι οποιοδήποτε χρώμα μπορεί να συντεθεί ανακατεύοντας όχι περισσότερα από τρία άλλα χρώματα. Η τριάδα των χρωμάτων που μπορούν να χρησιμοποιηθεί δεν είναι μοναδική. Τα βασικά χρώματα που χρησιμοποιούνται είναι το κόκκινο, το πράσινο και το μπλε (Red, Green, Blue RGB). Το ποσοστό συνεισφοράς κάθε βασικού χρώματος ορίζεται στο διάστημα από 0 (μαύρο) έως 255 (λευκό) ή ανάλογα 65535 στο τρισδιάστατο RGB
Χρωματικά Μοντέλα RGB (2) Στο RGB μοντέλο, τα χρώματα θεωρούνται προσμίξεις των βασικών χρωμάτων Κόκκινο, Πράσινο, Μπλε. Το μοντέλο βασίζεται στο καρτεσιανό σύστημα και αναπαριστάται με τον RGB κύβο. Χρησιμοποιείται στην απεικόνιση χρωμάτων στις οθόνες και γενικά στα συστήματα απεικόνισης.
Χρωματικά Μοντέλα RGB (3) Κόκκινο Πράσινο Μπλε Χρώμα 65535 65535 65535 Λευκό 65535 65535 0 Κίτρινο 65535 0 65535 Magenta- Βαθύ κόκκινο 0 65535 65535 Κυανό 65535 0 0 Κόκκινο 0 65535 0 Πράσινο 0 0 65535 Μπλε 0 0 0 Μαύρο
Χρωματικά Μοντέλα RGB (4) Κάθε εικόνα αποτελείται από 3 υπο-εικόνες, μία για κάθε βασικό χρώμα. Κόκκινο Πράσινο Μπλε
HSB-HSL (1) Με τις μεθοδολογίες HSB (Hue, Saturation, Brightness) και HSL (Hue, Saturation, Lightness) μπορούμε να καθορίσουμε την απόχρωση (hue) με γωνιακούς όρους (από 0 έως 360 βαθμούς) και τις παραμέτρους κορεσμού (Saturation), φωτεινότητας (Brightness) ή σκίασης (Lightness). Οι παράμετροι φωτεινότητας (Brightness) ή σκίασης (Lightness) με το ποσοστό συμμετοχής τους αντιστοιχούν στο ποσοστό μίξης του μαύρου ή λευκού με το χρώμα. Ποσοστό 100% στη σκίαση αντιστοιχεί στο λευκό χρώμα ενώ 0% αντιστοιχεί στο μαύρο. Το καθαρό χρώμα αντιστοιχεί σε ποσοστό 50% σκίασης. Τα αντίστροφα ποσοστά ισχύουν και στην παράμετρο φωτεινότητας. Ο κορεσμός (Saturation) είναι η ένταση του χρώματος. Ποσοστό 100% κορεσμού αντιστοιχεί στο καθαρό χρώμα. Ποσοστό 0% αντιστοιχεί σε άσπρο, μαύρο ή γκρι χρώμα ανάλογα με την απόχρωση (hue).
Βαθμοί Απόχρωσης Χρώμα Κόκκινο Κίτρινο Πράσινο Κυανό Μπλε Magenta - Βαθύ κόκκινο Βαθμοί 0 ο 60 ο 120 ο 180 ο 240 ο 300 o
CMYK (1) Το μοντέλο αυτό βασίζεται στη χρήση τεσσάρων χρωμάτων (Κυανό, Magenta Βαθύ κόκκινο, Κίτρινο) για το χρωματικό διαχωρισμό. Δεν χρησιμοποιείται συνήθως στις εφαρμογές πολυμέσων αλλά στον διαχωρισμό χρωμάτων στις εκτυπωτικές διαδικασίες.
CMYK (2) Το μοντέλο αυτό είναι αντίστοιχο με το RGB και χρησιμοποιείται στην έγχρωμη εκτύπωση. Στην πράξη προστίθεται επιπλέον το μαύρο χρώμα για καλύτερα οπτικά αποτελέσματα.
CMYK (3) Κάθε εικόνα αποτελείται από 4 υπο-εικόνες. Κυανό Μωβ Κίτρινο Μαύρο
HSI (1) Στο HSI μοντέλο, τα χρώματα αναπαριστώνται από δύο χρωματικούς παράγοντες (Hue & Saturation) και την φωτεινότητά (Intensity). Χρησιμοποιείται για την περιγραφή των χρωμάτων με βάση την ανθρώπινη αντίληψη.
HSI (2) Μία πρακτική οπτική αναπαράσταση για το HSΙ σύστημα, επιτυγχάνεται εάν περιστρέψουμε τον RGB κύβο έτσι ώστε στον κάθετο άξονα να βρίσκεται η ευθεία που ενώνει τις γωνίες του μαύρου και του άσπρου. S I H
HSI (3) Κάθε εικόνα αποτελείται από 3 υπο-εικόνες, μία για κάθε συνιστώσα. Απόχρωση Καθαρότητα Ένταση
Ψευδοχρωματισμός (1) Ψευδοχρωματισμός ονομάζεται η επεξεργασία εικόνας κατά την οποία αναθέτονται χρώματα σε τιμές του γκρι, σύμφωνα με κάποιο προκαθορισμένο κριτήριο.
Ψευδοχρωματισμός (2) Τεμαχισμός έντασης Έστω 0, L 1 τα επίπεδα του γκρι. Ορίζουμε κατώφλια, P i,1 i p και αναθέτουμε χρώματα σύμφωνα με την f x, y c, όταν x y f, P i 1, P i k Τεμαχισμός με ένα κατώφλι
Άλλα Μοντέλα CIE Κάθε χρώμα ορίζεται από τις παραμέτρους συχνότητας (frequency), κορεσμό (Saturation) και απόλυτη φωτεινότητα (luminance). YIQ, YUV Χρησιμοποιούνται στη μετάδοση τηλεοπτικού σήματος. Βασικοί παράμετροι είναι η φωτεινότητα (luminance) και της chrominance. Photo YCC Αναπτύχθηκε από την Kodak για τον ορισμό της αναπαράστασης ψηφιακών έγχρωμων εικόνων από slides κ.α. Το μοντέλο αυτό χρησιμοποιείται στις PhotoCD εικόνες