ΗΜΥ 007 Τεχνολογία Πληροφορίας Διάλεξη 7 Οπτική Πληροφορία Μέρος Β TΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Περίληψη Θέματα για σήμερα Επανάληψη και ολοκλήρωση Απεικόνιση πληροφορίας Δημιουργία εικόνας Αναπαράσταση εικόνας Ψηφιακή εικόνα, κβαντισμός Απόδοση χρώματος (αποχρώσεις γκρίζου, πλήρες χρώμα) Αναπαράσταση βίντεο Συμπίεση δεδομένων εικόνας Εξαγωγή χρήσιμων πληροφοριών από εικόνες (π.χ. ανασυγκρότηση τρισδιάστατου σχήματος) 3D σάρωση VRML, Γραφικά 1
Υλικό Αναφοράς Cyganski, D., Orr, A. O., and Vaz, R. F., Information Technology Inside and Outside, Prentice Hall, 2001, Κεφ. 5, σελίδες 74-93 Κεφ. 6, σελίδες 94-106 Κεφ. 7, σελίδες 108-114 Κεφ. 8, σελίδες 126-128,131-133 Demo programs στον οπτικό δίσκο Web Colors http://en.wikipedia.org/wiki/web_colors http://www.mywebsite.force9.co.uk/web-colors/ Bit depth, color depth http://www.devx.com/projectcool/article/19997/0/page/7 Φωτογραφική Απεικόνιση Πληροφορίας Camera obscura = σκοτεινός θάλαμος Συστήματα φωτογραφικής απεικόνισης πληροφορίας (τα οποία χρησιμοποιούν ορατό φως): Φωτογραφική κάμερα Μάτι Προβολή τοπίου ή αντικειμένου από ένα φακό πάνω στο επίπεδο απεικόνισης: Φιλμ Αμφιβληστροειδής χιτώνας (retina) του Αντικείμενο Είδωλο ματιού Υπάρχει μαθηματική σχέση μεταξύ ενός σημείου στην εικόνα και το αντίστοιχο στον πραγματικό κόσμο. Λόγω της προβολής (projection) του ειδώλου από τρεις σε δύο διαστάσεις, χάνουμε «ανεπανόρθωτα» πληροφορίες, δηλ. το βάθος. Το βάθος μπορεί να ανακατασκευαστεί (έως ένα σημείο) με δύο εικόνες, όπως αυτές που βλέπουν τα μάτια μας, δηλ. με στερεοσκοπική όραση (binocular or stereo vision). Γιατί και τα δύο συστήματα χρειάζονται φακό; (Γιατί η κάμερα οπής (pinhole camera) δεν είναι πολύ πρακτική;) 2
Φωτογραφική Απεικόνιση Πληροφορίας Το επίπεδο απεικόνισης έχει το ίδιο μέγεθος Το ανάποδο είδωλο μεγεθύνεται όσο μεγαλώνει το μήκος εστιάσεως. Μήκος εστιάσεως (Focal length) Λειτουργία συστήματος απεικόνισης βασιζόμενο σε προβολή τοπίου ή αντικειμένου από ένα φακό πάνω στο επίπεδο απεικόνισης (image plane). Το είδωλο ή η εικόνα είναι η προβολή (projection) ενός αντικειμένου από τρείς διαστάσεις σε δύο. Το μέγεθος του επιπέδου απεικόνισης καθορίζεται από το μέγεθος του φιλμ ή του ηλεκτρονικού αισθητήρα στη ψηφιακή κάμερα. Το μήκος εστιάσεως (focal length) καθορίζει την μεγέθυνση του φακού. Όσοπιομεγάλοτομήκοςεστιάσεωςτόσοπιομεγάλοτοείδωλοσεσχέση με το επίπεδο απεικόνισης. Για το φιλμ 35mm, ένας φακός με μήκος εστιάσεως 28mm έχει πλατύ οπτικό πεδίο, ενώ ένας φακός με 120mm θεωρείτε φακός telephoto, δηλ. έχουμε μεγέθυνση. Μια κάμερα με φακό μεταβλητού μήκους εστιάσεως από 35mm - 105mm έχει δυνατότητα μεγέθυνσης έως 3 φορές. f 1 f2 200mm 28mm Nikkor 28-200 mm zoom lens Φωτογραφική Απεικόνιση Πληροφορίας 28mm 50mm 70mm 200mm Το μήκος εστιάσεως και η επίδραση του στο μέγεθος του ειδώλου. 3
Φωτογραφικό Φίλμ Το φίλμ είναι πλαστική μεμβράνη με επικάλυψη φωτοευαίσθητου αλογονίδιου του αργυρού (silver halide). Όταν εμπίπτει φως τότε παράγεται μεταλλικός αργυρός. Όσο περισσότερο φώς πέφτει τόσο περισσότερος αργυρός απελευθερώνεται. Αρχικά η εικόνα είναι αόρατη. Με ειδικά χημικά το φίλμ εμφανίζεται. Η εικόνα είναι αρνητική της αρχικής γιατί ο μεταλλικός αργυρός είναι σκούρος. Η εκτύπωση των φωτογραφιών αντιστρέφει την εικόνα του αρνητικού. A: έγχρωμη εικόνα Β: αρνητικό (έγχρωμο) C: μαυρόασπρη εικόνα D: αρνητικό (μαυρόασπρο) Ηλεκτρονικός Οπτικός Αισθητήρας Web camera Αισθητήρας Φίλτρο Bayer για την παραγωγή έγχρωμων εικόνων από ένα μόνο αισθητήρα. Ο οπτικός αισθητήρας (image sensor) είναι μια διάταξη από μικροσκοπικούς αλλά πεπερασμένου μεγέθους φωτοκυττάρων (ένα για κάθε στοιχείο εικόνας). Πλείστες κάμερες χρησιμοποιούν ένα από δύο είδη αισθητήρων: CCD (Charge-Coupled Device ή διάταξη ζεύγους φορτίων). Παθητικοί αισθητήρες φωτός. Έχουν σχετικά χαμηλή ευπάθεια στο θόρυβο. Είναι όμως πιο αργοί και πιο ακριβοί. CMOS (complementary metal oxide semiconductor ή συμπληρωματικός ημιαγωγός μεταλλικού οξειδίου). Ενεργοί αισθητήρες οι οποίοι μπορούν να συνδυάσουν την αίσθηση με την μερική επεξεργασία της εικόνας. Είναι πιο φτηνοί και πιο γρήγοροι από τους CCD και μπορούν να κατασκευαστούν σε πιο μεγάλα μεγέθη. Χρησιμοποιούνται ευρέως στις κάμερες κινητών. Είναι όμως πιο ευπαθείς στο θόρυβο. Με το φίλτρο Bayer μπορούμε να παράγουμε έγχρωμες φωτογραφίες με ένα μόνο αισθητήρα. Χρειάζεται όμως παρεμβολή (interpolation) για να προσδιορίσουμε τις υπόλοιπες τιμές. (Ο αριθμός φωτοκυττάρων για το πράσινο είναι διπλάσιος από τα άλλα δύο βασικά χρώματα, γιατί τα μάτια μας είναι πιο ευαίσθητα στο πράσινο. Επίσης, το φως του ήλιου είναι πιο έντονο σ αυτό το μήκος κύματος.) Για καλύτερη πιστότητα, χρησιμοποιούνται τρείς αισθητήρες CCD, ένα για κάθε βασικό χρώμα φωτός. Έχει όμως πιο ψηλό κόστος. 4
Ψηφιακή φωτογραφική Χρησιμοποιούν αισθητήρες διάταξης. Ανάλογα με την ποιότητα (τόνο, απόχρωση, ένταση) του φωτός πουπροσπίπτεισεκάθεένα εικονοστοιχείο του αισθητήρα, παράγεται ένα byte (8-bit) πληροφορίας. => 256 (από 0-255) διαφορετικές τιμές για κάθε πληροφορία/μέτρηση του εικονοστοιχείου. Για κάθε εικονοστοιχείο συνήθως μετρούμε τρία βασικά χρώματα, έτσι μπορούμε να χρειαστούμε έως και 24 bits. Ψηφιακές εικόνες Δημιουργία ψηφιακών εικόνων: Χρήση ψηφιακής κάμερας Χρήση scanner για την σάρωση αναλογικών εικόνων (π.χ. φωτογραφιών) Χαρακτηριστικά: Στοιχεία εικόνας (picture elements pixels) Αναπαράσταση μιας εικόνας μέσω ενός ορθογωνίου πλέγματος (grid) από pixels Ανάλυση ή ευκρίνεια εικόνας (picture resolution) Πλέγμα με 13 x 13 στοιχεία = 169 pixels (με πρόσθετες μαύρες γραμμές) 5
Αναλογική σε ψηφιακή μετατροπή Βασίζεται σε προσεγγίσεις αναλογικές εικόνες έχουν άπειρα σημεία, και κάθε σημείο μπορεί να έχει μία οποιαδήποτε συνεχόμενη τιμή η ψηφιακή εικόνα έχει πεπερασμένες διαστάσεις (αριθμό στοιχείων ή δειγμάτων) και τιμές => στην μετατροπή χάνεται μέρος της οπτικής πληροφορίας Βασίζεται σε trade-offs (αντιπραγματισμούς, αντιστάθμισμα συντελεστών) Μέγεθος εικόνας: αριθμός bits = (αριθμός όλων των pixel) x (bits / pixel) Ανάλυση ή ευκρίνεια Εξαρτάται από την εφαρμογή στην οποία η εικόνα θα χρησιμοποιηθεί την δυνατότητα που έχουμε για μετατροπή, αποθήκευση και μετάδοση της εικόνας (ορθότητα) το κόστος και το κονδύλι που έχουμε την ακρίβεια που χρειαζόμαστε δεν είναι άπειρη! Ψηφιακή εικόνα Πλέγμα 13 x 13 Κάθε στοιχείο έχει μία περιορισμένη τιμή που χαρακτηρίζεται από ένα κώδικα δυαδικών ψηφίων Παράδειγμα ψηφιακής εικόνας Η εικόνα των λουλουδιών αποτελείται από πολύ μικρά στοιχεία. Τα στοιχεία είναι αντιληπτά όταν μεγεθύνουμε μια περιοχή αρκετά. Ο αριθμός στοιχείων μιας εικόνας εξαρτάται από την ψηφιοποίηση που κάνουμε και καθορίζει την ανάλυση της εικόνας. Επίσης, η εικόναέχειτρίαβασικάκανάλιαήεπίπεδα, ένα για κάθε βασικό χρώμα (κόκκινο, πράσινο, μπλε). 6
Ψηφιοποίηση μίας εικόνας 256 x 256 = 65.536 pixels 128 x 128 = 16.384 pixels 64 x 64 = 4.096 pixels 16 x 16 = 256 pixels Αναπαράσταση εικόνας Δύο βασικές αποφάσεις ψηφιακής αναπαράστασης Αριθμός στοιχείων εικόνας <= δειγματοληψία <=> ανάλυση εικόνας Αριθμός τιμών (intensity values) για κάθε στοιχείο εικόνας <= κβαντισμός Κβαντισμός Η συνεχές τιμή ενός pixel στρογγυλεύεται σε μία τιμή που αναπαριστάται από τον δυαδικό κώδικα που επιλέγουμε Κώδικας με κ bits δίνει 2 κ τιμές για κάθε pixel Γενικά Διτονικές εικόνες (bitonal, binary, or halftone) 1 bit για κάθε pixel (0 για μαύρο και 1 για άσπρο) Εικόνες συνεχούς τόνου (continuous tone images) ένα ή περισσότερα bits για κάθε pixel κλίμακες γκρίζου (gray scale) π.χ. με 6 bits έχουμε 64 τιμές 000000 111111 μαύρο άσπρο έγχρωμες (color) Ανάμιξη ποσοτήτων κόκκινου, πράσινου και μπλε χρώματος Ψηφιοποίηση 3 αριθμών για τις ποσότητες 7
Κβαντισμός μιας εικόνας Απόδοση χρωμάτων (color encoding) Συσχέτισηκάθεστοιχείουεικόναςμεέναχρώμαμέσωενόςαριθμού από bit: Ασπρόμαυρη (διτονική) εικόνα Εικόνα σε επίπεδα του γκρίζου (gray level quantization) Έγχρωμη εικόνα Περισσότερα bits 1 bit ασπρόμαυρη 3 bits 8 επίπεδα γκρίζου 6bits 64 επίπεδα γκρίζου Dithering (Χρωματική Διασκόρπιση) Όπως και με το ύψος της ανάλυσης, όσο λιγότερα τα επίπεδα γκρίζου, τόσο πιο πολύ επηρεάζεται η ποιότητα της εικόνας. Μπορούμε να αυξήσουμε τη ποιότητα χρησιμοποιώντας dithering, ένα αλγόριθμο που διασκορπά το λάθη κβαντισμού χωρικά. Καθώς μετατρέπουμε την εικόνα σε 0 ή 1 χρησιμοποιούμε το ακόλουθο φίλτρο για να διασκορπίσουμε τα λάθη κβαντισμού χωρικά: 6bits 64 επίπεδα γκρίζου 1 bit (ασπρόμαυρη χωρίς dithering) 1 bit (ασπρόμαυρη με dithering) 8
Προσθετική Παραγωγή Χρώματος Αποχρώσεις χρωμάτων στο ορατό φάσμα 100% κορεσμός 0% κορεσμός R G Ένα μεγάλο μέρος του ορατού φάσματος μπορεί να φτιαχτεί από τη μίξη τριών βασικών χρωμάτων σε διαφορετικές αναλογίες και εντάσεις: Κόκκινο, Πράσινο και Μπλε (Red, Green, Blue RGB). Είναι προσθετικά χρώματα: η μίξη και των τριών χρωμάτων δημιουργεί το λευκό χρώμα. Ένα χρώμα αναπαριστάται με 3 αριθμούς που δείχνουν την ποσότητα/αναλογία των χρωμάτων. Η ψηφιοποίηση γίνεται όπως πριν αλλά τώρα για 3 αριθμούς. π.χ. 3 bits για κάθε RGB χρώμα => 9 bits/pixel => 29 = 512 χρώματα. Για πλήρες χρώμα (full or true color), το πρότυπο είναι 24 bits/pixel δηλ. 8 bits για κάθε χρώμα. Σύγκριση με αφαιρετικά χρώματα στη ζωγραφική CMYK. B Παραγωγή Χρωμάτων: RGB και CMYK CMYK 32-bits RGB (24-bits) Red (Κόκκινο) Cyan (Γαλάζιο) Magenta (Πορφυρό) Yellow (Κίτρινο) Black (Μαύρο) Green (Πράσινο) Blue (Μπλέ) 9
Παραγωγή Χρωμάτων: HSV Hue Χρώμα Saturation κορεσμός Value Τιμή Απόδοση χρωμάτων 24 bit full color (8 bits για το καθένα, κόκκινο, πράσινο και μπλε) 16 bit color 8 bit color 4 bit color 10
Παράδειγμα με 16 bits Κόκκινο Πράσινο Μπλε 5 bits 6 bits 5 bits 32 values 64 values 32 values Σύνολο 32 x 64 x 32 = 65,536 [64k] χρώματα. Από εικόνες σε βίντεο Το βίντεο είναι η ψευδαίσθηση κινούμενης εικόνας που προκαλείται από την ταχεία προβολή μιας σειράς ανεξάρτητων εικόνων με μικρές διαφορές. Οι (μικρές) διαφορές ανάμεσα στις εικόνες γίνονται αντιληπτές σαν κίνηση των στοιχείων της εικόνας. Η ταχύτητα προβολής πρέπει να ξεπερνά τις 50 εικόνες το δευτερόλεπτο Βασισμένο σε ερευνητικές μελέτες που έδειξαν ότι η αντίδραση του οπτικού μας συστήματος σε αλλαγές είναι περιορισμένη Αυτό το φαινόμενο οδήγησε στην εφεύρεση της κινηματογραφικής μηχανής Μικρότερη ταχύτητα προκαλεί την αίσθηση τρέμουλου (flickering). 11
Αναπαράσταση σήματος βίντεο Δομή σήματος Αποτελείται από πλαίσια (frames) Κάθε πλαίσιο αποτελείται από έναν αριθμό οριζόντιων γραμμών σάρωσης Υπάρχουν διαφορετικοί τρόποι αναπαράστασης χρωμάτων Ρυθμός πλαισίων Ο αριθμός των πλαισίων που παράγονται από ένα σήμα βίντεο ανά δευτερόλεπτο (second) Τυπικές τιμές: 25-75 πλαίσια/sec Όχι τρεμόσβημα όταν παράγονται 50 πλαίσια/sec Ελάχιστο όριο για ανθρώπινο μάτι: 15 πλαίσια/sec Πλήθος γραμμών σάρωσης Σταθερό για όλα τα πλαίσια. Ρυθμός σάρωσης (scan rate) = ( αριθμός γραμμών σάρωσης) * (ρυθμός πλαισίων) Συμπίεση εικόνας Τομέγεθοςμιαςεικόναςείναιπολύμεγάλο π.χ. Εικόνα μεγέθους Α4 δημιουργημένη από ένα σαρωτή με 300 pixels ανά ίντσα και με χρήση του RGB μοντέλου (24 bits, 8 ανά χρώμα) καταλαμβάνει 20 Mbytes μνήμης Δύο κατηγορίες τεχνικών συμπίεσης Χωρίς απώλειες (lossless): η εικόνα που παράγεται μετά από συμπίεση και αποσυμπίεση της αρχικής είναι της ίδιας ποιότητας Με απώλειες (lossy): η εικόνα που παράγεται μετά από συμπίεση και αποσυμπίεση της αρχικής είναι κατώτερης ποιότητας Ο βαθμός αποτελεσματικότητας μιας τεχνικής συμπίεσης είναι συνήθως αντιστρόφως ανάλογος της διατήρησης ποιότητας της αρχικής εικόνας Οτύπος(format) εικόνας σχετίζεται και με τον τρόπο συμπίεσής της GIF (Graphics Interchange Format) περιορίζεται στην αναπαράσταση εικόνων μέσω 256 χρωμάτων (8 bits of color depth) JPEG (Joint Photographic Experts Group) εκατομμύρια χρωμάτων (24 bits of color depth) 12
Παραδείγματα GIF και JPEG Εικόνα με 115 x 87 pixels 2 χρώματα 1 bit GIF 1,329 bytes 16 χρώματα 4bit GIF 4,407 bytes 256 χρώματα 8bit GIF 8,822 bytes 16,777,216 χρώματα 24 bit JPEG 4,321 bytes Μέγιστο όριο GIF Καλύτερη συμπίεση Bit depth (βάθος ψηφίου) = αριθμός bit που χρησιμοποιείται για κάθε pixel Color depth (βάθος χρώματος) = αριθμός χρωμάτων που χρησιμοποιείται για κάθε pixel GIF Αναπτύχθηκε από την CompuServe με στόχο τη διευκόλυνση της ανταλλαγής εικόνων μέσω δικτύου. Υποστηρίζει συμπίεση εικόνας που βασίζεται στον αλγόριθμο LZW (Lempel-Ziv-Welch). Ο αλγόριθμος αυτός ανήκει στην κατηγορία των διανυσματικών τεχνικών συμπίεσης και λειτουργεί χωρίς απώλειες. Ο λόγος συμπίεσης (compression ratio) που επιτυγχάνει είναι 4:1, αλλά περιορίζεται σε εικόνες βάθους χρώματος των 8-bits (256 χρώματα). Προτερήματα: λειτουργεί χωρίς απώλειες για εικόνες βάθους 8bits είναι ιδανικός για εικόνες με πολλές ακμές και γωνίες όπως γραμμικά σχέδια. χρησιμοποιείται ευρέως και ελεύθερα Μειονεκτήματα: δεν είναι κατάλληλο για εικόνες με πολλά χρώματα οι λόγοι συμπίεσης είναι μικροί και δεν μπορούν να ανταλλαχθούν με ποιότητα εικόνας δεν μπορεί να χρησιμοποιηθεί για κινούμενη εικόνα μεγάλης διάρκειας. (Τα animated GIF προσφέρονται μόνο για μικρής διάρκειας βίντεο.) δεν είναι ανεξάρτητος από την ανάλυση της εικόνας 13
Το πρότυπο JPEG Σχεδιάστηκε από την ομάδα Joint Photographic Expert Group σε συνεργασία με την Διεθνή Ένωση Τηλεπικοινωνιών (ITU-TS) Σ αντίθεση με τον τύπο GIF, η τεχνική συμπίεσης με JPEG λειτουργεί με απώλειες (lossy compression). Η εικόνα που παράγεται μετά από συμπίεση και αποσυμπίεση της αρχικής είναι κατώτερης ποιότητας. Μπορεί να δώσει διαφορετικό αποτέλεσμα ανάλογα με τις απαιτήσεις που έχουμε για την ποιότητα της εικόνας και το λόγο συμπίεσης 10:1 έως 20:1 υψηλή ποιότητα 30:1 έως 50:1 μέτρια ποιότητα 60:1 έως 100:1 κακή ποιότητα Πετυχαίνει συμπίεση του αρχικού μεγέθους ακόμη και μικρότερο τουενόςδέκατουχωρίςορατέςαπώλειεςστηνποιότητατηςεικόνας. Βασίζεται στη Μείωση της χρωματικής πληροφορίας Συμπίεση των πληροφοριών φωτεινότητας και απόχρωσης JPEG (συν.) Χρησιμοποιείται κυρίως για (ασπρόμαυρες ή έγχρωμες) εικόνες, αλλά και για βίντεο (Motion JPEG MPEG) Υλοποιείται μέσω είτε μόνο ειδικού λογισμικού, είτε συνδυασμού λογισμικού και hardware (ειδικών καρτών) Ο χρήστης μπορεί να ορίσει την ποιότητα της εικόνας που θα παραχθεί, το χρόνο επεξεργασίας της συμπίεσης και το μέγεθος της συμπιεσμένης εικόνας. Εκτός από τις γενικές απαιτήσεις που πρέπει να ικανοποιεί κάθε τεχνική συμπίεσης, ισχύουν επίσης τα εξής: Η τεχνική είναι ανεξάρτητη του μεγέθους ή του περιεχομένου της εικόνας και εφαρμόσιμη σε οποιοδήποτε είδος εικόνας και pixel aspect ratio Η αναπαράσταση των χρωμάτων πρέπει να είναι ανεξάρτητη από τη συγκεκριμένη υλοποίηση της τεχνικής Ο βαθμός συμπίεσης και η ποιότητα της εικόνας που επιτυγχάνεται πρέπει να είναι όσο το δυνατόν καλύτερα. 14
Άλλοιτύποιαρχείωνεικόνας BMP Bitmap τύπος που υποστηρίζουν τα MS Windows ίσως ο πιο απλός τύπος - απλώς περιγράφει το τρόπο με τον οποίο θα αποθηκευτούν τα bits της εικόνας σε ένα αρχείο δεν προσφέρει καμιά δυνατότητα συμπίεσης. TIFF Tagged Image File Format αναπτύχθηκε από τις εταιρείες Aldus και Microsoft χρησιμοποιείται ευρέως στην ανταλλαγή εικόνων αποτελείται από ένα σύνολο εικόνων, με μια κεφαλίδα (header) να καθορίζει τις παραμέτρους της κωδικοποίησης. Μπορεί να συμπεριλάβει αλγορίθμους συμπίεσης, όπως τον αλγόριθμο LZW. Περίληψη - Τύποι αρχείων εικόνας Τύπος Αρχείου BMP TIFF GIF Tag Image File Format Περιγραφή standard Windows format (true color) Graphics Interchange Format (8-bit) διαθέτει μέθοδο συμπίεσης Lempel-Ziv-Welch - LZW) JPΕG Joint Photographic Experts Group (true color, διαθέτει την ομώνυμη μέθοδο συμπίεσης ) 15
Στερεοσκοπική Όραση (Stereo Vision) Εικόνες από διοπτρική όραση (binocular vision) by G. Medioni Αριστερή εικόνα Δεξιά εικόνα Παραλλαγή/διαφορά (disparity) CMU VASC Image Database Στερεοσκοπική Φωτομετρία (Photometric Stereo) Recovery of shape and reflectance (Ανακατασκευή σχήματος και αντανακλαστικότητας) Input Images (Εισερχόμενες Εικόνες Αλγορίθμου) Recovered Shape (Ανακατασκευασμένο Σχήμα) Image Synthesis (Σύνθεση Εικόνας) Ground-truth (Πραγματικό Σχήμα) Real Images (Πραγματικές Εικόνες) Synthetic Images (Συνθετικές Εικόνες) 16
3D Laser Scanning (3Δ ΣάρωσημεΛέιζερ τριγωνοποίηση) The Scanner and the Pipeline Images under different lights The Scanner Geometry of different Scans Unlit texture image Texture map Geometry model Patchified model Texture-mapped model 3D Laser Scanning (3Δ Σάρωση με Λέιζερ «χρόνος ταξιδιού») The 3D Scanner and the Pipeline Images from different viewing points 3D scans from different viewing points Aligned and Merged Άλλα παραδείγματα 17
VRML VRML = Virtual Reality Modeling Language. Είναι μια γλώσσα περιγραφής τρισδιάστατων αντικειμένων σε νοητό (συνθετικό) περιβάλλον. Virtual Reality (νοητή πραγματικότητα) είναι η περιγραφή ενός νοητού περιβάλλοντος, ακολουθούμενη από τη λήψη νοητών φωτογραφιών, δηλ. τη δημιουργία εικόνων (rendering) του νοητού περιβάλλοντος διαδραστικότητα. Η VRML είναι ένα παράδειγμα 3-Δ διαδραστικών διανυσματικών γραφικών (3D interactive vector graphics). Γενικά τα διανυσματικά γραφικά (vector graphics) επιτρέπουν τη περιληπτική περιγραφή του περιεχομένου μιας εικόνας, αντί να αποθηκεύουν την ένταση το φωτός σε κάθε σημείο της εικόνας ως μια συλλογή από pixels επιτρέπουν την αναπαραγωγή της εικόνας όσο καλά επιτρέπει η οθόνη ή ο εκτυπωτής, όμως πολλές φυσικές εικόνες (natural images) δεν μπορούν να περιγραφούν εύκολα με διανυσματικά γραφικά. Άλλα παραδείγματα γλωσσών είναι η PDF και η PostScript. Η VRML, και είναι ίσως το πιο σημαντικό, μάς επιτρέπει τη δημιουργία (σχεδόν) άπειρων εικόνων των περιγραμμένων αντικειμένων από διάφορες οπτικές γωνίες που μπορεί να προσδιορίσει ένας χρήστης. Είναι σαν να βαστά μια κάμερα και παίρνει φωτογραφίες του νοητού περιβάλλοντος. Η VRML έχει μεγάλες ομοιότητες με τη HTML. Όλατααντικείμεναπεριγράφονταιμεκείμενο, και μπορούμε να έχουμε hyperlinks. Το βασικό στοιχείο οργάνωσης της VRML ονομάζεται κόμβος (node): Παραδείγματα VRML Παράδειγμα 1 Παράδειγμα 2 #VRML V1.0 ascii Separator { Material { diffusecolor 0 0 1 # Blue sphere Sphere { radius 1 Translation { translation 2 0 0 Sphere { radius 1 Separator { Material { diffusecolor 1 0 0 # Red sphere Translation { translation -2 0 0 Sphere { radius 1 #VRML V1.0 ascii Separator { Texture2 { filename "my_image.jpg" Sphere { radius 1 18
Στην συνέχεια Αναπαράσταση Ηχητικής πληροφορίας: βασικές γνώσεις ηχητικών σημάτων (συχνότητα, εύρος ζώνης, φάσμα) μετατροπή ηχητικού σήματος αναλογικό/ψηφιακό (A/D) 19