Ε.Α.Υ. Υπολογιστική Όραση Θεωρητικό και Μαθηματικό Υπόβαθρο Γεώργιος Παπαϊωάννου 2015
ΠΡΑΞΕΙΣ ΚΑΙ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΣΤΟ ΧΩΡΟ ΤΗΣ ΕΙΚΟΝΑΣ
Γείτονες ενός Εικονοστοιχείου Το σύνολο ΝΝ 4 (pp) των 4 οριζόντιων και κατακόρυφων γειτόνων ενός Pixel pp με συντεταγμένες (xx, yy) είναι: xx 1, yy, xx + 1, yy, xx, yy 1, (xx, yy + 1) Αν πάρουμε τους διαγώνιους γείτονες, παίρνουμε την ΝΝ D (pp) γειτονιά: xx 1, yy 1, xx 1, yy + 1, xx + 1, yy + 1, (xx + 1, yy 1) Και αν συμπεριλάβουμε όλα τα στοιχεία γύρω από το pp έχουμε τη γειτονιά ΝΝ 8 pp = ΝΝ 4 pp + ΝΝ D (pp)
Γειτονίες Εικονοστοιχείων (1) Έστω ότι αναγνωρίζουμε ως μέλη μιας γειτονιάς μόνο Pixels με τιμές σε ένα προκαθορισμένο σύνολο VV, π.χ. VV = {1} σε μια μαυρόασπρη (binary 0 ή 1) εικόνα Τότε για 2 Pixels pp, qq με τιμές από το VV μπορούμε να ορίσουμε 3 τύπους γειτονίας: 4-γειτονία: pp NN 4 qq 8-γειτονία: pp NN 8 qq m-γειτονία(μεικτή): pp NN 4 qq ή pp NN D qq και ff rr VV, rr NN 4 pp NN 4 qq
Γειτονίες Εικονοστοιχείων (2) Είναι ΝΝ 4 Είναι ΝΝ 8 Είναι ΝΝ mm Δεν είναι ΝΝ mm διότι: διότι: διότι: διότι: και αλλά =
Μέτρα Απόστασης Εικονοστοιχείων Έστω pixels pp = xx, yy, qq = ss, tt Ευκλείδεια απόσταση: DD ee pp, qq = xx ss 2 + yy tt 2 City-block (Manhattan) απόσταση: DD 4 pp, qq = xx ss + yy tt Απόσταση σκακιέρας: DD 8 pp, qq = max ( xx ss, yy tt )
Μετασχηματισμοί Έντασης (1) Σε μια εικόνα μπορούμε σε κάθε εικονοστοιχείο να εφαρμόσουμε μια συνάρτηση ώστε να τροποποιήσουμε τοπικά την έντασή του: gg xx, yy = TT(ff xx, yy )
Μετασχηματισμοί Έντασης (2) Παραδείγματα: Αντιστροφή έντασης (negative): gg xx, yy = mmmmmm ff xx, yy Εφαρμογή κατωφλίου: gg xx, yy = mmaaaa, ff xx, yy > tt 0, ff xx, yy tt
Μετασχηματισμοί Έντασης (3) Παραδείγματα: Gamma correction (για κανονικοποιημένη εικόνα): gg xx, yy = ff xx, yy γγ, ff xx, yy [0,1] γ = 0.5 γ = 2.2 γ = 1.0 (αρχική)
Πράξεις με Γειτονιές Εικονοστοιχείων (1) Πολύ συχνά, ειδικά στην επιβολή χωρικών φίλτρων σε εικόνες, κάνουμε υπολογισμούς που επηρεάζουν ένα pixel pp = (xx, yy) χρησιμοποιώντας τιμές της εικόνας και από γειτονικά pixels Οι γειτονιές SS(xx, yy) αυτές αποτελούνται από NN SS pixels Συνήθως έχουν κέντρο το (xx, yy)
Πράξεις με Γειτονιές Εικονοστοιχείων (2) Παράδειγμα: Θόλωμα εικόνας με τοπικούς μέσους όρους: gg xx, yy = 1 ff(rr, tt) NN SS rr,tt SS(xx,yy) Π.χ., για περιοχή 3Χ3: 1 gg(xx, yy) = 1 9 mm= 1 1 pp(xx + mm, yy + nn) nn= 1
Πράξεις με Γειτονιές Εικονοστοιχείων (3) Γενικά όπου εφαρμόζουμε πράξεις με περιοχές pixels, πρέπει να φροντίζουμε να χειριζόμαστε σωστά τα ακριανά pixels: Περιορισμός της γειτονιάς μέσα στην εικόνα είτε Επέκταση της εικόνας (padding βλ. συνέλιξη)
Πράξεις με Γειτονιές Εικονοστοιχείων (4) Στο παράδειγμά μας, μπορούμε να κάνουμε έναν έλεγχο που να επιστρέφει 1 αν το σημείο είναι εντός και 0 αν είναι εκτός της εικόνας Έτσι, το θόλωμα γίνεται: gg(xx, yy) = 1 VV(xx + mm, yy + nn) 1 mm= 1 1 ff(xx + mm, yy + nn)vv(xx + mm, yy + nn) nn= 1
Συσχέτιση (1) + yy xx = h ss xx = h xx + tt ss tt dddd + = ss xx + tt h tt dddd Η συσχέτιση (correlation ή cross-correlation) 2 συναρτήσεων (ή σημάτων), συνθέτει τις 2 εισόδους ολισθαίνοντας τη μια πάνω στην άλλη πολλαπλασιαστικά Μεγιστοποιείται σε ολισθήσεις (t) που οι 2 συναρτήσεις μοιάζουν περισσότερο (συμμεταβάλλονται)
Συσχέτιση (2) Παράδειγμα: Η συσχέτιση των 2 συναρτήσεων μεγιστοποιείται στις 3 ολισθήσεις όπου η f μεγιστοποιείται ταυτόχρονα με την g
Συνέλιξη (1) + yy xx = h ss xx = h xx tt ss tt dddd + = ss xx tt h tt dddd Η συνέλιξη (convolution) υπολογίζει τη «διέλευση» μιας συνάρτησης (σήμα) μέσα από μια άλλη Η συνέλιξη υπολογίζει την έξοδο ενός γραμμικού αναλλοίωτου συστήματος με είσοδο ένα σήμα
Συνέλιξη (2) Στο παράδειγμα δίπλα, ο μοναδιαίος παλμός στη θέση x=1 εισέρχεται πρώτος στο σύστημα, μετά ο παλμός στο x=11 κλπ
Συνέλιξη (3) Image source: Wikipedia
Σύγκριση Συσχέτισης Συγκερασμού (1) Παρότι μοιάζουν, αρκετά (διαφέρουν σε ένα πρόσημο), έχουν διαφορετική ερμηνεία Πηγή: http://work.thaslwanter.at/bsa/html/features.html
Γραμμικά Συστήματα Ένα σύστημα επενεργεί με έναν τελεστή Τ πάνω σε ένα σήμα Όταν ο Τ είναι γραμμικός, τότε το σύστημα είναι επίσης γραμμικό Όταν ο Τ δε μεταβάλλεται, το σύστημα είναι αναλλοίωτο «χρονικά» (ή χωρικά στην περίπτωση της εικόνας)
Κρουστική Απόκριση (1) Ένα σύστημα χαρακτηρίζεται από την κρουστική απόκρισή του, δηλ. μια συνάρτηση ίση με την έξοδο του συστήματος όταν η είσοδος είναι ένας μοναδικός κρουστικός παλμός
Κρουστική Απόκριση (2) Στο συνεχές πεδίο: Κρουστικός παλμός = συνάρτηση Dirac δδ xx 0 μόνο για xx = 0, + με δδ xx dddd = 1 Για διακριτά συστήματα: συνάρτηση Kronecker:
Κρουστική Απόκριση (3) Η κρουστική απόκριση είναι το αποτέλεσμα του συγκερασμού του συστήματος με το μοναδιαίο παλμό Χαρακτηρίζει πλήρως το γραμμικό και αναλλοίωτο σύστημα: Εφαρμόζοντας ένα μοναδιαίο παλμό σε ένα άγνωστο σύστημα h, ανακαλύπτουμε τη συνάρτηση του συστήματος: + Άγνωστο LTI σύστημα h xx = h xx tt δδ tt dddd
Συσχέτιση και Συνέλιξη Διακριτών Σημάτων ww xx ff xx = ww ss ff(xx + ss) aa ss= aa aa ww xx ff xx = ww ss ff(xx ss) ss= aa Τα όρια μπορούν να είναι άπειρα (βλ. IIR φίλτρα)
Συνέλιξη σε Εικόνα (1) aa bb ww xx, yy ff xx, yy = ww ss, tt ss= aa tt= bb ff(xx ss, yy tt) Η συνάρτηση (σύστημα) ww xx, yy στην οποία δίνουμε ως είσοδο την εικόνα μέσω της συνέλιξης λέγεται φίλτρο ή μάσκα ή πυρήνας συνέλιξης
Συνέλιξη σε Εικόνα (2) Παρατήρηση: Πολλές φορές χρησιμοποιούμε την υπολογιστική διαδικασία του κυλιόμενου αθροίσματος (rolling sum) για να εφαρμόσουμε ένα φίλτρο σε μια εικόνα Το κυλιόμενο άθροισμα είναι στην ουσία συσχέτιση και όχι συνέλιξη! Όμως, η συσχέτιση είναι ίση με τη συνέλιξη όταν το φίλτρο είναι συμμετρικό
Φίλτρα Τα γραμμικά συστήματα στο χώρο της εικόνας είναι πολύ διαδεδομένα Εφαρμόζουν ένα χωρικό φίλτρο πάνω στην εικόνα με την πράξη της συνέλιξης Τα φίλτρα είναι είτε IIR είτε FIR: Infinite Impulse Response: Το πεδίο των μη μηδενικών τιμών της συνάρτησης του φίλτρου είναι άπειρο Finite Impulse Response: Το πεδίο των μη μηδενικών τιμών της συνάρτησης του φίλτρου είναι πεπερασμένο: έχουν τοπική εμβέλεια ή αλλιώς, χρησιμοποιούν τιμές μόνο στη γειτονιά ενός σημείου
Παραδείγματα Γραμμικών Φίλτρων Ο μέσος όρος που είδαμε, είναι και αυτός ένα χωρικό γραμμικό φίλτρο Συμμετρικό φίλτρο: 0 0 1 0 0 0 1 2 1 0 1 2 4 2 1 0 1 2 1 0 0 0 1 0 0 Μη συμμετρικό φίλτρο: -1 0 1-1 0 1-1 0 1
Η ΕΙΚΟΝΑ ΩΣ ΨΗΦΙΑΚΟ ΣΗΜΑ
Ψηφιοποίηση της Εικόνας Εκτός από προβλήματα κβάντισης, η διαδικασία της ψηφιοποίησης εισάγει το βασικό πρόβλημα της ταύτισης (aliasing) Η χρήση οπτικών και ηλεκτρονικών διατάξεων για την καταγραφή της οπτικής πληροφορίας, επιπλέον εισάγει θόρυβο (στατιστικό, θερμικό, κρουστικό)
Το Εικονοστοιχείο Ένα pixel είναι ένα σημειακό δείγμα στην εικόνα, όχι ένα «τετράγωνο» Clipping Σφάλματα κβάντισης και παρουσίας θορύβου
Δειγματοληψία (1) Ο ρυθμός με τον οποίο επιλέγουμε δείγματα στην εικόνα (ρυθμός δειγματοληψίας) εξαρτάται από τη σχέση της ανάλυσης της εικόνας ως προς τις πραγματικές διαστάσεις που απεικονίζει Πυκνότερη δειγματοληψία (υψηλότερη ανάλυση) Σωστή καταγραφή μεγαλύτερης λεπτομέρειας Υπάρχει πάντα όριο στη λεπτομέρεια που μπορεί να αναπαρασταθεί με δεδομένη ανάλυση (βλ. παρακάτω κριτήριο Nyquist)
Δειγματοληψία (2) Σε γενικές γραμμές, η εικόνα μας μπορεί να αναπαραστήσει σωστά μια φωτεινή διαταραχή με ημιτονοειδή μορφή με περιόδου μεγαλύτερη από 2 pixels
Δειγματοληψία (3) Γρηγορότερες εναλλαγές δε μπορούν να δειγματοληπτηθούν συστηματικά, οδηγώντας στο φαινόμενο της ταύτισης Όπως θα δούμε, για να αποφύγουμε προβλήματα, εσκεμένα μειώνουμε τη λεπτομέρεια της πληροφορίας ώστε να ταιριάζει το ρυθμό δειγματοληψίας που διαθέτουμε
The Pixels We See In order to perceive the color of an image, we have to go through a reconstruction of an analog intensity from the samples. This involves: A reconstruction filter obtain a continuous signal A tone mapping stage adjust intensity to actual displayable range The device s response curve translates nominal intensities to actual light The device s spatiotemporal impulse response spreads intensity over screen surface and time
Η Εικόνα που Βλέπουμε (1) Αρχική Ψηφιοποιημένη Όπως προβάλλεται
Η Εικόνα που Βλέπουμε (2) Όπως προβάλλεται Όπως τη βλέπουμε από απόσταση
Η Εικόνα που Βλέπουμε (3) Δείγματα Μετασχηματισμός Ανακατασκευή Μετασχηματισμός Κρουστική απόκριση έντασης έντασης οθόνης οθόνης και ματιού
Ταύτιση (Aliasing) Έχουμε όταν λόγω των ανεπαρκών δειγμάτων στο πεδίο του σήματος, από τα δείγματα που διαθέτουμε μπορούμε να αποκαταστήσουμε παραπάνω από ένα διαφορετικά σήματα
Τυπικά Προβλήματα Ταύτισης
Temporal Aliasing Actual motion Apparent motion Ταύτιση στο χρόνο έχουμε κυρίως σε γρήγορες κινήσεις Η ταχύτητα λήψης της κάμερας δεν επαρκεί (το ίδιο κάνει και το μάτι μας) Image source: Wikipedia
ΠΕΔΙΟ ΣΥΧΝΟΤΗΤΩΝ ΚΑΙ Ο ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ FOURIER
Μετασχηματισμοί Εικόνας Εκτός από το πεδίο του χώρου (2D επίπεδο εικόνας), στο οποίο εργαστήκαμε μέχρι στιγμής, πολλές διαδικασίες είναι πιο αποδοτικό να γίνουν σε ένα διαφορετικό πεδίο, μετά από κατάλληλο μετασχηματισμό της εικόνας: Πεδίο του μετασχηματισμού Πεδίο μετασχηματισμού Εικόνα Μετασχηματισμός Τελεστής στο πεδίο του μετασχηματισμού Αντίστροφος Μετασχηματισμός Το ίδιο ισχύει για οποιοδήποτε σήμα (1D, 2D, 3D nd) Εικόνα
Πεδίο Συχνοτήτων (1) 1D time/space domain Frequency domain Ένα περιοδικό σήμα μπορεί να αποσυντεθεί σε μια σειρά από επικαλυπτόμενες αρμονικές συναρτήσεις αύξουσας «συχνότητας» (ταχύτητας με την οποία επαναλαμβάνεται μια «περίοδος») Το πεδίο ορισμού των παραμέτρων αυτών των συναρτήσεων είναι το πεδίο συχνοτήτων Image source: Wikipedia
Image source: Wikipedia Πεδίο Συχνοτήτων (2) Στο ανάπτυγμα Fourier ενός σήματος, το σήμα γίνεται ένας γραμμικός συνδυασμός ημιτονοειδών συναρτήσεων Αλλιώς: η συνάρτηση προβάλλεται στη βάση ημιτονοειδών συναρτήσεων : Συχνότητα yy tt = aa sin 2ππξξtt + φφ = aa sin (ωωtt + φφ) Φάση
Ο Μετασχηματισμός Fourier Είναι ένας γενικός μετασχηματισμός που εκφράζει ένα αναλογικό σήμα στο χώρο συχνοτήτων και το αντίστροφο (αντίστροφος Fourier) Ευθύς ff ξξ = ff xx ee 2ππiiiiξξ dddd Αντίστροφος ff xx = ff ξξ ee 2ππiiiiξξ ddξξ
Μιγαδικοί Αριθμοί Ο Τύπος του Euler zz = xx + iiii = zz (cos φφ + sin φφ) = zz ee iiφφ zz = xx iiii = zz (cos φφ sin φφ) = zz ee iiφφ συζυγής του z xx = RRRR{zz}, yy = IIII zz zz = xx 2 + yy 2 Το επίπεδο των μιγαδικών αριθμών
Το Φάσμα Συχνοτήτων Το αποτέλεσμα του μετασχηματισμού Fourier είναι μια μιγαδική συνάρτηση Μέτρο: το ύψος (παρουσία) της κάθε συχνότητας Γωνία: η φάση (ή ολίσθηση) της κάθε συχνότητας Μαζί αποτελούν το φάσμα (spectrum) του σήματος z φ
Τύποι Φάσματος Ένα σήμα έχει μη φραγμένο ή άπειρο φάσμα αν για να μπορέσει να αναπαρασταθεί πλήρως χρειάζεται μη μηδενικούς συντελεστές για ξξ Όλα τα ασυνεχή σήματα έχουν άπειρο φάσμα Στην πραγματικότητα, δεν υπάρχουν τελείως απότομα (ασυνεχή) σήματα Πολύ απότομοι παλμοί απλά έχουν πολύ πεπλατυσμένο φάσμα Στην επεξεργασία εικόνας έχουμε ασυνεχή (μαθηματικά) σήματα! Ένα band-limited σήμα έχει πεπερασμένο φάσμα ή «εύρος ζώνης» όταν πάνω από μια συχνότητα όλοι οι συντελεστές Fourier είναι μηδενικοί
Τυπικά Φάσματα infinite Σημαντικά σήματα: Συμμετρικά μεταξύ των δύο πεδίων! sinc infinite ssssssss = sin (xx) xx infinite
Φάσματα Άλλων Συναρτήσεων Triangle function sssssscc 2 Gaussian Gaussian ssssssss Box
Ο Μετ. Fourier σε Ανώτερες Διαστάσεις Ο Μετασχηματισμός Fourier γενικεύεται σε N διαστάσεις:
Παραδείγματα Fourier σε Εικόνα
Η Συνέλιξη και το Πεδίο Συχνοτήτων (1) Σημαντική και Χρήσιμη ιδιότητα: Αν ΗΗ(ξξ) και SS(ξξ) είναι οι μετ. Fourier (FT) δύο συναρτήσεων h xx και ss(xx), τότε: FFFF h ss xx = ΗΗ(ξξ) SS(ξξ) Δηλαδή: Η συνέλιξη στο πεδίο ορισμού της συνάρτησης γίνεται πολλαπλασιασμός στο πεδίο συχνοτήτων Αποτέλεσμα: Πολλές φορές είναι ευκολότερο να σχεδιάσουμε φίλτρα (επιλογής συχνοτήτων) στο πεδίο συχνοτήτων και με τον αντίστροφο Fourier να πάρουμε τα αντίστοιχα χωρικά φίλτρα (κρουστική απόκριση)
Η Συνέλιξη και το Πεδίο Συχνοτήτων (2) Εικόνα εισόδου Φάσμα εικόνας εισόδου Ειδικά σχεδιασμένο φίλτρο αποκοπής συχνοτήτων στο χώρο του φάσματος 0 Συχνότητες του μοτίβου θορύβου Αποκατεστημένη εικόνα
Ιδιότητες του Μετασχηματισμού Fourier Γραμμικότητα: aaff 1 tt + bbff 2 tt aaff 1 ωω + bbff 2 ωω Ολίσθηση χρόνου: ff tt tt 0 FF ωω ee jjωωtt 0 Κλιμάκωση χρόνου: ff aaaa 1 aa F ωω aa Ολίσθηση συχνότητας: FF ωω ωω 0 ff tt ee jjωω 0tt Συνέλιξη: ff 1 tt ff 2 tt FF 1 ωω FF 2 ωω ff 1 tt ff 2 tt 1 2ππ FF 1 ωω FF 2 ωω
Πηγαίνοντας σε Διακριτά Πεδία Τόσο η συνέλιξη όσο και ο μετασχηματισμός Fourier έχουν αντίστοιχες εκδόσεις για διακριτά σήματα Τι ισχύει για τα μη περιοδικά διακριτά σήματα; Είναι τα πιο κοινά στην περίπτωση της εικόνας (μη επαναληπτική πληροφορία) Ισχύει η ίδια θεωρία αλλά με μικρές αλλαγές στο τι παριστάνει το πεδίο εισόδου (χώρος εικόνας) και πως αντιλαμβανόμαστε το πεδίο συχνοτήτων
Ο Διακριτός Μετασχηματισμός Fourier (DFT) Εφαρμόζεται σε διακριτά, ισαπέχοντα δείγματα μιας συνάρτησης : NN 1 XX kk = xx nn ee iiiππkkkk/nn, kk Z nn=0 Συνήθως υπολογίζεται με τον αλγόριθμο του Γρήγορου Μετασχηματισμού Fourier (FFT) Γρήγορος, παραλληλήσιμος αλγόριθμος (πολλές υλοποιήσεις σε CPU, GPU, ASIC, FPGA)
Αντίστροφος DFT NN 1 xx kk = 1 NN XX nnee iiiππkkkk/nn, kk Z nn=0 Υπολογίζεται κι αυτός μέσω του FFT
Ερμηνεύοντας τον DFT Σήμα εισόδου DFT (FFT): XX kk NN/3 xx nn = sin (3 2ππnn NN ) BB/2 BB/2 nn NN («περίοδος» ίση με το παράθυρο) 0 1 NN 2 NN 33 NN 2 1 NN NN NN 2 NN 33 NN 1 NN
2D DFT MM 1 NN 1 xx kk = 1 MMMM XX mm,nnee iiiππ( kkmm MM +kkkk NN ), kk Z mm=0 nn=0 O Fourier και ο DFT είναι διαχωρίσιμοι μετασχηματισμοί
Ο DFT στο Χώρο της Εικόνας
Ερμηνεύοντας τον 2D DFT B/2 -B/2 0 B/2 -B/2
Παραδείγματα Φασμάτων Εικόνας
Ερμηνεύοντας τον 2D DFT Ανισοτροπία (1) Οι μεταβολές στον κάθετο άξονα μοιάζουν με θόρυβο Το μπλε γράφημα δείχνει το σήμα πάνω στην κόκκινη γραμμή Η κατακόρυφη κατανομή συχνοτήτων είναι πολύ απλωμένη τυπική συμπεριφορά για το φάσμα θορύβου
Ερμηνεύοντας τον 2D DFT Ανισοτροπία (2) Η ένταση μεταβάλλεται ομαλότερα οριζόντια και διαφαίνονται ημιτονοειδή μοτίβα (brush strokes) Η αργή επαναληπτικότητα των οριζόντιων μορφών δημιουργεί διακριτές ζώνες στην οριζόντια κατανομή του φάσματος
ΔΕΙΓΜΑΤΟΛΗΨΙΑ
Το Θεώρημα Δειγματοληψίας Προκειμένου να διασφαλιστεί πως το ανακατασκευασμένο σήμα από τα δείγματα ενός πρωτότυπου αναλογικού σήματος είναι ίδιο με το αρχικό, το θεώρημα δειγματοληψίας των Nyquist-Shannon ορίζει ότι: Το αρχικό σήμα πρέπει να είναι πεπερασμένου εύρους ζώνης Ο ρυθμός (συχνότητα) δειγματοληψίας ff ssssssssssssssss πρέπει να είναι τουλάχιστο διπλάσιος από την υψηλότερη συχνότητα του φάσματος του σήματος: Ας δούμε στη συνέχεια γιατί
Δειγματοληψία και Πεδίο Συχνοτήτων (1) Τι παθαίνει ένα σήμα όταν δειγματοληπτείται; Τα δείγματα που παίρνουμε αποτελούν έναν (άπειρου μήκους) συρμό από κρουστικούς παλμούς: T -T 0 T 2T 3T 4T Θυμηθείτε ποιο είναι το φάσμα ενός τέτοιου σήματος: 1 1/T Συχνότητα
Δειγματοληψία και Πεδίο Συχνοτήτων (2) Η δειγματοληψία ισούται με τον πολλαπλασιασμό ενός σήματος xx tt με τον κρουστικό συρμό ss(tt) με περίοδο TT ss Μηδενίζονται όλες οι τιμές του σήματος εκτός δειγμάτων Από την ιδιότητα του συγκερασμού στο πεδίο συχνοτήτων: ss tt xx tt 1 SS ωω XX ωω 2ππ Δεδομένου του φάσματος XX ωω του σήματος, το φάσμα του δειγμνατοληπτιμένου σήματος είναι μια άπειρες φορές ολισθημένη έκδοση του XX ωω κατά διαστήματα 1/TT ss
Δειγματοληψία και Πεδίο Συχνοτήτων (3) Παρατηρήστε την αναδίπλωση (κατοπτρισμό) του φάσματος στις αρνητικές συχνότητες Δειγματοληπτούμε με ff ss = 1/TT ss
Ανακατασκευή του Σήματος Για να ανακτήσουμε το αρχικό σήμα από τα δείγματα πρέπει να πάρουμε τη συνέλιξή τους με το κατάλληλο φίλτρο που να απομονώνει το κεντρικό (αρχικό) εύρος συχνοτήτων
Μη διαχωρίσιμο Φάσμα Ταύτιση (1) Αν τα «είδωλα» του αρχικού φάσματος επικαλύπτονται με αυτό, τότε δε μπορούμε να ανακτήσουμε το αρχικό σήμα! Το νέο (επικαλυπτόμενο) φάσμα παριστάνει πια ένα διαφορετικό σήμα
Μη διαχωρίσιμο Φάσμα Ταύτιση (2) Αυτό είναι το φάσμα ενός διαφορετικού σήματος!
Το Κριτήριο Nyquist Με βάση τα προηγούμενα, αν Β είναι η μέγιστη συχνότητα ενός φραγμένου σήματος, η συχνότητα ff ss με την οποία παίρνουμε τα δείγματα πρέπει να είναι τουλάχιστο 2XB ώστε να αποφύγουμε την επικάλυψη των ειδώλων και επομένως το πρόβλημα της ταύτισης BB BB ff ss
Αντι-ταύτιση (Antialiasing) (1) Ok, και τι κάνουμε με τις περιπτώσεις: Δεδομένου και περιορισμένου ρυθμού δειγματοληψίας που δε μπορεί να ρυθμιστεί ανάλογα με τη μέγιστη συχνότητα της πληροφορίας (π.χ. Pixels μιας εικόνας); Σήματα με άπειρο (ή πολύ μεγάλο) φάσμα; Δεδομένος ρυθμός δειγματοληψίας (pixels) Ασυνέχεια: άπειρο φάσμα
Αντι-ταύτιση (Antialiasing) (2) Πρέπει να περιορίσουμε το φάσμα του σήματος πριν τη δειγματοληψία, απορρίπτοντας τις συχνότητες πέρα από το μισό ρυθμό δειγματοληψίας Κόβουμε υψηλές συχνότητες Εξομαλύνουμε (θολώνουμε) το αρχικό σήμα! Το αρχικό σήμα δε γίνεται να ανακτηθεί μεν, αλλά: Τουλάχιστο δεν έχουμε προβλήματα ταύτισης
Φίλτρα Αντι-ταύτισης (1) Περιορίζουν το φάσμα του σήματος στο ρυθμό δειγματοληψίας: [ ff ss, ff ss ] προκειμένου να γίνει σωστά η 2 2 δειγματοληψία με ρυθμό ff ss Τα ιδανικά φίλτρα δεν ενισχύουν ούτε καταστέλλουν τις ωφέλιμες συχνότητες: Ιδανικό φίλτρο διέλευσης ζώνης: sinc(x). Στο πεδίο συχνοτήτων είναι ένα κουτί: ίση απόκριση συχνοτήτων ff ss ff ss
Φίλτρα Αντι-ταύτισης (2) Μπορώ να φτιάξω ένα ιδανικό φίλτρο; Εμ όχι. Γι αυτό είναι «ιδανικό»! Τα ιδανικά φίλτρα είναι IIR, οπότε δεν υπάρχει πρακτικός τρόπος εφαρμογής τους στο χώρο του σήματος Τα προσεγγίζουμε με «καλά» FIR φίλτρα: Η απόκρισή τους μοιάζει με εξομαλυμένα IIR Image source: Triad Semiconductors
Φίλτρα Ανακατασκευής (1) Πλέον έχοντας τα δείγματα ενός σήματος προσαρμοσμένου φάσματος, πρέπει να ανακατασκευάσουμε ένα συνεχές σήμα από τα δείγματα: Θυμηθείτε: Έχουμε επιβάλει το κριτήριο Nyquist: Τα είδωλα του φάσματος είναι επαρκώς διαχωρισμένα Και πάλι χρειαζόμαστε να φιλτράρουμε το (δειγματοληπτημένο πλέον) σήμα ώστε να απαλλαγούμε από τις πλευρικές συνιστώσες του φάσματος
Φίλτρα Ανακατασκευής (2) Ιδανικό φίλτρο Πολύ πεπλατυσμένη απολαβή: πιάνει και τις πλευρικές μπάντες Καταστέλλει ωφέλιμες συχνότητες Καλό φίλτρο