Υπολογιστικά συστήµατα: ψηφιακά µέσα



Σχετικά έγγραφα
Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων

2. ΨΗΦΙΟΠΟΙΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ

ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ. Εισαγωγή στα Σήµατα Εισαγωγή στα Συστήµατα Ανάπτυγµα - Μετασχηµατισµός Fourier Μετασχηµατισµός Z

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Τηλεπικοινωνιακά Συστήματα Ι

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

Τηλεπικοινωνίες. Ενότητα 5: Ψηφιακή Μετάδοση Αναλογικών Σημάτων. Μιχάλας Άγγελος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Τι συσχετίζεται με τον ήχο

Εφαρμογές που συνδυάζουν ταυτόχρονα πολλαπλά μέσα : Κί Κείμενο, Εικόνα, Ήχος, Video, Animation. Στα υπερμέσα η πρόσπέλαση της πληροφορίας γίνεται

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

ΨΗΦΙΟΓΡΑΦΙΚΕΣ ΕΙΚΟΝΕΣ

Επεξεργασία Χαρτογραφικής Εικόνας

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

Διαδικασία Ψηφιοποίησης (1/2)

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Βασικές έννοιες. Αναλογικό Βίντεο. Ψηφιακό Βίντεο. Κινούμενα γραφικά (animation)( Πλαίσιο (frame, καρέ) Ρυθμός πλαισίων (frame rate)

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Γιατί Συµπίεση; Βιβλιογραφία

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Κεφάλαιο 2. Οργάνωση και διαχείριση της Πληροφορίας στον. Υπολογιστή

Βίντεο και κινούµενα σχέδια

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας.

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακό βίντεο. Αναλογικό βίντεο / ψηφιοποίηση Διεπαφές Εκτίμηση κίνησης μπλοκ

Ψηφιακή Επεξεργασία Σημάτων

Group (JPEG) το 1992.

Βίντεο. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 06-1

ΒΑΣΙΚΑ ΘΕΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Αντοχή (ruggedness) στο θόρυβο μετάδοσης Αποτελεσματική αναγέννηση (regeneration) Δυνατότητα ομοιόμορφου σχήματος (uniform format) μετάδοσης Όμως:

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα

Εισαγωγή. Τεχνολογία Πολυµέσων 01-1

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Σεραφείµ Καραµπογιάς ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ

Κωδικοποίηση βίντεο (H.261 / DVI)

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Επεξεργασία Χαρτογραφικής Εικόνας

Ψηφιακή Επεξεργασία Σηµμάτων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συµπίεση Εικόνας: Το πρότυπο JPEG

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

Συµπίεση Ήχου µεβάσητην Αντίληψη: Τα πρότυπα συµπίεσης MPEG-1 layer I, layer II, layer III

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Κατηγορίες τεχνικών συµπίεσης. Τεχνικές Συµπίεσης

Συμπίεση Δεδομένων

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Τι συσχετίζεται με τον ήχο

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Τηλεπικοινωνιακά Συστήματα Ι

Κωδικοποίηση βίντεο (MPEG)

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 8: MPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

Ψηφιακές Τηλεπικοινωνίες

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Θέματα Συστημάτων Πολυμέσων. Ενότητα #3: Ιδιότητες μέσων Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Συστήματα Επικοινωνιών ΙI

Συστήματα Επικοινωνιών ΙI

Συστήµατα και Αλγόριθµοι Πολυµέσων

Ευρυζωνικά δίκτυα (2) Αγγελική Αλεξίου

Ψηφιακή Επεξεργασία Εικόνας

Αφήγηση Μαρτυρία. Μουσική. Ενίσχυση μηνύματος Μουσική επένδυση Ηχητικά εφέ

Η ανάγκη για συμπίεση

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ.

Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε Απώλειες. Πρότυπα Συµπίεσης Εικόνων

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

ΠΛΗΡΟΦΟΡΙΚΗ I. 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Υπάρχουσες εφαρμογές:

Συστήµατα και Αλγόριθµοι Πολυµέσων

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακή Εικόνα. Χωρική ανάλυση Αρχεία εικόνων

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Ημιτονοειδή σήματα Σ.Χ.

Τεχνολογία Πολυμέσων. Ενότητα # 13: Κωδικοποίηση βίντεο: MPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα 3: Ψηφιοποίηση της Πληροφορίας. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Τμήμα Λογιστικής. Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές. Μαθήματα 6 και 7 Αναπαράσταση της Πληροφορίας στον Υπολογιστή. 1 Στέργιος Παλαμάς

ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ, 2007 ΘΡ. ΤΣΙΑΤΣΟΣ

Κωδικοποίηση βίντεο (MPEG)

Παράδειγµα ενός ηλεκτρικού συστήµατος

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Ψηφιακό Βίντεο. ΕΣ 200: ημιουργία Περιεχομένου ΙΙ. Περιεχόμενα - Βιβλιογραφία. Περιεχόμενα. Βιβλιογραφία. Βασικές έννοιες

Μορφοποίηση και ιαµόρφωση Σηµάτων Βασικής Ζώνης

Μετάδοση πληροφορίας - Διαμόρφωση

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

0, αλλιώς. Σεραφείµ Καραµπογιάς. Παράδειγµα 1 Η πηγή X(t) είναι στατική Gaussian µε µέση τιµή µηδέν και φασµατική πυκνότητα ισχύος.

Συµπίεση δεδοµένων: Εισαγωγή, Κατηγορίες τεχνικών συµπίεσης, Ανάλυση βασικών τεχνικών συµπίεσης

Κωδικοποίηση εικόνων κατά JPEG

Εξεταστική Ιανουαρίου 2007 Μάθηµα: «Σήµατα και Συστήµατα»

Τεχνολογία Πολυμέσων. Ενότητα 9: Αναλογικό Βίντεο. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Transcript:

Υπολογιστικά συστήµατα: ψηφιακά µέσα ιδάσκων: Τα ψηφιακά µέσα είναι πληροφορίες που... είναι αντιληπτές από τις αισθήσεις µας προς το παρόν: όραση, ακοή, αφή στο µέλλον: όσφρηση και γεύση(;) µπορούν οι υπολογιστές να τις διαχειριστούν σύλληψη, επεξεργασία, αποθήκευση-µετάδοση, αναπαραγωγή αναπαρίστανται από bits 1

είδη ψηφιακών µέσων Κείµενο: Μη δοµηµένο (π.χ. ASCII text documents), οµηµένο (word processors, postscript, html, κ.λπ.), hypertext Ήχος: µουσική, φωνή, συνθετικός δοµηµένος ήχος (π.χ. MIDI) Μονοκαναλικός Μονοφωνικός Πολυκαναλικός (Στερεοφωνικός, surround, κ.λπ.) Εικόνες: Φυσικές φωτογραφίες, συνθετικές εικόνες (2D γραφικά), Fax, στερεοσκοπικές και πανοραµικές εικόνες, ιατρικές εικόνες Έγχρωµες Αποχρώσεων του γκρι υαδικές Βίντεο: Φυσικό βίντεο (Ταινίες, ειδήσεις, κ.λπ), 3D γραφικά µερικές χρήσεις ψηφιακών µέσων... µετάδοση και λήψη ψηφιακής τηλεόρασης βίντεο κατ' απαίτηση συστήµατα τηλεφωνίας (σταθερής & κινητής) fax συστήµατα διαχείρισης απεικονιστικών ιατρικών εξετάσεων Medical Picture Archiving and Communication Systems PACS παιχνιδοµηχανές επεξεργασία και έκδοση εντύπων Desk-top Publishing DTP Pre-press ηλεκτρονική αρχειοθέτηση οπτικοακουστικού υλικού και ηλεκτρονικών εγγράφων 2

συστήµατα διαχείρισης ψηφιακών µέσων ψηφιοποίηση δειγµατοληψία + κβαντισµός 3

δειγµατοληψία από ένα αναλογικό µέσο παράγεται µια ακολουθία δειγµάτων µίας διάστασης: ήχος δύο διαστάσεων: εικόνες τριών διαστάσεων: βίντεο δείγµα: µέτρηση του σήµατος σε µία συγκεκριµένη θέση θέση: στο χρόνο, στο χώρο, στο χώρο-χρόνο απώλεια πληροφορίας; ίσως όχι... αν δειγµατοληπτούµε αρκετά συχνά δειγµατοληψία µονοδιάστατων σηµάτων xc (t) : αναλογικό σήµα ήχου x(n) : δειγµατοληπτηµένο σήµα = ακολουθία δειγµάτων x(n) = xc(tn), n ακέραιος Τ : περίοδος δειγµατοληψίας fs = 1/T : συχνότητα δειγµατοληψίας (δείγµατα/sec = Hz) xc(t) n=-1 n=0 n=1 n=2 n=3 n=4 n=5 n=6-1 T 0 T 2 T 3 T 4 T 5 T 6 T t 4

δειγµατοληψία διδιάστατων σηµάτων xc (t v,t h ) : αναλογικό σήµα εικόνας x(n v,n h ) : δειγµατοληπτηµένο σήµα = 2 ακολουθία δειγµάτων x(n v, n h ) = xc(t v n v, T h n h ), n v, n h ακέραιοι Τ v : περίοδος δειγµατοληψίας στην κατακόρυφη κατεύθυνση Τ h : περίοδος δειγµατοληψίας στην οριζόντια κατεύθυνση fsv = 1/T v : συχνότητα κατακόρυφης δειγµατοληψίας (γραµµές / µονάδα µήκους) fsh = 1/T h : συχνότητα οριζόντιας δειγµατοληψίας (στήλες / µονάδα µήκους) δειγµατοληψία τρισδιάστατων σηµάτων xc (t v,t h,t) : αναλογικό σήµα βίντεο x(n v,n h,n) : δειγµατοληπτηµένο σήµα = 3 ακολουθία δειγµάτων x(n v, n h, n) = xc(t v n v, T h n h, Tn), n v, n h, n ακέραιοι Τ v : περίοδος δειγµατοληψίας στην κατακόρυφη κατεύθυνση Τ h : περίοδος δειγµατοληψίας στην οριζόντια κατεύθυνση Τ : περίοδος χρονικής δειγµατοληψίας fsv = 1/T v : συχνότητα κατακόρυφης δειγµατοληψίας (γραµµές / µονάδα µήκους) fsh = 1/T h : συχνότητα οριζόντιας δειγµατοληψίας (στήλες / µονάδα µήκους) f = 1/T : συχνότητα χρονικής δειγµατοληψίας (καρέ / µονάδα χρόνου) 5

µπορούµε να πάµε προς τα πίσω; Από τα δείγµατα, x(n), µπορούµε να ανακατασκευάσουµε το αρχικό σήµα x c (t) υπό δύο προϋποθέσεις: 1.Το αρχικό σήµα x c (t) έχει πεπερασµένο εύρος συχνοτήτων = έχει µια µέγιστη συχνότητα µεταβολής f max 2.Η δειγµατοληψία γίνεται αρκετά πυκνά: f s > 2f max (η συχνότητα 2f max λέγεται συχνότητα Nyquist) 3.Αλλιώς έχουµε αναδίπλωση συχνότητας = στο ανακατασκευασµένο σήµα εµφανίζονται συχνότητες που δεν υπάρχουν στο αρχικό αναδίπλωση συχνότητας σε σήµατα 1 1 1 0.5 0.5 x c (t) 0 x c (t), x 1 (n) 0-0.5-0.5-1 0 0.1 0.2 0.3 0.4 0.5 t -1 0 0.1 0.2 0.3 0.4 0.5 t 1 0.5 x c (t), x 2 (n) 0-0.5-1 0 0.1 0.2 0.3 0.4 0.5 t 6

αναδίπλωση συχνότητας σε σήµατα 2 (Ι) αναδίπλωση συχνότητας σε σήµατα 2 (ΙΙ) 7

κβαντισµός ανάγκη αναπαράσταση των δειγµάτων µε πεπερασµένο αριθµό bits µε b bits n=2 b διαφορετικά κβαντικά σύµβολα η περιοχή τιµών των δειγµάτων (πεδίο τιµών) διαµερίζεται σε κβαντικές ζώνες οι τιµές δειγµάτων της ίδιας ζώνης αντιστοιχίζονται σε ένα κβαντικό σύµβολο που αντιπροσωπεύει τη ζώνη αντιστοιχεί σε στρογγυλοποίηση οποιαδήποτε τιµή στο εσωτερικό της ζώνης αντιστοιχίζεται στο ίδιο σύµβολο απώλεια πληροφορίας κβαντιστής Ο κβαντιστής s=q[x ] µε n στάθµες ορίζεται από: 1. Τις ζώνες κβαντισµού p i (=διαστήµατα τιµών του x) τα διαστήµατα ορίζονται από τα άκρα τους, d i : p 0 = (-, d 1 ) p1= [d 1, d 2 ), p n-1 = [d n-1, ) 2. Τα σύµβολα s 0,, s n-1 Η έξοδος του κβαντιστή είναι το σύµβολο s i αν το x ανήκει στη ζώνη p i Για n στάθµες χρειάζονται b=log 2 (n) bits/σύµβολο ισοδύναµα µε b bits ορίζονται n=2 b σύµβολα π.χ. n=8=2 3 b=3 αλλά. Αναγκαστικά βέβαια και για n=7 b=3 8

αποκβαντιστής Ο αποκβαντιστής y=q D [s] ορίζεται από τις στάθµες κβαντισµού x 0,, x n-1 Τότε Q D [s i ] x i κβαντιστής - αποκβαντιστής ^ y=q[q[x]] x 3 x 2 d 1 d 2 d 3 x x 1 P 0 P 1 P 2 P 3 x 0 9

σφάλµα κβαντισµού η διαδικασία κβαντισµού-αποκβαντισµού εισάγει πάντα σφάλµα αντίστοιχο του σφάλµατος στρογγυλοποίησης Όσο αυξάνει ο αριθµός n των συµβόλων (= ο αριθµός των σταθµών = ο αριθµός των ζωνών) το σφάλµα µειώνεται Γενικά το σφάλµα δίνεται από την έκφραση: ε = x Q d [ Q[x] ] Ψηφιακή Αναπαράσταση Μέσων... τι ακριβώς περιγράφουν τα δείγµατα;... πόσα δείγµατα χρησιµοποιούνται;... πόσα bits ανά δείγµα χρησιµοποιούνται; 10

ψηφιακή αναπαράσταση ήχου (Ι) κάθε δείγµα έχει τιµή αντίστοιχη προς την πίεση που καταγράφει ένα µικρόφωνο σε µιά συγκεκριµένη χρονική στιγµή ή ισοδύναµα την ηλεκτρική τάση στην έξοδο του µικροφώνου ψηφιακός µονοκαναλικός ήχος µονοδιάστατη ακολουθία βαθµωτών δειγµάτων πολυκαναλικός ήχος µονοδιάστατη ακολουθία διανυσµάτων ή ισοδύναµα πολλαπλές µονοδιάστατες ακολουθίες βαθµωτών δειγµάτων: µία για κάθε κανάλι ψηφιακή αναπαράσταση ήχου (ΙΙ) µονοκαναλικός ήχος:... x(n) x(n+1) x(n+2)... πολυκαναλικός ήχος µε k κανάλια... x(n) x(n+1) x(n+2)... όπου x(n) = ή... x 1 (n) x 1 (n+1) x 1 (n+2)...... x 2 (n) x 2 (n+1) x 2 (n+2)....... x k (n) x k (n+1) x k (n+2)... x1 ( n) x2( n).. x ( n) k 11

ψηφιακή αναπαράσταση ήχου (ΙΙI) Τύπος φωνή χαµηλής ποιότητας (π.χ. τηλέφωνο) φωνή υψηλής ποιότητας Εύρος αναλογικών συχνοτήτων 200-3200 Hz 50 7000 Hz Συχνότητα δειγµατοληψίας 8 KHz 16 KHz bits/δείγµα 16 16 bitrate 128 Kbits/sec 256 Kbits/sec ήχος CD 20 20000 Hz 44,1 KHz 2 κανάλια x 16 1,41 Mbits/sec ψηφιακή αναπαράσταση εικόνας (Ι) εικόνες αποχρώσεων του γκρί ( ασπρόµαυρες ) κάθε δείγµα έχει τιµή αντίστοιχη προς τη φωτεινότητα στην αντίστοιχη θέση αναπαρίστανται από έναν διδιάστατο πίνακα βαθµωτών τιµών y(1,1) y(1,2) L y(1, N) Y = y(2,1) M y( M,1) y(2,2) M y( M,2) L M L y(2, N) M y( M, N) 12

ψηφιακή αναπαράσταση εικόνας (ΙΙ) έγχρωµες εικόνες κάθε δείγµα είναι ένα διάνυσµα µήκους 3 οι συνιστώσες του διανύσµατος αναπαριστούν την ένταση µιας χρωµατικής συνιστώσας στην απλούστερη περίπτωση οι τρεις χρωµατικές συνιστώσες αντιστοιχούν στο κόκκινο (r), στο πράσινο (g) και στο µπλε (b) άρα η αναπαράσταση αποτελείται από τρεις πίνακες (R, G, B) µε βαθµωτές τιµές ή ισοδύναµα ένα πίνακα µε διανυσµατικά στοιχεία ψηφιακή αναπαράσταση εικόνας (ΙΙΙ) γιατί χρησιµοποιούµε 3 χρωµατικές συνιστώσες; χρειάζεται να κατανοήσουµε τη φυσιολογία του ανθρώπινου µατιού τα κωνία του µατιού (φωτοευαίσθητα κύτταρα) χωρίζονται σε 3 οικογένειες κάθε µία από τις 3 είναι ευαίσθητη σε διαφορετική περιοχή του φωτεινού φάσµατος για κάθε σηµείο της εικόνας φτάνουν στον εγκέφαλο 3 τιµές από τα αντίστοιχα κωνία 13

ψηφιακή αναπαράσταση εικόνας (IV) η φασµατική απόκριση των 3 οικογενειών κωνίων s r (Ï), s g (Ï), s b (Ï) - ðfiîúèûë ÛÂ ðúôûð ðùô Û ÎÙÈÓÔ ÔÏ Ì ÎÔ Î Ì ÙÔ Ï B G R f(λ) = φάσµα µίας έγχρωµης φωτεινής πηγής 400 440 480 520 560 600 640 680 Ï (nm) ψηφιακή αναπαράσταση εικόνας (IV) η φασµατική απόκριση των 3 οικογενειών κωνίων η πληροφορία που φτάνει στον εγκέφαλο από κάθε σηµείο της εικόνας είναι: r c = g = b s r ( λ) f ( λ) dλ sg ( λ) f ( λ) dλ sb( λ) f ( λ) dλ τα s r (λ), s g (λ), s b (λ) και ένα παράδειγµα του f(λ) φαίνονται στην προηγούµενη διαφάνεια στην ψηφιακή αναπαράσταση χρησιµοποιούµε ένα διάνυσµα a c 14

ψηφιακή αναπαράσταση βίντεο βίντεο = ακολουθία (ακίνητων) εικόνων καρέ ή πλαίσιο = κάθε µία από τις ακίνητες εικόνες συχνότητα χρονικής δειγµατοληψίας: περί τα 20 30 πλαίσια/sec (frames per second fps) σύστηµα PAL (ευρωπαϊκή τηλεόραση) 25 fps σύστηµα NTSC (αµερικανική τηλεόραση) 30 fps διαστάσεις πλαισίου: PAL 576 γραµµές x 720 στήλες NTSC 486 γραµµές x 720 στήλες High Definition TV 720 γραµµές x 1280 στήλες µέχρι 1080 γραµµές x 1920 στήλες Συµπίεση - Κωδικοποίηση να µειώσουµε το πλήθος των bits που απαιτούνται για την αναπαράσταση των ψηφιακών µέσων 15

µία ώρα µουσικής... 1 h x 3600 sec/h x 44100 δείγµατα/sec x 16 bits/δείγµα x 2 κανάλια = 5.080.320.000 bits 4.7 Gigabits 600 Mbytes δηλαδή όσο η χωρητικότητα 1 CD ένα δευτερόλεπτο φωνής 1 sec x 8000 δείγµατα/sec x 16 bits/δείγµα x 1 κανάλι = 128000 bits 128 kbits άρα απαιτούνται 128 kbps ενώ οι τηλεφωνικές συνδέσεις παρέχουν από 9,6 kbps έως το πολύ 56 kbps. 16

µία σελίδα Α4 στο fax υπόθεση: οριζόντια συχνότητα δειγµατοληψίας f h = 150 dots per inch (dpi) κατακόρυφη συχνότητα δειγµατοληψίας f v = 150 lines per inch (lpi) διαστάσεις Α4: 8,27 inches x 11,69 inches ρυθµός µετάδοσης (bitrate) = 9600 bps (bits per second) 8,27x11,69 x 150 x 150 δείγµατα x 1 bit/δειγµα = 2.175.216 bits 2 Mbits 0,25 Mbytes 227 sec για µετάδοση πάνω από σύνδεση 9600 bps 16 σελίδες την ώρα!!! ένα δευτερόλεπτο ψηφιακού βίντεο PAL 1 sec x 25 πλαίσια / sec x 576 x 720 δείγµατα / πλαίσιο x 3 χρωµατικές συνιστώσες / δείγµα x 8 bits / χρωµατική συνιστώσα = 248.832.000 bits 237 Mbits 30 Mbytes Για σύγκριση η χωρητικότητα (bandwidth): του πανεπιστηµιακού δικτύου δεδοµένων: 100 Mbits/sec των γραµµών ATM: ~155 Mbits/sec των δορυφορικών καναλιών: ~32 Mbits/sec των συνδέσεων DSL: 1,5 8 Mbits/sec Ένα DVD των 4 Gbytes θα χωρούσε ~133 sec βίντεο! 17

άρα χρειάζεται συµπίεση της αναπαράστασης ασυµπίεστη αναπαράσταση συµπίεση ψηφιακών µέσων ελεγχόµενη παραµόρφωση του αρχικού σήµατος κωδικοποίηση εντροπίας συµπιεσµένη αναπαράσταση µετασχηµατισµός για µείωση της περίσσειας της πληροφορίας ελεγχόµενη παραµόρφωση του µετασχηµατισµένου σήµατος συµπίεση µε απώλειες: από τη συµπιεσµένη αναπαράσταση µπορεί να ανακατασκευαστεί ένα παραµορφωµένο αντίγραφο της αρχικής (ασυµπίεστης) συµπίεση χωρίς απώλειες: είναι εφικτή η τέλεια ανακατασκευή λείπουν τα γκρίζα blocks του διαγράµµατος λιγότερη συµπίεση 18

ελεγχόµενη παραµόρφωση του αρχικού σήµατος υποδειγµατοληψία µείωση διάστασης της εικόνας µετάδοση άλλοτε των άρτιων και άλλοτε των περιττών γραµµών στο βίντεο κ.λπ. απάλειψη υψηλών συχνοτήτων µείωση του αριθµού των κβαντικών επιπέδων κ.λπ. µετασχηµατισµός για µείωση της περίσσειας της πληροφορίας περίσσεια πληροφορίας: αποθηκεύουµε / µεταδίδουµε την ίδια πληροφορία πολλές φορές συνήθως γειτονικά δείγµατα είναι συσχετισµένα η τιµή ενός δείγµατος µπορεί να προβλεφθεί από τα γειτονικά του µείωση περίσσειας = αποσυσχέτιση τεχνικές: πρόβλεψη και αφαίρεση : π.χ. Differential Pulse Code Modulation (DPCM) µετασχηµατισµός: π.χ., ιακριτού Συνηµιτόνου (DCT), Karhunen Loeve (KLT) εκτίµηση και αντιστάθµιση κίνησης 19

ελεγχόµενη παραµόρφωση του µετασχηµατισµένου σήµατος κβαντισµός του µετασχηµατισµένου σήµατος µε ελεγχόµενη ακρίβεια οδηγεί σε απώλεια πληροφορίας κωδικοποίηση εντροπίας (Ι) εντροπία (H): έστω ένας µηχανισµός παραγωγής n διαφορετικών συµβόλων {s 0, s 1,, s n-1 } όπως ο κβαντιστής του προηγούµενου σταδίου ο µηχανισµός αυτός χαρακτηρίζεται ως πηγή συµβόλων αν p i η πιθανότητα εµφάνισης του συµβόλου s i n H = = i 1 0 p i log 2 ( p ) i 20

κωδικοποίηση εντροπίας (ΙΙ) Έστω ότι επιλέγουµε τις κωδικές δυαδικές λέξεις {w 0, w 1,, w n-1 } για να αναπαραστήσουµε τα σύµβολα της πηγής το µήκος, w i, της κάθε λέξης µπορεί να είναι διαφoρετικό π.χ, s 0 w 0 = 1101 w 0 = 4 bits w 1 = 101 w 1 = 3 bits, κ.λπ. το µέσο µήκος λέξης είναι n L = = i 1 0 p i w i κωδικοποίηση εντροπίας (ΙΙΙ) Θεώρηµα: η εντροπία είναι το κάτω όριο του µέσου µήκους λέξης = δεν µπορούµε να πετύχουµε καλύτερη συµπίεση απότι µας δηλώνει η εντροπία L H κωδικοποίηση εντροπίας: επιλέγουµε τις κωδικές λέξεις {w 0, w 1,, w n-1 } έτσι ώστε το µέσο µήκος λέξης L να προσεγγίζει όσο γίνεται περισσότερο την εντροπία H. 21

πρότυπα συµπίεσης ήχος: Differential Pulse Code Modulation (DPCM) MPEG layer III (mp3) εικόνα: πρότυπα του Joint Pictures Expert Group (JPEG) µε απώλειες συµπίεση 10 προς 1 χωρίς απώλειες συµπίεση 2-3 προς 1 βίντεο: πρότυπα της επιτροπής Motion Pictures Expert Group MPEG 1 ~1.5 Mbits/sec εφαρµογές πολυµέσων/internet MPEG 2 2 ώς 60 Mbits/sec ψηφιακή TV, DVD, ψηφιακός κινηµατογράφος H.261 και H.263 64, 128, p x 64 Kbits/sec videoconference 22