Συμπίεση Δεδομένων Δρ. Ν. Π. Σγούρος

Σχετικά έγγραφα
Κλίμακα των δυνάμεων του 10.

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Συμπίεση Δεδομένων

Ψηφιακές Τηλεπικοινωνίες

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Συμπίεση Δεδομένων

ΠΛΗ 21 - Τι είναι Ψηφιακό Σύστημα

ΠΑΡΑΓΩΓΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΚΕΦΑΛΑΙΟ ΠΕΜΠΤΟ ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Τηλεπικοινωνιακά Συστήματα Ι

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Κεφάλαιο 2. Οργάνωση και διαχείριση της Πληροφορίας στον. Υπολογιστή

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Τηλεπικοινωνιακά Συστήματα ΙΙ

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Τηλεπικοινωνιακά Συστήματα ΙΙ

2 ΒΑΣΙΚΕΣ ΑΡΧΕΣ Βασικές Έννοιες

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Θέματα Συστημάτων Πολυμέσων

Ψηφιακή Επεξεργασία Εικόνας

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συμπίεση Δεδομένων

Ψηφιακές Τηλεπικοινωνίες

Τι συσχετίζεται με τον ήχο

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Β1.1 Αναπαράσταση Δεδομένων και Χωρητικότητα Μονάδων Αποθήκευσης

Τεχνολογία Πολυμέσων. Ενότητα # 7: Θεωρία πληροφορίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Ψηφιακές Τηλεπικοινωνίες. Θεωρία Ρυθμού Παραμόρφωσης

Εισαγωγή στην Επεξεργασία Σήματος. Νόκας Γιώργος

Συμπίεση Πολυμεσικών Δεδομένων

Θεωρία πληροφοριών. Τεχνολογία Πολυµέσων 07-1

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

Ψηφιακή Επεξεργασία Εικόνας

Ημιτονοειδή σήματα Σ.Χ.

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

ΕΠΙΚΟΙΝΩΝΙΕΣ, ΔΙΚΤΥΑ & ΤΕΧΝΟΛΟΓΙΑ ΥΠΟΛΟΓΙΣΤΩΝ

Αναπαράσταση Δεδομένων

Θέματα Συστημάτων Πολυμέσων. Ενότητα #3: Ιδιότητες μέσων Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

ΕΑΠ/ΠΛΗ22/ΑΘΗ-3. 3 η ΟΣΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

ΕΑΠ/ΠΛΗ22/ΑΘΗ-4. 3 η ΟΣΣ

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

Δ10. Συμπίεση Δεδομένων

Εισαγωγή στη θεωρία πληροφορίας

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

ΠΛΗΡΟΦΟΡΙΚΉ. Μάθημα 7

Τετάρτη 5-12/11/2014. ΣΗΜΕΙΩΣΕΙΣ 3 ου και 4 ου ΜΑΘΗΜΑΤΟΣ ΕΙΔΙΚΟΤΗΤΑ: ΤΕΧΝΙΚΟΣ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ: ΑΡΧΙΤΕΚΤΟΝΙΚΗ Η/Υ Α ΕΞΑΜΗΝΟ

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Σεραφείµ Καραµπογιάς. Πηγές Πληροφορίας και Κωδικοποίηση Πηγής 6.3-1

Ευρυζωνικά δίκτυα (2) Αγγελική Αλεξίου

Ψηφιακή Επεξεργασία Σημάτων

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Εφαρμογές που συνδυάζουν ταυτόχρονα πολλαπλά μέσα : Κί Κείμενο, Εικόνα, Ήχος, Video, Animation. Στα υπερμέσα η πρόσπέλαση της πληροφορίας γίνεται

Εισαγωγή στον Προγραμματισμό

Μετάδοση σήματος PCM

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τηλεπικοινωνιακά Συστήματα ΙΙ

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών

Διαδικασία Ψηφιοποίησης (1/2)

K24 Ψηφιακά Ηλεκτρονικά 6: Πολυπλέκτες/Αποπολυπλέκτες

Θεώρημα κωδικοποίησης πηγής

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

ΕΠΙΚΟΙΝΩΝΙΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΕΣ INTERNET

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 2 : Πληροφορία και Εντροπία Διάλεξη: Κώστας Μαλιάτσος Χρήστος Ξενάκης, Κώστας Μαλιάτσος

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

2. ΨΗΦΙΟΠΟΙΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ

υπολογιστικών συστημάτων. Παρουσίαση με τίτλο "Περιεχόμενο, διαδικασία μαθήματος και εισαγωγή"

Παναγιώτης Μαθιόπουλος Ph.D.

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

Αναπαράσταση Δεδομένων (2 ο μέρος) ΜΥΥ-106 Εισαγωγή στους Η/Υ και στην Πληροφορική

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τηλεπικοινωνιακά Συστήματα Ι

Βασικές Έννοιες Πληροφορικής

Τηλεπικοινωνίες. Ενότητα 5: Ψηφιακή Μετάδοση Αναλογικών Σημάτων. Μιχάλας Άγγελος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Πρόλογος 1. 1 Μαθηµατικό υπόβαθρο 9

Τμήμα Λογιστικής. Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές. Μαθήματα 6 και 7 Αναπαράσταση της Πληροφορίας στον Υπολογιστή. 1 Στέργιος Παλαμάς

Ψηφιακές Επικοινωνίες

Σημείωμα Αδειοδότησης

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Πανεπιστήμιο Πατρών Τμήμα Φυσικής Εργαστήριο Ηλεκτρονικής. Ψηφιακά Ηλεκτρονικά. Αριθμητικά Συστήματα. Επιμέλεια Διαφανειών: Δ.

ΒΑΣΙΚΑ ΘΕΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΚΕΦΑΛΑΙΟ 1 Ψηφιακός Κόσμος

Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o

Μέσα, Πολυµέσα & µέτρηση Πληροφορίας

Δ11 Δ12. Συμπίεση Δεδομένων

Ψηφιακή Επεξεργασία Εικόνας

Αφήγηση Μαρτυρία. Μουσική. Ενίσχυση μηνύματος Μουσική επένδυση Ηχητικά εφέ

15/3/2009. Ένα ψηφιακό σήμα είναι η κβαντισμένη εκδοχή ενός σήματος διάκριτου. χρόνου. Φλώρος Ανδρέας Επίκ. Καθηγητής

Θέματα Συστημάτων Πολυμέσων

Transcript:

Συμπίεση Δεδομένων 2013-2014

Συμπίεση Δεδομένων Αποτελεί ένα μέσο μείωσης του όγκου σε ένα σύνολο από δεδομένα διατηρώντας ωστόσο το νόημα των δεδομένων αυτών Αποτελεί μία τεχνική μείωσης του πλεονασμού σε ένα σύνολο από δεδομένα Αποτελεί μία τεχνική μείωσης του χρόνου και του κόστους μετάδοσης των δεδομένων Υπάρχουν πολλοί διαφορετικοί αλγόριθμοι συμπίεσης προσανατολισμένοι σε διαφορετικά σύνολα δεδομένων και με διαφορετικούς στόχους 2

Περιεχόμενα Α Μέρους Ι Περίγραμμα Α Μερους Εισαγωγή στη Συμπίεση Δεδομένων Επανάληψη Βασικών Εννοιών από Θεωρία Πληροφορίας Κωδικοποίηση Εξόδου Πηγής με Σύμβολα Διακριτά και Στατιστικά Ανεξάρτητα, Κώδικες Εντροπίας Κωδικοποίηση Εξόδου Πηγής αναλογικού Σήματος 3

Περιεχόμενα Α Μέρους ΙΙ Βιβλιογραφία Διαφάνειες Μαθήματος (Μ. Σαγκριώτης, Ν. Σγούρος) J. G. Proakis, M. Salehi Communication Systems Engineering Prentice Hall, 2001 (Ελληνική Μετάφραση) D. MacKay Information Theory, Inference and Learning Algorithms Cambridge University Press, 2003 D. Salomon, Data Compression, The Complete Reference Springer, 2007 J. G. Proakis, D. K. Manolakis Digital Signal Processing, 4 th edition, Prentice Hall, 2006 4

Δεδομένα Ι Ποσοτική Μονάδα μέτρησης μεγέθους πλήθους - όγκου δεδομένων binary digit - bit : Είναι η βασική μονάδα μέτρησης μιας ποσότητας ή όγκου δεδομένων. Δύο δυνατές τιμές (π.χ. 0/1, Yes/No, On/Off) Πρώτη χρήση : Διάτρητες κάρτες (Bouchon-1732) Πρώτη αναφορά ονόματος: Tuckey-1947 Shannon 1948 Συμβολισμός: bit ISO/IEC 80000-13 (2008) ή b IEEE 1541 (2002) 5

Δεδομένα ΙΙ Πολλαπλάσια Μονάδων μέτρησης πλήθους-όγκου δεδομένων Για πολλές δεκαετίες χρησιμοποιείται διπλή αναπαράσταση για τα πολλαπλάσια π.χ. Kilo 2 10 =1024 Kilo 10 3 =1000 Πρόθεμα Δυαδική Δεκαδική Ποσοστιαία Διαφορά Kilo 1.024 +2.4% Mega 1.049 +4.9% Giga 1.074 +7.4% Tera 1.100 +10.0% Peta 1.126 +12.6% Exa 1.153 +15.3% Zetta 1.181 +18.1% Yotta 1.209 +20.9% ISO/IEC 80000-13 (2008) : Εναρμόνιση προθεμάτων όπως αναφέρονται στο SI για το σύνολο των φυσικών και μαθηματικών μεγεθών 6

Δεδομένα ΙΙΙ Στην περίπτωση που χρησιμοποιούνται δυνάμεις του 2 τότε αποκλειστικά δηλώνεται διαφορετικό πρόθεμα Σύμβολο Πρόθεμα Μονάδα Μέγεθος Ki Kibi Kibibyte (KiB) 2 10 bytes Mi Mebi Mebibyte (MiB) 2 20 bytes Gi Gibi Gibibyte (GiB) 2 30 bytes Ti Tebi Tebibyte (TiB) 2 40 bytes Pi Pebi Pebibyte (PiB) 2 50 bytes Ei Exbi Exbibyte (EiB) 2 60 bytes Zi Zebi Zebibyte (ZiB) 2 70 bytes Yi Yobi Yobibyte (EiB) 2 80 bytes ISO/IEC 80000-13 (2008) 7

Όγκος Δεδομένων (EBytes) Όγκος παραγόμενων δεδομένων Ετήσιος παγκόσμιος όγκος παραγόμενων δεδομένων Παραγόμενα δεδομένα 3000 Όγκος Δεδομένων (Πρόβλεψη) 2500 Όγκος Δεδομένων (Πραγματικός) 2000 1500 Cloud 1000 500 ADSL2 Facebook 0 1998 2000 2002 2004 2006 2008 2010 2012 2014 Χρονολογία 8

Αναλογικά Ψηφιακά Σήματα Αναλογικό Σήμα x t, t [t min, t max ], x [x min, x max ] Δειγματοληψία t n, x t x n, n = 1,, N Κβάντιση x n x(n) 9

Παράδειγμα Αναλογικό σήμα Δειγματοληψία Κβάντιση 10

Άσκηση 1.1 Ποια η ποσότητα δεδομένων που μεταφέρεται στον ανθρώπινο εγκέφαλο όταν κάποιος ακούει μουσική για χρονικό διάστημα μίας ώρας Εύρος ακουστικών συχνοτήτων 20Hz έως 22kHz (16bits/δείγμα) Ποια η ποσότητα δεδομένων που μεταφέρεται στον ανθρώπινο εγκέφαλο από τα μάτια του σε διάστημα μίας ώρας Πλήθος λήψεων ματιού: ~30 λήψεις /s Ανάλυση αισθητήρα ματιού: ~576 Mpixels (Χρωματική απόκριση ~12bits/pixel) Ποια η συνολική ποσότητα δεδομένων που μεταφέρονται στον εγκέφαλο ανά δευτερόλεπτο (ρυθμός) από τις δύο παραπάνω πηγές 11

Άσκηση 1.2 Ποιος ο ρυθμός μετάδοσης για το επερχόμενο πρότυπο τηλεόρασης Ultra High Definition Television (UHDTV) 4K; Εικόνα Πλήθος pixels: Χρώμα: Ρυθμός Πλαισίων: 2160 x 3840 pixels/πλαίσιο 10-12 bits/pixel 60 fps έως 120fps (120Hz) Ήχος Κανάλια : 24 Ρυθμός Δειγματοληψίας: 48kHz-96kHz Κβάντιση: 16/20/24 bits/δείγμα 12

Ψηφιακά μέσα αποθήκευσης Οπτικοί Δίσκοι (CD): 700 ΜΒ = 5.6 Gbit Δίσκοι Ψηφιακού Video (DVD): 4,7GB = 37,6 Gbit Δίσκοι Blu-Ray (BD-XL): 128GB = 1 Tbit Σκληροί Δίσκοι: 4 ΤΒ = 32 Tbit Χωρητικότητα 1gr DNA 1 : 700TB = 5,6 Ebit 1 Church, G. M.; Gao, Y. & Kosuri, S. Next-Generation Digital Information Storage in DNA, Science, 2012, 337, 1628 13

Τηλεπικοινωνιακά κανάλια PSTN: = 56 Kbps ISDN: 2 κανάλια x 64Kbps+16Kbps (σημ.) = 144 Kbps Τ1: 24 κανάλια x 64Kbit/κανάλι = 1.544 Mbps T3: 672κανάλια x 64 KbitΚανάλι = 44.7 Μbps ADSL2+: = 24 Mbps VDSL2 = 100 MBps GSM(2G): = 14.4Kbps UMTS(3G): = 384Kbps 14

Βασικές Αρχές Συμπίεσης Δεδομένων 1 Ασυσχέτιστα δεδομένα Αντιστοίχιση μικρών κωδικών λέξεων σε δεδομένα με μεγάλη πιθανότητα εμφάνισης 2 Συσχετισμένα δεδομένα Αφαίρεση Μείωση της συσχέτισης Πλεονασμού και έπειτα χρήση της παραπάνω τεχνικής 3 Μη καταληπτά δεδομένα Αφαίρεση Μείωση των μη καταληπτών δεδομένων από τον χρήστη 15

Πληροφορία I Έστω πηγή που εκπέμπει διακριτά σύμβολα S i από ένα πεπερασμένο σύνολο C: S i C = A, B,, Ω. Για κάθε S i C ορίζουμε μία πιθανότητα εμφάνισης p i 0 p i 1, p i = 1 Λογική θεώρηση «μικρή πιθανότητα μεγάλη πληροφορία» i «ΨΗΦΙΟ», «Ψ_Φ», «_ΙΟ» Πληροφορία : Ι (Si ) I (pi ) 1 p i Θεωρώντας επιπλέον ότι τα S i εκπέμπονται ανεξάρτητα και ακολουθούν όμοιες κατανομές (i.i.d) τότε για μια λέξη με δύο σύμβολα : p ij = p i p j. Λογική θεώρηση «Η πληροφορία των δύο συμβόλων είναι το άθροισμα της πληροφορίας που κουβαλά το κάθε σύμβολο» Συνολική Πληροφορία : Ι (pij ) = I (pi p j ) = Ι (pi )+Ι (pj ) (Cauchy) 16

Πληροφορία II Επειδή η I (p) μονότονη (Γιατί ;) Με βάση τα προηγούμενα μία λογική εκλογή συνάρτησης για την ποσοτικοποίηση της πληροφορίας είναι η I (pi ) = κ logp i Επιλέγοντας κ = 1 (γιατί;) προκύπτει I (pi ) = log 1 p i Ορίζουμε ως πληροφορία του συμβόλου S i την ποσότητα I (Si ) I (pi ) = log 1 p i Ανάλογα με τη βάση του λογαρίθμου ορίζονται και οι μονάδες Βάση Μονάδες 10 Hartley ή dit e nat 2 bit 17

Εντροπία Ένα καλό στατιστικό μέτρο της πληροφορίας μιας διακριτής πηγής χωρίς μνήμη (DMS) είναι η εντροπία, η οποία αντιστοιχεί στη μέση πληροφορία ανα σύμβολο της πηγής H(s) = N i=1 p i log 2 1 p i 18

Άσκηση 1.3 Mία πηγή χωρίς μνήμη η οποία μπορεί να εκπέμψει Ν διαφορετικά σύμβολα S i, i = 1,, N με πιθανότητες εκπομπής p i, εκπέμπει μία σειρά από λ σύμβολα. Να δείξετε ότι H(s) = N i=1 p i log 2 1 p i 19

Άσκηση 1.4 Να υπολογίσετε την εντροπία μιας πηγής που εκπέμπει δύο σύμβολα (Δυαδική) με πιθανότητες p και 1 p. Ποια είναι η μέγιστη μέση ποσότητα πληροφορίας ανα σύμβολο για τη συγκεκριμένη πηγή; 20

Άσκηση 1.4 Να υπολογίσετε την εντροπία μιας πηγής που εκπέμπει δύο σύμβολα (Δυαδική) με πιθανότητες p και 1 p. Ποια είναι η μέγιστη μέση ποσότητα πληροφορίας ανα σύμβολο για τη συγκεκριμένη πηγή; 21

Παράδειγμα Για μία πηγή που εκπέμπει Ν σύμβολα ισχύει ότι 0 H S log 2 N. Ειδικά ισχύει ότι H S = 0 όταν υπάρχει σύμβολο με p i = 1 και H S = log 2 N όταν p i = 1/Ν για κάθε i. H S 0 1 Επειδή για κάθε σύμβολο p i 1 προκύπτει ότι p i log 2 0 άρα H p S i 0 Ειδικά H S = 0 όταν υπάρχει σύμβολο με p i = 1 (ή p i = 0) 22

Παράδειγμα Για μία πηγή που εκπέμπει Ν σύμβολα ισχύει ότι 0 H S log 2 N. Ειδικά ισχύει ότι H S = 0 όταν υπάρχει σύμβολο με p i = 1 και H S = log 2 N όταν p i = 1/Ν για κάθε i. H S log 2 N Θεωρούμε την ποσότητα H S log 2 N οπότε προκύπτει ότι : H S log 2 N = N 1 i=1 p i log 2 p i H S log 2 N N 1 i=1 p i log 2 Np i log 2 N N i=1 p i lnx x 1 x>0, log 2x= lnx log2e H S log 2 N log 2 e N i=1 p i ( 1 1) log Np 2 e N 1 i=1 p i N i Np i=1 p i 0 i 23

Πλεονασμός Ένα από τα πιθανά μέτρα πλεονασμού είναι το Π = 1 H S log 2 N 24

Κώδικες Πηγής Αποτελούν μια απεικόνιση μίας σειράς συμβόλων που εκπέμπει μία πηγή σε μία σειρά συμβόλων από ένα αλφάβητο με τρόπο ώστε να είναι δυνατή η ανάκτηση των αρχικών συμβόλων με οσοδήποτε μικρή πιθανότητα σφάλματος. Συνήθως χρησιμοποιούνται για το αλφάβητο δυαδικές συμβολοσειρές 25

Κώδικες Πηγής Ακριβής ανάκτηση των αρχικών συμβόλων Μη απωλεστική κωδικοποίηση Μη ακριβής ανάκτηση των αρχικών συμβόλων Απωλεστική κωδικοποίηση Υπάρχουν περιορισμοί στους κώδικες που μπορούν να χρησιμοποιηθούν οι οποίοι σχετίζονται με τη δυνατότητα μοναδικής αποκωδικοποίησης 26

Άσκηση 1.5 Χρησιμοποιήστε την απεικόνιση του παρακάτω πίνακα για να κωδικοποιήσετε και να αποκωδικοποιήσετε τη συμβολοσειρά α 1 α 0 α 2 α 3 α 0. Τι παρατηρείτε ; Σύμβολο Κώδικας α 0 0 α 1 01 α 2 10 α 3 11 27