Μουμτζή Ελένη Α.Μ. 1989



Σχετικά έγγραφα
Τεράστιες ανάγκες σε αποθηκευτικό χώρο

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ.

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Τεχνολογία Πολυμέσων. Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Κωδικοποίηση βίντεο (H.261 / DVI)

Θέμα: «ΣΥΜΠΙΕΣΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΟΛΥΜΕΣΑ» Εισηγητής: Παναγιώτης Γιώτης 20 Μαϊου 2007 Αθήνα

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

Εισαγωγή. Τεχνολογία Πολυµέσων 01-1

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 9 : Συμπίεση δεδομένων. Δρ. Γκόγκος Χρήστος

Βασικές έννοιες. Αναλογικό Βίντεο. Ψηφιακό Βίντεο. Κινούμενα γραφικά (animation)( Πλαίσιο (frame, καρέ) Ρυθμός πλαισίων (frame rate)

Τι συσχετίζεται με τον ήχο

Συστήματα Πολυμέσων. Ενότητα 15: Συμπίεση Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Κωδικοποίηση βίντεο (MPEG)

Αφήγηση Μαρτυρία. Μουσική. Ενίσχυση μηνύματος Μουσική επένδυση Ηχητικά εφέ

Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα).

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Υπάρχουσες εφαρμογές:

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18

ΠΑΡΑΓΩΓΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ

Τι είναι τα πολυμέσα;

Τηλεπικοινωνιακά Συστήματα Ι

Επεξεργασία Χαρτογραφικής Εικόνας

Τεχνολογία Πολυμέσων. Ενότητα # 1: Εισαγωγή Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Εφαρμογές που συνδυάζουν ταυτόχρονα πολλαπλά μέσα : Κί Κείμενο, Εικόνα, Ήχος, Video, Animation. Στα υπερμέσα η πρόσπέλαση της πληροφορίας γίνεται

Συμπίεση Πολυμεσικών Δεδομένων

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

ΨΗΦΙΑΚΗΕΠΕΞΕΡΓΑΣΙΑVIDEO ΣΠΟΥ ΑΣΤΗΣ: ΠΑΣΜΑΤΖΙ ΗΣ ΙΩΑΝΝΗΣ

Εισαγωγή. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 01-1

2. ΨΗΦΙΟΠΟΙΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 8: MPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

7ο ΓΥΜΝΑΣΙΟ ΠΕΡΙΣΤΕΡΙΟΥ ΤΑΞΗ Β3 ΜΑΘΗΜΑ : ΠΛΗΡΟΦΟΡΙΚΗ ΘΕΜΑ ΕΡΓΑΣΙΑΣ : ΠΟΛΥΜΕΣΑ ΚΑΘΗΓΗΤΗΣ : ΧΑΤΖΗΣ ΜΑΘΗΤΡΙΑ : ΣΙΟΥΛΑ ΔΗΜΗΤΡΑ

Β2.6 Άλλες Περιφερειακές Συσκευές και Κάρτες Επέκτασης

Τεχνολογία Πολυμέσων. Ενότητα # 3: Συστήματα πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Αλληλεπίδραση με εφαρμογές ήχου

Εισαγωγή στις Τηλεπικοινωνίες

Κωδικοποίηση βίντεο (MPEG)

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

υπολογιστικών συστημάτων. Παρουσίαση με τίτλο "Περιεχόμενο, διαδικασία μαθήματος και εισαγωγή"

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Κωδικοποίηση εικόνων κατά JPEG

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Ραδιοτηλεοπτικά Συστήματα Ενότητα 3: Θεωρία Ψηφιοποίησης

Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o

Συµπίεση Εικόνας: Το πρότυπο JPEG

Περιεχόμενα. 4.1 Χαρακτηριστικά του ήχου Ψηφιοποίηση με μετασχηματισμό Ψηφιοποίηση με δειγματοληψία Πρόλογος...

Συλλογή & Επεξεργασία Δεδομένων Εργαστήριο 7 Ακούγοντας Πρώτη Ματιά στην Ανάλυση Fourier. Σύστημα Συλλογής & Επεξεργασίας Μετρήσεων

Δ10. Συμπίεση Δεδομένων

Θέματα Συστημάτων Πολυμέσων. Ενότητα #3: Ιδιότητες μέσων Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Συμπίεση Δεδομένων

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Αλληλεπίδραση Ανθρώπου- Υπολογιστή & Ευχρηστία

ΨΗΦΙΟΓΡΑΦΙΚΕΣ ΕΙΚΟΝΕΣ

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Γιατί Συµπίεση; Βιβλιογραφία

Π Α Ν Ε Π Ι Σ Τ Η Μ Ι Ο Π ΑΤ Ρ Ω Ν

Τεχνολογία Πολυμέσων. Ενότητα # 14: Κωδικοποίηση βίντεο: Η.264 Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΜΟΥΣΙΚΗ ΚΑΙ ΥΠΟΛΟΓΙΣΤΕΣ

Εισαγωγή στην Επεξεργασία Σήματος. Νόκας Γιώργος

Βίντεο. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 06-1

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 1: Εισαγωγή Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Αντίστοιχα σημαντικό ήταν το Mp3, όσον αφορά την ταχύτητα των συνδέσεων στο Internet.

Ανάλυση Διατάξεων Εκπομπής σε Συστήματα Ψηφιακής Τηλεόρασης Υψηλής Ευκρίνειας

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Κεφάλαιο 11 Πολυμέσα

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα

ΦΥΛΛΟ ΠΛΗΡΟΦΟΡΙΩΝ. Μονάδες μέτρησης χωρητικότητας μνήμης - Η περιφερειακή μνήμη

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας.

Group (JPEG) το 1992.

Εισαγωγή στη σχεδίαση κινούμενων γραφικών

ΚΕΦΑΛΑΙΟ 7 ΕΠΕΞΕΡΓΑΣΙΑ ΚΑΙ ΜΕΤΑΔΟΣΗ ΨΗΦΙΑΚΩΝ ΔΕΔΟΜΕΝΩΝ

Εφαρμογές Πληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Κεφάλαιο 11 Πολυμέσα. Εφ. Πληροφορικής Κεφ. 11 Καραμαούνας Π. 1

TEI Ιονίων Νήσων Τμήμα Τεχνολογίας Τροφίμων Πληροφορική Σημειώσεις Τεύχος 2. Μάκης Σταματελάτος

Εφαρμογές Πληροφορικής

Ιόνιο Πανεπιστήμιο Τμήμα Τεχνών Ήχου και Εικόνας. Ακαδημαϊκό Έτος

«Επικοινωνίες δεδομένων»

MPEG-4 : Διαδραστικές εφαρμογές πολυμέσων

ΕΣΔ 200: ΔΗΜΙΟΥΡΓΙΑ ΠΕΡΙΕΧΟΜΕΝΟΥ ΙΙ. Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Κεφάλαιο 2. Οργάνωση και διαχείριση της Πληροφορίας στον. Υπολογιστή

Τεχνολογία Πολυμέσων. Ενότητα # 13: Κωδικοποίηση βίντεο: MPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Transcript:

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΩΡΙΩΝ Θέμα Πτυχιακής Εργασίας: Σύγχρονοι Μέθοδοι Συμπίεσης και Αποσυμπίεσης Αρχείων Επιβλέπων Καθηγητής: Χατζής Βασίλειος ΜΑΙΟΣ 2014

Ευχαριστίες Με την παρούσα πτυχιακή εργασία, ένας κύκλος φτάνει στο τέλος του. Η ακαδημαϊκή πορεία μου ολοκληρώνεται και ξεκινάει ένα νέο κεφάλαιο στη ζωή μου. Ως είθισται, στο τέλος μιας μακρόχρονης πορείας, γίνεται ο απολογισμός και δίνονται οι κατάλληλες ευχαριστίες στα άτομα τα οποία συνέβαλλαν στις πιο σημαντικές στιγμές της πορείας αυτής. Έτσι, μέσα από αυτήν τη σελίδα θα ήθελα να ευχαριστήσω και να αποδώσω την ευγνωμοσύνη μου στον επιβλέπων καθηγητή Δρ. Χατζή Βασίλειο, για την εμπιστοσύνη που έδειξε στο πρόσωπο μου, την υπομονή του, αλλά πρωτίστως για την σημαντική βοήθεια που μου παρείχε στην εκπόνηση και υλοποίηση της πτυχιακής μου εργασίας. Τον ευχαριστώ θερμά. Επίσης, θα ήθελα να ευχαριστήσω από τα βάθη της καρδιάς μου τους γονείς μου, που με κόπους και θυσίες συνεισέφεραν τα μέγιστα στο να πραγματοποιήσω τις σπουδές μου χωρίς να μου λείψει το παραμικρό. Τέλος, ένα μεγάλο ευχαριστώ στους φίλους μου που στάθηκαν δίπλα μου και με στήριξαν σε όλες τις φάσεις της φοιτητικής μου ζωής. 1

Πίνακας περιεχομένων ΚΕΦΑΛΑΙΟ 1ο 1.1 Εισαγωγή... 4 1.1.1 Εισαγωγή στα Πολυμέσα... 5 1.1.2 Ορισμός για τα Πολυμέσα...6 1.1.3 Ορισμός Συμπίεση Δεδομένων...8 1.2 Τεχνικές για μείωση του όγκου...9 1.3 Παράγοντες που Επηρεάζουν την Ποιότητα... 10 ΚΕΦΑΛΑΙΟ 2ο 2.1 Παράγοντες που σχετίζονται με την συμπίεση...11 2.1.1 Πραγματικός Χρόνος/ Μη πραγματικός Χρόνος...12 2.1.2 Συμμετρική / Ασύμμετρη... 12 2.1.3 Αναλογίες Συμπίεσης... 13 2.1.4 Μη Απωλεστική / Απωλεστική... 13 2.1.5 Διαπλαισιακή / Ενδοπλαισιακή... 13 2.1.6 Έλεγχος BitRate...14 2.2 Αρχές Συμπίεσης Βίντεο... 14 2.2.1 Ποιοτική Ανοχή...15 2.2.2 Τμηματική Πρόβλεψη Κίνησης... 15 2.2.3 Πλεονασμός...16 2.2.4 Στατικός πλεονασμός... 16 2.2.5 Υποκειμενικός πλεονασμός... 16 2.3 Είδη πλαισίων...17 2.3.1 Ενδοπλαισιακή Κωδικοποίηση... 17 2.3.2 Διαπλαισιακή Κωδικοποίηση... 17 2.3.3 Κβαντοποίηση...19 ΚΕΦΑΛΑΙΟ 3ο 3.1 Αρχές Συμπίεσης Ήχου... 20 3.1.1 Πρότυπο Συμπίεσης Ψηφιακού Ήχου (ΜΡ3)... 23 3.1.2 Άλλα πρότυπα ψηφιακού ήχου...24 3.1.3 Πρότυπο Συμπίεσης MIDI (Musical Instrument Digital Interface)...27 2

ΚΕΦΑΛΑΙΟ 4ο 4.1 Ψηφιακή Εικόνα... 28 4.1.1 Συμπίεση Εικόνας... 29 4.1.2 Πρότυπο Συμπίεσης JPEG... 30 4.1.3 Πρότυπο Συμπίεσης JPEG Lossless...33 4.1.4 Πρότυπο Συμπίεσης JPEG 2000... 33 ΚΕΦΑΛΑΙΟ 5ο 5.1 Πρότυπο Συμπίεσης MPEG... 35 5.1.1 MPEG-1...37 5.1.2 MPEG-2...38 5.1.3 MPEG-4... 46 5.1.4 Διαφορές μεταξύ των τεχνολογιών MPEG...50 ΚΕΦΑΛΑΙΟ 6ο 6.1 Κωδικοποίηση Huffman... 54 6.1.1 Αλγόριθμος συμπίεσης Huffman...55 6.1.2 Αποσυμπίεση Huffman... 57 6.1.3 Μειονεκτήματα Huffman... 57 6.2 Κωδικοποίηση Εντροπίας... 58 6.3 Κωδικοποίηση Πηγή... 59 ΚΕΦΑΛΑΙΟ 7ο 7.1 Συμπεράσματα... 61 ΠΑΡΑΡΤΗΜΑ : Κώδικας Huffman...64 Βιβλιογραφία...72 3

1.1 Εισαγωγή Οι άνθρωποι παρουσίασαν ανάγκη για να επικοινωνήσουν μεταξύ τους από τη στιγμή που εμφανίστηκε το ανθρώπινο είδος πάνω στη γη. Σημαντικό ρόλο στην επικοινωνία παίζει και η επικοινωνία μέσω των εικόνων, οι οποίες είναι ένας αποτελεσματικός τρόπος έκφρασης, εξαιτίας της πυκνότητας της πληροφορίας και της αμεσότητας του μηνύματος το οποίο μεταδίδει. Αυτός ο τρόπος επικοινωνίας εμφανίστηκε όταν οι πρώτοι άνθρωποι ζωγράφιζαν στους τοίχους των σπηλιών διάφορα γεγονότα που συνέβησαν κατά τη διάρκεια της ζωής τους. Η επανάσταση στην πληροφορική που έγινε την προηγούμενη δεκαετία σημείωσε την πραγματική αρχή της πληροφόρησης, δημιουργώντας έναν τεράστιο αριθμό από εφαρμογές και υπηρεσίες. Κάποιες από αυτές είναι η φωνή μέσω διαδικτύου, η ψηφιακή τηλεόραση, η μαγνητοσκόπηση προσωπικών video, τα πολυμεσικά συνέδρια μέσω δικτύου, η ανταλλαγή εικόνων και video μέσω των κινητών τηλεφώνων κλπ. Οι εφαρμογές αυτές έδειξαν ότι είναι απαραίτητες όσο και οι παραδοσιακές μέθοδοι αναπαράστασης της πληροφορίας όπως το κείμενο, οι εικόνες και ο ήχος. Με την υπάρχουσα αλλά και με την εξέλιξη των πολυμέσων μπορούμε να διαπιστώσουμε ότι η ποσότητα της πληροφορίας που ανταλλάσσεται, ακολουθεί μια αυξανομένη πορεία.. Η βιομηχανία των τηλεπικοινωνιών και των πολυμέσων έχει να αναλάβει μια νέα πρόκληση που περιλαμβάνει πολλά θέματα. Μεταξύ των ειδών πληροφορίας που υπάρχουν, τα οπτικοακουστικά δεδομένα παραμένουν από τους πλουσιότερους τρόπους επικοινωνίας. Παρά την πρόοδο στην τεχνολογία, η συμπίεση των δεδομένων είναι απαραίτητη γιατί η αναπαράσταση video απαιτεί τεράστια ποσότητα δεδομένων και είναι απαραίτητη η μείωση των απαιτήσεων αποθήκευσης και επικοινωνίας. Εφαρμογές όπως η ψηφιακή τηλεόραση αλλά και η διακίνηση κινούμενης εικόνας στο διαδίκτυο είναι εφικτές μόνο με τη συμπίεση των δεδομένων video. Επίσης, για την αποθήκευση των ψηφιακών video σε μικρούς δίσκους όπως τα CD (compact disk) ή τα DVD (digital versatile disk), η συμπίεση είναι απαραίτητη. Εκτός από την συμπίεση δεν υπάρχει αυτή τη στιγμή κανένας άλλος τρόπος να υποστηριχθεί η ποιότητα που απαιτείται από την βιομηχανία της ψυχαγωγίας, με χαρακτηριστικό την αποθήκευση μιας κινηματογραφικής ταινίας κανονικού μήκους η οποία διαρκεί δύο ώρες ή περισσότερο. Από την γρήγορη αύξηση των απαιτήσεων για πολυμεσικές εφαρμογές, η τεχνολογία της συμπίεσης και αποσυμπίεσης αρχείων έχει αναπτυχθεί σε ένα πεδίο, που προσφέρει αρκετά προϊόντα που βασίζονται σε hardware και software υλοποιήσεις. 4

Εκμεταλλευόμενοι τα hardware και software υλικά, ένα σύστημα συμπίεσης και αποσυμπίεσης αρχείων στοχεύει να μεγιστοποιήσει τον βαθμό συμπίεσης και αντίστοιχα τον βαθμό αποσυμπιέσης και να διατηρήσει μια υψηλή ποιότητα δεδομένων. Παρά τη μεγάλη πρόοδο σε αυτή την περιοχή, η συμπίεση αρχείων όπως και η αποσυμπίεση, παραμένει ένα προκλητικό ερευνητικό πρόβλημα λόγω των υπολογιστικών απαιτήσεων του, και επιπλέον λόγω της ανάγκης για υψηλότερη ποιότητα σε σχέση με τους χαμηλότερους ρυθμούς δεδομένων. Αποτέλεσμα όλων αυτών είναι ο σχεδιασμός αποδοτικών αλγορίθμων κωδικοποίησης, ο όποιος βρίσκεται σε ερευνητικό επίπεδο ακόμη. (An. Khare, M. Saxena, B., 2011) 1.1.1 Εισαγωγή στα Πολυμέσα Μια από τις πιο ενδιαφέρουσες τεχνολογίες που αναπτύχτηκαν στις αρχές της δεκαετίας του 90 είναι τα πολυμέσα, τα οποία αποτελούν το κέντρο συνάντησης 5 μεγάλων βιομηχανιών, οι οποίες είναι η πληροφορική, οι τηλεπικοινωνίες, οι ηλεκτρονικές εκδόσεις, η βιομηχανία audio και video, και η βιομηχανία της τηλεόρασης και του κινηματογράφου. Τη δεκαετία του 70 έκαναν την εμφάνισή τους τα δίκτυα υπολογιστών, τα οποία έφεραν πιο κοντά την πληροφορική με τις τηλεπικοινωνίες και σαν στόχο είχαν την αγορά των επιχειρήσεων. Τα πολυμέσα δεν έριξαν όλο το βάρος στην αγορά των επιχειρήσεων, αλλά σαν στόχο τους πλέον έχουν και τους καταναλωτές. Το ενδιαφέρον που έδειξε το αγοραστικό κοινό στα πολυμέσα, επειδή υπήρχαν πολλά και διαφορετικά ήδη νέων προϊόντων, έφεραν αναστάτωση ως προς την σημασία που μπορεί κανείς να δώσει σε ένα σύστημα πολυμέσων. Τα πολυμέσα στο χώρο της πληροφορίας είναι οι διάφοροι μεσολαβητές που υπάρχουν μεταξύ της πηγής και του παραλήπτη της πληροφορίας που τη βοηθούν να φτάσει στον τελικό προορισμό της. Συμφώνα με τον παραπάνω ορισμό που δόθηκε για τα πολυμέσα μπορούμε να χαρακτηρίσουμε ως σύστημα πολυμέσων τον έλεγχο βιντεοκασέτας και οπτικών μέσων αποθήκευσης. Επίσης ως σύστημα πολυμέσων μπορούμε να ορίσουμε τη τηλεόραση και την εφημερίδα. Στην πρώτη περίπτωση συνδυάζουμε την κινούμενη εικόνα και τον ήχο, ενώ στη δεύτερη περίπτωση συνδυάζουμε το κείμενο μαζί με την εικόνα. Δίνοντας με αυτό τον τρόπο περισσότερη σημασία στην πληροφορία που έχει ψηφιακή μορφή και ελέγχεται από τον υπολογιστή. 5

Στη συνέχεια θα ασχοληθούμε με τα ψηφιακά πολυμέσα χρησιμοποιώντας τον όρο πολυμέσα για να τα περιγράψουμε. Η πληροφορία που μεταφέρεται από τα πολυμέσα χωρίζεται σε διακριτού τύπου και συνεχούς, αλλά και σε capture και synthesized. Αν η πληροφορία κατασκευάζεται από κάποιον άνθρωπο χρησιμοποιώντας εργαλεία τότε λέμε ότι έχουμε συνθετικά μέσα, ενώ αν έρχεται απευθείας από τον πραγματικό κόσμο έχουμε capture πληροφορία. Οι εικόνες που βγάζουμε με τη ψηφιακή φωτογραφική μηχανή ή οι εικόνες που τις κάνουμε skan, είναι τύπου captured media γιατί αποθηκεύονται σε ψηφιακή μορφή και είναι εύκολες να τις χειριστεί κάποιος από τον υπολογιστή. Ένα κείμενο που θα πληκτρολογήσει ένας χρήστης στον υπολογιστή είναι συνθετικό μέσο, ενώ αν λαμβάνεται από scanner είναι captured. Επίσης αν η πληροφορία έχει χωρική διάσταση όπως είναι οι εικόνες, το κείμενο και τα γραφικά ονομάζονται συνεχές, σε σχέση με την πληροφορία που υπάρχει και η συνιστώσα του χρόνου, όπως είναι το βίντεο και ο ήχος. Ο άνθρωπος αντιλαμβάνεται τα παραπάνω μέσα με δύο από τις βασικότερες αισθήσεις του, την όραση και την ακοή του. Δεν είναι απαραίτητο να χρησιμοποιεί πάντα περισσότερες από μια αισθήσεις για να αντιληφτεί ένα σύστημα πολυμέσων. Χαρακτηριστικά του συστήματος πολυμέσων: Η πληροφορία παρουσιάζεται και ελέγχεται από τον υπολογιστή. Είναι ολοκληρωμένα. Ένα παράδειγμα είναι η οθόνη του υπολογιστή που την χρησιμοποιούμε για την απεικονίσει της εικόνας, του βίντεο και του κειμένου. Η πληροφορία είναι απαραίτητο να είναι σε ψηφιακή μορφή για να ελεγχτεί και να παρουσιαστεί από τον υπολογιστή. Ένα από τα πλεονεκτήματα της ψηφιακής αναπαράστασης. (http://www.musesnet.gr/ekp2000/polymesa.htm ) 1.1.2 Ορισμός για τα Πολυμέσα Ένας κλάδος της πληροφορικής τεχνολογίας που ασχολείται με ψηφιακά δεδομένα είναι τα πολυμέσα. Ασχολούνται κυρίως με ψηφιακά δεδομένα που έχουν πολλαπλές μορφές όπως είναι η εικόνα, το κείμενο, η κινουμένη εικόνα, ο ήχος, το βίντεο, τα γραφικά κ.α. Οι εφαρμογές αυτές είναι γνώστες ως πολυφασικές εφαρμογές και αποτελούνται από τις πιο εξελισσόμενες τεχνολογίες στην πληροφορική, με πολλές εφαρμογές σε διάφορους τομείς, 6

όπως είναι η εκπαίδευση, ψυχαγωγία, ηλεκτρονικά παιχνίδια, internet, τηλεδιάσκεψη, αγορά, διαφήμιση κ.α. Βασικό συστατικό σε κάποιες υπολογιστικές εφαρμογές είναι το κείμενο, το οποίο έχει διαφορετικό ρόλο στα πολυμέσα. Τη θέση του κειμένου έχουν πάρει τα τελευταία χρόνια άλλα στοιχειά των πολυμέσων, μερικά από τα οποία είναι ο ήχος, το βίντεο, οι εικόνες κ.α. Αλλά σε πολυμεσικές εφαρμογές όπως είναι η εγκυκλοπαίδειες δεν μπορεί να αντικατασταθεί τόσο εύκολα. Η εικόνα είναι ένα πολύ σημαντικό κομμάτι των υπολογιστών και των πολυμέσων. Μπορούμε να την εισάγουμε στον υπολογιστή κατεβάζοντας την από τον internet, αποθηκεύοντας την σε ένα αποθηκευτικό μέσο όπως ένα cd, dvd, usb stick, εξωτερικό σκληρό δίσκο, αλλά μπορούμε να τη σαρώσουμε με ένα σαρωτή και να τη ψηφιοποιήσουμε. Όταν φορτώσουμε την εικόνα στον υπολογιστή μπορούμε να τη επεξεργαστούμε με ένα πρόγραμμα επεξεργασίας εικόνας για να βελτιώσουμε την εμφάνιση της. Οι εικόνες που δημιουργούν οι χρήστες χρησιμοποιώντας διάφορα προγράμματα με την βοήθεια ενός υπολογιστή λέγονται γραφικά. Κάποια από τα προγράμματα που χρησιμοποιούνται για αυτόν τον σκοπό είναι PhotoPaint, CorelDRAW, PaintBrush, κ.α. Οι κινούμενες εικόνες ανήκουν και αυτές στην κατηγορία των γραφικών. Δημιουργούνται από ειδικά προγράμματα δισδιάστατης (2D) ή τρισδιάστατης (3D) μοντελοποίησης, χρησιμοποιώντας τον υπολογιστή. Για τη δημιουργία των κινούμενων εικόνων, τα προγράμματα χρησιμοποιούν γεωμετρικά σχήματα σαν βασικά συστατικά.. Ψηφιοποιητής είναι η συσκευή που εισάγει στον υπολογιστή το βίντεο και αναλαμβάνει να διαβάσει την αναλογική εικόνα του βίντεο και με τη μέθοδο της δειγματοληψίας αποθανατίζουμε όλα τα δεδομένα που περιέχει η βιντεοταινία σε ψηφιακή μορφή. Σε περίπτωση που χρησιμοποιήσουμε μια ψηφιακή συσκευή για τη λήψη ενός βίντεο, μπορούμε να τη χρησιμοποιήσουμε κατευθείαν στον υπολογιστή για να δούμε τι απαθανατίσαμε. Τα αρχεία βίντεο επειδή έχουν μεγάλο μέγεθος σε σχέση με άλλες πολυμεσικές εφαρμογές, μπορούμε να τα συμπιέσουμε για να ελαττώσουμε το μέγεθός τους, με την προϋπόθεση ότι θα αλλοιωθεί η ποιότητα του βίντεο. Επίσης υπάρχουν διάφορα προγράμματα επεξεργασίας βίντεο και ένα από αυτά είναι το Adope Premiere, με το οποίο μπορούμε να κρατήσουμε κάποιες σκηνές από το βίντεο που μας ενδιαφέρουν. Με παρόμοιο τρόπο όπως το βίντεο, εισάγουμε και επεξεργαζόμαστε τον ήχο, μόνο που δεν έχουμε πρόβλημα με την ποιότητα και το μέγεθος του αρχείου. Με ειδικά προγράμματα 7

που υπάρχουν μπορούμε να τον επεξεργαστούμε, να τον βελτιώσουμε αλλά και να προσθέσουμε διάφορα εφέ. (http://www.musesnet.gr/ekp2000/polymesa.htm ) 1.1.3 Ορισμός Συμπίεση Δεδομένων Η συμπίεση είναι σημαντική καθώς αρχεία ήχου, βίντεο, εικόνων και κινούμενων εικόνων καταλαμβάνουν ένα μεγάλο μέρος του χώρου αποθήκευσης σε σύγκριση με άλλους τύπους δεδομένων. Η συμπίεση μειώνει τον αριθμό των δυαδικών ψηφίων που απαιτούνται συνολικά για να αποθηκεύσουν τις ίδιες πληροφορίες. Αυτό αυξάνει την ταχύτητα μεταφοράς και επιτρέπει περισσότερα δεδομένα να αποθηκεύονται σε ένα παρόμοιο χώρο. Η συμπίεση γίνεται μέσω ενός αλγορίθμου που χρησιμοποιείται από μια εφαρμογή για να αποθηκεύσει και να ανοίξει το αρχείο. Το λογισμικό για το άνοιγμα του αρχείου αλλά και το λογισμικό που κωδικοποιεί το αρχείο πρέπει να διαθέτει τον αποκωδικοποιητή. Με τον όρο συμπίεση χαρακτηρίζουμε τη διαδικασία αλλαγής της αναπαράστασης ενός αρχείου (κειμένου, εικόνας, ήχου, βίντεο), με σκοπό τον περιορισμό του χρησιμοποιούμενου χώρου ή του χρόνου μετάδοσης, ενώ, ταυτόχρονα, να είναι δυνατή η αποκατάσταση της αρχικής μορφής από την συμπιεσμένη (αποσυμπίεση). Με τη συμπίεση κειμένου, ήχου, εικόνας ή βίντεο μπορούμε να πετύχουμε τη μείωση του κόστους επικοινωνίας και την αύξηση του αποθηκευτικού χώρου. Στόχος, λοιπόν, της συμπίεσης είναι ο περιορισμός του μεγέθους που καταλαμβάνει ένα ποσό πληροφορίας εις βάρος βέβαια της διαθεσιμότητας της. Αν υπολογίσουμε ότι ένα νοσοκομείο πρέπει να διατηρεί και να προσπελαύνει εκατομμύρια ακτινογραφίες με ανάλυση 2000x2000 σημείων, δηλαδή 4 εκατομμύρια εικονοστοιχεία (pixels) που είναι περίπου 10 ΜΒ μέγεθος η κάθε ακτινογραφία, καταλαβαίνουμε ότι όσο και αν ο ρυθμός της ανάπτυξης της τεχνολογίας των αποθηκευτικών χώρων είναι πολύ γρήγορος, υπάρχει πρόβλημα να υλοποιηθούν κάποιες εφαρμογές πολυμέσων. Τα σημερινά αποθηκευτικά μέσα δεν μπορούν να ικανοποιήσουν τις ανάγκες που δημιουργούν οι πολυμεσικές εφαρμογές, Για παράδειγμα ένα CD που έχει μέγεθος 700 MB μπορεί να χωρέσει μέσα 75 λεπτά ασυμπίεστου στερεοφωνικού ήχου ποιότητας CD αλλά μόλις 30 δευτερόλεπτα ασυμπίεστης ψηφιακής τηλεόρασης. Επίσης οι μαγνητικοί δίσκοι (DVD) που έχουν μέγεθος 4,7 GB δεν μπορούν να χωρέσουν μια ταινία 90 λεπτών, η οποία καταλαμβάνει μεγαλύτερο μέγεθος από τα DVD. (Data Compression Third Edition) (http://el.wikipedia.org/wiki/συμπίεσn δεδομένων) 8

1.2 Τεχνικές για μείωση του όγκου Δύο από τις βασικές τεχνικές είναι η υποδειγματοληψία χρώματος και η αποδοτική συμπίεση που χρησιμοποιούνται για τη μείωση του όγκου της ψηφιακής πληροφορίας. Με την τεχνική της υποδειγματοληψίας χρώματος, ψηφιοποιούνται λιγότερα δείγματα χρώματος απ' ότι της φωτεινότητας. Ο άνθρωπος αντιλαμβάνεται λιγότερο τις χρωματικές μεταβολές παρά εκείνες της φωτεινότητας. Άρα χρειάζονται περισσότερα δεδομένα για τη φωτεινότητα και λιγότερα δεδομένα χρωματικής πληροφορίας για να αντιληφτεί την ποιότητα της εικόνας ο παραλήπτης. Η τεχνική της αποδοτικής συμπίεσης γίνεται με τη χρήση ισχυρών συμπιεστών, οι όποιοι είναι συσκευές που τις χρησιμοποιούμε για τη συμπίεση και την αποσυμπιέση του ψηφιακού βίντεο. Σε τέτοιες συμπιέσεις χρησιμοποιούμε hardware κωδικοποιητές αλλά και software κωδικοποιητές. Οι software κωδικοποιητές έχουν πιο πολλά πλεονεκτήματα σε περίπτωση που δεν χρειάζεται ειδικός hardware κωδικοποιητής για να γίνει η αποσυμπίεση. Το παρακάτω παράδειγμα θα μας βοηθήσει να κατανοήσουμε πως έχουμε ανάγκη τη συμπίεση. Θέλουμε να μεταδώσουμε ένα κανονικό ασυμπίεστο σήμα PAL, σε ψηφιακή μορφή με εύρος ζώνης 5 MHz χωρίς απώλειες, αλλά αν υπάρξουν απώλειες τότε θα μειωθεί η ποιότητα της εικόνας. Αυτό μπορούμε να το πετύχουμε χρησιμοποιώντας το θεώρημα του Nyquist, το όποιο λέει ότι αν πρέπει να διπλασιάσουμε τη συχνότητα, και από 5 MHz να πάει 10 MHz. Θα πρέπει το δείγμα μας να έχει τουλάχιστον 8 bits επαρκή ευκρίνεια και σε αυτή την περίπτωση έχουμε 80 Mbits/sec. Η μέθοδος αυτή χρησιμοποιείται όταν έχουμε ασπρόμαυρες εικόνες, στην περίπτωση που έχουμε όμως ασυμπίεστο σήμα βίντεο πρέπει να χρησιμοποιήσουμε και τα τρία βασικά χρώματα, τα όποια συνδυάζονται για να δημιουργηθούν όλα τα άλλα χρώματα. Άρα θα χρειαστούμε 240 Mbits/sec. Για να κατανοήσουμε το μέγεθος που έχει το εύρος ζώνης μπορούμε να το συγκρίνουμε με την ταχύτητα μεταφοράς δεδομένων από ή προς τον επεξεργαστή που δεν μπορεί να ξεπεράσει τα 40 Mbits/sec. Είναι 6 φορές πιο μικρή απ ότι χρειαζόμαστε εμείς. Ένα άλλο παράδειγμα είναι το CD/ROM στο όποιο η ταχύτητα δεν ξεπερνά τα 10 Mbits/sec, άρα είναι 24 φορές πιο μικρή η ταχύτητα του. Ένα κινηματογραφικό φιλμ που έχει διάρκεια 90 λεπτά, δηλαδή 5400 δευτερόλεπτα, θα χρειαστούμε αποθηκευτικό μέσο που θα μπορεί να αποθηκεύσει 30*5400=167 GB. Με αυτό τον τρόπο δεν μπορούμε να χρησιμοποιούμε τα 9

DVD που η χωρητικότητα τους είναι στα 4,7 GB, άλλα θα πρέπει να χρησιμοποιούμε πολλούς σκληρούς δίσκους. Με τα παραπάνω παραδείγματα μπορούμε να συνειδητοποιήσουμε ότι μεγάλο πρόβλημα είναι τόσο η μετάδοση άλλα και η αποθήκευση του ασυμπίεστου βίντεο που καταλαμβάνει μεγάλο αποθηκευτικό χώρο. Είναι σημαντικό να περιορίσουμε το μέγεθος των αρχείων, όχι μόνον γιατί υπάρχει πρόβλημα αποθήκευσης, αλλά γιατί δεν θα μπορούμε να επεξεργαστούμε και να διαχειριστούμε τα δεδομένα. Άρα η συμπίεση είναι ο τρόπος με τον οποίο θα λυθούν τα παραπάνω προβλήματα που πρόεκυψαν. (J.S. Boreczky, L.A. Rowe, 1996), («An explanation of video compression techniques» AXIS COMMUNICATIONS) 1.3 Παράγοντες που Επηρεάζουν την Ποιότητα Στις επόμενες παραγράφους παρουσιάζονται οι παράγοντες οι οποίοι επηρεάζουν την ποιότητα και την ταχύτητα συμπίεση της εικόνας και του βίντεο. Πρώτος παράγοντας είναι ο βαθμός συμπίεσης, ο οποίος υπολογίζεται με το αρχικό μέγεθος της εικόνας ή του video και το μέγεθος του αντίστοιχου συμπιεσμένου. Τα περισσότερα σχήματα συμπίεσης παράγουν λόγους που εξαρτώνται από το περιεχόμενο της εικόνας, για παράδειγμα όσο πιο περίπλοκη είναι μια εικόνα τόσο μικρότερη συμπίεση μπορούμε να περιμένουμε. Δεύτερος παράγοντας είναι η ταχύτητα συμπίεσης και αποσυμπίεσης. Αυτός ο παράγοντας υπολογίζεται με το χρόνο που απαιτείται για να κωδικοποιήσουμε και να αποκωδικοποιήσουμε την εικόνα ή το βίντεο. Όταν είναι γρήγορος ο ρυθμός συμπίεσης τότε μπορούμε να τον χρησιμοποιήσουμε για εγγραφή, ενώ όταν είναι γρήγορος ρυθμός αποσυμπίεσης μπορούμε να τον χρησιμοποιήσουμε για αναπαραγωγή. Οι ταχύτητες συμπίεσης και αποσυμπίεσης για μετάδοση βίντεο συνήθως αναφέρονται σε MB/second. Τρίτος παράγοντας είναι η χωρική και η χρονική συμπίεση. Η χωρική συμπίεση χρησιμοποιείται για να συμπιέσει τα εικονοστοιχεία (pixels) ενός πλαισίου και απαλείφει την πλεονάζουσα πληροφορία που βρίσκεται μέσα στο ίδιο το πλαίσιο. Ενώ η χρονική συμπίεση χρησιμοποιείται σε ακολουθίες εικόνων και πολλές φορές αναφέρεται ως διαφορά των πλαισίων. Αυτό που κάνει είναι να συγκρίνει ένα πλαίσιο με ένα προηγούμενο πλαίσιο και να απαλείφει την πλεονάζουσα πληροφορία. Σε αυτήν την περίπτωση χρησιμοποιούνται τα πλαίσια «κλειδιά» τα οποία τίθενται ως σημεία έναρξης για την εύρεση των διαφορών με τα επόμενα πλαίσια. Τα πλαίσια μεταξύ των πλαισίων «κλειδιών» ονομάζονται πλαίσια 10

διαφορών και περιέχουν μόνο την πληροφορία που έχει αλλάξει από το προηγούμενο πλαίσιο. Τέτοια κωδικοποίηση συμπίεσης χρησιμοποιεί το πρότυπο MPEG. (http://el.wikipedia.org/wiki/mpeg#.ce.a7.cf.89.cf.81.ce.b9.ce.ba.ce.ae_.ce.a3.cf.8 5.CE.BC.CF.80.CE.AF.CE.B5.CF.83.CE.B7) Τέταρτος παράγοντας είναι η ποιότητα εικόνας στην οποία τα σχήματα συμπίεσης μπορούν να είναι είτε με απώλειες (lossy) είτε χωρίς απώλειες (lossless). Όταν χρησιμοποιούνται σχήματα χωρίς απώλειες δεν έχουν καμία απώλεια δεδομένων, ενώ όταν χρησιμοποιούνται τα σχήματα με απώλειες, δε διατηρούνται όλα τα αρχικά δεδομένα, με αποτέλεσμα να χαθεί πληροφορία από την εικόνα γεγονός που προκαλεί αισθητή ή μη αισθητή υποβάθμιση της ποιότητας της εικόνας. Τα lossy σχήματα χρησιμοποιούνται σε αρχεία γραφικών, ήχου και βίντεο, που σε αυτές τις τεχνικές παραλείπονται bits δεδομένων και η απώλεια πληροφορίας δεν είναι ανιχνεύσιμη από το ανθρώπινο μάτι. Αντίθετα για αρχεία κειμένου και προγραμμάτων που δεν θέλουμε να χάσουμε δεδομένα μόνο η lossless συμπίεση είναι αποδεκτό να εφαρμοστεί. Το μέγεθος αυτών των αρχείων μειώνεται εντοπίζοντας επαναλαμβανόμενα πρότυπα δεδομένων και αντικαθιστώντας τα με τη χρήση του κατάλληλου κώδικα. (http://www.aventuracctv.com/el/video quality tutorial/hcodavidq.asp) 2.1 Παράγοντες που σχετίζονται με την συμπίεση Χρησιμοποιούμε τη συμπίεση στο βίντεο για να μειώσουμε ένα ποσοστό της πληροφορίας, με τέτοιο τρόπο ώστε να αποθηκευτεί το ψηφιακό σήμα και παράλληλα να διατηρήσουμε όσο το δυνατόν καλύτερη την ποιότητα του αρχικού βίντεο. Για να έχουμε σωστό αποτέλεσμα θα πρέπει να λάβουμε υπόψη μας τους παράγοντες που παίζουν σημαντικό ρολό στη διαδικασία συμπίεσης του βίντεο. Οι σημαντικοί παράγοντες οι εξής : Πραγματικός χρόνος / Μη πραγματικός χρόνος Συμμετρική / Ασύμμετρη Αναλογίες Συμπίεσης Μη Απωλεστική / Απωλεστική Διαπλαισιακή/Ενδοπλαισιακή Έλεγχος BitRate 11

2.1.1 Πραγματικός χρόνος / Μη πραγματικός χρόνος Τη χρονική στιγμή που γίνεται η συμπίεση σε ένα ψηφιακό βίντεο, κάποια συστήματα ασχολούνται με τη σύλληψη, τη συμπίεση, την αποσυμπίεση και την αναπαραγωγή του βίντεο σε 30 fps (frames per second) σε πραγματικό χρόνο και χωρίς καθυστέρηση. Άλλα συστήματα μπορούν να κάνουν μόνο σύλληψη μερικών από τα 30 fps και να αναπαράγουν μόνο μερικά από αυτά τα πλαίσια, ενώ άλλες φορές δεν μπορούν να τα αναπαράγουν καθόλου. Ένα σημαντικό ελάττωμα που συμβαίνει στο βίντεο είναι η ανεπαρκής συχνότητα ανανέωσης. Αν αναπαράγονται κάτω από 24 πλαίσια το δευτερόλεπτο στο βίντεο, τότε θα είναι αισθητά απότομο. Επίσης κάποια πλαίσια που παραλείπονται έχουν πολύ σημαντικές πληροφορίες συγχρονισμού. Ένα παράδειγμα είναι η κίνηση που κάνουν τα χείλη ενός ατόμου που μιλάει στο βίντεο και έχει χαθεί εξαιτίας ενός παραλειπόμενου πλαισίου τη χρονική στιγμή της σύλληψης ή της αναπαραγωγής, δεν θα μπορούσε να συγχρονιστεί ο ήχος με το βίντεο. Άρα με αυτό το παράδειγμα μπορούμε να καταλάβουμε την έννοια του πραγματικού χρόνου που έχει να κάνει με το πόσο συχνά ανανεώνονται τα πλαίσια. (Tools for Signal Compression), (Handbook of Data Compression Fifth Edition) 2.1.2 Συμμετρική / Ασύμμετρη Με αυτή τη μέθοδο θα προσπαθήσουμε να κατανοήσουμε πως γίνεται η συμπίεση και η αποσυμπίεση στις εικόνες του βίντεο. Με τη συμμετρική συμπίεση μπορεί κανείς να αναπαράγει ένα βίντεο το οποίο έχει ανάλυση 640 x 480 pixels και η συχνότητα ανανέωσης είναι 30 fps, τότε μπορεί να κάνει σύλληψη και αποθήκευση με ακριβώς τις ίδιες τιμές. Με την ασύμμετρη μέθοδο δεν γίνεται αυτό αλλά ακριβώς το αντίθετο και ο βαθμός ασυμμετρίας εκφράζεται από την αναλόγια. Όταν έχουμε αναλόγια 100:1 για να συμπιεστεί ένα λεπτό από το βίντεο θα πρέπει να περάσουν 100 λεπτά. Με τη μέθοδο της ασύμμετρης συμπίεσης κατά τη διάρκεια της συμπίεσης έχουμε πιο περίπλοκη αλλά και αποδοτική ποιότητα και ταχύτητα, επειδή χρησιμοποιείται πολύ περισσότερος χρόνος όταν συμπιέζεται το βίντεο. Κάποια από τα μειονέκτημα της μεθόδου αυτής είναι ότι απαιτείται πάρα πολύ χρόνος, και για να γίνει η συμπίεση πρέπει να δοθεί το βίντεο σε κάποια εταιρία, με αποτέλεσμα να χρειαστεί περισσότερος χρόνος αλλά και κόστος. (Tools for Signal Compression), (Handbook of Data Compression Fifth Edition) 12

2.1.3 Αναλογίες Συμπίεσης Η έννοια της αναλογίας που χρησιμοποιείται στη συμπίεση του βίντεο δεν έχει να κάνει με την αναλόγια που αναφέρεται στην ασυμμετρία. Έχει να κάνει με την αριθμητική αναλογία συμπίεσης του αρχικού βίντεο σε σύγκριση με το συμπιεσμένο. Ένα παράδειγμα είναι η αναλογία 100:1, το 100 είναι το μέγεθος που έχει αρχικά το βίντεο πριν γίνει η συμπίεση, ενώ το συμπιεσμένο βίντεο το παρουσιάζουμε με το 1 για να δείξουμε ότι έχει γίνει η συμπίεση. Όσο περισσότερο συμπιέζουμε ένα βίντεο, τόσο πιο μεγάλη θα είναι η διαφορά ανάμεσα στις 2 τιμές. Επίσης όσο η αναλογία της συμπίεσης είναι χαμηλή τόσο πιο καλή εικόνα θα έχουμε σε σχέση με την υψηλή αναλογία, που θα έχουμε πιο χαμηλή ποιότητα εικόνας. Μεγάλο ρόλο στην αναλογία της συμπίεσης παίζουν τα προγράμματα αλλά και οι συσκευές που χρησιμοποιεί κάποιος σε έναν υπολογιστή για να κάνει μια συμπίεση ενός βίντεο, με αποτέλεσμα να μην είναι η συμπίεση τόσο αποδοτική όσο θα ήθελε. (Tools for Signal Compression), (Handbook of Data Compression Fifth Edition) 2.1.4 Μη Απωλεστική / Απωλεστική Η «απώλεια» είναι ένας παράγοντας που καταλαβαίνουμε αν υπάρχει απώλεια της ποιότητας μεταξύ της αρχικής εικόνας με την εικόνα που συμπιέστηκε. Αν ένα σήμα συμπιεστεί πολλές φορές τότε υπάρχει μεγάλη πιθανότητα η ποιότητα του σήματος να επηρεαστεί και να χαθεί η αρχική ποιότητα που είχε η εικόνα. Όταν δεν υπάρχει μεγάλη διάφορα ανάμεσα στο συμπιεσμένο βίντεο με το αρχικό βίντεο, η μέθοδος αυτή ονομάζεται συμπίεση με απώλειες. Οι μόνοι αλγόριθμοι χωρίς απώλειες που υπάρχουν είναι μόνο για συμπίεση εικόνων με παράγοντα αναλογίας 2:1. (Tools for Signal Compression), (Handbook of Data Compression Fifth Edition) 2.1.5 Διαπλαισιακή/Ενδοπλαισιακή Με την ενδοπλαισιακή μέθοδο συμπίεσης μπορούμε να συμπιέσουμε και να αποθηκεύσουμε κάθε πλαίσιο ενός βίντεο σαν μια ξεχωριστή εικόνα. Με τη διαπλαισιακή μέθοδο συμπίεσης, παρόλο που υπάρχει κίνηση στο βίντεο, κάποιες σκηνές μοιάζουν σαν να παραμένουν σταθερές και γι αυτό θεωρούνται περιττές. Η διαπλαισιακή συμπίεση ξεκινά με τη δημιουργία ενός πλαισίου, κάθε πλαίσιο συγκρίνεται με το προηγούμενο και το 13

επόμενο πλαίσιο, αν βρεθεί κάποια διάφορα μεταξύ αυτών των πλαισίων, τότε αποθηκεύεται σε ένα καινούριο πλαίσιο. Με αυτόν τον τρόπο μειώνεται σημαντικά το ποσοστό της πληροφορίας. (Tools for Signal Compression), (Handbook of Data Compression Fifth Edition) 2.1.6 Έλεγχος BitRate Ο έλεγχος BitRate είναι ο τελευταίος παράγοντας στη συμπίεση ενός βίντεο και είναι πολύ σημαντικός. Τον χρησιμοποιούν όσοι έχουν σύστημα συμπίεσης με χαμηλό εύρος ζώνης και μπορεί να μάθει ο χρήστης μέσα από το λογισμικό ποιοι παράμετροι είναι οι πιο σημαντικοί. Κάποιες εφαρμογές ενδιαφέρονται περισσότερο για τη συχνότητα ανανέωσης και λιγότερο για το μέγεθος που μπορεί να έχει το πλαίσιο, ενώ κάποιες άλλες ενδιαφέρονται για την ποιότητα των πλαισίων και λιγότερο για την συχνότητα ανανέωσης. (Tools for Signal Compression), (Handbook of Data Compression Fifth Edition) 2.2 Αρχές συμπίεσης Βίντεο Ένα αρχείο βίντεο αποτελείται από μεγάλο όγκο δεδομένων αν υπολογίσουμε ότι για 1 δευτερόλεπτο χρειαζόμαστε 30 φωτογραφίες με μέγεθος 1 ΜΒ η κάθε εικόνα. Επίσης το μέγεθος του βίντεο εξαρτάται από την ποιότητα και το μέγεθος της εικόνας, αλλά και τον αριθμό των πλαισίων που χρησιμοποιούνται για την αναπαραγωγή της κίνησης. Υπάρχει μεγάλη ανάγκη συμπίεσης ενός αρχείου βίντεο και για τον όγκο του αλλά και για λόγους διακίνησης. Υπάρχουν δύο είδη μου μπορεί να κάνει κάποιος συμπίεση σε ένα αρχείο βίντεο: Χωρική Συμπίεση: γίνεται συμπίεση σε κάθε πλαίσιο ξεχωριστά. Τέτοια συμπίεση αποτελεί το JPEG, το οποίο είναι αλγόριθμος συμπίεσης με απώλειες (lossy). Χρονική Συμπίεση: αποθηκεύει ένα αρχικό πλαίσιο και μετά οι διαφορές που έχει με τα επόμενα πλαίσια. Η συμπίεση αυτή είναι ιδιαίτερα αποτελεσματική για στατικές σκηνές, αλλά όχι για σκηνές δράσης. Τέτοια συμπίεση επιτυγχάνουν τα JPEG αρχεία με κίνηση. (VIDEO COMPRESSION TECHNIQUES AND STANDARDS), (S.S. Maniccama, N. Bourbakis, 2004) 14

2.2.1 Ποιοτική Ανοχή Υπάρχει η αντίληψη ότι το εύρος ζώνης θα πρέπει να είναι όσο το δυνατόν ικανοποιητικό για να μεταδοθεί και το πιο απαιτητικό πλαίσιο που υπάρχει σε μια σειρά κινούμενων εικόνων, θεωρείται λογικό να υπάρχει ένα μικρό ποσοστό παραμόρφωσης με αντάλλαγμα τη χρήση των bits που εξοικονομούμε για να αναβαθμιστεί ο μέσος όρος ανάλυσης του συνόλου των σκηνών. Στη συμπίεση βίντεο θα πρέπει να υπάρχει μία «χρυσή τομή» μεταξύ της ποιότητας του βίντεο και στο εύρος ζώνης γιατί είναι σημαντικό για κάποιους ανθρώπους που ασχολούνται επαγγελματικά με τον ήχο και την εικόνα, οι οποίοι μπορούν να αντιληφθούν πολύ εύκολα τις διαφορές ενός κωδικοποιημένου ήχου, σε σχέση με έναν απλό χρήστη ο οποίος θα αντιληφθεί πιο γρήγορα την παραμόρφωση της εικόνας απ ότι την παραμόρφωση του ήχου. Ο ήχος προσφέρει πολύ πιο μεγάλα ποσοστά συμπίεσης χωρίς να αντιληφθεί κάποιος την υποβάθμιση της ποιότητάς του, σε σχέση με τη συμπίεση σε μία εικόνα, όπου οι ατέλειες είναι ορατές προσπαθώντας να μην είναι ενοχλητικές για τον χρήστη. (VIDEO COMPRESSION TECHNIQUES AND STANDARDS), (IMAGE and VIDEO COMPRESSION for MULTIMEDIA ENGINEERING), (STILL IMAGE AND VIDEO COMPRESSION WITH MATLAB) 2.2.2 Τμηματική πρόβλεψη κίνησης Η τμηματική πρόβλεψη κίνησης είναι μία μέθοδος που μπορούμε να περιγράψουμε πιο αποτελεσματικά εικόνες με κίνησης, εκτελώντας τη διαπλαισιακή κωδικοποίηση για να περιγράψουμε την διαδοχική σειρά των εικόνων ως μια σειρά ομοιοτήτων και διαφορών. Στη θέση των δύο ανεξάρτητων πλαισίων παίρνουμε τη δεύτερη εικόνα, την οποία χωρίζουμε σε ίσα τμήματα, με αυτό τον τρόπο φτιάχνουμε έναν πίνακα που περιέχει τα τμήματα που μένουν ίδια και διανύσματα που δείχνουν τα τμήματα που έχουν αλλάξει θέση. Με αυτόν τον τρόπο μπορούμε να στείλουμε την πρώτη εικόνα όπως έχει και την δεύτερη σε πίνακα στον οποίο φαίνονται ποια τμήματα παρέμειναν ίδια και ποια άλλαξαν. (VIDEO COMPRESSION TECHNIQUES AND STANDARDS),(IMAGE and VIDEO COMPRESSION for MULTIMEDIA ENGINEERING),(STILL IMAGE AND VIDEO COMPRESSION WITH MATLAB) 15

2.2.3 Πλεονασμός Η βασική αρχή που πάνω σε αυτή στηρίζονται οι μέθοδοι ψηφιακής συμπίεσης είναι ο πλεονασμός που περιέχει το σήμα. Η πληροφορία που μπορεί να παραληφθεί, να κωδικοποιηθεί με λιγότερη ακρίβεια χωρίς να υπάρχει καμία επίδραση στο τελικό αποτέλεσμα αντιπροσωπεύει επάξια τον όρο του πλεονασμού. Δύο από τους πλεονασμούς που θα αναλυθούν πιο κάτω είναι ο Στατικός Πλεονασμός και ο Υποκειμενικός Πλεονασμός. (VIDEO COMPRESSION TECHNIQUES AND STANDARDS), (IMAGE and VIDEO COMPRESSION for MULTIMEDIA ENGINEERING),(STILL IMAGE AND VIDEO COMPRESSION WITH MATLAB) 2.2.4 Στατικός πλεονασμός Μπορούμε να υπολογίσουμε το επίπεδο του σήματος σε οποιαδήποτε χρονική στιγμή εξετάζοντας την προηγούμενη τιμή, επειδή οι τιμές του δείγματος μιας εικόνας σχετίζονται σε ένα πολύ μεγάλο ποσοστό μεταξύ του. Ένα συχνό παράδειγμα είναι η εικόνα ή καλύτερα το φόντο που υπάρχει στα δελτία ειδήσεων, το οποίο παραμένει το ίδιο σε όλη τη διάρκεια και η μόνη εναλλαγή της εικόνας γίνεται στο μέρος που εμφανίζεται ο παρουσιαστής ή οι καλεσμένοι. Με αυτόν τον τρόπο υπολογίζουμε ένα τμήμα της εικόνας χρησιμοποιώντας μια προηγούμενη χωρίς να χρειαστεί να κωδικοποιήσουμε κάθε πλαίσιο της εικόνας. (VIDEO COMPRESSION TECHNIQUES AND STANDARDS),(IMAGE and VIDEO COMPRESSION for MULTIMEDIA ENGINEERING),(STILL IMAGE AND VIDEO COMPRESSION WITH MATLAB) 2.2.5 Υποκειμενικός πλεονασμός Η παραμόρφωση ή η αλλοίωση που γίνεται σε ορισμένες παραμέτρους της εικόνας και οι οποίες μπορούν να γίνουν αντιληπτές από το μάτι του ανθρώπου είναι ένα μικρό ποσοστό, γιατί το μάτι είναι πιο ευαίσθητο στην φωτεινότητα παρά στην αλλοίωση των χρωμάτων. Το καλύτερο που έχουμε να κάνουμε είναι να αφιερώσουμε πιο λίγο από το εύρο ζώνης στην περιγραφή των χρωμάτων με σκοπό να μην γίνει αντιληπτό από το θεατή. Οι ιδιαιτερότητες που έχει η όραση του ανθρώπου αλλά και ο υποκειμενικός πλεονασμός έχουν αξιοποιηθεί από την αναλογική τηλεόραση, αλλά τώρα τελευταία και από τη ψηφιακή. (VIDEO COMPRESSION TECHNIQUES AND STANDARDS),(IMAGE and VIDEO COMPRESSION for MULTIMEDIA ENGINEERING),(STILL IMAGE AND VIDEO COMPRESSION WITH MATLAB) 16

2.3 Είδη πλαισίων Στα είδη των πλαισίων κάναμε μια αναφορά στην προηγούμενη ενότητα, αλλά τώρα θα τα αναλύσουμε πιο πολύ. Οι δύο πιο βασικές κωδικοποιήσεις κινούμενης εικόνας είναι η Ενδοπλαισιακή Κωδικοποίηση και η Διαπλαισιακή Κωδικοποίηση. Η πρώτη μέθοδος ασχολείται με τη συμπίεση εικόνας JPEG ενώ η δεύτερη ασχολείται με τη τμηματική πρόβλεψη κίνησης. (block potion compresation), (VIDEO COMPRESSION TECHNIQUES AND STANDARDS), (IMAGE and VIDEO COMPRESSION for MULTIMEDIA ENGINEERING), (STILL IMAGE AND VIDEO COMPRESSION WITH MATLAB) 2.3.1 Ενδοπλαισιακή Κωδικοποίηση Η ενδοπλαισιακή κωδικοποίηση είναι η μέθοδος που συμπιέζει ένα βίντεο εφαρμόζοντας αλγόριθμους κωδικοποίησης στα πλαίσια (frames) που έχει μία στατική εικόνα. Η μέθοδος αυτή δεν έχει και τα καλύτερα αποτελέσματα γιατί δεν παίρνει υπόψη της το χρονικό πλεονασμό. Με αυτή τη μέθοδο οι αλγόριθμοι κωδικοποίησης αντιμετωπίζουν σαν μια αυτόνομη μονάδα το κάθε πλαίσιο και το κωδικοποιούν ανεξάρτητα από τα άλλα, έχοντας σαν αποτέλεσμα μια σειρά από διακριτές ακίνητες εικόνες. Εντελώς διαφορετικά λειτουργεί η διαπλαισιακή μέθοδος η οποία προσπαθεί να απαλείψει τον χρονικό πλεονασμό και την ομοιότητα που υπάρχει ανάμεσα στα διαδοχικά πλαίσια. (VIDEO COMPRESSION TECHNIQUES AND STANDARDS), (IMAGE and VIDEO COMPRESSION for MULTIMEDIA ENGINEERING), (STILL IMAGE AND VIDEO COMPRESSION WITH MATLAB). 2.3.2 Διαπλαισιακή Κωδικοποίηση Η διαπλαισιακή μέθοδος βρίσκει πρώτα τις πιθανές ομοιότητες που μπορεί να έχουν τα πλαίσια και μετά κωδικοποιεί τις διαφορές μεταξύ των πλαισίων. Με αυτόν τον τρόπο τα πλαίσια που υπάρχουν στο τελικό σήμα, εξαρτάται το ένα από το άλλο γιατί αν χρειαστεί να γίνει αποκωδικοποίηση του σήματος, θα πάρει πληροφορίες από προηγούμενο ή από επόμενο πλαίσιο για να γίνει σωστά η αποκωδικοποίηση του. Έτσι η συμπίεση είναι πολύ μεγαλύτερη εφόσον κωδικοποιούνται μόνο οι διαφορές που υπάρχουν ανάμεσα στα πλαίσια. Ο τύποι των πλαισίων είναι τρεις και είναι οι εξής: 17

Τα I-πλαίσια (intra coded frames), αυτόνομα κωδικοποιημένα πλαίσια P-πλαίσια (predictive frames), κωδικοποιημένα με βάση την προβλεπτική κωδικοποίηση Β-πλαίσια (inter coded frames), παρεμβαλλόμενα πλαίσια ανάμεσα στα P και I frames. i. Ι (Intra frames) Η κωδικοποίηση γίνεται σε όλα τα πλαίσια I (Intra frames), ενώ η αποκωδικοποίηση γίνεται στα πλαίσια χωρίς να είναι εξαρτημένα μεταξύ τους και γι' αυτό αποτελούν σημείο αναφοράς κατά την τυχαία προσπέλαση του σήματος. Τα πλαίσια I επιβάλλεται να μεταδίδονται ανά τακτά χρονικά πλαίσια, σχεδόν κάθε 15 πλαίσια, για να αποφύγουν τα σφάλματα που δημιουργούν τα πλαίσια P. Ένα παράδειγμα για να καταλάβουμε πως λειτουργούν τα πλαίσια I είναι όταν η συχνότητα της μετάδοσης είναι στα 30 Hz, τότε θα μεταδίδονται 2 φορές το δευτερόλεπτο. Η διαδικασία που γίνεται η κωδικοποίηση βασίζεται πάνω στο πρότυπο κωδικοποίησης JPEG που χωρίζει την εικόνα σε macro blocks και για κάθε ένα block ξεχωριστά εφαρμόζεται ο μετασχηματισμός DCT (Discrete Cosine Transform - Διακριτό μετασχηματισμό συνημιτόνου), κβαντοποίηση, Zig-Zag Scanning και οι κωδικοποιήσεις Run-Length και Huffman. ii. P (Predicted frames) Ένα άλλο είδος πλαισίου είναι τα πλαίσια P τα οποία χρησιμοποιούν το motion compensation για να βρούνε ποια macroblocks έχουν μετακινηθεί και ποια θέση κατέχουν, για να τα κωδικοποιήσουν μαζί με το διάνυσμα κίνησης και τη διαφορά τους. Αποτελούν σημείο αναφοράς για τα επόμενα πλαίσια συμβάλλοντας στην εισαγωγή και στην διάδοση σφαλμάτων, αφού δεν μπορεί να είναι ακριβής η πρόβλεψη κίνησης και γι' αυτό το λόγο δεν έχουν ίδιο μέγεθος με τα πλαίσια I, αλλά έχουν μεγαλύτερο ποσοστό συμπίεσης. Τα βήματα που ακολουθούν μας περιγράφουν τη διαδικασία κωδικοποίησης που χρησιμοποιούν τα πλαίσια P: Συγκρίνει τα macroblocks του πλαισίου με αυτά του προηγουμένου για να βρει τις ομοιότητας που υπάρχουν, 18

δημιουργεί διάνυσμα κίνησης και υπολογίζει τις διαφορές που υπάρχουν στις προβλέψεις, χρησιμοποιεί το μετασχηματισμό DCT των διαφορών σε κάθε block του νέου macroblock, κβαντοποίηση, χρησιμοποιεί την κωδικοποίηση Run-Lenght και το αποτέλεσμα κωδικοποιείται με την κωδικοποίηση Huffman. iii. B (Bi-directional frames) Τα πλαίσια Β λαμβάνουν το μέσο όρο του επιπέδου από ένα προηγούμενο και ένα επόμενο πλαίσιο από κάθε είδος πλαισίου I και P. Δεν ασχολείται τόσο με τη διάδοση των σφαλμάτων και με τα σημεία αναφοράς, όσο με το να μειώνει σημαντικά τα σφάλματα που βρίσκονται στο μέσο όρο των δύο πλαισίων. Τα πλαίσια B ασχολούνται μόνο με αυτά που αναφέρθηκαν πιο πάνω και με τίποτα άλλο, γιατί όταν μπλέκονται με πληροφορίες άλλων πλαισίων σε συνδυασμό με την υπολογιστική πολυπλοκότητα που χρησιμοποιείται για την κωδικοποίηση και την αποκωδικοποίηση, τα κάνει πιο ανεπιθύμητα για τους κατασκευαστές Με την κωδικοποίηση συνδυάζουμε τα αντίστοιχα macroblocks χρησιμοποιώντας τις διαφορές τους, με τα αντίστοιχα πλαίσια αναφοράς. Στην συνέχεια αφαιρούμε τον μέσο όρο των δύο πλαισίων που υπάρχουν στο τρέχον πλαίσιο μας, συνδυάζουμε τα διανύσματα των κινήσεων που έχουν πλαίσια αναφοράς και ακολουθεί η ίδια ακριβώς διαδικασία κωδικοποίησης με τα πλαίσια I και P. (VIDEO COMPRESSION TECHNIQUES AND STANDARDS),(IMAGE and VIDEO COMPRESSION for MULTIMEDIA ENGINEERING),(STILL IMAGE AND VIDEO COMPRESSION WITH MATLAB) (http://vsr.informatik.tu-chemnitz.de/~jan/mpeg/html/mpeg tech.html) 2.3.3 Κβαντοποίηση Η μέθοδος με την οποία μπορούμε να απαλλαγούμε από ένα σημαντικό μέρος της πληροφορίας είναι η κβαντοποίηση. Η κβαντοποίηση είναι η διαδικασία με την οποία μετατρέπουμε ένα σήμα που έχει πάρα πολλές τιμές σε σήμα με ορισμένες διακριτές τιμές. Όταν έχουμε μία εικόνα η οποία έχει εκατομμύρια χρώματα και χρησιμοποιούμε τη μέθοδο της κβαντοποίησης, τότε η εικόνα θα καταλήξει να έχει μόνο 256 διαφορετικές τιμές 19

χρωμάτων, όπως το πρότυπο συμπίεσης JPEG. Δηλαδή περιορίζει τα bits που μας χρειάζονται για να περιγράψουμε τα δείγματα του σήματος. (Alan Word) 3.1 Αρχές Συμπίεσης Ήχου Τα τελευταία χρόνια έχει αναπτυχθεί τόσο πολύ η ψηφιακή τεχνολογία που όλο και πιο πολύ κόσμος στρέφεται προς αυτή και έχει αντικαταστήσει την αναλογική τεχνολογία όπως τις τηλεπικοινωνίες, την εγγραφή και αναπαραγωγή της μουσικής καθώς και άλλους τομείς. Γι αυτό το λόγο άρχισε μια μεγάλη έρευνα που έχει να κάνει με τη συμπίεση τα ψηφιακής τεχνολογίας και του ψηφιακού σήματος. Στα πλαίσια της έρευνας παρατήρησαν ότι προσπαθώντας να ψηφιοποιήσουν ηχητικά δεδομένα το μέγεθος των αρχείων είναι πάρα πολύ μεγάλο και αυτό κάνει δύσκολη την επεξεργασία, τη μεταφορά που θέλει πολύ χρόνο, αρκετή μνήμη και μεγάλο αποθηκευτικό χώρο. Οι τεχνολογίες συμπίεσης ηχητικού σήματος είναι αυτές που θα διορθώσουν το πρόβλημα χρησιμοποιώντας διάφορες βασικές τεχνικές για τη μείωση του όγκου και τη ροή δεδομένων, οι οποίες χωρίζονται σε δύο κατηγορίες, τις απωλεστικές (lossy) και τις μη απωλεστικές (lossless). Η συμπίεση με απώλειες (lossless) είναι μια μέθοδος η όποια χάνει μέρος της πληροφορίας κατά τη διάρκεια της συμπίεσης, αλλά στο τέλος παρουσιάζει παρόμοια δεδομένα με τα αρχικά. Η μέθοδος αυτή χρησιμοποιείται κυρίως σε πολυμεσικά δεδομένα όπως ο ήχος, η εικόνα, το βίντεο και στην διαδικτυακή τηλεφωνία. Οι εικόνες αλλά και τα σήματα ομιλίας είναι αναλογικά και το αναλογικό σήμα εμπεριέχει άπειρη πληροφορία, με αυτόν τον τρόπο δημιουργείται θόρυβος κβαντισμού. Για να απεικονιστεί το σήμα όσο το δυνατόν πιο καλά μπορεί, δειγματοληπτείται με συγκεκριμένη ακρίβεια. Επομένως κατά τη συμπίεση, η αναπαραγωγή είναι καλύτερη γιατί μέσα από τη δειγματοληψία έχει καταφέρει να κρατηθεί ο θόρυβος κβάντισης κάτω από κάποια συγκεκριμένα επίπεδα, τα οποία είναι τα όρια που παραμορφώνεται η πληροφορία μας αλλά την ανεχόμαστε. Πλεονέκτημα της μεθόδου αυτής είναι ότι παράγει μικρότερα αποτελέσματα απ ότι η συμπίεση χωρίς απώλειες. Υπάρχουν δυο είδη συμπίεσης με απώλειες: Πρώτον είναι οι κώδικες μετατροπής με απώλειες, οι οποίοι παίρνουν μικρά δείγματα από τα αρχεία, τα όποια τα αλλάζουν μορφή, στη συνεχεία τα κβαντίζουν και στο τέλος τα κωδικοποιούν. Δεύτερον είναι οι κώδικες πρόβλεψης με απώλειες, οι συγκεκριμένοι κώδικες παίρνουν από προηγούμενα ή επόμενα δεδομένα τα οποία έχουν αποκωδικοποιηθεί για να κάνουν 20

πρόβλεψη των συγκεκριμένων. Αφού τα έχουν βρει, καταγράφουν τη διάφορα τους και ότι άλλο είναι απαραίτητο, τα κβαντίζουν και στο τέλος τα κωδικοποιούν. Για κάποια άλλα όμως δεδομένα μπορεί να χρειαστεί να χρησιμοποιήσουν και τις δυο μεθόδους μαζί, όπως για παράδειγμα είναι η συμπίεση MPEG. (En-hui Yang and John C. Kieffer, 2000), (Ming-Bo Lin, Jang-Feng Lee and Gene Eu, 2006), (S.S. Maniccama, N. Bourbakis, 2004) Η συμπίεση χωρίς απώλειες αντιστοιχίζει την κάθε κωδική λέξη με μόνο μια αρχική ακολουθία δεδομένων. Χρησιμοποιείται σε περιπτώσεις που απαιτείται η διατήρηση της ακριβούς αρχικής μορφής δεδομένων. Για παράδειγμα ένα κείμενο στο οποίο έχει αλλοιωθεί η δομή του, θα έχει σαν αποτέλεσμα να επέλθει και η αλλοίωση του με πιθανή την αδυναμία κατανόησης του. Επίσης εκμεταλλεύεται το στατιστικό πλεονασμό στη συγκεκριμένη αρχική απεικόνιση των δεδομένων. Ένα χαρακτηριστικό παράδειγμα είναι η συχνή εμφάνιση των γραμμάτων στην ελληνική γλώσσα όπου το Α εμφανίζεται πολύ πιο συχνά απ' ότι το Ξ ή το Ψ. Είναι εύκολο να εξοικονομήσετε χώρο χρησιμοποιώντας αυτή τη διαφοροποίηση. Η λογική των προγραμμάτων που χρησιμοποιούνται στη συμπίεση χωρίς απώλειες λειτουργούν σε δύο βήματα. Στο πρώτο βήμα δημιουργούν ένα στατιστικό μοντέλο από τα δεδομένα και στο δεύτερο βήμα χρησιμοποιούν αυτό το μοντέλο για να μετατρέψουν τα αρχικά δεδομένα σε μια ακολουθία που αποτελείται από δυαδικά ψηφιά. Στην ακολουθία των δυαδικών ψηφίων που έχει δημιουργηθεί, τα δεδομένα που εμφανίζονται πιο συχνά αναπαριστώνται με λιγότερα ψηφία από εκείνα που εμφανίζονται πιο σπάνια. Οι δυο πιο δημοφιλέστεροι αλγόριθμοι που παράγουν ακολουθίες δυαδίκων ψηφίων είναι η Κωδικοποίηση Huffman και η Αριθμητική Κωδικοποίηση. (Tadaaki Hosaka, Yoshiyuki Kabashima, 2006) Το στατιστικό μοντέλο δημιουργείται με 2 τρόπους, ο πρώτος είναι ο στατικός και ο δεύτερος είναι ο προσαρμοστικός. Με την στατιστική μοντελοποίηση αναλύονται τα δεδομένα, από τα οποία εξάγεται το μοντέλο το οποίο θα χρησιμοποιηθεί για να συμπιεστεί στον κωδικοποιητή και να αποσυμπιεστεί στον αποκωδικοποιητή. Με αυτόν τον τρόπο χάνεται πολύτιμος αποθηκευτικός χώρο αν και είναι πολύ απλή η μέθοδος. Σε αντίθεση με την στατική μοντελοποίηση, το προσαρμοστικό μοντέλο, αν και στην αρχή είναι ίδια στην κωδικοποίηση και στην αποκωδικοποίηση, το μόνο που αλλάζει είναι ότι προσαρμόζεται καθώς αποστέλλονται δεδομένα, με τέτοιο τρόπο ώστε να ταιριάζει καλύτερα την κατανομή των συμπιεσμένων μηνυμάτων. Οι αλγόριθμοι συμπίεσης χωρίς απώλειες αν μπουν στη διαδικασία να συμπιέσουν όλα τα δεδομένα εισόδου, εξαρτώνται από την κατανομή της πηγής. Αποδεικνύεται μαθηματικά 21

ότι υπάρχει περίπτωση κάποιος αλγόριθμος προσπαθώντας να συμπίεση ένα σύνολο δεδομένων, να μη μπορεί κάποιο κομμάτι να το μικρύνει σε μέγεθος με τη χρήση του συγκεκριμένου αλγορίθμου. Αυτό έχει σαν αποτέλεσμα να αποστέλλεται το αρχικό μήνυμα, όταν κάποιο πρόγραμμα αντί να μικρύνει το αρχείο, το μεγαλώνει. Σε κάποιες περιπτώσεις, οι απωλεστηκές τεχνικές συμπίεσης πετυχαίνουν συμπίεση που φτάνει το 24:1, καλή ποιότητα σε σχέση με τη μη απωλεστική που δεν μπορεί να ξεπεράσει το 4:1. Αυτό έχει σαν αποτέλεσμα στις σύγχρονες μεθόδους συμπίεσης να εφαρμόζουν κάποια ψυχοακουστικά μοντέλα αντίληψης που βοηθούν στο να απορρίψουν τους ήχους που δεν γίνονται κατανοητοί στο ανθρώπινο αυτί. Η ηχητική σκίαση είναι το φαινόμενο στο οποίο στηρίζονται οι πιο σημαντικοί μέθοδοι συμπίεσης ψηφιακών αρχείων, που έχει ως σκοπό την ακουστικότητα των αρχείων. Πρακτικά είναι ο ήχος ο οποίος έχει συγκεκριμένη συχνότητα και ένταση. Κάποιοι ήχοι σε πιο κοντινές συχνότητες δεν μπορούν να τους αντιληφθεί το ανθρώπινο αυτί, γι αυτό κατά τη διάρκεια που γίνεται η συμπίεση των ψηφιακών ηχητικών δεδομένων, οι συχνότητες τις οποίες δεν μπορεί να αντιληφθεί το αυτί του ανθρώπου απορρίπτονται σε καθορισμένο διάστημα συχνοτήτων, χάνοντας κάποιες από τις ηχητικές πληροφορίες και η ποιότητα του ήχου παραμένει σε υψηλό επίπεδα. JL Πλάτος Σήμα κυρίαρχου ήχου Περιοχή ήχων παραπλήσιας συχνότητας και χαμηλότερης. έντασης που δεν γίνονται αντιληπτοί από το ανθρώπινο αυτί Συχνότητα Εικόνα 1: Ηχητική σκιά Το πρότυπο AC-3 Dolby Digital και το πρότυπο MPEG έχουν άμεση σχέση με το φαινόμενο της ηχητικής σκίασης, διαφέροντας στο τρόπο που υλοποιούνται. Ο τρόπος με τον οποίο λειτουργούν είναι ο εξής, χωρίζουν το φάσμα των ακουστικών συχνοτήτων σε υπομπάντες με τη βοήθεια περίπλοκων αλγορίθμων και ψυχοακουστικά μέσα απορρίπτοντας τις μη ακουστικές συχνότητες από το ανθρώπινο αυτί. Μεταξύ των δύο 22

αυτών προτύπων ο κόσμος προτίμησε το AC-3 και αναδείχτηκε ως το διεθνές πρότυπο συμπίεσης ψηφιακών ηχητικών αρχείων. Όλες οι μέθοδοι που χρησιμοποιούνται για τη συμπίεση και την αποσυμπίεση των αρχείων υλοποιούνται με προγράμματα. Στα ψηφιακά δεδομένα παίζει μεγάλο ρόλο ο ρυθμός μετάδοσης γιατί είναι αυτός που καθορίζει την ποιότητα του ήχου, και εξαρτάται από τη συχνότητα της δειγματοληψίας αλλά και από το μέγεθος του δείγματος. Ο ρυθμός δεδομένων που παράγει ο ήχος του μουσικού CD είναι 1,4 Mbit/sec, χρησιμοποιώντας συχνότητα δειγματοληψίας 44.1 khz και έχει μέγεθος 16 bits. Αν για κάποιο λόγο μειωθεί η συχνότητα δειγματοληψίας τότε θα χαθούν οι υψηλές συχνότητες του ήχου γι αυτό οι σύγχρονοι αλγόριθμοι συμπίεσης που χρησιμοποιούν το ψυχοακουστικό μοντέλο, εξαρτώνται από τη μεταβολή των bits για να έχουν μεγαλύτερη συμπίεση και προσπαθούν να διατηρήσουν την υψηλή ποιότητα του αναπαραγόμενου ήχου. (Jeremy Iverson, Chandrika Kamath and George Karypis, 2012), (Data Compression Third Edition) 3.1.1 Πρότυπο Συμπίεσης Ψηφιακού Ήχου (MP3) Η ψηφιακή μουσική είναι συνδεδεμένη τα τελευταία χρόνια με το MP3, που έχει περάσει στην ιστορία ως η πιο θορυβώδες καινοτομίες της ψηφιακής μουσικής, διαπιστώνοντας το γεγονός ότι οι νέες συσκευές κατακλύζουν όλο και περισσότερο την αγορά. Αυτό έχει χαροποιήσει τους φίλους της μουσικής αλλά και πολλές δισκογραφικές εταιρίες γιατί βγαίνοντας στη αγορά άλλαξε πολλά από τα δεδομένα που ίσχυαν μέχρι εκείνη τη στιγμή. Το MP3 εμφανίστηκε στην παγκόσμια αγορά από το Ινστιτούτου Fraughofer IIS που είχαν επικεφαλή, τους Karlheinz Branderburg και Dieter, με σκοπό τη μεγαλύτερη συμπίεση και την καλύτερη ποιότητα του ήχου. Η συμπίεση που γίνεται σε ένα αρχείο ήχου μπορεί να φτάσει μέχρι και το 85%, χωρίς όμως να υπάρχει κάποια διαφορά στην ποιότητα απόδοσης. Η συμπίεση που γίνεται στο αρχείο έχει ρυθμό συμπίεσης άνω των 128 Kbit/sec και δεν γίνεται αντιληπτή η διαφορά από το πρωτότυπο CD, με αποτέλεσμα κάποια μουσικά αρχεία που είχαν μέγεθος 50-70 MB τώρα να έχουν 3-4 MB μέγεθος. Το βασικό μοντέλο ακοής που χρησιμοποιείται από τους κωδικοποιητές MP3 είναι οι καμπύλες κατωφλιού ακουστικότητας. Το μοντέλο αυτό βασίζεται στην ελάχιστη ένταση που πρέπει να έχει ο ήχος για να τον ακούμε, δηλαδή όσο πιο μικρή είναι η ένταση του μουσικού αρχείου τόσο πιο μικρή θα είναι και η ευαισθησία της ακοής μας. Το αυτί του ανθρώπου μετά από έρευνες έχει δείξει ότι έχει περιορισμένη και εξαρτώμενη συχνότητα διακριτικότητας, και το κατώφλι ακουστικότητας εξαρτάται από την ένταση του σήματος σε 23

ένα περιορισμένο εύρος ζώνης γειτονικό της συχνότητας. Η συχνότητα που έχει ένα ακουστικό φάσμα για κάθε κατώφλι ακουστικότητας είναι διαφορετικό. Ένα άλλο φαινόμενο που έχει μεγάλο ενδιαφέρον είναι το φαινόμενο της επικάλυψης το οποίο ασχολείται με δύο γειτονικούς ήχους οι οποίοι είναι δεδομένοι και ο ισχυρότερος αλλοιώνει τοπικά την καμπύλη ακουστικότητας με τέτοιο τρόπο που καλύπτει τον ασθενέστερο χωρίς να το αντιληφθεί το ανθρώπινο αυτί. Οι κωδικοποιητές MP3 μπορούν να υπολογίσουν το περιεχόμενο του φάσματος κάθε χρονικής στιγμής που υπάρχει στο σήμα, να βρουν ποιοι ήχοι είναι οι ασθενέστεροι και καλύπτονται από τους ισχυρότερους, για να μην τους κωδικοποιήσουν. Επίσης, έχουν στη διάθεσή τους οποιαδήποτε χρονική στιγμή, έναν αριθμό ψηφίων που εξαρτάται από το βαθμό συμπίεσης που έχει ζητηθεί, ενώ κατά τη διάρκεια που γίνεται η συμπίεση δεν χρησιμοποιούνται όλα τα ψηφία και ειδικά όταν η στιγμιαία μορφή του σήματος μπορεί εύκολα να συμπιεστεί και στη συνέχεια να συντηρήσει μια δεξαμενή από ψηφία, τα οποία απαιτούν ακρίβεια στην κωδικοποίηση τους. (Mengyu Qiao, Andrew H. Sung and Qingzhong Liu, 2012), (Shijun Xiang a,_, Hyoung Joong Kim b, Jiwu Huang, 2008) 3.1.2 Άλλα Πρότυπα Ψηφιακού Ήχου Πέρα από την πολύ γρήγορη εξέλιξη και την απήχηση που είχε το MP3 από τον κόσμο, δεν έμειναν μόνο σε αυτό το μοντέλο γιατί η τεχνολογία αναπτύσσεται με τόσο γρήγορους ρυθμούς παρέχοντας στους χρήστες πρότυπα για να έχουν όσο το δυνατόν καλύτερη συμπίεση ψηφιακού ήχου. Κάποια από αυτά τα πρότυπα μπορούμε να πούμε ότι είναι το Windows Media Player (WMA), το AAC(Advanced Audio Coding), το MP3 Pro, το OGG και το AC-3 Dolby Digital. > WMA (Windows Media Audio) Το WMA είναι ένα σύστημα κωδικοποίησης και αποκωδικοποίησης ήχου και επιτρέπει τη συμπίεση αρχείων ήχου στο 1/20 του αρχικού όγκου, τα οποία αποθηκεύονται σε ένα CD. Ο κατασκευαστής του προτύπου αυτού είναι η Microsoft, η οποία βλέποντας ότι ο κόσμος έχει στραφεί προς την καινούρια τεχνολογία και προς τα συμπιεσμένα ηχητικά 24

αρχεία, δεν θα μπορούσε να μείνει έξω από αυτή τη διαδικασία προσφέροντας σχεδόν ίδιες δυνατότητες με το MP3, καθώς εγγυάται άριστη ποιότητα αναπαραγωγής και μεγάλη συμπίεση (64 Kbps). Γι' αυτό το λόγο πολλές δισκογραφικές εταιρίες χρησιμοποιούν το πρότυπο WMA για τα πλαίσια υλοποίησης του έργου τους. (http://en.wikipedia.org/wiki/windows Media Audio) > MP3 Pro Η εταιρία Coding Technologies δημιούργησε μια νέα τεχνολογία το 2001 που την ονόμασε Mp3 Pro, η οποία ήταν μία πιο βελτιωμένη έκδοση του Mp3 προσφέροντας στον χρήστη αρχεία με το μισό μέγεθος αλλά με όμοια ποιότητα, πραγματοποιώντας μεγαλύτερη συμπίεση στα δεδομένα. Το μέγεθος της συμπίεσης ήταν 64 Kbps και 96 Kbps, σε σχέση με τα 128 Kbps και 192 Kbps που έχουν τα Mp3 αρχεία. (http://en.wikipedia.org/wiki/mp3pro ) > MP3 Surround Το Mp3 Surround και η πολυκαναλική έκδοση MP3 παρουσιάστηκαν το 2004 από το Ινστιτούτο Fraunhofer IIS, βασιζόμενα στη τεχνολογία Binaural Cue Coding της Agere. Η πολυκαναλική τεχνολογία επιτρέπει να αναμειχθούν τα σήματα από πολλά κανάλια μόνο σε δύο κανάλια, δημιουργώντας ένα σήμα που είναι με τον απλό κωδικοποιητή Mp3 και παράλληλα κωδικοποιεί μία σειρά από παραμέτρους περιγράφοντας πλήρως το ηχητικό πεδίο surround. Οι χρονικές διαφορές, η συσχέτιση μεταξύ καναλιών και οι διαφορές στάθμης που υπάρχουν ανάμεσα στα κανάλια είναι κάποιες από τις παραμέτρους. (http://en.wikipedia.org/wiki/mp3 Surround ) > AAC (Advance Audio Coding) Ένα ακόμη πρότυπο που έβγαλε στην αγορά το Ινστιτούτο Fraunhofer IIS το 1997 ήταν το AAC (Advance Audio Coding). Για να λειτουργήσει αυτό το πρότυπο χρησιμοποιεί το ψυχοακουστικό μοντέλο για να καλύψει τα προβλήματα που υπάρχουν στην ποιότητα των αρχείων MP3 στους μικρούς αριθμούς κατά τη διάρκεια που γινόταν η μετάδοση των δεδομένων. Είναι ένα πραγματικό εργαλείο δίνοντας την ικανότητα να αποδίδει εξαιρετικά υψηλή ποιότητα ήχου φτάνοντας τα 64 Kb/sec. Επίσης κωδικοποιεί χρησιμοποιώντας 48 κανάλια ήχου και 16 κανάλια χαμηλής συχνότητας για διάφορα εφέ αλλά και για να μπορεί να χρησιμοποιήσει πολλές γλώσσες μαζί. 25