Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Σχετικά έγγραφα
Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Περιεχόμενα. 4.1 Χαρακτηριστικά του ήχου Ψηφιοποίηση με μετασχηματισμό Ψηφιοποίηση με δειγματοληψία Πρόλογος...

Τεχνολογία Πολυμέσων. Ενότητα # 15: Συγχρονισμός πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

Τεχνολογία Πολυμέσων. Ενότητα # 20: Υπηρεσίες καλύτερης προσπάθειας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Τεχνολογία Πολυμέσων. Ενότητα # 1: Εισαγωγή Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 14: Κωδικοποίηση βίντεο: Η.264 Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 7: Θεωρία πληροφορίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 2: Εφαρμογές πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 3: Συστήματα πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Συστήματα Πολυμέσων. Ενότητα 11: Χαρακτηριστικά Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 8: MPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Τεχνολογία Πολυμέσων. Ενότητα # 17: Πρωτόκολλα μετάδοσης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Κωδικοποίηση βίντεο (MPEG)

Τεχνολογία Πολυμέσων. Ενότητα # 5: Εικόνα Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 19: Τηλεδιάσκεψη Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Κωδικοποίηση βίντεο (MPEG)

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 9 : Συμπίεση δεδομένων. Δρ. Γκόγκος Χρήστος

Τεχνολογία Πολυμέσων. Ενότητα # 6: Βίντεο Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

Θέματα Συστημάτων Πολυμέσων. Ενότητα #3: Ιδιότητες μέσων Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

Συστήματα Πολυμέσων. Ενότητα 16: Διαμορφώσεις και Πρότυπα Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 7: JPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τεχνολογία Πολυμέσων. Ενότητα # 13: Κωδικοποίηση βίντεο: MPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Θέματα Συστημάτων Πολυμέσων

Κωδικοποίηση βίντεο (H.261 / DVI)

Πληροφορική Εφαρμογές Πολυμέσων

Μάθημα: Ακουστική και Ψυχοακουστική

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Αφήγηση Μαρτυρία. Μουσική. Ενίσχυση μηνύματος Μουσική επένδυση Ηχητικά εφέ

Εισαγωγή στις Τηλεπικοινωνίες / Εργαστήριο

Ψηφιακή Επεξεργασία Εικόνας

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 6: Κωδικοποίηση & Συμπίεση Εικόνας

ΜΟΥΣΙΚΗ ΚΑΙ ΥΠΟΛΟΓΙΣΤΕΣ

Ψηφιακή Επεξεργασία Σηµμάτων

Ψηφιακή Επεξεργασία Εικόνας

Εισαγωγή στις Τηλεπικοινωνίες

Συστήματα Πολυμέσων Ενότητα 4: Συμπίεση. Επικ. Καθηγητής Συνδουκάς Δημήτριος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Νέες Τεχνολογίες και Καλλιτεχνική Δημιουργία

Τεχνολογία Πολυμέσων. Ενότητα # 21: Εγγυημένη ποιότητα υπηρεσίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ, 2007 ΘΡ. ΤΣΙΑΤΣΟΣ

Βίντεο. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 06-1

Τεχνολογία Πολυμέσων. Ενότητα # 22: Δίκτυα ATM Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 9: Κωδικοποίηση εντροπίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Εισαγωγή στη Δικτύωση Υπολογιστών

Συστήματα Πολυμέσων. Ενότητα 8: Συμπίεση Εικόνας κατά JPEG Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Εισαγωγή στις Τηλεπικοινωνίες

Τεχνολογία Πολυμέσων. Ενότητα # 16: Πολυεκπομπή Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Συστήματα Πολυμέσων Ενότητα 7: Ψηφιοποίηση και ψηφιακή επεξεργασία σήματος.

Κεφάλαιο 4 Συμπίεση Ήχου

Πληροφορική Εφαρμογές Πολυμέσων

Πολυμέσα πάνω από κινητά δίκτυα

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

Τηλεπικοινωνίες. Ενότητα 5: Ψηφιακή Μετάδοση Αναλογικών Σημάτων. Μιχάλας Άγγελος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Συµπίεση Ήχου µεβάσητην Αντίληψη: Τα πρότυπα συµπίεσης MPEG-1 layer I, layer II, layer III

Ψηφιακή Επεξεργασία Εικόνας

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

ΜΑΘΗΜΑ: Τεχνολογίες Πολυμέσων

Τεχνολογία Πολυμέσων. Ενότητα # 18: Ροή πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Συστήματα Πολυμέσων Ενότητα 3: Ήχος. Επικ. Καθηγητής Συνδουκάς Δημήτριος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Ραδιοτηλεοπτικά Συστήματα Ενότητα 3: Θεωρία Ψηφιοποίησης

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

Εισαγωγή. Τεχνολογία Πολυµέσων 01-1

MPEG-4 : Διαδραστικές εφαρμογές πολυμέσων

Συστήματα Επικοινωνιών

Τηλεπικοινωνιακά Συστήματα Ι

Πολυμεσικές Εφαρμογές

Αρχές Τηλεπικοινωνιών

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1

Εισαγωγή στις Τηλεπικοινωνίες / Εργαστήριο

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 1: Εισαγωγή Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Τεχνολογία*Ήχου 1/11/16. Αναλογικές*ηχητικές*διασυνδέσεις. Βασικές* κατηγορίες*ηχητικές* διασυνδέσεων. Αναλογικές* ηχητικές*διασυνδέσεις

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΣΗΜΑΤΑ & ΣΥΣΤΗΜΑΤΑ. Ενότητα : ΔΙΑΚΡΙΤΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ FOURIER

Μετάδοση πληροφορίας - Διαμόρφωση

ηµοτικό ιαδικτυακό Ραδιόφωνο και Τηλεόραση

Διάλεξη 8. Η Φυσική της Μουσικής Τ.Ε.Ι. Ιονίων Νήσων. Αντιληπτό ύψος καθαρού τόνου Απόλυτο ύψος

Συστήματα Επικοινωνιών

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Συστήματα πολυμέσων. Εισαγωγή Υλικό συστημάτων πολυμέσων Λογισμικό συστημάτων πολυμέσων Συστήματα πραγματικού χρόνου Χρονοπρογραμματισμός

Μια «ανώδυνη» εισαγωγή στο μάθημα (και στο MATLAB )

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

ΠΑΡΑΓΩΓΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

Transcript:

Τεχνολογία Πολυμέσων Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Οικονομικό Πανεπιστήμιο Αθηνών» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 2

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Οι εικόνες προέρχονται από το βιβλίο «Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες», Γ.Β. Ξυλωμένος, Γ.Κ. Πολύζος, 1 η έκδοση, 2009, Εκδόσεις Κλειδάριθμος. 3

Σκοποί ενότητας Κατανόηση των βασικών τεχνικών κωδικοποίησης καναλιού και πηγής ειδικά για τη φωνή. Εισαγωγή στην αντιληπτική κωδικοποίηση και την εφαρμογή της στην κωδικοποίηση γενικών ήχων στα πρότυπα MPEG. 4

Περιεχόμενα ενότητας Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG-1 Κωδικοποίηση ήχου MPEG-2 5

Κωδικοποίηση καναλιού φωνής Μάθημα: Τεχνολογία Πολυμέσων, Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γιώργος Ξυλωμένος, Τμήμα: Πληροφορικής

Κωδικοποίηση καναλιού (1 από 4) Αρχικά ψηφιοποίηση στα 64 kbps (G.711) Κωδικοποίηση DPCM Κωδικοποίηση διαφορών αντί δειγμάτων Μεταδίδουμε προσέγγιση της διαφοράς Βάση: η προηγούμενη προσέγγιση 7

Κωδικοποίηση καναλιού (2 από 4) Κωδικοποίηση DPCM με πρόβλεψη Γραμμικός συνδυασμό παλιών προβλέψεων Καλύτερες προσεγγίσεις με λιγότερα bit 8

Κωδικοποίηση καναλιού (3 από 4) Κωδικοποίηση ADPCM Χρήση πολλών τιμών για πρόβλεψη Μεταβολή βήματος κβαντοποίησης G.721: ποιότητα G.711 στα 32 kbps Χρήση 8 προηγούμενων τιμών για πρόβλεψη G.723: αντίστοιχα για 24 και 40 kbps G.726: επεκτείνει τα G.721 και G.723 Υποστηρίζει ρυθμούς 16, 24, 32 και 40 Kbps 9

Κωδικοποίηση καναλιού (4 από 4) G.722: 64 kbps για εύρος ζώνης 7 KHz Χωρίζουμε τη φωνή σε δύο ζώνες συχνοτήτων Κωδικοποίηση κάθε ζώνης με ADPCM 0-3,5 KHz: κωδικοποίηση με 48 kbps Αντίστοιχο με κλασική τηλεφωνία 3,5-7 KHz: κωδικοποίηση με 16 kbps Προσθήκη υψηλότερων συχνοτήτων Πιο φυσική απόδοση της φωνής 10

Κωδικοποίηση πηγής φωνής Μάθημα: Τεχνολογία Πολυμέσων, Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γιώργος Ξυλωμένος, Τμήμα: Πληροφορικής

Κωδικοποίηση πηγής (1 από 6) Κωδικοποιητές φωνής (vocoders) Χρήση μοντέλου ανθρώπινης φωνής Εξαγωγή χαρακτηριστικών και μετάδοσή τους Παράμετροι μοντέλου 12

Κωδικοποίηση πηγής (2 από 6) Βασική ορολογία Φωνητικοί ήχοι (voiced) Παράγονται με κλειστές φωνητικές χορδές Σχηματιστικές συχνότητες (formants) Παράγονται από λαιμό και στόμα Επηρεάζουν τους φωνητικούς ήχους Μη φωνητικοί ήχοι (unvoiced) Παράγονται με ανοιχτές φωνητικές χορδές 13

Κωδικοποίηση πηγής (3 από 6) Γραμμική προβλεπτική κωδικοποίηση (LPC) Φωνητικοί ήχοι: γεννήτρια συχνοτήτων Περνάνε από φίλτρο σχηματιστικών συχνοτήτων Μη φωνητικοί ήχοι: γεννήτρια θορύβου Πρόβλεψη επόμενων παραμέτρων Από προηγούμενες ομάδες δειγμάτων LPC-10: γραμμικός συνδυασμός 10 ομάδων Ρυθμοί μετάδοσης έως και 2,4 Kbps 14

Κωδικοποίηση πηγής (4 από 6) LPC διεγειρόμενη με κωδικούς (CELP) Χρήση βιβλιοθήκης έτοιμων προτύπων Προσθήκη προσαρμοσμένων προτύπων Δημιουργία βιβλίου κατά την κωδικοποίηση Εντοπίζεται το καλύτερο ταίριασμα Ενημέρωση προσαρμοσμένων προτύπων Πρόβλεψη παραμέτρων Μείωση του εύρους ζώνης 15

Κωδικοποίηση πηγής (5 από 6) G.728: 16 kbps Κατάλληλο για τηλεδιάσκεψη σε ISDN G.729: 8 kbps Χρήση στην κινητή τηλεφωνία Το G.729a χρησιμοποιείται στο GSM G.723.1: 5,3 ή 6,3 kbps Κατάλληλο για τηλεδιάσκεψη σε δίκτυα PSTN 16

Κωδικοποίηση πηγής (6 από 6) Η αποδοτική κωδικοποίηση έχει κόστος Αυξάνεται η καθυστέρηση κωδικοποίησης Συνάρτηση Flanagan Καμπύλες ποιότητας ρυθμού μετάδοσης Κάθε δεκαετία αντιστοιχεί σε νέα καμπύλη 17

Αντιληπτική κωδικοποίηση Μάθημα: Τεχνολογία Πολυμέσων, Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γιώργος Ξυλωμένος, Τμήμα: Πληροφορικής

Κωδικοποίηση γενικών ήχων Η φωνή είναι ειδική περίπτωση ήχου Συγκεκριμένα χαρακτηριστικά και μοντέλα Ομαλή μεταβολή, συγκεκριμένοι ήχοι Πώς να κωδικοποιήσουμε τυχαίο ήχο; Για παράδειγμα, μουσική Η κωδικοποίηση πηγής δεν είναι εφικτή Δεν γνωρίζουμε τα χαρακτηριστικά της πηγής Γνωρίζουμε όμως τα χαρακτηριστικά της ακοής 19

Λειτουργία της ακοής Δυναμικό εύρος της ακοής Πλέον ισχυρό / πλέον ασθενές αντιληπτό σήμα Εξαρτάται από την περιοχή συχνοτήτων Μεγιστοποιείται στην περιοχή 2-5 KHz Αντιληπτική κωδικοποίηση Χρήση ψυχοακουστικού μοντέλου της ακοής Εντοπισμός μη αντιληπτών τμημάτων του ήχου Κωδικοποίησή τους με μικρή ακρίβεια ή καθόλου 20

Απόκρυψη ήχων (1 από 2) Απόκρυψη συχνοτήτων Ισχυρά σήματα: μειώνουν το δυναμικό εύρος Στις γειτονικές συχνότητες ανεβαίνει το κάτω όριο Η επίδραση εξαρτάται από τη συχνότητα Απόκρυψη χρόνου Ισχυρά σήματα: αποκρύπτουν ασθενή για λίγο Η επίδραση εξαρτάται πάλι από τη συχνότητα 21

Απόκρυψη ήχων (2 από 2) Αξιοποίηση των αποκρύψεων Αναλύουμε το σήμα σε περιοχές συχνοτήτων Σε κάθε περιοχή εντοπίζουμε τα ισχυρά σήματα Υπολογίζουμε επίδραση στα ασθενή σήματα Σε κάθε περιοχή έχουμε διαφορετική επίδραση Εντοπίζουμε τα ασθενή σήματα Κωδικοποίηση με μικρότερη ακρίβεια 22

Κωδικοποίηση ήχου MPEG-1 Μάθημα: Τεχνολογία Πολυμέσων, Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γιώργος Ξυλωμένος, Τμήμα: Πληροφορικής

Κωδικοποίηση MPEG-1 (1 από 6) MPEG Audio Layer 1, 2, 3 Τυποποιήθηκε στα πλαίσια του MPEG-1 Συνοδεύει πρότυπα για βίντεο και σύστημα Τρία επίπεδα, προς τα πίσω συμβατότητα Πιο δημοφιλές το επίπεδο 3 (MP3) Ψηφιοποίηση σήματος 48, 44,1 ή 32 KHz με 16 bit ανά κανάλι Συμβατό με CD μουσικής και DAT 24

Κωδικοποίηση MPEG-1 (2 από 6) Συμπίεση με βάση ψυχοακουστικό μοντέλο Επηρεάζει κωδικοποίηση με βάση την αντίληψη 25

Κωδικοποίηση MPEG-1 (3 από 6) Βασική κωδικοποίηση Επεξεργασία πακέτου δειγμάτων MP1/2: διάκριση σε 32 ζώνες με φίλτρα MP3: επιπλέον μετασχηματισμός MDCT Κάθε ζώνη διακρίνεται σε 18 υποζώνες Μεγαλύτερη ακρίβεια στην απόκρυψη θορύβου 26

Κωδικοποίηση MPEG-1 (4 από 6) Ψυχοακουστικό μοντέλο Ξεκινάει με FFT 1024 σημείων ή έξοδο MDCT Εκτίμηση σημασίας κάθε ζώνης/συντελεστή Κατανομή bit ανάλογα με τη σημασία Κβαντοποίηση Λογαριθμική κβαντοποίηση των συντελεστών Χρήση παράγοντα κλιμάκωσης κβαντοποίησης Στόχος: έξοδος με σταθερό ρυθμό bit 27

Κωδικοποίηση MPEG-1 (5 από 6) Κωδικοποίηση εντροπίας MP1/2: PCM MP3: Huffman σε ζεύγη συντελεστών Επιλογή πίνακα Huffman ανάλογα με την είσοδο Διπλός βρόχος προσαρμογής κβαντοποίησης Εσωτερικός: ανάλογα με κωδικοποίηση εντροπίας Ρυθμίζει καθολικό παράγοντα κβαντοποίησης Εξωτερικός: ανάλογα με θόρυβο σε κάθε ζώνη Ρυθμίζει παράγοντες κβαντοποίησης ανά ζώνη 28

Κωδικοποίηση MPEG-1 (6 από 6) Τελική κωδικοποίηση Επίπεδα 1 και 2: σταθερός ρυθμός bit Επίπεδο 3: προαιρετικά μεταβλητός ρυθμός bit Αλλαγή σε κάθε πλαίσιο (frame) ήχου Ρυθμός δεδομένων: τουλάχιστον 32 Kbps Επίπεδο 1: Μέχρι 448 Kbps Επίπεδο 2: Μέχρι 384 Kbps Επίπεδο 3: Μέχρι 320 Kbps 29

Στερεοφωνία (1 από 2) Στερεοφωνικός ήχος Δύο κανάλια ήχου για μεγαλύτερη πιστότητα Μικρόφωνα / ηχεία σε διαφορετικά σημεία Ο άνθρωπος τα αντιλαμβάνεται με δύο τρόπους Διαφορές στο χρονισμό των καναλιών Διαφορές στην ένταση των καναλιών Κωδικοποίηση στέρεο στο MPEG-1 Ανεξάρτητη ή κοινή (joint) 30

Στερεοφωνία (2 από 2) Κωδικοποίηση έντασης (intensity) Οι χαμηλές συχνότητες είναι ιδιαίτερες Δεν αντιλαμβανόμαστε διαφορές στο χρονισμό Συνένωση δεξιού/αριστερού καναλιού Προσθήκη πληροφορίας για τις διαφορές εντάσεων Κεντρική-πλευρική κωδικοποίηση (mid-side) Το κεντρικό είναι το άθροισμα δεξιού/αριστερού Το πλευρικό κανάλι είναι η διαφορά τους Μη απωλεστικός μετασχηματισμός 31

Αρχεία MPEG-1 (1 από 2) Μορφή αρχείων MPEG-1 Το αρχείο μπορεί να έχει ιδιαίτερη κεφαλίδα Εξαρτάται από το μορφότυπο, όχι από το πρότυπο Το αρχείο διακρίνεται σε πλαίσια (frames) ήχου Διάρκεια 24 ms στα 48 KHz Κάθε πλαίσιο έχει μία κεφαλίδα Επιτρέπει την άμεση έναρξη της αποκωδικοποίησης Λέξη χρονισμού: έλεγχος για περιοδική εμφάνιση Μπορεί να εμφανίζεται και στα δεδομένα 32

Αρχεία MPEG-1 (2 από 2) Μορφή αρχείων MPEG-1 Ρυθμός bit: επιτρέπει αλλαγή ανά πλαίσιο Δειγματοληψία: επιτρέπει αλλαγή ανά πλαίσιο Επίπεδο: 1, 2, 3 ή παραλλαγές Τρόπος κωδικοποίησης Στέρεο, κοινό στέρεο, κ.λπ. Bit προστασίας: χρησιμοποιούνται ελάχιστα 33

Κωδικοποίηση ήχου MPEG-2 Μάθημα: Τεχνολογία Πολυμέσων, Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γιώργος Ξυλωμένος, Τμήμα: Πληροφορικής

Κωδικοποίηση MPEG-2 (1 από 2) Πολυκαναλικός ήχος MPEG-2 Μέχρι πέντε κανάλια πλήρους εύρους Κεντρικό, εμπρός, περιφερειακά Κανάλι βελτίωσης μπάσων (LFE) Συχνότητες 15-120 Hz Επιτρέπονται διάφοροι συνδυασμοί Πολύγλωσση ομιλία και σχολιασμός Κινηματογραφικός ήχος 5.1 35

Κωδικοποίηση MPEG-2 (2 από 2) Άλλες προσθήκες του MPEG-2 Υποδιπλάσιοι ρυθμοί δειγματοληψίας Αποδοτικό με 64 Kbps ανά κανάλι 36

Προβλήματα MPEG (1 από 2) Προβλήματα ψηφιακής κωδικοποίησης ήχου Διαφέρουν από αυτά του αναλογικού ήχο Απώλεια ποιότητας Σε συγκεκριμένες περιοχές συχνοτήτων Όχι όπως η αναλογική αρμονική παραμόρφωση Μπορεί να αλλάζει σε κάθε διάστημα κωδικοποίησης Εξαφάνιση συχνοτήτων λόγω χαμηλού ρυθμού bit Αναγκαστικός μηδενισμός ορισμένων συντελεστών 37

Προβλήματα MPEG (2 από 2) Προ-ηχώ (pre-echo) Απότομη αλλαγή στο διάστημα κωδικοποίησης Παράγει θόρυβο λόγω ανεπαρκούς ρυθμού bit Απλώνεται σε όλο το διάστημα κωδικοποίησης Διπλή ομιλία (double speak) Διαφορά περιόδου σήματος και κωδικοποίησης Η ομιλία παρουσιάζει περιοδικότητα Αλλοιώνεται από την κωδικοποίηση 38

MPEG-2 AAC (1 από 4) MPEG-2 Advanced Audio Coding (AAC) Νέος κωδικοποιητής για το MPEG-2 Πιο αποδοτικός από το MPEG-1 Μείωση ρυθμού bit κατά 30% για ίδια ποιότητα Δεν διατηρεί προς τα πίσω συμβατότητα Ίδια βασική δομή αλλά με πολλές βελτιώσεις Βασικός κωδικοποιητής ήχου και για το MPEG-4 39

MPEG-2 AAC (2 από 4) Βελτιώσεις κωδικοποίησης Έως και 1024 ζώνες συχνοτήτων (αντί για 576) Χρησιμοποιεί μόνο MDCT, όχι φίλτρα Η περίοδος κωδικοποίησης είναι μικρότερη Βελτιωμένη κοινή στερεοφωνική κωδικοποίηση Huffman σε τετράδες συντελεστών Πρόβλεψη συντελεστών σε κάθε συχνότητα Χρησιμοποιείται πολύ σπάνια 40

MPEG-2 AAC (3 από 4) Βελτιώσεις ποιότητας Μειωμένη προ-ηχώ (pre-echo) Οφείλεται στη μικρότερη περίοδο κωδικοποίησης Χρονική μορφοποίηση θορύβου (TNS) Αποφυγή του φαινομένου της διπλής ομιλίας 41

MPEG-2 AAC (4 από 4) Μορφή αρχείων AAC Audio Data Interchange Format (ADIF) Όλες οι πληροφορίες είναι σε μία κεφαλίδα Αποκωδικοποίηση μόνο από αρχή του αρχείου Audio Data Transport Stream (ADTS) Κεφαλίδες ανά πλαίσιο ήχου Παρόμοιο με το MPEG-1 Επιτρέπει όμως και πλαίσια μεταβλητού μεγέθους Επίπεδο 4 στην κεφαλίδα του πλαισίου 42

Τέλος Ενότητας #10 Μάθημα: Τεχνολογία Πολυμέσων, Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γιώργος Ξυλωμένος, Τμήμα: Πληροφορικής