ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου Δρ. Νικόλαος- Αλέξανδρος Τάτλας Τμήμα Ηλεκτρονικών Μηχανικών Τ.Ε Κάντε κλικ για να ξεκινήσετε
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3
Περιεχόμενα 5.1 Ψηφιοποίηση και συμπίεση σημάτων ήχου 4
Προσδοκώμενα Αποτελέσματα Στην ενότητα αυτή θα μάθετε για: Χαρακτηριστικά υλικού ήχου, Βασική θεωρία ψηφιοποίησης σημάτων, Ψηφιοποίηση ηχητικών σημάτων και πρότυπα, Μη απωλεστικοί αλγόριθμοι συμπίεσης, Συμπίεση ηχητικών σημάτων: τεχνικές στα πεδία χρόνου/συχνότητας, πρότυπα MPEG1 LI,LII,LIII. 5
5.1 Ψηφιοποίηση και Συμπίεση Σημάτων Ήχου 6
Τεχνικές μη Απωλεστικής Συμπίεσης Ηχητικών Δεδομένων Συνήθως υλοποιούνται σε 3 στάδια: Γραμμική πρόβλεψη: Στόχος η ελαχιστοποίηση της διαφοράς του σήματος εισόδου από την εκτίμηση της τιμής του. Η εκτίμηση αυτή παράγεται από τις κβαντισμένες τιμές Μ δειγμάτων εισόδου. Κωδικοποίηση εντροπίας Το σήμα διαφοράς κβαντίζεται. Οι τιμές με μεγαλύτερη πιθανότητα εμφάνισης κβαντίζονται με μικρότερες ψηφιακές λέξεις. Πολύπλεξη και δημιουργία πακέτων 7
Τεχνικές Απωλεστικής Συμπίεσης Ηχητικών Δεδομένων Συνεχής εξέλιξη από τη δεκαετία του 1960. Αφαίρεση πλεονασμού από τα δεδομένα. Πλεονασμός λόγω θεωρήματος Nyquist. Μείωση της υποκειμενικά μη ακουστής πληροφορίας Τι ακούμε πραγματικά; Τεχνικές στο πεδίο του χρόνου (time domain). Τεχνικές στο πεδίο της συχνότητας (frequency domain) Υποκειμενικές κωδικοποιήσεις. Λόγος συμπίεσης μεγαλύτερος από 10:1. 8
Τεχνικές Συμπίεσης στο Πεδίο του Χρόνου Αξιοποίηση της συσχέτισης μεταξύ των δειγμάτων. Κωδικοποίηση στο πεδίο του χρόνου διαφορών της τιμής του σήματος. Πρότυπα CCITT και ISO. Χαμηλή ποιότητα, χαμηλές επιδόσεις. Χαμηλή πολυπλοκότητα. Χρήση κυρίως σε τηλεπικοινωνιακές εφαρμογές φωνής. ΣΥΜΠΙΕΣΗ ΔΥΝΑΜΙΚΗΣ ΠΕΡΙΟΧΗΣ (NICAM) ΔΙΑΦΟΡΙΚΗ ΚΩΔΙΚΟΠΟΙΗΣΗ ADPCM DM, DPCM (CCITT, G.721) SB-ADPCM 2 BAND (CCITT, G.722) 4 (APT-X BAND 100) M (DTS) BAND ISO/MPEG-4 9
Τεχνικές Συμπίεσης στο Πεδίο της Συχνότητας Κωδικοποίηση συχνοτικού περιεχομένου σήματος. Μετασχηματισμός στο πεδίο της συχνότητας. Τράπεζα φίλτρων. Μαθηματικό μετασχηματισμό. Υβριδικό μετασχηματισμό. Εύκολη προσαρμογή στα υποκειμενικά χαρακτηριστικά της ακοής. Υψηλή ποιότητα και συμπίεση. Υψηλή πολυπλοκότητα και βαθμός επεξεργασίας. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ OCF ASPEC (AC-2, AC-3) ATRAC (MINIDISC) ISO/MPEG-4 ISO/MPEG-1 ΤΡΑΠΕΖΑΣ ΦΙΛΤΡΩΝ MASCAM MUSICAM PASC (DCC) ISO/MPEG-2 MPEG-2 LSF MPEG-2 BC MPEG-2 AAC 10
Τεχνικές Συμπίεσης στο Πεδίο της Συχνότητας Χρήση τράπεζας φίλτρων (filter bank). Διαίρεση του φάσματος σε δύο ή περισσότερες περιοχές. Διαδικασία στατικής ή δυναμικής ανάθεσης των bits ανά φασματική περιοχή. Sub-band ADPCM Κωδικοποίηση ακουστικού σήματος με εύρος ζώνης 7kHz. Παροχή δεδομένων 64kbps. Τράπεζα φίλτρων 11
Ηχητικό Σήμα Τεχνικές Υποκειμενικής Κωδικοποίησης Παλμοσειρά Εξόδου Μετασχηματισμός δειγμάτων εισόδου σε φασματικούς συντελεστές Κβαντισμός φασματικών συντελεστών με θόρυβο μικρότερο από το κατώφλι Τράπεζα Φίλτρων Κβαντιστής & Κωδικοποιητής Πολυπλέκτης Ψυχοακουστικό Μοντέλο Δημιουργία παλμοσειράς εξόδου από κωδικοποιημένους συντελεστές και πληροφορία πλευράς Υπολογισμός του κατωφλίου επικάλυψης των παραμορφώσεων 12
Το Ψυχοακουστικό Μοντέλο Ακοής Το ανθρώπινο αυτί λειτουργεί ως φασματικός αναλυτής Χρονο-συχνοτική ανάλυση στο έσω-αυτί. Μοντελοποίηση με παράλληλα ζωνοδιαβατά φίλτρα. Αύξηση του πλάτους των ζωνών της συχνότητας με τη συχνότητα. Φαινόμενο ακουστικής επικάλυψης Υπολογισμός κατωφλίου επικάλυψης. Μορφοποίηση του θορύβου κβαντισμού ώστε να είναι μικρότερος από το κατώφλι επικάλυψης. Κατάλληλη ανάθεση bits στις περιοχές συχνότητας που το σήμα είναι ακουστό. 13
Ευαισθησία Ακοής 14
Πλάτος (db) Το Ψυχοακουστικό Μοντέλο Ακοής (συν.) Φάσμα ισχύος σήματος Εκτίμηση κατωφλίου επικάλυψης Φασματικοί συντελεστές μετά την ανάθεση των bits Συχνότητα (Hz) 15
To Κατώφλι Ακουστικής Επικάλυψης 16
To Κατώφλι Ακουστικής Επικάλυψης (συν.) Masker sound Masked sound Κατώφλι Ακουστότητας Κατώφλι επικάλυψης 17
Μοντέλα Υπολογισμού Κατωφλίου Επικάλυψης Acoustic level (db) Κατώφλι ακουστικής επικάλυψης για ημιτονικό σήμα 1kHz μεταβλητού πλάτους 100 80 60 101dB 40 61dB 81dB 20μPa 20 0 Hearing threshold 41dB 100 1000 10000 Frequency (Hz) 18
Μοντέλα Υπολογισμού Κατωφλίου Επικάλυψης (συν.) Acoustic level (db) Κατώφλι ακουστικής επικάλυψης για ημιτονικό σήμα 50Hz μεταβλητού πλάτους 100 80 60 110dB 40 80dB 100dB 20 20μPa 0 Hearing threshold 100 1000 10000 Frequency (Hz) 19
Χρονική Επικάλυψη 20
Το Πρότυπο MPEG-1 Πρότυπο ISO/IEC11172-3 Χρονοσυχνοτική ανάλυση. Ψυχοακουστικό μοντέλο. Δυναμική ανάθεση bits. Αρχιτεκτονική 3 επιπέδων (Layer I, II και III). Αυξανόμενη πολυπλοκότητα. Καλύτερη ποιότητα και συμπίεση (4:1, 8:1, και 10:1 αντίστοιχα). Συχνότητες δειγματοληψίας 32, 44.1 και 48kHz. Μονοφωνικός, στερεοφωνικός και συνδυασμένα στερεοφωνικός ήχος. Ρυθμός δεδομένων 32-448kbps (Layer I) 32-384kbps (Layer II) 32-320kbps (Layer III) 21
Ηχητικό Σήμα PCM Ο Κωδικοποιητής MPEG-1 Layer I και II Πολυπλέκτης Κωδικοποιημένο Ηχητικό Σήμα Τράπεζα Φίλτρων 32 περιοχών 0 31 Γραμμικός Κβαντιστής 0 31 FFT Ψυχοακουστικό Μοντέλο Κωδικοποίηση Πληροφορίας Πλευράς 22
Σύγκριση Παραμέτρων Layer I και Layer II Parameter MPEG-1 Layer I MPEG-1 Layer II Μήκος πλαισίου (δείγματα) 384 1152 Περιοχές 32 32 Δείγματα ανά περιοχή 12 36 Αριθμός σημείων FFT 512 1024 Ανάθεση bits (bits) Πληροφορία επιλογής συντελεστών κλίμακας (bits) Συντελεστές κλίμακας (bits) Ομαδοποίηση δειγμάτων 4 ανά περιοχή 2 έως 4 ανάλογα την περιοχή - 2 ανά περιοχή 6 ανά περιοχή 6 ως 18 ανά περιοχή (επιλεγόμενο) - 3 ανά περιοχή 23
O MPEG-1 Layer III Κωδικοποιητής Χρήση μετασχηματισμού MDCT. Μεταβλητό παράθυρο ανάλυσης Αντιμετώπιση pre-echo φαινομένου. Μη ομοιόμορφος κβαντισμός. Εξελιγμένη τεχνική ανάθεσης bits Κωδικοποίηση εντροπίας (Huffman). 24
Παράδειγμα Υλοποίησης Τράπεζας Φίλτρων db Συχνότητα (Hz) 25
bits Παράδειγμα Ανάθεσης bits db bits Ρυθμός δεδομένων = 96kbps Ρυθμός δεδομένων = 128kbps Αριθμός περιοχών Λόγος σήματος προς κατώφλι επικάλυψης Αριθμός περιοχών 26
Άλλες Τεχνικές Υποκειμενικής Κωδικοποίησης Dolby AC-2 (1989) Εφαρμογές καλωδιακής τηλεόρασης. Ρυθμοί 128-192kbps (εύρος ζώνης 20kHz). Χαμηλή πολυπλοκότητα και καθυστέρηση (7-60msec). Dolby AC-3 Εφαρμογές: HDTV, DVD-Video. Υποστήριξη πολυκάναλου ήχου. Ρυθμοί 32-640kbps. DTS Εφαρμογές: DVD-Video. Πολυκάναλος Ήχος. Ρυθμός 600 1500kbps. 27
AC3 Decoder 28
Άλλες Τεχνικές Υποκειμενικής Κωδικοποίησης (συν.) MPEG-2 Εξέλιξη του MPEG-1 Υποστήριξη πολυκάναλου ήχου MPEG-2 Advanced Audio Coding (1997) MPEG-4 Κωδικοποίηση ενός καναλιού στα 64kbps Κωδικοποίηση 5.1 καναλιών στα 320kbps Πρότυπο συμπίεσης για πολυμεσικές εφαρμογές Υψηλό κέρδος συμπίεσης / καθολική προσπελασιμότητα Χρήση κωδικοποίησης MPEG-2 AAC για ηχητικά δεδομένα Windows Media Audio (WMA) RealAudio 29
Παραδείγματα Να υπολογιστεί το απαιτούμενο εύρος ζώνης για τη μετάδοση ηχητικού σήματος 5.1 πλήρους ευκρίνειας, πιστότητας CD. Ποιο είναι το αντίστοιχο τυπικό εύρος ζώνης για AC3 και DTS; Υπολογίστε το λόγο συμπίεσης μονοφωνικου ηχητικού σήματος CD-DA που εισάγεται σε κωδικοποιητή MP3 λαμβάνοντας υπόψη ότι το σήμα περνάει από φίλτρο 32 περιοχών, και ότι στις μεσαίες συχνότητες (8) γίνεται ανάθεση 2 bit ενώ στις χαμηλές και υψηλές 1 bit. 30
Σε αυτή την ενότητα μιλήσαμε για: 5.1 Ψηφιοποίηση και συμπίεση σημάτων ήχου 31
Ολοκλήρωση Μαθήματος Συγχαρητήρια!! Έχετε ολοκληρώσει με επιτυχία το μάθημα Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου Δρ. Νικόλαος Αλέξανδρος Τάτλας Τμήμα Ηλεκτρονικών Μηχανικών Τ.Ε ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα 32