ΜΟΥΣΙΚΗ ΚΑΙ ΥΠΟΛΟΓΙΣΤΕΣ



Σχετικά έγγραφα
Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

Πληροφορική Εφαρμογές Πολυμέσων

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ, 2007 ΘΡ. ΤΣΙΑΤΣΟΣ

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Αφήγηση Μαρτυρία. Μουσική. Ενίσχυση μηνύματος Μουσική επένδυση Ηχητικά εφέ

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Συµπίεση Ήχου µεβάσητην Αντίληψη: Τα πρότυπα συµπίεσης MPEG-1 layer I, layer II, layer III

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ψηφιακή Επεξεργασία Σηµμάτων

Συστήματα Πολυμέσων. Ενότητα 11: Χαρακτηριστικά Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Αλληλεπίδραση με εφαρμογές ήχου

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

Κεφάλαιο 4 Συμπίεση Ήχου

Περιεχόμενα. 4.1 Χαρακτηριστικά του ήχου Ψηφιοποίηση με μετασχηματισμό Ψηφιοποίηση με δειγματοληψία Πρόλογος...

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακός ήχος. Χαρακτηριστικά σήματος ήχου Ψηφιοποίηση ήχου Συνθετικοί ήχοι MIDI

Τηλεπικοινωνιακά Συστήματα Ι

ΨΗΦΙΟΓΡΑΦΙΚΕΣ ΕΙΚΟΝΕΣ

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τι είναι τα πολυμέσα;

SC Surround Sound Card (714DX 7.1 SOUND EXPERT)

ΠΑΡΑΓΩΓΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Πληροφορική Ι ΨΗΦΙΑΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ.

Μετάδοση σήματος PCM

Πολυμεσικές Εφαρμογές

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα

ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑΣ MIDI

Περιγραφή του βασικού παραθύρου του Cubase SE3. Εικόνα 1

Δέκτης AV Πολλαπλών Καναλιών. Ξεκινήστε εδώ Καλώς ορίσατε στον Οδηγό γρήγορης εγκατάστασης

15/3/2009. Ένα ψηφιακό σήμα είναι η κβαντισμένη εκδοχή ενός σήματος διάκριτου. χρόνου. Φλώρος Ανδρέας Επίκ. Καθηγητής

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Εισαγωγή. Τεχνολογία Πολυµέσων 01-1

Ραδιοτηλεοπτικά Συστήματα Ενότητα 3: Θεωρία Ψηφιοποίησης

Θέμα: «ΣΥΜΠΙΕΣΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΟΛΥΜΕΣΑ» Εισηγητής: Παναγιώτης Γιώτης 20 Μαϊου 2007 Αθήνα

Πολυκάναλος Δέκτης AV. Ξεκινήστε εδώ Καλώς ορίσατε στον Οδηγό γρήγορης εγκατάστασης

Μάθημα: Ακουστική και Ψυχοακουστική

2. ΨΗΦΙΟΠΟΙΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ

Ηχογραφώντας με το CUBASE

ΠΑΡΟΥΣΙΑΣΗ ΕΝΔΕΙΚΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΡΟΤΑΣΗ Νο3

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακό βίντεο. Αναλογικό βίντεο / ψηφιοποίηση Διεπαφές Εκτίμηση κίνησης μπλοκ

Διαδικασία Ψηφιοποίησης (1/2)

Τεχνολογία Πολυμέσων. Ενότητα # 14: Κωδικοποίηση βίντεο: Η.264 Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Εφαρµογές ήχου στα Πολυµέσα. Βιβλιογραφία. Ήχος και Πολυµέσα

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Ψηφιακή Επεξεργασία Σηµμάτων

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

sur so ro un un d d 5.1

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

Κωδικοποίηση βίντεο (MPEG)

Τηλεπικοινωνίες. Ενότητα 5: Ψηφιακή Μετάδοση Αναλογικών Σημάτων. Μιχάλας Άγγελος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Συστήματα Επικοινωνιών

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

ΠΑΡΟΥΣΙΑΣΗ ΕΝΔΕΙΚΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΡΟΤΑΣΗ Νο2

Εγχειρίδιο Ζωντανών Μεταδόσεων Εξελιγμένων Υπηρεσιών Βίντεο Πανελληνίου Σχολικού Δικτύου Εγχειρίδιο τεχνικού μετάδοσης

Επεξεργασία Χαρτογραφικής Εικόνας

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Τα ηλεκτρονικά σήματα πληροφορίας διακρίνονται ανάλογα με τη μορφή τους σε δύο κατηγορίες : Αναλογικά σήματα Ψηφιακά σήματα

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 2 : Ψηφιακή Αναπαράσταση Δεδομένων. Δρ.

Κωδικοποίηση βίντεο (H.261 / DVI)

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 4 ΠΑΛΜΟΚΩΔΙΚΗ ΔΙΑΜΟΡΦΩΣΗ - PCM (ΜΕΡΟΣ Α)

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 9 : Συμπίεση δεδομένων. Δρ. Γκόγκος Χρήστος

Εγχειρίδιο Ζωντανών Μεταδόσεων Υπηρεσιών Βίντεο. Πανεπιστημίου Κρήτης. Εγχειρίδιο τεχνικού μετάδοσης

ΠΕ 2.3 Εξελιγμένες υπηρεσίες Βίντεο ΠΣΔ

Συστήματα Επικοινωνιών ΙI

Τι συσχετίζεται με τον ήχο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Θέματα Συστημάτων Πολυμέσων. Ενότητα #3: Ιδιότητες μέσων Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Εύχρηστο σύστημα οικιακού κινηματογράφου DVD με δυνατότητα αναπαραγωγής μουσικής/βίντεο μέσω σύνδεσης USB

MPEG-4 : Διαδραστικές εφαρμογές πολυμέσων

Αντίστοιχα σημαντικό ήταν το Mp3, όσον αφορά την ταχύτητα των συνδέσεων στο Internet.

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

Ενότητα: Ασκήσεις Audio Editing

Συμπίεση Πολυμεσικών Δεδομένων

Εγχειρίδιο Ζωντανών Μεταδόσεων Εξελιγμένων Υπηρεσιών Βίντεο Πανελληνίου Σχολικού Δικτύου Εγχειρίδιο τεχνικού μετάδοσης

Συστήματα Επικοινωνιών ΙI

MPEG-4: Διαδραστικές εφαρμογές πολυμέσων

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ.

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

ΜΕΤΑΤΡΟΠΕΙΣ D/A & A/D

High Fidelity, Surround Sound, Home Cinema, 23/04/2012. Δημήτρης Σταματάκος

Εισαγωγή στις τεχνολογίες μετάδοσης

Κωδικοποίηση βίντεο (MPEG)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

ΒΑΣΙΚΑ ΘΕΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα).

Transcript:

ΗΧΟΣ ΚΑΙ ΕΦΑΡΜΟΓΕΣ Ήχος σε δεύτερο πλάνο σε εφαρμογές πολυμέσων (εστίαση σε βίντεο) Επικέντρωση σε ψυχαγωγικές ή εκπαιδευτικές εφαρμογές (π.χ. Information kiosks) Αφήγηση/σχολιασμός βοηθούν στη μετάδοση μηνύματος Γίνεται αντιληπτός χωρίς εστίαση προσοχής Εφαρμογές για μουσική ή για άτομα με προβλήματα όρασης Αναγνώριση και σύνθεση ομιλίας

ΜΟΥΣΙΚΗ ΚΑΙ ΥΠΟΛΟΓΙΣΤΕΣ Ήχος αποθηκεύεται ως ψηφιακό σήμα (συμπιεσμένο ή ασυμπίεστο) Αναλογία με διανυσματικά γραφικά: πρότυπο MIDI (Musical Instrument Digital Interface) Καθορίζει την κωδικοποίηση των τόνων και των οργάνων Δυνατότητα χρήσης 127 οργάνων και εφέ Καθορίζει πρότυπα επικοινωνίας οργάνων (π.χ. synthesizers) και υπολογιστή Συνήθως η σύνθεση ήχων γίνεται με FM σύνθεση (άλλοτε αποθηκεύονται δείγματα πραγματικών οργάνων σε ROM)

ΜΟΥΣΙΚΗ ΚΑΙ ΥΠΟΛΟΓΙΣΤΕΣ MIDI σε αναλογία με vector graphics: Μεγαλύτερη ευελιξία στην επεξεργασία Μικρότερος αποθηκευτικός χώρος Υπολογιστικό κόστος για μετατροπή σε ακουστό σήμα Αποτέλεσμα εξαρτάται από συσκευή εξόδου

ΓΕΝΙΚΑ ΓΙΑ ΤΟ MIDI Το MIDI εμφανίστηκε το 1983 (συνεργασία Roland, Yamaha, Korg κλπ.) Επιτρέπει αλληλεπίδραση και συγχρονισμό ηλεκτρονικών συσκευών (υπολογιστές, συνθετητές, ελεγκτές συστημάτων φωτισμού, πολυκαναλικά μαγνητόφωνα, VCR) Επιτρέπει έλεγχο όλων των συσκευών από μια (master control device) Αναλογία με σύνδεση υπολογιστών μέσω modem

Η ΜΕΘΟΔΟΣ ΤΟΥ MIDI To MIDI περιέχει πληροφορία για: Ποια νότα παίχτηκε (πλήκτρο πιέστηκε) Πότε παίχτηκε η νότα Πόσο κράτησε Με τι πίεση πατήθηκε Τι ένταση είχε η νότα Τι διαμόρφωση είχε η νότα Τι όργανο παίχτηκε Οι εντολές MIDI αποτελούνται από ένα σύνολο bytes (το πρώτο είναι το status)

GENERAL MIDI General MIDI: πρότυπο που υιοθετήθηκε σχετικά πρόσφατα από κατασκευαστές Πρόβλημα: ένα MIDI αρχείο ενός συνθέτη που μεταφέρεται σε άλλη συσκευή δεν αντιστοιχεί τα ίδια όργανα στο ίδιο patch (αριθμό οργάνου) Λύση: το General MIDI καθορίζει κανόνες αντιστοίχισης (π.χ. Patch 0=Grand Piano, Patch 40=Violin) Το ίδιο συμβαίνει πλέον με τις κάρτες ήχου

MIDI CHANNELS Channels (κανάλια): Το General MIDI καθορίζει 16 κανάλια Διαφορετικά όργανα αντιστοιχίζονται σε διαφορετικά κανάλια Η πολυφωνία (πόσες νότες μπορούν να ακούγονται ταυτόχρονα) ποικίλει σε κάρτες ήχου και συνθετητές

MIDI TRACKS Tracks: Το πλήθος των tracks εξαρτάται από το λογισμικό (συνήθως πάνω από 100) Κάθε track περιέχει ένα σύνολο από events Είναι δυνατόν δύο tracks με διαφορετικό περιεχόμενο να αντιστοιχηθούν στο ίδιο κανάλι (π.χ. αριστερό και δεξί χέρι στο πιάνο)

ΟΜΙΛΙΑ ΚΑΙ ΥΠΟΛΟΓΙΣΤΕΣ Ορισμένες εφαρμογές: ομιλία σημαντικότερη Λογισμικό, κάρτες: Apple, Microsoft, Creative Labs Microsoft Windows Sound System: κάρτα ήχου 16 bit, μικρόφωνο, ακουστικά, λογισμικό Λογισμικό για αναγνώριση και σύνθεση φωνής, εισαγωγή ηχητικών αντικειμένων σε εφαρμογές IBM Personal Dictation System (OS/2): 70-100 λέξεις/λεπτό (χειρισμός συστήματος) Αναγνώριση ομιλίας: 30000 λέξεις σε εκπαιδευμένο σύστημα, 400 λέξεις (συνεχής λόγος, άγνωστος ομιλητής)

ΣΥΜΠΙΕΣΗ ΗΧΟΥ Ήχος δυσκολότερος από εικόνα: ακοή πιο ευαίσθητη Ανάπτυξη πολλών τεχνικών (ενδιαφέρον για τηλεφωνία) Στη μουσική πιο δύσκολα (μεγάλο εύρος ζώνης) Επιλογή κατάλληλης συχνότητας δειγματοληψίας και μήκους λέξης Περαιτέρω συμπίεση με αφαίρεση τμημάτων σιωπής Χρήση μη-γραμμικής PCM (λογαριθμική ή μ-law, διαφορική PCM, προσαρμοστική διαφορική PCM)

ΣΥΜΠΙΕΣΗ ΗΧΟΥ Συχνότητα Δειγματοληψίας (khz) Κβαντοποίηση (bits) Τεχνική Κωδικοποίησης Ποιότητα 44.1 16 PCM Hi-Fi 37.8 8 ADPCM 18.9 8 ADPCM FM μετάδοση (μουσική) ΑΜ μετάδοση (ομιλία) 8 8 PCM Τηλεφωνική

ΟΠΤΙΚΟΑΚΟΥΣΤΙΚΗ ΤΗΛΕΦΩΝΙΑ Οικογένεια προτύπων Η.320 (ITU-TS) για teleconferencing και videophony Υποστηρίζει τηλεπικοινωνιακά δίκτυα αλλά και υπολογιστών Περιλαμβάνει πρότυπα ITU-G για συμπίεση ήχου Πρότυπο Περιγραφή G.711 PCM συχνοτήτων φωνής G.722 ADPCM με συχνότητα 7kHz και απαιτούμενο εύρος ζώνης 64Kbits/s G.728 CELP κωδικοποίηση που απαιτεί 16Kbits/s

MP3 - ΙΣΤΟΡΙΑ 1987, Fraunhofer Institut και Erlangen University: project σε perceptual audio coding Προέκυψε το ISO-MPEG Audio Layer-3 Χωρίς μείωση δεδομένων, ένα sec μουσικής stereo σε ποιότητα CD απαιτεί 1.4 Mbit MPEG κωδικοποίηση: συμπίεση με παράγοντα 12 χωρίς απώλειες ποιότητας Παράγοντας 24 διατηρεί ικανοποιητική ποιότητα Perceptual coding: αντίληψη των ηχητικών κυμάτων από το ανθρώπινο αυτί

MP3 - ΙΣΤΟΡΙΑ 1:4 1:6 1:8 1:10 1:12 με Layer 1 (αντιστοιχεί σε 384 kbps για ένα στερεοφωνικό σήμα) με Layer 2 (αντιστοιχεί σε 256 192 kbps για ένα στερεοφωνικό σήμα) με Layer 3 (αντιστοιχεί σε 128 112 kbps για ένα στερεοφωνικό σήμα)

MP3 - ΙΣΤΟΡΙΑ Εκμετάλλευση εφέ στερεοφωνίας και περιορισμός ηχητικού εύρους ζώνης MPEG Layer-3 είναι το πιο ισχυρό Για δοσμένο επίπεδο ποιότητας ήχου απαιτεί το χαμηλότερο ρυθμό μετάδοσης, ή για δοσμένο ρυθμό μετάδοσης πετυχαίνει την καλύτερη ποιότητα ήχου

MP3 ΠΟΙΟΤΗΤΑ ΗΧΟΥ Ποιότητα ήχου Εύρος ζώνης Τρόπος Λειτουργίας Ρυθμός μετάδοσης Αναλογία μείωσης Ήχος Τηλεφώνου Καλύτερα από βραχέα Καλύτερα από ραδιόφωνο ΑΜ Παρόμοια με ραδιόφωνο FM 2.5 khz mono 8 kbps 96:1 4.5 khz mono 16 kbps 48:1 7.5 khz mono 32 kbps 24:1 11 khz stereo 56 64 kbps 26 24:1 Σχεδόν-CD 15 khz stereo 96 kbps 16:1 CD >15 khz stereo 112 128 kbps 14 12:1

MP3 - ΠΟΙΟΤΗΤΑ ΗΧΟΥ Σε όλα τα διεθνή τεστ ακρόασης, το MP3 έδειξε ανώτερη απόδοση Διατηρεί την αρχική ποιότητα ήχου με μείωση δεδομένων 1:12 (περίπου 64 kbps ανά κανάλι ήχου) Αν εύρος ζώνης εφαρμογής 10 khz ικανοποιητική ποιότητα με 1:24 μείωση ITU-R συνιστά MP3 για εφαρμογές ευρείας μετάδοσης στα 60 kbit/s ανά κανάλι

MP3 SURROUND Το νέο format MP3 Surround προσφέρει πολυκαναλικό ήχο (MPEG-2) Είναι πλήρως συμβατό προς τα πίσω με το stereo MP3 Υποστηρίζει κάθε διάταξη surround (όπως το 5.1 surround) Ο ρυθμός δεδομένων που απαιτεί συγκρίνεται με του stereo MP3 Χρήσεις: ραδιοφωνικοί σταθμοί στο internet, music download shops

MP3 - ΛΕΠΤΟΜΕΡΕΙΕΣ Filter Bank (συστοιχία φίλτρων): υβριδική (πολυφασική συστοιχία φίλτρων και MDCT) Perceptual Model (μοντέλο αντίληψης): βασικά καθορίζει ποιότητα υλοποίησης κωδικοποιητή Χρησιμοποιεί χωριστή συστοιχία φίλτρων ή Συνδυάζει υπολογισμό τιμών ενέργειας με την κυρίως συστοιχία

MP3 - ΛΕΠΤΟΜΕΡΕΙΕΣ Joint Stereo (ενιαία στερεοφωνία): Εκμεταλλεύεται γεγονός ότι στέρεο κανάλια έχουν κατά πολύ την ίδια πληροφορία Μειώνεται το bitrate βάσει των πλεονασμών και ελλείψεων σχέσης των καναλιών Χρησιμοποιείται όπου διατίθεται χαμηλό bitrate αλλά απαιτείται στερεοφωνικό σήμα

MP3 - ΛΕΠΤΟΜΕΡΕΙΕΣ Κβαντισμός και κωδικοποίηση: Κβαντισμός με κβαντιστή νόμου ισχύος (μεγάλες τιμές κωδικοποιούνται με μικρότερη ακρίβεια) Κωδικοποίηση κβαντισμένων τιμών κατά Huffman (lossless, noiseless) Διαδικασία εύρεσης μέγιστης ενίσχυσης και παράγοντα κλίμακας για δοσμένο μπλοκ, bitrate και έξοδο perceptual model: με δύο εμφωλιασμένους βρόχους επαναλήψεων

MP3 - ΛΕΠΤΟΜΕΡΕΙΕΣ Εσωτερικός βρόχος (βρόχος ρυθμού): Τα codebooks του Huffman αναθέτουν μικρότερους κωδικούς σε συχνότερες τιμές Αν πλήθος bits μετά από coding > πλήθος bits για coding ενός μπλοκ ρύθμιση ολικού κέρδους Μεγαλώνω το βήμα κβαντισμού (άρα μικρότερες κβαντισμένες τιμές) Επαναλαμβάνω μέχρι η απαίτηση bits για Huffman να είναι αρκετά μικρή

MP3 - ΛΕΠΤΟΜΕΡΕΙΕΣ Εξωτερικός βρόχος (βρόχος ελέγχου θορύβου/παραμόρφωσης): Παράγοντες κλίμακας εφαρμόζονται σε κάθε μπάντα παραγόντων κλίμακας Αν ο θόρυβος κβαντισμού υπερβαίνει κατώφλι συγκάλυψης (επιτρεπόμενο θόρυβο) ρυθμίζω scalefactor Για κάθε νέο scalefactor τρέχει το εσωτερικό loop (γιατί για μικρότερο θόρυβο θέλω περισσότερα βήματα κβαντισμού μεγαλύτερο bitrate) Επαναλαμβάνω μέχρι ο τρέχων θόρυβος να είναι κάτω από το κατώφλι για κάθε μπάντα

MP3 - ΛΕΠΤΟΜΕΡΕΙΕΣ Επέκταση Surround: Πολλά κανάλια ήχου στην είσοδο συνδυάζονται σε ένα στερεοφωνικό σήμα εξόδου με μια διαδικασία μίξης Παράλληλα, εξέχοντα διακαναλικά cues εξάγονται από κανάλια εισόδου και κωδικοποιούνται συμπαγώς ως παράπλευρη πληροφορία surround Το ολικό σήμα είναι ένα stereo MP3 που κωδικοποιείται και μεταδίδεται μαζί με την παράπλευρη πληροφορία στο δέκτη

MP3 - ΛΕΠΤΟΜΕΡΕΙΕΣ Επέκταση Surround (συνέχεια): Στο δέκτη αποκωδικοποιούνται τα MP3 δεδομένα Δημιουργείται ένα πολυκαναλικό σήμα εξόδου από το ολικό σήμα και τα cues ανασυνθέτοντας τα κανάλια του Τα διακαναλικά cues είναι η διακαναλική διαφορά χρόνου, η διακαναλική διαφορά επιπέδου, η διακαναλική συνέπεια κλπ.

AC3 (Audio Code 3) Αναπτύχθηκε στα εργαστήρια της Dolby Χρησιμοποιείται στην κινηματογραφική βιομηχανία Υιοθετήθηκε και στα DVD και στην HDTV στην Αμερική (η Ευρώπη υιοθέτησε το MPEG-2) Συμπυκνώνει 6 κανάλια σε χώρο λιγότερο από ένα μόνο κανάλι σε CD Δημιουργείται αληθινή αίσθηση χώρου

AC3 (Audio Code 3) 6 κανάλια: δεξί, αριστερό, κεντρικό, δύο surround και ένα για χαμηλές συχνότητες (low frequency effects channel) Χρήση subwoofer για καλύτερη ακρόαση του τελευταίου καναλιού 5 κανάλια πλήρους εύρους (3Hz-20KHz) Έκτο κανάλι συχνότητες 3Hz-120Hz Υποστηρίζονται sampling rates 32, 44.1, 48 KHz

AC3 (Audio Code 3) Επιτρέπεται επικάλυψη ήχου σε κανάλι με θόρυβο, από ήχο άλλου καναλιού Ρυθμοί δεδομένων: 32-640 kbps/channel Χρησιμοποιείται από το Real Audio (Real Media)

AAC (Advanced Audio Codec) Δίνει υψηλής ποιότητας ήχο στα 64 kbps ανά κανάλι Κωδικοποιεί έως και 48 κανάλια ήχου και έως 16 κανάλια χαμηλών συχνοτήτων Υποστηρίζει πολλές γλώσσες παράλληλα Υποστηρίζει φωνή πάνω από προγράμματα ήχου Έχει τρεις τρόπους λειτουργίας: κύρια, χαμηλής πολυπλοκότητας και κλιμακούμενης συχνότητας δειγματοληψίας

AAC (Advanced Audio Codec) Κύρια: σε εφαρμογές χωρίς περιορισμούς σε υπολογιστική ισχύ και μνήμη Χαμηλής πολυπλοκότητας: εφαρμογές όπου υπάρχουν περιορισμοί ισχύος και μνήμης Κλιμακούμενης συχνότητας δειγματοληψίας: για εφαρμογές με ελάχιστες απαιτήσεις σε ισχύ και μνήμη Δίνει καλύτερη ποιότητα ήχου από κάθε άλλο coding με το μισό μόλις bitrate Είναι κομμάτι του MPEG-4