ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ, 2007 ΘΡ. ΤΣΙΑΤΣΟΣ



Σχετικά έγγραφα
Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 11: Χαρακτηριστικά Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Αφήγηση Μαρτυρία. Μουσική. Ενίσχυση μηνύματος Μουσική επένδυση Ηχητικά εφέ

Συµπίεση Ήχου µεβάσητην Αντίληψη: Τα πρότυπα συµπίεσης MPEG-1 layer I, layer II, layer III

Πολυμεσικές Εφαρμογές

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

ΜΟΥΣΙΚΗ ΚΑΙ ΥΠΟΛΟΓΙΣΤΕΣ

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

Αλληλεπίδραση με εφαρμογές ήχου

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Πληροφορική Εφαρμογές Πολυμέσων

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΨΗΦΙΟΓΡΑΦΙΚΕΣ ΕΙΚΟΝΕΣ

ΠΑΡΑΓΩΓΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

Τι είναι τα πολυμέσα;

Περιεχόμενα. 4.1 Χαρακτηριστικά του ήχου Ψηφιοποίηση με μετασχηματισμό Ψηφιοποίηση με δειγματοληψία Πρόλογος...

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Ήχος: Εισαγωγή, Βασικές τεχνικές συµπίεσης ήχου (PCM, ADPCM)

Αντίστοιχα σημαντικό ήταν το Mp3, όσον αφορά την ταχύτητα των συνδέσεων στο Internet.

Ψηφιακή Επεξεργασία Σηµμάτων

Τι συσχετίζεται με τον ήχο

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

Τηλεπικοινωνιακά Συστήματα Ι

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακός ήχος. Χαρακτηριστικά σήματος ήχου Ψηφιοποίηση ήχου Συνθετικοί ήχοι MIDI

Κωδικοποίηση βίντεο (H.261 / DVI)

SC Surround Sound Card (714DX 7.1 SOUND EXPERT)

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ψηφιακή Επεξεργασία Σηµμάτων

Επεξεργασία Χαρτογραφικής Εικόνας

Υλοποίηση σταδίων κωδικοποίησης ηχητικών σημάτων στο προγραμματιστικό περιβάλλον Matlab

Τηλεπικοινωνίες. Ενότητα 5: Ψηφιακή Μετάδοση Αναλογικών Σημάτων. Μιχάλας Άγγελος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Μάθημα: Ακουστική και Ψυχοακουστική

Ψηφιακός ήχος και κινούμενα γραφικά

Διαδικασία Ψηφιοποίησης (1/2)

Κεφάλαιο 4 Συμπίεση Ήχου

Συστήματα Επικοινωνιών

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Matlab. 1. Δημήτρης Πέρρος ΑΜ: Alexey Bukreyev ΑΜ:0910. Επιβλέπων καθηγητής: Μιχαήλ Παρασκευάς. Εκπονήθηκε από τους:

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

2. ΨΗΦΙΟΠΟΙΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

ΚΕΦΑΛΑΙΟ 5. Audacity

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα).

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

Βασικές έννοιες. Αναλογικό Βίντεο. Ψηφιακό Βίντεο. Κινούμενα γραφικά (animation)( Πλαίσιο (frame, καρέ) Ρυθμός πλαισίων (frame rate)

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 8: MPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Γιατί Συµπίεση; Βιβλιογραφία

Τεχνολογία Πολυμέσων. Ενότητα 3: Ψηφιοποίηση της Πληροφορίας. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Εφαρµογές ήχου στα Πολυµέσα. Βιβλιογραφία. Ήχος και Πολυµέσα

Εισαγωγή. Τεχνολογία Πολυµέσων 01-1

Τι συσχετίζεται με τον ήχο

Ραδιοτηλεοπτικά Συστήματα Ενότητα 4: Ψηφιοποίηση και συμπίεση σημάτων εικόνας

ΨΗΦΙΑΚΗΕΠΕΞΕΡΓΑΣΙΑVIDEO ΣΠΟΥ ΑΣΤΗΣ: ΠΑΣΜΑΤΖΙ ΗΣ ΙΩΑΝΝΗΣ

Ραδιοτηλεοπτικά Συστήματα Ενότητα 3: Θεωρία Ψηφιοποίησης

Θέμα: «ΣΥΜΠΙΕΣΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΟΛΥΜΕΣΑ» Εισηγητής: Παναγιώτης Γιώτης 20 Μαϊου 2007 Αθήνα

Φυσική για Μηχανικούς

ΒΑΣΙΚΑ ΘΕΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Κωδικοποίηση βίντεο (MPEG)

Ψηφιακή Επεξεργασία Σηµμάτων

Ψηφιακή Επεξεργασία Εικόνας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Θέματα Συστημάτων Πολυμέσων. Ενότητα #3: Ιδιότητες μέσων Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Συστήματα Επικοινωνιών

Φυσική για Μηχανικούς

Πανεπιστήµιο Πάτρας. Πρόγραµµα Μεταπτυχιακών Σπουδών ΗΧΟΣ ΣΤΑ ΠΟΛΥΜΕΣΑ. ηµήτρης Καλαµαράς Α.Μ

Από τις τριγωνομετρικές συναρτήσεις στο Mp3

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Φυσική για Μηχανικούς

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Κατηγορίες τεχνικών συµπίεσης. Τεχνικές Συµπίεσης

Αρώνη Ιωάννα (Α.Μ. 655) κ. Παπαδάκης Νικόλαος

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

Β τάξη. ΕΝΟΤΗΤΑ 1 Κεφάλαιο 2: Το εσωτερικό του Υπολογιστή. Εικόνα 2.1: Η Κεντρική Μονάδα.

Ο Ήχος. Υπεύθυνος Καθηγητής: Παζούλης Παναγιώτης

Συστήµατα και Αλγόριθµοι Πολυµέσων

Συστήµατα και Αλγόριθµοι Πολυµέσων

Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Πληροφορική Ι ΨΗΦΙΑΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ.

ΚΩ ΙΚΟΠΟΙΗΣΗ ΟΜΙΛΙΑΣ. Μικρότερος ρυθµός µετάδοσης Μεγαλύτερη χωρητικότητα. Νοε-06 Γ.Ι.Στεφάνου 1

Φυσική για Μηχανικούς

Ηχογραφώντας με το CUBASE

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18

Συστήµατα και Αλγόριθµοι Πολυµέσων

Πληροφορική Εφαρμογές Πολυμέσων

Συστήματα Επικοινωνιών ΙI

ΜΕΤΑΤΡΟΠΕΙΣ D/A & A/D

Εισαγωγή στις Τηλεπικοινωνίες / Εργαστήριο

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Transcript:

Ψηφιακός Ήχος

Ενότητες Η φυσική του ήχου Ψηφιοποίηση & κωδικοποίηση ψηφιακού ήχου Αρχή ηχητικής σκίασης Απωλεστική συµπίεση ψηφιακού ήχου & το πρότυπο mp3 Ιστορικά στοιχεία για το mp3 & άλλα πρότυπα Ήχος midi & υποσύστηµα ήχου

Η Φυσική Του Ήχου Ήχος όνηση των µορίων ενός µέσου ιάδοση ακουστικού κύµατος στο µέσο όπου συµβαίνει η δόνηση. Μεταβολές πίεσης (πυκνώµατα και αραιώµατα) που µεταδίδονται µε µια ορισµένη ταχύτητα Συχνότητα (pitch) ονήσεις (κύκλοι)/sec [Hz] Ανθρώπινη ακοή 20 20000 Hz Ένταση Ισχύς της δόνησης Καθορίζεται από το πλάτος της δόνησης

Ευαισθησία της ανθρώπινης ακοής Ακουστ(ικ)ότητα Audibility Μεγαλύτερη ευαισθησία στην περιοχή 1-4 khz

«Λογαριθµική» Ακοή Η ανθρώπινη ακοή είναι «λογαριθµική» & όχι γραµµική Ηυποκειµενική αίσθηση µεταξύ των εντάσεων δύο ήχων δεν εξαρτάται από την απόλυτη τιµή της διαφοράς τους αλλά από το λόγο τους Πχ. αύξηση της έντασης από 2 4 µwatt/m 2 είναι το ίδιο µε την αύξηση από 5 10 µwatt/m 2

Μονάδα decibel (db) Σχετική διαφορά ισχύος δύο ήχων = 10 log (P/ P o ) σε db P ητιµή ισχύος του ήχου P o τιµή αναφοράς (ήχος αναφοράς) Το decibel είναι «σχετική» µονάδα συγκρίνει το µετρούµενο µέγεθος (Ρ) µε µία στάθµη αναφοράς(p o ) Ίδια ισχύς P= P o ιαφορά = 0 db ιπλασιασµός της ισχύος P=2 P o σηµαίνει αύξηση κατά 3 db

ιαφορά κατά 3 db ιαφορά κατά 1db

Ψηφιοποίηση Του Ήχου ειγµατοληψία Κβαντοποίηση Κωδικοποίηση

Μέγεθος αρχείου Μέγεθος Αρχείου (bits)= Συχνότητα ειγµατοληψίας (Hz) x Μέγεθος δείγµατος (bits) x ιάρκεια (sec) Μέγεθος Αρχείου = [44.100 (Hz) x 16 (bits) x 1 (sec)] = 88.200 byte για µονοφωνικό Ή το διπλάσιο 176.4ΚΒ για στερεοφωνικό

Μέθοδοι Κωδικοποίησης PCM µ-law & A-Law PCM DPCM ADPCM

PCM (Pulse Code Modulation - παλµοκωδική διαµόρφωση) Αποθηκεύει ένα προς ένα τα δείγµατα σε ψηφιακή µορφή Γραµµική (οµοιόµορφη) κωδικοποίηση το πλήθος των σταθµών κβάντωσης κατανέµεται εξίσου σε όλο το εύρος του πεδίου τιµών του σήµατος εν περιλαµβάνει συµπίεση 4-bit κωδικοποίηση ηµιτονοειδούς σήµατος

DPCM (Differential Pulse Code Modulation διαφορική παλµοκωδική κωδικοποίηση) Κωδικοποιεί τη διαφορά µεταξύ της πραγµατικής τιµής του δείγµατος και της προβλεπόµενης τιµής του δείγµατος (predicted value) Η πρόβλεψη βασίζεται στις τιµές των προηγούµενων δειγµάτων ΗβασικήιδέατηςDPCM (κωδικοποίηση της διαφοράς) είναι εφαρµόσιµη γιατί τα περισσότερα ηχητικά σήµατα παρουσιάζουν σηµαντικό βαθµό συσχέτισης (correlation) µεταξύ διαδοχικών δειγµάτων Η DPCM εκµεταλλεύεται τον πλεονασµό στις τιµές των δειγµάτων και κωδικοποιεί µε µικρότερο bit rate (4 bit / sample).

µu-law PCM και Α-Law PCM Λογαριθµική αντιστοίχιση Αντιστοιχεί περισσότερες στάθµες κβάντωσης στις χαµηλές συχνότητες και λιγότερες στις υψηλές. Στις χαµηλές συχνότητες περιέχεται το µεγαλύτερο ποσοστό της πληροφορίας που γίνεται αντιληπτή από το ανθρώπινο αυτί. Με λογαριθµική κωδικοποίηση µu-law 8-bit κωδικοποιείται το ίδιο δυναµικό εύρος ήχου όπως µε 14-bit γραµµική PCM

Η αρχή της ηχητικής σκίασης

Συµπίεση πληροφορίας ψηφιακού ήχου Κατά τη συµπίεση του ήχου χρησιµοποιούνται πολύπλοκοι αλγόριθµοι συµπίεσης που συνδυάζουν τόσο απωλεστικές όσο και µη απωλεστικές τεχνικές συµπίεσης Στις σύγχρονες µεθόδους συµπίεσης εφαρµόζονται διάφορα ψυχο-ακουστικά µοντέλα βάσει των οποίων απορρίπτονται οι συχνότητες που έτσι και αλλιώς δεν µπορούσαν να γίνουν αντιληπτές από το ανθρώπινο αυτί.

Ηχητική Σκίαση (auditory masking) Συχνότητες χαµηλής έντασης κοντά σε µία συχνότητα υψηλής έντασης (κυρίαρχη) δεν ακούγονται Το κατώφλι ακουστότητας µιας συχνότητας ποικίλει ανάλογα µε τη συχνότητα και τον ακροατή

Ηχητική Σκίαση συχνοτήτων Ισχυρή συχνότητα 1000 Hz Ασθενής συχνότητα (-10 db) 1100 Hz εν γίνεται αντιληπτή παρά µόνον αν η συχνότητα αυξηθεί σηµαντικά πχ. 4000 Hz

Ηχητικήσκίασηστοχρόνο(temporal masking) Ταυτόχρονη αναπαραγωγή ισχυρής και ασθενούς συχνότητας ηασθενήςδεν γίνεται αντιληπτή Ηασθενήςµπορεί να γίνει αντιληπτή αν «καθυστερήσει» σε σχέση µε τηνισχυρή Για καθαρούς τόνους (συχνότητες) η χρονική διάρκεια τηςδιαφοράςαναπαραγωγήςείναι~ 5 msec

Απωλεστική Συµπίεση Ήχου & Συµπίεση κατά mp3

MPEG MPEG (Motion Picture Expert Group) / 1987 Οικογένεια συµπιεστών (Codecs) Ανάπτυξη: Συνεργασία πανεπιστηµίων, ερευνητικών ινστιτούτων και εταιρειών Υπό την αιγίδα του ιεθνούς Οργανισµού Προτύπων (International Standards Organization (ISO)) Αναπτύσσει διεθνή πρότυπα για τη συµπίεση εικόνας, ήχου και βίντεο.

Βασική δοµή ενός ηχητικού κωδικοποιητή

Mp3 Τα βήµατα 1) Τράπεζα Φίλτρων 2) Εφαρµογή MDCT (Modified DCT) 3) Εφαρµογή Ψυχοακουστικού Μοντέλου 4) Επιµερισµός διαθέσιµων bits (ανάλογα µε το bit rate) 5) Εφαρµογή κωδικοποίησης εντροπίας

(1) Τράπεζα φίλτρων Το ακουστικό σήµα διαιρείται σε 32 ζώνες συχνοτήτων ίσου µεγέθους Το ανθρώπινο αυτί έχει περιορισµένη διακριτική ικανότητα Μέσα σε µια περιορισµένη κριτική περιοχή εύρους ζώνης συγχέει τις συχνότητες που ακούει Οι κριτικές περιοχές αντιστοιχούνται σε 32 ζώνες

(2) Εφαρµογή MDCT MDCT = Modified Discrete Cosine Transform Υποδιαιρείται επιπλέον το φάσµα συχνοτήτων µε στόχο την καλύτερη διακριτικότητα Χρησιµοποιούνται 18 συντελεστές MDCT Τελικά δηµιουργούνται συνολικά 32 Χ 18 = 576 ζώνες στο φάσµα συχνοτήτων

(3) Εφαρµογή Ψυχοακουστικού Μοντέλου Εφαρµόζεται το ψυχοακουστικό µοντέλο ηχητικής σκίασης σε καθεµιά από τις ζώνες ηλ. υπολογίζεται το κατώφλι ακουστότητας σε κάθε ζώνη για κάθε δεδοµένη στιγµή (frame) Υπολογίζεται έτσι ποιες συχνότητες µπορούν να γίνουν αντιληπτές

(4) Επιµερισµός διαθέσιµων bit Καθορίζεται το πλήθος των bits που θα διατεθεί σε κάθε ζώνη (µε βάση το ψυχοακουστικό µοντέλο)

(5) Κβάντωση & Κωδικοποίηση Κβάντωση & Κωδικοποίηση εδοµένων Προσθήκη συνοδευτικών δεδοµένων Κωδικοποίηση κατά Huffman

MPEG-1 Layer 3 Ρυθµός Μετάδοσης Το µέγεθος και η ποιότητα των αρχείων ήχου καθορίζονται από τον ρυθµό µετάδοσης των δεδοµένων (bit rate). Το πρότυπο MP3 υποστηρίζει αρκετούς προκαθορισµένους ρυθµούς µετάδοσης δεδοµένων. Τα αρχεία µε µεγαλύτερο bit rate θα ακούγονται καλύτερα από αυτά µε µικρότερο bit rate.

Συµπίεση MPEG-1 Layer 3 Ρυθµός Μετάδοσης bandwidth mode Bit rate Λόγος Συμπίεσης Ποιότητα 2.5 khz Mono 8 kbps 96:1 Ήχος τηλεφώνου 4.5 khz Mono 16 kbps 48:1 Βραχέα 11 khz Stereo 56..64 kbps 26.. 24:1 FM 15 khz Stereo 96 kbps 16:1 Σχεδόν σαν CD >15 khz Stereo 112..128 kbps 14..12:1 CD

Χαρακτηριστικά του MPEG-1 Layer 3 Συµπίεση αρχείων ήχου µπορείναφτάσεικαιτο85% Με ρυθµό µετάδοσης (bit rate) άνω των 128 Kbps η διαφορά από το πρωτότυπο CD δεν γίνεται αντιληπτή. Το αποτέλεσµα είναιναέχουµε µουσικά αρχεία 4-6 λεπτών που κανονικά θα καταλάµβαναν χώρο 40-70 MB, να πιάνουν τώρα χώρο µόλις 3-7MB.

Ιστορικά Στοιχεία

MPEG Motion Picture Expert Group Προσπάθεια συµπίεσης ψηφιακού ήχου: 1987, Ινστιτούτο Fraunhoffer MPEG-1, MPEG-1 Audio Επίπεδα συµπίεσης: MPEG-1 Layer 1, 2, 3

Επίπεδα συµπίεσης στο MPEG-1 MPEG-1 Layer 1 Κασέτα DCC της Philips Συµπίεση 4:1 Ποιότητα µέτρια Ρυθµός µετάδοσης 384 Kbps/κανάλι MPEG-1 Layer 2 Ψηφιακό ραδιόφωνο DAB, VideoCD & DVD Συµπίεση 6:1 & 8:1 Ποιότητα εφάµιλλη του CD Ρυθµός µετάδοσης βελτιστοποιηµένος στην περιοχή 192..256 Kbps/κανάλι MPEG-1 Layer 3 (mp3) Αρχεία mp3 στο διαδίκτυο Συµπίεση 10:1 & 12:1 Ποιότητα εφάµιλλη του CD Ρυθµός µετάδοσης 112..128 Kbps για στερεοφωνικό ήχο (64 kbps/κανάλι)

Άλλα πρότυπα

Άλλα πρότυπα (1/3) WAVE (*.wav) Αποτελεί το πρότυπο αποθήκευσης ψηφιακού ήχου και είναι υποσύνολο του πρότυπου RIFF. Εφαρµόζουν κωδικοποίηση PCM format ηλ. είναι ασυµπίεστα και µεγάλου µεγέθους AIFF (*.aif) ηµιουργήθηκε από την Apple αλλά χρησιµοποιείται σε όλες τις πλατφόρµες. Υποστηρίζει δειγµατοληψία 32 bit.

Άλλα πρότυπα (2/3) WMA Windows Media Audio Αναπτύχθηκε από την Microsoft µε στόχο την υποστήριξη απωλεστικής συµπίεσης και ως «απάντηση» στο mp3 & mp3 pro Προσφέρει ίδια ποιότητα στο µισό µέγεθος των αρχείων και σε χαµηλότερα bit rates (πχ. στα 64 Kbps) MP3 Pro Συνδυάζει ένα mp3 αρχείο χαµηλού bitrate και τεχνικές υψηλής συµπίεσης στις υψηλότερες συχνότητες Προσφέρει εξαιρετική ποιότητα στις χαµηλές (bass) και µεσαίες συχνότητες (treble).

Άλλα πρότυπα (3/3) OGG Vorbis Ποιότητα συγκρίσιµη µε τοmp3 Ελεύθερος codec Ενσωµάτωση σε πληθώρα συσκευών (από φορητές συσκευές µέχρι συστήµατα Linux) RealAudio Προορίζεται για την άµεση αναπαραγωγή ήχων µέσω του ιαδικτύου.

Ήχος Midi Musical Instrument Digital Interface Αποθηκεύει τέσσερις παραµέτρουςγιακάθενόταπου παίζεται: Θεµελιώδης συχνότητα (ποια νότα είναι), Αρµονικές (ποιο όργανο, ηχόχρωµα), υναµική (πόσο δυνατά παίζεται η νότα ) ιάρκεια (χρόνος)

Υλικό Κάρτα ήχου. Η εταιρεία Ad Lib κατασκεύασε την πρώτη κάρτα ήχου, για προσωπικούς υπολογιστές περίπου στις αρχές της δεκαετίας του 90. Μερικά χρόνια αργότερα εµφανίσθηκε και η πρώτη SoundBlaster της Creative µε δυνατότητα ηχογράφησης.

Υλικό Κάρτα ήχου DSP (Digital Signal Processor) ADC / DAC µετατροπείς Synthesizer Wavetable ROM Μνήµη RAM Έξοδος ηχείων Είσοδος µικροφώνου MIDI interface Στερεοφωνικός ήχος, (16bit/ 44,1 khz ή ακόµη και 24/96) Πολυκάναλος ήχος «Τρισδιάστατος» ήχος, πχ. 5.1

Λογισµικό Προγράµµατα επεξεργασίας ψηφιοποιηµένου ήχου Sound Forge της Sonic, SoundEdit της Macromedia, WaveStudio της Creative, Cool Edit της Syntrillium Προγράµµατα επεξεργασίας ήχων MIDI Cakewalk Cubase Audio της Steinberg, MidiSoft Studio, Master Tracks της Passport Design

Ήχος και Εφαρµογές Πολυµέσων Ήχοι περιεχοµένου οι αφηγήσεις κειμένου, οι εκφωνήσεις οδηγιών, τα ηχητικά ντοκουμέντα η μουσική όταν αποτελεί μέρος του αντικειμένου παρουσίασης. Ήχοι περιβάλλοντος Τα διάφορα ηχητικά εφέ (ήχοι της φύσης, φωνές ζώων, ήχοι πόλης) η µουσική επένδυση

Ενότητες Η φυσική του ήχου Ψηφιοποίηση & κωδικοποίηση ψηφιακού ήχου Αρχή ηχητικής σκίασης Απωλεστική συµπίεση ψηφιακού ήχου & το πρότυπο mp3 Ιστορικά στοιχεία για το mp3 & άλλα πρότυπα Ήχος midi & υποσύστηµα ήχου