Μετάδoση περιφερικού ήχου μέσω πρωτοκόλου mp3

Σχετικά έγγραφα
Σημειώσεις κεφαλαίου 16 Αρχές επικοινωνίας με ήχο και εικόνα

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

ΕΝΟΤΗΤΑ ΡΑΔΙΟΦΩΝΙΑ

Ψηφιακή Επεξεργασία Σηµμάτων

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Εισαγωγή στα χαρακτηριστικά των μικροφώνων

18/3/2009. Ορισμός ευαισθησίας μικροφώνων. Ορισμός στάθμης ευαισθησίας μικροφώνων. Φλώρος Ανδρέας Επίκ. Καθηγητής

Τμήμα Μουσικής Τεχνολογίας και Ακουστικής. Το «πολυκαναλικό στέρεο», τα μορφότυπα και η παραγωγή (ηχογράφηση/μίξη)

Μάθημα: Ακουστική και Ψυχοακουστική

Τα ηλεκτρονικά σήματα πληροφορίας διακρίνονται ανάλογα με τη μορφή τους σε δύο κατηγορίες : Αναλογικά σήματα Ψηφιακά σήματα

ΙΕΜΑ Κύκλος διαλέξεων μουσικής ακουστικής

Από τις τριγωνομετρικές συναρτήσεις στο Mp3

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

ΠΑΡΑΓΩΓΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

sur so ro un un d d 5.1

ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ & ΤΕΧΝΟΛΟΓΙΑ ΗΧΟΥ εισαγωγή

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Φυσική για Μηχανικούς

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΠΕΙΡΑΜΑ 4: ΕΞΟΙΚΕΙΩΣΗ ΜΕ ΠΑΛΜΟΓΡΑΦΟ ΚΑΙ ΜΕΤΡΗΣΗ ΕΝΑΛΛΑΣΣΟΜΕΝΩΝ ΣΗΜΑΤΩΝ

Αρχές επικοινωνίας με ήχο και εικόνα Συστήματα επικοινωνίας με ήχο και εικόνα

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

ΟΕΦΕ 2009 Γ' ΛΥΚΕΙΟΥ ΘΕΤΙΚΗ & ΤΕΧΝΟΛΟΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΦΥΣΙΚΗ

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΔΙΕΥΘΥΝΣΗ ΑΝΩΤΕΡΗΣ ΚΑΙ ΑΝΩΤΑΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΥΠΗΡΕΣΙΑ ΕΞΕΤΑΣΕΩΝ ΠΑΓΚΥΠΡΙΕΣ ΕΞΕΤΑΣΕΙΣ 2013

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

ΗΛΕΚΤΡΙΚΟ ΣΥΣΤΗΜΑ ΑΥΤΟΚΙΝΗΤΟΥ

Φυσική για Μηχανικούς

ΚΕΦΑΛΑΙΟ 7 ΕΠΕΞΕΡΓΑΣΙΑ ΚΑΙ ΜΕΤΑΔΟΣΗ ΨΗΦΙΑΚΩΝ ΔΕΔΟΜΕΝΩΝ

Μουσική και Ψηφιακή Τεχνολογία

Αφήγηση Μαρτυρία. Μουσική. Ενίσχυση μηνύματος Μουσική επένδυση Ηχητικά εφέ

Β1. Να γράψετε στο τετράδιό σας τους αριθμούς της Στήλης Α και δίπλα τα γράμματα της Στήλης Β που αντιστοιχούν σωστά.

ΕΝΟΤΗΤΑ ΤΗΛΕΦΩΝΙΑ ΕΙΣΑΓΩΓΗ

Πολυπλεξία. Creative Commons License 3.0 Share-Alike

Ο ηλεκτρισμός συναντά τον μαγνητισμό

ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ ΜΙΚΡΟΦΩΝΑ ΓΙΑΝΝΗΣ ΜΟΥΡΤΖΟΠΟΥΛΟΣ ΚΑΘΗΓΗΤΗΣ

Γ' ΛΥΚΕΙΟΥ ΘΕΤΙΚΗ & ΤΕΧΝΟΛΟΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΦΥΣΙΚΗ ΕΚΦΩΝΗΣΕΙΣ

ΕΣΔ 200: ΔΗΜΙΟΥΡΓΙΑ ΠΕΡΙΕΧΟΜΕΝΟΥ ΙΙ. Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Φυσική για Μηχανικούς

Αρχές επικοινωνίας με ήχο και εικόνα

ΚΥΜΑ ΗΧΟΣ ΙΑΘΛΑΣΗ ΠΕΡΙΘΛΑΣΗ ΑΝΑΚΛΑΣΗ ΣΥΜΒΟΛΗ

Ψηφιακός ήχος και κινούμενα γραφικά

High Fidelity, Surround Sound, Home Cinema, 23/04/2012. Δημήτρης Σταματάκος

Φυσική για Μηχανικούς

25/3/2009. Η επεξεργασία του ψηφιακού σήματος υλοποιείται μέσω κατάλληλου αλγορίθμου. Φλώρος Ανδρέας Επίκ. Καθηγητής Παράμετροι ελέγχου

Ψηφιακή Επεξεργασία Σηµμάτων

Τηλεόραση και Κινηματογράφος

Συλλογή & Επεξεργασία Δεδομένων Εργαστήριο 7 Ακούγοντας Πρώτη Ματιά στην Ανάλυση Fourier. Σύστημα Συλλογής & Επεξεργασίας Μετρήσεων

ΕΡΕΥΝΗΤΙΚΗ ΕΚΘΕΣΗ. Θέμα «Το Τεχνικό Μέρος του Ραδιοφωνικού Πομπού» Σχολικό Έτος : o Γενικό Λύκειο Μυτιλήνης Τάξη Α

Τι συσχετίζεται με τον ήχο

Φυσική για Μηχανικούς

ΜΑΘΗΜΑ ΕΙΔΙΚΗΣ ΘΕΜΑΤΙΚΗΣ ΔΡΑΣΤΗΡΙΟΤΗΤΑΣ. Ραδιοφωνία

A3. Στο στιγμιότυπο αρμονικού μηχανικού κύματος του Σχήματος 1, παριστάνονται οι ταχύτητες ταλάντωσης δύο σημείων του.

Ύψος Συχνότητα Ένταση Χροιά. Ο ήχος Ο ήχος είναι μια μορφή ενέργειας. Ιδιότητες του ήχου. Χαρακτηριστικά φωνής

Πανεπιστήμιο Κύπρου Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εργαστήριο Κυκλωμάτων και Μετρήσεων

ΠΕΙΡΑΜΑΤΙΚΟ ΛΥΚΕΙΟ ΕΥΑΓΓΕΛΙΚΗΣ ΣΧΟΛΗΣ ΣΜΥΡΝΗΣ Φυσική Θετικής και Τεχνολογικής Κατεύθυνσης Γ Λυκείου ΓΡΑΠΤΕΣ ΔΟΚΙΜΑΣΤΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΜΑΪΟΥ 2009

Μάθημα: Ακουστική και Ψυχοακουστική

ΔΙΑΓΩΝΙΣΜΑ 05 ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ Διάρκεια: 3 ώρες ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΠΕΝΤΕ (5) U β A

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

ÁÎÉÁ ÅÊÐÁÉÄÅÕÔÉÊÏÓ ÏÌÉËÏÓ

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων

Φυσική για Μηχανικούς

Τμήμα Φυσικής Πανεπιστημίου Κύπρου Χειμερινό Εξάμηνο 2016/2017 ΦΥΣ102 Φυσική για Χημικούς Διδάσκων: Μάριος Κώστα

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 6 ΣΕΛΙ ΕΣ

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

κριτήρια αξιολόγησης ΚΕΦΑΛΑΙΟ 5 1o Κριτήριο αξιολόγησης

ΠΟΜΠΟΣ ΕΚΤΗΣ ΑΝΙΧΝΕΥΤΗΣ

Public Address (PA) Ενίσχυση Συναυλιών. Κύκλος Διαλέξεων Ηλεκτρακουστικής 20/2/2012. Δευτέρα, 20 Φεβρουαρίου 12

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Φυσική για Μηχανικούς

ΤΕΧΝΟΛΟΓΙΑ ΕΠΙΚΟΙΝΩΝΙΩΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Β ΤΑΞΗΣ ΛΥΚΕΙΟΥ 2002

Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Αρχή λειτουργίας στοιχειώδους γεννήτριας εναλλασσόμενου ρεύματος

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΤΟ ΣΥΜΒΑΤΙΚΟ ΤΗΛΕΦΩΝΟ

Τ Ε Ι Κ Ρ Η Τ Η Σ Π Α Ρ Α Ρ Τ Η Μ Α Ρ Ε Θ Υ Μ Ν Ο Υ ΤΜΗΜΑ ΜΟΥΣΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΑΚΟΥΣΤΙΚΗΣ ΙΟΥΛΙΟΣ 2013

1. Να χαρακτηρίσετε τις παρακάτω προτάσεις ως σωστές (Σ) ή λανθασμένες (Λ):

ΘΕΜΑΤΑ ΕΞΕΤΑΣΕΩΝ ΦΥΣΙΚΗΣ ΙΙ

ΦΥΣΙΚΗ Γ ΓΥΜΝΑΣΙΟΥ - ΘΕΩΡΙΑ - ΤΥΠΟΛΟΓΙΟ

ΘΕΜΑ : ΨΗΦΙΑΚΑ ΗΛΕΚΤΡΟΝΙΚΑ DIGITAL ELECTRONICS

ΑΣΚΗΣΕΙΣ ΚΥΜΑΤΙΚΗΣ ΟΠΤΙΚΗΣ

Κεφάλαιο 3 ο : ΕΙΣΑΓΩΓΗ στις ΤΗΛΕΠΙΚΟΙΝΩΝΙΕΣ. ΗΛΕΚΤΡΟΜΑΓΝΗΤΙΚΟ ΚΥΜΑ και ΤΕΧΝΙΚΕΣ ΙΑΜΟΡΦΩΣΗΣ

ιαγώνισμα στη Φυσική Γ Λυκείου Κατεύθυνσης Επαναληπτικό Ι

ΗΧΗΤΙΚΕΣ ΕΓΚΑΤΑΣΤΑΣΕΙΣ

ΕΙΚΟΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ. Γάντι δεδομένων. Το γάντι δεδομένων είναι. Τρισδιάστατος ήχος

Σύστημα ενίσχυσης ήχου εξωτερικού χώρου (Outdoor Sound Reinforcement System)

Ολογραφία. Ιστορία, χρήση και µέλλον της ολογραφίας

1o ΘΕΜΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΠΑΝΕΛΛΗΝΙΩΝ ΕΞΕΤΑΣΕΩΝ ΦΥΣΙΚΗ ΘΕΤΙΚΗΣ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΗΣ Γ ΛΥΚΕΙΟΥ ΕΚΦΩΝΗΣΕΙΣ

ΕΧΕΙ ΤΑΞΙΝΟΜΗΘΕΙ ΑΝΑ ΕΝΟΤΗΤΑ ΚΑΙ ΑΝΑ ΤΥΠΟ ΓΙΑ ΔΙΕΥΚΟΛΥΝΣΗ ΤΗΣ ΜΕΛΕΤΗΣ ΣΑΣ ΚΑΛΗ ΕΠΙΤΥΧΙΑ ΣΤΗ ΠΡΟΣΠΑΘΕΙΑ ΣΑΣ ΚΙ 2014

Παρεμβολή Ενισχυτών μεταξύ γεωφώνων και καταγραφικού

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 6 ΣΕΛΙΔΕΣ

Analog vs Digital. Δούρβας Ιωάννης ΙΩΑΝΝΗΣ ΔΟΥΡΒΑΣ

ΘΕΜΑ Α : α V/m β V/m γ V/m δ V/m

3 η Εργαστηριακή Άσκηση

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Δ ΕΣΠΕΡΙΝΩΝ

Transcript:

ΘΕΣΣΑΛΟΝΙΚΗ ΙΑΝΟΥΑΡΙΟΣ 2011 Μετάδoση περιφερικού ήχου μέσω πρωτοκόλου mp3 Διπλωματική Εργασία Κούκουλης Ιωάννης Επιβλέπων καθηγητής: Παπανικολάου Γεώργιος [Type the abstract of the document here. The abstract is typically a short summary of the contents of the document. Type the abstract of the document here. The abstract is typically a short summary of the contents of the document.]

Στην Τζένη, την πιο αγαπημένη μου και στον μπαμπά μου. Τίτλος πρωτοτύπου: Μετάδοση περιφερικού ήχου μέσω πρωτοκόλλου Mp3 Παρούσα έκδοση: ΙΟΥΛΙΟΣ 2012 Τις θερμές ευχαριστίες μου στον καθηγητή μου κ. Γ. Παπανικολάου για την συνεργασία του χωρίς την οποία δεν θα ήταν εφικτή η εκπόνηση αυτής της διπλωματικής και στους φίλους μου Ζάχο, Σωτήρη, Τατιάνα, Στέργιο, Γιάννη, για όσα προσέφεραν. Τέλος, στον Θάνο, τα mail του οποίου βοήθησαν. 2

ΕΙΣΑΓΩΓΗ : ΜΕΤΑΔΟΣΗ.. ΚΕΦΑΛΑΙΟ 1: ΣΤΕΡΕΟΦΩΝΙΑ. 1.1. Εισαγωγή.. 1.2. Ψυχοακουστική. 1.2.1 Μονοφωνία. 1.2.2 Στερεοφωνία. 1.2.2.1 Μηχανισμός αντίληψης της πηγής. 1.2.2.2 Ελάχιστη γωνία ακουστότητας. 1.2.2.3 Τοποθέτηση στον χώρο (Summing Localization) και εικονικές πηγές (Phantom sources). 1.2.2.4 Νομος του πρώτου κυματομετώπου Φαινόμενο της προπορείας (Precedence effect) 1.2.2.5 Οι τρεις φάσεις του φαινομένου της προπορείας ΚΕΦΑΛΑΙΟ 2: Ηχογράφηση και Αναπαραγωγή του ήχου - Ιστορικά 2.1. Τα πρώτα χρόνια... 2.1.1 Φωνοαυτόγραφος... 2.1.2. Φωνόγραφος... 2.1.3 Γραμμόφωνο... 2.2. Η ελληνική ιστορία... 2.3. Ηλεκτρική ηχογράφηση... 2.3.1 Μικρόφωνα... 2.4. Μαγνητική ηχογράφηση... 2.4.1 Μαγνητικά υλικά... 2.4.2 Μαγνητική ταινία... 2.4.3 Ανάγνωση και εγγραφή... 2.5. Πολυκαναλική ηχογράφηση... 2.6. Ψηφιακός κόσμος... 2.7. Σήμερα-Συμπεράσματα ΚΕΦΑΛΑΙΟ 3: Συμπίεση 3.1. Εισαγωγή... 3.2. Κωδικοποίηση ή Ψηφιοποίηση... 3.2.1 Δειγματοληψία... 3.2.2 Κβαντοποίηση... 3.2.3 Διαμόρφωση... 3.3. Ψυχοακουστική... 3.3.1 Γενικά... 3.3.2 Το δεύτερο κομμάτι του παζλ... 3.3.3 Σπάζοντας την διαδικασία σε δύο κομμάτια... 3.3.4 Επικάλυψη (masking)... 3.3.4.1 Ακουστική επικάλυψη 3.3.4.2 Χρονική επικάλυψη 3.3.5 Ακουστικά Φίλτρα 3.3.6 Ρυθμοί δεδομένων.. 3.3.7 Αποθηκευτικός χώρος (Dipping into the reservoir).. 3.4. Τεχνικές κωδικοποίησης - Πρότυπα συμπίεσης 3.4.1 Πρότυπα MPEG.. 3.4.1.1 Mp3. 3.4.2 Άλλα πρότυπα. 3.4.2.1 AAC. 3.4.2.2 WMA.. 3.4.2.3 Mp3Pro 3.4.2.4 Ogg Vorbis.. 3.4.2.5 Dolby Digital. 3.4.2.6 DTS.. 3.4.2.7 Mp3 Surround. 3

ΚΕΦΑΛΑΙΟ 4: Τεχνικές Ηχογράφησης 4.1. Δικαναλικές Τεχνικές Ηχογράφησης Στέρεο. 4.1.1 Συμπίπτοντα μικρόφωνα. 4.1.1.1 Χ-Υ.. 4.1.1.2 MS. 4.1.2 Κοντινά τοποθετημένα μικρόφωνα.. 4.1.2.1 ORTF,NOS, Faulkner. 4.1.3 Απομακρυσμένα μικρόφωνα. 4.1.3.1 AB 4.1.4 Αμφιωτική εγγραφή. 4.2. Πολυκαναλικές Τεχνικές Ηχογράφησης 4.2.1 Συμπίπτοντα μικρόφωνα.. 4.2.1.1 Double M/S.. 4.2.1.2 SoundFeld.. 4.2.2 Κοντινά τοποθετημένα μικρόφωνα. 4.2.2.1 OCT 4.2.3 Ψευδο-αμφιωτική εγγραφή.. 4.2.3.1 Sphere.. 4.2.4 Απομακρυσμένα Μικρόφωνα. 4.2.4.1 DecaTree.. 4.2.5 Ελεύθερες τεχνικές ηχογράφησης. ΚΕΦΑΛΑΙΟ 5: Κωδικοποίηση περιφερικού Mp3 5.1. Εισαγωγή. 5.2. Τυπικός mp3 αποκωδικοποιητής. 5.2.1. Φίλτρο-Analysis Polyphase Filterbank. 5.2.2. Τροποποιημένος μετασχηματισμός συνημίτονου (MDCT).. 5.2.3. Γρήγορος μετασχηματισμός Fourier (FFT) 5.2.4. Ψυχοακουστικό μπλοκ. 5.2.5. Κωδικοποιώντας την επιπρόσθετη πληροφορία.. 5.2.6. Κωδικοποίηση Huffman 5.2.7. Σχηματοποίηση της MP3 πληροφορίας και CRC κώδικας διόρθωσης λαθών.. 5.3. Το Bitstream του mp3 5.3.1. Κεφαλίδα (Header) 5.3.2. CRC κώδικας διόρθωσης λαθών 5.3.3. Επιπρόσθετη πληροφορία (Side information) 5.3.4. Κυρίως δεδομένα (Main Data) 5.3.5. Βοηθητική πληροφορία (Ancillary Data) 5.4. Συμβατή μίξη (Downmixing). 5.5. Κωδικοποιητής αμφιωτικών ακολουθιών - BCC (Binaural Cue Coding) Μερος 2 ο Πρακτικό Κομμάτι ΒΙΒΛΙΟΓΡΑΦΙΑ ΠΑΡΑΡΤΗΜΑΤΑ.. Παραρτημα Α : Header bits του mp3 Παράρτημα Β : Τυπικές HRTFs 4

5

Εισαγωγή Μετάδοση Στην παρούσα διπλωματική εξετάζεται η μετάδοση στερεοφωνικού ήχου. Δύο λέξεις που κρύβουν πολύ θεωρία και γενικότερα ατελείωτες ώρες μελέτης από μηχανικούς και επιστήμονες. Στις επόμενες παραγράφους γίνεται ευρεία αναφορά στην Στερεοφωνία. Από τις βασικές αρχές τις θεωρίας, τον τρόπο που αντιλαμβάνεται τον ήχο ο άνθρωπο και τις βασικές αρχές της ψυχοακουστικής, μέχρι τις σύγχρονες μεθόδους ψηφιακής κωδικοποίησης ήχου και το πρωτόκολλο Mp3 Surround. Δεν γίνεται όμως μεγάλη αναφορά στο άλλο μεγάλο κομμάτι της επιστήμης του ήχου, που είναι η μετάδοση του. Επειδή λοιπόν η ανάλυση της μετάδοσης ήταν αρχικός και παραμένει πολύ σημαντικός στόχος αυτής τις διπλωματικής θα επιχειρηθεί μία αρκετά συντομότερη ανάλυση, η οποία θα ολοκληρωθεί με πρακτική φάση της παρούσας. Το κεφάλαιο αυτό έχει μπει εκ των υστέρων γιατί επανεκτιμήθηκε η ανάγκη για πληρότητα η οποία ήταν αδύνατη χωρίς αυτό το κομμάτι της μετάδοσης. Αρχικά, ας μιλήσουμε για το πιο ευρέως διαδεδομένο πρότυπο μετάδοσης του ήχου, το S/PDIF (Sony Phillips Digital InterFace). Αυτό το πρότυπο προτείνει τρόπο μετάδοσης του ψηφιακού ήχου. Το όνομα παραπέμπει και στο καλώδιο που χρησιμοποιείται για την συγκεκριμένη μεταφορά και πρόκειται για ομοαξινικό καλώδιο με RCA (ή BNC) βύσμα. Ακόμα χρησιμοποιείται οπτική ίνα TOSLINK ή η πιο επαγγελματική έκδοση του προτύπου AES-3. Τα πρότυπα αυτά διαφέρουν μόνο ως προς την σημασία των bit ελέγχου. Στον παρακάτω πίνακα φαίνονται οι διαφορές στα πρότυπα σε σχέση με τις τεχνικές και υλικές προδιαγραφές της διασύνδεσης. 6

Πριν δούμε τους τρόπους με τους οποίους μπορούμε να μεταφέρουμε συμπιεστικές κωδικοποιήσεις του ήχου, ας ρίξουμε μια ματιά στο Bitstream που προβλέπει το SPDIF. Το standard IEC 60958 type II, ορίζει το πρότυπο. Επίσης παρατίθενται 1 και οι προδιαγραφές της EBU για το πρότυπο AES3 (ή AES/EBU). Καταρχήν το SPDIF μεταφέρει ήχο με δύο τρόπους. Ασυμπίεστο ήχο με δύο κανάλια με PCM δείγματα Συμπιεσμένο ήχο με την τεχνική passthrough Εικόνα 1 2 Ένα SPDIF audio block Σε κάθε περίπτωση το bitstream όπως φαίνεται στην παραπάνω εικόνα, χωρίζεται σε audio blocks κάθε ένα από τα οποία αποτελείται από 192 frames όπου κάθε ένα περιέχει ένα δείγμα (από τα 44100 ή 48000 της δειγματοληψίας) για κάθε κανάλι. Στην παρακάτω εικόνα φαίνεται και η ακριβής δόμή του 32-μπιτου slot. Δύο 32- μπιτα slot φτιάχνουν ένα frame. Εύκολα βγαίνει πως για κάθε δευτερόλεπτο έχουμε τόσα frame όσα και η συχνότητα δειγματοληψίας και 44100 = 230 audio block. 192 1 http://tech.ebu.ch/docs/tech/tech3250.pdf 2 Πηγή εικόνας http://en.wikipedia.org/wiki/aes3 7

Εικόνα 2 3 Κατανομή των slots μέσα σε ένα subframe Βλέπουμε τις δύο περιπτώσεις ορισμού του subframe. Στην πρώτη η ανάλυση των δειγμάτων είναι 24 bit, ενώ στην δεύτερη είναι 16-20 bit και τα έξτρα 4 bit χρησιμοποιούνται σαν auxiliary bit για επιπλέον πληροφορία. Ας δούμε τα slot 0-3 slots: bit προλόγου 4. Υπάρχουν τρεις τετράδες Χ, Υ και Ζ οι οποίες προλογίζουν To X προλογίζει το subframe A To Y προλογίζει το subframe Β To Z προλογίζει ένα subframe A που επιπλέον βρίσκεται στην αρχή ενός audioblock. 4-7 slots : Όταν αυτά δεν χρησιμοποιούνται για 24 μπιτα δείγματα. Χρησιμοποιούνται σαν auxiliary bits. Bit δηλαδή που μεταφέρουν επιπρόσθετη παράλληλη πληροφορία. 8-27 slots : Περιέχουν τα 20 ή 16 bit του δείγματος για κάθε στιγμή της δειγματοληψίας. Το πρώτο bit αριστερά είναι το λιγότερο σημαντικό. 28 slot : Περιέχει το validity bit. Αυτό είναι: 0 όταν το δείγμα είναι κατάλληλο για μετατροπή σε αναλογικό 1 δεν έχει την παραπάνω δυνατότητα 29 slot : To User data bit μπορεί να χρησιμοποιηθεί κατ επιλογή του χρήστη. Η προεπιλογή του είναι το 0. 30 slot : To Channel status bit. Τα 192 bit των 192 frame ενός audio block σχηματίζουν μια λέξη των 24 byte, η οποία περιέχει όλες της απαραίτητες πληροφορίες για το stream (κωδικοποίηση, αποκωδικοποίηση κ.α.). 3 Πηγή εικόνας http://tech.ebu.ch/docs/tech/tech3250.pdf 4 Η λέξη προτείνεται από τον συγγραφέα καθώς τα bit αυτά, τρόπον τινά, προλογίζουν τα subframe που ακολουθούν. 8

31 slot : Περιέχει το Parity bit ή bit ισοτιμίας, το οποίο συμπληρώνει μονό ή ζυγό άσων στοχεύοντας στην αναγνώριση μονού αριθμού λαθών. Έτσι λοιπόν διατάσσονται τα bit μέσα στο bitstream που προβλέπει το S/PDIF. Για περισσότερες πληροφορίες ο αναγνώστης παραπέμπεται στο κείμενο της 1 ης αναφοράς καθώς και στο standard IEC 60958. Αξίζει να σημειωθεί εδώ πως ο ρυθμός δεδομένων μέσα στο καλώδιο SPDIF θα πρέπει να είναι ίσος με αυτόν ενός 16-μπιτου PCM ρυθμού αναλόγως της συχνότητας. Έτσι εάν περνάμε συμπιεσμένο format αυτό θα πρέπει να συμπληρωθεί με μηδενικά ώστε να φτάσει το εν λόγω ρυθμό δεδομένων. Από την τελευταία πρόταση γίνεται επιπλέον φανερό πως μπορεί να μεταδοθεί και συμπιεσμένος πολυκαναλικός ήχος. Υπάρχουν δύο τεχνικές 5 μεταφοράς με το SPDIF (σύμφωνα με το AC3FILTER 6 ) για συμπιεσμένο πολυκαναλικό ήχο. Φυσικά η κλασσική λειτουργία παραμένει η μεταφορά δικάναλου ασυμπίεστου PCM ήχου. S/PDIF passthrough S/PDIF encode Με την πρώτη μεταφέρουμε συμπιεσμένο ήχο χωρίς καμιά αλλαγή. Απλά τοποθετούμε την πληροφορία μέσα στους «χώρους» του S/PDIF bitstream. Έτσι όμως δεν υπάρχει η δυνατότητα της οποιασδήποτε μορφοποίησης του ήχου, ακόμα και της έντασης, πριν τον δέκτη. Με τον δεύτερο τρόπο ένας surround 5.1 ήχος αποκωδικοποιείται και κωδικοποιείται σε AC-3, ώστε να περάσει μέσα από το SPDIF. Πριν την επανακωδικοποίηση σε AC-3 επιτρέπεται η επεξεργασία του ήχου, σε αντίθεση με την προηγούμενη περίπτωση. Μπορούμε να αλλάξουμε την φωνή, των αριθμό των καναλιών κ.α. πριν τον στείλουμε στον δέκτη. Ένας λόγος για να μην μπορούμε να μεταδώσουμε με S/PDIF είναι να μην υποστηρίζεται το format για την passthrough λειτουργία (υποστηρίζονται τα AC3, 5 Βλέπε IEC 61937 6 Το πρόγραμμα παρέχεται δωρεάν στην σελίδα http://ac3filter.net/ 9

DTS padded/wrapped και MPEG surround) και μετατρέψουμε σε AC-3. να μην μπορούμε να το Συνοψίζοντας τα της μεταφοράς σε δύο λογικές. Πρώτον μας ενδιαφέρει να μεταφέρουμε στον δυνατόν μικρότερο όγκο την καλύτερη δυνατή ποιότητα. Αυτή η αρχή, όπως θα φανεί παρακάτω, ενσωματώνεται από το Mp3 Surround πρότυπο για 5.1 ήχο. Έτσι, θα βόλευε πολύ να μπορούμε να μεταφέρουμε τον ήχο σε αυτήν την μορφή για να εξοικονομούμε το απαραίτητο bandwidth. Δεύτερον μας ενδιαφέρει να μεταφέρουμε ήχο μέσα από το S/PDIF, το οποίο αποτελεί και το πιο ευρέως διαδεδομένο σύστημα μεταφοράς ήχου. Το συναντάμε παντού από επαγγελματικές παραγωγές, όπως συναυλίες (συνήθως στην πιο επαγγελματική του μορφή το AES3) μέχρι και σε καθημερινές εφαρμογές όπως στα σπίτια και στα home cinema. Για να συμβεί αυτό θα χρειαστεί να μπορούμε να μετατρέπουμε τα πολυκαναλικά κομμάτια μας, που για λόγους μείωσης του χώρου αποθήκευσης κ.α, κρατάμε σε mp3surround φορματ, σε AC3. Στο πρακτικό κομμάτι, θα δούμε πως μπορούμε να μετατρέψουμε τον ήχο μας, από mp3 Surround σε AC3 και αντίστροφα. Ακόμα ένα ζητούμενο αποτελεί και η μεταφορά mp3 Surround αρχείων απευθείας μέσω του S/PDIF. Αυτό προτείνεται στο τέλος του πρακτικού κομματιού για περαιτέρω μελέτη. 10

ΚΕΦΑΛΑΙΟ 1ο 7 Στερεοφωνία 1.1 Εισαγωγή Ένα ελάφι κάνει απόλυτη ησυχία. Έχει διαισθανθεί τον κίνδυνο. Περιμένει να ακούσει κάτι. Ο παραμικρός ήχος, το σπάσιμο ενός κλαδιού ή η μετακύληση μιας πέτρας, περιέχει πληροφορία ζωτικής σημασίας για αυτό. Εάν το ελάφι ακούσει έγκαιρα μπορεί να ζήσει, αλλιώς η φύση δεν θα του συγχωρέσει τέτοιο λάθος. Στα φίδια το ίδιο τους το σώμα είναι άμεσος δέκτης ακόμα και των ασθενέστερων δονήσεων και ήχων χαμηλής συχνότητας που μεταφέρονται από το έδαφος. Αυτήν η πληροφορία η τόσο απαραίτητη για την ζωή, δίνει την δυνατότητα στα όντα να προσδιορίσουν την θέση της ηχογόνας πηγής. Η στερεοφωνία είναι συστατικό της φύσης. Ο όρος στερεοφωνία προέρχεται από τις λέξεις «στερεό» και «φωνή». Η πρώτη δίνει την αίσθηση των τριών διαστάσεων. Έτσι για να έχουμε τρεις διαστάσεις στον ήχο χρειαζόμαστε τουλάχιστον τρία ηχεία και συνεπώς τουλάχιστον τρία διαφορετικά σήματα. Μάλλον, λοιπόν, αδόκιμη 8 πρέπει να θεωρηθεί η χρήση του όρου όταν αναφερόμαστε σε δικάναλη ηχογράφηση ή αναπαραγωγή. Στο παρών σύγγραμμα η χρήση του όρου γίνεται με την ευρεία έννοια του, που υπονοεί τρισδιάστατο ήχο. Η δεύτερη λέξη, προδίδει πως έχουμε να κάνουμε με ήχο. Ο τρισδιάστατος ήχος αναπτύχθηκε ώστε να προσομοιωθεί ο τρόπος που ακούμε. Η ακοή είναι τρισδιάστατη και περιφεριακή, που σημαίνει ότι τα ηχητικά δεδομένα λαμβάνονται από μπροστά, πίσω, δεξιά και αριστερά καθώς και από πάνω ή κάτω. Σ αυτό το κεφάλαιο θα μελετήσουμε την στερεοφωνία. Με ποιον τρόπο καταφέρνουμε να ηχογραφήσουμε ένα ήχο ή μια ζωντανή μουσική παράσταση και με ποιον τρόπο μπορούμε να την αναπαράγουμε δίνοντας την εντύπωση και την αίσθηση του χώρου. Ο ακροατής δηλαδή είναι θα πρέπει να μπορεί να καταλάβει σε ποιο σημείο εκπέμπεται ο κάθε ξεχωριστός ήχος μέσα στον χώρο. Αρχικά θα εισάγουμε τον αναγνώστη στην βασικές αρχές και έννοιες της στερεοφωνίας. Θα επιδιώξω να απαντήσω στην ερώτηση: Τι είναι Στερεοφωνία?. Ιδιαίτερη σημασία τέλος θα δοθεί στον τρόπο με τον οποίο ο άνθρωπος αντιλαμβάνεται την πηγή του 7 Η εικόνα του εξωφύλλου βρίσκεται στην σελίδα http://www.hpc.unm.edu/~vic_var/research.html 8 Ο όρος στέρεο επικράτησε να χρησιμοποιείται για δικάναλη ηχογράφηση ή αναπαραγωγή εσφαλμένα. Η χρήση του εντοπίζεται την δεκαετία του 50, όταν γινόταν η μετάβαση από τον μονοφωνικό στον δικαναλικό ήχο, ο οποίος τότε θεωρούνταν τρισδιάστατος. 11

ήχου στον χώρο, ώστε να γίνει κατανοητό αργότερα με ποιον τρόπο μπορούμε να αναπαράγουμε και πρωτίστως πώς να μετατρέψουμε αυτήν την πληροφορία σε bit και να την εισάγουμε στο mp3 surround bit stream. Σε επόμενα κεφάλαια, θα μελετηθούν οι βασικές αρχές που διέπουν την διαδικασία της ηχογράφησης, τεχνικές και μέσα. Στερεοφωνία 9 αναφέρεται στην τεχνική λήψεως, εγγραφής και αναπαραγωγής του ήχου η οποία αποσκοπεί στο να δώσει στον ακροατή την αίσθηση της κατανομής του ήχου στο χώρο, ότι ο ήχος προέρχεται από περισσότερες της μιας πηγές (διαύλους) μέσα στο χώρο. Η στερεοφωνία 10 έχει ως βασική αρχή, την αρχή του εντοπισμού της ηχογόνας πηγής, την ικανότητα δηλ. των αυτιών μας να μπορούν να διακρίνουν τις διαφορές στην ένταση των ήχων που προσβάλλουν το κάθε αυτί. Είναι γνωστό ότι η ηχογόνα πηγή γίνεται περισσότερο αντιληπτή από εκείνο το αυτί προς τη μεριά του οποίου βρίσκεται. Ένα ακόμα στοιχείο για τον προσδιορισμό της κατεύθυνσης των ήχων είναι εκτός από τη διαφορά έντασης και η διαφορά φάσης με την οποία οι ήχοι προσβάλλουν τα αυτιά. Σ` αυτό όμως το σημείο αξίζει να τονιστεί ένα αξιοπερίεργο φαινόμενο, όπου, ενώ σε οριζόντιο επίπεδο είναι πολύ εύκολος ο προσδιορισμός της κατεύθυνσης της ηχογόνας πηγής, σε κατακόρυφο επίπεδο παρουσιάζει δυσχέρειες. Δηλ. ενώ είναι εύκολο να αποφανθούμε αν ο ήχος έρχεται από δεξιά ή αριστερά, δεν μπορούμε με βεβαιότητα να πούμε ότι ο ήχος έρχεται από πάνω ή από κάτω. Έτσι τα περισσότερα στερεοφωνικά συστήματα αποδίδουν μόνο την οριζόντια κατανομή των ήχων. Οι διαφορά της έντασης και της φάσης σχετίζονται με τις συναρτήσεις που έχουν να κάνουν με το κεφάλι (HRTF head related transfer functions) και προσδιορίζουν με ποιον τρόπο επηρεάζεται κάθε ήχος που ακούμε σε συνάρτηση με την γωνία και την ανύψωση από την οποία εκπέμπονται σε σχέση με το κεφάλι και λόγω του κεφαλιού. Αυτά θα μελετηθούν σε περισσότερο βάθος αργότερα 11. 9 «Λεξικό της νέας ελληνικής γλώσσας» Γ. Μπαμπινιώτης 10 Livepedia.gr 11 Στο παράρτημα Β περιλαμβάνονται τυπικές HRTFs για βαθύτερη μελέτη και κατανόηση. 12

Εικόνα 1.1 12 Στο σχήμα φαίνονται ανάλογα με την θέση της ηχογόνας πηγής Α) συναρτήσεις μεταφοράς HRTFs Β) η αμφιωτική διαφορά φάσης και Γ) η αμφιωτική διαφορά έντασης Η ικανότητα των θηλαστικών να αντιλαμβάνονται τον ήχο ήταν πάντοτε κριτικής σημασίας για την επιβίωση. Από την εμφάνιση τους τα θηλαστικά, για περισσότερο από 200 εκατομμύρια χρόνια, βασίζονταν στον εντοπισμό της πηγής του ήχου για να την πετύχουν. Η ικανότητα αυτή εντοπισμού της πηγής, μέχρι και τώρα, αποτελεί την αισθητήρια προσλαμβάνουσα σε συνθήκες θηράματος-κυνηγού. Σε ορισμένα μάλιστα είδη, όπως στις νυχτερίδες, η ακοή προσφέρει το σύνολο της προσλαμβάνουσας, μέσω των αισθήσεων, πληροφορίας! Η ανάγκη για επιβίωση ανάγκασε τους ανθρώπους να επιδιώξουν να μιμηθούν την ακοή και να αναπαράγουν στερεοφωνικά ακούσματα. Όπως όλες οι τεχνικές επαναστάσεις οδηγήθηκαν από πρωτοπόρους εφευρέτες, ερευνητές ή μηχανικούς, έτσι και αυτή. Ακολουθεί εν συντομία μια ιστορική αναδρομή, ώστε να εισαχθεί ο αναγνώστης στα ψυχοακουστικά φαινόμενα που σχετίζονται με την ικανότητα αντίληψης της πηγής και στο επόμενο κεφάλαιο ακολουθεί μια πιο εμπεριστατωμένη μελέτης της μηχανικής του ήχου. Από τα πρώτα χρόνια μέχρι το σήμερα. 1.1.1 Τα πρώτα χρόνια Η πρώτη στερεοφωνική μετάδοση σημειώνεται στην βιβλιογραφία το 1881. Πρόκειται για μία εφαρμογή που έκανε ément ο Cl Ader 9, το θεατρόφωνο (theatrophone) στο πλαίσιο της διεθνούς έκθεσης του Παρισιού το 1881. Η τεχνική προέβλεπε δύο κανάλια ήχου, ένα για κάθε αυτί και βρήκε στην μετάδοση θεατρικών παραστάσεων. Θα περάσουν 50 χρόνια μέχρις ότου η βιομηχανία ασχοληθεί ξανά σοβαρά, το 1931, όταν ένας Άγγλος φυσικός, ο Μπλουμλάιν, υπό την στέγη της EMI, πήρε δίπλωμα ευρεσιτεχνίας για στερεοφωνική τεχνική, που τελειοποιήθηκε σε πολύ σύντομο χρονικό διάστημα. Ταυτόχρονα, στις αρχές της δεκαετίας το 30 στην Αμερική η ομάδα του Harvey Fletcher που αποτελείται από μια ομάδα επιστημόνων των εργαστηρίων Bell ξεκινάει μελέτες πάνω στην στερεοφωνία. Οι δυο σχολές βασίζονται πάνω στις 12 Πηγή εικόνας Mechanisms of sound Localization in Mammals BENEDIKT GROTHE, MICHAEL PECKA, AND DAVID McALPINE 13

διατυπώσεις του Huygens περί επιπέδου κύματος και στη θεωρία πως «κάθε εκπομπή από μία ηχητική πηγή μπορεί να αναλυθεί σε ένα σύνολο ισοφασικών κυμάτων». Η «μάκρο» προσέγγιση του Fletcher πειραματιζόμενη με ένα άπειρο αριθμό μικροφώνων και ηχείων, δίνουν την αίσθηση της πηγής στο χώρο (βλ σχήμα), αναπαράγοντας το κυματομέτωπο. Κατέληξαν στο συμπέρασμα πως τρία μικρόφωνα και ηχεία αρκούν για να δοθεί στον αναγνώστη η αίσθηση του χώρου. Εικόνα 1.2 Πολλά ηχεία, η αίσθηση του χώρου οφείλεται αναπαραγωγή του κυματομετώπου Αργότερα αποδείχθηκε πως ο λόγος, εξ αιτίας του οποίου αντιλαμβανόμαστε τον χώρο με τρία ηχεία δεν βασίζεται στην αναπαραγωγή του κυματομετώπου αλλά στο φαινόμενο της προπορείας. Με αυτό και με τις τεχνικές του Blumlein θα ασχοληθούμε στην συνέχεια. Εικόνα 1.3 Αναπαραγωγή με τρία ηχεία, η αίσθηση του χώρου οφείλεται στο φαινόμενο της προπορείας 14

Ξεχωριστό κεφάλαια της στερεοφωνίας μπορεί να αποτελέσει η ταινία Fantasia (1940) του Ντίσνευ. Νεοτερισμοί ήχου και εικόνας χωρίς προηγούμενο συνθέτουν μία από τις μεγαλύτερες οπτικοακουστικές εκπλήξεις του αιώνα. Δικαναλικές ηχογραφήσεις 5 ηχείων, με τρία μπροστά στην σκηνή και δύο μακρυά από αυτήν, θυμίζουν πολύ 3/2 τεχνικές. Στην συνέχεια Cinemascope(1950) από την Warner Bros, και πιο μετά τεχνολογίες κωδικοποίησης Matrix (Analogue Matrix), μέχρι να καταλήξουμε στα φορμά, Dolby stereo(1970), Dolby Pro Logic,Dolby Digital, το DTS, το Sony SDDS κ.α. 1.2 Ψυχοακουστική Πριν προχωρήσουμε περαιτέρω στην ουσία αυτής της μελέτης, θα ολοκληρώσουμε την προπαρασκευαστική εκπαίδευση, με κάποιες απαραίτητες έννοιες από τον χώρο της ψυχοακουστικής. Αφού θα έχουμε τελειώσει με την θεωρία αυτή και με την διαδικασία της ηχογράφησης, αυτό που θα μένει, είναι να κωδικοποιήσουμε και να μεταδώσουμε τον ήχο, με στόχο να τον αναπαράγουμε όπου επιλέξουμε. Η απαραίτητη στης μέρες μας προσβασιμότητα του ήχου, μπορεί να επιτευχτεί μέσω του διαδικτύου (internet) και έτσι θέλουμε να είναι και μικρός ο όγκος του αρχείου ώστε να μην εγερθεί πρόβλημα bandwidth. Η συμπίεση-κωδικοποίηση, μπορεί να γίνει με ένα από τους πολυάριθμους τρόπους-πρωτόκολλα (μορφότυπους) που θα αναφέρουμε αργότερα (όπως και με άλλους λιγότερο διαδεδομένους) και η μετάδοση, με πρωτόκολλα μεταφοράς όπως AES/EBU. Η ανατομία πρώτων θα γίνει στο 3 ο κεφάλαιο και θα ολοκληρώσουμε, με το φοτματ Mp3Surround όπου γίνεται ειδική μνεία στο 5 ο κεφάλαιο του παρόντος. Για την μετάδοση συγκεκριμένα έχει γίνει λόγος στην εισαγωγή. Προς το παρών θα εξηγήσουμε με ποιον τρόπο ο εγκέφαλος μας αντιλαμβάνεται την πηγή ενός ήχου, που είναι η βάση της στερεοφωνικής αντίληψης. Αυτή η γνώση είναι απαραίτητη για να κατανοήσουμε ποια είναι η πληροφορία και με ποιον τρόπο πρέπει να την κωδικοποιήσουμε για surround πρωτόκολλα. 1.2.1 Μονοφωνία Αρχικά για μονοφωνία μιλάμε, για ένα τυπικό σύστημα αναπαραγωγής με ένα μόνο κανάλι ήχου. Βεβαίως, μπορεί αυτό το κανάλι να τροφοδοτείται από πολλά κανάλια και πολλά μικρόφωνα, τα οποία μιγνύονται, όμως το σύστημα παραμένει μονοφωνικό. Η μόνη αίσθηση του χώρου που μπορεί να δώσει εάν τέτοιο σύστημα είναι η αίσθηση της απόστασης και του βάθους, που δίδεται μέσω της αντήχησης. 15

Τα περισσότερα πρώιμα συστήματα του 19 και 20 ου αι. ήταν τέτοια και ακόμα και σήμερα χρησιμοποιείται από τις AM ραδιοφωνικές μεταδόσεις. 1.2.2 Στερεοφωνία 13 Εικόνα 1,4 14 Η προσέγγιση Blumlein, ηχογράφηση με coincident-pairs (με διαφορά χρονική και έντασης) και στην συνέχεια αναπαραγωγή (ICTD,ICLD), για χωρική ακρόαση. 1.2.2.1 Μηχανισμός αντίληψης της πηγής (Localization) Το εύρος συχνοτήτων που αντιλαμβάνεται ο άνθρωπος είναι πολύ μεγάλο, 10 οκτάβες. Έτσι, ο ανθρώπινος εγκέφαλος φαίνεται μικρός στις χαμηλές συχνότητες και μεγάλος στις υψηλές. Στην μέγιστη συχνότητα(20khz) το μήκος κύματος είναι πολύ μικρό (17.15mm), έτσι το κεφάλι φαίνεται μεγάλο και λειτουργεί σχεδόν σαν φράγμα. Στην ελάχιστη συχνότητα (20Hz) το μήκος κύματος είναι μεγάλο(17,15m), έτσι το κεφάλι είναι φαίνεται μικρό και αυτές οι συχνότητες αγκαλιάζουν το κεφάλι λογω περίθλασης. Παρ όλα αυτά υπάρχει «ακουστική σκιά» σε ένα αυτί για ήχους που προέρχονται από την αντίθετη μεριά. Το κεφάλι έχει μέγεθος που είναι συγκρίσιμο για τις μεσαίες συχνότητες του ακουστικού εύρους, έτσι είναι φανερό πως δεν μπορεί να υπάρχει μόνο ένας κανόνας για όλο το φάσμα, αφού τα πράγματα αλλάζουν τόσο με την συχνότητα. Η αίσθηση του χώρου δίνεται από δύο παράγοντες την διαφορά έντασης, ILD (interaural level difference) και την διαφορά φάσης ITD (interaural time difference) που φτάνει ο ήχος στα αυτιά. Στις ψηλές συχνότητες τα δυο αυτιά λαμβάνουν τον ήχο με διαφορετικές εντάσεις ενώ στις χαμηλές με διαφορετικές φάσεις ή διαφορά στον χρόνο άφιξης ανάλογα με την 13 Tomlinson Holman, Surround Sound: Up and Running, Εκδοση 2η 2008, Εκδόσεις «Focal Press», Psychoacoustics 14 Πηγή εικόνας: Jeroen Breebaart & Christof Faller, Spatial Audio Processing: MPEG Surround and other Applications, Αγγλική Έκδοση 2007, Εκδόσεις WILEY, 16

διεύθυνση του ήχου. Στο σχήμα φαίνεται καθαρά η συνάρτηση με την συχνότητα ως προς την μέθοδο που χρησιμοποιεί το αυτί για Localization. Το σύστημα αυτό προσδιορισμού της πηγής του ήχου γεννάει μια απροσδιοριστία ως προς σημεία που έχουν ίδιες τιμές ILD, ITD. Σημεία που ανήκουν σε κύκλο που βρίσκεται σε επίπεδο, παράλληλο με το επίπεδο που είναι κάθετο στο έδαφος και σχηματίζει γωνία μηδέν μοίρες με τον κεντρικό άξονα του κεφαλιού, έχουν ίση διαφορά απόστασης και έντασης μεταξύ τους. Τα σημεία αυτά σχηματίζουν τον «κώνο απροσδιοριστίας»(βλ σχήμα), καθώς τα σημεία αυτά δεν μπορούν να διαχωριστούν με την Duplex Theory Εικόνα 1.5 15 Duplex Theory Η συμβολή των δύο μεθόδων προσδιορισμού της πηγής του ήχου συναρτήσει της συχνότητας Πως λοιπον ξεχωρίζει το αυτί την θέση της πηγής σε αυτήν την περίπτωση? Το πτερύγιο ή το σχήμα του αυτιού συνελίσσεται διαφορετικά με κάθε σημείο του χώρου. Διαφορετικές συναρτήσεις μεταφοράς για κάθε σημείο του χώρου λόγω πολυάριθμων και περίπλοκων περιθλάσεων ή ανακλάσεων. Για παράδειγμα εάν ένα ήχος έρχεται από τα δεξιά θα είναι πολύ πιο φωτεινός, καθαρός λόγω των μεγίστων στις υψηλές συχνότητες σε αντίθεση με το αν έρχεται από μπροστά ή από πίσω. Αυτές οι συναρτήσεις μεταφοράς που σχετίζονται με την κεφαλή και σπάνε την απροσδιοριστία που δημιουργεί η Duplex Theory, είναι γνωστές στα Αγγλικά ως Head related transfer functions (HRTFs). 15 Πηγή εικόνας: Jeroen Breebaart & Christof Faller, Spatial Audio Processing: MPEG Surround and other Applications, Αγγλική Έκδοση 2007, Εκδόσεις WILEY 17

Εικόνα 1.6 Κώνος απροσδιοριστίας 16 1.2.2.2 Ελάχιστη γωνία ακουστότητας (Minimum Audible Angle) Η ελάχιστη γωνία ακουστότητας ή αλλιώς η διακριτικότητα του αυτιού ως προς την αζιμουθιακή γωνία είναι 1 ο. Ταυτόχρονα η διακριτικότητα του αυτιού ως προς την γωνία ανύψωσης είναι 3 ο. 1.2.2.3 Τοποθέτηση στον χώρο (Summing localization) και Εικονικές Πηγές (Phantom Sources) Όταν έχουμε δύο όμοια (coherent) ηχητικά γεγονότα (two sound sources), πολύ κοντά χρονικα το ένα στο άλλο, λαμβάνει χώρα το summing localization και τα αντιλαμβανόμαστε σαν ένα γεγονός. Για χρονική διαφορά μεταξύ των δύο πηγών μικρότερη από 1,5 msec, η διαφορά χρόνου και έντασης μας προσδιορίζουν την θέση μίας ηχητικής πηγής. Αυτό εκμεταλλευόμαστε για να προσδιορίσουμε στα αυτιά μας που είναι η πηγή του ήχου. Αξίζει να σημειωθεί εδώ πως 1,5msec είναι ελάχιστα μεγαλύτερο από τον χρόνο(1msec) που θα έκανε το κύμα να διανύσει την κρίσιμη απόσταση(critical distance), δηλαδή την απόσταση των αυτιών. Το «νέο» αυτό ηχητικό γεγονός καλείται «Phantom Source» (εικονική πηγή). Οι πηγές «Phantom» που δημιουργούνται από τον μηχανισμό προσθετικού προσδιορισμού κατεύθυνσης «Summing Localization» αποτελούν την βάση της στερεοφωνικής αναπαραγωγής. Μέχρι τώρα μιλούσαμε για ICT, ILD που είναι οι διαφορές που φτάνουν στα αυτιά μας. Οι HRTF έχουν δηλαδή ήδη εφαρμοστεί πάνω στους ήχους. Ας υποθέσουμε το απλό παράδειγμα της δικαναλικής αναπαραγωγής με ένα ηχείο για κάθε κανάλι. Σ αυτήν την περίπτωση θα μιλάμε για interchannel time difference (ICTD) και interchannel level difference (ICLD) και είναι οι διαφορές φάσης και έντασης που παίζουν τα κανάλια. Χωρίς δηλαδή τις HRTF του κεφαλιού που θα εφαρμοστούν πάνω σε αυτές. ITD HRTF = ICTD και ILD HRTF = ICLD Αξίζει να σημειωθεί πως στην περίπτωση που φοράμε ακουστικά τα interaural και interchannel φαινόμενα συμπίπτουν. Ελέγχοντας τα δύο τελευταία, για ένα σύστημα δύο ηχείων μπορούμε να χειριστούμε την αίσθηση της πηγής που θα δώσουμε στον αναγνώστη. Ας δούμε το παρακάτω παράδειγμα: Μιλάμε σταθερά για όμοια (coherent) ηχητικά σήματα (δηλαδή ICC=1 intechannel correlation). Η αίσθηση της εικονικής πηγής phantom source με το νούμερο 1 θα δοθεί στον εγκέφαλο εάν to διακαναλικό πλάτος και η διακαναλική χρονοδιαφορά είναι 0 (ICTD=ICLD=0). 16 Πηγή εικόνας Introduction to head-related functions (HRTFs)Representations of HRTFs in time frequency and space, COREY I. CHENG, AES Student Member, AND GREGORY H. WAKEFIELD, University of Michigan, Department of Electrical Engineering and Computer Science, 18

Εάν αυξήσουμε την ένταση του δεξιού ηχείου (με ην μέθοδο amplitude panning ) έχουμε μετακίνηση της ηχητικής πηγής προς τα δεξιά και στο νούμερο 2 Η πηγή με το νούμερο 3 αντιστοιχεί στην περίπτωση που το δεξί ηχείο δεν παίζει καθόλου. Εικόνα 1.7 17 Μεταβάλλοντας τα ICLD και ICTD μεταξύ των πηγών R και L μεταβάλλεται και η θέση του γεγονότος μεταξύ αυτών. Το ίδιο αποτέλεσμα μπορεί να επιτευχθεί μεταβάλλοντας είτε το ICLD είτε το ICTD (time panning), και αφήνοντας των μηχανισμό προσθετικού διαχωρισμού της πηγής να κάνει τα υπόλοιπα. 1.2.2.4 O Νόμος του πρώτου κύματομετώπου - Φαινόμενο προπορείας ή αγγλιστί The law of the first wavefront - Precedence Effect Δεν αναφέρθηκε προηγουμένως τι συμβαίνει όταν αφενός είμαστε σε κλειστούς χώρους και αφετέρου όταν τα κύματα καταφθάνουν στα αυτιά μας με όχι τόσο μικρή χρονική διαφορά(>1,5msec). Τα ερωτήματα αυτά θα προσπαθήσω να αναδείξω στις επόμενες γραμμές. Ο εναλλακτικός τίτλος της παραγράφου θα μπορούσε να ήταν «χωρική αντίληψη και δύο ηχητικές πηγές σε κλειστούς χώρους». Όπως είναι φυσικό όταν έχουμε να κάνουμε με κλειστούς χώρους τα πράγματα είναι διαφορετικά από την περίπτωση των ανοιχτών χώρων που το ηχητικό κύμα ταξιδεύει ελεύθερα. Στην πρώτη περίπτωση τα κύματα υφίστανται ανακλάσεις με αποτέλεσμα να φτάνουνε στα αυτιά του ακροατή, από διάφορες μεριές και με διαφορές χρονικές διαφορές. Τι συμβαίνει σ αυτήν την περίπτωση? Αφού σύμφωνα με την προηγούμενη παράγραφο όταν δυο κύματα φτάνουνε με μια χρονική διαφορά <1msec γίνονται αντιληπτά σαν ένα γεγονός. Σε μια περίπτωση θα συνέβαλλαν ένας ήχος από 17 Parametric coding of spatial audio, Christof Faller, 7 th int. conference of Digital audio effects, 2004 19

μπροστά(όπου βρίσκετα η ηχητική πηγή) και μια ανάκλαση του από δεξιά με αποτέλεσμα να αντιλαμβανόμασταν την πηγή μετατοπισμένη πιο δεξιά από την πραγματικότητα. Όμως αυτοί οι ήχοι λαμβάνονται με χρονική διαφορά μεγαλύτερη από 1,5msec. Όπότε λαμβάνει χώρα το φαινόμενο της προπορείας (Precedence effect) ή φαινόμενο Haas ή νόμος του πρώτου κυματομετώπου. Σύμφωνα με αυτό ο άνθρωπος ορίζει την πηγή με βάση μόνο τον πρώτο ήχο. Ας δώσουμε ένα παράδειγμα: Ας πούμε ότι έχουμε δύο ηχεία χ 1, χ 2 που εκπέμπουν τα σήματα χ 1, χ 2, όπως φαίνεται στο παρακάτω σχήμα. Στην περίπτωση Το χ 2 εκπέμπει τους ίδιους παλμούς με το χ 1 απλά μετατοπισμένους πιο μετά στον χρόνο κατά τ e. Λόγω του Precedence effect και για τυπική τιμή τ e = 5msec, ο ακροατής αντιλαμβάνεται μόνο ένα (ενιάιο) ηχητικό γεγονός με κατεύθυνση από το χ 1. Εικόνα 1.8 18 Εικόνα 10: Ένα τυπικό πείραμα που αποδεικνύει το «Precedence effect». Στο σχήμα (α) βλέπουμε τα σήματα-είσοδοι και β) η θέση του γεγονότος που βρίσκεται στην πλευρά του προπορευόμενου σήματος 1.2.2.5 Οι τρεις φάσεις του φαινομένου της προπορείας Τι συμβαίνει ανάλογα με την χρονική διαφορά που καταφθάνουν τα ηχητικά γεγονότα. Θα χωρίσουμε την ανάλυση σε τρεις χρονικές φάσεις, και στα φαινόμενα που λαμβάνουν χώρα σε αυτές. Τα δύο κανάλια αναπαράγουν ακριβώς το ίδιο σήμα (ICC = 1) και το «Αριστερά» αναπαριστά το απ ευθείας κύμα ενώ το δεξιά έχει τις χρονικές καθυστερήσεις t. 18 Πηγή εικόνας 1.8, Jeroen Breebaart & Christof Faller, Spatial Audio Processing: MPEG Surround and other Applications, Αγγλική Έκδοση 2007, Εκδόσεις WILEY, σελ. 36 20

Εικόνα 1.9 19 Οι τρεις φάσεις και τα τρία φαινόμενα που λαμβάνουν χώρα ανάλογα με τη διαφορά που φτάνουν στο αυτί δύο ήχοι Φαση I Για t < 1msec: Λαμβάνει χώρα το summing localization και ο ακροατής αντιλαμβάνεται ένα ήχο και η θέση του προσδιορίζεται από την χρονική διαφορά άφιξης των δύο σημάτων. Για χρόνο καθυστέρησης 0 msec είναι αισθητό στον ακροατή ένα γεγονός που μάλιστα συμβαίνει στο κέντρο. Όσο αυξάνεται η χρονική καθυστέρηση του δεξιά τόσο η πηγή μετατοπίζεται δεξιά με όριο το 1msec που η πηγή γίνεται αισθητή πάνω στο αριστερό ηχείο. Φαση ΙΙ Για 1msec < t < 50msec: Λαμβάνει χώρα το Precedence Effect και ο ακροατής αντιλαμβάνεται πάλι μόνο ένα ηχητικό γεγονός, όμως ο προσδιορισμός της κατεύθυνσης του γίνεται μόνο από το πρώτο κύμα που φτάνει στα αυτιά του. Το δεξιά απορρίπτεται με συνέπεια ένα ηχητικό γεγονός που προέρχεται από το αριστερό κανάλι. Φαση ΙΙΙ t > 50msec Σ αυτήν την φάση γίνονται αντιληπτοί δύο ξεχωριστοί ήχοι. Ο πρώτος που φτάνει είναι ο απ ευθείας και ο δεύτερος, το είδωλο του. Πρόκειται για το φαινόμενο της ηχούς(echo). Αυτή η χρονική καθυστέρηση είναι πολύ σημαντική γιατί δίνει (με την βοήθεια και των καθυστερήσεων από την φάση ΙΙ) την αίσθηση της αίθουσας(spaciousness) και ότι περιβάλλεσαι από τον ήχο (Envelopness). 19 Πηγή εικόνας 1.9, Jeroen Breebaart & Christof Faller, Spatial Audio Processing: MPEG Surround and other Applications, Αγγλική Έκδοση 2007, Εκδόσεις WILEY, σελ. 37 21

ΚΕΦΑΛΑΙΟ 2ο Ηχογράφηση Αναπαραγωγή Ήχου - ΙΣΤΟΡΙΚΑ 2.1 Τα πρώτα χρόνια 20 Η ιστορία ξεκινάει εδώ! Με τις πρώτες αποτυχημένες απόπειρες ηχογράφησης πριν ο Thomas Alva Edison ανακαλύψει τον φωνόγραφο το 1877. Για αιώνες, μέχρι τότε, ο άνθρωπος ονειρεύονταν να συλλάβει τους ήχους της φύσης και την μουσική που δημιουργούσε. Αυτό, λοιπόν που ξεκίνησε σαν ένα τμήμα πιο εξελιγμένης τηλεφωνικής συσκευής, κατέληξε στην ανάπτυξη ενός οργάνου που θα άλλαζε τον κόσμο μια για πάντα, κάνοντας τον πιο χαρούμενο. Εικόνα 2.1 Thomas Edison Αν και ο Αμερικάνος Έντισον θεωρείται ο πατέρας της ηχογράφησης, υπήρξαν και παλιότερες απόπειρες καταγραφής και αναπαραγωγής του ήχου. Η πιο παλιά επιτυχημένη προσπάθεια ήταν αυτήν του Edouard Leon-Scott de Martinville, ο οποίος, με τον φωνοαυτόγραφο του, στόχευε στην οπτικοποίηση του ήχου. Ούτε o Scott ούτε οι σύγχρονοι του είχαν καταφέρουν να ανα[αράγουν τις ηχογραφήσεις του. Μόνο πού πρόσφατα (2008) Αμερικάνοι ιστορικοί έφεραν στο φως τις ηχογραφήσεις του, που τοποθετούνται στα 1860 και μάλιστα κατάφεραν να τις αναπαράγουν με σύγχρονες μεθόδους. Οι ηχογραφήσεις βρέθηκαν σε αρχεία στο Παρίσι, τα οποία φωτογραφήθηκαν με πολύ ηψηλή ακρίβεια και στην συνέχεια μια εικονική βελόνα κατάφερε να αναπαράγει τον ήχο από τις φψτογραφίες. Ο λόγος ίσως που αυτή η συσκευή, και ο εφευρέτης της, δεν είχαν την αναγνώριση που τους έπρεπε, είναι το γεγονός πως αυτή δεν μπορούσε να αναπαράγει τον ήχο.http://www.firstsounds.org/sounds/scott.php Το 1887 ο Berliner ανακαλύπτει και λανσάρει το γραμμόφωνο, το οποίο θα εμπλακεί σε έναν σαραντακοντακονταετή πόλεμο, με στόχο μεγαλύτερο μερίδιο αγοράς, κόντρα στο φωνόγραφο του Έντισον, από τον οποίο θα βγει τελικά νικητής το 1929. Με ποιον τρόπο λειτουργούσαν, ποιες είναι οι διαφορές και ποιες οι ομοιότητες των δύο αυτών συσκευών, που ενεπλάκησαν σε έναν από τους πιο μακρόχρονους πολέμους στην ιστορία της τεχνολογικής εξέλιξης των ηχογραφήσεων? 20 Η εικόνες αυτού του κεφαλαίου προέρχονται από το site της Wikipedia. Σε άλλη περίπτωση η πηγή ορίζεται ρητά. 22

2.1.1 Φωνοαυτόγραφος Ο φωνοαυτόγραφος ήταν μια συσκευή πολύπλοκη και τελείως μηχανική, που περιείχε όμως, όλες τις βασικές αρχές της μοντέρνας ηχογράφησης εκτός από τον ηλεκτρισμό. Μία λεπτή μεμβράνη μετέφερε την δόνηση στην βελόνα η οποία άφηνε αποτύπωμα σε ένα καπνισμένο χαρτί, τυλιγμένο σε κύλινδρο που περιστρέφονταν. 2.1.2 Φωνόγραφος Ο φωνόγραφος είναι η πρώτη συσκευή στην ιστορία η οποία ηχογραφεί και αναπαράγει την εγγραφή. Ο φωνόγραφος του Έντισον βασίζεται στην βασική αρχή της ηχογράφησης που είναι η μετατροπή του ήχου σε μια μορφή που μπορεί να αποθηκευτεί σε κάποιο μέσο. Ας μην ξεχνάμε πως η ηλεκτρική εγγραφή θα αργήσει ακόμα να εμφανιστεί. Με ποιον τρόπο θα καταγράψουμε τον ήχο? Η λειτουργία είναι κατά κάποιον τρόπο μια προσομοίωση του αυτιού. Μια μεμβράνη που λαμβάνει της δονήσεις του αέρα που προκαλούνται από αλλαγές στην ένταση του ήχου. Ένα σύστημα που μοιάζει με τα τρία μικρά οστά του αυτιού (σφύρα, άκμονας, αναβολέας), που στόχος του είναι να μεταφέρει τις δονήσεις της μεμβράνης στην βελόνα με όσο το δυνατόν μεγαλύτερη ενίσχυση. Η βελόνα χαράζει το αποθηκευτικό μέσο. Το αποθηκευτικό μέσο στον φωνόγραφο είναι ο κύλινδρος Κύλινδροι Είναι το πρώτο εμπορικό μέσο για εγγραφή και αναπαραγωγή ήχου. Αποκαλούμενοι απλώς και δίσκοι (records) την εποχή της απόλυτης δημοτικότητας 23

τους (1888-1915). Εξωτερικά περιβάλλονταν από ένα υλικό που μπορούσε να χαραχτεί και εκεί καταγράφονταν ο ήχος. Αρχικά, ο Εντισον, στα πρώτα του πειράματα, χρησιμοποίησε αλουμινόχαρτο τυλιγμένο γύρο από ένα χειροποίητο κύλινδρο. Το αλουμινόχαρτο όμως αποδείχθηκε μη πρακτικό και έτσι στράφηκε στους κέρινους κυλίνδρους. Οι τελευταίοι παράγονταν μαζικά στα τέλη της δεκαετίας 1880. Μειονεκτούσαν, ωστόσο, ως προς το γεγονός πως η ηχογράφηση μπορούσε να παιχτεί μερικές εκατοντάδες φορές πριν πάψει να είναι ορατή. Τότε ο αγοραστής μπορούσε να ξανακάνει την επιφάνεια λεία (ξύρισμα) και να ξαναγράψει τον κύλινδρο. Καινούριες πατέντες κατατέθηκαν τις δεκαετίες του 80 και του 90 οι οποίες βελτίωναν τις ιδιότητες του μέσου, όπως δυνατότητα περισσότερων αναπαραγωγών. Οι κύλινδροι αν και συνηθίζονταν να πωλούνται με εγγεγραμμένη μουσική, είχαν το πλεονέκτημα πως επέτρεπαν την εγγραφή τους από τον αγοραστή, γεγονός που τους επέτρεψε να επιζήσουν περισσότερο της διαμάχης με τους δίσκους, οι οποίοι πωλούνταν μονάχα γραμμένοι. Το 1906 η Indestructible Record Company έφτιαξε έναν κύλινδρο από σελιλόιντ, πλαστικό που φτιάχνεται από κυτταρίνη, που αποτελούσε ότι πιο ανθεκτικό από μέσα αποθήκευσης μέχρι την ανακάλυψη της ψηφιακής αποθήκευσης. Δεν έχουν την δυνατότητα να «ξυριστούν» ώστε να ξαναγραφούν, όμως επιτρέπουν περισσότερες αναπαραγωγές από ποτέ (πολύ περισσότερες από δίσκους βινυλίου και κασέτες). Η εταιρία του Έντισον έφτιαξε το δικό της τύπο, ανθεκτικού κυλίνδρου, από κεχριμπάρι (η εξωτερική εγγράψιμη επιφάνεια), ενώ το εσωτερικό φτιάχτηκε από Βακελίτη. Οι κύλινδροι έπαψαν να παράγονται μαζικά μετά το 1929. 2.1.3 Γραμμόφωνο Το 1886 πρότεινε ο Emile Berliner (1851-1929) να αντικατασταθεί ο κύλινδρος με «αυλάκι ήχου» του Έντισον, με μία επίπεδη πλάκα όπου, μετά από διάφορες βελτιώσεις, μία ελικοειδής διαδρομή σχημάτιζε ένα συνολικό αυλάκι σε όλη την επιφάνεια της πλάκας και η βελόνα έκανε ταλαντώσεις, εγκάρσια στην κίνηση Η βασική του διαφορά είναι πως αναπαράγει δίσκους. Δίσκοι Αποτέλεσαν το αντίπαλο δέος του κυλίνδρου για περισσότερο από δυο δεκαετίες, στη μάχη για την εύνοια του αγοραστικού κοινού. Το αποθηκευτικό μέσο που χρησιμοποιούσε η έτερη συσκευή το γραμμόφωνο. Οι δίσκοι άρχισαν να κερδίζουν την μάχη την δεκαετία του 10, χάρις στην πολύ καλή τους διαφημιστική καμπάνια. Είχαν πείσει τον Καρούζο και 24

άλλους καλλιτέχνες και δισκογραφικές να γράφουν αποκλειστικά σε δίσκους, έτσι έδιναν την εντύπωση ότι οι δίσκοι ήταν καλύτεροι. Επιπλέον πλεονεκτήματα ήταν η εύκολη αποθήκευση τους και η χαμηλή τους τιμή λόγω της απλότητας τους και του γεγονότος πως η χάραξη οδηγούσε την βελόνα. Το τελευταίο βεβαίως οδηγούσε σε ταχύτερη αχρήστευση του δίσκου λόγω φθοράς του υλικού και επιδείνωσης της ποιότητας του ήχου. Αρχικά είχαν χειρότερη πιστότητα από τους κυλίνδρους, μέχρι όμως, την δεκαετία του 10 η ποιότητα των καλών δίσκων είχε προσεγγίσει αυτή των κυλίνδρων. Επίκαιρα 21 "In December, 1877, a young man came into the office of the SCIENTIFIC AMERICAN, and placed before the editors a small, simple machine about which very few preliminary remarks were offered. The visitor without any ceremony whatever turned the crank, and to the astonishment of all present the machine said : " Good morning. How do you do? How do you like the phonograph?" The machine thus spoke for itself, and made known the fact that it was the phonograph... Ενδεικτικές ημερομηνίες 1857:Ο Γάλλος Leon Scott δημιουργεί τον φωνοαυτογράφο (phonautograph) που μετέτρεπε μία κυμαινόμενη πίεση αέρα σε ένα ορατό ίχνος πάνω σε έναν "καπνισμένο" κύλινδρο με τη χρήση μίας γραφίδας προσαρτημένης σε μία μεμβράνη. Η καταγραφή αυτή του ήχου δεν μπορούσε να αναπαραχθεί. 1886: Ο Edison αποκτά δίπλωμα ευρεσιτεχνίας από τις ΗΠΑ για ένα κύλινδρο εγγραφής καλυμμένο με κερί. Αυτό σηματοδότησε το τέλος του κυλίνδρου με φύλλο κασσίτερου 1877: Τον Απρίλιο ένας ακόμα Γάλλος, ο Charles Cros, ποιητής και εφευρέτης της έγχρωμης φωτογραφικής επεξεργασίας, πρότεινε τη βελτίωση της μεθόδου του Scott με φωτοτύπιση (photoengraving) του ίχνους πάνω στο μέταλλο, με την πιθανότητα της ανίχνευσης του μοντέλου με αποτέλεσμα την αναπαραγωγή του αρχικού ήχου. Τον Ιούλιο ο Thomas Alva Edison ανακάλυψε μία μέθοδο ηχογράφησης και αναπαραγωγής ήχου ακολουθώντας διαφορετική μέθοδο από αυτή του Scott και του Cros. Έκανε αίτηση για ευρεσιτεχνία στη Βρετανία και στις 24 Δεκεμβρίου έκανε αντίστοιχη αίτηση στις ΗΠΑ που κάλυπτε τις ομιλούσες συσκευές και τους εγγραφείς ήχου που έγιναν γνωστοί ως Φωνογράφοι. Οι πρώτοι φωνογράφοι χρησιμοποιούσαν κυλίν-δρους με κάλυψη φύλλου κασσίτερου 1887: Ο Berliner ανέπτυξε μια επιτυχημένη μέθοδο εκ των υστέρων μεταφοράς ενός αυλακιού που περιείχε ηχητική πληροφορία σε ένα δίσκο. Επίσης ανέπτυξε μία μέθοδο μαζικής παραγωγής αντιτύπων ενός πρωτότυπου δίσκου 1889: Πρόγονοι του juke-box με μεγάλη απήχηση στο κοινό δημιούργησαν μία ανάγκη για περισσότερα ηχογραφήματα, κυρίως για κωμικούς μονολόγους 1890: Η Edison's Phonograph και η Bell-Tainter Graphophone βρίσκονται σε έντονο ανταγωνισμό. Ο φωνογράφος φαίνεται να είναι πιο δημοφιλής 21 Scientific American July 25, 1896 http://www.machine-history.com/the%20phonograph.%201877%20thru%201896 25

1895: Η ηχογραφημένη μουσική για ψυχαγωγία άρχισε να βρίσκει ανταπόκριση από το κοινό. Η απαίτηση για ηχογραφήσεις έδωσε το κίνητρο για επενδύσεις σε νέες τεχνολογίες από τις νεοσύστατες δισκογραφικές εταιρίες 1901: Η αρχική μέθοδος της χάραξης μιας πλάκας με οξύ, αντικαθίσταται με τη χρήση στρώματος κεριού 1902: Ο Caruso έκανε τον πρώτο από τους πολλούς δίσκους του. Η δημοτικότητα του κυλίνδρου αρχίζει να υποχωρεί 1906: Το γραμμόφωνο Victrola της εταιρίας Victor κάνει την εμφάνισή του. Η επιτυχία του ήταν τέτοια που το όνομα Victrola περιέγραφε από τότε όλα τα γραμμόφωνα 1917: Οι πρώτες κυκλοφορίες μουσικής τζαζ σε κυλίνδρους καθυστέρησαν την οριστική εξαφάνιση αυτού του μέσου 1923: Οι δισκογραφικές εταιρίες βρίσκονται σε ύφεση λόγω της αυξανόμενης δημοτικότητας του ραδιοφώνου 2.2 Η Ελληνική ιστορία 1896: Η πρώτη ηχογράφηση ελληνικού τραγουδιού πραγματοποιείται από το Μιχαήλ Αραχτίντζη. Η ιστορία της ελληνικής δισκογραφίας ξεκίνησε εκεί στη Νέα Υόρκη που τυπώθηκαν οι πρώτοι 8 δίσκοι 78 στροφών και βάρους..200 γραμμαρίων στις 4 Μαΐου του 1896 με την εταιρεία Berliner που «έγραψε» τη φωνή του τενόρου Αραχτίντζη, του οποίου η καλλιτεχνική τύχη έκτοτε αγνοείται 1924: Δημιουργείται η πρώτη δισκογραφική εταιρεία στην Ελλάδα. Πρόκειται για την Odeon. 1929: Η πρώτη ηχογράφηση στην Ελλάδα σε ξενοδοχείο 2.3 Ηλεκτρική ηχογράφηση 1906: Ο Fleming δημιουργεί τη διοδική θερμική βαλβίδα και αργότερα ο Lee de Forest την τριοδική. Η ηλεκτρική ηχογράφηση ήταν πλέον εφικτή 1919: Η ηλεκτρική ηχογράφηση βρίσκεται σε πειραματικό στάδιο. Η Garrard Engineering, θυγατρική της British Crown Jewellers κατασκεύασε μηχανισμούς ακριβείας για γραμμόφωνα 1925: Είναι η χρόνια που πολλές δισκογραφικές εταιρίες κάνουν τις πρώτες ηλεκτρικές ηχογραφήσεις Η ιστορία με το ηλεκτρικό ρεύμα δεν είναι καινούρια, κρατάει από το 1600. Στα τέλη του 19 ου αιώνα γινόντουσαν δεκάδες ανακαλύψεις όπως τηλεφωνία, ραδιοφωνία και ηλεκτρικό φως. Η ηχογράφηση και η κινηματογράφηση λειτουργούν μηχανικά. Αξίζει να σημειωθεί πως το φιλμ υπόσχεται πολύ καλύτερη πιστότητα ήχου και ενώ πάρχει ήδη η δυνατότητα μετατροπής του ακουστικού και 26

οπτικό (στο φιλμ) κύματος σε ρεύμα, χάρη στο φωτοηλεκτρικό φαινόμενο, δεν υπάρχει η δυνατότητα να ενισχυθεί το ηλεκτρικό σήμα, με αποτέλεσμα να είναι άχρηστο. Το αδιέξοδο έρχεται να λύσει ο Lee de Forest με την ανάπτυξη τη λυχνίας κενού το 1906, γνωστής και ως διόδου. Ένα χρόνο αργότερα αναπτύσσει την τρίοδο, μια συσκευή με τρία ηλεκτρόδια, που ενίσχυε το ηλεκτρικό σήμα. α β Εικόνα 22 : Διάγραμμα της τριοδικής ηλεκτρονικής λυχνίας. Ο John Ambrose Fleming σχεδίασε έναν προγενέστερο τύπο λυχνίας γνωστή ως oscillation valve, η οποία ήταν μία δίοδος. Ο Lee de Forest τοποθέτησε ένα ακόμα ηλεκτρόδιο λυχνίας (grid) μεταξύ ανόδου (plate) και καθόδου (filament). Συνοπτικά το μαθηματικό μοντέλο της ενίσχυσης: Τα τρία μεγέθη τάση στο πλέγμα V g, ρεύμα ανόδου(ι α ), τάση ανόδου (V a ) Για μια εφαρμοζόμενη τάση στο grid έστω V g = 1 έχουμε την κίτρινη χαρακτηριστική. Για μια τάση ανόδου V a = 200V έχουμε ρεύμα Ι α = 2.25 ma. Επομένως για μια αντίσταση στην άνοδο V Ra = 1000Ω V Ra = 22.5V Εάn θέσουμε τώρα την V g = 2V με V α = 200V => Ι α = 0.5 ma => V Ra = 5V Είναι επομένως φανερό πως για μια άυξηση 1V της V g έχουμε αύξηση 17,5 της V Ra 22 Πηγή εικόνων Wikipedia 27

Την ανακάλυψη αυτή προσπάθησε ακαριαία να εκμεταλλευτεί ο Lauste ο οποίος χρησιμοποίησε την εξέλιξη για να αναπαράγει ήχο όμως δεν κατάφερε να το κάνει εμπορικό. Με την ανακάλυψη του Forest από το 1925 οι μεγάλες δισκογραφικές εταιρίες άρχισαν να χρησιμοποιούν μικρόφωνα, μεγάφωνα και κονσόλες μίξης για τις παραγωγές τους, ακολουθώντας και οι μικρότερες εταιρίες στο τέλος της δεκαετίας. Η ηλεκτρική ηχογράφηση βελτίωσε την ποιότητά της μουσικής απόδοσης. 2.3.1 Μικρόφωνα Τα μικρόφωνα είναι ηλεκτροακουστικοί μετατροπείς που μετατρέπουν το ακουστικό σήμα σε ηλεκτρικό. Τα μικρόφωνα χρησιμοποιούνται σε μια πληθώρα πεδίων όπως: ραδιόφωνο, τηλεόραση, τηλεφωνία, πιο πρόσφατα για αναγνώριση φωνής ή VoIP αλλά και για ανίχνευση υπερήχων πχ. για σηματοδότηση με υπερήχους. Χαρακτηριστικές κατηγορίες μικροφώνων είναι: 1. Μικρόφωνο άνθρακα (carbon microphone) 2. Μικρόφωνο κρυστάλλου (piezoelectric microphone) 3. Ηλεκτροδυναμικό μικρόφωνο κινούμενου πηνίου(moving-coil microphone) 4. Ηλεκτροδυναμικό μικρόφωνο ταινίας (ribbon microphone) 5. Πυκνωτικό μικρόφωνο (condenser microphone) 6. Ηλεκτροστατικό μικρόφωνο (electrets microphone) Οι πρώτες πατέντες για μικρόφωνα κατατέθηκαν από τους συνήθεις ύποπτους Thomas Alva Edison και Emile Berliner τον Μάρτιο και τον Ιούνιο του 1877 αντίστοιχα. Επρόκειτο για ένα μικρόφωνο άνθρακα και αξίζει να σημειωθεί πως τελικά η πατέντα του Berliner κρίθηκε άκυρη από τα αμερικάνικα και αγγλικά δικαστήρια. Θα περιγράψω την αρχή λειτουργίας αυτού του μικροφώνου, γιατί είναι σημαντικό να γίνει φανερή η μηχανική ιδιοφυία που οδήγησε σε αυτές της ανακαλύψεις. Οι περισσότερες τηλεφωνικές συσκευές είναι εφοδιασμένες με μικρόφωνα άνθρακα λόγω χαμηλού κόστους και μεγάλης ευαισθησίας. Το μικρόφωνο άνθρακα δεν μετατρέπει την ακουστική ενέργεια των ηχητικών κυμάτων σε ηλεκτρική ενέργεια αλλά διαμορφώνει το συνεχές ρεύμα που παίρνει από την πηγή τροφοδοτήσεώς του με το ακουστικό σήμα που παράγεται από τον ομιλητή. Το ακουστικό σήμα θέτει σε ταλάντωση τη μεμβράνη του μικροφώνου η οποία πιέζει άλλοτε εντονότερα και άλλοτε ασθενέστερα τα ψήγματα του άνθρακα που βρίσκονται σε ειδικό χώρο. Συνεπώς μεταβάλλεται η αντίσταση των ψηγμάτων και στη συνέχεια το ρεύμα στο κύκλωμα του μικροφώνου διαμορφώνεται ανάλογα με την ένταση της ομιλίας του συνδρομητή. 28

Εικόνα Μικρόφωνο άνθρακα Το ρεύμα για f=0 δηλαδή όταν δεν υπάρχει κάποιος ήχος και η μεμβράνη δεν πάλλεται. i M = R M + R T όπου R M η αντίσταση ανθρακικού ψήγματος V B η τάση τροφοδοσίας του μικροφώνου και R T η υπόλοιπη αντίσταση του μικροφώνου. Έστω ότι υφίσταται ημιτονοειδής ήχος και η μεμβράνη πάλλεται, αυτό έχει σαν αποτέλεσμα να μεταβάλλεται η αντίσταση R M σε συνάρτηση με την συχνότητα ταλάντωσης της μεμβράνης (ω) και όπως δίνεται από την σχέση Έτσι i M = V B r M + R T = V B r M = R M (1 + x sin ωt) V B R M + R M x sin ωt + R T = V B R M + R T 1 (1 + a sin ωt) (1) Όπου α = χr M. Θα πρέπει να σημειωθεί ότι σε ένα κύκλωμα μικροφώνου μιας R M +R T τηλεφωνικής συσκευής ισχύει R M << R T και συνεπώς α<<1. Έτσι μπορούμε να αναπτύξουμε τον δεύτερο όρο της (1) σε σειρά: = 1 a sin ωt + α 2 sin ωt 2 1 (1+a sin ωt) και η σχέση (1) μπορεί να γραφεί προσεγγιστικά ως: i M = V B R M + R T (1 a sin ωt + α 2 sin ωt 2 ) Aπό την παραπάνω σχέση παρατηρούμε ότι η μεταβλητή συνιστώσα του ρεύματος φέρει την πληροφορία του ακουστικού σήματος ως θεμελιώδη συχνότητα. Όμως, εμφανίζονται και άλλοι όροι αρμονικών που συμβάλλουν στην παραμόρφωση του σήματος στην έξοδο του μικροφώνου. Εάν το α είναι πολύ μικρό, η παραμόρφωση 29

μπορεί να είναι αμελητέα αλλά τότε και η ευαισθησία του μικροφώνου είναι μικρή. Ο συμβιβασμός που πρέπει να γίνει επιτρέπει κάποια παραμόρφωση στο σήμα. 2.4 Μαγνητική ηχογράφηση 1928: Επινόηση της μαγνητικής ταινίας από τον Fritz Pfleumer 1934: Η εταιρία BASF κατασκεύασε 50.000 μέτρα μαγνητικής ταινίας για πειράματα μεγάλης κλίμακας από την AEG 1935: Η εταιρία AEG-Telefunken έκανε την πρώτη δημόσια επίδειξη ενός μαγνητοφώνου, του "Magnetophon" στην έκθεση του Βερολίνου 1936: Οι μηχανικοί της BASF, χρησιμοποιώντας ένα "Magnetophon" ηχογράφησαν τη Συμφωνία Νο 39 του Μότσαρτ από τη Φιλαρμονική Ορχήστρα του Λονδίνου σε διεύθυνση του Sir Thomas Beecham. Ηταν η πρώτη ηχογράφηση συμφωνικής ορχήστρας, η οποία υπάρχει ακόμα και μάλιστα έχει απρόσμενα καλή ποιότητα ήχου Κατά την δεκαετία του 30 η ηχογράφηση έχει αρχίσει να μετατρέπεται από μηχανική σε μαγνητική. Η τεχνολογία επιτρέπει ήδη την μετατροπή του ακουστικού σε ηλεκτρικό σήμα, που ενισχύεται χάρη στην τρίοδο του Forest. Αν θέλουμε να συναντήσουμε της απαρχές της μαγνητικής εγγραφής πρέπει να πάμε αρκετά πιο πίσω και στο 1899 όπου έχουμε μαγνητική καταγραφή σε σύρμα (magnetic wire recorder) από τον Valdemar Poulsen με το Telegraphone. Το 1928 Ο Γερμανός Fritz Pfleumer ανακάλυψε την πρώτη μαγνητική ταινία. Η Γερμανική εταιρία AEG (Βασική Εταιρία Ηλεκτρισμού) πήρε τα δικαιώματα του Pfleumer και το 1932 σε συνεργασία με την IG Farben (χημικός oργανισμός) κατασκεύασε το πρώτο παγκοσμίως μαγνητόφωνο, το Κ1. To 1962 η Phillips εφευρίσκει την κασέτα μαγνητικής ταινίας, compact cassette. Το 1964 αρχίζουν και πωλούνται προεγγεγραμμένες κασέτες. Ως το 1966 έχουν πουληθεί μόνο στην Αμερική 250.000 εγγραφείς κασετών, ενώ η Ιαπωνία γίνεται ο μεγάλος πάροχος των συσκευών. Το 1968 έχουν πουληθεί πάνω από 2,4 εκατομμύρια συσκευές αναπαραγωγής. 30

2.4.1 Μαγνητικά Υλικά Η μαγνητική ταινία εγγραφής βασίζεται στο φαινόμενο του παραμένοντος μαγνητισμού στα μαγνητικά υλικά. Πιο συγκεκριμένα όταν κάποιο (φερρομαγνητικό) υλικό τεθεί εντός μαγνητικού πεδίου, τότε τα στοιχειώδη μαγνητικά δίπολα που το αποτελούν προσανατολίζονται λιγότερο ή περισσότερο στην κατεύθυνση του εξωτερικού πεδίου. Όταν το πεδίο απομακρυνθεί οι στοιχειώδεις αυτοί μαγνήτες τείνουν και πάλι λιγότερο ή περισσότερο να επανέρθουν στην αρχική τους κατεύθυνση. Όταν ο προσανατολισμός, δηλαδή η μαγνήτιση του υλικού μετά την απομάκρυνση του πεδίου μείνει, τότε το υλικό χαρακτηρίζεται ως σκληρό μαγνητικό υλικό και είναι ικανό να αποθηκεύσει πληροφορία. Στην αρχή χρησιμοποιήθηκαν εκτός από σύρμα, υλικά όπως ατσάλινες ταινίες. Η τελευταία αποτέλεσε επινόηση του Marconi το 1930, η οποία όμως απορρίφθηκε σχετικά γρήγορα, λόγω επικινδυνότητας, αν και υιοθετήθηκε από μερικούς οργανισμούς(ράδιο Halim EI-Dabh Αίγυπτος, Ραδιοφωνία - Καναδας). Το πιο ιστορικό και διαχρονικό μέσο είναι η γνωστή σε όλους μας μαγνητική ταινία. 2.4.2 Μαγνητική Ταινία Ως μαγνητικά υλικά αποθήκευσης στις μαγνητικές ταινίες εγγραφής χρησιμοποιούνται διάφορα οξείδια του σιδήρου αλλά και το διοξείδιο του χρωμίου διότι αυτά πλεονεκτούν ως προς το SNR αλλά και τη δυναμική τους περιοχή. Πιο συγκεκριμένα, ιδιαίτερα αποτελεσματικά κρίνονται τα παραπάνω χημικά με μέγεθος κόκκου της τάξεως των 0.5μ. Τα μαγνητικά υλικά αναμειγνύονται με μια κολλώδη και λιπαντική ουσία και το μίγμα που δημιουργούν ονομάζεται binder (κέλυφος) και έχει σκοπό να διατηρεί τόσο τις δομικές ιδιότητες του μαγνητικού υλικού, όσο και να το σταθεροποιεί επάνω στον σκελετό της μαγνητικής ταινίας. Ως σκελετός substrate της μαγνητικής ταινίας χρησιμοποιείται ταινία πολυεστέρα (ή πολυβινυλοχλωριδίου (πάχους περίπου 0.01που έχει μηχανική και χημική αντοχή. Ανάγνωση και Εγγραφή: Η εγγραφή και ανάγνωση της ταινίας πραγματοποιείται με κεφαλές όπως αυτή της εικόνας. Κατά την εγγραφή ένα μικρόφωνο αναλαμβάνει την μετατροπή του ηχητικού κύματος σε σήμα τάσης. Αυτό το σήμα τάσης υπόκειται σε μια μικρή επεξεργασία για την ποιοτικότερη αποθήκευσή του και οδηγείται στην κεφαλή, όπου διεγείρει το πηνίο της κεφαλής. Το πηνίο με τη σειρά 31