Πολυμεσικές Εφαρμογές Ενότητα 6: ΗΧΟΣ Γεώργιος Στυλιαράς Σχολή Οργάνωσης και Διοίκησης Επιχειρήσεων Τμήμα Διαχείρισης Πολιτισμικού Περιβάλλοντος και Νέων Τεχνολογιών
ΕΙΣΑΓΩΓΙΚΑ Ψηφιοποίηση ήχου: Δειγματοληψία, Κβάντωση, Κωδικοποίηση Ήχος εκφράζεται σαν συνεχής συνάρτηση της έντασης του σε σχέση με τον χρόνο Δειγματοληψία: Σε τακτές χρονικές στιγμές παίρνουμε δείγμα της έντασης του ήχου δημιουργείται ένα στιγμιότυπο της έντασης σε μια δεδομένη χρονική στιγμή Συχνότητα δειγματοληψίας: Συχνότητα >>, Ποιότητα >>, Όγκος >> γιατί υπάρχει περισσότερη πληροφορία Μετριέται σε χιλιάδες κύκλους ανά δευτερόλεπτο ή KHz
ΚΒΑΝΤΩΣΗ ΚΩΔΙΚΟΠΟΙΗΣΗ Μετατροπή του δείγματος από συνεχή τιμή σε διακριτή Κβαντισμένες τιμές: επιλογή πλήθους τιμών που αναπαριστάνουν την ένταση του ήχου Αντιστοίχηση τιμής δείγματος σε μια κβαντισμένη τιμή (Δε γίνεται να υπάρχει μια κβαντισμένη τιμή για κάθε δείγμα, χρειάζεται στρογγυλοποίηση) Κωδικοποίηση της κβαντισμένης τιμής σε δυαδική αναπαράσταση Bits ψηφιακών τιμών >>, Ακρίβεια αναπαράστασης >>, Στρογγυλοποίηση <<, Όγκος >> Audio CD δημιουργούνται με αυτή τη μέθοδο πιο ανθεκτικά (700 ΜΒ, 80 λεπτά διάρκεια) Μέγεθος αρχείου (bits) = Συχνότητα (Hz) x Μέγεθος δείγματος (bits) x Διάρκεια (sec) Στερεοφωνικός ήχος επί 2 π.χ. stereo 44,1 KHz, 16 bit / 8 88200 bytes/sec 176,4 KB/sec stereo Παραμόρφωση (ποιότητα κυκλώματος δειγματολοηψίας), ποσοστό μέχρι 0,3% (δεν είναι αντιληπτό) Θόρυβος: υπεισέρχεται στη διαδικασία της δειγματοληψίας >>, Ποιότητα << (φύσημα) Ηχητικό σύστημα υπολογιστή: ο θόρυβος μετριέται σε SNR (signal-to-noise ratio) >>, θόρυβος <<
ΜΕΘΟΔΟΙ ΚΩΔΙΚΟΠΟΙΗΣΗΣ PCM (Pulse code modulation Παλμοκωδική κωδικοποίηση): Ευρέως χρησιμοποιούμενη, αποθήκευση ένα-προς-ένα των δειγμάτων, γραμμική κωδικοποίηση: το πλήθος των τιμών της κβάντωσης κατανέμονται ομοιόμορφα σε όλο το εύρος των τιμών του σήματος, όχι συμπίεση μεγάλο μέγεθος, όχι απώλειες. Mu-Law PCM, A-Law PCM: Παραλλαγή PCM λογαριθμική κωδικοποίηση PCM αντιστοιχεί περισσότερη πληροφορία στις χαμηλές συχνότητες και λιγότερη στις ψηλές (δεν είναι αντιληπτές από το ανθρώπινο αυτί). 8bit+log = 14bit pure PCM καλύτερη αναπαράσταση όπου χρειάζεται και συμπίεση. Mu-Law (ISDN B.Α. +Ιαπωνία), A-Law (αλλού) τυποποίηση logo-pcm από ITU-T. DPCM (Differential/Διαφορική PCM): Κάθε δείγμα κωδικοποιείται σε σχέση με το προηγούμενο και όχι ξεχωριστά όπως στο PCM παραλλαγή: διαμόρφωση δέλτα: bit 1 για αμέσως μεγαλύτερη τιμή ή 0 για μικρότερη (δουλεέυι γιατί ο ήχος είναι κυρίως συνεχής) εξοικονόμηση χώρου Adpative /Προσαρμοζόμενη DPCM: Προβλέπεται το επόμενο δείγμα και αποθηκεύετει μόνο η διαφορά που απαιτεί λιγότερα bits από ολόκληρη την τιμή LPC (linear predictive coding γραμμική προβλεπόμενη κωδικοποίηση): κατάλληλη για ανθρώπινη ομιλία, πετυχαίνει σημαντικούς βαθμούς συμπίεσης χρησιμοποιείται στην κινητή τηλεφωνία (η φωνή μεταδίδεται ψηφιακά σε όλο το εύρος)
ΣΥΜΠΙΕΣΗ 176,4 ΚΒ 10,1 ΜΒ/min ήχου audio cd Συμπίεση για ταχύτερη μετάδοση μέσω Internet, Τ/Ο, sat, Κινητής τηλεφωνίας, Ρ/Φ / καλύτερη διαχείριση, λιγότερο όγκο Μέθοδοι συμπίεσης χρησιμοποιούν ψυχο-ακουστικά μοντέλα με βάση τα οποία συμπιέζονται πληροφορίες που δε γίνονται αντιληπτές από το ανθρώπινο αυτί αρχικά έξω από 20 Hz 20 KHz μειώνονται τα bits που κωδικοποιούν τις τιμές κβάντωσης (δεν επηρ. συχν. δειγματοληψίας) MPEG (Motion Picture Expert Group) συνεργασία εταιρειών/παν/μίων/ερευν.ινστ ISO-approved πρωτόκολλα για ήχο/βίντεο/εικόνα / MPEG1 από τα πρώτα πρότυπα MPEG-1 Audio αποκλειστικά για ήχο υψηλής πιστότητας συμπίεση 3 επίπεδα χρησιμοποιεί αλγόριθμους συμπίεσης / ισχύει προς τα πίσω συμβατότητα / MPEG2 πολυκάναλος ήχος DVD Video / MPEG3 / MPEG4: αλγ. τεχνητής νοημοσύνης Layer1: Ψηφιακή κασέτα DCC Philips (αποτυχία), 4/1 συμπίεση / μέτρια πιοότητα, 192-196 KBps min bitrate Layer2: DAB, VideoCD, DVD, μέχρι 8/1 συμπίεση, καλύτερη ποιότητα, 96-128 KBps Layer3: 12/1 συμπίεση, πλης. Audio cd, 64 Kbps
ΑΛΛΕΣ ΤΕΧΝΟΛΟΓΙΕΣ MP3 / Internet / Peer-to-peer / Copyright / Players / Multimedia / Μετατροπή AudioCD σε MP3 Άλλες εφάμιλλες τεχνολογίες: WMA, ASF (ενσωματωμένη πληροφορία για copyrights, Media Player, streaming), AAC (ενσωματωμένη πληροφορία για copyrights, itunes / ipod), OGG (Vorbis, ανοιχτό λογισμικό), AC-3 Dolby Digital (χρησ. σε DVD), SWA (Director) Real Audio (χαμηλή ποιότητα, streaming) + wav συνήθως ασυμπίεστος ήχος aif κωδικοποίηση ήχου σε Mac mid/rmi Αρχεία MIDI: Δεν καταγράφουν ηχητικό σήμα, αλλά ενέργεια που χρείαζεται για να παραχθεί / αντιστοιχία με διανυσματικές εικόνες / είναι σαν να αποθηκεύονται οι νότες για κάθε μουσική / κάρτα ήχου περιέχει δείγματα από όλες τις νότες κάθε οργάνου και πόσο δυνατά πρέπει να παίζονται και με βάση νότες παράγει τη μουσική όγκος <<
ΥΛΙΚΟ Κάρτα ήχου: συνήθως ενσωματωμένη στον υπολογιστή, ή ξεχωριστή κάρτα ήχου. Creative. Χαρακτηριστικά: αριθμός bits με τον οποίο αναπαριστάνεται ο ήχος σε ψηφιακή μορφή, μέγιστος αριθμός δειγματοληψίας που μπορεί να πετύχει (τουλάχιστον 16 bit @ 44,1 KHz και 24@96) in: Μικρόφωνο, Line In / out: ποιοτικά: ηχεία ψηλές / μέσες συχνότητες, χαμηλές (subwoofer) / 2 (stereo?) με subwoofer ή έξοδοι (5.1) για AC-3 dolby digital της Creative με ενισχυτή / σημασία στην τοποθέτηση Τεχνικές σύνθεσης ήχου (για την αναπαραγωγή ήχου από κάρτα ήχου) FM παλιότερα / χρήση τσιπ σύνθεσης FM / αναπαραγωγή με χρήση πολλών απλών κυματομορφών (εξομοίωση) δύσκολη η προσομοίωση φυσικών οργάνων, εντυπωσιακοί ηλεκτρονικοί ήχοι Wavetable χρήση ROM (~8ΜΒ) που αποθηκεύει βασικές κυματομορφές από κάθε όργανο σε ψηφιακή μορφή, μεγαλύτερη ROM ακριβέστερος, πιστότερος ήχος (και σε σχέση με FM) DSP (Digital Signal Processor): καταγραφή, επεξεργασία και αναπαραγωγή ψηφιακού ήχου, αυξομείωση έντασης, μεταβολή ρυθμού δειγματοληψίας, μπάσα, πρίμα, δη, ηχ. Εφέ ADC (δειγματοληψία / κωδικοποίηση) / DAC (τροφοδότηση ηχείων με αναλογικό ήχο), ενσ. σε cd-rom Interface MIDI για σύνδεση συμβατών πληκτρολογίων
ΛΟΓΙΣΜΙΚΟ Προγράμματα επεξεργασίας ήχων κυματομορφής: import/copy-cutpaste/volume/frequency/αλλαγή επιπέδων κβάντωσης/ αλλαγή χρον. διάρκειας/mix/απαλοιφή θορύβου/effects (fade)/συμπίεση: Windows Sound Recorder, Sonic Sound Forge, Macromedia SoundEdit Προγράμματα επεξεργασίας ήχων midi: import/edit/preview/publish
ΕΦΑΡΜΟΓΕΣ ΠΟΛΥΜΕΣΩΝ Ήχοι περιεχομένου (όπως διάλογοι στον κινηματογράφο) και ήχοι περιβάλλοντος (OST, μη κρίσιμοι, π.χ. φωνές ζώων για παρουσίαση ζωολογικού κήπου) Συμπληρωματικός ρόλος: μουσικό background σε κείμενα, σε αλλαγές ενοτήτων (ανάλογα με τη φύση τους), πάτημα κουμπιών (recycle bin), σε automated image galleries, animation, αφήγηση, εκφώνηση οδηγιών, ηχητικά και μουσικά ντοκουμέντα, ΑΜΕΑ Συνετή χρήση εφέ, επιλογή ήχου ανάλογα με περιεχόμενο, προσοχή στο μέγεθος
DIRECTOR SWA member play/stop/pause duration state 0 (loading), 5 (ready) percentplayed volume 0..255 Background (sprite) /mouseover/click
ΒΙΒΛΙΟΓΡΑΦΙΑ Δημητριάδης Σ.Ν., Πομπόρτσης Α.Σ., Τριανταφύλλου Ε.Γ. (2004) Τεχνολογία πολυμέσων θεωρία και πράξη, Εκδόσεις Τζιόλα, ISBN: 960-418- 025-8 (Κεφάλαιο 9). Δημοσθένης Ακουμιανάκης, Διεπαφή Χρήστη-Υπολογιστή: μια σύγχρονη προσέγγιση, εκδόσεις. Κλειδάριθμος, 2006 Νικόλαος Αβούρης, Εισαγωγή στην επικοινωνία ανθρώπου-υπολογιστή, Εκδόσεις ΔΙΑΥΛΟΣ, Αθήνα 2000Dix, A., Finlay, J., Abowd, G., Beale., R.. Επικοινωνία Ανθρώπου - Υπολογιστή. Μ. Γκιούρδας, Αθήνα 2004. Jennifer Preece, Yvonne Rogers, Helen Sharp, Interaction Design: Beyond Human-Computer Interaction, John Wiley & Sons, 2002 Δ. Ζευγώλης, Γ. Στυλιαράς, ΠΟΛΥΜΕΣΑ, Εκδόσεις Τζιόλα, 2011
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στo πλαίσιo του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Πατρών» έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους.
Σημείωμα Ιστορικού Εκδόσεων Έργου Το παρόν έργο αποτελεί την έκδοση 1.0.
Σημείωμα Αναφοράς Copyright Πανεπιστήμιο Πατρών, Γεώργιος Στυλιαράς. «Πολυμεσικές εφαρμογές. ΗΧΟΣ». Έκδοση: 1.0. Πάτρα 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: https://eclass.upatras.gr/courses/culture162.
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Μη Εμπορική Χρήση Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] http://creativecommons.org/licenses/by-nc-sa/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί.
Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς το Σημείωμα Αδειοδότησης τη δήλωση Διατήρησης Σημειωμάτων το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει) μαζί με τους συνοδευόμενους υπερσυνδέσμους.