Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Σχετικά έγγραφα
Συμπίεση Πολυμεσικών Δεδομένων

ΚΩ ΙΚΟΠΟΙΗΣΗ ΟΜΙΛΙΑΣ. Μικρότερος ρυθµός µετάδοσης Μεγαλύτερη χωρητικότητα. Νοε-06 Γ.Ι.Στεφάνου 1

Διαδικασία Ψηφιοποίησης (1/2)

Περιεχόμενα. 4.1 Χαρακτηριστικά του ήχου Ψηφιοποίηση με μετασχηματισμό Ψηφιοποίηση με δειγματοληψία Πρόλογος...

Συμπίεση Πολυμεσικών Δεδομένων

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ-ΥΠΟΛΟΓΙΣΤΩΝ

Ψηφιακές Τηλεπικοινωνίες. Θεωρία Ρυθμού Παραμόρφωσης

ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 4 ΠΑΛΜΟΚΩΔΙΚΗ ΔΙΑΜΟΡΦΩΣΗ - PCM (ΜΕΡΟΣ Α)

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

ITU-R F (2011/04)

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Συστήματα Επικοινωνιών

Θεώρημα κωδικοποίησης πηγής

Συστήματα Πολυμέσων και Εικονική Πραγματικότητα Εργασία

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

Ψηφιακή Επεξεργασία Εικόνας

Μετάδοση πληροφορίας - Διαμόρφωση

Ψηφιακές Τηλεπικοινωνίες

Συστήματα Επικοινωνιών ΙI

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

Μετάδοση πληροφορίας - Διαμόρφωση

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Συμπίεση Δεδομένων

Ψηφιακή Επεξεργασία Σηµμάτων

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

Βασικές Τεχνολογίες Κωδικοποίησης και συμπίεσης φωνής στα Τηλεπικοινωνιακά Δίκτυα: Τεχνικές, Τυποποιήσεις και Εφαρμογές

Τηλεπικοινωνιακά Συστήματα ΙΙ

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

ΚΩ ΙΚΟΠΟΙΗΣΗ ΦΩΝΗΣ ΚΩ ΙΚΟΠΟΙΗΤΕΣ ΧΑΜΗΛΟΥ ΡΥΘΜΟΥ ΜΕΤΑ ΟΣΗΣ. του. Αγγελή Στυλιανού

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Τηλεπικοινωνίες. Ενότητα 5: Ψηφιακή Μετάδοση Αναλογικών Σημάτων. Μιχάλας Άγγελος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Ψηφιακές Τηλεπικοινωνίες. Κωδικοποίηση Κυματομορφής

Ημιτονοειδή σήματα Σ.Χ.

Τ.Ε.Ι. ΚΡΗΤΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΑΡΑΡΤΗΜΑ ΧΑΝΙΩΝ ΣΠΟΥ ΑΣΤΗΣ: ΓΙΑΝΝΟΥΛΗΣ ΙΩΣΗΦ. ΥΠΕΥΘΥΝΟΣ ΚΑΘΗΓΗΤΗΣ: ρ. Α.

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ. Εισαγωγή στα Σήµατα Εισαγωγή στα Συστήµατα Ανάπτυγµα - Μετασχηµατισµός Fourier Μετασχηµατισµός Z

Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Συµπίεση Εικόνας: Το πρότυπο JPEG

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Συστήματα Επικοινωνιών ΙI

ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΦΩΝΗΣ ΚΑΙ ΟΙ ΕΦΑΡΜΟΓΕΣ ΤΟΥΣ

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

Συστήματα Επικοινωνιών ΙI

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΚΕΦΑΛΑΙΟ ΠΕΜΠΤΟ ΜΕΤΑΤΡΟΠΗ ΑΝΑΛΟΓΙΚΟΥ ΣΗΜΑΤΟΣ ΣΕ ΨΗΦΙΑΚΟ

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 7: JPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Συμπίεση Δεδομένων

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας.

Τηλεπικοινωνιακά Συστήματα Ι

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Φυσικής Εισαγωγή στα Συστήματα Τηλεπικοινωνιών Συστήματα Παλμοκωδικής Διαμόρφωσης

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Η κωδικοποίηση των συντελεστών DC

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Σημάτων

Θεωρία Πληροφορίας. Διάλεξη 10: Κωδικοποίηση καναλιού με συνελικτικούς κώδικες. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Ασκήσεις Επεξεργασίας Εικόνας

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Συμπίεση Δεδομένων

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

ΕΠΙΚΟΙΝΩΝΙΕΣ, ΔΙΚΤΥΑ & ΤΕΧΝΟΛΟΓΙΑ ΥΠΟΛΟΓΙΣΤΩΝ

ΣΗΜΕΙΩΣΕΙΣ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΕΙΣΑΓΩΓΗ ΣΤΑ ΣΥΣΤΗΜΑΤΑ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Εισαγωγή στις Τηλεπικοινωνίες

Ψηφιακή Επεξεργασία Φωνής

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Εισαγωγή στις Τηλεπικοινωνίες / Εργαστήριο

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Παναγιώτης Μαθιόπουλος Ph.D.

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ.

Συμπίεση Δεδομένων

Σημείωμα Αδειοδότησης

Συστήματα Επικοινωνιών

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

Αρχές Τηλεπικοινωνιών

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

15/3/2009. Ένα ψηφιακό σήμα είναι η κβαντισμένη εκδοχή ενός σήματος διάκριτου. χρόνου. Φλώρος Ανδρέας Επίκ. Καθηγητής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Στο Κεφάλαιο 9 παρουσιάζεται μια εισαγωγή στις ψηφιακές ζωνοπερατές επικοινωνίες.

Transcript:

Τμήμα Μηχανικών Η/Υ και Πληροφορικής Εργαστήριο Επεξεργασίας Σημάτων και Τηλεπικοινωνιών Κινητά Δίκτυα Επικοινωνιών Μέρος Α: Τηλεπικοινωνιακά Θέματα: Τεχνικές Κωδικοποίησης Πηγής Η Περίπτωση της Φωνής

Κωδικοποίηση Πηγής: Η πληροφορία μιας διακριτής πηγής κωδικοποιείται με σκοπό την οικονομική δυαδική αναπαράσταση. Μέσω της διαδικασίας αυτής απορρίπτεται η πλεονάζουσα «πληροφορία». Η κωδικοποίηση χωρίς απώλειες (lossless) υπόκειται στο θεμελιώδη περιορισμό ότι μια πηγή με εντροπία Η μπορεί να κωδικοποιηθεί με μηδενική πιθανότητα σφάλματος εφόσον ο ρυθμός που προκύπτει είναι R > H, και αντίστροφα, εάν R < H τότε, ανεξάρτητα από την πολυπλοκότητα του κώδικα θα προκύψει μη μηδενική πιθανότητα σφάλματος, (1ο Θεώρημα του Shannon). Κλασικές τεχνικές lossless, γενικού σκοπού: - Αλγόριθμος του Shannon - Αλγόριθμος των Lempel Ziv - Αλγόριθμος του Huffman Κωδικοποίηση αναλογικών πηγών : Έχει αναπόφευκτα απώλειες (lossy) που οφείλονται στη διακριτοποίηση των τιμών (κβαντισμός). Ο στόχος στην περίπτωση αυτή είναι η ελαχιστοποίηση αυτών των απωλειών και εν συνεχεία η συμπίεση με ελεγχόμενες και πάλι απώλειες (Rate-Distortion Theory) 2

Κωδικοποίηση Φωνής: Ιδιαίτερα χρήσιμη διαδικασία αν αναλογιστούμε ότι μεγάλο μέρος της διακινούμενης πληροφορίας είναι φωνή και ότι μέσω της συμπίεσης της μπορεί να επιτευχθεί σημαντική μείωση του απαιτούμενου εύρους ζώνης (μέχρι και 4-5 φορές, χωρίς αισθητή υποβάθμιση της ποιότητας). Γενική κατηγοριοποίηση των τεχνικών 1) Waveform Coding - Temporal - Spectral (Transform) 2) ) Model-based Coding Παρόμοια κατηγοριοποίηση ισχύει και σε άλλου τύπου αναλογικές πηγές, π.χ. εικόνα ή video (η( φυσική σκηνή είναι σχεδόν πάντα αναλογική) 3

Ιεραρχική κατηγοριοποίηση των διαφόρων τεχνικών κωδικοποίησης 4

Διάγραμμα βαθμίδων ενός κωδικοποιητή ADPCM (CT2 cordless telephone system) Το σύστημα είναι προσαρμοστικό (προβλέπτης και κβαντιστής) και έτσι είναι σε θέση να παρακολουθεί τις στατιστικές αλλαγές του σήματος εισόδου S(k) 5

Μετατοπιστής Τεχνικές Κωδικοποίησης Φωνής Διαγράμματα βαθμίδων υπο-ζωνικού κωδικοποιητή και αποκωδικοποιητή Το σήμα φωνής χωρίζεται σε ζώνες συχνοτήτων, που κβαντίζονται και κωδικοποιούνται ξεχωριστά Στις ζώνες που είναι περισσότερο σημαντικές για την ανθρώπινη ακοή ανατίθενται περισσότερα bits Χρήση των filter banks QMF για ακύρωση της αναδίπλωσης φάσματος 6

Τυπικός διαχωρισμός υπο-ζωνών Adaptive Transform Coding (ADC) - Κωδικοποίηση τμημάτων φωνής στο πεδίο συχνοτήτων - Συνήθως χρησιμοποιείται ο Διακριτός Μετασχηματισμός Συνημιτόνου (DCT) του οποίου οι σχέσεις ανάλυσης και σύνθεσης φαίνονται παρακάτω ( g(0)=1, g(k)=2 1/2 ) : 7

Μοντέλο παραγωγής φωνής Με δεδομένη τη βασική φωνητική οδό, απαιτείται επιπλέον η εκτίμηση των εξής παραμέτρων: - Αν το φώνημα είναι εύφωνο (voiced) ή άφωνο (unvoiced) - - Θεμελιώδης συχνότητα (pitch) - Μέση ισχύς του φωνήματος 8

Κωδικοποιητές φωνής (Vocoders) τύπου LPC (Linear Predictive Coding) Ένας LPC Vocoder μοντελοποιεί τη φωνητική οδό ως ένα γραμμικό σύστημα τύπου all-pole με συνάρτηση μεταφοράς: Προσδιορισμός των συντελεστών του LPC Vocoder : To τρέχον δείγμα γράφεται ως γραμμικός συνδυασμός προηγουμένων δειγμάτων : min{σ e 2 n} } w.r.t. α k R α = r (R R = Toeplitz) (Levinson-Durbin Algorithm) 9

Διάγραμμα βαθμίδων ενός κωδικοποιητή LPC Απαιτούμενη πληροφορία στον δέκτη: - Συντελεστές LPC (κβαντισμένοι( κβαντισμένοι) - Voiced/unvoiced decision - Pitch period - Gain > Τεχνικές εκτίμησης/ανίχνευσης για τις παραπάνω παραμέτρους Η διαδικασία LPC θυμίζει το ADPCM με τη βασική διαφορά ότι αντί να αποστέλλεται το κβαντισμένο σφάλμα αποστέλλονται κάποια χαρακτηριστικά του 10

Διάφορες εναλλακτικές μέθοδοι δημιουργίας του σήματος διέγερσης στον αποκωδικοποιητή LPC LPC Vocoder MPE-LPC (Multipulse Excitation) Χρήση συγκεκριμένου αριθμού παλμών ανά περίοδο με μεταβαλλόμενα πλάτη και θέσεις (επιλέγεται από ένα codebook η ακολουθία που ελαχιστοποιεί κατάλληλη συνάρτηση κόστους) CELP (Code Excited LP) Χρήση pitch predictor + διέγερση (η οποία επιλέγεται από ένα προκαθορισμένο codebook με σήματα διέγερσης ) (βλ( βλ. επόμενο slide) en ( ) en ( T) cn ( ) 11

Διάγραμμα βαθμίδων της διαδικασίας code book search του συστήματος κωδικοποίησης CELP (Code Excited Linear Predictive) Οι βασικές διαδικασίες στον κωδικοποιητή CELP: - Υπολογισμός των δύο προβλεπτών (LTP, STP) από το εκάστοτε τμήμα φωνής (Long Term & Short Term Prediction) - Εύρεση της βέλτιστης διέγερσης (από το codebook). Το αντικειμενικό σφάλμα ανακατασκευής (error) υφίσταται περαιτέρω μετασχηματισμό σύμφωνα με τον αντιληπτικό μηχανισμό μας (perceptual masking) 12

Διάγραμμα βαθμίδων του συστήματος κωδικοποίησης RELP (Residual Excited Linear Predictive) To σύστημα κωδικοποίησης RELP βασίζεται ουσιαστικά στην ίδια λογική με αυτή του συστήματος ADPCM με επιπλέον στοιχεία την ενσωμάτωση χαρακτηριστικών του τρέχοντος δείγματος (v/u, gain, pitch). Σχηματίζεται το σήμα σφάλματος (residual) το οποίο κβαντίζεται και μεταδίδεται. 13

Διάγραμμα βαθμίδων του κωδικοποιητή φωνής του συστήματος GSM ( Regular Pulse Excited - Long Term Prediction RPE-LTP ) To σύστημα RPE-LTP συνδυάζει τα πλεονεκτήματα του RELP και του MPE- LTP. Ουσιαστικά είναι σύστημα τύπου RELP που έχει ενσωματώσει τη διαδικασία LTP. 14

Διάγραμμα βαθμίδων του αποκωδικοποιητή φωνής του συστήματος GSM - H ανάλυση STP (στον κωδικοποιητή) δίνει τους λεγόμενους reflection coefficients και όχι τους ίδιους τους συντελεστές πρόβλεψης. Είναι μαθηματικά ισοδύναμη παραμετροποίηση. - Στη συνέχεια από τους r.c. υπολογίζονται οι συντελεστές L.A.R. (logarithmic area ratios) μέσω ενός απλού μη-γραμμικού μετασχηματισμού. Οι συντελεστές που προκύπτουν έχουν καλύτερες ιδιότητες κβάντισης. 15

Τεχνικές κωδικοποίησης που χρησιμοποιούνται σε διάφορα συστήματα κινητών επικοινωνιών Πρότυπο Τύπος Υπηρεσίας Κωδικοποιητής Φωνής Bit Rate (kbps) GSM Cellular RPE-LTP 13 CD-900 Cellular SBC 16 USDC (IS-54) Cellular VSELP 8 IS-95 Cellular CELP 1.2, 2.4, 4.8, 9.6 IS-95 PCS PCS CELP 14.4 PDC Cellular VSELP 4.5, 6.7, 11.2 CT2 Cordless ADPCM 32 DECT Cordless ADPCM 32 PHS Cordless ADPCM 32 DCS-1800 PCS RPE-LTP 13 PACS PCS ADPCM 32 - Συστήματα 3ης γενιάς: Adaptive Multirate (AMR) speech codec Το σύστημα επιτρέπει συμπίεση σε διαφορετικούς ρυθμούς ανάλογα με τις συνθήκες. Στον πυρήνα του συστήματος είναι η τεχνική ACELP (Algebraic CELP) που είναι κατά βάση η CELP με διαφορετικό coodbook design and search. 16

Αξιολόγηση της απόδοσης διαφόρων τεχνικών κωδικοποίησης με βάση τον δείκτη MOS (Mean Opinion Score) 17