Συστήµατα και Αλγόριθµοι Πολυµέσων

Σχετικά έγγραφα
Συστήµατα και Αλγόριθµοι Πολυµέσων

Συστήµατα και Αλγόριθµοι Πολυµέσων

Συστήµατα και Αλγόριθµοι Πολυµέσων

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Συστήµατα και Βάσεις Πολυµέσων. Δρ. Μαρία Κοζύρη Τµήµα Πληροφορικής Πανεπιστήµιο Θεσσαλίας

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ.

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνικές Συµπίεσης Βίντεο. Δρ. Μαρία Κοζύρη Τµήµα Πληροφορικής Πανεπιστήµιο Θεσσαλίας

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Ακαδηµαϊκό Έτος , Εαρινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Ψηφιακή Επεξεργασία Σηµμάτων

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων

Εισαγωγή. Τεχνολογία Πολυµέσων 01-1

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Εισαγωγή στην Επεξεργασία Σήματος. Νόκας Γιώργος

ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΩΝ Εισαγωγή. Εµµανουήλ Ζ. Ψαράκης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Κωδικοποίηση βίντεο (H.261 / DVI)

Περιεχόµενα διαλέξεων 2ης εβδοµάδας

Εισαγωγή στα Προσαρµοστικά Συστήµατα

Ψηφιακή Επεξεργασία Σημάτων

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήµατα και Αλγόριθµοι Πολυµέσων

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

Ραδιοτηλεοπτικά Συστήματα Ενότητα 3: Θεωρία Ψηφιοποίησης

Discrete Fourier Transforms

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Τηλεπικοινωνίες. Ενότητα 5: Ψηφιακή Μετάδοση Αναλογικών Σημάτων. Μιχάλας Άγγελος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 8: MPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

H ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ. στις τηλεπικοινωνίες

Να αναφέρουµε τους πέντε τύπους δεδοµένων που χρησιµοποιούνται σε έναν υπολογιστή. Να περιγράψουµε τον τρόπο µε τον οποίο αποθηκεύονται οι

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Group (JPEG) το 1992.

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

«Επικοινωνίες δεδομένων»

Ημιτονοειδή σήματα Σ.Χ.

x(t) = 4 cos(2π600t π/3) + 2 sin(2π900t + π/4) + sin(2π1200t) (1) w(t) = y(t)z(t) = 2δ(t + 1) (2) (2 sin(2π900t + π/4) t= 1 + sin(2π1200t) )

Συστήµατα και Αλγόριθµοι Πολυµέσων

0, αλλιώς. Σεραφείµ Καραµπογιάς. Παράδειγµα 1 Η πηγή X(t) είναι στατική Gaussian µε µέση τιµή µηδέν και φασµατική πυκνότητα ισχύος.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Εισαγωγή στις Τηλεπικοινωνίες

«Επικοινωνίες δεδομένων»

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ ΕΞΕΤΑΣΤΙΚΗΣ ΠΕΡΙΟ ΟΥ ΙΟΥΝΙΟΥ 2004., η οποία όµως µπορεί να γραφεί µε την παρακάτω µορφή: 1 e

Συγχρονισµός πολυµέσων

(CLR, κεφάλαιο 32) Στην ενότητα αυτή θα µελετηθούν τα εξής θέµατα: Παραστάσεις πολυωνύµων Πολυωνυµική Παρεµβολή ιακριτός Μετασχηµατισµός Fourier

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Κωδικοποίηση βίντεο (MPEG)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Συστήματα πολυμέσων. Εισαγωγή Υλικό συστημάτων πολυμέσων Λογισμικό συστημάτων πολυμέσων Συστήματα πραγματικού χρόνου Χρονοπρογραμματισμός

ΣΤΟΧΑΣΤΙΚΑ ΣΗΜΑΤΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Μετατροπή Αναλογικού Σήµατος σε. Ψηφιακό (A/D Conversion) Μετατροπή Ψηφιακού Σήµατος σε Αναλογικό (D/A Conversion)

Τηλεπικοινωνιακά Συστήματα Ι

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Επεξεργαστές - ελεγκτές ψηφιακού σήµατος

ΨΗΦΙΟΓΡΑΦΙΚΕΣ ΕΙΚΟΝΕΣ

ΘΕΜΑ 2 1. Υπολογίστε την σχέση των δύο αντιστάσεων, ώστε η συνάρτηση V

Συστήματα Πολυμέσων. Ενότητα 11: Χαρακτηριστικά Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΘΕΜΑ 1 ο. α. τα μήκη κύματος από 100m έως 50m ονομάζονται κύματα νύχτας και τα μήκη κύματος από 50m έως 10m ονομάζονται κύματα ημέρας.

Εξεταστική Ιανουαρίου 2007 Μάθηµα: «Σήµατα και Συστήµατα»

Βίντεο. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 06-1

Κεφάλαιο 2 Διαχείριση Σηµάτων σε Ψηφιακά Συστήµατα Ελέγχου

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Συµπίεση Ήχου µεβάσητην Αντίληψη: Τα πρότυπα συµπίεσης MPEG-1 layer I, layer II, layer III

όπου είναι γνήσια. ρητή συνάρτηση (δηλαδή ο βαθµός του πολυωνύµου υ ( x)

Τι είναι σήµα; Ωςσήµαορίζεταιέναφυσικόµέγεθοςτοοποίοµεταβάλλεταισεσχέσηµετοχρόνοή το χώρο ή µε οποιαδήποτε άλλη ανεξάρτητη µεταβλητή ή µεταβλητές.

Ψηφιακή Επεξεργασία Εικόνας

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΚΕΦΑΛΑΙΟ ΟΙ ΥΠΟΛΟΓΙΣΤΕΣ ΑΠΟ ΤΗΝ ΑΡΧΑΙΟΤΗΤΑ ΜΕΧΡΙ ΣΗΜΕΡΑ Ιστορική αναδρομή Υπολογιστικές μηχανές

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 7-8 : Συστήματα Δειγματοληψία Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

DFT ιακριτός µετ/σµός Fourier Discrete Fourier Transform

Μια «ανώδυνη» εισαγωγή στο μάθημα (και στο MATLAB )

ΤΗΛ412 Ανάλυση & Σχεδίαση (Σύνθεση) Τηλεπικοινωνιακών Διατάξεων. Διάλεξη 6. Άγγελος Μπλέτσας ΗΜΜΥ Πολυτεχνείου Κρήτης, Φθινόπωρο 2016

Κεφάλαιο 2 Διαχείριση Σηµάτων σε Ψηφιακά Συστήµατα Ελέγχου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΩΝ Κυκλική Συνέλιξη. Εµµανουήλ Ζ. Ψαράκης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 4: Δειγματοληψία και Κβάντιση Εικόνας

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

1) Να σχεδιαστούν στο matlab οι γραφικές παραστάσεις των παρακάτω ακολουθιών στο διάστημα, χρησιμοποιώντας τις συναρτήσεις delta και step.

Συμπίεση Δεδομένων

Στοιχεία επεξεργασίας σημάτων

15/3/2009. Ένα ψηφιακό σήμα είναι η κβαντισμένη εκδοχή ενός σήματος διάκριτου. χρόνου. Φλώρος Ανδρέας Επίκ. Καθηγητής

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία. Εργαστήριο 10 ο : MATLAB

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών Σημάτων. Διάλεξη 20: Διακριτός Μετασχηματισμός Fourier (Discrete Fourier Transform DFT)

Ιόνιο Πανεπιστήμιο Τμήμα Τεχνών Ήχου και Εικόνας. Ακαδημαϊκό Έτος

Βίντεο και κινούµενα σχέδια

Στατιστική ΙΙ Ενότητα 2: ειγµατοληψία

ΜΑΘΗΜΑΤΑ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ ΠΑΡΑ ΟΣΕΙΣ ΑΣΚΗΣΕΙΣ ΚΑΘΗΓΗΤΕΣ/ΤΡΙΕΣ

2. ΨΗΦΙΟΠΟΙΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ

Συστήµατα τα οποία χαρακτηρίζονται από γραµµικές εξισώσεις διαφορών µε σταθερούς συντελεστές

Transcript:

Συστήµατα και Αλγόριθµοι Πολυµέσων Ιωάννης Χαρ. Κατσαβουνίδης Οµιλία #2: Αρχές Επεξεργασίας Σηµάτων Πολυµέσων 4 Οκτωβρίου 2005

Επανάληψη (1) Πολυµέσα είναι Ήχος (1-D σήµα) Εικόνα (2-D σήµα) Βίντεο (3-D σήµα) Πολυµεσικό σύστηµα αποτελείται από Λογισµικό (επιµέρους συστατικά, δοµή, GUI) Υλικό (CPU, µνήµη, συσκευές απόδοσης ήχου και εικόνας) Τηλεπικοινωνικό δίκτυο

Επανάληψη (2) Πολυµεσικοί αλγόριθµοι Τεχνικές ψηφιακής επεξεργασίας σήµατος Τεχνικές κωδικοποίησης και θεωρίας πληροφοριών Συµπίεση και αποσυµπίεση δεδοµένων ( codec ) Πολυµεσικές αρχιτεκτονικές υπολογιστών PC (Intel MMX/SSE/SSE2) Embedded (TI DSP, ARM RISC) ASIC/SOC (full hard-wred desgn, GP-CPU + hardwred block acceleraton, confgurable & etensble Tenslcs)

Βασικές τεχνικές (αρχές) επεξεργασίας πολυµέσων ειγµατοληψία/κβαντοποίηση Μετασχηµατισµοί Θεωρία Πληροφορίας Προ- και Μετά-επεξεργασία πολυµεσικών σηµάτων

ειγµατοληψία Βασίζεται στο θεώρηµατουnyqust: F s >= 2* F MAX Π.χ. Audo CD, F MAX = 20kHz, F s = 44.1kHz Τηλέφωνο - ανθρώπινη φωνή F MAX = 4kHz, F s = 8kHz

Κβαντοποίηση Μη-αναστρέψιµηδιαδικασία Αποτελείται από δύο τµήµατα: Μετατροπή συνεχούς εύρους τιµών σε διακριτές τιµές (=σύµβολα) quantzaton Μετατροπή των συµβόλων σε τιµές (centrods) που αντιπροσωπεύουν το αρχικό εύρος τιµών nverse quantzaton Οαριθµός του bts καθορίζεται από την αποδεκτή ποιότητα αναπαραγωγής του αρχικού σήµατος

Κβαντοποίηση Π.χ. Στο Audo CD, N (# of bts) = 16 Άσκηση #1: επιβεβαιώστε ότι ο ρυθµός δεδοµένων του Audo CD είναι 1411200 bts/sec Άσκηση #2: αποδείξτε τη σηµατοθορυβική σχέση οµοιόµορφου κβαντιστή PSNR = 6*Ν+11 (db) και κατά συνέπεια τη σηµατοθορυβική σχέση του Audo CD ~ 107 db

Επανα-δειγµατοληψία Αύξηση του αριθµού των δειγµάτων (upsamplng) Μείωση του αριθµού των δειγµάτων (down-samplng)

Τεχνικές φίλτρων Βασίζεται στην χρήση της συνάρτησης sync() = sn()/ για τον υπολογισµότωνενδιάµεσων τιµών, σε συνδιασµό µε τη χρήση παραθύρων για τη µείωση της κυµάτωσης (rpples) και της επικάλυψης φάσµατος (alasng) Για τον υπολογισµό τωντιµών εξόδου, γίνεται συνέλιξη (convoluton) των τιµών εισόδου µε τους συντελεστές του φίλτρου Παράδειγµα: [1, -5, 20, 20, -5, 1]

Τεχνικές φίλτρων (2) Ρουτίνα συνέλιξης for (j = 0; j < N; j++) { sum = 0; for ( = -2; < 2; ++) sum += h[]*nput[j+]; output[j] = sum; }

Τεχνικές φίλτρων (3) Ιδιαίτερη αντιµετώπιση στα όρια του σήµατος Συνήθως, επανάληψη του οριακού δείγµατος Πολυπλοκότητα N MACs/output sample Ιδανικός αλγόριθµος για DSPs

Τεχνικές παρεµβολής (1) Βασίζεται στην χρήση πολυώνυµων για τον υπολογισµό ενδιάµεσων τιµών Παρεµβολή πρώτου βαθµού (γραµµική παρεµβολή) Παρεµβολή δευτέρου & τρίτου βαθµού Splnes

Τεχνικές παρεµβολής (2) Γραµµική παρεµβολή y( t) = 1t + 0(1 t),0 t 1 Μπορεί να γραφτεί και ως y( t) = + ( 1 0) t,0 t 0 1

Τεχνικές παρεµβολής (3) εύτερου ή µεγαλύτερου βαθµού παρεµβολή απαιτεί την επίλυση συστήµατος γραµµικών εξισώσεων Π.χ. ευτεροβάθµια παρεµβολή y( t) y(0) y(1) 2 = αt + βt + γ = = 1 0,0 t 1

Τεχνικές παρεµβολής (4) Μπορεί να γραφτεί ως όπου οι τιµές των δ (µία τιµή γιακάθε διάστηµα) υπολογίζονται απαιτώντας συνέχεια των παραγώγων στα όρια των διαστηµάτων: R t t t t y + + = δ δ δ, 1,0 ) )(1 ( ) ( ) ( 0 0 1 2 0 1 ) )(1 ( ) )(1 ( ) ( 2 1 1 1 1 + + = + δ δ δ ) )(1 ( ) )(1 ( 1 1 1 + + = + δ δ

Τεχνικές παρεµβολής (5) Αν έχουµε Νσηµεία ( 0, 1,, N-1 ), δηλαδή (Ν-2) εσωτερικά σηµεία, έχουµε (Ν-2) γραµµικές εξισώσεις. 2 επιπρόσθετες εξισώσεις προκύπτουν µετη βοήθεια προέκτασης των οριακών σηµείων, οπότε λύνουµε τοσύστηµαν εξισώσεων µε Ν αγνώστους και αποκτούµε τους συντελεστές δ 0, δ 1,, δ N-1

Τεχνικές παρεµβολής (6) Στην περίπτωση διδιάστατου σήµατος (εικόνα), εφαρµόζουµετιςπροηγούµενες τεχνικές µε διαχωρίσιµο τρόπο πρώτα κατά τη µία διάσταση και µετά κατά την άλλη.

Τεχνικές κβαντοποίησης (1) Οµοιόµορφη κβαντοποίηση Για προσηµασµένα σήµατα, συνήθως κβαντοποιούµετοπρόσηµο µε 1-bt και το πλάτος (=απόλυτη τιµή) µεταυπόλοιπα(ν-1) bts dead-zone quantzaton Μη-οµοιόµορφη κβαντοποίηση Οι υπο-περιοχές κβαντοποίησης ( bns ) δεν έχουν το ίδιο εύρος. Συνήθως επιλέγουµε το εύρος ούτως ώστε η πιθανότητα κάθε υποπεριοχής να είναι σταθερή

Τεχνικές κβαντοποίησης (2) Μη-οµοιόµορφη κβαντοποίηση Οι τιµές αντικατάστασης υπολογίζονται µε τον αλγόριθµο Lloyd-Ma Εναλλακτικά, το σήµα µετατρέπεται µε τη βοήθεια µιας µη-γραµµικής συνάρτησης σε οµοιόµορφα κατανεµµηµένο και ακολουθεί οµοιόµορφη κβαντοποίηση ( compandng )

Αλγόριθµος κβαντοποίησης Quantzaton: for (=0; <8; ++) { sgn[] = ([]>0)? 0 : 1; q[] = abs([])/(2*qp); }

Αλγόριθµος κβαντοποίησης Inverse Quantzaton: for (=0; <8; ++) { f(q[]==0) r[] = 0; else f (sgn[]==0) r[] = (2*q[]+1)*QP; else r[] = -(2*q[]+1)*QP; }

Technology overvew of MPEG1/2 Basc unt of processng s a pcture Each pcture conssts of an array of pels; for each pel, we assocate one nteger value (usually 8-bt) called lumnance and for each 22 block of pels we assocate two chromnance values, called Cb/Cr or U/V also called YUV 4:2:0 format. YUV 4:2:2 and 4:4:4 are also supported (MPEG2 only).

MPEG1/2 YUV 4:2:0 format (0,0) j Represent lumnance samples Represent chromnance samples

Ασκήσεις Να υπολογίσετε τις παρακάτω στατιστικές ποσότητες για κάθε ένα από τα τρία συστατικά (Y/U/V) του 1ου καρέ του βίντεο src13 Μέσος όρος (µ) ιασπορά (σ) Συσχέτιση 1ου βαθµού κατά τη διάσταση και κατά τη διάσταση y ρ hor = [E((,j)*(,j+1))-µ 2 ]/σ 2 ρ ver = [E((,j)*(+1,j))-µ 2 ]/σ 2 Συσχέτιση 2ου βαθµού κατά τη διάσταση και κατά τη διάσταση y