Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Σχετικά έγγραφα
Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Διεθνή Πρότυπα Αναλογικού Βίντεο

Συστήματα Πολυμέσων. Ενότητα 16: Διαμορφώσεις και Πρότυπα Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση JPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Ραδιοτηλεοπτικά Συστήματα Ενότητα 4: Ψηφιοποίηση και συμπίεση σημάτων εικόνας

Η ανάγκη για συμπίεση

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Βίντεο (Video) Περιεχόµενα. Βιβλιογραφία. Καγιάφας [2000]: Κεφάλαιο 5, [link]

Τι συσχετίζεται με τον ήχο

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

ΒΕΣ 04: Συμπίεση και Μετάδοση Πολυμέσων. Βίντεο (Video)

Ψηφιακό Βίντεο. ΕΣ 200: ημιουργία Περιεχομένου ΙΙ. Περιεχόμενα - Βιβλιογραφία. Περιεχόμενα. Βιβλιογραφία. Βασικές έννοιες

Συστήματα Πολυμέσων. Ενότητα 15: Συμπίεση Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Βίντεο. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 06-1

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

ITU-R BT.1908 (2012/01) !" # $ %& '( ) * +, - ( )

Συμπίεση Βίντεο: Αρχές και Πρότυπα Συμπίεσης

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βίντεο (Video) Εισαγωγή. Βιβλιογραφία. Καγιάφας [2000]: Κεφάλαιο 5, [link]

Τεχνολογία Πολυμέσων. Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Συστήµατα και Αλγόριθµοι Πολυµέσων

Κωδικοποίηση βίντεο (H.261 / DVI)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Συµπίεση Βίντεο. Βιβλιογραφία. Αρχές συµπίεσης βίντεο

2. ΨΗΦΙΟΠΟΙΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ

Τι συσχετίζεται με τον ήχο

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα

Συµπίεση Εικόνας: Το πρότυπο JPEG

Αντοχή (ruggedness) στο θόρυβο μετάδοσης Αποτελεσματική αναγέννηση (regeneration) Δυνατότητα ομοιόμορφου σχήματος (uniform format) μετάδοσης Όμως:

Τεχνολογία Πολυμέσων. Ενότητα # 6: Βίντεο Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Συστήματα Πολυμέσων. Ενότητα 14: Εισαγωγικά Θέματα Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ψηφιακή Επεξεργασία Σηµμάτων

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Βασικές έννοιες. Αναλογικό Βίντεο. Ψηφιακό Βίντεο. Κινούμενα γραφικά (animation)( Πλαίσιο (frame, καρέ) Ρυθμός πλαισίων (frame rate)

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Συστήµατα και Αλγόριθµοι Πολυµέσων

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

Συµπίεση Βίντεο: Αναλογικό και Ψηφιακό Βίντεο, Υποδειγµατοληψία χρώµατος

Ο μετασχηματισμός wavelet (Discrete Wavelet Transform, DWT) έχει χρησιμοποιηθεί με επιτυχία στη συμπίεση εικόνας6

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης

Συστήµατα και Αλγόριθµοι Πολυµέσων

Τεχνολογία Πολυμέσων. Ενότητα 9: Αναλογικό Βίντεο. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Υπάρχουσες εφαρμογές:

ΕΡΓΑΣΙΑ #2 Να κωδικοποιήσετε τρεις εικόνες (baboon, boat, lighthouse) χρησιμοποιώντας το σύστημα DPCM και βασίζοντας την πρόβλεψή σας σε γειτονικά εικ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 9: Πρότυπο Συμπίεσης Βίντεο MPEG

Ψηφιακή Επεξεργασία Εικόνας

Συµπίεση Βίντεο: Αρχές και Πρότυπα Συµπίεσης

Βίντεο και κινούµενα σχέδια

Πως περιγράφεται το bitstream

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Γιατί Συµπίεση; Βιβλιογραφία

Εισαγωγή στη σχεδιοκίνηση (animation)

Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε Απώλειες. Πρότυπα Συµπίεσης Εικόνων

Δ10. Συμπίεση Δεδομένων

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Ψηφιακή Επεξεργασία Εικόνας

Η κωδικοποίηση των συντελεστών DC

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακό βίντεο. Αναλογικό βίντεο / ψηφιοποίηση Διεπαφές Εκτίμηση κίνησης μπλοκ

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας.

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Εικόνας

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Κατηγορίες τεχνικών συµπίεσης. Τεχνικές Συµπίεσης

Δ13b. Συμπίεση Δεδομένων

ΤΗΛΕΜΑΤΙΚΗ ΚΑΙ ΝΕΕΣ ΥΠΗΡΕΣΙΕΣ

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 7: JPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Γιώργος Τζιρίτας Τµήµα Επιστήµης Υπολογιστών

Ψηφιακή τηλεόραση. [από το Α έως το Ω] Αναλογικό σήµα Video και ψηφιοποίηση σε SDI

Ραδιοτηλεοπτικά Συστήματα Ενότητα 2: Παραγωγή και Μετάδοση Τηλεοπτικού Σήματος

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

Διαδικασία Ψηφιοποίησης (1/2)

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Δ11 Δ12. Συμπίεση Δεδομένων

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

ΒΑΣΙΚΑ ΘΕΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Υπολογιστικά συστήµατα: ψηφιακά µέσα

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τεχνικές Συµπίεσης Βίντεο. Δρ. Μαρία Κοζύρη Τµήµα Πληροφορικής Πανεπιστήµιο Θεσσαλίας

Συστήµατα και Βάσεις Πολυµέσων. Δρ. Μαρία Κοζύρη Τµήµα Πληροφορικής Πανεπιστήµιο Θεσσαλίας

Ψηφιακή Επεξεργασία Σημάτων

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΚΕΦΑΛΑΙΟ ΠΕΜΠΤΟ ΜΕΤΑΤΡΟΠΗ ΑΝΑΛΟΓΙΚΟΥ ΣΗΜΑΤΟΣ ΣΕ ΨΗΦΙΑΚΟ

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

Τεχνολογία Πολυμέσων. Ενότητα # 13: Κωδικοποίηση βίντεο: MPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Group (JPEG) το 1992.

Επεξεργασία Χαρτογραφικής Εικόνας

ΤΥΠΟΣ ΤΕΧΝΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ TIMH Crystal Line Crystal 35

Συμπίεση Δεδομένων

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Transcript:

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Αλέξανδρος Ελευθεριάδης Αναπ. Καθηγητής & Marie Curie Chair Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών eleft@di.uoa.gr, (210) 727-5210 [Διάλεξη 1 η ] p1

Διεθνή Πρότυπα Αναλογικού Βίντεο p2

Progressive/Interlaced p3

Ασπρόµαυρο Έγχρωµο Βίντεο Αναλογικό Ψηφιακό (CCIR-601) p4

Πρότυπα NTSC National Television Stadards Committee 1941 µονόχρωµο, 525 lines, 30 fps, 2:1 interlaced, 4:3 aspect ratio 1950 έγχρωµο, 29.97 fps PAL Phase Alternating Line 1963 έγχρωµο, 625 lines,25 fps, 2:1 interlaced, 4:3 aspect ratio p5

Διαµόρφωση NTSC PAL p6

Ψηφιακό Βίντεο CCIR-601 / ITU-R BT.601 720x525@60 (active 480) 720x625@50 (active 576) 2:1 interlace, 4:2:2 Chroma Formats: 4:2:2 CCIR-601 4:2:0 SIF p7

Άλλα Chroma Formats p8

SIF Source Interchange Format Ευρώπη: 360χ288@25 (µισές γραµµές των active) Β. Αµερική: 360χ240@30 Μετατροπή από CCIR-601 απαιτεί φιλτράρισµα (nonstandard): Luminance Chrominance (σηµ.: ζυγός αριθµός συντελεστών) p9

CIF Common Interchange Format Εφαρµογές videoconferencing Μισό resolution σε σχέση µε CCIR-601, παίρνοντας το µέγιστο αριθµό γραµµών (625) και µέγιστο ρυθµό εικόνων (30): 360χ288@30 (29.97) Υποδιαιρέσεις: QSIF, QCIF p10

HDTV Formats p11

Formats Η/Υ Formats από υπολογιστές: VGA 640x480 SVGA 800x600 XGA 1024x768 SXGA 1280x1024 UXGA 1600x1200 Πρόθεµα W για widescreen (π.χ. WXGA 1366x768) Συχνότητα 60 Hz, 75 Hz, κτλ., progressive p12

Film 24 εικόνες/sec Δειγµατοληψία µόνο χρονικά Μετατροπή σε NTSC/PAL δεν είναι απλή (telecine). Παράδειγµα Film-to-NTSC: 3:2 pull-down 3:2 - Πρόσθεσε ένα field σε κάθε δεύτερο frame (24x2.5=60) pull-down - Αφού το NTSC έχει 59.94 fields/sec, επιβράδυνε τον ήχο κατά 0.1% για συγχρονισµό p13

Μέτρηση Ποιότητας σε Βίντεο Υποκειµενική Subjective Double-Stimulus Impairment Scale Double-Stimulus Continuous Quality Scale Single-Stimulus Continuous Quality Scale Double-Stimulus Unknown Reference (2 γύροι, πρώτα για να βρεθεί το reference) κτλ. MOS, Mean Opinion Score Αντικειµενική Objective PSNR Μέση τιµή σε όλη την ακολουθία εικόνων (mean PSNR) Συνήθως µόνο σε luma (Y-PSNR) p14

Καµπύλες R-D Παράδειγµα σύγκρισης p15

Bjontegaard Delta (2001) Ιδέα: κάνε 4 πειράµατα, προσάρµοσε δύο καµπύλες, και υπολόγισε το ολοκλήρωµα της διαφοράς => ένας αριθµός σύγκρισης για όλα τα bit rates SNR = (a + b*bit + c*bit 2 )/(bit + d) Πρoβλήµατα: πόλοι σε µερικές περιπτώσεις υπερίσχυση υψηλών bit rates p16

Bjontegaard Delta (2) Λύση: χρήση λογαριθµικής κλίµακας για το bit rate Απόσταση µεταξύ καθέτων γραµµών 10 0.05 = 1.122 (ή 12.2%). Χρήση απλούστερου πολυωνύµου για παρεµβολή: SNR = a + b*bit + c*bit 2 + d*bit 3 p17

Βασικές Αρχές Συµπίεσης 1. Ελαχιστοποίηση χωρικής πλεονασµατικότητας (spatial redundancy) π.χ. transform coding 2. Ελαχιστοποίηση χρονικής πλεονασµατικότητας (temporal redundancy) π.χ. motion compensated prediction 3. Κωδικοποίηση εντροπίας (entropy coding) π.χ. Huffman coding p18

DPCM Μεταξύ pixels αλλά και µεταξύ frames p19

Transform Coding Παράδειγµα p20

Discrete Cosine Transform Προσέγγιση του KLT Κατανοµή σταθερών ώστε οι συντελεστές να είναι µεταξύ -2047 και +2047 C(u)=sqrt(1/2) άν u=0, 1 διαφορετικά Mismatch Control Μη τυποποιηµένη υλοποίηση συσσωρεύει σφάλµα στο δέκτη. Προσθήκη ψευδοτυχαίου σήµατος το κρατάει µέσα σε όρια p21

Fast DCT p22

Κβαντισµός (quantization) Με dead-zone (τυπικά για AC) Χωρίς (τυπικά για DC) p23

Κβάντιση Quantization index Αντιστροφή p24

Motion Estimation Διαφορά διαδοχικών εικόνων χωρίς (a) και µε (b) εκτίµηση κίνησης p25

Μοντέλο ME MSE MAE p26

Τεχνικές ΜΕ Full-search, πολυπλοκότητα (2w+1) 2 50-65 % συνολικής υπολογιστικής πολυπλοκότητας τυπικού κωδικοποιητή Παράδειγµα ταχύ αλγορίθµου Cross-Search Algorithm (CSA), πολυπλοκότητα 5+4log 2 w p27

Ιεραρχική Εκτίµηση (Hierarchical ME) Ιδιαίτερα χρήσιµη σε scalable codecs p28

Κωδικοποίηση Εντροπίας Εντροπία Huffman & Arithmetic Coding Παράδειγµα Huffman: p29

Γενική Αρχιτεκτονική Κωδικοποιητή Βίντεο Interframe predictive encoder Καλύπτει όλες τις γενιές κωδικοποιητών βίντεο! Παρατηρήστε σύvδεση buffer-quantizer (rate control) p30

Αποκωδικοποιητής p31

Επιτεύγµατα στην Κωδικοποίηση Βίντεο PSNR [db] 40 38 36 35 34 32 30 28 Variable block size Variable block size (16x16 4x4) + (16x16 8x8) quarter-pel + multi-frame motion compensation (H.264/AVC, 2003) (H.263, 1996) + quarter-pel motion compensation (MPEG-4, 1998) Half-pel motion compensation (MPEG-1 1993 MPEG-2 1994) Bit-rate Reduction: 75% Integer-pel motion compensation (H.261, 1991) Intraframe DCT coding (JPEG, 1990) 0 100 200 300 Foreman 10 Hz, QCIF 100 frames Rate [kbit/s] p32