Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Σχετικά έγγραφα
Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Διεθνή Πρότυπα Αναλογικού Βίντεο

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Πως περιγράφεται το bitstream

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

Συστήµατα και Αλγόριθµοι Πολυµέσων

Συστήµατα και Αλγόριθµοι Πολυµέσων

Ραδιοτηλεοπτικά Συστήματα Ενότητα 4: Ψηφιοποίηση και συμπίεση σημάτων εικόνας

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

Elements of Information Theory

Τεχνικές Συµπίεσης Βίντεο. Δρ. Μαρία Κοζύρη Τµήµα Πληροφορικής Πανεπιστήµιο Θεσσαλίας

ITU-R BT.1908 (2012/01) !" # $ %& '( ) * +, - ( )

Συστήματα Πολυμέσων. Ενότητα 15: Συμπίεση Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Υπάρχουσες εφαρμογές:

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

Η ανάγκη για συμπίεση

Instruction Execution Times

Ο μετασχηματισμός wavelet (Discrete Wavelet Transform, DWT) έχει χρησιμοποιηθεί με επιτυχία στη συμπίεση εικόνας6

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

6.1. Dirac Equation. Hamiltonian. Dirac Eq.

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Math 6 SL Probability Distributions Practice Test Mark Scheme

Κωδικοποίηση και αποκωδικοποίηση µε χρήση του H.264/MPEG-4 για βίντεο µε µία ή περισσότερες λήψεις

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1

6.003: Signals and Systems. Modulation

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Βίντεο (Video) Περιεχόµενα. Βιβλιογραφία. Καγιάφας [2000]: Κεφάλαιο 5, [link]

Πτυχιακή Εργασι α «Εκτι μήσή τής ποιο τήτας εικο νων με τήν χρή σή τεχνήτων νευρωνικων δικτυ ων»

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

BandPass (4A) Young Won Lim 1/11/14

Τεχνολογία*Ήχου* 9/10/13. Από*προηγούμενο*μάθημα...*

The Simply Typed Lambda Calculus

Block Ciphers Modes. Ramki Thurimella

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Approximation of distance between locations on earth given by latitude and longitude

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Συµπίεση Βίντεο. Βιβλιογραφία. Αρχές συµπίεσης βίντεο

Συμπίεση Βίντεο: Αρχές και Πρότυπα Συμπίεσης

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Γιατί Συµπίεση; Βιβλιογραφία

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση JPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Supplementary Materials for Evolutionary Multiobjective Optimization Based Multimodal Optimization: Fitness Landscape Approximation and Peak Detection

EE512: Error Control Coding

Συστήµατα και Αλγόριθµοι Πολυµέσων

Stabilization of stock price prediction by cross entropy optimization

ΥΛΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΟΣ P2P MULTIMEDIA STREAMING. ιπλωµατική Εργασία. του. Μπάλλου Αλέξανδρου

ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ MPEG-2 ΑΠΟΚΩ ΙΚΟΠΟΙΗΤΗ ΣΕ ΥΠΟΛΟΓΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ARM CORTEX A8

CMOS Technology for Computer Architects

ΣΜΗΜΑ ΔΦΑΡΜΟΓΧΝ ΠΛΗΡΟΦΟΡΙΚΗ ΣΗ ΓΙΟΙΚΗΗ ΚΑΙ ΣΗΝ ΟΙΚΟΝΟΜΙΑ. Φεθηαθή ηειεφξαζε (Digital Video Broadcasting). Μειέηε ησλ πξνηχπσλ DVB-T, DVB-S2 θαη DVB-H.

Homework 3 Solutions

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Ψηφιακή Επεξεργασία Εικόνας

w o = R 1 p. (1) R = p =. = 1

ΤΥΠΟΣ ΤΕΧΝΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ TIMH Crystal Line Crystal 35

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

ΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ "VIDEO ΚΑΤΟΠΙΝ ΖΗΤΗΣΗΣ" ΑΝΝΑ ΜΟΣΧΑ Μ 11 / 99

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

ΝΤUA Τεχνολογία Πολυμέσων

ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙO ΑΘΗΝΩΝ ΤΜΗΜΑ ΑΞΙΟΠΟΙΗΣΗΣ ΦΥΣΙΚΩΝ ΠΟΡΩΝ & ΓΕΩΡΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ

ΔΙΑΚΡΙΤΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ FOURIER - Discrete Fourier Transform - DFT -

Συστήµατα και Αλγόριθµοι Πολυµέσων

Other Test Constructions: Likelihood Ratio & Bayes Tests

ΑΥΤΟΜΑΤΟΠΟΙΗΣΗ ΜΟΝΑΔΑΣ ΘΡΑΥΣΤΗΡΑ ΜΕ ΧΡΗΣΗ P.L.C. AUTOMATION OF A CRUSHER MODULE USING P.L.C.

ΜΕΛΕΤΗ ΚΑΙ ΠΡΟΣΟΜΟΙΩΣΗ ΙΑΜΟΡΦΩΣΕΩΝ ΣΕ ΨΗΦΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΕΠΙΚΟΙΝΩΝΙΩΝ.

ΗΜΥ 210 ΣΧΕΔΙΑΣΜΟΣ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. Χειµερινό Εξάµηνο 2016 ΔΙΑΛΕΞΗ 13: Διαδικασία Σχεδιασµού Ακολουθιακών Κυκλωµάτων (Κεφάλαιο 6.


Πανεπιστήμιο Θεσσαλίας. Πολυτεχνική Σχολή

(C) 2010 Pearson Education, Inc. All rights reserved.

Ο ΗΓΟΣ ΕΠΙΜΟΡΦΩΤΗ. Το εκπαιδευτικό υλικό υπόκειται σε Άδεια Χρήσης Creative Commons Αναφορά Μη-Εµπορική Χρήση Όχι Παράγωγο Έργο v. 3.

Fractional Colorings and Zykov Products of graphs

DESIGN OF MACHINERY SOLUTION MANUAL h in h 4 0.

Section 8.3 Trigonometric Equations

Συστήματα Διαχείρισης Βάσεων Δεδομένων

NMBTC.COM /

Notes on the Open Economy

Siemens AG Rated current 1FK7 Compact synchronous motor Natural cooling. I rated 7.0 (15.4) 11.5 (25.4) (2.9) 3.3 (4.4)

Fourier Series. MATH 211, Calculus II. J. Robert Buchanan. Spring Department of Mathematics

ΤΗΛΕΜΑΤΙΚΗ ΚΑΙ ΝΕΕΣ ΥΠΗΡΕΣΙΕΣ

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Chap. 6 Pushdown Automata

Ατομική Διπλωματική Εργασία

Ψηφιακή Επεξεργασία Σηµμάτων

Βασικές έννοιες. Αναλογικό Βίντεο. Ψηφιακό Βίντεο. Κινούμενα γραφικά (animation)( Πλαίσιο (frame, καρέ) Ρυθμός πλαισίων (frame rate)

DVB (DVB-S, DVB-C, DVB-T, DVB-H)

Ψηφιακή Επεξεργασία Εικόνας

Partial Trace and Partial Transpose

Cite as: Pol Antras, course materials for International Economics I, Spring MIT OpenCourseWare ( Massachusetts

Ψηφιακό Βίντεο. ΕΣ 200: ημιουργία Περιεχομένου ΙΙ. Περιεχόμενα - Βιβλιογραφία. Περιεχόμενα. Βιβλιογραφία. Βασικές έννοιες

Dynamic types, Lambda calculus machines Section and Practice Problems Apr 21 22, 2016

Διπλωματική Εργασία. του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και. Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του. Πανεπιστημίου Πατρών

Συµπίεση (ΙΙ) Ψηφιακή τηλεόραση [από το Α έως το Ω]

Συστήµατα και Αλγόριθµοι Πολυµέσων

Aluminum Electrolytic Capacitors (Large Can Type)

CE 530 Molecular Simulation

Τηλεοπτικά Ρεπορτάζ Ενότητα 3: Μοντάζ και Κώδικες

Πρότυπη υλοποίηση και αξιολόγηση κωδικοποίησης εικονοροών ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ

Transcript:

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Αλέξανδρος Ελευθεριάδης Αναπ. Καθηγητής & Marie Curie Chair Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών eleft@di.uoa.gr, (210) 727-5210 [Διάλεξη 4 η ] p1

Outline H.264/AVC Coding Standard History and Brief Introduction Adoption and Products Scalable Coding (SVC) Temporal scalability SNR scalability Spatial scalability Scalable video transmission Receiver-driven layered multicast conferencing demo p2

H.264 AVC (Advanced Coding) Σηµ.: Μερικές διαφάνειες και διαγράµµατα είναι από τον Thomas Wiegand, HHI p3

p4

Input Signal Split into Macroblocks 16x16 pixels - Decoder Coder Transform/ Scal./Quant. Scaling & Inv. Transform Quant. Transf. coeffs Entropy Coding Intra/Inter Intra-frame Prediction Motion- Compensation De-blocking Filter Output Signal Motion Estimation Motion p5

Input Signal Split into Macroblocks 16x16 pixels - Decoder Coder Transform/ Scal./Quant. Scaling & Inv. Transform Quant. Transf. coeffs Entropy Coding Intra/Inter Intra-frame Prediction Motion- Compensation Motion Estimation De-blocking 16x16 16x8 8x16 8x8 Filter MB 0 0 1 Types 0 0 1 Output1 2 3 8x8 Signal 8x4 4x8 4x4 8x8 0 0 1 0 0 1 Types Motion 1 2 3 Motion vector accuracy 1/4 (6-tap filter) p6

Multiple Reference Pictures and Generalized B Pictures Δ = 4 Δ = 2 4 Prior Decoded Pictures as Reference Δ = 1 Current Picture 1. Extend motion vector by reference picture index Δ 2. Provide reference pictures at decoder side 3. In case of bi-predictive coding (B pictures): decode 2 sets of motion parameters Flexible buffering of reference pictures generalizes B pictures: B pictures can be reference pictures (decoupling of concepts) Reference picture for a B picture can be any prior decoded picture p7

Input Signal Split into Macroblocks 16x16 pixels - Decoder Intra/Inter Coder Transform/ Scal./Quant. Intra-frame Prediction Motion- Compensation Motion Estimation Scaling & Inv. Transform De-blocking Filter Directional spatial prediction (9 types for luma, 1 chroma) Q A B C D E F G H I Quant. a b c d J Transf. e f g coeffs h K i j k l L m n o p M N O P Output Signal 4 Entropy Coding 0 e.g., Mode 3: diagonal down/right Motion prediction a, f, k, p are predicted by (A + 2Q + I + 2) >> 2 6 1 5 3 7 2 8 p8

Input Signal 4x4 Block Integer Transform Decoder Split into Macroblocks 16x16 pixels 8x8 Block Integer Transform H = - Intra/Inter Coder Transform/ Scal./Quant. Intra-frame Motion- Prediction Compensation 1 1 1 1 1 1 1 1 12/8 10/8 6/8 3/8-3/8-6/8-10/8-12/8 1 1/2-1/2-1 -1-1/2 1/2 1 10/8-3/8 12/8-6/8 6/8-12/8 3/8-10/8 1-1 -1 1 1-1 -1 1 Scaling & Inv. Transform De-blocking Filter Quant. Transf. coeffs Output Signal Entropy Coding 6/8-12/8 3/8 10/8-10/8-3/8 12/8-6/8 1/2-1 1-1/2-1/2 1-1 1/2 Scalar Quantization using QP to Adjust Step Size / Bit Rate Motion Estimation 3/8-6/8 10/8-12/8 12/8-10/8 6/8-3/8 Motion p9

Input Signal Split into Macroblocks 16x16 pixels - Decoder Coder Transform/ Scal./Quant. Inv. Scal. & Transform Quant. Transf. coeffs Entropy Coding Intra/Inter Intra-frame Prediction Motion- Compensation De-blocking Filter Output Signal Motion Estimation Motion p10

Exp-Golomb code is used universally for all symbols except for transform coefficients (Section 9.1) p11

Context adaptive VLCs for coding of transform coefficients Contexts are built dependent on transform coefficients No end-of-block, but number of coefficients is decoded Coefficients are scanned backwards p12

Context-based Adaptive Binary Arithmetic Codes (CABAC) Usage of adaptive probability models for most symbols Exploiting symbol correlations by using contexts Restriction to binary arithmetic coding Simple and fast adaptation mechanism Fast binary arithmetic codec based on table look-ups and shifts only Average bit-rate saving over CAVLC 10-15% for broadcast video p13

NAL unit header NAL unit payload NAL unit header: 1 byte consisting of forbidden_bit (1 bit): may be used to signal that a NAL unit is corrupt (useful e.g. for decoders capable to handle bit errors) nal_storage_idc (2 bit): signals relative importance, and if the picture is stored in the reference picture buffer nal_unit_type (5 bit): signals 1 of 10 different NAL unit types Coded slice (regular VCL data), Coded data partition A, B, C (DPA, DPB, DPC), Instantaneous decoder refresh (IDR), Supplemental enhancement information (SEI), Sequence and picture parameter set (SPS, PPS), Picture delimiter (PD) and filler data (FD). NAL unit payload: an emulation prevented sequence of bytes. p14

Application Standards Adoption Status 3GPP (recommended in rel 6) 3GPP2 (optional for streaming service) ARIB (Japan mobile segment broadcast) ATSC (preliminary adoption for robust-mode back-up channel) Blu-ray Disc Association (mandatory for BD-ROM players) DLNA (optional in first version) DMB (Korea - mandatory) DVB (specified in TS 102 005 and one of two in TS 101 154) DVD Forum (mandatory for HD DVD players) IETF AVT (RTP payload spec approved as RFC 3984) ISMA (mandatory specified in near-final rel 2.0) SCTE (under consideration) US DoD MISB (US government preferred codec up to 1080p) (And of course MPEG and the ITU-T) p15

Product Examples conferencing (Polycom, Tandberg, Sony) HDTV satellite (DirecTV, BSkyB, Echostar, ) Terrestrial TV (France, Estonia, Norway, Brazil, ) IPTV (AT&T, France Telecom, British Telecom, Deutsche Telekom, KPN, Belgacom, ) Mobile TV (Korea, Japan, Italy, USA, Qatar, Malaysia, ) Mobile phones (Nokia, Samsung, SonyEricsson, Apple, ) Mobile video players (Sony PSP, Apple ipod, ) Blu-ray disc and HD DVD (Sony, Samsung, Toshiba, LG, ) AVC HD Camcorders (Panasonic, Sony, Hitachi, ) Internet video streaming (Apple Quicktime, Adobe Flash-YouTube, ) application area where H.264/AVC is not present: Digital Cinema p16

Coder Rate-Distortion Optimization (RDO) Constrained problem: min p D( p) s.t. R( p) R T Unconstrained Lagrangian formulation: p = argmin{ D( p) + λ R(p) } p with λ controlling the rate-distortion trade-off D Distortion R Rate R T Target rate p Parameter Vector Rate-Constrained Mode Decision D 2 (M QP)+λ M R(M QP) Rate-Constrained Motion Estimation D 1 (m,δ)+λ D R(m,Δ) M Evaluated macroblock mode out of a set of possible modes Q Value of quantizer for transform coefficients l M Lagrange parameter for mode decision D 2 Sum of squared differences (luminance & chrominance) R Number of bits associated with header, motion, transform coefficients m Motion vector containing spatial displacement and picture reference parameter D l D Lagrange parameter for motion estimation D 1 Sum of absolute differences (luminance) R Number of bits associated with motion information p17

Αναφορές για RDO IEEE Signal Processing Magazine, Vol. 15, Nr. 6, 1998 αφιέρωµα σε τεχνικές RDO για εικόνες/βίντεο Ιδιαίτερα: G. Sullivan, T. Wiegand, Rate-distortion optimization for video compression (pp. 74-90). p18

Επιτεύγµατα στην Κωδικοποίηση Βίντεο PSNR [db] 40 Variable block size (16x16 4x4) + quarter-pel + multi-frame motion compensation (H.264/AVC, 2003) Variable block size (16x16 8x8) (H.263, 1996) + quarter-pel motion compensation (MPEG-4, 1998) Half-pel motion compensation (MPEG-1 1993 MPEG-2 1994) 38 35 36 34 Bit-rate Reduction: 75% Foreman 10 Hz, QCIF 100 frames 32 30 Integer-pel motion compensation (H.261, 1991) 28 Intraframe DCT coding (JPEG, 1990) Rate [kbit/s] 0 100 200 300 p19