ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ : Σ Α Ε Δ Ε

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ : Σ Α Ε Δ Ε"

Transcript

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ : Σ Α Ε Δ Ε του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών Κ Μ : Θέμα HEVC - Κωδικοποίηση video υψηλής αποδοτικότητας Επιβλέπων Καθηγητής Αθανάσιος Σκόδρας Αριθμός Διπλωματικής Εργασίας: /2017 Πάτρα, Μάρτιος 2017

2

3 ΠΙΣΤΟΠΟΙΗΣΗ Πιστοποιείται ότι η διπλωματική εργασία με θέμα HEVC - Κωδικοποίηση video υψηλής αποδοτικότητας του φοιτητή του τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Κωνσταντίνου Μέρμελα (Α.Μ.: ) παρουσιάστηκε δημόσια και εξετάστηκε στο τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών στις / / Ο Επιβλέπων Ο Διευθυντής του Τομέα Αθανάσιος Σκόδρας Καθηγητής Νικόλαος Κούσουλας Καθηγητής

4

5 Αριθμός διπλωματικής εργασίας: /2017 Θέμα: HEVC - Κωδικοποίηση video υψηλής αποδοτικότητας Φοιτητής: Κωνσταντίνος Μέρμελας Επιβλέπων: Καθηγητής Αθανάσιος Σκόδρας Περίοδος εκπόνησης της εργασίας: Απρίλιος Φεβρουάριος 2017 Η εργασία αυτή γράφτηκε στο X L A TEX και χρησιμοποιήθηκε η γραμματοσειρά GFS Didot του Greek Font Society. E

6

7 Σ Περίληψη της παρούσας διπλωματικής εργασίας είναι η συγκριτική μελέτη των προτύπων κωδικοποίησης βίντεο νέας γενιάς HEVC και Thor, τόσο μεταξύ τους όσο και με το μέχρι σήμερα ευρέως διαδεδομένο πρότυπο H.264. Αρχικά, γίνεται μία εισαγωγή στις έννοιες της κωδικοποίησης βίντεο, ενώ στη συνέχεια, παρουσιάζονται τα κύρια τεχνικά χαρακτηριστικά των προαναφερθέντων προτύπων. Τέλος, περιγράφεται η πειραματική διαδικασία και παρουσιάζονται αναλυτικά τα αποτελέσματα. Σύμφωνα με τις αντικειμενικές συγκρίσεις, που πραγματοποιήθηκαν, τα πρότυπα HEVC και Thor παράγουν καλύτερο οπτικό αποτέλεσμα από το H.264, με το Thor να παρουσιάζει γενικά χαμηλότερες μετρήσεις από το HEVC. vii

8

9 T Abstract he main focus of this dissertation is the objective comparison between two contemporary video codecs, HEVC and Thor, using H.264 as a baseline of performance. In the first chapter, a brief introduction to video coding is given followed by an overview of the H.264, HEVC and Thor standards in chapters two to four. In the last chapter, experiment details are explained along with a thorough examination of the results. According to the expiremental measurements, both HEVC and Thor provide better reproduction quality than H.264, with Thor showing worse results than HEVC. ix

10

11 Θ Ευχαριστίες ήθελα να ευχαριστήσω τον επιβλέποντα καθηγητή της διπλωματικής μου εργασίας, κ. Αθανάσιο Σκόδρα, για την πολύτιμη βοήθειά του καθ όλη τη διάρκεια εκπόνησης της εργασίας, καθώς και για την ευκαιρία που μου έδωσε να ασχοληθώ με το συγκεκριμένο θέμα. Παράλληλα, θα ήθελα να ευχαριστήσω την οικογένεια, τους φίλους και όλους όσους με στήριξαν και με στηρίζουν στις σπουδές μου. xi

12

13 Απόδοση αγγλικών όρων partitioning mapping standardized lossy lossless frame quadtree extrapolation interpolation encoder decoder deblocking filter διαμέριση απεικόνιση τυποποιημένος απωλεστικός μη-απωλεστικός καρέ τετραδικό δέντρο παρέκταση παρεμβολή κωδικοποιητής αποκωδικοποιητής φίλτρο απεμπλοκής Ακρωνύμια MB DCT VCL NAL CAVLC CABAC FMO ASO CTU/CU/PU/TU CTB/CB/PB/TB/SB AMVP SAO VPS SEI VUI WPP CLPF URQ Macroblock Discrete Cosine Transform Video Coding Layer Network Abstraction Layer Context-Adaptive Variable-Length Coding Context-Adaptive Binary Arithmetic Coding Flexible Macroblock Ordering Arbitrary Slice Ordering Coding Tree/Coding/Prediction/Transform Unit Coding Tree/Coding/Prediction/Transform/Super Block Advanced Motion Vector Prediction Sample Adaptive Offset Video Parameter Set Supplemental Enhancement Information Video Usability Information Wavefront Parallel Processing Constrained Low Pass Filter Uniform Reconstruction Quantization xiii

14

15 ΠΕΡΙΕΧΟΜΕΝΑ 1 Εισαγωγή στην κωδικοποίηση βίντεο Εισαγωγικά στοιχεία Είδη καρέ - I, P, B Αποθήκευση και διαμέριση εικόνας Αποθήκευση εικόνας - χρωματικά μοντέλα Διαμέριση εικόνας (Partioning) Aντιστάθμιση κίνησης (Motion compensation) Μετασχηματισμός και Κβάντιση Κωδικοποίηση εντροπίας (Entropy coding) Πρότυπα κωδικοποίησης βίντεο Το πρότυπο H Εισαγωγικά στοιχεία Πεδία εφαρμογών Τεχνικά χαρακτηριστικά Προφίλ και επίπεδα Το πρότυπο HEVC Εισαγωγικά στοιχεία Τεχνικά χαρακτηριστικά Προφίλ, επίπεδα και βαθμίδες Το πρότυπο Thor Εισαγωγικά στοιχεία Τεχνικά χαρακτηριστικά Πειραματική διαδικασία 29 xv

16 xvi 5.1 Χρησιμοποιούμενα μέσα Ακολουθίες βίντεο Μετρικές αντικειμενικής αξιολόγησης Κωδικοποιητές και ρυθμίσεις Αποτελέσματα και συμπεράσματα Μελλοντική έρευνα 37 Βιβλιογραφία 39 Παράρτημα Αʹ Ρυθμίσεις κωδικοποιητών 43 Παράρτημα Βʹ Σύγκριση κωδικοποιημένων καρέ 53

17 ΕΙΣΑΓΩΓΗ Η κωδικοποίηση βίντεο είναι ο κλάδος, που αναφέρεται σε όλες τις τεχνικές, οι οποίες χρησιμοποιούνται για την αποδοτική συμπίεση της πληροφορίας του βίντεο. Από τις πρώτες μέρες του βίντεο έως και σήμερα, υπάρχει μια συνεχώς αυξανόμενη ζήτηση για περιεχόμενο όλο και καλύτερης οπτικής ποιότητας. Η ζήτηση αυτή, λόγω των τεχνικών περιορισμών, που θέτουν τα μέσα αποθήκευσης και οι γραμμές μεταφοράς δεδομένων, δημιουργεί με τη σειρά της την απαίτηση για συνεχώς μεγαλύτερο ποσοστό συμπίεσης της πληροφορίας του βίντεο, δίχως όμως αυτό να συνεπάγεται την υποβάθμιση της ποιότητάς του. Στα επόμενα κεφάλαια, θα αναφερθούμε στις βασικές τεχνικές, που χρησιμοποιούνται στην κωδικοποίηση βίντεο, καθώς και στο πώς αυτές επεκτείνονται από τα πρότυπα κωδικοποίησης νέας γενιάς, για την κάλυψη των σύγχρονων απαιτήσεων. 1

18

19 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΚΩΔΙΚΟΠΟΙΗΣΗ ΒΙΝΤΕΟ 1.1 Εισαγωγικά στοιχεία Μ τον όρο κωδικοποίηση ενός βίντεο αναφερόμαστε στη μετατροπή αυτού σε μια συμπιεσμένη μορφή, με στόχο τη μείωση του μεγέθους του για την εύκολη και προσιτή αποθήκευση και μεταφορά του. Η βασική αρχή πάνω στην οποία στηρίζονται όλες οι μέθοδοι ψηφιακής συμπίεσης είναι το γεγονός ότι το σήμα εμπεριέχει πλεονάζουσα πληροφορία (redundancy), δηλαδή πληροφορία που επαναλαμβάνεται είτε εντός ενός συγκεκριμένου καρέ είτε γειτονικών. Είναι δυνατόν, συνεπώς, να κωδικοποιηθεί μονάχα ένα μέρος αυτής της πληροφορίας και το υπόλοιπο να εξαχθεί, μέσω κατάλληλων τεχνικών, από αυτή. Συνήθως, η διαδικασία αυτή είναι απωλεστική, που σημαίνει ότι κάποια, μικρή γενικά, ποσότητα πληροφορίας τελικά χάνεται, γεγονός που επιδρά αρνητικά στην ποιότητα του συμπιεσμένου βίντεο, μιας και δεν υπάρχει η απαιτούμενη πληροφορία για την ακριβή ανασύνθεση του αρχικού βίντεο [1]. Υπάρχουν δύο είδη πλεονασμού σε ένα σήμα βίντεο, ο χωρικός (spatial redundancy) και ο χρονικός (temporal redundancy): Ο χωρικός πλεονασμός σχετίζεται με την ικανότητα του ανθρώπινου ματιού να μπορεί να ανεχτεί ένα ποσοστό παραμόρφωσης ή αλλοίωσης ορισμένων παραμέτρων της εικόνας, χωρίς αυτό να γίνεται αντιληπτό. Παράλληλα, γνωρίζουμε ότι η ανθρώπινη όραση είναι πολύ πιο ευαίσθητη σε μεταβολές της φωτεινότητας παρά σε μεταβολές 3

20 4 Εισαγωγή στην κωδικοποίηση βίντεο των χρωμάτων, γεγονός, που όπως αναφέρεται στη συνέχεια, αξιοποιείται στην αποδοτικότερη συμπίεση. Ο χρονικός πλεονασμός αναφέρεται στην πλεονάζουσα πληροφορία μεταξύ συνεχόμενων καρέ. Οι τιμές φωτεινότητας και χρώματος κάθε pixel μπορούν σε κάθε δεδομένη χρονική στιγμή να υπολογιστούν από τιμές τους σε προηγούμενα ή επόμενα καρέ, αφού οι τιμές των δειγμάτων της εικόνας συνήθως μεταβάλλονται ελάχιστα μεταξύ παραπλήσιων καρέ. Χαρακτηριστικό παράδειγμα αποτελούν τα κοντινά πλάνα σε πρόσωπο, στα οποία το φόντο παραμένει στο μεγαλύτερό του μέρος αμετάβλητο. Κατ αυτόν τον τρόπο μπορούμε να υπολογίσουμε ένα τμήμα ενός καρέ αναφερόμενοι σε άλλα παραπλήσια και να προσθέσουμε απλά τις προκύπτουσες διαφορές, χωρίς να χρειάζεται να κωδικοποιήσουμε την πλεονάζουσα πληροφορία. Όπως είναι φυσικό, τα δύο αυτά είδη πλεονασμού πληροφορίας, υποδεικνύουν δύο είδη συμπίεσης, την ενδοπλαισιακή (intra-frame) και τη διαπλαισιακή (inter-frame). Στην ενδοπλαισιακή συμπίεση, τα στοιχεία ενός καρέ κωδικοποιούνται αναφερόμενα σε στοιχεία εντός του ίδιου καρέ, ενώ στη διαπλαισιακή κωδικοποιούνται αναφερόμενα σε στοιχεία χρονικά κοντινών καρέ, με την προκύπτουσα διαφορά να κωδικοποιείται αποκλειστικά ενδοπλαισιακά. 1.2 Είδη καρέ - I, P, B Ανάλογα με το είδος της συμπίεσης που εφαρμόζεται σε κάθε καρέ, τα κατατάσουμε σε I (Intra-frame), P (Predictive inter-frame) και B (Bi-predictive inter-frame). I-frames Αυτό το είδος καρέ, όπως μαρτυρά και το όνομά του, συμπιέζεται ενδοπλαισιακά και είναι τα μόνα καρέ, που για την αποκωδικοποίησή τους δεν χρειάζεται να γίνει αναφορά σε κάποιο άλλο. Χρησιμοποιούνται ως σημεία χρονικής αναφοράς κατά την τυχαία προσπέλαση του σήματος και μεταδίδονται ανά τακτά χρονικά πλαίσια (τουλάχιστον 1 κάθε 15 καρέ), για να αποφευχθεί η διάδοση σφαλμάτων, που δημιουργούν τα P καρέ. P-frames Τα P καρέ για τη συμπίεσή τους αναφέρονται σε προηγούμενα I ή P καρέ (διαπλαισιακή συμπίεση) και παρουσιάζουν μεγαλύτερο ποσοστό συμπίεσης από τα I, αφού παραλείπεται και η χρονικά πλεονάζουσα πληροφορία. Κατά τη διαδικασία της κωδικοποίησης των P καρέ, εκτελούνται αλγόριθμοι εκτίμησης κίνησης (motion estimation) και δημιουργούνται διανύσματα κίνησης (motion vectors), ούτως ώστε να προσδιορισθεί ο τρόπος με τον οποίο τα στοιχεία του υπό κωδικοποίηση καρέ προκύπτουν ως κίνηση

21 Αποθήκευση και διαμέριση εικόνας 5 των στοιχείων του καρέ αναφοράς. Στη συνέχεια, εξάγεται η διαφορά μεταξύ των δύο καρέ και κωδικοποιείται κατάλληλα μόνο αυτή μαζί με την πληροφορία της κίνησης. B-frames Τα B καρέ κωδικοποιούνται και αυτά με διαπλαισιακή συμπίεση αλλά προκύπτουν από την εύρεση των διαφορών με αναφορά τόσο σε προηγούμενα όσο και σε επόμενα I ή/και P καρέ. Δεν συντελούν στη διάδοση σφαλμάτων, αφού δεν χρησιμοποιούνται ως σημεία αναφοράς για άλλα καρέ και παρουσιάζουν μεγαλύτερο ποσοστό συμπίεσης από τα P καρέ, επειδή συνδυάζουν πληροφορίες από προηγούμενα και μελλοντικά καρέ. Παρακάτω παρουσιάζονται οι σχέσεις αναφοράς μεταξύ των διαφόρων ειδών καρέ, καθώς και μια ενδεικτική ακολουθία ενός βίντεο: Σχήμα 1.1 και Σχήμα 1.2 αντίστοιχα. Σχήμα 1.1: Σχέσεις μεταξύ I, P, B καρέ Σχήμα 1.2: Ενδεικτική ακολουθία I, P, B καρέ 1.3 Αποθήκευση και διαμέριση εικόνας Αποθήκευση εικόνας - χρωματικά μοντέλα Προτού γίνει αναφορά στον τρόπο με τον οποίο πραγματοποιείται η συμπίεση κάθε καρέ, είναι απαραίτητο να εστιάσουμε στο πώς απο-

22 6 Εισαγωγή στην κωδικοποίηση βίντεο θηκεύεται μια ψηφιακή εικόνα και πώς διαμερίζουμε το σύνολό της σε μικρότερα block εργασίας. Μια εικόνα μπορεί να θεωρηθεί ως ένα δισδιάστατο σύνολο σημείων, πολύ κοντά το ένα στο άλλο, όπου κάθε τέτοιο σημείο έχει ένα συγκεκριμένο χρώμα. Για την πιστή αναπαραγωγή της εικόνας, θα πρέπει λοιπόν αυτή να αναπαρασταθεί ως ένας δισδιάστατος πίνακας, με στοιχεία όσα τα σημεία της εικόνας, και τα οποία στοιχεία θα έχουν τιμή το αντίστοιχο χρώμα. Κάτι τέτοιο σημαίνει ότι απαιτείται ένα τεράστιο εύρος αποθήκευσης τιμών, για την ικανοποίηση του επίσης τεράστιου αριθμού διαφορετικών χρωμάτων. Οδηγούμαστε συνεπώς στην ανάγκη δημιουργίας ενός χρωματικού μοντέλου, το οποίο θα καθιστά δυνατή την περιγραφή όλων των χρωμάτων μοναχά μέσω μιας πλειάδας αριθμών. Παραδείγματα τέτοιων μοντέλων είναι: το RYB (Red-Yellow-Blue), που χρησιμοποιείται στη ζωγραφική και στο οποίο τα βασικά χρώματα είναι το κόκκινο, το κίτρινο και το μπλε το RGB (Red-Green-Blue), που χρησιμοποιείται στην κωδικοποίηση των χρωμάτων που εμφανίζονται σε μία οθόνη και στο οποίο τα βασικά χρώματα είναι το κόκκινο, το πράσινο και το μπλε το CMYK (Cyan-Magenta-Yellow-Black), που χρησιμοποιείται στην εκτύπωση εντύπων και στο οποίο τα βασικά χρώματα είναι το γαλάζιο, το ματζέντα, το κίτρινο και το μαύρο. Αναφερθήκαμε νωρίτερα στο χαρακτηριστικό της ανθρώπινης όρασης να είναι πολύ πιο ευαίσθητη σε μεταβολές της φωτεινότητας παρά σε μεταβολές των χρωμάτων. Αυτό αξιοποιείται με τη θεώρηση του χρωματικού μοντέλου Y CbCr, στο οποίο η Y συνιστώσα αναπαριστά την πληροφορία της φωτεινότητας και οι Cb, Cr συνιστώσες την πληροφορία της χρωματικότητας (συγκεκριμένα τη διαφορά του χρωματικού περιεχομένου από το μπλε και το κόκκινο αντίστοιχα του μοντέλου RGB). Στο Σχήμα 1.3 φαίνεται η μετατροπή μιας εικόνας από το RGB χρωματικό μοντέλο στο Y CbCr, όπου γίνεται εμφανής η διαφορά που αντιλαμβανόμαστε στην προσληφθείσα πληροφορία μεταξύ των συνιστωσών Y, Cb, Cr. Σχήμα 1.3: Μετατροπή από RGB σε Y CbCr

23 Aντιστάθμιση κίνησης (Motion compensation) Διαμέριση εικόνας (Partioning) Τυπικά, οι εικόνες διαμερίζονται σε block από pixel (macroblock - MB), στο κάθε ένα εκ των οποίων μπορεί να εφαρμοσθεί ξεχωριστός τύπος συμπίεσης, χωρίς να χρειάζεται να εφαρμόζεται ένας ενιαίος για όλη την εικόνα: I-καρέ μπορούν να περιέχουν μόνο I-MB. P-καρέ μπορούν να περιέχουν είτε I είτε P-MB. B-καρέ μπορούν να περιέχουν I, P ή B-MB. Για την πιστή αναπαράσταση κάθε MB, είναι απαραίτητη η αποθήκευση και των τριών καναλιών του χρωματικού μοντέλου. Ωστόσο, στην προηγούμενη παράγραφο είδαμε ότι, η συνιστώσα της φωτεινότητας έχει μεγαλύτερη βαρύτητα στο αντιλαμβανόμενο τελικό αποτέλεσμα από τις συνιστώσες της χρωματικότητας. Ως αποτέλεσμα, συνηθίζεται να υποδειγματοληπτούμε τα κανάλια της χρωματικότητας, αφού επιτυγχάνεται μεγαλύτερη συμπίεση με μικρή αρνητική επίδραση στην ποιότητα. Στο Σχήμα 1.4 παρουσιάζεται καλύτερα το μέγεθος της οικονομίας. Σχήμα 1.4: Παράδειγμα αναλογίας καναλιών 4:1:1 (Y :Cb:Cr). Παρατήρηση: Στην περίπτωση χρήσης 4:4:4, τα απαιτούμενα κελιά από 6 θα ήταν 12! 1.4 Aντιστάθμιση κίνησης (Motion compensation) Αναφερθήκαμε νωρίτερα στην έννοια της πλεονάζουσας πληροφορίας τόσο εντός του ίδιου καρέ όσο και μεταξύ γειτονικών, γεγονός που εκμεταλλευόμαστε με την πρόβλεψη ενός καρέ από άλλα και αντισταθμίζοντας τις όποιες διαφορές με το πραγματικό καρέ, με στόχο την περαιτέρω συμπίεση του σήματος. Η αλγοριθμική διαδικασία με την οποία πραγματοποιείται η παραπάνω πρόβλεψη ονομάζεται αντιστάθμιση κίνησης. Στην Εικόνα 1 βλέπουμε ένα παράδειγμα του πώς, μέσω της πρόβλεψης, μειώνεται δραστικά το μέγεθος της υπολειπόμενης πληροφορίας, που χρειάζεται να κωδικοποιηθεί. H αντιστάθμιση κίνησης μπορεί είτε να εφαρμόζεται ενιαία σε

24 8 Εισαγωγή στην κωδικοποίηση βίντεο Εικόνα 1: Αριστερά: Αρχικό καρέ. Κέντρο: Διαφορές μεταξύ του αρχικού καρέ και του επόμενου. Δεξιά: Διαφορές μεταξύ του αρχικού καρέ και του επόμενου, όπως προβλέφθηκε με αντιστάθμιση ολόκληρο το καρέ (global motion compensation) είτε και σε κάθε MB ξεχωριστά (block motion compensation), ανάλογα με τους στόχους της εκάστοτε συμπίεσης (μικρή πολυπλοκότητα, μεγάλη ποιότητα, κλπ). Το όφελος αυτής της διαδικασίας γίνεται εύκολα αντιληπτό αν αναλογιστούμε την απλή περίπτωση ενός μόνο pixel και επεκτείνοντας τα συμπεράσματα. Ένα pixel, για τη σωστή αναπαραγωγή του, απαιτεί 3 τιμές για κάθε κανάλι του χρωματικού μοντέλου Y CbCr. Ψάχνοντας στα προηγούμενα καρέ για ένα ίδιο pixel, είτε σε ολόκληρο το εύρος της εικόνας είτε σε μια γειτονιά αυτού του pixel (ανάλογα όπως είπαμε τους στόχους της συμπίεσης), είναι δυνατό να το αναπαραστήσουμε ως διάνυσμα κίνησης από το καρέ αναφοράς, με χρήση δηλαδή μόνο 2 τιμών! Στην πράξη, αντί για μεμονομένα pixel, εκτιμάται η κίνηση κατά MB, οπότε το κέρδος είναι ακόμα πιο μεγάλο. Σημείωση: Στο σημείο αυτό πρέπει να τονιστεί ότι κατά την αντιστάθμιση κίνησης, το τρέχον καρέ είναι αυτό που χωρίζεται σε μη επικαλυπτόμενα MB και το διάνυσμα κίνησης δείχνει από πού ήρθε το κάθε MB. Συνεπώς, σ αυτό το στάδιο της συμπίεσης, για την κωδικοποίηση του τρέχοντος καρέ, απαιτείται να κωδικοποιηθούν μόνο τα διανύσματα κίνησης και η υπολειπόμενη διαφορά! Όπως περιγράφεται στη συνέχεια της εργασίας, κάθε πρότυπο κωδικοποίησης δίνει το περιθώριο χρήσης πληθώρας διαφορετικών αλγορίθμων και επιλογών, για παράδειγμα μεταβλητό μέγεθος block, επικαλυπτόμενα block και υπο-pixel ακρίβεια διανυσμάτων κίνησης (συνήθως, σε κλάσματα μισού ή τετάρτου ενός pixel). 1.5 Μετασχηματισμός και Κβάντιση Στο επόμενο στάδιο της κωδικοποίησης, αρχικά εφαρμόζεται κατά block ένας μετασχηματισμός στο πεδίο της συχνότητας. Οι μετασχηματισμοί που χρησιμοποιούνται στην κωδικοποίηση βίντεο είναι μονοσήμαντοι, που σημαίνει ότι το πρωτότυπο βίντεο μπορεί να αναπαραχθεί μοναδικά. Ο DCT (Discrete Cosine Transform - Διακριτός Μετασχηματισμός Συνημιτόνου) συγκεκριμένα έχει χρησιμοποιηθεί σε πληθώρα προτύπων, όπως τα H. 261, H. 262, H. 263, MPEG- 1, MPEG- 2 και MPEG- 4. Εξαιτίας του με-

25 Κωδικοποίηση εντροπίας (Entropy coding) 9 γάλου βαθμού συσχέτισης μεταξύ γειτονικών pixel, το μεγάλο πλεονέκτημα του μετασχηματισμού στη συχνότητα όταν εφαρμόζεται κατά block είναι πως το μεγαλύτερο μέρος της ενέργειας του σήματος, όπως περιγράφεται από τον πίνακα των συντελεστών του μετασχηματισμού, συγκεντρώνεται πάνω και αριστερά. Στη συνέχεια, ακολουθεί η διαδικασία της κβάντισης, προκειμένου να απομακρυνθούν τόσο οι πολύ μεγάλες όσο και οι πολύ μικρές συχνότητες του σήματος, ενώ η ενέργεια των ενδιάμεσων συχνοτήτων κβαντίζεται σε συγκεκριμένα επίπεδα. Παράλληλα, η συγκέντρωση της ενέργειας, που αναφέραμε νωρίτερα, οδηγεί στο στάδιο αυτό σε ελάττωση του πλήθους των μη μηδενικών στοιχείων του πίνακα, οπότε και απομένει ακόμα λιγότερη πληροφορία για κωδικοποίηση! Γίνεται εμφανές απ όλα αυτά ωστόσο πως η κβάντιση είναι εξ ορισμού μια απωλεστική διαδικασία, κατά την οποία χάνεται τμήμα της πληροφορίας, γι αυτό και ο τρόπος που θα εφαρμοστεί πρέπει να λαμβάνει υπ όψιν και τα χαρακτηριστικά του προς συμπίεση βίντεο. Στο Σχήμα 1.5 φαίνεται μια απλή αναπαράσταση των προηγούμενων. Σχήμα 1.5: Μετασχηματισμός και κβάντιση block. Αρχικά χρειάζονται 16 τιμές για να αναπαρασταθεί σωστά το block, ενώ μετά την κβάντιση απαιτούνται μόνο 4! 1.6 Κωδικοποίηση εντροπίας (Entropy coding) Τελευταίο στάδιο της διαδικασίας κωδικοποίησης αποτελεί η κωδικοποίηση εντροπίας, με την οποία προκύπτει μια ακολουθία από bits, που αναπαριστά το συμπιεσμένο βίντεο. Στόχος αυτού του σταδίου είναι η κατά το δυνατόν αποτελεσματικότερη κωδικοποίηση της πληροφορίας, ή με άλλα λόγια, η περιγραφή του σήματος με το ελάχιστο πλήθος διαφορετικών συμβόλων, χωρίς ωστόσο αυτό να συνεπάγεται απώλεια πληροφορίας (μη απωλεστική διαδικασία). Για παράδειγμα, αν θεωρήσουμε μια ακολουθία 10 διαδοχικών μηδενικών, αυτή θα μπορούσε να αντικατασταθεί από έναν μόνο ειδικό χαρακτήρα, μειώνοντας έτσι το μέγεθος της

26 10 Εισαγωγή στην κωδικοποίηση βίντεο ακολουθίας και χωρίς να χάνεται η πληροφορία που φέρει. Δύο συνήθεις τεχνικές, είναι η κωδικοποίηση Huffman και η αριθμητική κωδικοποίηση, ενώ αν τα κατά προσέγγιση χαρακτηριστικά της εντροπίας του σήματος είναι γνωστά, μπορούν να χρησιμοποιηθούν και πιο απλές στατικές κωδικοποιήσεις, όπως η Fibonacci και η Rice. Από το 2014, έχει αρχίσει η χρήση τεχνικών κωδικοποίησης της οικογένειας των Ασύμμετρων Αριθμητικών Συστημάτων (Asymmetric Numeral Systems), που συνδυάζουν το βαθμό συμπίεσης, που προσφέρει η αριθμητική κωδικοποίηση, με υπολογιστικό κόστος παρόμοιο αυτού της κωδικοποίησης Huffman. Σχήμα 1.6: Κωδικοποίηση - Αποκωδικοποίηση βίντεο 1.7 Πρότυπα κωδικοποίησης βίντεο Στο σημείο αυτό ολοκληρώθηκε η γενική περιγραφή της κωδικοποίησης βίντεο (Σχήμα 1.6). Η αποκωδικοποίηση του βίντεο μπορεί να θεωρηθεί ως η αντίστροφη διαδικασία, αν και δεν είναι πάντα μοναδικά αντιστρέψιμη. Ως πρότυπο κωδικοποίησης ενός βίντεο ορίζεται ένα σύνολο από κανόνες που πρέπει να διέπουν είτε την κωδικοποίηση είτε την αποκωδικοποίηση ενός βίντεο ή και τα δύο. Κάθε πρότυπο ανάλογα με τις εφαρμογές που σχεδιάζεται να καλύψει, χρησιμοποιεί διαφορετικές τεχνικές για την κάλυψη των εκάστοτε απαιτήσεων. Μια λίστα με πρότυπα κωδικοποίησης βίντεο μπορεί να βρεθεί στο [2]. Στη συνέχεια, θα αναφερθούμε στα πρότυπα H.264, HEVC και Thor.

27 ΚΕΦΑΛΑΙΟ 2 ΤΟ ΠΡΟΤΥΠΟ H Εισαγωγικά στοιχεία Τ πρότυπο H.264, επίσης γνωστό ως MPEG-4 Part 10 και AVC (Advanced Video Coding - Προχωρημένη Κωδικοποίηση Βίντεο), είναι προϊόν της κοινής συνεργασίας των οργανισμών προτυποποίησης ITU-T Video Coding Experts Group (VCEG) και ISO/IEC Moving Picture Experts Group (MPEG), με την ονομασία Joint Video Team (JVT). Αναπτύχθηκε αρχικά την περίοδο μεταξύ 1999 και 2003 και συνέχισε να επεκτείνεται έως το Αντικείμενο του προτύπου, τόσο του συγκεκριμένου όσο και των παλαιότερων από τους ίδιους οργανισμούς, όπως φαίνεται και στο Σχήμα 2.1, αποτελεί αποκλειστικά και μόνο το κομμάτι της αποκωδικοποίησης. Το πρότυπο θέτει περιορισμούς στο bitstream και στη σύνταξη των στοιχείων του, καθώς και στον ορισμό της διαδικασίας αποκωδικοποίησης, τέτοιους Σχήμα 2.1: Αντικείμενο του προτύπου κωδικοποίησης βίντεο 11

28 12 Το πρότυπο H.264 ώστε κάθε αποκωδικοποιητής σύμφωνος με το πρότυπο να παράγει παρόμοιο αποτέλεσμα δοθείσης φυσικά μια κωδικοποιημένης ακολουθίας επίσης σύμφωνης με το πρότυπο. Ο περιορισμός αυτός στο αντικείμενο του προτύπου επιφέρει μέγιστη ελευθερία στη βελτιστοποίηση των υλοποιήσεων για συγκεκριμένες εφαρμογές, ισοσταθμίζοντας παραμέτρους όπως ποιότητα συμπίεσης, χρόνος υλοποίησης και κωδικοποίησης, τελικό μέγεθος αρχείου, κ.λ.π. Ως εκ τούτου ωστόσο, το πρότυπο δεν προσφέρει εγγυήση πιστής αναπαραγωγής από άκρη σε άκρη (end-to-end), αφού ακόμα και χοντροκομμένες τεχνικές κωδικοποίησης μπορεί να θεωρηθούν σύμφωνες με το πρότυπο [3]. 2.2 Πεδία εφαρμογών Το πρότυπο Η.264 σχεδιάστηκε με γνώμονα την παροχή υψηλής ανάλυσης και ποιότητας βίντεο με την κάλυψη ενός ευρέος φάσματος εφαρμογών και αναγκών όπως επίγεια, καλωδιακή και δορυφορική μετάδοση HD τηλεοπτικού σήματος, αποθήκευση και επεξεργασία βίντεο σε μαγνητικά και οπτικά μέσα, streaming υπηρεσίες πολυμέσων καθώς και υπηρεσίες τηλεεπικοινωνίας και τηλεδιάσκεψης, συστήματα επιτήρησης και ασφάλειας, ιατρικές εφαρμογές, κ.ά. ([3],[4],[5],[6],[7]). Επιπρόσθετα, νέες εφαρμογές θα πρέπει να μπορούν να υλοποιηθούν πάνω στα υπάρχοντα αλλά και σε μελλοντικά δίκτυα. Για την κάλυψη αυτής της ανάγκης για ευελιξία και παραμετροποίηση των χαρακτηριστικών της κωδικοποίησης, το πρότυπο H.264 κάνει χρήση ενός επιπέδου VCL (Video Coding Layer) για την αποδοτική αναπαράσταση του περιεχομένου του βίντεο και ενός ξεχωριστού επιπέδου (NAL (Network Abstraction Layer), που τροποποιεί την αναπαράσταση του βίντεο με πληροφορίες κεφαλίδας (header information) κατάλληλες για τη μετάδοση από διάφορα πρότυπα μεταφοράς (Σχήμα 2.2). Σχήμα 2.2: Δομή του H.264 κωδικοποιητή

29 Τεχνικά χαρακτηριστικά Τεχνικά χαρακτηριστικά Στη συνέχεια παρουσιάζονται μερικά από τα τεχνικά χαρακτηριστικά του προτύπου H.264, που συμβάλουν στην αποδοτική του κωδικοποίηση και που το ξεχώρισαν ως ένα από τα πιο διαδεδομένα και ευρέως χρησιμοποιούμενα πρότυπα μέχρι σήμερα. Διαμέριση σε MB μεγέθους 16x16 δειγμάτων φωτεινότητας. Αντιστάθμιση κίνησης με μεταβλητό μέγεθος block. Το πρότυπο προσφέρει μεγάλη ευελιξία στην επιλογή του μεγέθους και του σχήματος των block, μεγαλύτερη από κάθε παλαιότερο πρότυπο, με 4x4 ελάχιστο μέγεθος για block φωτεινότητας. Αντιστάθμιση κίνησης με ακρίβεια ενός τετάρτου του δείγματος, ενώ στα προηγούμενα πρότυπα γινόταν χρήση ακρίβειας μισού δείγματος. Διανύσματα κίνησης εκτός των ορίων της εικόνας. Στα παλαιότερα πρότυπα ήταν αναγκαίο τα διανύσματα κίνησης να δείχνουν μόνο σε περιοχές εντός των προηγούμενα αποκωδικοποιημένων εικόνων αναφοράς, ενώ πλέον χρησιμοποιείται παρέκταση στα όρια της εικόνας. Αντιστάθμιση κίνησης με πολλαπλές εικόνες αναφοράς. Σε αντίθεση με τα παλαιότερα πρότυπα, στα οποία η εικόνα αναφοράς ήταν πάντα η αμέσως προηγουμένη για P καρέ και η αμέσως προηγούμενη με την αμέσως επόμενη για B καρέ, στο πρότυπο H.264 δίνεται η δυνατότητα για χρήση πολλαπλών εικόνων ως αναφορά για την αντιστάθμιση κίνησης σε P και B καρέ. Αποσύνδεση της σειράς αναφοράς από τη σειρά απεικόνισης. Κατ αυτό τον τρόπο, προσφέρεται μεγάλη ευελιξία με την αναφορά σε εικόνες που δεν είναι απαραίτητο να έχουν ήδη απεικονιστεί. Αποσύνδεση του τρόπου αναπαράστασης ενός καρέ από την ικανότητά του ως στοιχείο αναφοράς. Με άλλα λόγια, ένα B καρέ μπορεί να χρησιμοποιηθεί ως αναφορά για άλλα καρέ, αυξάνοντας την ευελιξία του προτύπου να επιλέγει καλύτερες προσεγγίσεις. Πρόβλεψη με βάρη (weighted prediction). Προσφέρει τη δυνατότητα προσθήκης βαρών σημαντικότητας στο σήμα πρόβλεψης, γεγονός που μπορεί να χρησιμοποιηθεί για την αποδοτικότερη κωδικοποίησή του. Βελτιωμένη μέθοδος συμπερασμού skipped ή direct κίνησης. Ένα block που προβλέπεται με αναφορά σε ήδη κωδικοποιημένο με αναφορά block και έχει μηδενικό διάνυσμα κίνησης, μπορεί να κωδικοποιηθεί απ ευθείας μέσω της πρώτης αναφοράς χωρίς περαιτέρω πληροφορία κίνησης. Κατευθυντική χωρική πρόβλεψη για ενδοπλαισιακή κωδικοποίηση. Πρόκειται για μια νέα τεχνική παρέκτασης των ακμών προηγουμένως αποκωδικοποιημένων τμημάτων του τρέχοντος καρέ, τα οποία κωδικοποιήθηκαν ενδοπλαισιακά. Η τεχνική αυτή βελτιώνει την ποιότητα

30 14 Το πρότυπο H.264 του σήματος πρόβλεψης και επιτρέπει την πρόβλεψη από γειτονικές περιοχές, που δεν είχαν κωδικοποιηθεί ενδοπλαισιακά. In-the-loop φίλτρο απεμπλοκής (deblocking filter). Η επεξεργασία του σήματος κατά block, εισάγει τα γνωστά τετραγωνοειδή υπολείμματα στο σήμα και για την απομάκρυνσή τους εφαρμόζεται ένα προσαρμοστικό φίλτρο απεμπλοκής. Στο πρότυπο H.264, αυτό το φιλτράρισμα γίνεται εντός του βρόχου της αντιστάθμισης κίνησης, ούτως ώστε το βελτιωμένο οπτικό αποτέλεσμα στην έξοδο του φίλτρου να συμβάλει και στη βελτιωμένη πρόβλεψη κίνησης των επόμενων καρέ. Επιπρόσθετα στις βελτιωμένες μεθόδους πρόβλεψης, βελτιώθηκαν και άλλα τμήματα του προτύπου για αποδοτικότερη κωδικοποίηση του σήματος: Μετασχηματισμός με μικρό μέγεθος block. Όλα τα μεγάλα πρότυπα πριν το H.264, χρησιμοποιούν μετασχηματισμό με 8x8 μέγεθος block, ενώ στο παρόν πρότυπο χρησιμοποιείται κυρίως μέγεθος 4x4. Αυτό συμβάλει στη μείωση των τετραγωνοειδών υπολειμμάτων και δικαιολογείται και από τη μείωση των προβλεπόμενων περιοχών, όπως αναφέρθηκε νωρίτερα. Ιεραρχικός μετασχητισμός κατά block. Χρησιμοποιείται όταν τα χαρακτηριστικά του σήματος είναι τέτοια, που δικαιολογούν την επεξεργασία με μεγαλύτερο μέγεθος block. Στο συγκεκριμένο πρότυπο η διαδικασία αυτή υλοποιείται με δύο τρόπους. 1) Με τη χρήση ιεραρχικού μετασχηματισμού για την επέκταση του μεγέθους των block που χρησιμοποιούνται για την αναπαράσταση χρωματικού περιεχομένου χαμηλής συχνότητας σε πίνακα 8x8. 2) Ο κωδικοποιητής επιτρέπεται να χρησιμοποιήσει ένα ειδικό τύπο κωδικοποίησης για ενδοπλαισιακή κωδικοποίηση, που επιτρέπει την επέκταση του μεγέθους για το μετασχηματισμό περιεχομένου φωτεινότητας χαμηλής συχνότητας σε πίνακα 16x16. Μετασχηματισμό με μικρό μέγεθος λέξης. Ενώ τα προηγούμενα πρότυπα γενικά απαιτούσαν επεξεργασία 32bit, το πρότυπο H.264 απαιτεί μόνο 16bit. Ακριβής αντιστοίχιση του αντίστροφου μετασχηματισμού. Λόγω της δυσκολίας στην απόκτηση του ακριβούς αντίστροφου μετασχηματισμού, τα προηγούμενα πρότυπα χρησιμοποιούσαν μετασχηματισμό ορισμένο εντός ενός ορίου ανοχής στο σφάλμα. Ως αποτέλεσμα, κάθε αποκωδικοποιητής παρήγαγε ένα ελαφρώς διαφορετικά αποκωδικοποιημένο βίντεο, προκαλώντας μια διαφορά μεταξύ της κωδικοποιημένης και της αποκωδικοποιημένης αναπαράστασης του βίντεο και μειώνοντας έτσι την αντιλαμβανόμενη ποιότητά του. Αριθμητική κωδικοποίηση εντροπίας και προσαρμοσμένη στο περιεχόμενο κωδικοποίηση εντροπίας. Στο πρότυπο H.264 χρησιμοποιούνται δύο μέθοδοι κωδικοποίησης εντροπίας, η CAVLC (Context- Adaptive Variable-Length Coding) και η CABAC (Context-Adaptive

31 Τεχνικά χαρακτηριστικά 15 Binary Arithmetic Coding), οι οποίες παρουσιάζουν βελτιωμένη απόδοση συγκριτικά με παλαιότερες μεθόδους και επιτυγχάνουν μεγαλύτερο βαθμό συμπίεσης. Για την ανοχή σφαλμάτων και τη σθεναρότητα του σήματος σε απώλειες πακέτων, καθώς και για την ευελιξία λειτουργίας σε μια ποικιλία δικτύων, το πρότυπο περιλαμβάνει και τα παρακάτω χαρακτηριστικά: Ξεχωριστή δομή σετ παραμέτρων. Το σετ παραμέτρων συμβάλει στη σθεναρή και αποτελεσματική μεταφορά των πληροφοριών κεφαλίδας, η απώλεια των οποίων μπορεί να έχει πολύ αρνητική επίδραση στη διαδικασία αποκωδικοποίησης. Για αυτό το λόγο στο πρότυπο H.264, οι πληροφορίες αυτές αποτελούν ξεχωριστή δομή για την πιο ευέλικτη και ειδική μεταχείρισή τους, βάσει των ιδιαίτερων χαρακτηριστικών της εκάστοτε εφαρμογής. Δομή σύνταξης σε μονάδες του επιπέδου NAL. Κάθε δομή σύνταξης του προτύπου H.264 τοποθετείται μέσα σε πακέτα λογικών δεδομένων, που ονομάζονται μονάδες του επιπέδου NAL (NAL units). Οποιαδήποτε διαμόρφωση για τη μετάδοση σε κάθε συγκεκριμένο δίκτυο πραγματοποιείται πάνω σε αυτές τις μονάδες, σε αντίθεση με την ανάγκη συμμόρφωσης του bitstream στα χαρακτηριστικά του μέσου, όπως εμφανίζεται σε παλαιότερα πρότυπα. Ευέλικτο μέγεθος slice. Το slice είναι δομή διαμέρισης, αποτελεί ακολουθία από MB και υπάρχουν αντίστοιχοι τύποι με τα καρέ, δηλαδή I, P και B slices. Ο κωδικοποιητής μπορεί να επιλέξει ξεχωριστά το είδος της πρόβλεψης για κάθε slice, που σε συνδυασμό με το ευέλικτο μέγεθός τους οδηγεί σε αποτελεσματικότερη πρόβλεψη. Ευέλικτη ταξινόμηση MB (FMO - Flexible macroblock ordering). Ενισχύει τη σθεναρότητα σε απώλεια δεδομένων εξετάζοντας τις χωρικές σχέσεις μεταξύ περιοχών που κωδικοποιούνται στο ίδιο slice. Αυθαίρετη ταξινόμηση slice (ASO - Arbitrary slice ordering). Επειδή κάθε slice μπορεί να αποκωδικοποιηθεί ανεξάρτητα από άλλα slices μιας κωδικοποιημένης εικόνας, το πρότυπο H.264 επιτρέπει την αποστολή και λήψη των slices σε οποιαδήποτε σχετική σειρά μεταξύ τους. Η δυνατότητα αυτή, βελτιώνει τις καθυστερήσεις από άκρη-σε-άκρη σε εφαρμογές πραγματικού χρόνου, ειδικά σε δίκτυα με εκτός σειράς (out-of-order) μεταφορά δεδομένων. Πλεονάζουσες εικόνες. Το πρότυπο επιτρέπει στον κωδικοποιητή την αποστολή επιπλέον αναπαραστάσεων από περιοχές των εικόνων, προκειμένου να μπορούν να αναπαρασταθούν (έστω και μερικώς) περιοχές, των οποίων η αρχική αναπαράσταση χάθηκε κατά τη μετάδοση δεδομένων, γεγονός που ενισχύει τη σθεναρότητα σε απώλειες δεδομένων. Διαμέριση δεδομένων (data partitioning). Δεδομένου ότι κάποιες πληροφορίες είναι πιο σημαντικές για την αναπαράσταση κάθε περιοχής

32 16 Το πρότυπο H.264 (π.χ. τα διανύσματα κίνησης και πληροφορίες πρόβλεψης), το πρότυπο H.264 επιτρέπει τη διαμέριση της σύνταξης κάθε slice σε τρία διαφορετικά τμήματα για μετάδοση, με κατηγοριοποίηση των στοιχείων της σύνταξης. Εικόνες με συγχρονισμό/εναλλαγή SP/SI. Το πρότυπο H.264 εισάγει δύο νέους τύπους καρέ, τους SP και SI, οι οποίοι επιτρέπουν τον ακριβή συγχρονισμό μιας διαδικασίας αποκωδικοποίησης με το παραγόμενο βίντεο από άλλους αποκωδικοποιητές. Αυτό επιτρέπει την εναλλαγή αποκωδικοποιητών μεταξύ αναπαραστάσεων του βίντεο, που χρησιμοποιούν διαφορετικούς ρυθμούς δεδομένων, ανάκαμψη από σφάλματα ή/και απώλειες δεδομένων, ενώ παράλληλα επιτρέπει trick λειτουργίες όπως το fast-forward και το fast-reverse. 2.4 Προφίλ και επίπεδα Σχήμα 2.3: Baseline, Main και Extended προφίλ (+ περιλαμβανόμενα χαρακτηριστικά) του προτύπου H.264 Το πρότυπο ορίζει μια σειρά από προφίλ και επίπεδα, με τα οποία κατηγοριοποιούνται τα προς χρήση χαρακτηριστικά του προτύπου. Ένα προφίλ ορίζει ένα σύνολο από τεχνικές και αλγορίθμους κωδικοποίησης, που μπορούν να χρησιμοποιηθούν για την παραγωγή ενός σύμφωνου με το πρότυπο bitstream. Όλοι οι αποκωδικοποιητές σύμφωνοι με ένα προφίλ πρέπει να υποστηρίζουν όλα τα χαρακτηριστικά που περιλαμβάνονται σε αυτό, ενώ για τους κωδικοποιητές η μοναδική απαίτηση είναι η παραγωγή του κατάλληλου bitstream για χρήση από τους ανωτέρω αποκωδικοποιητές. Αρχικά, στο πρότυπο ορίσθηκαν μόνο τρία προφίλ, τα Baseline, Main και

33 Προφίλ και επίπεδα 17 Extended (Σχήμα 2.3), ενώ στην πορεία της επέκτασής του προστέθηκαν και άλλα για την κάλυψη HD σήματος, χρωματικού βάθους 10bits/δείγμα, 4:4:4 δειγματοληψία, μόνο ενδοπλαισιακή κωδικοποίηση, κ.ά. Τα επίπεδα από την άλλη, ορίζονται ενιαία με τον ίδιο τρόπο ανεξαρτήτως προφίλ και αποτελούν περιορισμούς σε συγκεκριμένες παραμέτρους του bitstream, υποδεικνύοντας έτσι ένα βαθμό απόδοσης που απαιτείται από τον αποκωδικοποιητή. Ένας αποκωδικοποιητής σύμφωνος με ένα συγκεκριμένο επίπεδο θα πρέπει να μπορεί να αποκωδικοποιήσει όλα τα bitstream που είναι σύμφωνα με αυτό το επίπεδο ή μικρότερα. Τα επίπεδα (15 στο πλήθος όταν ολοκληρώθηκε το πρότυπο) θέτουν άνω όρια στο μέγεθος (σε MB) του καρέ (από 99 έως 36Κ ή διαφορετικά αναλύσεις μέχρι 4kx2k pixels), στο ρυθμό (σε MB/s) αποκωδικοποίησης (με εύρος από 1.5k έως 2Μ), στο bit-rate του βίντεο (από 64Kbps μέχρι 240Mbps) και στο μέγεθος των buffers για πολλαπλές εικόνες και για το βίντεο.

34

35 ΚΕΦΑΛΑΙΟ 3 ΤΟ ΠΡΟΤΥΠΟ HEVC 3.1 Εισαγωγικά στοιχεία Τ πρότυπο HEVC (High Εfficiency Video Coding - Κωδικοποίηση Βίντεο Υψηλής Αποδοτικότητας), επίσης γνωστό ως H.265 και MPEG-H Part 2, αποτελεί τον διάδοχο του προτύπου H.264 και όπως και ο προκάτοχός του είναι προϊόν της κοινής συνεργασίας των οργανισμών προτυποποίησης ITU-T Video Coding Experts Group (VCEG) και ISO/IEC Moving Picture Experts Group (MPEG), με την ονομασία Joint Collaborative Team on Video Coding (JCT-VC)[8]. Το πρότυπο προσφέρει σχεδόν διπλάσιο ποσοστό συμπίεσης στο ίδιο επίπεδο ποιότητας βίντεο ή ισοδύναμα αισθητά βελτιωμένη ποιότητα εικόνας στο ίδιο bit-rate σε σύγκριση με το πρότυπο H.264. Στη σχεδίασή του κύριος στόχος ήταν η κάλυψη όλων των εφαρμογών που χρησιμοποιούσαν το προηγούμενο πρότυπο και ιδιαίτερο βάρος δόθηκε στο βίντεο υψηλής ανάλυσης (υποστήριξη 8K ανάλυσης, pixels), καθώς και στην αυξημένη χρήση αρχιτεκτονικών παράλληλης επεξεργασίας [4]. Η πρώτη έκδοση του προτύπου ολοκληρώθηκε το 2013, ενώ η επέκτασή του συνεχίζεται μέχρι και σήμερα. Για την κάλυψη του ευρέος φάσματος των εφαρμογών στο οποίο στοχεύει το πρότυπο, καθώς και μελλοντικών αναγκών, η περιγραφή του προτύπου HEVC είναι αρκετά γενική (όπως και σε όλα τα προηγούμενα πρότυπα κωδικοποίησης βίντεο των οργανισμών ITU-T και ISO/IEC) και τυποποιημένη είναι μόνο η δομή του παραγόμενου bitstream, καθώς και οι περιορισμοί που θα πρέπει αυτό και η απεικόνισή του να ικανοποιούν για την ορθή αποκωδικοποίησή του. Ως εκ τούτου, κάθε αποκωδικοποιητής σύμφωνος με το πρότυπο θα παράγει το ίδιο αποτέλεσμα δοθέντος 19

36 20 Το πρότυπο HEVC ενός bitstream επίσης σύμφωνου με το πρότυπο. Φυσικά, όπως συμβαίνει και στο πρότυπο H.264, το πρότυπο HEVC δεν προσφέρει εγγυήση πιστής αναπαραγωγής από άκρη σε άκρη (end-to-end), αφού ακόμα και χοντροκομμένες τεχνικές κωδικοποίησης μπορεί να θεωρηθούν σύμφωνες με αυτό. 3.2 Τεχνικά χαρακτηριστικά Στη συνέχεια, παρουσιάζονται τα κύρια τεχνικά χαρακτηριστικά που περιλαμβάνει το πρότυπο HEVC και τα οποία συμβάλλουν στην βελτιωμένη απόδοσή του, ενώ παράλληλα συγκρίνονται στην πλεινότητά τους και με τις αντίστοιχες δομές του προτύπου H.264. Όπως φαίνεται και στη συνέχεια, πολλά χαρακτηριστικά του προτύπου HEVC αποτελούν βελτίωση προηγούμενων τεχνικών ή/και επέκτασή τους για την αποδοτικότερη αξιοποίηση της υπάρχουσας τεχνολογίας. Δομές CTU (Coding Tree Unit) και CTB (Coding Tree Block). Αποτελούν τις δομές διαμέρισης, που χρησιμοποιούνται στο πρότυπο HEVC αντί του MB και έχουν γενικά μεγαλύτερο μέγεθος απ αυτό. Πιο συγκεκριμένα, ένα CTU περιλαμβάνει ένα CTB φωτεινότητας και τα αντίστοιχα CTB χρωματικότητας, ανάλογα με την εκάστοτε χρωματική δειγματοληψία. Το μέγεθος LxL του CTB φωτεινότητας μπορεί να επιλεγεί ως L = 16, 32 ή 64 δείγματα, όπου το μεγαλύτερο μέγεθος γενικά συνεπάγεται και μεγαλύτερη συμπίεση. Παράλληλα, υποστηρίζεται η περαιτέρω διαμέριση των CTB σε μικρότερα blocks, χρησιμοποιώντας δομές απλού ή τετραδικού δέντρου. Δομές CU (Coding Unit) και CB (Coding Block). Η σύνταξη τετραδικού δέντρου του CTU ορίζει το μέγεθος και τις θέσεις των CB φωτεινότητας και χρωματικότητας, ενώ η ρίζα του δέντρου σχετίζεται με το ίδιο το CTU. Συνεπώς, το μέγεθος του CTB φωτεινότητας είναι το μέγιστο υποστηριζόμενο μέγεθος για τα CB φωτεινότητας. Ο διαχωρισμός ενός CTU σε CBs φωτεινότητας και χρωματικότητας σηματοδοτείται από κοινού, καθώς ένα CB φωτεινότητας και τυπικά δύο CBs χρωματικότητας αποτελούν ένα CU. Ένα CTB μπορεί να περιλαμβάνει μόνο ένα CU ή να χωριστεί προς δημιουργία πολλαπλών CUs. Τέλος, κάθε CU έχει μια αντίστοιχη διαμέριση σε PU (Prediction Unit) και TU(Transform Unit). Δομές PU και PB (Prediction Block). Η απόφαση για το αν μια περιοχή της εικόνας θα κωδικοποιηθεί ενδοπλαισιακά ή διαπλαισιακά γίνεται σε επίπεδο CU. Η δομή διαμέρισης σε PU έχει τη ρίζα της στο επίπεδο CU. Ανάλογα με τον τύπο της πρόβλεψης, τα CBs φωτεινότητας και χρωματικότητας μπορούν να χωριστούν περαιτέρω και να προβλεφθούν από PBs φωτεινότητας και χρωματικότητας, με υποστηριζόμενα μεγέθη αυτών από 4x4 έως 64x64 δείγματα.

37 Τεχνικά χαρακτηριστικά 21 Δομές TU και TB (Transform Block). Το υπόλοιπο της πρόβλεψης κωδικοποιείται με μετασχηματισμό κατά block. Η δομή δέντρου TU έχει τη ρίζα της στο επίπεδο CU. Το CB φωτεινότητας (ή χρωματικότητας) του υπολοίπου μπορεί να είναι ίδιο με το TB φωτεινότητας (ή χρωματικότητας) ή να χωριστεί περαιτέρω σε μικρότερα TBs. Για το μετασχηματισμό TBs μεγέθους 4x4, 8x8, 16x16 και 32x32 ορίζονται ακέραιες συναρτήσεις βάσης παρόμοιες με αυτές του DCT, ενώ ειδικά για τα 4x4 υπόλειπα φωτεινότητας ορίζεται μια μορφή ακέραιου μετασχηματισμού βασισμένη στον DST (Discrete Cosing Transform). Προχωρημένη πρόβλεψη διανυσμάτων κίνησης (AMVP - Advanced Motion Vector Prediction), η οποία περιλαμβάνει την εξαγωγή πολλαπλών πιθανών υποψηφίων βάσει δεδομένων από παραπλήσια PBs και την εικόνα αναφοράς. Μπορεί επίσης να χρησιμοποιηθεί μια λειτουργία συγχώνευσης διανυσμάτων κίνησης, η οποία επιτρέπει την κληρονόμηση διανυσμάτων κίνησης από γειτονικά (χωρικά ή χρονικά) PBs. Παράλληλα, ορίζεται μια βελτιωμένη μέθοδος συμπερασμού skipped ή direct κίνησης από αυτή που χρησιμοποιείται στο πρότυπο H.264. Χρησιμοποιείται ακρίβεια ενός τετάρτου του δείγματος για την εξαγωγή των διανυσμάτων κίνησης, ενώ για την παρεμβολή σε θέσεις κλασμάτων του δείγματος χρησιμοποιούνται φίλτρα 7ης ή 8ης τάξης (σε αντίθεση με το φιλτράρισμα 6ης τάξης σε θέσεις μισού δείγματος ακολουθούμενo από γραμμική παρεμβολή σε θέσεις ενός τετάρτου του δείγματος, που χρησιμοποιούταν στο πρότυπο H.264). Παρόμοια με το τελευταίο, γίνεται χρήση πολλαπλών εικόνων αναφοράς, ενώ μπορεί να γίνει και χρήση πρόβλεψης με βάρη. Τέλος, για κάθε PB μπορούν να μεταδοθούν είτε ένα είτε δύο διανύσματα κίνησης, καταληγόντας σε μονοκατευθυντική ή αμφικατευθυντική κωδικοποίηση αντίστοιχα. Στην ενδοπλαισιακή κωδικοποίηση περιοχών, που δεν κωδικοποιούνται διαπλαισιακά, χρησιμοποιούνται για τη χωρική πρόβλεψή τους ως δεδομένα αναφοράς τα αποκωδικοποιημένα δείγματα των ορίων από γειτονικών blocks. Η ενδοπλαισιακή πρόβλεψη υποστηρίζει 33 ρυθμίσεις κατευθύνσεων (σε σύγκριση με τις 8 που χρησιμοποιούνται στο πρότυπο H.264) συν λειτουργίες planar και DC. Στην planar λειτουργία του HEVC υποστηρίζονται όλα τα υποστηριζόμενα μεγέθη block σε αντίθεση με τον περιορισμό για 16x16 block στο πρότυπο H.264, ενώ η DC λειτουργία πρόβλεψης αναφέρεται στον υπολογισμό μιας μέσης τιμής αναφερόμενη στα δείγματα αναφοράς και μπορεί να χρησιμοποιηθεί για επίπεδες επιφάνειες. Οι επιλεγμένες λειτουργίες ενδοπλαισιακής πρόβλεψης κωδικοποιούνται με την εξαγωγή των πιθανότερων λειτουργιών βάσει προηγούμενα αποκωδικοποιημένων γειτονικών PBs. Η κωδικοποίηση εντροπίας πραγματοποιείται στο πρότυπο HEVC

38 22 Το πρότυπο HEVC αποκλειστικά με τη μέθοδο CABAC, η οποία έχει υποστεί τροποποιήσεις, συγκριτικά με αυτή που χρησιμοποιείται στο πρότυπο H.264, για τη βελτίωση της διεκπεραιωτικής της ικανότητας (ειδικά για αρχιτεκτονικές παράλληλης επεξεργασίας) και του ποσοστού συμπίεσης, με την παράλληλη μείωση των απαιτήσεων της σε μνήμη. Χρησιμοποιείται ένα παρόμοιο in-the-loop φίλτρο απεμπλοκής με αυτό στο πρότυπο H.264, τροποποιημένο σχεδιαστικά για να είναι πιο απλό στη διαδικασία λήψης αποφάσεων και πιο φιλικό στην παράλληλη επεξεργασία. Δειγματικά προσαρμοζόμενη μετατόπιση (SAO - Sample Adaptive Offset). Για την καλύτερη επανάκτηση των πλατών του αρχικού σήματος, εφαρμόζεται μια μη γραμμική αντιστοίχιση των πλατών μετά το φίλτρο απεμπλοκής εντός του βρόχου της διαπλαισιακής πρόβλεψης. Για το σκοπό αυτό, χρησιμοποιείται ένας πίνακας αναζήτησης, ο οποίος περιγράφεται από λίγες επιπλέον παραμέτρους, που μπορούν να καθοριστούν με ανάλυση ιστογράμματος στην πλευρά του κωδικοποιητή. Όπως και στο πρότυπο H.264, έτσι και στο HEVC γίνεται χρήση μιας σειράς δομών για τη σθεναρότητα του σήματος σε σφάλματα και απώλειες δεδομένων, καθώς και για ευελιξία χρήσης σε ποικιλία δικτύων. Ξεχωριστή δομή σετ παραμέτρων, η οποία παρέχει ένα σθεναρό μηχανισμό για τη μετάδοση δεδομένων ουσιαστικής σημασίας για τη διαδικασία της αποκωδικοποίησης. Παράλληλα, προστίθεται στα σετ παραμέτρων ακολουθίας και εικόνας, που χρησιμοποιούνται στο πρότυπο H.264, ένα σετ παραμέτρων βίντεο (VPS - Video Parameter Set). Δομή σύνταξης σε μονάδες του επιπέδου NAL. Κάθε δομή σύνταξης τοποθετείται μέσα σε πακέτα λογικών δεδομένων, που ονομάζονται μονάδες του επιπέδου NAL (NAL units). Με χρήση του περιεχομένου μιας κεφαλίδας 2 byte μιας μονάδας NAL, είναι δυνατό να αναγνωριστεί ο σκοπός των φερόμενων δεδομένων. Χρήση της δομής slice. Το slice είναι δομή διαμέρισης, που μπορεί να αποκωδικοποιηθεί ανεξάρτητα από άλλα slices εντός της ίδιας εικόνας, ενώ μπορεί να είναι είτε ολόκληρη εικόνα είτε τμήμα αυτής. Βασική χρησιμότητα των slices είναι ο επανασυγχρονισμός στην περίπτωση απώλειας δεδομένων. Η σύνταξη περιλαμβάνει υποστήριξη για διάφορους τύπους metadata, όπως τα SEI (Supplemental Enhancement Information) και VUI (Video Usability Information). Αυτά τα δεδομένα προσφέρουν πληροφορίες σχετικά με το χρονισμό των καρέ του βίντεο, την ορθή ερμηνεία του χρωματικού χώρου που χρησιμοποιείται στο βίντεο, πληροφορίες για στερεοσκοπικό 3D, κ.λ.π. Τέλος, παρουσιάζονται τρεις νέες τεχνικές για τη βελτίωση της ικανότητας παράλληλης επεξεργασίας του σήματος, καθώς και για την

39 Προφίλ, επίπεδα και βαθμίδες 23 παραμετροποίηση της δομής των slices για λόγους πακετοποίησης βάσει του εκάστοτε δικτύου. Διαμέριση σε πλακίδια (tiles). Δίνεται η δυνατότητα για διαμέριση της εικόνας σε ορθογώνια πλακίδια, με κύριο στόχο την αύξηση της ικανότητας για παράλληλη επεξεργασία. Τα πλακίδια είναι αυτόνομα αποκωδικοποιήσιμες περιοχές, που κωδικοποιούνται ωστόσο με κάποιες κοινές πληροφορίες κεφαλίδας. Τυπικά, διαμορφώνονται έτσι ώστε κάθε πλακίδιο να έχει κατά προσέγγιση τον ίδιο αριθμό CTUs. Τέλος, τα πλακίδια προσφέρουν παραλληλισμό με μια πιο ευρεία θεώρηση διακριτότητας (εικόνας/υποπεριοχής) και άρα για τη χρήση τους δεν απαιτείται ιδιαίτερη μέριμνα για συγχρονισμό των νημάτων (threads). Παράλληλη επεξεργασία μετώπου κύματος (WPP - Wavefront Parallel Processing). Σε αυτή την περίπτωση, κάθε slice χωρίζεται σε γραμμές από CTUs. Η πρώτη γραμμή επεξεργάζεται κανονικά, ενώ η επεξεργασία της δεύτερης ξεκινά αφού έχουν επεξεργαστεί δύο CTUs από την πρώτη γραμμή. Ομοίως, η τρίτη γραμμή ξεκινά, αφού έχουν επεξεργαστεί δύο CTUs από τη δεύτερη γραμμή, κ.ο.κ. Τα μοντέλα περιεχομένου του κωδικοποιητή εντροπίας για κάθε γραμμή συμπεραίνονται από αυτά στις προηγηθείσες γραμμές με μία καθυστέρηση ίση με το χρόνο επεξεργασίας δύο CTUs. Η WPP συχνά μπορεί να προσφέρει καλύτερη συμπίεση από τα πλακίδια, ενώ παράλληλα αποφεύγονται μερικά οπτικά υπολείμματα, που μπορεί να δημιουργηθούν με τη χρήση των δεύτερων. Χρήση δομής εξαρτημένων τμημάτων slice, η οποία επιτρέπει σε δεδομένα, που σχετίζονται με συγκεκριμένο σημείο της WPP ή με κάποιο πλακίδιο, να τοποθετηθούν σε ξεχωριστή μονάδα NAL. Με αυτό τον τρόπο, τα δεδομένα αυτά είναι διαθέσιμα για κατακερματισμένη πακετοποίηση με μικρότερη καθυστέρηση απ ότι αν κωδικοποιούνταν όλα μαζί στο ίδιο slice. Φυσικά, για την αποκωδικοποίησή τους θα πρέπει να έχει ολοκληρωθεί τουλάχιστον ένα μέρος της αποκωδικοποίησης ενός άλλου slice, αλλά είναι ιδιαίτερα χρήσιμα για κωδικοποίηση χαμηλής καθυστέρησης και δίχως να συνεπάγονται μείωση της ικανότητας συμπίεσης. 3.3 Προφίλ, επίπεδα και βαθμίδες Το πρότυπο HEVC κάνει χρήση προφίλ και επιπέδων, κατά τον ίδιο τρόπο που αυτά χρησιμοποιούνται στο πρότυπο H.264. Παράλληλα, εισάγεται και μια νέα έννοια, αυτή της βαθμίδας (tier), για την καλύτερη ικανοποίηση των διαφόρων εφαρμογών. Πιο συγκεκριμένα, τα προτεινόμενα προφίλ στην πρώτη έκδοση του προτύπου είναι τα Main, Main 10 και Main Still Picture, ενώ ισχύουν οι κάτωθι περιορισμοί:

40 24 Το πρότυπο HEVC Υποστηρίζεται μόνο 4:2:0 χρωματική δειγματοληψία Όταν ένας κωδικοποιητής κωδικοποιεί μια εικόνα με χρήση πολλαπλών πλακιδίων, δεν μπορεί να χρησιμοποιεί και WPP, ενώ κάθε πλακίδιο θα πρέπει να έχει πλάτος τουλάχιστον 256 και ύψος 64 δειγμάτων φωτεινότητας. Στα προφίλ Main και Main Still Picture, υποστηρίζεται ακρίβεια χρωματικού βάθους μόνο 8bit/δείγμα, ενώ στο προφίλ Main 10 υποστηρίζεται και 10bit/δείγμα. Στο προφίλ Main Still Picture, όλο το bitstream πρέπει να περιλαμβάνει μόνο μια κωδικοποιημένη εικόνα (και άρα δεν υποστηρίζεται διαπλαισιακή κωδικοποίηση). Στις επόμενες εκδόσεις του προτύπου, τα προφίλ έχουν επεκταθεί για την κάλυψη διαφόρων αναγκών, καθώς και για την αποφυγή αυτών των περιορισμών (Σχήμα 3.1αʹ). (αʹ) (βʹ) Σχήμα 3.1: Επέκταση προφίλ (α ), επίπεδα και βαθμίδες (β ) του προτύπου HEVC Παράλληλα, στο πρότυπο ορίζονται 13 επίπεδα, που θέτουν περιορισμούς στη μέγιστη υποστηριζόμενη ανάλυση, (από 176x144 έως 7680x4320 pixels), στο μέγιστο μέγεθος εικόνων φωτεινότητας, στο μέγιστο bit-rate και στο ελάχιστο ποσοστό συμπίεσης, όπως φαίνονται στο Σχήμα 3.1βʹ. Τέλος, ορίζονται και δύο βαθμίδες, η Main και η High, για την κάλυψη εφαρμογών γενικών και υψηλών απαιτήσεων αντίστοιχα.

41 ΚΕΦΑΛΑΙΟ 4 ΤΟ ΠΡΟΤΥΠΟ THOR 4.1 Εισαγωγικά στοιχεία Τ Thor είναι ένα πρότυπο κωδικοποίησης βίντεο, που αναπτύσσεται από τη Cisco Systems, Inc., με σκοπό να αποτελέσει μια ανταγωνιστική εναλλακτική, απαλλαγμένη από τέλη χρήσης (royalty free), στο πρότυπο HEVC. Το πρότυπο παρουσιάστηκε τον Ιούλιο του 2015 στον οργανισμό IETF (Internet Engineering Task Force) ως πιθανός υποψήφιος για το πρότυπο - project που αναπτύσσουν, το NETVC (Internet Video Codec). 4.2 Τεχνικά χαρακτηριστικά Τα τεχνικά χαρακτηριστικά του προτύπου Thor παρουσιάζονται λεπτομερώς στο [9], ωστόσο όπως επισημαίνεται και στο επίσημο έγγραφο, η ανάπτυξη του προτύπου βρίσκεται ακόμα σε εξέλιξη και οποιαδήποτε αναφορά πρέπει να λαμβάνει υπ όψιν της τις ενδεχόμενες διαφορές με το τελικό προϊόν. Στη συνέχεια, ακολουθεί μια συνοπτική παρουσίαση των κύριων τεχνικών, που χρησιμοποιούνται στο πρότυπο Thor. Υποστηρίζεται ακρίβεια χρωματικού βάθους στα καρέ εισόδου 8, 10 ή 12 bit/δείγμα, ενώ η εσωτερική τους επεξεργασία μπορεί να πραγματοποιείται σε 8, 10 ή 12 bit/δείγμα ακρίβεια ανεξάρτητα από την ακρίβεια στην είσοδο. Για τη δειγματοληψία χρώματος υποστηρίζεται τόσο η πλήρης 4:4:4 όσο και η 4:2:0. 25

42 26 Το πρότυπο Thor Δομές SB (Super Block), CB (Coding Block), PB (Prediction Block) και TB (Transform Block). Τα SB είναι block μεγέθους 64x64 ή 128x128 (pixels φωτεινότητας) και μπορούν να χωριστούν σε CBs, με ελάχιστο μέγεθος 8x8. Τα PBs, είναι υποδιαίρεση των CBs σε 1, 2 ή 4 ίσα μέρη, ενώ τα TBs σε 1 ή 4 ίσα μέρη. Κάθε καρέ διαμερίζεται σε 64x64 ή 128x128 SBs, τα οποία επεξεργάζονται σε σειρά raster-scan (Σχήμα 4.1). Το μέγεθος των SBs σηματοδοτείται μέσω της κεφαλίδας ακολουθίας, ενώ κάθε SB μπορεί να διαμεριστεί σε CBs με χρήση δομής τετραδικού δέντρου. Τα SBs, συνεπώς, προκύπτουν ως αντίστοιχες δομές με τα CTUs του προτύπου HEVC. Σχήμα 4.1: Raster-scan επεξεργασία Ενδοπλαισιακή πρόβλεψη με υποστήριξη 7 ρυθμίσεων κατεύθυνσης, συν DC λειτουργία. Υποστήριξη για πολλαπλές εικόνες αναφοράς, με χρήση ενός κινητού παραθύρου για την αποθήκευση των πρόσφατα αποκωδικοποιημένων καρέ. Επιλογή για βελτιωμένη πρόβλεψη χρωματικότητας, με χρήση της αποκωδικοποίησης της φωτεινότητας, όπως περιγράφεται στο [10]. Αποσύνδεση της σειράς αναφοράς των καρέ από τη σειρά μετάδοσής τους. Χρήση καρέ αναφοράς εκ παρεμβολής. Μέσω μιας ντετερμινιστικής διαδικασίας, κοινή στον κωδικοποιητή και στον αποκωδικοποιητή, δημιουργείται ένα καρέ αναφοράς, το οποίο τοποθετείται πρώτο στη λίστα των αναφορών και προκύπτει με παρεμβολή από τη δεύτερη και την τρίτη αναφορά στη λίστα. Η χρήση αυτών των καρέ βελτιώνει την μονοκατευθυντική πρόβλεψη, όπου πολλές φορές δεν απομένει υπόλοιπο για κωδικοποίηση, ενώ παράλληλα μειώνει τη χρήση αμφικατευθυντικής πρόβλεψης. Η διαδικασία περιγράφεται στο [11]. Για τη φωτεινότητα, προβλέπεται αντιστάθμιση κίνησης με ακρίβεια ενός τετάρτου του δείγματος με χρήση πολυφασικού φίλτρου 6ης τάξης, ενώ για τη χρωματικότητα ακρίβεια ενός ογδόου του δείγματος με χρήση πολυφασικού φίλτρου 4ης τάξης. Για την εκτίμηση των διανυσμάτων κίνησης, επιλέγονται ως υποψήφια τα γειτονικά blocks βάσει της διαθεσιμότητάς τους, δηλαδή αν έχουν ήδη κωδικοποιηθεί, αν ανήκουν στο ίδιο slice και αν βρίσκονται εντός της εικόνας.

43 Τεχνικά χαρακτηριστικά 27 Ο μετασχηματισμός υλοποιείται είτε σε επίπεδο TB είτε σε επίπεδο CB, δηλαδή μπορεί να έχει μέγεθος από 4x4 έως 128x128. Κατά τη διαδικασία της κβάντισης, για μετασχηματισμούς 32x32, 64x64 ή 128x128, μόνο οι 16x16 χαμηλοί συντελεστές συχνότητας κβαντίζονται και μεταδίδονται. Ο 64x64 (128x128) αντίστροφος μετασχηματισμός ορίζεται ως ένας 32x32 μετασχηματισμός ακολουθούμενος από αντιγραφή κάθε δείγματος εξόδου σε ένα block 2x2 (4x4). In-the-loop φίλτρο απεμπλοκής, για την απομάκρυνση των τετραγωνοειδών υπολειμμάτων. Δυνατότητα χρήσης, μετά το φίλτρο απεμπλοκής, ενός φίλτρου CLPF (Constrained Low Pass Filter), για την περαιτέρω αφαίρεση των υπολειμμάτων, που εισήχθησαν από το μετασχηματισμό και την κβάντιση του σήματος. Μπορεί να εφαρμοστεί κατ επιλογή σε συγκεκριμένα ή όλα τα καρέ ή τα περιεχόμενα block, με κατάλληλη σηματοδότηση στις κεφαλίδες ακολουθίας και καρέ. Το φίλτρο περιγράφεται στο [12]. Τέλος, για την κωδικοποίηση εντροπίας, το πρότυπο Thor χρησιμοποιεί μια μέθοδο CAVLC, η οποία περιγράφεται αναλυτικά στο [9].

44 28 Το πρότυπο Thor Ως σύνοψη των κεφαλαίων 2-4, ακολουθεί συγκριτικός πίνακας των διαφορών στα τεχνικά χαρακτηριστικά των προτύπων H.264, HEVC και Thor.

45 ΚΕΦΑΛΑΙΟ 5 ΠΕΙΡΑΜΑΤΙΚΗ ΔΙΑΔΙΚΑΣΙΑ Σ παρόν κεφάλαιο, αρχικά αναφέρονται τα χρησιμοποιούμενα μέσα για τη διεξαγωγή της αξιολόγησης, ενώ στη συνέχεια παρουσιάζονται τα αποτελέσματα των συγκρίσεων. 5.1 Χρησιμοποιούμενα μέσα Όλες οι κωδικοποιήσεις έγιναν σε υπολογιστή με επεξεργαστή Intel Core 2.6GHz, μνήμη RAM 16GB και λειτουργικό σύστημα Ubuntu LTS 64-bit Ακολουθίες βίντεο Για την αξιόλογηση της απόδοσης των προτύπων, χρησιμοποιήθηκαν οι παρακάτω τέσσερις ακολουθίες βίντεο: CrowdRun, 1920x1080, 50fps [13] Jockey, 1920x1080, 50fps [14] Beauty, 3840x2160, 30fps [14] ReadySteadyGo, 3840x2160, 30fps [14] Όλες οι αρχικές ακολουθίες ήταν ασυμπίεστες (σε.yuv format) και είχαν ακρίβεια χρωματικού βάθους 8bit/δείγμα, ενώ οι αναλύσεις τους και τα αντίστοιχα frame rates, δίνονται στην παραπάνω λίστα, μαζί με τα ονόματά τους. Επιλέχθηκαν ακολουθίες με ποικιλία περιεχομένου και κινήσεων, για την ορθότερη εξαγωγή συμπερασμάτων. 29

46 30 Πειραματική διαδικασία Μετρικές αντικειμενικής αξιολόγησης Χρησιμοποιήθηκαν οι μετρικές PSNR (Peak Signal-to-Noise Ratio) και SSIM (Structural Similarity Index), των οποίων ο υπολογισμός πραγματοποιήθηκε με το πρόγραμμα VQMT (Video Quality Measurement Tool) [15]. Ο PSNR μετρείται σε db και υπολογίζεται από τη σχέση: P SNR = 10 log m2 MSE [db], όπου m είναι η μέγιστη τιμή, που μπορεί να πάρει ένα pixel (π.χ. 255 για 8bit ακρίβεια) και M SE (Mean Squared Error) είναι το μέσο τετραγωνικό σφάλμα μεταξύ των pixels φωτεινότητας ([16]) δύο εικόνων ή ακολουθιών I και Ĩ: MSE = 1 [I(t, x, y) T XY Ĩ(t, x, y)]2, για εικόνες μεγέθους XxY και T καρέ. t x y Τεχνικά, το MSE μετράει τη διαφορά δύο εικόνων, ενώ ο PSNR την πιστότητα, δηλαδή το πόσο κοντά στην αρχική εικόνα μοιάζει η συμπιεσμένη εκδοχή της. Το μεγάλο πλεονέκτημα του PSNR είναι ο εύκολος και ταχύς υπολογισμός του [17]. Ο SSIM είναι ένα μέτρο της δομικής ομοιότητας της αρχικής εικόνας με τη συμπιεσμένη εκδοχή της και για τον υπολογισμό του συνδυάζονται οι δείκτες ομοιότητας για τη φωτεινότητα, την αντίθεση και τη δομή των δύο εικόνων (Σχήμα 5.1). Λόγω του ανθρώπινου οπτικού συστήματος, που είναι εξειδικευμένο στην εξαγωγή δομικών πληροφοριών από το οπτικό πεδίο και όχι διαφορών και σφαλμάτων, ο SSIM επιτυγχάνει καλό βαθμό συσχέτισης με τις υποκειμενικές αξιολογήσεις [18]. Σχήμα 5.1: Block διάγραμμα για τον υπολογισμό του SSIM Τα αποτελέσματα του SSIM βρίσκονται στο διάστημα [0, 1], όπου το 0 αντιστοιχεί στη χειρότερη και το 1 στην καλύτερη ποιότητα.

47 Αποτελέσματα και συμπεράσματα Κωδικοποιητές και ρυθμίσεις Οι κωδικοποιητές, που χρησιμοποιήθηκαν για την κωδικοποίηση των ακολουθιών, είναι οι προτεινόμενοι κωδικοποιητές αναφοράς των αντίστοιχων προτύπων και μπορούν να βρεθούν στους συνδέσμους [19], [20] και [21]. Για τις ρυθμίσεις των κωδικοποιητών, χρησιμοποιήθηκε εσωτερική ακρίβεια βάθους χρώματος ίση με αυτής της εισόδου, δηλαδή 8bit/δείγμα, δειγματοληψία 4:2:0, IntraPeriod=32, GoPSize=8 και QP=29, 31, 34, 37 και 39, ενώ γενικά χρησιμοποιήθηκαν οι προεπιλεγμένες ρυθμίσεις για τυχαία προσπέλαση (random access), όπως αυτές προτείνονται από τον εκάστοτε κωδικοποιητή (Παράρτημα Αʹ). Για την ταχύτερη κωδικοποίηση του συνόλου των ακολουθιών, δημιουργήθηκαν scripts για κάθε βίντεο και για κάθε κωδικοποιητή, με μεταβλητή την παράμετρο QP, τα οποία εκτελέστηκαν παράλληλα με χρήση του GNU Parallel [22]. Ως εκ τούτου, οι χρόνοι κωδικοποίησης, που αναφέρονται παρακάτω, προκύπτουν σαφώς μεγαλύτεροι απ ότι αν είχε επιλεχθεί σειριακή εκτέλεση των scripts, ωστόσο διατηρούν ποιοτικά το νόημα και τη σημασία τους, όπως αναφέρεται στη συνέχεια. 5.2 Αποτελέσματα και συμπεράσματα Στη συνέχεια, παρουσιάζονται οι συγκεντρωτικοί πίνακες των αποτελεσμάτων, όπου φαίνονται αναλυτικά οι επιτυγχανόμενες τιμές του Bitrate, του PSNR, του SSIM, του χρόνου κωδικοποίησης κάθε ακολουθίας καθώς και του μεγέθους του παραγόμενου bitstream. Bit-Rate (kbit/s) QP(29) QP(31) QP(34) QP(37) QP(39) CrowdRun_1920x1080_50fps Jockey_1920x1080_50fps Beauty_3840x2160_30fps ReadySteadyGo_3840x2160_30fps Πίνακας 5.1: Bitrates ακολουθιών, κατά QP και πρότυπο κωδικοποίησης ( H.264, HEVC και Thor ).

48 32 Πειραματική διαδικασία Σχήμα 5.2: Αποτελέσματα αντικειμενικής αξιολόγησης. Αριστερά, δίνεται ο PSNR ως συνάρτηση του Bitrate. Δεξιά, δίνεται ο SSIM ως συνάρτηση του Bitrate.

49 Αποτελέσματα και συμπεράσματα 33 PSNR (db) QP(29) QP(31) QP(34) QP(37) QP(39) CrowdRun_1920x1080_50fps Jockey_1920x1080_50fps Beauty_3840x2160_30fps ReadySteadyGo_3840x2160_30fps Πίνακας 5.2: PSNR ακολουθιών, κατά QP και πρότυπο κωδικοποίησης ( H.264, HEVC και Thor ). SSIM QP(29) QP(31) QP(34) QP(37) QP(39) CrowdRun_1920x1080_50fps Jockey_1920x1080_50fps Beauty_3840x2160_30fps ReadySteadyGo_3840x2160_30fps Πίνακας 5.3: SSIM ακολουθιών, κατά QP και πρότυπο κωδικοποίησης ( H.264, HEVC και Thor ). Από τις γραφικές παραστάσεις (Σχήμα 5.2), παρατηρούμε ότι στο σύνολο των ακολουθιών το πρότυπο HEVC επιτυγχάνει υψηλότερους δείκτες PSNR και SSIM από το Thor, ενώ και τα δύο δίνουν μεγαλύτερα αποτελέσματα από το H.264, κάτι που είναι σύμφωνο με άλλες έρευνες και μελέτες στο χώρο της κωδικοποίησης βίντεο, οι οποίες βασίζονται τόσο σε αντικειμενικές [5], [23] όσο και σε υποκειμενικές [16], [24],, [25], [26] αξιολογήσεις. Πιο συγκεκριμένα, παρατηρούμε ότι για το ίδιο bitrate, το HEVC δίνει μέχρι και 4.5 db υψηλότερο PSNR από το H.264 και μέχρι 2 db από το Thor, με το τελευταίο να δίνει έως και 3.5 db υψηλότερα από το H.264. Ως προς το δείκτη SSIM, παρατηρούμε ότι, για τα ίδια bitrate, το πρότυπο HEVC παρουσιάζει ίδιο ή και καλύτερο οπτικό αποτέλεσμα από το Thor, ανάλογα με το είδος του περιεχομένου του βίντεο, ενώ και τα δύο παρουσιάζουν καλύτερο οπτικό αποτέλεσμα από το H.264.

50 34 Πειραματική διαδικασία Encoding Time (sec) QP(29) QP(31) QP(34) QP(37) QP(39) CrowdRun_1920x1080_50fps Jockey_1920x1080_50fps Beauty_3840x2160_30fps ReadySteadyGo_3840x2160_30fps Πίνακας 5.4: Χρόνος κωδικοποίησης ακολουθιών, κατά QP και πρότυπο κωδικοποίησης ( H.264, HEVC και Thor ). Bitstream size (MB) QP(29) QP(31) QP(34) QP(37) QP(39) CrowdRun_1920x1080_50fps Jockey_1920x1080_50fps Beauty_3840x2160_30fps ReadySteadyGo_3840x2160_30fps Πίνακας 5.5: Μέγεθος παραγόμενου bitstream, κατά QP και πρότυπο κωδικοποίησης ( H.264, HEVC και Thor ). Μια διαφορετική ερμηνεία των γραφικών παραστάσεων, προκύπτει από την οριζόντια ανάγνωσή τους, όπου γίνεται φανερό το μέγεθος της συμπίεσης, που επιτυγχάνεται με τα πρότυπα της νέας γενιάς, αφού για την επίτευξη του ίδιου οπτικού αποτελέσματος (ίδιο επίπεδο PSNR/SSIM), τα πρότυπα HEVC και Thor απαιτούν σημαντικά μικρότερο bitrate, με το πρότυπο HEVC να παρουσιάζει τις μικρότερες απαιτήσεις. Στον Πίνακα 5.5 παρουσιάζονται αναλυτικά τα μεγέθη των bitstream, ενώ για μεγαλύτερη ευκρίνεια, παρουσιάζεται στον Πίνακα 5.6 η ποσοστιαία μείωση στο μέγεθος του παραγόμενου bitstream των προτύπων HEVC και Thor συγκριτικά με το H.264. Είναι φανερό ότι το Thor εξασφαλίζει πάντοτε μικρότερο μέγεθος bitstream, χαρακτηριστικό πολύ σημαντικό για εφαρμογές μικρής αποθηκευτικής ικανότητας. Στο Παράρτημα Βʹ, παρουσιάζονται προς σύγκριση κάποια ενδει-

51 Αποτελέσματα και συμπεράσματα 35 Bitstream size reduction (%) QP(29) QP(31) QP(34) QP(37) QP(39) CrowdRun_1920x1080_50fps % % % % % % % % % % Jockey_1920x1080_50fps % % % % % % % % % % Beauty_3840x2160_30fps % % % % % % % % % % ReadySteadyGo_3840x2160_30fps % % % % % % % % % % Πίνακας 5.6: Ποσοστιαία μείωση του μεγέθους του παραγόμενου bitstream σε σύγκριση με το H.264, κατά QP και πρότυπο κωδικοποίησης ( HEVC και Thor ). κτικά στιγμιότυπα των κωδικοποιημένων ακολουθιών. Φυσικά, τα στιγμιότυπα απεικονίζουν το ίδιο καρέ κάθε ακολουθίας, ενώ προσοχή δόθηκε στο να έχουν παραπλήσια bitrate, για την ορθότερη σύγκρισή τους. Όπως φαίνεται και από τα γραφήματα (Σχήμα 5.2), μεγαλύτερη σύγκλιση στις μετρήσεις των τριών προτύπων παρουσιάζεται για την ακολουθία CrowdRun, ενώ μεγαλύτερη απόκλιση για την ακολουθία Jockey. Ο χρόνος κωδικοποίησης κάθε ακολουθίας συναρτήσει του bitrate δίνεται στο Σχήμα 5.3. Λόγω της παράλληλης εκτέλεσης των κωδικοποίησεων, οι γραφικές παραστάσεις δεν έχουν ποσοτική σημασία, διατηρούν ωστόσο το ποιοτικό τους νόημα. Με άλλα λόγια, όπως είναι εμφανές, οι κωδικοποιήσεις με το πρότυπο HEVC χρειάστηκαν πάντα πολύ περισσότερο χρόνο απ ό,τι αυτές με το Thor και το H.264. Ενδιαφέρον είναι επίσης, ότι οι κωδικοποιήσεις με το πρότυπο Thor, χρειάστηκαν γενικά παρόμοιο χρόνο με το πρότυπο H.264, ενώ το παραγόμενο οπτικό αποτέλεσμα, όπως αυτό κρίνεται από το δείκτη SSIM, βρίσκεται κοντά στα επίπεδα του HEVC. Τέλος, κρίνεται σκόπιμο να τονιστούν τα εξής σημεία: Κατά την κωδικοποίηση των ακολουθιών, οι ρυθμίσεις για έλεγχο και επίτευξη συγκεκριμένου bitrate ήταν απενεργοποιημένες. Οι μόνες κοινές παράμετροι μεταξύ των κωδικοποιήσεων είναι αυτές, που αναφέρονται στην υποενότητα Οι υπόλοιπες αφέθηκαν όπως προτείνονται από τους κωδικοποιητές αναφοράς των προτύπων για ρύθμιση τυχαίας προσπέλασης (random access configuration). Οι αναλύσεις των βίντεο είναι κατηγορίας Full High Definition και Ultra High Definition, ενώ τα frame-rates είναι 50 και 30 fps αντίστοιχα. Οι κωδικοποιήσεις έγιναν με παράλληλη εκτέλεση των scripts για κάθε ακολουθία και πρότυπο. Το πρότυπο Τhor βρίσκεται ακόμα σε πολύ πρώιμο στάδιο της ανάπτυξής του. Με βάση τα παραπάνω, τα όποια συμπεράσματα εξάγονται από

52 36 Πειραματική διαδικασία Σχήμα 5.3: Χρόνος κωδικοποίησης των ακολουθιών συναρτήσει του Bitrate. τα αποτελέσματα αυτών των συγκρίσεων, έχουν νόημα μόνο ως μια γενική σύγκριση μεταξύ των τεχνολογιών, που προσφέρει το κάθε πρότυπο, για κωδικοποίηση βίντεο υψηλής ανάλυσης. Για συγκεκριμένες εφαρμογές, που απαιτείται π.χ. ένα προκαθορισμένο επίπεδο bitrate, συγκεκριμένη πολυπλοκότητα (και χρόνος κωδικοποίησης) ή για βίντεο χαμηλότερης ανάλυσης, απαιτούνται διαφορετικές συγκρίσεις για την εξαγωγή ασφαλών συμπερασμάτων.

53 ΚΕΦΑΛΑΙΟ 6 ΜΕΛΛΟΝΤΙΚΗ ΕΡΕΥΝΑ Ό είδαμε στο προηγούμενο κεφάλαιο, το πρότυπο HEVC προσφέρει στην ίδια ποιότητα σημαντική μείωση στο μέγεθος του παραγόμενου bitstream από τα πρότυπα Thor και H.264, ή ισοδύναμα, προσφέρει για το ίδιο bitrate καλύτερο οπτικό αποτέλεσμα. Αντικείμενο μελλοντικής έρευνας θα μπορούσε να αποτελέσει η διενέργεια και υποκειμενικών συγκρίσεων, για την επιβεβαίωση της βελτιωμένης οπτικής ποιότητας που προσφέρουν τα πρότυπα HEVC και Thor σε σχέση με το H.264. Παράλληλα, θα μπορούσαν να συμπεριληφθούν στις συγκρίσεις και άλλα γνωστά πρότυπα, που βρίσκονται υπό ανάπτυξη, όπως τα Daala [27] και AV1 (AOMedia Video 1) [28], ενώ θα μπορούσαν να γίνουν και μελέτες για συγκεκριμένες εφαρμογές, όπως για παράδειγμα Video on Demand (VOD) ή Live Streaming. Πολύ ενδιαφέρον πεδίο έρευνας αποτελεί επίσης η μελέτη της επίδρασης στη συμπίεση και στην ποιότητα του βίντεο των τεχνικών που χρησιμοποιούνται στα επί μέρους τμήματα της κωδικοποίησης, όπως ο μετασχηματισμός, η κβάντιση, η εξαγωγή των διανυσμάτων κίνησης και η κωδικοποίηση εντροπίας. Τέτοιου είδους μελέτες είναι αναπόσπαστο κομμάτι της ανάπτυξης ενός προτύπου κωδικοποίησης βίντεο, τόσο για τη βελτίωση των ήδη υπαρχουσών τεχνικών όσο και για την αποδοχή νέων καινοτόμων ιδεών. 37

54

55 ΒΙΒΛΙΟΓΡΑΦΙΑ [1] A. C. Bovik, The Essential Guide to Video Processing. Academic Press, [2] Video compression formats. List_of_codecs#Video_compression_formats. Accessed: 30-Jan [3] T. Wiegand, G. J. Sullivan, G. Bjøntegaard, and A. Luthra, Overview of the H.264/AVC Video Coding Standard, IEEE Transactions on Circuits and Systems for Video Technology, vol. 13, Jul [4] G. J. Sullivan, J.-R. Ohm, W.-J. Han, and T. Wiegand, Overview of the High Efficiency Video Coding (HEVC) Standard, IEEE Transactions on Circuits and Systems for Video Technology, vol. 22, Dec [5] M. Uhrina, J. Frnda, L. Sevcik, and M. Vaculik, Impact of H.264/AVC and H.265/HEVC Compression Standards on the Video Quality for 4K Resolution, Advances in Electrical and Electronic Engineering, vol. 12, no. 4, [6] Axis Communications, H.264 video compression standard. New possibilities within video surveillance. White paper. [7] H. Yu, Z. Lin, and F. Pan, Applications and Improvement of H.264 in Medical Video Compression, IEEE Transactions on Circuits and Systems-I: Regular Papers, vol. 52, no. 12, [8] B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, and T. Wiegand, High Efficiency Video Coding (HEVC) Text Specification Draft 9, document JCTVC-K1003, ITU-T/ISO/IEC Joint Collaborative Team on Video Coding (JCT-VC), Oct [9] A. Fuldseth, G. Bjøntegaard, S. Midtskogen, T. Davies, and M. Zanaty, 39

56 40 ΒΙΒΛΙΟΓΡΑΦΙΑ Thor Video Codec, draft-fuldseth-netvc-thor-03, Network Working Group, Internet-Draft (work in progress), Oct [10] S. Midtskogen, Improved chroma prediction, draft-midtskogen-netvcchromapred-02, Network Working Group, Internet-Draft (work in progress), Oct [11] T. Davies, Interpolated reference frames for video coding, draftdavies-netvc-irfvc-00, Network Working Group, Internet-Draft (work in progress), Oct [12] S. Midtskogen, A. Fuldseth, and M. Zanaty, Constrained Low Pass Filter, draft-midtskogen-netvc-clpf-03, Network Working Group, Internet-Draft (work in progress), Oct [13] Xiph.org :: Derf s Test Media Collection. video/derf/. Accessed: 05-Feb [14] Ultra Video Group. #testsequences. Accessed: 05-Feb [15] VQMT: Video Quality Measurement Tool MMSPG. epfl.ch/vqmt. Accessed: 06-Feb [16] T. K. Tan, R. Weerakkody, M. Mrak, N. Ramzan, V. Baroncini, J.- R. Ohm, and G. J. Sullivan, Video Quality Evaluation Methodology and Verification Testing of HEVC Compression Performance, IEEE Transactions on Circuits and Systems for Video Technology, vol. 26, Jan [17] S. Winkler, Digital video quality : vision models and metrics. John Wiley & Sons Ltd, [18] Z. Wang, A. C. Bovik, H. R. Sheikh, and E. P. Simoncelli, Image Quality Assessment: From Error Visibility to Structural Similarity, IEEE Transactions on Image Processing, [19] H.264/AVC JM Reference Software. suehring/tml/. Accessed: 06-Feb [20] High Efficiency Video Coding (HEVC) JCT-VC. fraunhofer.de/. Accessed: 02-Feb [21] GitHub - cisco/thor: Thor Video Codec. thor. Accessed: 06-Feb [22] O. Tange, GNU Parallel - The Command-Line Power Tool, ;login: The USENIX Magazine, vol. 36, pp , Feb [23] D. Grois, D. Marpe, A. Mulayoff, B. Itzhaky, and O. Hadar, Performance Comparison of H.265/MPEG-HEVC, VP9, and H.264/MPEG-AVC Encoders, 2013 Picture Coding Symposium, Dec [24] L. R. Fiorentin, M. Masera, S. Mantovano, P. Sunna, G. Masera, and M. Martina, Comparison Between HEVC and Thor Based on Objective and Subjective Assessments, 2016 International Conference

57 ΒΙΒΛΙΟΓΡΑΦΙΑ 41 on Systems, Signals and Image Processing (IWSSIP), May [25] J.-R. Ohm, G. J. Sullivan, H. Schwarz, T. K. Tan, and T. Wiegand, Comparison of the Coding Efficiency of Video Coding Standards - Including High Efficiency Video Coding (HEVC), IEEE Transactions on Circuits and Systems for Video Technology, vol. 22, Dec [26] M. Řeřábek and T. Ebrahimi, Comparison of compression efficiency between HEVC/H.265 and VP9 bases on subjective assessments, Proceedings of SPIE - The International Society for Optical Engineering, Sep [27] Xiph.org :: daala video. Accessed: 27- Feb [28] Alliance for Open Media. Accessed: 27-Feb

58

59 ΠΑΡΑΡΤΗΜΑ Αʹ ΡΥΘΜΙΣΕΙΣ ΚΩΔΙΚΟΠΟΙΗΤΩΝ Ρυθμίσεις κωδικοποιητή αναφοράς του προτύπου H.264 InputFile = "CrowdRun_1920x1080_50fps.yuv" InputHeaderLength = 0 StartFrame = 0 FramesToBeEncoded = 500 FrameRate = 50.0 Enable32Pulldown = 0 SEIVUI32Pulldown = 0 SourceWidth = 1920 SourceHeight = 1080 SourceResize = 0 OutputWidth = 1920 OutputHeight = 1080 ProcessInput = 0 Interleaved = 0 PixelFormat = 0 StandardRange = 0 VideoCode = 1 TraceFile = "CrowdRun_1920x1080_50fps_trace_AVC_qp_29.txt" ReconFile = "CrowdRun_1920x1080_50fps_AVC_qp_29.yuv" OutputFile = "CrowdRun_1920x1080_50fps_AVC_qp_29.264" StatsFile = "CrowdRun_1920x1080_50fps_AVC_29.dat" View1ConfigFile = "encoder_view1.cfg" Grayscale = 0 ProfileIDC = 100 IntraProfile = 0 LevelIDC = 52 IDRPeriod = 0 AdaptiveIntraPeriod = 1 AdaptiveIDRPeriod = 0 IntraDelay = 0 EnableIDRGOP = 0 EnableOpenGOP = 0 QPISlice = 29 43

60 44 Ρυθμίσεις κωδικοποιητών QPPSlice = 29 FrameSkip = 0 ChromaQPOffset = 0 DisableSubpelME = 0 SearchRange = 32 MESoftenSSEMetric = 0 MEDistortionFPel = 0 MEDistortionHPel = 2 MEDistortionQPel = 2 MDDistortion = 2 SkipDeBlockNonRef = 0 OnTheFlyFractMCP = 0 ChromaMCBuffer = 1 ChromaMEEnable = 0 ChromaMEWeight = 0 NumberReferenceFrames = 5 PList0References = 0 Log2MaxFNumMinus4 = 0 Log2MaxPOCLsbMinus4 = -1 GenerateMultiplePPS = 1 SendAUD = 0 ResendSPS = 2 ResendPPS = 0 MbLineIntraUpdate = 0 RandomIntraMBRefresh = 0 PSliceSkip = 1 PSliceSearch16x16 = 1 PSliceSearch16x8 = 1 PSliceSearch8x16 = 1 PSliceSearch8x8 = 1 PSliceSearch8x4 = 1 PSliceSearch4x8 = 1 PSliceSearch4x4 = 1 BSliceDirect = 1 BSliceSearch16x16 = 1 BSliceSearch16x8 = 1 BSliceSearch8x16 = 1 BSliceSearch8x8 = 1 BSliceSearch8x4 = 1 BSliceSearch4x8 = 1 BSliceSearch4x4 = 1 BiPredSearch16x16 = 1 BiPredSearch16x8 = 1 BiPredSearch8x16 = 1 BiPredSearch8x8 = 0 DisableIntra4x4 = 0 DisableIntra16x16 = 0 DisableIntraInInter = 0 IntraDisableInterOnly = 0 Intra4x4ParDisable = 0 Intra4x4DiagDisable = 0 Intra4x4DirDisable = 0 Intra16x16ParDisable = 0 Intra16x16PlaneDisable = 0 ChromaIntraDisable = 0 EnableIPCM = 1 DisposableP = 0 PreferDispOrder = 1 PreferPowerOfTwo = 0 FrmStructBufferLength = 16 ChangeQPFrame = 0 ChangeQPI = 0 ChangeQPP = 0 ChangeQPB = 0

61 45 ChangeQPSI = 0 ChangeQPSP = 0 NumberBFrames = 2 PReplaceBSlice = 0 QPBSlice = 29 BRefPicQPOffset = 0 DirectModeType = 1 DirectInferenceFlag = 1 BList0References = 0 BList1References = 1 BReferencePictures = 0 HierarchicalCoding = 0 HierarchyLevelQPEnable = 0 ExplicitHierarchyFormat = "b3r0b1r1b0e2b2e2b5r1b4e2b6e2" ExplicitSeqCoding = 0 ExplicitSeqFile = "explicit_seq.cfg" LowDelay = 0 ReferenceReorder = 1 UseDistortionReorder = 0 PocMemoryManagement = 1 SetFirstAsLongTerm = 0 BiPredMotionEstimation = 1 BiPredMERefinements = 3 BiPredMESearchRange = 16 BiPredMESubPel = 2 BLevel0MoreRef = 0 BIdenticalList = 0 CRA = 0 HM50RefStructure = 0 LDRefSetting = 0 SPPicturePeriodicity = 0 SPSwitchPeriod = 0 QPSPSlice = 36 QPSISlice = 36 QPSP2Slice = 35 SI_FRAMES = 0 SP_output = 0 SP_output_name = "low_quality.dat" SP2_FRAMES = 0 SP2_input_name1 = "high_quality.dat" SP2_input_name2 = "low_quality.dat" SymbolMode = 1 OutFileMode = 0 PartitionMode = 0 ContextInitMethod = 1 FixedModelNumber = 0 MbInterlace = 0 IntraBottom = 0 WeightedPrediction = 0 WeightedBiprediction = 0 ChromaWeightSupport = 1 UseWeightedReferenceME = 1 WPMethod = 1 WPIterMC = 0 EnhancedBWeightSupport = 0 WPMCPrecision = 0 WPMCPrecFullRef = 0 WPMCPrecBSlice = 1 RDPictureDecision = 0 RDPSliceBTest = 0 RDPSliceITest = 1 RDPictureMaxPassISlice = 1 RDPictureMaxPassPSlice = 2 RDPictureMaxPassBSlice = 3

62 46 Ρυθμίσεις κωδικοποιητών RDPictureFrameQPPSlice = 0 RDPictureFrameQPBSlice = 0 RDPictureDeblocking = 0 RDPictureDirectMode = 0 DFParametersFlag = 0 DFDisableRefISlice = 0 DFAlphaRefISlice = 0 DFBetaRefISlice = 0 DFDisableNRefISlice = 0 DFAlphaNRefISlice = 0 DFBetaNRefISlice = 0 DFDisableRefPSlice = 0 DFAlphaRefPSlice = 0 DFBetaRefPSlice = 0 DFDisableNRefPSlice = 0 DFAlphaNRefPSlice = 0 DFBetaNRefPSlice = 0 DFDisableRefBSlice = 0 DFAlphaRefBSlice = 0 DFBetaRefBSlice = 0 DFDisableNRefBSlice = 0 DFAlphaNRefBSlice = 0 DFBetaNRefBSlice = 0 SliceArgument = 50 num_slice_groups_minus1 = 0 slice_group_map_type = 0 slice_group_change_direction_flag = 0 slice_group_change_rate_minus1 = 85 SliceGroupConfigFileName = "sg0conf.cfg" UseRedundantPicture = 0 NumRedundantHierarchy = 1 PrimaryGOPLength = 8 NumRefPrimary = 1 RestrictSearchRange = 2 RDOptimization = 1 I16RDOpt = 1 SubMBCodingState = 1 DistortionSSIM = 0 DistortionMS_SSIM = 0 SSIMOverlapSize = 8 DistortionYUVtoRGB = 0 CtxAdptLagrangeMult = 0 FastCrIntraDecision = 1 DisableThresholding = 1 DisableBSkipRDO = 0 BiasSkipRDO = 0 ForceTrueRateRDO = 0 SkipIntraInInterSlices = 0 PSliceSkipDecisionMethod = 0 WeightY = 1 WeightCb = 1 WeightCr = 1 UseExplicitLambdaParams = 0 DisableDistanceLambdaScale = 0 UpdateLambdaChromaME = 0 FixedLambdaISlice = 0.1 FixedLambdaPSlice = 0.1 FixedLambdaBSlice = 0.1 FixedLambdaRefBSlice = 0.1 FixedLambdaSPSlice = 0.1 FixedLambdaSISlice = 0.1 LambdaWeightISlice = 0.65 LambdaWeightPSlice = 0.68 LambdaWeightBSlice = 0.68

63 47 LambdaWeightRefBSlice = 0.68 LambdaWeightSPSlice = 0.68 LambdaWeightSISlice = 0.65 LossRateA = 5 LossRateB = 0 LossRateC = 0 FirstFrameCorrect = 0 NumberOfDecoders = 30 RestrictRefFrames = 0 UseConstrainedIntraPred = 0 NumberofLeakyBuckets = 8 LeakyBucketRateFile = "leakybucketrate.cfg" LeakyBucketParamFile = "leakybucketparam.cfg" NumFramesInELayerSubSeq = 0 SparePictureOption = 0 SparePictureDetectionThr = 6 SparePicturePercentageThr = 92 PicOrderCntType = 0 RateControlEnable = 0 Bitrate = 4000 InitialQP = 0 BasicUnit = 0 ChannelType = 0 RCUpdateMode = 2 RCISliceBitRatio = 1.0 RCBSliceBitRatio0 = 0.5 RCBSliceBitRatio1 = 0.25 RCBSliceBitRatio2 = 0.25 RCBSliceBitRatio3 = 0.25 RCBSliceBitRatio4 = 0.25 RCBoverPRatio = 0.45 RCIoverPRatio = 3.80 RCMinQPPSlice = 8 RCMaxQPPSlice = 42 RCMinQPBSlice = 8 RCMaxQPBSlice = 42 RCMinQPISlice = 8 RCMaxQPISlice = 42 RCMinQPSPSlice = 8 RCMaxQPSPSlice = 40 RCMinQPSISlice = 8 RCMaxQPSISlice = 42 RCMaxQPChange = 4 EarlySkipEnable = 0 SelectiveIntraEnable = 0 YUVFormat = 1 RGBInput = 0 SeparateColourPlane = 0 SourceBitDepthLuma = 8 SourceBitDepthChroma = 8 SourceBitDepthRescale = 0 OutputBitDepthLuma = 8 OutputBitDepthChroma = 8 CbQPOffset = 0 CrQPOffset = 0 Transform8x8Mode = 1 ReportFrameStats = 0 DisplayEncParams = 0 Verbose = 1 SkipGlobalStats = 0 QmatrixFile = "q_matrix.cfg" ScalingMatrixPresentFlag = 0 ScalingListPresentFlag0 = 3 ScalingListPresentFlag1 = 3

64 48 Ρυθμίσεις κωδικοποιητών ScalingListPresentFlag2 = 3 ScalingListPresentFlag3 = 3 ScalingListPresentFlag4 = 3 ScalingListPresentFlag5 = 3 ScalingListPresentFlag6 = 3 ScalingListPresentFlag7 = 3 ScalingListPresentFlag8 = 3 ScalingListPresentFlag9 = 3 ScalingListPresentFlag10 = 3 ScalingListPresentFlag11 = 3 OffsetMatrixPresentFlag = 0 QOffsetMatrixFile = "q_offset.cfg" OffsetMatrixFlat = 0 AdaptiveRounding = 1 AdaptRoundingFixed = 0 AdaptRndPeriod = 16 AdaptRndChroma = 1 AdaptRndWFactorIRef = 8 AdaptRndWFactorPRef = 8 AdaptRndWFactorBRef = 8 AdaptRndWFactorINRef = 8 AdaptRndWFactorPNRef = 8 AdaptRndWFactorBNRef = 8 AdaptRndCrWFactorIRef = 8 AdaptRndCrWFactorPRef = 8 AdaptRndCrWFactorBRef = 8 AdaptRndCrWFactorINRef = 8 AdaptRndCrWFactorPNRef = 8 AdaptRndCrWFactorBNRef = 8 UseRDOQuant = 0 RDOQ_DC = 1 RDOQ_CR = 1 RDOQ_DC_CR = 1 RDOQ_QP_Num = 5 RDOQ_CP_Mode = 0 RDOQ_CP_MV = 0 RDOQ_Fast = 0 LosslessCoding = 0 SearchMode = 3 UMHexDSR = 1 UMHexScale = 3 EPZSPattern = 2 EPZSDualRefinement = 3 EPZSFixedPredictors = 3 EPZSAggressiveWindow = 0 EPZSTemporal = 1 EPZSSpatialMem = 1 EPZSBlockType = 1 EPZSMinThresScale = 0 EPZSMedThresScale = 1 EPZSMaxThresScale = 2 EPZSSubPelMEBiPred = 1 EPZSSubPelThresScale = 1 EPZSSubPelGrid = 1 HMEEnable = 1 EPZSUseHMEPredictors = 1 UseDistortionReorder = 1 ToneMappingSEIPresentFlag = 0 ToneMappingFile = "ToneMapping.cfg" GenerateSEIMessage = 0 SEIMessageText = "H.264/AVC Encoder" SEIFPAType = -1 UseMVLimits = 0 SetMVXLimit = 512

65 49 SetMVYLimit = 512 EnableVUISupport = 0 VUI_aspect_ratio_info_present_flag = 0 VUI_aspect_ratio_idc = 1 VUI_sar_width = 0 VUI_sar_height = 0 VUI_overscan_info_present_flag = 0 VUI_overscan_appropriate_flag = 0 VUI_video_signal_type_present_flag = 0 VUI_video_format = 5 VUI_video_full_range_flag = 0 VUI_colour_description_present_flag = 0 VUI_colour_primaries = 2 VUI_transfer_characteristics = 2 VUI_matrix_coefficients = 2 VUI_chroma_location_info_present_flag = 0 VUI_chroma_sample_loc_type_top_field = 0 VUI_chroma_sample_loc_type_bottom_field = 0 VUI_timing_info_present_flag = 0 VUI_num_units_in_tick = 1000 VUI_time_scale = VUI_fixed_frame_rate_flag = 0 VUI_nal_hrd_parameters_present_flag = 0 VUI_nal_cpb_cnt_minus1 = 0 VUI_nal_bit_rate_scale = 0 VUI_nal_cpb_size_scale = 0 VUI_nal_bit_rate_value_minus1 = 0 VUI_nal_cpb_size_value_minus1 = 0 VUI_nal_vbr_cbr_flag = 0 VUI_nal_initial_cpb_removal_delay_length_minus1 = 23 VUI_nal_cpb_removal_delay_length_minus1 = 23 VUI_nal_dpb_output_delay_length_minus1 = 23 VUI_nal_time_offset_length = 24 VUI_vcl_hrd_parameters_present_flag = 0 VUI_vcl_cpb_cnt_minus1 = 0 VUI_vcl_bit_rate_scale = 0 VUI_vcl_cpb_size_scale = 0 VUI_vcl_bit_rate_value_minus1 = 0 VUI_vcl_cpb_size_value_minus1 = 0 VUI_vcl_vbr_cbr_flag = 0 VUI_vcl_initial_cpb_removal_delay_length_minus1 = 23 VUI_vcl_cpb_removal_delay_length_minus1 = 23 VUI_vcl_dpb_output_delay_length_minus1 = 23 VUI_vcl_time_offset_length = 24 VUI_low_delay_hrd_flag = 0 VUI_pic_struct_present_flag = 0 VUI_bitstream_restriction_flag = 0 VUI_motion_vectors_over_pic_boundaries_flag = 1 VUI_max_bytes_per_pic_denom = 0 VUI_max_bits_per_mb_denom = 0 VUI_log2_max_mv_length_vertical = 16 VUI_log2_max_mv_length_horizontal = 16 VUI_num_reorder_frames = 16 VUI_max_dec_frame_buffering = 16 Ρυθμίσεις κωδικοποιητή αναφοράς του προτύπου HEVC InputBitDepth : 8 InputChromaFormat : 420 FrameRate : 50 FrameSkip : 0 SourceWidth : 1920

66 50 Ρυθμίσεις κωδικοποιητών SourceHeight : 1080 FramesToBeEncoded : 500 PrintFrameMSE : 1 PrintSequenceMSE : 1 Profile : main Level : 5.2 MaxCUWidth : 64 MaxCUHeight : 64 MaxPartitionDepth : 4 QuadtreeTULog2MaxSize : 5 QuadtreeTULog2MinSize : 2 QuadtreeTUMaxDepthInter : 3 QuadtreeTUMaxDepthIntra : 3 IntraPeriod : 32 DecodingRefreshType : 1 GOPSize : 8 ReWriteParamSetsFlag : 1 IntraQPOffset : -3 LambdaFromQpEnable : 1 # Type POC QPoffset QPOffsetModelOff QPOffsetModelScale CbQPoffset CrQPoffset QPfactor tcoffsetdiv2 Frame1: B Frame2: B Frame3: B Frame4: B Frame5: B Frame6: B Frame7: B Frame8: B # betaoffsetdiv2 temporal_id #ref_pics_active #ref_pics reference pictures predict deltarps #ref_idcs reference idcs Frame1: Frame2: Frame3: Frame4: Frame5: Frame6: Frame7: Frame8: FastSearch : 1 SearchRange : 256 BipredSearchRange : 4 HadamardME : 1 FEN : 1 FDM : 1 QP : 29 MaxDeltaQP : 0 MaxCuDQPDepth : 0 DeltaQpRD : 0 RDOQ : 1 RDOQTS : 1 SliceChromaQPOffsetPeriodicity: 0 SliceCbQpOffsetIntraOrPeriodic: 0 SliceCrQpOffsetIntraOrPeriodic: 0 LoopFilterOffsetInPPS : 1 LoopFilterDisable : 0 LoopFilterBetaOffset_div2 : 0 LoopFilterTcOffset_div2 : 0 DeblockingFilterMetric : 0 InternalBitDepth : 8 SAO : 1 AMP : 1 TransformSkip : 1 TransformSkipFast : 1 SAOLcuBoundary : 0 SliceMode : 0

67 51 SliceArgument : 1500 LFCrossSliceBoundaryFlag : 1 PCMEnabledFlag : 0 PCMLog2MaxSize : 5 PCMLog2MinSize : 3 PCMInputBitDepthFlag : 1 PCMFilterDisableFlag : 0 TileUniformSpacing : 0 NumTileColumnsMinus1 : 0 TileColumnWidthArray : 2 3 NumTileRowsMinus1 : 0 TileRowHeightArray : 2 LFCrossTileBoundaryFlag : 1 WaveFrontSynchro : 0 ScalingList : 0 ScalingListFile : scaling_list.txt TransquantBypassEnableFlag : 0 CUTransquantBypassFlagForce : 0 RateControl : 0 TargetBitrate : KeepHierarchicalBit : 2 LCULevelRateControl : 1 RCLCUSeparateModel : 1 InitialQP : 0 RCForceIntraQP : 0 Ρυθμίσεις κωδικοποιητή αναφοράς του προτύπου Thor HQperiod 1 num_reorder_pics 7 interp_ref 1 intra_period 32 dqpi -2 dqpb0 3 dqpb1 1 dqpb2 0 mqpp 1.2 mqpb 1.2 mqpb0 1.1 mqpb1 1.2 mqpb2 1.3 lambda_coeffi 0.8 lambda_coeffp 1.2 lambda_coeffb 1.2 lambda_coeffb0 1.2 lambda_coeffb1 1.2 lambda_coeffb2 1.2 intra_rdo 1 enable_tb_split 1 enable_pb_split 1 early_skip_thr 0.3 max_num_ref 4 use_block_contexts 1 enable_bipred 1 encoder_speed 1 enable_cfl_intra 1 enable_cfl_inter 0

68 52 Ρυθμίσεις κωδικοποιητών

69 ΠΑΡΑΡΤΗΜΑ Βʹ ΣΥΓΚΡΙΣΗ ΚΩΔΙΚΟΠΟΙΗΜΕΝΩΝ ΚΑΡΕ Στις επόμενες σελίδες, παρουσιάζονται προς σύγκριση κάποια ενδεικτικά στιγμιότυπα των κωδικοποιημένων ακολουθιών. Τα πάνω στιγμιότυπα είναι κωδικοποιημένα με το H.264, τα κεντρικά με το HEVC και τα κάτω με το Thor. Φυσικά, τα στιγμιότυπα απεικονίζουν το ίδιο καρέ κάθε ακολουθίας, ενώ προσοχή δόθηκε στο να έχουν παραπλήσια bitrate, για την ορθότερη σύγκρισή τους. 53

70 54 Σύγκριση κωδικοποιημένων καρέ Εικόνα 2: CrowdRun (#Frame=256)

71 Εικόνα 3: Jockey (#Frame=177) 55

72 56 Σύγκριση κωδικοποιημένων καρέ Εικόνα 4: Beauty (#Frame=233)

73 Εικόνα 5: ReadySteadyGo (#Frame=326) 57

MPEG-4: Βασικά Χαρακτηριστικά

MPEG-4: Βασικά Χαρακτηριστικά MPEG-4 MPEG-4: Βασικά Χαρακτηριστικά Σχεδιάστηκε ώστε να καλύπτει ευρύ φάσμα ρυθμών, από 5 kbps εώς 10 Mbps Εκτός από τη συμπίεση δίνει έμφαση και στην αλληλεπίδραση με το χρήστη Χρησιμοποιεί αντικείμενα

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 14: Κωδικοποίηση βίντεο: Η.264 Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 14: Κωδικοποίηση βίντεο: Η.264 Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 14: Κωδικοποίηση βίντεο: Η.264 Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου

Διαβάστε περισσότερα

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ 2 Κωδικοποίηση εικόνας Ακολουθία από ψηφιοποιημένα καρέ (frames) που έχουν συλληφθεί σε συγκεκριμένο ρυθμό frame rate (π.χ. 10fps,

Διαβάστε περισσότερα

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1 Αρχές κωδικοποίησης Απαιτήσεις κωδικοποίησης Είδη κωδικοποίησης Κωδικοποίηση εντροπίας Διαφορική κωδικοποίηση Κωδικοποίηση μετασχηματισμών Στρωματοποιημένη κωδικοποίηση Κβαντοποίηση διανυσμάτων Τεχνολογία

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του

Διαβάστε περισσότερα

Κωδικοποίηση βίντεο (H.261 / DVI)

Κωδικοποίηση βίντεο (H.261 / DVI) Κωδικοποίηση βίντεο (H.261 / DVI) Αρχές κωδικοποίησης βίντεο Εισαγωγή στο H.261 Κωδικοποίηση βίντεο Ροή δεδοµένων Εισαγωγή στο DVI Κωδικοποίηση ήχου και εικόνων Κωδικοποίηση βίντεο Ροή δεδοµένων Τεχνολογία

Διαβάστε περισσότερα

Δ11 Δ12. Συμπίεση Δεδομένων

Δ11 Δ12. Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2013-2014 Κωδικοποιητές εικονοροής (Video) Δρ. Ν. Π. Σγούρος 2 Κωδικοποιητές Εικονοροών ITU-T VCEG H.261 (1990) ISO/IEC MPEG H.263 (1995/9 6) MPEG-2 (H.262) (1994/9 5) H.263+ (1997/98)

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2013-2014 JPEG 2000 Δρ. Ν. Π. Σγούρος 2 JPEG 2000 Βασικά χαρακτηριστικά Επιτρέπει συμπίεση σε εξαιρετικά χαμηλούς ρυθμούς όπου η συμπίεση με το JPEG εισάγει μεγάλες παραμορφώσεις Ενσωμάτωση

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 15: Συμπίεση Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 15: Συμπίεση Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Συστήματα Πολυμέσων Ενότητα 15: Συμπίεση Ψηφιακού Βίντεο Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Συµπίεση Εικόνας: Το πρότυπο JPEG

Συµπίεση Εικόνας: Το πρότυπο JPEG ΒΕΣ : Συµπίεση και Μετάδοση Πολυµέσων ΒΕΣ Συµπίεση και Μετάδοση Πολυµέσων Συµπίεση Εικόνας: Το πρότυπο JPEG ΒΕΣ : Συµπίεση και Μετάδοση Πολυµέσων Εισαγωγή Σχεδιάστηκε από την οµάδα Joint Photographic Experts

Διαβάστε περισσότερα

Group (JPEG) το 1992.

Group (JPEG) το 1992. Μέθοδοι Συμπίεσης Εικόνας Πρωτόκολλο JPEG Συμπίεση Εικόνας: Μείωση αποθηκευτικού χώρου Ευκολία στη μεταφορά αρχείων Δημιουργήθηκε από την ομάδα Joint Photographic Experts Group (JPEG) το 1992. Ονομάστηκε

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου

Διαβάστε περισσότερα

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Αλέξανδρος Ελευθεριάδης Αναπ. Καθηγητής & Marie Curie Chair Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών eleft@di.uoa.gr,

Διαβάστε περισσότερα

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT ΒΕΣ : Συµπίεση και Μετάδοση Πολυµέσων Συµπίεση εικόνων: Το πρότυπο JPEG Περιεχόµενα Εισαγωγή Ο µετασχηµατισµός DCT Το πρότυπο JPEG Προετοιµασία εικόνας / µπλοκ Ευθύς µετασχηµατισµός DCT Κβαντισµός Κωδικοποίηση

Διαβάστε περισσότερα

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT Περιεχόµενα ΕΠΛ : Συστήµατα Πολυµέσων Συµπίεση εικόνων: Το πρότυπο JPEG Εισαγωγή Ο µετασχηµατισµός DCT Το πρότυπο JPEG Προετοιµασία εικόνας / µπλοκ Ευθύς µετασχηµατισµός DCT Κβαντισµός Κωδικοποίηση ηµιουργία

Διαβάστε περισσότερα

Δ10. Συμπίεση Δεδομένων

Δ10. Συμπίεση Δεδομένων Συμπίεση Δεδομένων 203-204 Κωδικοποίηση εικονοροής (Video) Δρ. Ν. Π. Σγούρος 2 Ανάλυση Οθονών Δρ. Ν. Π. Σγούρος 3 Πρωτόκολλα μετάδοσης εικονοροών Πρωτόκολλο Ρυθμός (Hz) Φίλμ 23.976 ATSC 24 PAL,DVB-SD,DVB-HD

Διαβάστε περισσότερα

Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε Απώλειες. Πρότυπα Συµπίεσης Εικόνων

Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε Απώλειες. Πρότυπα Συµπίεσης Εικόνων ΤΨΣ 5: Ψηφιακή Επεξεργασία Εικόνας ΤΨΣ 5 Ψηφιακή Επεξεργασία Εικόνας Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε απώλειες Πρότυπα Συµπίεσης Εικόνων Τµήµα ιδακτικής της Τεχνολογίας και Ψηφιακών Συστηµάτων Πανεπιστήµιο

Διαβάστε περισσότερα

Συμπίεση Πολυμεσικών Δεδομένων

Συμπίεση Πολυμεσικών Δεδομένων Συμπίεση Πολυμεσικών Δεδομένων Εισαγωγή στο πρόβλημα και επιλεγμένες εφαρμογές Παράδειγμα 2: Συμπίεση Εικόνας ΔΠΜΣ ΜΥΑ, Ιούνιος 2011 Εισαγωγή (1) Οι τεχνικές συμπίεσης βασίζονται στην απόρριψη της πλεονάζουσας

Διαβάστε περισσότερα

Ραδιοτηλεοπτικά Συστήματα Ενότητα 4: Ψηφιοποίηση και συμπίεση σημάτων εικόνας

Ραδιοτηλεοπτικά Συστήματα Ενότητα 4: Ψηφιοποίηση και συμπίεση σημάτων εικόνας ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ραδιοτηλεοπτικά Συστήματα Ενότητα 4: Ψηφιοποίηση και συμπίεση σημάτων εικόνας Δρ. Νικόλαος- Αλέξανδρος Τάτλας Τμήμα Ηλεκτρονικών

Διαβάστε περισσότερα

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1 Αρχές κωδικοποίησης Απαιτήσεις κωδικοποίησης Είδη κωδικοποίησης Βασικές τεχνικές κωδικοποίησης Κωδικοποίηση Huffman Κωδικοποίηση µετασχηµατισµών Κβαντοποίηση διανυσµάτων ιαφορική κωδικοποίηση Τεχνολογία

Διαβάστε περισσότερα

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding): ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intraframe Coding): κάθε εικόνα αντιμετωπίζεται και κωδικοποιείται ανεξάρτητα από τις υπόλοιπες (όπως στο JPEG) Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

Διαβάστε περισσότερα

Κωδικοποίηση βίντεο (MPEG)

Κωδικοποίηση βίντεο (MPEG) (MEG) Εισαγωγή στο MEG-1 Κωδικοποίηση βίντεο οµή βίντεο Κωδικοποίηση ήχου Ροή δεδοµένων Τεχνολογία Πολυµέσων 11-1 Εισαγωγή στο MEG-1 MEG (Motion ictures Experts Group) ίντεο και ήχος υψηλής ποιότητας ιανοµή

Διαβάστε περισσότερα

Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών

Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: Συστημάτων και Αυτομάτου Ελέγχου ΕΡΓΑΣΤΗΡΙΟ Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 7: Συμπίεση Εικόνας κατά JPEG Θρασύβουλος Γ. Τσιάτσος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας.

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας. Το πρότυπο JPEG για κωδικοποίησηση εικόνας Το JPEG, που υιοθετήθηκε από την Joint Photographic Experts Group, είναι ένα πρότυπο που χρησιµοποιείταιευρέωςγιατησυµπίεσηακίνητωνεικόνων, µε µέσο λόγο συµπίεσης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 4: ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ Ακαδηµαϊκό Έτος 004 005, Χειµερινό Εξάµηνο Καθ.: Νίκος Τσαπατσούλης ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ Η εξέταση αποτελείται από δύο µέρη. Το πρώτο περιλαµβάνει

Διαβάστε περισσότερα

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ. Οι διαφάνειες έχουν βασιστεί στο βιβλίο «Εισαγωγή στην επιστήμη των υπολογιστών» του B. Forouzanκαι Firoyz Mosharraf(2 η έκδοση-2010) Εκδόσεις Κλειδάριθμος Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου

Διαβάστε περισσότερα

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση Χειμερινό Εξάμηνο 2013-2014 Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση 5 η Παρουσίαση : Ψηφιακή Επεξεργασία Εικόνας Διδάσκων: Γιάννης Ντόκας Σύνθεση Χρωμάτων Αφαιρετική Παραγωγή Χρώματος Χρωματικά

Διαβάστε περισσότερα

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ 3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ ΑΝΑΓΚΗ ΣΥΜΠΙΕΣΗΣ ΔΕΔΟΜΕΝΩΝ Local Multimedia Π.χ. Μία ταινία 90 min απαιτεί 120 GB, και τα σημερινά μέσα αποθήκευσης < 25 GB. Άρα σήμερα είναι αδύνατη η αποθήκευση και η

Διαβάστε περισσότερα

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 8: MPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 8: MPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών Θέματα Συστημάτων Πολυμέσων Ενότητα # 8: MPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου

Διαβάστε περισσότερα

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Πολυμέσα Συμπίεση δεδομένων Κωδικοποίηση MPEG Δρ. Γεώργιος Π. Παυλίδης Συμπίεση Δεδομένων Περιεχόμενα Γνωστοίαλγόριθμοισυμπίεσης MPEG Χρησιμοποίηση Εφαρμογές Εκμάθηση Σχεδίαση Διασύνδεση χρήστη Υπηρεσίες

Διαβάστε περισσότερα

Συστήµατα και Αλγόριθµοι Πολυµέσων

Συστήµατα και Αλγόριθµοι Πολυµέσων Συστήµατα και Αλγόριθµοι Πολυµέσων Ιωάννης Χαρ. Κατσαβουνίδης Οµιλία #5: Αρχές Επεξεργασίας Σηµάτων Πολυµέσων 7 Νοεµβρίου 2005 Επανάληψη Θεωρία Πληροφορίας Εντροπία: H ( P) i= 0 Κωδικοποίηση Huffman 3

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Σκοποί ενότητας Εισαγωγή στη συμπίεση εικόνας Μη απωλεστικες

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΧΕΔΙΟ ΠΑΡΟΥΣΙΑΣΗΣ ΑΤΟΜΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ Δεκέμβριος 2013 Ατομική Διπλωματική Εργασία ΣΥΓΚΡΙΣΗ ΠΡΟΤΥΠΩΝ ΚΩΔΙΚΟΠΟΙΗΣΗΣ ΚΑΙ ΤΕΧΝΙΚΩΝ ΑΦΑΙΡΕΣΗΣ ΘΟΡΥΒΟΥ ΓΙΑ ΤΗ

Διαβάστε περισσότερα

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Συµπίεση Βίντεο. Βιβλιογραφία. Αρχές συµπίεσης βίντεο

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Συµπίεση Βίντεο. Βιβλιογραφία. Αρχές συµπίεσης βίντεο Περιεχόµενα ΕΠΛ 422: Συστήµατα Πολυµέσων Συµπίεση Βίντεο Αρχές Συµπίεσης Τύποι πλαισίων Εκτίµηση και αντιστάθµιση κίνησης Θέµατα υλοποίησης Η261 Η263 MEG MEG-1 MEG-2 MEG-4 Βιβλιογραφία Καγιάφας [2000]:

Διαβάστε περισσότερα

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση JPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση JPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Πολυμέσα Συμπίεση δεδομένων Δρ. Γεώργιος Π. Παυλίδης Συμπίεση Δεδομένων Περιεχόμενα Γνωστοίαλγόριθμοισυμπίεσης JPEG, Οικογένεια H.26x, H.32x Χρησιμοποίηση Εφαρμογές Εκμάθηση Σχεδίαση Διασύνδεση χρήστη

Διαβάστε περισσότερα

MPEG-4 : Διαδραστικές εφαρμογές πολυμέσων

MPEG-4 : Διαδραστικές εφαρμογές πολυμέσων MPEG-4 : Διαδραστικές εφαρμογές πολυμέσων Συμπίεση οπτικοακουστικών δεδομένων για το Διαδίκτυο Οπτικοί δίσκοι Ψηφιακή τηλεόραση (επίγεια, δορυφορική) Συμβατότητα με MPEG-1 και MPEG-2 Συνθετική σκηνή Εισαγωγή

Διαβάστε περισσότερα

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1 Εικόνα Εισαγωγή Ψηφιακή αναπαράσταση Κωδικοποίηση των χρωμάτων Συσκευές εισόδου και εξόδου Βάθος χρώματος και ανάλυση Συμβολική αναπαράσταση Μετάδοση εικόνας Σύνθεση εικόνας Ανάλυση εικόνας Τεχνολογία

Διαβάστε περισσότερα

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων ΓΤΠ 61 Ηλεκτρονικοί Υπολογιστές στις Γραφικές Τέχνες Πολυµέσα και Συµπίεση εδοµένων Εισαγωγή Βασικές Έννοιες Ταξινόµηση Τεχνικών Συµπίεσης Συµπίεση Κειµένου Συµπίεση Εικόνας Συµπίεση Ήχου Συµπίεση Video

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Συστήματα Πολυμέσων Ενότητα 12: Συμπίεση Ψηφιακού Ήχου Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Αλέξανδρος Ελευθεριάδης Αναπ. Καθηγητής & Marie Curie Chair Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών eleft@di.uoa.gr,

Διαβάστε περισσότερα

Κωδικοποίηση εικόνων κατά JPEG

Κωδικοποίηση εικόνων κατά JPEG Κωδικοποίηση εικόνων κατά JPEG Εισαγωγή Προετοιµασία της εικόνας ρυθµός Ακολουθιακός απωλεστικός ρυθµός Εκτεταµένος απωλεστικός ρυθµός Μη απωλεστικός ρυθµός Ιεραρχικός ρυθµός Τεχνολογία Πολυµέσων 09-1

Διαβάστε περισσότερα

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα Συµπίεση/κωδικοποίηση βίντεο ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) Συνδιάσκεψη : ISDN, ATM, LANs, Internet, PSTN MPEG-1, MPEG-2, MPEG-4 Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα 1 H.261 : εισαγωγή

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση 12 η. Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση 12 η. Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Παρουσίαση 12 η Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων Εισαγωγή (1) Το χρώμα είναι ένας πολύ σημαντικός παράγοντας περιγραφής, που συχνά απλουστεύει κατά

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης Θρασύβουλος Γ. Τσιάτσος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Η ανάγκη για συμπίεση

Η ανάγκη για συμπίεση Πρότυπα συμπίεσης Η ανάγκη για συμπίεση High-Definition Television (HDTV) 1920x1080 30 frames per second (full motion) 8 bits για κάθε κανάλι χρώματος 1.5 Gb/sec! Κάθε κανάλι 6 MHz Max data rate: 19.2

Διαβάστε περισσότερα

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας Ενότητα 4: Συµπίεση Εικόνας 2 Συµπίεση Εικόνας Μείωση Πλεονασµού: Το σήµα εικόνας παρουσιάζει

Διαβάστε περισσότερα

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Υπάρχουσες εφαρμογές:

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Υπάρχουσες εφαρμογές: VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ Υπάρχουσες εφαρμογές: Αναπαραγωγή αποθηκευμένου οπτικοακουστικού υλικού (εκπαιδευτικές/ψυχαγωγικές π.χ. video on demand) Οπτικοακουστική επικοινωνία πραγματικού χρόνου (ένας-προς-έναν

Διαβάστε περισσότερα

Θέματα Συστημάτων Πολυμέσων

Θέματα Συστημάτων Πολυμέσων Θέματα Συστημάτων Πολυμέσων Ενότητα # 6: Στοιχεία Θεωρίας Πληροφορίας Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Εικόνας ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ψηφιακή Επεξεργασία Εικόνας Ενότητα 9 : Κωδικοποίηση βίντεο Πρότυπο συμπίεσης MPEG Ιωάννης Έλληνας Τμήμα Η/ΥΣ Άδειες Χρήσης Το

Διαβάστε περισσότερα

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης DIP_06 Συμπίεση εικόνας - JPEG ΤΕΙ Κρήτης Συμπίεση εικόνας Το μέγεθος μιας εικόνας είναι πολύ μεγάλο π.χ. Εικόνα μεγέθους Α4 δημιουργημένη από ένα σαρωτή με 300 pixels ανά ίντσα και με χρήση του RGB μοντέλου

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης Θρασύβουλος Γ. Τσιάτσος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Εικόνας ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ψηφιακή Επεξεργασία Εικόνας Ενότητα 6 : Κωδικοποίηση & Συμπίεση εικόνας Ιωάννης Έλληνας Τμήμα Η/ΥΣ Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Συστήµατα και Αλγόριθµοι Πολυµέσων

Συστήµατα και Αλγόριθµοι Πολυµέσων Συστήµατα και Αλγόριθµοι Πολυµέσων Ιωάννης Χαρ. Κατσαβουνίδης Οµιλία #3: Αρχές Επεξεργασίας Σηµάτων Πολυµέσων 10 Οκτωβρίου 005 Επανάλειψη (1) ειγµατοληψία επανα-δειγµατοληψία Τεχνικές φίλτρων (συνέλειξη)

Διαβάστε περισσότερα

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Τεράστιες ανάγκες σε αποθηκευτικό χώρο ΣΥΜΠΙΕΣΗ Τεράστιες ανάγκες σε αποθηκευτικό χώρο Παράδειγμα: CD-ROM έχει χωρητικότητα 650MB, χωρά 75 λεπτά ασυμπίεστου στερεοφωνικού ήχου, αλλά 30 sec ασυμπίεστου βίντεο. Μαγνητικοί δίσκοι χωρητικότητας

Διαβάστε περισσότερα

Εφαρμογές Πληροφορικής

Εφαρμογές Πληροφορικής Εφαρμογές Πληροφορικής Κεφάλαιο 11 Πολυμέσα ΜΕΡΟΣ Α 1. Υπερκείμενο Ποιός είναι ο κόμβος, ποιός ο σύνδεσμος και ποιά η θερμή λέξη; 1 2. Υπερμέσα Χαρακτηριστικά Κόμβος (Node) Αποτελεί τη βάση πληροφοριών

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Ρυθμός κωδικοποίησης Ένας κώδικας που απαιτεί L bits για την κωδικοποίηση μίας συμβολοσειράς N συμβόλων που εκπέμπει μία πηγή έχει ρυθμό κωδικοποίησης (μέσο μήκος λέξης) L

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το

Διαβάστε περισσότερα

Βασικές έννοιες. Αναλογικό Βίντεο. Ψηφιακό Βίντεο. Κινούμενα γραφικά (animation)( Πλαίσιο (frame, καρέ) Ρυθμός πλαισίων (frame rate)

Βασικές έννοιες. Αναλογικό Βίντεο. Ψηφιακό Βίντεο. Κινούμενα γραφικά (animation)( Πλαίσιο (frame, καρέ) Ρυθμός πλαισίων (frame rate) 8. Video & ΠΟΛΥΜΕΣΑ Βασικές έννοιες Πλαίσιο (frame, καρέ) Ρυθμός πλαισίων (frame rate) Αναλογικό Βίντεο Τύποι αναλογικού σήματος Κωδικοποίηση αναλογικού βίντεο Ψηφιακό Βίντεο Σύλληψη, ψηφιοποίηση, δειγματοληψία

Διαβάστε περισσότερα

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1 Ήχος Χαρακτηριστικά του ήχου Ψηφιοποίηση με μετασχηματισμό Ψηφιοποίηση με δειγματοληψία Κβαντοποίηση δειγμάτων Παλμοκωδική διαμόρφωση Συμβολική αναπαράσταση μουσικής Τεχνολογία Πολυμέσων και Πολυμεσικές

Διαβάστε περισσότερα

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 7 ο Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1 Εισαγωγή (1) Οι τεχνικές συμπίεσης βασίζονται στην απόρριψη της πλεονάζουσας πληροφορίας Ανάγκες που καλύπτονται Εξοικονόμηση μνήμης Ελάττωση χρόνου και εύρους

Διαβάστε περισσότερα

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG Κωδικοποίηση ήχου Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG Τεχνολογία Πολυµέσων και Πολυµεσικές Επικοινωνίες 10-1 Κωδικοποίηση καναλιού φωνής

Διαβάστε περισσότερα

MPEG-4: Διαδραστικές εφαρμογές πολυμέσων

MPEG-4: Διαδραστικές εφαρμογές πολυμέσων MPEG-4: Διαδραστικές εφαρμογές πολυμέσων Γιώργος Τζιρίτας Τμήμα Επιστήμης Υπολογιστών http://www.csd.uoc.gr/~tziritas Άνοιξη 2016 1 Εισαγωγή Δημοσίευση 1998 (Intern. Telecom. Union) Επικοινωνίες με πολυμέσα,

Διαβάστε περισσότερα

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Τμήμα Μηχανικών Η/Υ και Πληροφορικής Τμήμα Μηχανικών Η/Υ και Πληροφορικής Εργαστήριο Επεξεργασίας Σημάτων και Τηλεπικοινωνιών Κινητά Δίκτυα Επικοινωνιών Μέρος Α: Τηλεπικοινωνιακά Θέματα: Τεχνικές Κωδικοποίησης Πηγής Η Περίπτωση της Φωνής

Διαβάστε περισσότερα

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. MPEG 2 bitstream και πολυπλεξία

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. MPEG 2 bitstream και πολυπλεξία ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ 3 MPEG 2 bitstream και πολυπλεξία 2 Μικρότερο δομικό στοιχείο: Το block 8x8 με τους συντελεστές DCT είτε για τη φωτεινότητα ή

Διαβάστε περισσότερα

Μετάδοση πληροφορίας - Διαμόρφωση

Μετάδοση πληροφορίας - Διαμόρφωση ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΤΜΗΜΑ ΜΗΧ. Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ Μετάδοση πληροφορίας - Διαμόρφωση MYE006-ΠΛΕ065: ΑΣΥΡΜΑΤΑ ΔΙΚΤΥΑ Ευάγγελος Παπαπέτρου Διάρθρωση μαθήματος Βασικές έννοιες μετάδοσης Διαμόρφωση ορισμός

Διαβάστε περισσότερα

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Αλέξανδρος Ελευθεριάδης Αναπ. Καθηγητής & Marie Curie Chair Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών eleft@di.uoa.gr,

Διαβάστε περισσότερα

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Εισαγωγή

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Εισαγωγή ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ 1 Εισαγωγή Το μάθημα «Αρχές Ψηφιακής Τηλεόρασης» εξετάζει τις τεχνολογίες και τους μηχανισμούς που παρεμβάλλονται για να διανεμηθεί

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα.

Διαβάστε περισσότερα

Μετάδοση πληροφορίας - Διαμόρφωση

Μετάδοση πληροφορίας - Διαμόρφωση Μετάδοση πληροφορίας - Διαμόρφωση MYE006: ΑΣΥΡΜΑΤΑ ΔΙΚΤΥΑ Ευάγγελος Παπαπέτρου ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΤΜΗΜΑ ΜΗΧ. Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ Διάρθρωση μαθήματος Μετάδοση Βασικές έννοιες Διαμόρφωση ορισμός είδη

Διαβάστε περισσότερα

Επεξεργασία Χαρτογραφικής Εικόνας

Επεξεργασία Χαρτογραφικής Εικόνας Επεξεργασία Χαρτογραφικής Εικόνας ιδάσκων: Αναγνωστόπουλος Χρήστος Αρχές συµπίεσης δεδοµένων Ήδη συµπίεσης Συµπίεση εικόνων Αλγόριθµος JPEG Γιατί χρειαζόµαστε συµπίεση; Τα σηµερινά αποθηκευτικά µέσα αδυνατούν

Διαβάστε περισσότερα

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων Εισαγωγή στην επιστήμη των υπολογιστών Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων 1 2.1 Τύποι Δεδομένων Τα δεδομένα σήμερα συναντώνται σε διάφορες μορφές, στις οποίες περιλαμβάνονται αριθμοί,

Διαβάστε περισσότερα

ΣΧΕΔΙΑΣΗ ΣΥΣΤΗΜΑΤΩΝ ΜΕ ΧΡΗΣΗ ΥΠΟΛΟΓΙΣΤΩΝ (E-CAD) ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ

ΣΧΕΔΙΑΣΗ ΣΥΣΤΗΜΑΤΩΝ ΜΕ ΧΡΗΣΗ ΥΠΟΛΟΓΙΣΤΩΝ (E-CAD) ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ ΣΧΕΔΙΑΣΗ ΣΥΣΤΗΜΑΤΩΝ ΜΕ ΧΡΗΣΗ ΥΠΟΛΟΓΙΣΤΩΝ (E-CAD) ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2016 2017 Χ. Βέργος Καθηγητής ΕΡΓΑΣΙΑ ΕΞΑΜΗΝΟΥ Σκοπός της φετινής εργασίας εξαμήνου είναι η σχεδίαση ενός Συστήματος Απεικόνισης Χαρακτήρων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 4: ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ Ακαδηµαϊκό Έτος 004 005, Χειµερινό Εξάµηνο Θεωρητικές Ασκήσεις (# 3): 1. Ο διακριτός µετασχηµατισµός συνηµίτονου (Discrete Cosine Transform)

Διαβάστε περισσότερα

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο Μοντέλο Επικοινωνίας Δεδομένων Επικοινωνίες Δεδομένων Μάθημα 6 ο Εισαγωγή Με τη βοήθεια επικοινωνιακού σήματος, κάθε μορφή πληροφορίας (κείμενο, μορφή, εικόνα) είναι δυνατόν να μεταδοθεί σε απόσταση. Ανάλογα

Διαβάστε περισσότερα

Γιώργος Τζιρίτας Τµήµα Επιστήµης Υπολογιστών http://www.csd.uoc.gr/~tziritas

Γιώργος Τζιρίτας Τµήµα Επιστήµης Υπολογιστών http://www.csd.uoc.gr/~tziritas Συµπίεση/κωδικοποίηση βίντεο Γιώργος Τζιρίτας Τµήµα Επιστήµης Υπολογιστών http://www.csd.uoc.gr/~tziritas Άνοιξη 2009 1 Εφαρµογή Απαίτηση Παρα- µόρφωση Μετάδοση Πρότυπο ικτυακό βίντεο 1,5 Mbps Υψηλή Internet

Διαβάστε περισσότερα

Πολυμέσα πάνω από κινητά δίκτυα

Πολυμέσα πάνω από κινητά δίκτυα Πολυμέσα πάνω από κινητά δίκτυα Γιώργος Τζιρίτας Τμήμα Επιστήμης Υπολογιστών http://www.csd.uoc.gr/~tziritas Άνοιξη 2016 1 Πολυμέσα σε ασύρματα δίκτυα Οι πολυμεσικές επικοινωνίες μέσω φορητών συσκευών

Διαβάστε περισσότερα

Συμπίεση Βίντεο: Αρχές και Πρότυπα Συμπίεσης

Συμπίεση Βίντεο: Αρχές και Πρότυπα Συμπίεσης ΒΕΣ 04 Συμπίεση και Μετάδοση Πολυμέσων Συμπίεση Βίντεο: Αρχές και Πρότυπα Συμπίεσης Εισαγωγή Στη συμπίεση video αναζητείται μία χρυσή τομή (sweet spot) ανάμεσα στην ποιότητα και το εύρος ζώνης (bandwidth)

Διαβάστε περισσότερα

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Τμήμα Μηχανικών Η/Υ και Πληροφορικής Τμήμα Μηχανικών Η/Υ και Πληροφορικής Εργαστήριο Επεξεργασίας Σημάτων και Τηλεπικοινωνιών Ασύρματες και Κινητές Επικοινωνίες Κωδικοποίηση καναλιού Τι θα δούμε στο μάθημα Σύντομη εισαγωγή Γραμμικοί κώδικες

Διαβάστε περισσότερα

Εφαρμογές που συνδυάζουν ταυτόχρονα πολλαπλά μέσα : Κί Κείμενο, Εικόνα, Ήχος, Video, Animation. Στα υπερμέσα η πρόσπέλαση της πληροφορίας γίνεται

Εφαρμογές που συνδυάζουν ταυτόχρονα πολλαπλά μέσα : Κί Κείμενο, Εικόνα, Ήχος, Video, Animation. Στα υπερμέσα η πρόσπέλαση της πληροφορίας γίνεται Τι είναι Πολυμέσα και τι Υπερμέσα Εφαρμογές που συνδυάζουν ταυτόχρονα πολλαπλά μέσα : Κί Κείμενο, Εικόνα, Ήχος, Video, Animation Στα πολυμέσα η προσπέλαση της πληροφορίας γίνεται με γραμμικό τρόπο (προκαθορισμένη

Διαβάστε περισσότερα

Ο μετασχηματισμός wavelet (Discrete Wavelet Transform, DWT) έχει χρησιμοποιηθεί με επιτυχία στη συμπίεση εικόνας6

Ο μετασχηματισμός wavelet (Discrete Wavelet Transform, DWT) έχει χρησιμοποιηθεί με επιτυχία στη συμπίεση εικόνας6 ΣΥΜΠΙΕΣΗ BINTEO ΜΕ WAVELETS) Ο μετασχηματισμός wavelet (Discrete Wavelet Transorm DWT) έχει χρησιμοποιηθεί με επιτυχία στη συμπίεση εικόνας6 Αλγόριθμοι EZW SPIHT και JPEG-0006 Ο DWT έχει καλύτερη απόδοση

Διαβάστε περισσότερα

Τι συσχετίζεται με τον ήχο

Τι συσχετίζεται με τον ήχο ΗΧΟΣ Τι συσχετίζεται με τον ήχο Υλικό Κάρτα ήχου Προενυσχιτής Equalizer Ενισχυτής Ηχεία Χώρος Ανθρώπινη ακοή Ψυχοακουστικά φαινόμενα Ηχητική πληροφορία Σημείο αναφοράς 20 μpa Εύρος συχνοτήτων Δειγματοληψία

Διαβάστε περισσότερα

Συστήματα Επικοινωνιών

Συστήματα Επικοινωνιών Συστήματα Επικοινωνιών Ενότητα 9: Παλμοκωδική Διαμόρφωση (PCM) Μιχαήλ Λογοθέτης Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Σκοποί ενότητας Περιγραφή της μεθόδου παλμοκωδικής

Διαβάστε περισσότερα

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας Ενότητα 3: Επισκόπηση Συµπίεσης 2 Θεωρία Πληροφορίας Κωδικοποίηση Θεµελιώθηκε απο τον Claude

Διαβάστε περισσότερα

Θέμα: «ΣΥΜΠΙΕΣΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΟΛΥΜΕΣΑ» Εισηγητής: Παναγιώτης Γιώτης 20 Μαϊου 2007 Αθήνα

Θέμα: «ΣΥΜΠΙΕΣΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΟΛΥΜΕΣΑ» Εισηγητής: Παναγιώτης Γιώτης 20 Μαϊου 2007 Αθήνα Θέμα: «ΣΥΜΠΙΕΣΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΟΛΥΜΕΣΑ» Εισηγητής: Παναγιώτης Γιώτης 20 Μαϊου 2007 Αθήνα Βασικοί άξονες της παρουσίασης ΜΕΡΟΣ Ι: Τι είναι η συμπίεση και γιατί είναι απαραίτητη ΜΕΡΟΣ ΙΙ: Τεχνικές Συμπίεσης

Διαβάστε περισσότερα

Κωδικοποίηση βίντεο (MPEG)

Κωδικοποίηση βίντεο (MPEG) Κωδικοποίηση βίντεο (MPEG) Εισαγωγή στο MPEG-2 Κωδικοποίηση βίντεο Κωδικοποίηση ήχου Ροή δεδοµένων Εισαγωγή στο MPEG-4 οµή σκηνών Κωδικοποίηση ήχου και βίντεο Τεχνολογία Πολυµέσων 11-1 Εισαγωγή στο MPEG-2

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων Περιεχόμενα Διακριτές Πηγές Πληροφορίας χωρίς μνήμη Ποσότητα πληροφορίας της πηγής Κωδικοποίηση

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 014-015 Μοναδικά Αποκωδικοποιήσιμοι Κώδικες Δρ. Ν. Π. Σγούρος Έλεγος μοναδικής Αποκωδικοποίησης Γενικοί ορισμοί Έστω δύο κωδικές λέξεις α,β με μήκη,m και

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΚΗ I. 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή

ΠΛΗΡΟΦΟΡΙΚΗ I. 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ - ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΣΑΓΩΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΤΟΥΡΙΣΤΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ ΚΑΙ ΕΠΙΧΕΙΡΗΣΕΩΝ ΦΙΛΟΞΕΝΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗ I 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή ΧΑΣΑΝΗΣ ΒΑΣΙΛΕΙΟΣ

Διαβάστε περισσότερα

Μετάδοση video στα κινητά 3 ης γενιάς: Δομή και απαιτούμενα πρωτόκολλα κωδικοποίησης

Μετάδοση video στα κινητά 3 ης γενιάς: Δομή και απαιτούμενα πρωτόκολλα κωδικοποίησης Μετάδοση vdeo στα κινητά 3 ης γενιάς: Δομή και απαιτούμενα πρωτόκολλα κωδικοποίησης Πτυχιακή Εργασία Μαργαρίτη Παππά Εισαγωγή Στόχος της εργάσιας είναι να περιγραφεί ο τρόπος λειτουργίας του WCDMA,για

Διαβάστε περισσότερα

Κωδικοποίηση και αποκωδικοποίηση µε χρήση του H.264/MPEG-4 για βίντεο µε µία ή περισσότερες λήψεις

Κωδικοποίηση και αποκωδικοποίηση µε χρήση του H.264/MPEG-4 για βίντεο µε µία ή περισσότερες λήψεις ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟ ΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Κωδικοποίηση και αποκωδικοποίηση µε χρήση του H.264/MPEG-4 για βίντεο µε µία

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ακαδημαϊκό Έτος 2015-16 Παρουσίαση Νο. 1 Εισαγωγή Τι είναι η εικόνα; Οτιδήποτε μπορούμε να δούμε ή να απεικονίσουμε Π.χ. Μια εικόνα τοπίου αλλά και η απεικόνιση

Διαβάστε περισσότερα

Δημιουργία Περιλήψεων από Ακολουθίες Βίντεο στο Συμπιεσμένο Πεδίο

Δημιουργία Περιλήψεων από Ακολουθίες Βίντεο στο Συμπιεσμένο Πεδίο Εργαστήριο Ηλεκτρονικής Τομέας Ηλεκτρονικής και Υπολογιστών Τμήμα Φυσικής Πανεπιστήμιο Πατρών Ειδική Επιστημονική Εργασία Δημιουργία Περιλήψεων από Ακολουθίες Βίντεο στο Συμπιεσμένο Πεδίο Ρήγας Ιωάννης

Διαβάστε περισσότερα

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1 Ήχος και φωνή Φύση του ήχου Ψηφιοποίηση µε µετασχηµατισµό Ψηφιοποίηση µε δειγµατοληψία Παλµοκωδική διαµόρφωση Αναπαράσταση µουσικής Ανάλυση και σύνθεση φωνής Μετάδοση φωνής Τεχνολογία Πολυµέσων 4-1 Φύση

Διαβάστε περισσότερα

ΠΛΗ21 Κεφάλαιο 1. ΠΛΗ21 Ψηφιακά Συστήματα: Τόμος Α Κεφάλαιο: 1 Εισαγωγή

ΠΛΗ21 Κεφάλαιο 1. ΠΛΗ21 Ψηφιακά Συστήματα: Τόμος Α Κεφάλαιο: 1 Εισαγωγή Ψηφιακά Συστήματα: Τόμος Α Κεφάλαιο: 1 Εισαγωγή Στόχοι του κεφαλαίου είναι να γνωρίσουμε: Τι είναι τα Αναλογικά κ τι τα Ψηφιακά Μεγέθη Τι είναι Σήμα, Αναλογικό Σήμα, Ψηφιακό Σήμα Τι είναι Δυαδικό Σήμα

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 2 ΒΑΣΙΚΑ ΚΑΙ ΣΥΝΘΕΤΑ ΣΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ - ΕΙΚΟΝΑΣ

ΑΣΚΗΣΗ 2 ΒΑΣΙΚΑ ΚΑΙ ΣΥΝΘΕΤΑ ΣΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ - ΕΙΚΟΝΑΣ ΑΣΚΗΣΗ 2 ΒΑΣΙΚΑ ΚΑΙ ΣΥΝΘΕΤΑ ΣΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ - ΕΙΚΟΝΑΣ Αντικείμενο: Κατανόηση και αναπαράσταση των βασικών σημάτων δύο διαστάσεων και απεικόνισης αυτών σε εικόνα. Δημιουργία και επεξεργασία των διαφόρων

Διαβάστε περισσότερα

Δ13b. Συμπίεση Δεδομένων

Δ13b. Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Εκτίμηση ποιότητας Εικόνας Ι Αντικειμενική Αξιολόγηση Χρήση μετρικών εκτίμησης ποιότητας Βασίζονται στη σύγκριση μεταξύ εικονοστοιχείων αρχικής και ανασυσταμένης εικόνας Υποκειμενική

Διαβάστε περισσότερα

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ΗΜΥ 100 Εισαγωγή στην Τεχνολογία Δρ. Στέλιος Τιμοθέου ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΑ ΘΕΜΑΤΑ ΜΑΣ ΣΗΜΕΡΑ Αναλογικά και ψηφιακά συστήματα Μετατροπή

Διαβάστε περισσότερα

ΤΗΛΕΜΑΤΙΚΗ ΚΑΙ ΝΕΕΣ ΥΠΗΡΕΣΙΕΣ

ΤΗΛΕΜΑΤΙΚΗ ΚΑΙ ΝΕΕΣ ΥΠΗΡΕΣΙΕΣ ΤΗΛΕΜΑΤΙΚΗ ΚΑΙ ΝΕΕΣ ΥΠΗΡΕΣΙΕΣ Ενότητα #1: Κωδικοποίηση Πολυμεσικών Δεδομένων Καθηγητής Χρήστος Ι. Μπούρας Τμήμα μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών email: bouras@cti.gr, site: http://ru6.cti.gr/ru6/bouras?language=el

Διαβάστε περισσότερα