ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Σχεδιασμός και Υλοποίηση Επιταχυντή Υλικού για τον Αλγόριθμο Εκτίμησης Κίνησης Εξαντλητικής Αναζήτησης

Σχετικά έγγραφα
Διαφορές single-processor αρχιτεκτονικών και SoCs

ΔΙΑΧΥΤΑ ΚΑΙ ΕΝΣΩΜΑΤΩΜΕΝΑ ΣΥΣΤΗΜΑΤΑ

Σχεδιασμός και Υλοποίηση Επιταχυντή Υλικού για τον Αλγόριθμο Εκτίμησης Κίνησης Εξαντλητικής Αναζήτησης

Κεφάλαιο Το υπολογιστικό σύστημα Η εξέλιξη του ανθρώπου πραγματοποιήθηκε χάρη στην ικανότητά στον χειρισμό εργαλείων.

Μηχανοτρονική. Τμήμα Μηχανικών Παραγωγής και Διοίκησης 7 ο Εξάμηνο,

*Ένας υπολογιστής είναι στην πραγματικότητα ένα σύστημα πολλών μερών που συνεργάζονται μεταξύ τους.

Οδηγίες εγκατάστασης και χρήσης του Quartus

Αρχιτεκτονική Υπολογιστών

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Λογικά σύμβολα των CPU, RAM, ROM και I/O module

Ενσωµατωµένα Υπολογιστικά Συστήµατα (Embedded Computer Systems)

ΣΧΕΔΙΑΣΗ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ - VHDL ΑΝΤΩΝΗΣ ΠΑΣΧΑΛΗΣ

Κυκλωμάτων» Χειμερινό εξάμηνο

Κεφάλαιο 1.5: Τα βασικά μέρη ενός υπολογιστή

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Προηγμένα Συστήματα Πληροφορικής» Μεταπτυχιακή Διατριβή

Κεντρική Μονάδα Επεξεργασίας

Αρχιτεκτονική Μνήμης

ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Α Γενικού Λυκείου (Μάθημα Επιλογής)

Ενσωματωμένα Συστήματα

Πανεπιστήμιο Πατρών. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών

ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Α ΤΑΞΗ

Ενότητα 4. Εισαγωγή στην Πληροφορική. Αναπαράσταση δεδοµένων. Αναπαράσταση πληροφορίας. υαδικοί αριθµοί. Χειµερινό Εξάµηνο

Αρχιτεκτονική Μνήµης

Αρχιτεκτονική Υπολογιστών

ΑΡΧΙΤΕΚΤΟΝΙΚΗ HARDWARE ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Προγραµµατισµός Συστηµάτων Πραγµατικού Χρόνου

Πρότυπο περιφερειακής ολίσθησης για ψηφιακά. Std ) Δημήτρης Νικολός, Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής, Παν.

Οργάνωση επεξεργαστή (1 ο μέρος) ΜΥΥ-106 Εισαγωγή στους Η/Υ και στην Πληροφορική

Διπλωματική Εργασία. Επιβλέπων καθηγητής: Δρ. Μηνάς Δασυγένης. Πανεπιστήμιο Δυτικής Μακεδονίας Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών

Τμήμα Λογιστικής. Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές. Μάθημα 8. 1 Στέργιος Παλαμάς

«Σχεδιασμός Ψηφιακών Συστημάτων σε FPGA» Εαρινό εξάμηνο Διάλεξη 8 η : Μηχανές Πεπερασμένων Κaταστάσεων σε FPGAs

ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 1

Αρχιτεκτονική Υπολογιστών

Στοιχεία αρχιτεκτονικής μικροεπεξεργαστή

Αρχιτεκτονική Υπολογιστών

Είναι το «μυαλό» του υπολογιστή μας. Αυτός κάνει όλους τους υπολογισμούς και τις πράξεις. Έχει δική του ενσωματωμένη μνήμη, τη λεγόμενη κρυφή

Αρχιτεκτονική υπολογιστών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Το ολοκληρωμένο κύκλωμα μιας ΚΜΕ. «Φέτα» ημιαγωγών (wafer) από τη διαδικασία παραγωγής ΚΜΕ

Οργάνωση Υπολογιστών (ΙI)

Το υλικό του υπολογιστή

Κεφάλαιο 3 Αρχιτεκτονική Ηλεκτρονικού Τμήματος (hardware) των Υπολογιστικών Συστημάτων ΕΡΩΤΗΣΕΙΣ ΑΣΚΗΣΕΙΣ

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Απόδοση ΚΜΕ. (Μέτρηση και τεχνικές βελτίωσης απόδοσης)

ΗΥ220 Εργαστήριο Ψηφιακών Κυκλωμάτων

ΠΕΡΙΓΡΑΦΗ ΥΛΙΚΟΥ AVR 1. ΕΙΣΑΓΩΓΗ 1.1 ΓΕΝΙΚΗ ΔΟΜΗ 1.2 ΟΙΚΟΓΕΝΕΙΕΣ 1.3 ΤΥΠΟΙ 1.4 ΕΡΓΑΛΕΙΑ

Μνήμη και Προγραμματίσιμη Λογική

ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ ΟΡΓΑΝΩΣΗ Η/Υ

ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΩΤΑΠΑΝΤΗΣΕΙΣ

Βασίλειος Κοντογιάννης ΠΕ19

ΗΥ220 Εργαστήριο Ψηφιακών Κυκλωμάτων

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση)

ΗΜΥ 210 ΣΧΕΔΙΑΣΜΟΣ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. Χειµερινό Εξάµηνο 2016 ΔΙΑΛΕΞΗ 15: Καταχωρητές (Registers)

Ενσωματωμένα Συστήματα

Βασικές έννοιες. Αναλογικό Βίντεο. Ψηφιακό Βίντεο. Κινούμενα γραφικά (animation)( Πλαίσιο (frame, καρέ) Ρυθμός πλαισίων (frame rate)

Αρχιτεκτονική Η/Υ Το chipset ενός υπολογιστικού συστήματος. Δρ. Μηνάς Δασυγένης

Περίληψη. ΗΜΥ-210: Λογικός Σχεδιασµός Εαρινό Εξάµηνο Παράδειγµα: Καταχωρητής 2-bit. Καταχωρητής 4-bit. Μνήµη Καταχωρητών

Ηλεκτρονικοί Υπολογιστές Δ Εξάμηνο

ΗΥ220: Εργαστήριο σχεδίασης ψηφιακών κυκλωμάτων Χριστόφορος Κάχρης

ΕΙΔΙΚΟΤΗΤΑ: ΤΕΧΝΙΚΟΣ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Κύρια μνήμη. Μοντέλο λειτουργίας μνήμης. Ένα τυπικό υπολογιστικό σύστημα σήμερα. Οργάνωση Υπολογιστών (ΙI)

ΤΙΤΛΟΣ ΕΡΓΑΣΤΗΡΙΑΚΗΣ ΑΣΚΗΣΗΣ ΣΕΙΡΙΑΚΗ ΠΡΟΣΘΕΣΗ

Υλικό Υπολογιστών (Hardware) ΜΥΥ-106 Εισαγωγή στους Η/Υ και Πληροφορική

Ενσωµατωµένα Συστήµατα

Κεφάλαιο 7 Ιεραρχία Μνήμης (Memory Hierarchy)

Ενσωματωμένα Συστήματα

Τεχνολογία Δικτύων Επικοινωνιών (Ενότητα Πρωτόκολλα και Αρχιτεκτονική Δικτύου)

«Σχεδιασμός Ψηφιακών Συστημάτων σε FPGA» Εαρινό εξάμηνο

ΗΜΥ 210: Σχεδιασμός Ψηφιακών Συστημάτων. Καταχωρητές 1

Δομημένος Προγραμματισμός

Αρχιτεκτονική Υπολογιστών

Τεχνολογίες Κύριας Μνήμης

ΣΤΑΤΙΚΕΣ ΚΑΙ ΔΥΝΑΜΙΚΕΣ ΜΝΗΜΕΣ ΤΥΧΑΙΑΣ ΠΡΟΣΠΕΛΑΣΗΣ (Static and Dynamic RAMs). ΔΙΑΡΘΡΩΣΗ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΘΕΜΑΤΙΚΕΣ ΕΝΟΤΗΤΕΣ

ε. Ένα κύκλωμα το οποίο παράγει τετραγωνικούς παλμούς και απαιτείται εξωτερική διέγερση ονομάζεται ασταθής πολυδονητής Λ

5 η Θεµατική Ενότητα : Μνήµη & Προγραµµατιζόµενη Λογική. Επιµέλεια διαφανειών: Χρ. Καβουσιανός

Συστήματα σε Ολοκληρωμένα Κυκλώματα

i Throughput: Ο ρυθμός ολοκλήρωσης έργου σε συγκεκριμένο χρόνο

Συστήματα VLSI. Εισαγωγή. Γιώργος Δημητρακόπουλος. Δημοκρίτειο Πανεπιστήμιο Θράκης. Άνοιξη 2014

ΔΙΑΧΥΤΑ ΚΑΙ ΕΝΣΩΜΑΤΩΜΕΝΑ ΣΥΣΤΗΜΑΤΑ

i Όλες οι σύγχρονες ΚΜΕ είναι πολυπλοκότερες!

Ι ΑΣΚΩΝ ΚΑΘΗΓΗΤΗΣ: ΚΑΘΗΓΗΤΗΣ ΕΦΑΡΜΟΓΩΝ. ΤΕΙ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Υπάρχουσες εφαρμογές:

Τέτοιες λειτουργίες γίνονται διαμέσου του

i Στα σύγχρονα συστήματα η κύρια μνήμη δεν συνδέεται απευθείας με τον επεξεργαστή

Με τον όρο μνήμη αναφερόμαστε στα μέσα που χρησιμοποιούνται για την αποθήκευση προγραμμάτων και δεδομένων σε έναν υπολογιστή ή άλλη ψηφιακή

ΑΣΚΗΣΗ 8 ΚΑΤΑΧΩΡΗΤΕΣ - REGISTERS

Μικροεπεξεργαστές - Μικροελεγκτές Ψηφιακά Συστήματα

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

ΗΛΕΚΤΡΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΤΕΣ

Βασικές Έννοιες της Πληροφορικής

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 5

Θέματα Διπλωματικών Εργασιών

Τηλεπικοινωνιακά Συστήματα ΙΙ

Ιεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

26-Nov-09. ΗΜΥ 210: Λογικός Σχεδιασμός, Χειμερινό Εξάμηνο Καταχωρητές 1. Διδάσκουσα: Μαρία Κ. Μιχαήλ

«Σχεδιασμός Ψηφιακών Συστημάτων σε FPGA» Εαρινό εξάμηνο

Μάθημα 3.2: Κεντρική Μονάδα Επεξεργασίας

Παρουσίαση Διπλωματικής

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Σχεδίαση Ψηφιακών Συστημάτων. Ενότητα: ΚΑΤΑΧΩΡΗΤΕΣ - ΑΠΑΡΙΘΜΗΤΕΣ

Βασικές Σχεδίασης Υπολογιστών Αριθμητική Μονάδα Επεξεργασίας Κεφάλαιο 10

Transcript:

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Σχεδιασμός και Υλοποίηση Επιταχυντή Υλικού για τον Αλγόριθμο Εκτίμησης Κίνησης Εξαντλητικής Αναζήτησης Θωμάς Ι. Μακρυνιώτης Επιβλέπων: Δρ. Μηνάς Δασυγένης Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών Εργαστήριο Ψηφιακών Συστημάτων και Αρχιτεκτονικής Υπολογιστών http://arch.icte.uowm.gr

Outline Καθορισμός του προβλήματος Περιγραφή της λύσης Θεωρητικό υπόβαθρο Σχεδιασμός του συστήματος Λογισμικό Έλεγχος του συστήματος Αποτελέσματα - Συμπεράσματα

Καθορισμός του Προβλήματος Κωδικοποίηση/Συμπίεση Video Σύγχρονες μορφές συμπίεσης Δειγματοληψία Εκτίμηση Κίνησης (Motion Estimation) Αντιστάθμιση Κίνησης (Motion Compensation) Εκτίμηση Κίνησης: Η διαδικασία κατά την οποία υπολογίζεται η μεταβολή της θέσης τμημάτων ενός καρέ σε σχέση με τα επόμενα / προηγούμενα Εξαιρετικά Πολύπλοκη Διαδικασία!

Καθορισμός του Προβλήματος FSME: Full-Search Motion Estimation Algorithm (Εξαντλητική Αναζήτηση) Για τον υπολογισμό των διανυσμάτων κίνησης απαιτείται τεράστια υπολογιστική ισχύς κατανάλωση ενέργειας Ασύμφορη η υλοποίησή του σε software για CPU γενικής χρήσης Συμπίεση video υψηλής ποιότητας (ΗD, 4Κ) σε πραγματικό χρόνο από συσκευές όπως smartphones, φορητές κάμερες κλπ ;

Περιγραφή της Λύσης Δημιουργία ενός κυκλώματος ειδικού σκοπού, με μοναδική λειτουργία την εκτέλεση του FSME Χρήση VHDL Χρήση του κυκλώματος ως επιταχυντή / συνεπεξεργαστή σε ενσωματωμένο σύστημα Βελτίωση της ταχύτητας υπολογισμού των MVs σε βαθμό τέτοιο ώστε να επιτρέπεται η χρήση του για real-time κωδικοποίση

Θεωρητικό Υπόβαθρο Συμπίεση εικόνας Συσχετισμός μεταξύ γειτονικών pixel DCT (Discrete Cosine Tranform) - JPEG Chrominance Downsampling DPCM (Differential Pulse-Code Modulation) DEFLATE PNG Χωρικός Πλεονασμός (Spatial Redundancy)

Θεωρητικό Υπόβαθρο Συμπίεση video Κοινά χαρακτηριστικά με την εικόνα Motion-JPEG Χρονικός πλεονασμός (Temporal Redundancy) Ρυθμός: Καρέ / Δευτερόλεπτο

Διάνυσμα Κίνησης

Θεωρητικό Υπόβαθρο * 30 FPS 1 Frame ανα ~33ms

Αρχιτεκτονική του Επιταχυντή Η βασική αρχιτεκτονική προτάθηκε στο παρελθόν από άλλους ερευνητές (Olivares et al) Ο επιταχυντής αποτελείται από 5 μονάδες: Τοπική μονάδα μνήμης Μονάδα Υπολογισμού SAD Συγκριτής Μνήμη Διανυσμάτων Κίνησης Μονάδα Ελέγχου

Διάγραμμα της Αρχιτεκτονικής

Μονάδα Τοπικής Μνήμης Η μονάδα τοπικής μνήμης αποτελείται από δύο υπομονάδες: τον αποπολυπλέκτη δεδομένων (data demux) και τη μονάδα μνήμης Demux Δρομολογεί τα δεδομένα είτε κατευθείαν στη μονάδα SAD είτε στην τοπική μνήμη για αποθήκευση Μονάδα μνήμης Αποτελείται από τρεις υπομνήμες και πρακτικά πρόκειται για ένα register-file

Μονάδα Τοπικής Μνήμης Κάθε υπομνήμη αποτελείται από ενα 16 16 register file Κάθε register έχει data width των 8-bits, οπότε, μπορεί να αποθηκεύσει την τιμή ενός pixel σε διαβαθμίσεις του γκρι (greyscale) Οι υπομνήμες αποθηκεύουν ένα τμήμα από την περιοχή αναζήτησης των 32 32 pixel Raster scan και σύγκριση με το current block η υπόλοιπη περιοχή αναζήτησης φορτώνεται γραμμη-προς-γραμμη. 13

Περιοχή Αναζήτησης 14

Επαναχρησιμοποίηση Δεδομένων Κύριο πλεονέκτημα της αρχιτεκτονικής μηχανισμός επαναχρησιμοποίησης δεδομένων Ο μηχανισμός προσπέλασης είναι πρακτικά ένας εσωτερικός μετρητής που επιτρέπει την προσπέλαση κάθε στήλης θέτοντας απλώς την αντίστοιχη τιμή Η εγγραφή και η ανάγνωσή γίνονται με έναν ιδιαίτερο τρόπο, γραμμή-προς-γραμμή και στήλη προς στήλη Επαναχρησιμοποίηση δεδομένων χρησιμοποιώντας έξυπνο dataflow 15

Μονάδα Υπολογισμού SAD Δύο διαφορετικά submodules: Absolute Difference Processor & Adder Tree Κριτήριο SAD: Ο AD Processor παράγει ένα concatenated διάνυσμα των 2048 bit. Οι παραχθείσες τιμές πρέπει να αθροιστούν μ'εναν πολύ γρήγορο τρόπο Ο Αθροιστής Δέντρου αποτελείται κυρίως από 4:2 compressors και μερικούς πλήρεις αθροιστές γενικής χρήσης 16

Στοιχείο Επεξεργασίας 17

Αθροιστής Δέντρου Λειτουργεί σε block των 16 x 16 ( σπάει το διάνυσμα των 2048 bit σε ομάδες των 16 x 16 x 8-bit) Ο υπολογισμός κάθε block γίνεται ξεχωριστά και παράλληλα με τα υπόλοιπα Τελικό output: 16-bit τιμή 18

Μονάδα Σύγκρισης Η μονάδα συγκρίνει το καινούργιο SAD που παράχθηκε (και τη θέση στην οποία εντοπίστηκε) με το προηγούμενο, το οποίο βρίσκεται αποθηκευμένο σε έναν εσωτερικό καταχωρητή, μετά τη συγκριση του current block με κάποιο άλλο reference block. Αν η τιμή του νέου SAD < τιμή του παλιού SAD, τότε την κρατάμε, διαφορετικά απορρίπτεται. Η θέση του SAD υπολογίζεται από έναν εσωτερικό μετρητή που αυξάνει σε κάθε κύκλο ρολογιού. Output: 11-bit position signal 19

Μνήμη Διανυσμάτων Κίνησης FIFO 1395 11-bit registers 20

Μονάδα Ελέγχου Ιδιαίτερα περίπλοκο σύστημα, το σημαντικότερο του κυκλώματος Ελέγχει όλα τα σήματα που διακινούνται μέσα στον επιταχυντή Αποτελείται από: - Incremental counter - Signal controller State machine Incremental counter αυξάνει μέχρι την τιμή 400'h πριν το reset 21

Αρχιτεκτονική του Ενσωματωμένου Συστήματος Το σύστημα που σχεδιάστηκε περιλαμβάνει τον επιταχυντή και την ARM CPU Περιλαμβάνει επίσης λογική που επιτρέπει την επικοινωνία μεταξύ των components και τη μεταφορά δεδομένων Αυτή η glue logic βασίζεται στο πρωτόκολλο AXI όπως όλα τα συγχρονα ARM SoC 22

AMBA AXI Advanced Microcontroller Bus Architecture Το σύστημα ZYNQ χρησιμοποιεί την τρίτη γενιά του AMBA AXI bus (AXI4) Στοχεύει σε high-performance, high clock frequency designs Κάθε περιφερειακό σχεδιασμένο για χρήση με το ZYNQ, θα πρέπει να επικοινωνεί πάνω από τον κοινό AXI bus, για βέλτιστη απόδοση 23

24

AXI Protocols Υπάρχουν πολλά διαφορετικά flavors της διασύνδεσης AXI: - AXI4: Έκδοση για memory-mapped, highperformance IP - AXI4-Lite: Υποσύνολο του AXI4. Απλές, μονές μεταδόσεις μεταξύ memory mapped IP - AXI4-Stream: Non-memory mapped IP που απαιτούν υψηλές ταχύτητες διαμεταγωγής, και συνεχή ροή δεδομένων 25

AXI4 - Stream Ο επιταχυντής που υλοποιήσαμε είναι ακριβώς εκείνος ο τύπος IP που απαιτεί συνεχόμενη και ταχύτατη ροή δεδομένων Το AXI4-Stream είναι μια εξαιρετική επιλογή για πρωτόκολλο διασύνδεσης. Χρησιμοποιεί δύο σήματα συγχρονισμού, VALID και READY Κύρια χρήση: DMA Controller 26

Direct Memory Access Από τη στιγμή που απαιτούμε real-time κωδικοποίηση video, η απόκριση του συστήματος πρέπει να είναι ταχύτατη. Για το λόγο αυτό επιλέξαμε να χρησιμοποιήσουμε μια μηχανή DMA προκειμένου να επιταχύνουμε τη διαμεταγωγή των δεδομένων Συγκεκριμένα χρησιμοποιήσαμε το Xilinx AXI DMA IP σε Scatter-Gather mode, προκειμένου να επιτύχουμε περαιτέρω επιτάχυνση 27

Λογισμικό Eλέγxος λειτουργικότητας του συστήματος TCL Scripts & Bare metal C applications Παρόλα αυτα προκειμένου να δημιουργήσουμε ένα ολοκληρωμένο ενσωματωμένο σύστημα, κάναμε compile και εγκαταστήσαμε το PetaLinux μαζί με τους Xilinx DMA drivers User-space application χρήση του kernel driver επικοινωνία με IP 28

Έλεγχος του Συστήματος VHDL Testbenches Integrated Logic Analyzers TCL Scripts 29

ModelSim Testbenches 30

Αποτελέσματα Max op. frequency (theoretical) : 111,895 MHz - Απροβλημάτιστη λειτουργία στα 112 MHz Για μεγαλύτερα clock speeds setup time violations Design area ~ 26% της συνολικής FPGA 31

Αποτελέσματα XILINX VIVADO POWER REPORT Total On-Chip Power (W) 1,735 Dynamic (W) 1,576 Device Static (W) 0,159 Effective TJA (C/W) 11,5 MAX Ambient (C) 65,0 Junction Temperature (C) 45,0 Thermal Margin (C) 39,7 On-Chip Power (W) Clocks 0,03 Signals 0,005 Slice Logic 0,004 PS7 1,532 Static Power 0,159 Total 1,735 32

FPGA Area Utilization Report Site Type Used Available Utilization % Slice LUTs 13912 53200 26,15 LUT as Logic 12041 53200 22,63 LUT as Memory 1871 17400 10,75 LUT FF Pairs 17141 53200 32,22 Slice Registers 11525 106400 10,83 Block RAM Tiles 3 140 2,14 F7 Muxes 232 26600 0,87 F8 Muxes 88 13300 0,66 Συγκρίσιμη υλοποίηση με αυτή που προτάθηκε στο "Highspeed Motion Estimation Architecture for Real-time Video Transmission" των Goel et al Τα επιπλέον ~900 LUTs, οφείλονται σε άλλα συστήματα (DMA, AXI controllers, etc) 33

Επιτάχυνση Η υλοποίηση στο hardware είναι πάνω από 21 φορές γρηγορότερη σε σχέση με τη βέλτιστη υλοποίηση σε software

Συμπεράσματα Ο σχεδιασμός και η υλοποίηση αυτού του ενσωματωμένου συστήματος απέδειξε τη δυνατότητα σχεδιασμού ετερογενών συστημάτων υψηλών επιδόσεων. Χρήση της ισχύος των νέων SoCs για την κατασκευή ακόμα καλύτερων ψηφιακών συστημάτων με πολύ μεγαλύτερες δυνατότητες. Επιταχυντές Πολύ πιθανό ενδεχόμενο για το μέλλον του everyday computing, ειδικά σε processing-intensive applications 35

Μελλοντικές Επεκτάσεις Σχεδιασμός και υλοποίηση πολυπλοκότερων, εξειδικευμένων ενσωματωμένων συστημάτων, με έμφαση στη χαμηλή κατανάλωση ισχύος Implement greater level of data reuse Σχεδιασμός ενός upscaled version, με στόχο τα Ultra-High Definition (HEVC) encoding standards. 36

That's all Folks! Ο κώδικας και το documentation του project βρίσκονται στο: https://github.com/tommakrin/brenda Ευχαριστώ για την προσοχή σας! 37