Κατηγοριοποίηση πυκνότητας κίνησης εθνικών οδών με χαμηλή υπολογιστική πολυπλοκότητα

Σχετικά έγγραφα
ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

Μοντέλο οικιστικής ανάπτυξης πρόγνωση της ζήτησης σε επίπεδο πόλης. Ε. Ρόζος και Χ. Μακρόπουλος

ΑΝΙΧΝΕΥΣΗ ΦΩΤΙΑΣ. Χαοτικό φαινόμενο, με ακανόνιστο σχήμα Βασικό χαρακτηριστικό της φωτιάς είναι το χρώμα

Gemini, FastMap, Applications. Εαρινό Εξάμηνο Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών

Προχωρημένες Εργασίες

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Anomaly Detection with Neighborhood Preservation Principle

ΕΥΡΕΣΗ ΤΟΥ ΔΙΑΝΥΣΜΑΤΟΣ ΘΕΣΗΣ ΚΙΝΟΥΜΕΝΟΥ ΡΟΜΠΟΤ ΜΕ ΜΟΝΟΦΘΑΛΜΟ ΣΥΣΤΗΜΑ ΟΡΑΣΗΣ

Area Location and Recognition of Video Text Based on Depth Learning Method

Τεχνολογία Ψυχαγωγικού Λογισμικού και Εικονικοί Κόσμοι Ενότητα 8η - Εικονικοί Κόσμοι και Πολιτιστικό Περιεχόμενο

ΠΑΝΕΠΙΤΗΜΙΟ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Ανάκτηση πολυμεσικού περιεχομένου

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j

Διακριτικές Συναρτήσεις

ER-Tree (Extended R*-Tree)

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o

Υπολογιστικές μέθοδοι για την ανάλυση της πληροφορίας των εικόνων και την κατανόηση του περιεχομένου

Τα σύγχρονα συστήματα υποστήριξης του οδηγού. Γιώργος Γιαννής Λέκτορας, ΕΜΠ

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

(Α.Σ.ΠΑΙ.Τ.Ε.) ΠΑΡΑΔΟΤΕΟ Δ3-5_3 1 ΕΠΙΣΤΗΜΟΝΙΚΗ ΕΡΓΑΣΙΑ ΣΕ ΔΙΕΘΝΕΣ ΕΠΙΣΤΗΜΟΝΙΚΟ ΣΥΝΕΔΡΙΟ. Vocational Technology Enhanced Learning (VocTEL) 2015

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Detection and Recognition of Traffic Signal Using Machine Learning

MIDI [8] MIDI. [9] Hsu [1], [2] [10] Salamon [11] [5] Song [6] Sony, Minato, Tokyo , Japan a) b)

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ

Εισαγωγικά για την αναγνώριση έκφρασης προσώπου (Facial Expression Recognition)

Automatic extraction of bibliography with machine learning

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Χρήση συστημάτων πληροφορικής στην οδική υποδομή

Μέθοδοι Βιοκινητικών Μετρήσεων

Ranking the importance of real-time traffic and weather variables when examining crash injury severity

Αναγνώριση Προτύπων. Μη παραμετρικές τεχνικές Αριθμητικά. (Non Parametric Techniques)

Ανάκτηση Εικόνας βάσει Υφής με χρήση Eye Tracker

Αναγνώριση Προτύπων Ι

ΣΥΓΚΡΙΤΙΚΗ ΑΝΑΛΥΣΗ ΣΥΜΠΕΡΙΦΟΡΑΣ ΝΕΩΝ ΟΔΗΓΩΝ ΣΕ ΣΥΝΘΗΚΕΣ ΚΑΝΟΝΙΚΕΣ ΚΑΙ ΠΡΟΣΟΜΟΙΩΣΗΣ ΣΕ ΑΣΤΙΚΗ ΟΔΟ. Δανάη Βουτσινά

Μηχανουργική Τεχνολογία ΙΙ

Ολοκληρωμένο σύστημα υποστήριξης γυναικολόγου κατά την υστεροσκοπική εξέταση

Πτυχιακή Εργασι α «Εκτι μήσή τής ποιο τήτας εικο νων με τήν χρή σή τεχνήτων νευρωνικων δικτυ ων»

Πληροφοριακά Συστήματα Διοίκησης

Ειδικές Επιστηµονικές Εργασίες

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «ΕΝΤΟΠΙΣΜΟΣ ΑΝΤΙΚΕΙΜΕΝΩΝ ΑΠΟ ΠΟΛΛΑΠΛΕΣ ΚΑΜΕΡΕΣ»

An Automatic Modulation Classifier using a Frequency Discriminator for Intelligent Software Defined Radio

Application of a novel immune network learn ing algorithm to fault diagnosis

Χωρική Ανάλυση Συμπεριφοράς Ασφάλειας Οδηγών με Δεδομένα από Έξυπνα Κινητά Τηλέφωνα

On line αλγόριθμοι δρομολόγησης για στοχαστικά δίκτυα σε πραγματικό χρόνο

Ο νοσηλευτικός ρόλος στην πρόληψη του μελανώματος

ΤΕΧΝΙΚΕΣ ΚΑΤΑΓΡΑΦΗΣ ΣΥΝΑΙΣΘΗΜΑΤΩΝ (EMOTIONS) ΑΠΟ ΤΗ ΧΡΗΣΗ ΠΟΛΥΜΕΣΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ. Ελένη Καλκοπούλου. στα πλαίσια του μαθήματος Πολυμέσα (ΓΤΠ61)

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

GPGPU. Grover. On Large Scale Simulation of Grover s Algorithm by Using GPGPU

Στοιχεία εισηγητή Ημερομηνία: 10/10/2017

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μια «ανώδυνη» εισαγωγή στο μάθημα (και στο MATLAB )

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

[5] F 16.1% MFCC NMF D-CASE 17 [5] NMF NMF 3. [5] 1 NMF Deep Neural Network(DNN) FUSION 3.1 NMF NMF [12] S W H 1 Fig. 1 Our aoustic event detect

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

[1] DNA ATM [2] c 2013 Information Processing Society of Japan. Gait motion descriptors. Osaka University 2. Drexel University a)

Ζωντανό Εργαστήριο Thessaloniki Active and Healthy Ageing Living Lab Παρακολούθηση ατόμων στο σπίτι σε πραγματικό χρόνο

Speed-0 Παρουσίαση Φυσικού Αντικειμένου

No. 7 Modular Machine Tool & Automatic Manufacturing Technique. Jul TH166 TG659 A

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ ΠΜΣ «ΠΛΗΡΟΦΟΡΙΚΗ & ΕΠΙΚΟΙΝΩΝΙΕς» OSWINDS RESEARCH GROUP

ΕΚΘΕΣΗ ΠΡΟΟ ΟΥ Υποψήφιος ιδάκτορας: Ιωάννης Κυριαζής

Online Social Networks: Posts that can save lives. Sotiria Giannitsari April 2016

(Υπογραϕή) (Υπογραϕή) (Υπογραϕή)

Συστήµατα και Αλγόριθµοι Πολυµέσων

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Θερμοδυναμική - Εργαστήριο

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

ΣΥΓΚΡΙΤΙΚΗ ΑΝΑΛΥΣΗ ΣΥΜΠΕΡΙΦΟΡΑΣ ΝΕΩΝ ΟΔΗΓΩΝ ΣΕ ΣΥΝΘΗΚΕΣ ΚΑΝΟΝΙΚΕΣ ΚΑΙ ΠΡΟΣΟΜΟΙΩΣΗΣ ΣΕ ΥΠΕΡΑΣΤΙΚΗ ΟΔΟ ΝΙΚΑΣ ΜΑΡΙΟΣ

Μεταπτυχιακό Πρόγραμμα Σπουδών Ολοκληρωμένα Συστήματα Υλικού και Λογισμικού

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

CSJ. Speaker clustering based on non-negative matrix factorization using i-vector-based speaker similarity

Γραφικά με υπολογιστές

ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΕΠΙΡΡΟΗΣ ΤΗΣ ΟΔΗΓΗΣΗΣ ΤΗ ΝΥΧΤΑ ΣΤΗ ΣΥΜΠΕΡΙΦΟΡΑ ΚΑΙ ΣΤΗΝ ΑΣΦΑΛΕΙΑ ΤΩΝ ΝΕΩΝ ΟΔΗΓΩΝ ΣΤΙΣ ΠΟΛΕΙΣ ΜΕ ΤΗ ΧΡΗΣΗ ΠΡΟΣΟΜΟΙΩΤΗ ΟΔΗΓΗΣΗΣ

DECO-DECoration Ontology.

I student. Μεθοδολογική προσέγγιση και απαιτήσεις για την ανάπτυξη των αλγορίθμων δρομολόγησης Χρυσοχόου Ευαγγελία Επιστημονικός Συνεργάτης ΙΜΕΤ

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He

Ημερίδα διάχυσης αποτελεσμάτων έργου Ιωάννινα, 14/10/2015

Εφαρμογή Υπολογιστικών Τεχνικών στην Γεωργία

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Παραμετρική ανάλυση του συντελεστή ανάκλασης από στρωματοποιημένο πυθμένα δύο στρωμάτων με επικλινή διεπιφάνεια 1

Χαρακτηρισµός Νεοπλασµάτων στη Μαστογραφία από το Σχήµα της Παρυφής µε χρήση Νευρωνικών ικτύων

HOSVD. Higher Order Data Classification Method with Autocorrelation Matrix Correcting on HOSVD. Junichi MORIGAKI and Kaoru KATAYAMA

Εργαστήριο Επεξεργασίας Σηµάτων και Τηλεπικοινωνιών Κινητά ίκτυα Επικοινωνιών

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Αυτοαξιολόγηση και Οδική Συμπεριφορά

Indexing Methods for Encrypted Vector Databases

ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ. Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα

ΠΡΟΤYΠΟ ΠΕΙΡΑΜΑΤΙΚΟ ΓΕΝΙΚΟ ΣΧ. ΕΤΟΣ : ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

9. O Προσομοιωτής Κβαντικού Υπολογιστή QCS

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ ΠΜΣ «ΠΛΗΡΟΦΟΡΙΚΗ & ΕΠΙΚΟΙΝΩΝΙΕΣ» OSWINDS RESEARCH GROUP

Quick algorithm f or computing core attribute

Adaptive grouping difference variation wolf pack algorithm

ΜΕΛΕΤΗ ΤΗΣ ΔΥΝΑΜΙΚΗΣ ΝΑΝΟΣΥΝΘΕΤΩΝ ΥΛΙΚΩΝ ΠΟΛΥΜΕΡΟΥΣ/ΓΡΑΦΕΝΙΟΥ ΜΕ ΧΡΗΣΗ ΛΕΠΤΟΜΕΡΩΝ ΑΤΟΜΙΣΤΙΚΩΝ ΠΡΟΣΟΜΟΙΩΣΕΩΝ

D. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110, 2004.

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

Transcript:

Κατηγοριοποίηση πυκνότητας κίνησης εθνικών οδών με χαμηλή υπολογιστική πολυπλοκότητα Στέργιος Πουλαράκης Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Πανεπιστήμιο Θεσσαλίας Βόλος, Ελλάδα stpoular@inf.uth.gr Ιωάννης Κατσαβουνίδης Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Πανεπιστήμιο Θεσσαλίας Βόλος, Ελλάδα ioannis.k@inf.uth.gr Περίληψη Στην παρούσα εργασία, προτείνουμε μια νέα μέθοδο για κατηγοριοποίηση της πυκνότητας κίνησης σε εθνικές οδούς και σε δρόμους υψηλής κυκλοφορίας από τυπικά βίντεο καταγραφής κυκλοφοριακής κίνησης. Η μέθοδός μας παρουσιάζει χαμηλή υπολογιστική πολυπλοκότητα, καθώς βασίζεται σε γρήγορες τεχνικές εκτίμησης κίνησης σε βίντεο και σε ολιστικές παραμέτρους περιγραφής της κίνησης των οχημάτων. Στα πειράματά μας σε μια δημόσια διαθέσιμη βάση βίντεο, εξερευνούμε διάφορες πλευρές του συστήματός μας, όπως η ακρίβεια κατηγοριοποίησης, η υπολογιστική πολυπλοκότητα και η ευαισθησία σε παραμέτρους καθοριζόμενες από τον χρήστη. Τα αποτελέσματά μας αποδεικνύουν την υψηλή αποδοτικότητα και αποτελεσματικότητα του συστήματος μας στην κατηγοριοποίηση κίνησης. Abstract In this work, we propose a novel approach for classification of highway traffic congestion from traffic video scenes, based on dynamic motion information. Our approach is computationally efficient, relying on fast motion estimation techniques and holistic parameters to describe the global vehicle motion in the video scene. In our experiments, we explore various aspects of our system, involving classification accuracy, computational efficiency and sensitivity to basic user defined parameters. Our experimental results on a publicly available dataset show high efficiency and state of the art classification. Keywords Traffic congestion, traffic video, motion estimation. I. ΕΙΣΑΓΩΓΗ Η αυτόματη ανάλυση της κυκλοφοριακής κίνησης σε δρόμους έχει πολλαπλά οφέλη όσον αφορά την ασφάλεια της οδικής κυκλοφορίας. Στην παρούσα εργασία, εστιάζουμε στην κατηγοριοποίηση της πυκνότητας κίνησης σε εθνικές οδούς και σε δρόμους υψηλής κυκλοφορίας από τυπικά βίντεο καταγραφής κυκλοφοριακής κίνησης. Τα αποτελέσματα της ανάλυσής μας θα μπορούσαν να αποδειχθούν χρήσιμα τόσο για την συλλογή στατιστικών δεδομένων κίνησης, όσο και για λήψη αποφάσεων πραγματικού χρόνου σχετικά με τον έλεγχο και ανακατεύθυνση της κίνησης από τα αρμόδια όργανα της Τροχαίας. Παράλληλα, μια πληροφορία αυτού του είδους θα μπορούσε να χρησιμοποιηθεί και από έξυπνους πλοηγούς οδήγησης (navigators) κατά την διάρκεια υπολογισμού της συντομότερης διαδρομής προς έναν δεδομένο προορισμό. Το πρόβλημα της κατηγοριοποίησης κυκλοφοριακής κίνησης έχει πρόσφατα απασχολήσει αρκετά την ερευνητική κοινότητα. Κάποια πρώιμα συστήματα [1, 2, 3] αντιμετώπισαν τα οχήματα ως κινούμενα αντικείμενα και χρησιμοποίησαν τεχνικές αφαίρεσης υποβάθρου σκηνής (background subtraction) και καταμέτρησης αντικειμένων. Αντίθετα, κάποιες πιο πρόσφατες εργασίες [4-7] υιοθέτησαν μια ολιστική προσέγγιση, αντιμετωπίζοντας την σκηνή του βίντεο σαν σύνολο. Η μέθοδος μας εμπίπτει στην δεύτερη κατηγορία, καθώς εξάγουμε πληροφορία από ολόκληρη την σκηνή χωρίς να χρησιμοποιούμε κάποια τεχνική ανίχνευσης αντικειμένων. Πιο συγκεκριμένα, αναπαριστούμε την κίνηση ως ένα σύνολο διανυσμάτων κίνησης (motion vectors), τα οποία εξάγουμε χρησιμοποιώντας γρήγορες τεχνικές εκτίμησης και ανίχνευσης κίνησης (motion estimation). Στην ενότητα 2 κάνουμε μια σύντομη ανασκόπηση των κυριότερων εργασιών που είναι σχετικές με κατηγοριοποίηση κίνησης. Στην ενότητα 3 περιγράφουμε αναλυτικά την μέθοδό μας. Στην ενότητα 4 περιγράφουμε την βάση δεδομένων που χρησιμοποιήσαμε και παρουσιάζουμε τα πειραματικά μας αποτελέσματα. Τέλος, στην ενότητα 5 καταγράφουμε τα συμπεράσματά μας και περιγράφουμε κάποιους στόχους μελλοντικής εργασίας. II. ΒΙΒΛΙΟΓΡΑΦΙΚΗ ΕΠΙΣΚΟΠΗΣΗ Οι προσεγγίσεις κατηγοριοποίησης κίνησης μπορούν να ομαδοποιηθούν σε δύο κατηγορίες [5, 7], τις μικροσκοπικές (microscopic) και τις μακροσκοπικές ή ολιστικές (holistic). Οι μικροσκοπικές μέθοδοι αντιμετωπίζουν έναν πληθυσμό ως μια συλλογή από αντικείμενα και χρησιμοποιούν τεχνικές αφαίρεσης υποβάθρου σκηνής (background subtraction) και ανίχνευσης αντικειμένων με σκοπό την κατάτμηση, παρακολούθηση και καταμέτρηση των κινούμενων οχημάτων. Η αποτελεσματικότητα των παραπάνω μεθόδων εξαρτάται έντονα από την ποιότητα της κατάτμησης αντικειμένων και επηρεάζεται από τις συνθήκες φωτισμού, την χαμηλή ανάλυση της κάμερας λήψης και τον συνολικό αριθμό οχημάτων στην σκηνή. Μια αναλυτική περιγραφή των μικροσκοπικών μεθόδων [8-10] είναι διαθέσιμη από τους Asmaa κ.α. [1]. 46

Εικόνα 1. Ένα τυπικό καρέ από το dataset που χρησιμοποιήσαμε. Το κόκκινο τεράγωνο είναι το ROI μέσα στο οποίο καταγράφουμε τα χαρακτηριστικά κίνησης. Αντίθετα, οι ολιστικές μέθοδοι αντιμετωπίζουν έναν πληθυσμό ως μια ενιαία οντότητα, την οποία περιγράφουν μέσω καθολικών παραμέτρων, χωρίς να χρειάζεται να πραγματοποιηθεί κατάτμηση αντικειμένων. Οι Chan και Vasconcelos [4] μοντελοποίησαν την κυκλοφοριακή κίνηση ως δυναμική υφή (dynamic texture), η οποία υλοποιείται από μια στοχαστική διαδικασία αυτοπαλινδρόμησης (autoregressive stochastic process) και περιλαμβάνει μια μεταβλητή κρυφής κατάστασης για την περιγραφή της κίνησης και μια μεταβλητή παρατήρησης για την χωρική περιγραφή της σκηνής. Για την τελική κατηγοριοποίηση της κίνησης χρησιμοποίησαν μια μηχανή διανυσμάτων υποστήριξης (Support Vector Machine - SVM), πετυχαίνοντας 94.5 % ακρίβεια. Οι Derpanis και Wildes [5] χρησιμοποίησαν τον κατηγοριοποιητή πλησιέστερου γείτονα (Nearest Neighbor classifier) και τον συντελεστή Bhattacharyya για την σύγκριση χωροχρονικών ιστογραμμάτων, βελτιώνοντας την ακρίβεια σε 95.28%. Οι Sobral, Oliveira, Schnitman και Souza [6] περιέγραψαν την κίνηση με δύο ολιστικές παραμέτρους, την μέση πυκνότητα κίνησης και την ταχύτητα του πληθυσμού οχημάτων. Για την κατηγοριοποίηση έλεγξαν διάφορες μεθόδους, με τα Νευρωνικά Δίκτυα (Multi-Layer Neural Networks) να αποδίδουν καλύτερα (94.5% ακρίβεια). Οι Asmaa, Mokhtar και Abdelaziz [7] πραγματοποίησαν μια σύγκριση μεταξύ μικροσκοπικών και μακροσκοπικών παραμέτρων. Τα αποτελέσματά τους δείξανε ότι απλές μακροσκοπικές παράμετροι, όπως η μέση πυκνότητα κίνησης και την ταχύτητα του πληθυσμού οχημάτων, υπερτερούν των μικροσκοπικών, βελτιώνοντας την ακρίβεια κατηγοριοποίησης σε 96.37%. III. Η ΜΕΘΟΔΟΣ ΜΑΣ Στην παρούσα ενότητα περιγράφουμε αναλυτικά τα στάδια της μεθόδου μας, τα οποία περιλαμβάνουν την εξαγωγή χαρακτηριστικών από το βίντεο (feature extraction) και την κατηγοριοποίηση πυκνότητας κίνησης. A. Περιοχή ενδιαφέροντος (Region of Interest - ROI) Καθώς η σκηνή λήψης του βίντεο μπορεί να περιλαμβάνει και αρκετά σημεία εκτός δρόμου, το πρώτο μας βήμα περιλαμβάνει τον καθορισμό μιας περιοχής ενδιαφέροντος (Region of Interest - ROI), όπως φαίνεται στην Εικόνα 1. Ο καθορισμός του ROI γίνεται από εξειδεικευμένο τεχνικό Εικόνα 2. Τα πρότυπα μικρού και μεγάλου διαμαντιού που χρησιμοποιούν οι γρήγοροι αλγόριθμοι εκτίμησης κίνησης, Diamond Search και PMVFAST. Black circles denote the points where SAD will be computed. προσωπικό που μεταβαίνει στην περιοχή παρακολούθησης. Η χρήση του ROI είναι αρκετά συχνή στην βιβλιογραφία [4-6]. B. Γρήγορη εκτίμηση κίνησης(fast Motion Estimation) Οι τεχνικές εκτίμησης κίνησης που χρησιμοποιούμε, χωρίζουν κάθε βίντεο καρέ (frame) σε τετράγωνα blocks μεγέθους 16x16 pixels. Για κάθε block, υπολογίζουν ένα διάνυσμα κίνησης (motion vector), v = (Δx, Δy), όπου Δx, Δy οι μετατοπίσεις στον οριζόντιο και κάθετο άξονα αντίστοιχα, σε σχέση με κάποιο προηγούμενο καρέ αναφοράς (reference frame). Καθώς υπάρχουν πολλά πιθανά διανύσματα κίνησης, επιλέγεται εκείνο που ελαχιστοποιεί το σφάλμα αθροιστικών διαφορών (Sum of Absolute Differences - SAD) μεταξύ των δύο blocks: SAD(Δx, Δy) = x=0:p-1 y=0:p-1 curr(x,y) - ref(x - Δx, y - Δy) (1) όπου τα curr και ref δηλώνουν το τρέχον frame και το frame αναφοράς αντίστοιχα. Ο πιο απλός και αργός αλγόριθμος εκτίμησης κίνησης είναι ο Full Search (FS), ο οποίος ψάχνει όλες τις δυνατές θέσεις γύρω από κάθε block. Λόγω της σημασίας της εκτίμησης κίνησης στην συμπίεση βίντεο, έχουν αναπτυχθεί διάφοροι γρήγοροι αλγόριθμοι, όπως ο Diamond Search [11] και ο Predictive Motion Vector Field Adaptive Search Technique (PMVFAST) [12], τους οποίους και χρησιμοποιούμε στην μέθοδό μας. Οι αλγόριθμοι αυτοί βασίζονται στην εξέταση ενός διαμαντιού σημείων γύρω από κάθε block (Εικόνα 2). Ο PMVFAST εφαρμόζει κάποια επιπλέον κριτήρια (heuristics) προκειμένου να σταματήσει ακόμη πιο γρήγορα την διαδικασία ελέγχου υποψήφιων διανυσμάτων. C. Χαρακτηριστικά περιγραφής κίνησης Η μέθοδος μας χρησιμοποιεί δύο ολιστικές παραμέτρους περιγραφής κίνησης: 1. Μέση ταχύτητα κίνησης, την οποία υπολογίζουμε ως το μέσο πλάτος των μη μηδενικών διανυσμάτων κίνησης 2. Πυκνότητα κίνησης, την οποία υπολογίζουμε ως το ποσοστό των μη μηδενικών διανυσμάτων κίνησης μέσα στο ROI. 47

TABLE I. ΑΚΡΙΒΕΙΑ ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗΣ (%) ΜΕΘΟΔΟΣ ΑΚΡΙΒΕΙΑ (%) Full Search 96.85 Diamond Search 96.06 PMVFAST 96.85 Chan et al. [4] 94.50 Derpanis et al. [5] 95.28 Sobral et al. [6] 94.50 Asmaa et al. [7] 96.37 Τα χαρακτηριστικά αυτά είναι παρόμοια με εκείνα που χρησιμοποιούν οι Asmaa, Mokhtar και Abdelaziz [7]. D. Κατηγοριοποίηση πυκνότητας κίνησης Η τελική κατηγοριοποίηση πυκνότητας κίνησης βασίζεται στην χρήση των μηχανών διανυσμάτων υποστήριξης (Support Vector Machines - SVMs) [13]. Τα SVMs είναι γραμμικοί δυαδικοί κατηγοριοποιητές, βελτιστοποιημένοι ώστε να αφήνουν το μέγιστο δυνατό περιθώριο μεταξύ δύο κλάσεων. Αν υπάρχουν περισσότερες από δύο πιθανές κλάσεις, χρησιμοποιούνται συνδυαστικά σχήματα, όπως το 1-vs-1 ή το 1-vs-all [14]. Στην περίπτωσή μας επιλέξαμε το σχήμα 1-vs-1, το οποίο υποστηρίζεται από την βιβλιοθήκη LibSVM [15] που χρησιμοποιούμε. IV. ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ Στην παρούσα ενότητα περιγράφουμε την βάση δεδομενων (dataset) που χρησιμοποιήσαμε και τα πειραματικά μας αποτελέσματα. A. Βάση δεδομένων UCSD Highway Traffic και πειραματικό πλαίσιο Για τα πειράματά μας χρησιμοποιήσαμε την βάση δεδομένων UCSD Highway Traffic [4], η οποία περιέχει βίντεο από δρόμους κυκλοφορίας υψηλής ταχύτητας (εθνικές οδοί). Η βάση αυτή περιέχει 254 βίντεο, διάρκειας 20 λεπτών συνολικά και καταγράφηκε στο Seattle, WA, USA. Τα βίντεο έχουν ληφθεί από κάμερα σταθερής γωνίας θέασης, σε ανάλυση 320x240 (QVGA) και με ρυθμό 10 fps. Κάθε βίντεο περιέχει περίπου 50 frames. Υπάρχουν τρεις τύποι καιρικών συνθηκών: 1. Καθαρή μέρα (clear sky) 2. Συννεφιά (overcast) 3. Βροχή (rain) Υπάρχουν επίσης τρεις τύποι πυκνότητας κίνησης, τις οποίες κατηγοριοποιούμε στα πειράματά μας: 1. Αραιή κίνηση (light) 2. Μέτρια πυκνή κίνηση (medium) 3. Πυκνή κίνηση (heavy) Εικόνα 2. Γραφική αναπαράσταση των χαρακτηριστικών περιγραφής κίνησης (πυκνότητα κίνησης μέση ταχύτητα) για κάθε τύπο πυκνότητας κίνησης που εξετάζουμε στα πειράματά μας. Παρατηρούμε πως οι τρεις κατηγορίες είναι γραμμικά διαχωρίσιμες με μικρή πιθανότητα λάθους, γεγονός που αποτυπώνεται και στα πειραματικά μας αποτελέσματα (Πίνακες Ι - ΙΙ). Αξίζει να σημειωθεί ότι σε 13 βίντεο η ποιότητα της εικόνας είναι αρκετά χαμηλή, λόγω των σταγόνων βροχής στον φακό της κάμερας λήψης. Οι Chan και Vasconcelos [4] χρησιμοποίησαν 4 διαφορετικούς τρόπους χωρισμού της βάσης σε δεδομένα εκπαίδευσης και ελέγχου (training and testing data), σε αναλογία 75:25. Παρόμοια με προηγούμενες εργασίες [5-7], ακολουθούμε την ίδια τακτική και στα δικά μας πειράματα. B. Αποτελέσματα κατηγοριοποίησης Ο πίνακας Ι δείχνει την ακρίβεια κατηγοριοποίησης για κάθε μια από τις τρεις τεχνικές εκτίμησης κίνησης που χρησιμοποιήσαμε: Full Search, Diamond Search και PMVFAST. Παρατηρούμε πως ο PMVFAST αποδίδει το ίδιο καλά με τον κατά πολύ πιο αργό του Full Search, ενώ ο Diamond Search έρχεται τρίτος. Και στις τρεις περιπτώσεις, η ακρίβεια κατηγοριοποίησης είναι αρκετά υψηλή (>96%). Αποδίδουμε την απόδοση αυτή στα χαρακτηριστικά περιγραφής κίνησης που χρησιμοποιούμε, τα οποία διαχωρίζουν πολύ καλά τις τρεις κατηγορίες πυκνότητας κίνησης, όπως φαίνεται και στην Εικόνα 2. Ground Truth/Πρόβλεψη TABLE II. ΠΊΝΑΚΑΣ ΣΥΓΧΥΣΗΣ light medium heavy light 164 0 1 medium 2 40 3 heavy 0 2 42 48

Εικόνα 3. Οι δύο πρώτες επιλογές ROI που χρησιμοποιήσαμε στα πειράματά μας (Α - Β). Εικόνα 4. Δύο επιπλέον επιλογές ROI που χρησιμοποιήσαμε στα πειράματά μας (Γ - Δ). Συγκρίνοντας με τις προηγούμενες εργασίες [4-7], βλέπουμε πως τα ολιστικά χαρακτηριστικά που χρησιμοποιούμε, σε συνδυασμό με τα SVM, είναι ικανά για να δώσουν state-of-the-art ακρίβεια κατηγοριοποίησης. Αξίζει να σημειωθεί πως η εργασία των Asmaa, Mokhtar και Abdelaziz [7] χρησιμοποίησε παρόμοια χαρακτηριστικά και SVM, αλλά έλεγξε μόνο τον αλγόριθμο Full Search. Αποδίδουμε την παρατηρούμενη βελτίωση στην ακρίβεια κατηγοριοποίησης στην χρήση του ROI, το οποίο μειώνει κατά πολύ τον θόρυβο από άλλους παράγοντες (κίνηση στο αντίθετο ρεύμα κυκλοφορίας, κίνηση στον ουρανό, καιρικά φαινόμενα, κ.α.). Αντίθετα, οι Asmaa, Mokhtar και Abdelaziz χρησιμοποίησαν μια τεχνική αυτόματης ανίχνευσης δρόμου, η οποία προσθέτει επιπλέον υπολογιστικό κόστος. Εξετάζοντας τον πίνακα σύγχυσης (confusion matrix), παρατηρούμε πως τα περισσότερα λάθη προκύπτουν μεταξύ γειτονικών κλάσεων (Πίνακας ΙΙ). Η μόνη εξαίρεση παρατηρείται στην σύγχυση μεταξύ αραιής και πυκνής κίνησης. Εξερευνώντας τις συγκεκριμένες περιπτώσεις είδαμε ότι πρόκειται για βίντεο που είτε δεν έχουν σχεδόν καθόλου οχήματα είτε τα οχήματα κινούνται πολύ αργά. Καθώς και στις δυο περιπτώσεις τα μη μηδενικά διανύσματα είναι πολύ λίγα, η σύγχυση είναι μάλλον αναμενόμενη. C. Ευαισθησία στην επιλογή του ROI Η μέθοδός μας βασίζεται στην χρήση μιας περιοχής ενδιαφέροντος (Region of Interest - ROI), μέσα στην οποία υπολογίζονται και εξετάζονται τα χαρακτηριστικά περιγραφής της κίνησης των οχημάτων. Παρόλο που ο καθορισμός του ROI γίνεται από εξειδεικευμένο τεχνικό προσωπικό, που μεταβαίνει στην περιοχή παρακολούθησης, είναι σχεδόν βέβαιο πως διαφορετικοί άνθρωποι θα επιλέξουν ελαφρώς διαφορετικα ROI. Οι διαφορές μπορεί να παρατηρηθούν κυρίως στο μέγεθος και τη θέση του ROI. Προκειμένου να εξετάσουμε την ευαισθησία του συστήματός μας στην επιλογή του ROI, εκτελέσαμε ξανά τα πειράματά μας, θεωρώντας τρία επιπλέον ROI, τα οποία είναι ελαφρώς μετατοπισμένα από το αρχικό, και αλλαγμένα σε μέγεθος (Εικόνες 3-4). Εξετάσαμε δύο πιθανά σενάρια χρήσης: 1. Χρησιμοποιείται το ίδιο ROI τόσο στην φάση εκπαίδευσης (training) όσο και στην φάση ελέγχου (testing) του συστήματος. 2. Χρησιμοποιείται αρχικό μας ROI στην φάση εκπαίδευσης (training) και ένα διαφορετικό στην φάση ελέγχου (testing) του συστήματος. Τα αποτελέσματά μας φαίνονται στον Πίνακα ΙΙΙ. Παρατηρούμε πως στο πρώτο σενάριο, η ακρίβεια κατηγοριοποίησης μεταβάλλεται ελαφρά (κατά 1%), ανάλογα με την ποιότητα του επιλεγμένου ROI. Στο δεύτερο σενάριο αντίθετα, παρατηρούμε πιο σοβαρές μειώσεις (3%), οι οποίες είναι αναμενόμενες καθώς δεν υπάρχει πλήρης συμφωνία μεταξύ δεδομένων ελέγχου και εκπαίδευσης. Παρολαυτά, ακόμη και σε αυτήν την περίπτωση, η ακρίβεια κατηγοριοποίησης παραμένει υψηλή (>93%). D. Υπολογιστική αποδοτικότητα Υλοποιήσαμε το σύστημά μας σε γλώσσα C και σε περιβάλλον Microsoft Visual Studio 2010. Εξετάζοντας την υπολογιστική αποδοτικότητα του συστήματός μας, παρατηρήσαμε πως το πιο χρονοβόρο στοιχείο είναι η εκτίμηση κίνησης. Η χρήση των γρήγορων αλγορίθμων Diamond Search και PMVFAST έδωσε μια αρκετά μεγάλη επιτάχυνση σε σχέση με τον βαρύτερο αλγόριθμο, Full Search. Για επιπλέον επιτάχυνση, χρησιμοποιήσαμε τις εντολές SIMD-SSE2 (Single Instruction Multiple Data Streaming SIMD Extensions 2), οι οποίες υποστηρίζονται από όλους τους σύγχρονους επεξεργαστές της Intel [16]. Οι εντολές αυτές προσφέρουν την δυνατότητα επιτάχυνσης του υπολογισμού του SAD (Εξίσωση 1), το οποίο αποτελεί και το βαρύτερο στοιχείο όλων των αλγορίθμων εκτίμησης κίνησης. Στον Πίνακα IV παρουσιάζουμε τα αποτελέσματά μας αναλυτικά, δηλαδή τον μέσο χρόνο εκτέλεσης ανά βίντεο καρέ (frame) και την αντίστοιχη επιτάχυνση σε σχέση με τον TABLE III. ROI ΕΚΠΑΙΔΕΥΣΗΣ ΕΥΑΙΣΘΗΣΙΑ ΣΤΗΝ ΕΠΙΛΟΓΗ ΤΟΥ ROI ROI ΕΛΕΓΧΟΥ ΑΚΡΙΒΕΙΑ ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗΣ Α Α 96.85 Β Β 96.5 C C 95.67 D D 96.85 A Α 96.85 Α Β 93.70 A C 93.31 A D 95.28 49

TABLE IV. ΥΠΟΛΟΓΙΣΤΙΚΗ ΑΠΟΔΟΤΙΚΟΤΗΤΑ Μέθοδος Υλοποίηση σε C Υλοποίηση σε SSE2 Χρόνος Επιτάχυνση Χρόνος Επιτάχυνση (ms) (ms) Full 27.84 1x 8.61 3.2x Search Diamond 0.93 29.8x 0.41 67.7x Search PMV FAST 0.32 87.0x 0.13 182.7x χρόνο του Full Search. Παρατηρούμε πως οι γρήγοροι αλγόριθμοι Diamond Search και PMVFAST καταναλώνουν ελάχιστο χρόνο σε σχέση με τον Full Search και είναι κατάλληλοι για χρήση σε συστήματα ελέγχου πραγματικού χρόνου. Επιπλέον, η επιτάχυνση τους είναι ακόμη μεγαλύτερη όταν χρησιμοποιούμε τις εντολές SSE2. V. ΣΥΜΠΕΡΑΣΜΑΤΑ ΚΑΙ ΜΕΛΛΟΝΤΙΚΗ ΕΡΓΑΣΙΑ Στην παρούσα εργασία παρουσιάσαμε ένα σύστημα κατηγοριοποίησης της κίνησης σε εθνικές οδούς και σε δρόμους υψηλής κυκλοφορίας από τυπικά βίντεο καταγραφής κυκλοφοριακής κίνησης. Η μέθοδός μας βασίζεται στην εξαγωγή ολιστικών παραμέτρων κίνησης, χρησιμοποιώντας γρήγορες τεχνικές εκτίμησης κίνησης. Τα πειραματικά μας αποτελέσματα απέδειξαν την υψηλή ακρίβεια κατηγοριοποίησης που πετυχαίνει το σύστημά μας και την χαμηλή ευαισθησία σε παραμέτρους καθοριζόμενες από τον χρήστη. Τα αποτελέσματα της ανάλυσής μας θα μπορούσαν να αποδειχθούν χρήσιμα τόσο για την συλλογή στατιστικών δεδομένων κίνησης, όσο και για λήψη αποφάσεων πραγματικού χρόνου σχετικά με τον έλεγχο και ανακατεύθυνση της κίνησης από τα αρμόδια όργανα της Τροχαίας. Οι στόχοι μελλοντικής μας εργασίας περιλαμβάνουν την εξέταση περισσότερων βάσεων δεδομένων και την εξέταση άλλων χαρακτηριστικών κίνησης. VI. ACKNOWLEDGMENT This research has been co-financed by the European Union (European Social Fund ESF) and Greek national funds through the Operational Program "Education and Lifelong Learning" of the National Strategic Reference Framework (NSRF) - Research Funding Program: ARCHIMEDES III. Investing in knowledge society through the European Social Fund. H παρούσα έρευνα έχει συγχρηματοδοτηθεί από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο - ΕΚΤ) και από εθνικούς πόρους μέσω του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» του Εθνικού Στρατηγικού Πλαισίου Αναφοράς (ΕΣΠΑ) Ερευνητικό Χρηματοδοτούμενο Έργο: ΑΡΧΙΜΗΔΗΣ ΙΙΙ. Επένδυση στην κοινωνία της γνώσης μέσω του Ευρωπαϊκού Κοινωνικού Ταμείου. REFERENCES [1] Y.-K. Jung, K.-W. Lee, and Y.-S. Ho, Content based event retrieval using semantic scene interpretation for automated traffic surveillance, IEEE Trans. on Intelligent Transportation Systems, vol. 2, no. 3, pp. 151 163, 2001. [2] R. Cucchiara, M. Piccardi, and P. Mello, Image analysis and rule-based reasoning for a traffic monitoring system, IEEE Trans. on Intelligent Transportation Systems, vol. 1, no. 2, pp. 119 130, 2000. [3] B. Maurin, O. Masoud, and N. Papanikolopoulos, Monitoring crowded traffic scenes, in IEEE Int l Conf. on Intelligent Transportation Systems, 2002, pp. 19 24. [4] A. Chan and N. Vasconcelos, Classification and retrieval of traffic video using auto-regressive stochastic processes, in IEEE Intelligent Vehicles Symposium, pp. 771 776, 2005. [5] K. Derpanis and R. Wildes, Classification of traffic video based on a spatiotemporal orientation analysis, in IEEE Workshop on Applications of Computer Vision (WACV), 2011, pp. 606 613. [6] A. Sobral, L. Oliveira, L. Schnitman, and F. Souza, Highway traffic congestion classification using holistic properties, in 10th Int l Conf. on Signal Processing, Pattern Recognition and Applications (IASTED), 2013. [7] Q. Asmaa, K. Mokhtar, and O. Abdelaziz, Road traffic density estimation using microscopic and macroscopic parameters, Image and Vision Computing, vol. 31, no. 11, pp. 887 894, 2013. [8] J. Kim, C. W. Lee, K. M. Lee, T. S. Yun, and H. Kim, Wavelet-based vehicle tracking for automatic traffic surveillance, in IEEE Int l Conf. on Electrical and Electronic Technology, vol. 1, 2001, pp. 313 316 vol.1. [9] F. Bardet and T. Chateau, Mcmc particle filter for real-time visual tracking of vehicles, in IEEE Int l Conf. on Intelligent Transportation Systems, 2008, pp. 539 544. [10] L. Huang and M. Barth, Real-time multi-vehicle tracking based on feature detection and color probability model, in IEEE Intelligent Vehicles Symposium, 2010, pp. 981 986. [11] S. Zhu and K.-K. Ma, A new diamond search algorithm for fast block matching motion estimation, IEEE Transactions on Image Processing, vol. 9, no. 2, pp. 287 290, 2000. [12] A. M. Tourapis, O. C. Au, and M. L. Liou, Predictive Motion Vector Field Adaptive Search Technique (PMVFAST) enhancing block based motion estimation, in SPIE Conf. Visual Communications and Image Processing, 2001, pp. 883 892. [13] C. Cortes and V. Vapnik, Support-vector networks, Machine learning, vol. 20, no. 3, pp. 273 297, 1995. [14] C.-W. Hsu and C.-J. Lin, A comparison of methods for multiclass support vector machines, IEEE Trans. on Neural Networks, vol. 13, no. 2, pp. 415 425, 2002. [15] C.-C. Chang and C.-J. Lin, LIBSVM: A library for Support Vector Machines, ACM Transactions on Intelligent Systems and Technology, vol. 2, pp. 27:1 27:27, 2011. [16] Intel Corporation, Intel 64 and IA 32 ArchitecturesSoftware Developer s Manual, September 2013, http://www.intel.com/content/dam/www/public/us/en/documents/manual s/64-ia-32-architectures-software-developer-manual-325462.pdf. 50