Identifying Scenes with the Same Person in Video Content on the Basis of Scene Continuity and Face Similarity Measurement

Σχετικά έγγραφα
Detection and Recognition of Traffic Signal Using Machine Learning

Ανάκτηση Εικόνας βάσει Υφής με χρήση Eye Tracker

Πτυχιακή Εργασι α «Εκτι μήσή τής ποιο τήτας εικο νων με τήν χρή σή τεχνήτων νευρωνικων δικτυ ων»

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He

Comparison of Evapotranspiration between Indigenous Vegetation and Invading Vegetation in a Bog

D. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110, 2004.

Journal of the Institute of Science and Engineering. Chuo University

EE512: Error Control Coding

Section 8.3 Trigonometric Equations

Speeding up the Detection of Scale-Space Extrema in SIFT Based on the Complex First Order System

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

ST5224: Advanced Statistical Theory II

MIDI [8] MIDI. [9] Hsu [1], [2] [10] Salamon [11] [5] Song [6] Sony, Minato, Tokyo , Japan a) b)

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ "ΠΟΛΥΚΡΙΤΗΡΙΑ ΣΥΣΤΗΜΑΤΑ ΛΗΨΗΣ ΑΠΟΦΑΣΕΩΝ. Η ΠΕΡΙΠΤΩΣΗ ΤΗΣ ΕΠΙΛΟΓΗΣ ΑΣΦΑΛΙΣΤΗΡΙΟΥ ΣΥΜΒΟΛΑΙΟΥ ΥΓΕΙΑΣ "

*,* + -+ on Bedrock Bath. Hideyuki O, Shoichi O, Takao O, Kumiko Y, Yoshinao K and Tsuneaki G

VBA Microsoft Excel. J. Comput. Chem. Jpn., Vol. 5, No. 1, pp (2006)

TMA4115 Matematikk 3

Buried Markov Model Pairwise

Reaction of a Platinum Electrode for the Measurement of Redox Potential of Paddy Soil

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o

ES440/ES911: CFD. Chapter 5. Solution of Linear Equation Systems

ΜΕΛΕΤΗ ΑΠΟΤΙΜΗΣΗΣ ΠΑΡΑΓΟΜΕΝΗΣ ΕΝΕΡΓΕΙΑΣ Φ/Β ΣΥΣΤΗΜΑΤΩΝ ΕΓΚΑΤΕΣΤΗΜΕΝΩΝ ΣΕ ΕΛΛΑ Α ΚΑΙ ΤΣΕΧΙΑ

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Βίντεο (Video) Περιεχόµενα. Βιβλιογραφία. Καγιάφας [2000]: Κεφάλαιο 5, [link]

ΠΕΡΙΕΧΟΜΕΝΑ. Κεφάλαιο 1: Κεφάλαιο 2: Κεφάλαιο 3:

ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙO ΑΘΗΝΩΝ ΤΜΗΜΑ ΑΞΙΟΠΟΙΗΣΗΣ ΦΥΣΙΚΩΝ ΠΟΡΩΝ & ΓΕΩΡΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ

Approximation of distance between locations on earth given by latitude and longitude

Επιβλέπουσα Καθηγήτρια: ΣΟΦΙΑ ΑΡΑΒΟΥ ΠΑΠΑΔΑΤΟΥ

Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1

ΕΚΤΙΜΗΣΗ ΤΟΥ ΚΟΣΤΟΥΣ ΤΩΝ ΟΔΙΚΩΝ ΑΤΥΧΗΜΑΤΩΝ ΚΑΙ ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΠΑΡΑΓΟΝΤΩΝ ΕΠΙΡΡΟΗΣ ΤΟΥ

IMES DISCUSSION PAPER SERIES

Study of In-vehicle Sound Field Creation by Simultaneous Equation Method

2 Composition. Invertible Mappings

Instruction Execution Times

[1] P Q. Fig. 3.1

Μηχανική Μάθηση Hypothesis Testing

Homework 8 Model Solution Section

An Automatic Modulation Classifier using a Frequency Discriminator for Intelligent Software Defined Radio

ER-Tree (Extended R*-Tree)

Μεταπτυχιακή διατριβή. Ανδρέας Παπαευσταθίου

ΓΕΩΜΕΣΡΙΚΗ ΣΕΚΜΗΡΙΩΗ ΣΟΤ ΙΕΡΟΤ ΝΑΟΤ ΣΟΤ ΣΙΜΙΟΤ ΣΑΤΡΟΤ ΣΟ ΠΕΛΕΝΔΡΙ ΣΗ ΚΤΠΡΟΤ ΜΕ ΕΦΑΡΜΟΓΗ ΑΤΣΟΜΑΣΟΠΟΙΗΜΕΝΟΤ ΤΣΗΜΑΣΟ ΨΗΦΙΑΚΗ ΦΩΣΟΓΡΑΜΜΕΣΡΙΑ

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

«ΑΝΑΠΣΤΞΖ ΓΠ ΚΑΗ ΥΩΡΗΚΖ ΑΝΑΛΤΖ ΜΔΣΔΩΡΟΛΟΓΗΚΩΝ ΓΔΓΟΜΔΝΩΝ ΣΟΝ ΔΛΛΑΓΗΚΟ ΥΩΡΟ»

Maxima SCORM. Algebraic Manipulations and Visualizing Graphs in SCORM contents by Maxima and Mashup Approach. Jia Yunpeng, 1 Takayuki Nagai, 2, 1

Jesse Maassen and Mark Lundstrom Purdue University November 25, 2013

Other Test Constructions: Likelihood Ratio & Bayes Tests

(C) 2010 Pearson Education, Inc. All rights reserved.

Bundle Adjustment for 3-D Reconstruction: Implementation and Evaluation

Strain gauge and rosettes

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΠΟΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΒΙΟΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΣΤΗΜΗΣ ΤΡΟΦΙΜΩΝ. Πτυχιακή εργασία

Επεξεργασία πειραματικών αποτελεσμάτων

Math 6 SL Probability Distributions Practice Test Mark Scheme

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

Areas and Lengths in Polar Coordinates

n 1 n 3 choice node (shelf) choice node (rough group) choice node (representative candidate)

Areas and Lengths in Polar Coordinates

Εφαρμογές της τεχνολογίας επίγειας σάρωσης Laser στις μεταφορές

ΤΜΗΜΑ ΦΥΣΙΚΩΝ ΠΟΡΩΝ & ΠΕΡΙΒΑΛΛΟΝΤΟΣ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ. «Θεσμικό Πλαίσιο Φωτοβολταïκών Συστημάτων- Βέλτιστη Απόδοση Μέσω Τρόπων Στήριξης»

Retrieval of Seismic Data Recorded on Open-reel-type Magnetic Tapes (MT) by Using Existing Devices

Η Διδακτική Ενότητα «Γνωρίζω τον Υπολογιστή», στα πλαίσια των Προγραμμάτων Σπουδών της Πληροφορικής: μια Μελέτη Περίπτωσης.

[1] DNA ATM [2] c 2013 Information Processing Society of Japan. Gait motion descriptors. Osaka University 2. Drexel University a)

ΣΙΣΛΟ ΓΙΑΣΡΙΒΗ ΔΞΑΓΧΓΗ ΥΑΡΑΚΣΗΡΙΣΙΚΧΝ ΔΙΚΟΝΟΠΛΑΙΙΧΝ ΑΠΟ ΑΚΟΛΟΤΘΙΔ ΒΙΝΣΔΟ ΜΔ ΥΡΗΗ ΟΜΑΓΟΠΟΙΗΗ ΠΟΛΛΑΠΛΧΝ ΟΦΔΧΝ ΜΔΣΑΠΣΤΥΙΑΚΗ ΔΡΓΑΙΑ ΔΞΔΙΓΙΚΔΤΗ

Statistical Inference I Locally most powerful tests

CSJ. Speaker clustering based on non-negative matrix factorization using i-vector-based speaker similarity

ΚΛΙΜΑΤΟΛΟΓΙΑ CLIMATOLOGY

Example Sheet 3 Solutions

Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit

6.1. Dirac Equation. Hamiltonian. Dirac Eq.

Study of urban housing development projects: The general planning of Alexandria City

Μεταπτυχιακή διατριβή

Physical and Chemical Properties of the Nest-site Beach of the Horseshoe Crab Rehabilitated by Sand Placement

Numerical Analysis FMN011

ΕΦΑΡΜΟΓΗ ΕΥΤΕΡΟΒΑΘΜΙΑ ΕΠΕΞΕΡΓΑΣΜΕΝΩΝ ΥΓΡΩΝ ΑΠΟΒΛΗΤΩΝ ΣΕ ΦΥΣΙΚΑ ΣΥΣΤΗΜΑΤΑ ΚΛΙΝΗΣ ΚΑΛΑΜΙΩΝ

ECON 381 SC ASSIGNMENT 2

Dong Liu State Key Laboratory of Particle Detection and Electronics University of Science and Technology of China

Homomorphism in Intuitionistic Fuzzy Automata

DESIGN OF MACHINERY SOLUTION MANUAL h in h 4 0.

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ (ΣΔΟ) ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΚΑΙ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής

c Key words: cultivation of blood, two-sets blood culture, detection rate of germ Vol. 18 No

Αλγοριθµική και νοηµατική µάθηση της χηµείας: η περίπτωση των πανελλαδικών εξετάσεων γενικής παιδείας 1999

Εγκατάσταση λογισμικού και αναβάθμιση συσκευής Device software installation and software upgrade

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

* ** *** *** Jun S HIMADA*, Kyoko O HSUMI**, Kazuhiko O HBA*** and Atsushi M ARUYAMA***

Neutralization E#ects of Acidity of Rain by Cover Plants on Slope Land

Τ.Ε.Ι. ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΔΗΜΟΣΙΩΝ ΣΧΕΣΕΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΣ

Σχέση µεταξύ της Μεθόδου των ερµατοπτυχών και της Βιοηλεκτρικής Αντίστασης στον Υπολογισµό του Ποσοστού Σωµατικού Λίπους

Homework 3 Solutions

The challenges of non-stable predicates

HIV HIV HIV HIV AIDS 3 :.1 /-,**1 +332

Resurvey of Possible Seismic Fissures in the Old-Edo River in Tokyo

Partial Differential Equations in Biology The boundary element method. March 26, 2013

Cross sectional area, square inches or square millimeters

Transcript:

Identifying Scenes with the Same Person in Video Content on the Basis of Scene Continuity and Face Similarity Measurement Tatsunori Hirai, Tomoyasu Nakano, Masataka Goto and Shigeo Morishima Abstract We present a method that can automatically annotate when and who is appearing in a video stream that is shot in an unstaged condition. Previous face recognition methods were not robust against different shooting conditions, such as those with variable lighting, face directions, and other factors, in a video stream and had difficulties identifying a person and the scenes the person appears in. To overcome such difficulties, our method groups consecutive video frames (scenes) into clusters that each have the same person s face, which we call a facial-temporal continuum, and identifies a person by using many video frames in each cluster. In our experiments, accuracy with our method was approximately two or three times higher than a previous method that recognizes a face in each frame. 3 1. 2011 11 30 2012 4 11 2012 5 23 169-8555 3-4-1 TEL 03-5286-3510 305-8568 1-1-1 TEL 029-861-2130 Faculty of Science and Engineering, Waseda University (3-4-1, Ohkubo, Shinjuku-ku, Tokyo 169-8555, Japan) National Institute of Advanced Industrial Science and Technology (AIST) (1-1-1, Umezono, Tsukuba-shi, Ibaraki 305-8568, Japan) 1 JST CREST

2. 2. 1 1) TRECVID 2) TREC Video Retrieval Evaluation Bag-of-Features MKL-SVN TRECVID2010 TRECVID2010 3) TRECVID 4)5) 2. 2 3. 3 3. 5 1 3. 6 3. 1

1 The image of facial-temporal continuum. 1 2 3. 1 2 ➀ 2 ➁ ➂ 2 ➃ ➄ 2 ➅ 2 Outline of the method. 3. 1 1 N i(i =1 N) I H i (I) 1 1 D(H i,h i+1 ) D(H i,h i+1 )= I H i+1 (I) H i (I) H i+1 (I)+H i (I) (1) D(H i,h i+1 ) 3 0 +2

4 Example of face detection and detected facial feature points (green plots). 3 An example of transition of shot detection feature in a video stream. 3. 2 Active Structure Appearance Model ASAM 6) 7) ASAM ASAM Active Appearance Model AAM Active Shape Model ASM ASAM ASAM 31 4 4 ASAM 3. 3 I 1 I 2 Sum of Squared Difference(SSD R SSD = width i (I 1 (i, j) I 2 (i, j)) 2 (2) height j R SSD 2 SSD 2

5 3 Adjusting face direction by reconstructing 3D face form. 3. 4 3 3. 2 ASAM 1 2 2 3 2 3 Blanz 8) Blanz 3 2 3 2 3 Blanz 2 3 5 5 5 3. 5 Histogram of Oriented Gradient HOG 9)10) HOG HOG Scale-Invariant Feature Transform Invariant SIFT 11) HOG 5 5 HOG HOG 9

1 3. 6 6 HOG HOG feature around the facial feature points and reactions to facial expression by changing cell size. 1 9 31 279 HOG 6 6 279 n n =5 2 Faces in the wild 500 12) 500

1 3. 2 3. 3 Performance of face detection and effect of tracking. [% ] [% ] Let it be / The Beatles 7073 3524 0 100.00 3610 1 99.97 Hey Jude / The Beatles 7119 3678 1 99.97 3871 1 99.97 Get Back / The Beatles 4957 848 1 99.88 935 1 99.89 Two of us / The Beatles 6136 1628 0 100.00 1717 0 100.00 The Beatles 25285 9678 2 99.98 10102 3 99.97 Can You Keep A Secret?/ 4208 1284 21 98.39 1446 39 97.37 Wait & See / 3974 2271 72 96.93 2404 98 96.08 For You / 5447 1309 7 99.47 1486 11 99.27 Final Distance / 3905 489 3 99.39 553 6 98.93 17527 5353 103 98.11 5889 154 97.45 4. 4. 1 PV Promotion Video Promotion Video The Beatles 4 Promotion Video4 8 The Beatles 4 Face in the wild 495 The Beatles 4 1 500 4. 2 3. 2 ASAM 3. 3 1 2 = (3) 1 500 The Beatles 2 Promotion Video 3 3 The Beatles 3 HOG

2 ( ) Comparison of face recognition ratios (comparison of the number of frames). [% ] [% ] The Beatles 10136 2871 6489 28.3 64.0 6043 1960 5778 32.4 95.6 3 Face recognition ratio with facial-temporal continuum. [%] The Beatles 157 30 19.1 295 271 82.0 4 Average of error rate in each facial-temporal continuum. [%] The Beatles 10136 46 0.5 6043 149 2.5 1 45.1 20.5 4 97 5 ASAM 5 Average of error rate between facial-temporal continua. [%] The Beatles 37 8 21.6 160 5 3.1 2 5. 279

2011 2010 2008 21 3 1998 2001 IPA IT 29 1987 1988 2001 2004 IT 1991 2010 1 52 12 pp.3471-3482 (2011) 2 TRECVID http://www-nlpir.nist.gov/projects/trecvid/ 3 CVIM 177 28 pp.1-8 (2011) 4 FacePassenger TM 4 3 pp.27-28 (2011) 5 3 PRMU 106 73 pp.13-18 (2006) 6 J94-D 4 pp.721-729 (2011) 7 A. Irie M. Takagiwa K. Moriyama T. Yamashita Improvements to Facial Contour Detection by Hierarchical Fitting and Regression Asian Conference on Pattern Recognition (ACPR) pp.273-277 (2011) 8 V. Blanz A. Mehl T. Vetter H. SeidelA Statistical Method for Robust 3D Surface Reconstruction from Sparse DataSymp. on 3D Data Processing Visualization and Transmission pp.293-300 (2004) 9 N. Dalal B. Triggs Histograms of Oriented gradients for human detection Proc. IEEE Conference on Computer Vision and Pattern Recognition (CVPR) pp.886-893 (2005) 10 HOG AdaBoost FPGA CPSY 110 360 pp.117-122 (2011) 11 D. G. LoweObject Recognition from Local Scale-Invariant Features Proc. IEEE International Conference on Computer vision (ICCV) pp.1150-1157 (1999) 12 T. L. Berg A. C. Berg J. Edwards D. A. ForsythWho s in the Picture Proc. Neural Information Processing Systems (NIPS) pp.137-144 (2004)