της Μαρίας Παπαδογιωργάκη Σύνθεση Νοηµατικής Γλώσσας από Κείµενο Κινήσεις 3 Μοντέλων Χεριού µε βάση το Πρότυπο MPEG-4



Σχετικά έγγραφα
Γραφικά µε Υπολογιστές. Μετασχηµατισµοί Σύνθετη Γεωµετρία

ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΓΙΑ ΤΟ ΔΙΑΔΙΚΤΥΟ

MPEG-4 : Διαδραστικές εφαρμογές πολυμέσων

ιεθνής Αερολιµένας Αθηνών Τεχνολογίες ροής δεδοµένων σε ΙΡ δίκτυα: Ένας δρόµος προς τα συστήµατα πληροφόρησης επιβατών επόµενης γενιάς

MPEG-4: Διαδραστικές εφαρμογές πολυμέσων

Κωδικοποίηση βίντεο (MPEG)

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Οδηγίες σχεδίασης στο περιβάλλον Blender

Κείμενο ASCII Unicode - HTML. Κωδικοποίηση ASCII / Unicode HTML

2. Αλγόριθμοι, δομές δεδομένων και πολυπλοκότητα

Σχεδίαση και Ανάπτυξη Ιστότοπων

ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΚΡΗΤΗΣ

Εισαγωγή στο 3DS Max 2009

Τι είναι τα πολυμέσα;

7.Α.1 Παρουσιάσεις. 7.Α.2 Περιγραφή περιεχομένων της εφαρμογής

ΕΠΛ 012 Εισαγωγή στο Παγκόσμιο Πλέγμα Πληροφοριών

Εισαγωγή. Τεχνολογία Πολυµέσων 01-1

Γραφικά με Υπολογιστές. Εισαγωγή στη VRML

Εισαγωγη στην html. Η δομή μιας ιστοσελίδας (αρχείο html) Η βασική δομή ενός αρχείου html είναι η εξής: <html> <head>

Σχεδιαστικά Προγράμματα Επίπλου

Μοντελοποίηση τρισδιάστατου κόσμου σε πραγματικό κόσμο: το παράδειγμα του Kinect. ιδάσκων: Φ. Αζαριάδης Φοιτήτρια: Άρτεμις-Αγγελική Σφύρη

Γαβαλάς αµιανός

Κεφάλαιο 7. Τρισδιάστατα Μοντέλα

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου

Μάθημα 4ο. Προγράμματα

Επεξεργασία Εικόνας. Κωδικός Πακέτου ACTA - CGD+CWD Τίτλος Πακέτου ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ - ΣΧΕ ΙΑΣΗ ΙΣΤΟΣΕΛΙ ΑΣ. Εκπαιδευτικές Ενότητες

Σχεδιάζοντας Εφαρμογές για το Διαδίκτυο

Ref.: SLWS 1 5Copyright 2005 The European Computer Driving Licence Foundation Ltd Σελίδα 1 από 7

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

To λεξικό του Internet

World Wide Web: Ο παγκόσµιος ιστός Πληροφοριών

Α ΤΑΞΗ. 1 η ΕΝΟΤΗΤΑ: Γνωρίζω τον υπολογιστή. Θα παρουσιαστεί µε τρόπο απλό και κατανοητό,

Συστήματα Πολυμέσων. Ανάπτυξη Πολυμεσικών Εφαρμογών Ι

Σχεδιάζοντας Εφαρμογές για το Διαδίκτυο

ΠΟΛΥΜΕΣΑ ΣΤΟ ΙΑ ΙΚΤΥΟ

Αρχιτεκτονική σχεδίαση με ηλεκτρονικό υπολογιστή

Εφαρμογές Πληροφορικής

ΚΕΦΑΛΑΙΟ 2. Οι Μεταβολές ως Χαρακτηριστικό Γνώρισµα της Τεχνολογίας Επικοινωνιών

ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ. Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα

Το διαδίκτυο είναι ένα δίκτυο που αποτελείτε από πολλά μικρότερα δίκτυα υπολογιστών.

Συγχρονισµός πολυµέσων

ισδιάστατοι μετασχηματισμοί ΚΕΦΑΛΑΙΟ 4: ισδιάστατοι γεωμετρικοί μετασχηματισμοί

Γλώσσες Σήµανσης (Markup Languages) Τεχνολογία ιαδικτύου και Ηλεκτρονικό Εµπόριο

Απαραίτητες αφού 3Δ αντικείμενα απεικονίζονται σε 2Δ συσκευές. Θέση παρατηρητή. 3Δ Μετασχ/σμός Παρατήρησης

Ιατρική Πληροφορική. Δρ. Π. ΑΣΒΕΣΤΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΒΙΟΪΑΤΡΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ Τ.Ε.

Περίληψη ιπλωµατικής Εργασίας

Συστήματα συντεταγμένων

Εισαγωγή στη σχεδίαση κινούμενων γραφικών

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Εικόνες και Πολυµεσικές Εφαρµογές. Ψηφιακή Επεξεργασία Εικόνας.

ΤΟΜΕΑΣ HΛΕΚΤΡΟΝΙΚΗΣ. Επαγγελματικό λογισμικό στην ΤΕΕ: Επιμόρφωση και Εφαρμογή ΣΕΜΙΝΑΡΙΟ 2

Φύλλο Κατανόησης 1.8

Δίκτυα. ΜΥΥ-106 Εισαγωγή στους Η/Υ και στην Πληροφορική

1. O FrontPage Explorer

ΜΑΘΗΜΑ: Εργαλεία Ανάπτυξης εφαρμογών internet.

Γιώργος Τζιρίτας Τµήµα Επιστήµης Υπολογιστών

ΕΡΓΑΣΤΗΡΙΑΚΗ ΕΦΑΡΜΟΓΗ 1 ΤO ΡΟΜΠΟΤ INTELLITEK ER-2u

Οπτική αντίληψη. Μετά?..

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

ΣΧΕΔΙΑΣΗ ΣΥΣΤΗΜΑΤΩΝ ΜΕ ΧΡΗΣΗ ΥΠΟΛΟΓΙΣΤΩΝ (E-CAD) ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ

ΘΕΜΑ ΑΝΑΠΤΥΞΗ ΠΟΛΥΜΕΣΙΚΗΣ ΕΦΑΡΜΟΓΗΣ ΜΕ ΘΕΜΑ : MORPHING ΚΑΙ ΕΙΚΟΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ

Προσοµοίωση λειτουργίας επικοινωνίας δεδοµένων (µόντεµ)

ΣΧΕΔΙΑΣΗ ΣΥΣΤΗΜΑΤΩΝ ΜΕ ΧΡΗΣΗ ΥΠΟΛΟΓΙΣΤΩΝ (E-CAD) ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ Χ. Βέργος Καθηγητής

Ερωτήσεις- Απαντήσεις Πολυμέσα Απο το Βιβλίο Εφαρμογές Η/Υ Α,Β,Γ Λυκείου

Τεχνολογία Πολυμέσων. Ενότητα 6: Υπερκείμενο - Υπερμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα).

Εισαγωγή στον Παγκόσμιο ιστό και στη γλώσσα Html. Χρ. Ηλιούδης

Παρουσίαση διπλωματικής εργασίας

Πρόταση Διδασκαλίας. Ενότητα: Γ Γυμνασίου. Θέμα: Δραστηριότητες Παραγωγής Λόγου Διάρκεια: Μία διδακτική περίοδος. Α: Στόχοι. Οι μαθητές/ τριες:

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

Οδηγίες Χρήσεως Ψηφιακού Αποθετηρίου Ιστοριών στην Ελληνική Νοηματική Γλώσσα (ΕΝΓ)

Εικόνες και γραφικά. Τεχνολογία Πολυµέσων 05-1

Τελικός τίτλος σπουδών:

Περιεχόμενα. Δημιουργία σύνδεσης ΤΙ ΕΙΝΑΙ ΙΣΤΟΣΕΛΙΔΕΣ ΚΑΙ ΤΙ ΤΟΠΟΘΕΣΙΕΣ ΙΣΤΟΥ Γνωριμία με μια ιστοσελίδα:... 38

TEC410 Ανάπτυξη Δικτυακών Τόπων (Δ εξάμηνο)

Χωρικές σχέσεις και Γεωμετρικές Έννοιες στην Προσχολική Εκπαίδευση

ΚΕΦΑΛΑΙΟ 1.7. Πρωτόκολλα και Αρχιτεκτονική Δικτύου

Όταν αποθηκεύετε μία παρουσίαση, την ονομάζετε και καθορίζετε πού θα την αποθηκεύσετε

Γεωργάκης Αριστείδης ΠΕ20

Εργαλεία Ανάπτυξης Εφαρμογών Internet I

Ψηφιακή τέχνη DIGITAL ART

Δημιουργία HTML5 Podcasts ΜΑΡΚΟΠΟΥΛΟΣ ΠΑΝΑΓΙΩΤΗΣ

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18

Δημοσίευση στο Διαδίκτυο

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

Μοντελοποίηση δεδομένων με UML Χρήση σε πολυμεσικές εφαρμογές

Cubitech Hellas Ακροπόλεως 24, Καλλιθέα, Αθήνα Τ.Κ , Ελλάδα, Τηλ Φαξ

Δικτυακοί τόποι. Η σχεδίαση ενός δικτυακού τόπου. Δρ. Ματθαίος Α. Πατρινόπουλος

3D FLASH ANIMATOR (3DFA)

Περιεχόµενα. 1 Tο βιβλίο "µε µια µατιά" Εισαγωγή στη Microsoft Access Γνωριµία µε τις βάσεις δεδοµένων της Access...

Βιωματικό εργαστήριο ηλεκτρονικών υπολογιστών. Οργάνωση εκπαιδευτικού υλικού με Η/Υ από δραστηριότητες στο Δημοτικό και στο Νηπιαγωγείο.

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

ΟΡΓΑΝΩΣΗ ΚΑΙ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 1: Εισαγωγή στη Διοίκηση Επιχειρήσεων

ΨΗΦΙΑΚΗΕΠΕΞΕΡΓΑΣΙΑVIDEO ΣΠΟΥ ΑΣΤΗΣ: ΠΑΣΜΑΤΖΙ ΗΣ ΙΩΑΝΝΗΣ

Ανοικτά Ψηφιακά Μαθήματα στο Πανεπιστήμιο Δυτικής Μακεδονίας

Εισαγωγή στην επιστήμη των υπολογιστών. Υλικό Υπολογιστών Κεφάλαιο 6ο ίκτυα υπολογιστών

9. Τοπογραφική σχεδίαση

Πλοήγηση www / Με τον Internet Explorer

Όμως πώς θα ορίζαμε την έννοια πληροφορία; Πώς την αντιλαμβανόμαστε;

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

Κεφάλαιο 1. Εισαγωγή στα συστήματα σχεδιομελέτης και παραγωγής με χρήση υπολογιστή computer aided design and manufacture (cad/cam)

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΉ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ιπλωµατική Εργασία της Μαρίας Παπαδογιωργάκη µε θέµα Σύνθεση Νοηµατικής Γλώσσας από Κείµενο Κινήσεις 3 Μοντέλων Χεριού µε βάση το Πρότυπο MPEG-4 Επιβλέπων καθηγητής: Μ. Γ. Στρίντζης ΘΕΣΣΑΛΟΝΙΚΗ 2003

ΠΕΡΙΕΧΟΜΕΝΑ Ευχαριστίες Κατά κύριο λόγο θα ήθελα να ευχαριστήσω τον επιβλέποντα καθηγητή µου, κύριο Μιχαήλ Γεράσιµο Στρίντζη, o οποίος µου προσέφερε την ευκαιρία να ασχοληθώ µε ένα τόσο ενδιαφέρον θέµα, να αναπτύξω και να υλοποιήσω τις ιδέες-πρωτοβουλίες µου πάνω σ αυτό. Ακόµη, θα ήθελα να ευχαριστήσω τους διδάκτορες Νίκο Σαρρή και Νίκο Γραµµαλίδη, για την εποικοδοµητική συνεργασία που είχαµε και τις πολύτιµες συµβουλές τους καθόλη τη διάρκεια της εκπόνησης της εργασίας. Επίσης θα ήθελα να ευχαριστήσω θερµά τους φίλους, που εργάζονται στον ίδιο χώρο όπου ασχολήθηκα µε την παρούσα διπλωµατική εργασία, για την συνεχή συµπάραστασή τους και την υποµονή που επέδειξαν στις δικές µου κατά καιρούς τάσεις άγχους και απογοήτευσης. Φυσικά ευχαριστώ ειλικρινά και όλους τους άλλους φίλους µου που έχουν σταθεί δίπλα µου µέχρι σήµερα και έχουν ανεχθεί από εµένα διάφορες διαθέσεις και συµπεριφορές. Ειδικά το φίλο µου Νίκο Μανουσάκη τον ευχαριστώ θερµά για την ανιδιοτελή και ακούραστη υποστήριξη που µου παρείχε τα τελευταία χρόνια, καθώς επίσης για την υποµονή που διέθεσε αντέχοντας τους παλιµπαιδισµούς και της ιδιορρυθµίες του χαρακτήρα µου. Τέλος τα λόγια είναι φτωχά για να εκφράσω τις ευχαριστίες µου προς τους δύο γονείς µου Μανόλη και Ελένη, στους οποίους αφιερώνω την εργασία µου. Τους ευχαριστώ για την τεράστια, αδιάκοπη υλική και ηθική υποστήριξη που µου έχουν προσφέρει απλόχερα τα τελευταία 25 χρόνια, όπως επίσης για την κατανόηση και την αµέριστη συµπαράσταση τους στην προσπάθεια για την επίτευξη των στόχων µου ανεξάρτητα µε το αν συµφωνούσαν µε όλες τις επιλογές µου. Σελίδα 2

ΠΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΕΧΟΜΕΝΑ... 3 1. ΕΙΣΑΓΩΓΗ... 5 1.1 Γενική Περιγραφή Του Συστήµατος Γραφής Της Νοηµατικής Γλώσσας (Sign Writing)... 5 1.2 Οργάνωση της εργασίας... 7 2. ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 KAI VRML... 11 2.1 Τo πρότυπο MPEG και η ιστορική εξελιξή του έως το MPEG-4... 11 2.2 Παράµετροι Κίνησης Σώµατος (Βaps)... 13 2.3 Περιγραφή Βap αρχείων... 21 2.4 Το πρότυπο VRML... 24 2.5 Σύνθεση Μοντέλου VRML... 26 2.6 Σύστηµα συντεταγµένων της VRML... 29 2.7 Κώδικας VRML αρχείου... 30 2.8 Ο Χάρτης Βάθους... 37 3. ΗΜΙΟΥΡΓΙΑ ΑΡΧΕΙΩΝ BAP ΚΑΙ VRML ΜΕΣΩ ΤΙΜΩΝ ΑΠΟ ΦΟΡΜΑ... 39 3.1 Το λογισµικό GestureDatabase: Επιµέρους Τµήµατα και Αντικείµενο Υλοποιησής... 39 3.2 Σχηµατισµός αρχείου µε παραµέτρους bap (bapfile)... 40 3.3 ηµιουργία VRML αρχείου από το bapfile... 44 3.4 Σχηµατισµός χάρτη βάθους... 46 3.5 Παράδειγµα εξόδου του λογισµικού GestureDatabase για συγκεκριµένη είσοδο... 54 Σελίδα 3

ΠΕΡΙΕΧΟΜΕΝΑ 4. ΜΕΤΑΤΡΟΠΗ SWML ΣΕ ΒΑP ΑΡΧΕΙΟ... 58 4.1 Συστατικά µέρη σχεδίου χειρονοµίας και µετασχηµατισµοί συµβόλων... 58 4.2 Βασικοί ορισµοί και γεωµετρικές θεωρήσεις -παραδοχές... 65 4.3 Περιγραφή της µορφής SWML... 69 4.4 Περιγραφή του λογισµικού SignBox και εισαγωγή στην εργασία XmlToBapfile... 73 4.5 Στατική χειρονοµία... 77 4.6 Χειρονοµία κίνησης... 81 4.7 Χειρονοµία µε συγχρονισµό... 88 4.8 Χειρονοµία που παριστάνει λέξη... 90 5. ΣΥΝΘΕΣΗ ΤΩΝ GESTUREDATABASE ΚΑΙ XMLTOBAPFILE ΣΕ ΕΝΙΑΙΟ ΛΟΓΙΣΜΙΚΟ... 92 5.1 Περιγραφή του σύνθετου λογισµικoύ GestureDatabase... 92 5.2 Παράδειγµα εξόδου µε είσοδο ένα sign_box... 95 6. ΣΥΜΠΕΡΑΣΜΑΤΑ - ΠΡΟΟΠΤΙΚΕΣ... 99 7. ΠΑΡΑΡΤΗΜΑΤΑ... 102 ΠΑΡΑΡΤΗΜΑ Ι... 102 ΠΑΡΑΡΤΗΜΑ ΙΙ... 110 8. ΠΙΝΑΚΑΣ ΕΙΚΟΝΩΝ... 124 9. ΒΙΒΛΙΟΓΡΑΦΙΑ - ΑΝΑΦΟΡΕΣ... 126 Σελίδα 4

Κεφάλαιο Ι -ΕΙΣΑΓΩΓΗ 1. ΕΙΣΑΓΩΓΗ 1.1 Γενική Περιγραφή Του Συστήµατος Γραφής Της Νοηµατικής Γλώσσας (Sign Writing) Tο επονοµαζόµενο Sign Writing σύστηµα είναι ένα σύστηµα γραφής των νοηµατικών γλωσσών για κωφούς. ηµιουργήθηκε από την Valerie Sutton, για το Center of Sutton Movement Writing το 1974 [1]. Απεικονίζει τα διάφορα νοήµατα όπως αυτά παρατηρούνται παραστατικά σαν οργανωµένες αλληλουχίες από χειρονοµίες και όχι κατά το γλωσσικό περιεχόµενό τους. Σύµφωνα µε το σύστηµα αυτό οι χειρονοµίες (gestures) αντιπροσωπεύονται από γραφικά σχέδια. Υπάρχουν δύο διαφορετικές εκδόσεις της νοηµατικής γλώσσας όσον αφορά τις χειρονοµίες έκφρασης µε µικρές διαφορές µεταξύ τους. Είναι η American Sign Language(ASL) από την Αµερική και η Brazilian Sign Language(LIBRAS) από τη Βραζιλία. Όµως και στις δύο περιπτώσεις ο τρόπος γραφικής απεικόνισης των χειρονοµιών είναι ο ίδιος. Κάθε σχέδιο χειρονοµίας απαρτίζεται από γραφικά σύµβολα (symbols), εκ των οποίων το κάθε ένα αφορά σχηµατικά κάποιο επιµέρους σηµείο της ολοκληρωµένης χειρονοµίας, και µπορεί να είναι κάποια συγκεκριµένη θέση των χεριών, κίνηση των χεριών και των δακτύλων, επαφή µεταξύ των χεριών ή αυτών και του κεφαλιού, έκφραση του προσώπου κτλ. Μια ολοκληρωµένη χειρονοµία, πχ αυτές που απεικονίζονται στο σχήµα που ακολουθεί, απαρτίζεται από ένα σύνολο διαφόρων συµβόλων (χεριών, κινήσεων, επαφών, συγχρονισµού). Σελίδα 5

Κεφάλαιο Ι -ΕΙΣΑΓΩΓΗ Σχήµα 1.1.1 : Τρία παραδείγµατα χειρονοµιών νοηµατικής Οι κωφοί άνθρωποι δεν έχουν καθιερώσει ακόµα ένα συγκεκριµένο τρόπο της έκφρασης της φυσικής τους γλώσσας µε χειρονοµίες στο γραπτό λόγο και το Sign Writing σύστηµα υποδεικνύεται για αυτό ακριβώς το σκοπό. Επειδή το σύστηµα βασίζεται σε ένα σύνολο από γραφικά - σχηµατικά σύµβολα (Sign Writing Symbol Sequence) και χρησιµοποιεί απλούς κανόνες συνδυασµών των συµβόλων σε χειρονοµίες και νοήµατα εξασφαλίζει έναν αποτελεσµατικό τρόπο για τους κωφούς αλλά και τους µη-κωφούς ανθρώπους που δεν έχουν κάποια εξειδικευµένη εκπαίδευση στη νοηµατική γλώσσα, να γράφουν σε αυτήν. Περιλαµβάνει την Sign Writing Markup Language (SWML) η οποία είναι µία µορφοποίηση γραφής βασισµένη στην XML και αναπτύσσεται σήµερα για την αποθήκευση και επεξεργασία των κειµένων σε νοηµατική γλώσσα όπως και των λεξικών αυτής. Επίσης χρησιµοποιείται για την εισαγωγή κειµένων νοηµατικής σε HTML έγγραφα. Έτσι µε τη χρήση της συγκεκριµένης µορφοποίησης οι κωφοί έχουν τη δυνατότητα της πρόσβασης σε αντιλαµβανόµενες από αυτούς εφαρµογές, καθώς και στο δίκτυο µέσω της δικής τους φυσικής γλώσσας. Tα σύµβολα(symbols) της νοηµατικής γραφής συνήθως αποδίδονται στο δίκτυο σαν αρχεία σε gif µορφοποίηση, τα οποία είναι συµπιεσµένα σε zip αρχεία κατά κατηγορίες, ανάλογα µε το είδος τους οι κυριότερες από τις οποίες είναι: η οµάδα των συµβόλων χεριών, του κεφαλιού, του σώµατος, των κινήσεων, των σηµείων στίξης. Τα zip αυτά αρχεία ονοµάζονται σύµφωνα µε το πρότυπο sss95-οµάδα-gif αν πρόκειται για τις εικόνες συµβόλων του προτύπου SSS-1995 και sss99-οµάδα-gif Σελίδα 6

Κεφάλαιο Ι -ΕΙΣΑΓΩΓΗ όσον αφορά τα σύµβολα του προτύπου SSS-1999. Στην παρούσα διπλωµατική εργασία όλες οι παραδοχές και οι χειρισµοί έχουν πραγµατοποιηθεί µε βάση το πρότυπο SSS-1995 [2]. Το πεδίο «οµάδα» στην ονοµασία των συγκεκριµένων zip αρχείων, αφορά ένα από τα είδη τα οποία προαναφέρθηκαν, δηλαδή χέρια (hand), κεφάλι (head), σώµα (body), κίνηση (movement), σηµείο στίξης (punctuation). Κάθε ένα από τα gif αρχεία τα οποία συµπεριλαµβάνονται µέσα σε κάθε οµάδα zip αρχείων έχει όνοµα σύµφωνα µε ένα συγκεκριµένο κανόνα τον: sx-y-z-w.gif όπου: x είναι ο αριθµός για το πεδίο σχήµα(shape) του συµβόλου y είναι ο αριθµός για το πεδίο µεταβολή(variation) του συµβόλου z είναι ο αριθµός για το πεδίο «γέµισµα»(fill) του συµβόλου w είναι ο αριθµός για το πεδίο περιστροφή(rotation) του συµβόλου. Στo κεφαλαίο 4 πραγµατοποιείται λεπτοµερής περιγραφή του τι ακριβώς δηλώνουν τα παραπάνω πεδία και έχει να κάνει µε τα διάφορα είδη µετασχηµατισµών στους οποίους είναι δυνατόν να υποβάλλονται τα σύµβολα, όπως για παράδειγµα περιστροφή γύρω από έναν άξονα. 1.2 Οργάνωση της εργασίας Σκοπός της παρούσας διπλωµατικής εργασίας είναι η µετατροπή της Sign Writing Markup Language (SWML) µορφοποίησης αρχικά σε µορφή bap (body animation parameters), που έχει να κάνει µε τις λεγόµενες παραµέτρους κίνησης σώµατος, (για τις οποίες γίνεται λόγος σε παρακάτω κεφάλαιο) και κατόπιν η µετατροπή της στη µορφή VRML. Πιο συγκεκριµένα επιχειρείται η µετατροπή, µιας κάθε φορά χειρονοµίας(gesture), π.χ. κάποιας από τις τρεις της προηγούµενης εικόνας (σχήµα 1.1.1), που περιέχεται κωδικοποιηµένη(signbox) σε ένα SWML αρχείο και αποτελείται από επιµέρους σύµβολα(symbols), στο αντίστοιχο αρχείο µε παραµέτρους κίνησης σώµατος (bap) και στο επίσης αντίστοιχο VRML αρχείο. Λέγοντας αντίστοιχο εννοείται ότι για την περίπτωση του αρχείου µε τα baps, οι παράµετροι κίνησης θα έχουν τέτοιες τιµές ώστε το «άνοιγµα» αυτού µε το κατάλληλο λογισµικό, δηλαδή την εφαρµογή MPEG-4, να έχει ως αποτέλεσµα την απόδοση της Σελίδα 7

Κεφάλαιο Ι -ΕΙΣΑΓΩΓΗ συγκεκριµένης χειρονοµίας µέσα από την εικόνα ενός κινούµενου ανθρωποειδούς µοντέλου που θα την εκτελεί. Το ίδιο ισχύει και για την περίπτωση του VRML αρχείου µόνο που εδώ αλλάζει το υπεύθυνο πρόγραµµα για την απεικόνισή του. Η εργασία πραγµατοποιεί συνεισφορά στην τηλεπαρουσίαση µέσα από τρισδιάστατα µοντέλα, χειρονοµιών της νοηµατικής που απεικονίζονται σαν γραφικά σύµβολα(σχήµα 1.1.1). Έτσι δίνεται στους κωφούς η δυνατότητα της παρακολούθησης διαφόρων παρουσιάσεων στη νοηµατική γλώσσα µέσω κινούµενης εικόνας (video). Η συγκεκριµένη εργασία ειδικεύεται µόνο στους βραχίονες των δύο χεριών(από τους ώµους και κάτω) µε έµφαση στα δάκτυλα. Όµως µε κατάλληλη επέκταση ώστε να αφορά όλα τα µέλη του ανθρώπινου µοντέλου καθώς και κινήσεις των χαρακτηριστικών του προσώπου µπορεί να έχει πρακτική εφαρµογή σε δελτία ειδήσεων στη νοηµατική γλώσσα καθώς και σε πολλές άλλες εκποµπές γενικού ενδιαφέροντος µεταδιδόµενες σε αυτήν. Η διάρθρωση της διπλωµατικής εργασίας έχει ως εξής : Στο κεφάλαιο 2 αρχικά παρουσιάζεται µια σύντοµη ιστορική αναδροµή όσον αφορά την έρευνα που κατέληξε στα πρότυπα MPEG-4 και VRML. Επίσης πραγµατοποιείται περιγραφή των παραµέτρων κίνησης σώµατος (ΒΑΡs) οι οποίες είναι από τα βασικότερα χαρακτηριστικά του προτύπου MPEG-4 για την υποστήριξη 3- µοντέλων. Στη συνέχεια γίνεται αναφορά στο ανθρωποειδές µοντέλο VRML και περιγράφεται η υλοποίηση ενός VRML αρχείου. Επιπλέον πραγµατοποιείται περιληπτική περιγραφή των χαρτών βάθους. Στο κεφάλαιο 3 επιχειρείται η αναλυτική περιγραφή της πρώτης εργασίας (Gesture Database Project) αυτής της διπλωµατικής η οποία έχει πραγµατοποιηθεί σε περιβάλλον της Microsoft Visual C++. Αναλύονται τα µέρη από τα οποία αποτελείται η εργασία και τι ακριβώς υλοποιεί. Επιπρόσθετα παρουσιάζονται αποτελέσµατα και αρχεία εξόδου τα οποία φυσικά προκύπτουν µετά την εκτέλεση του συνόλου των προγραµµάτων τα οποία περιλαµβάνει. Σελίδα 8

Κεφάλαιο Ι -ΕΙΣΑΓΩΓΗ Στο κεφάλαιο 4 αρχικά παρατίθεται το σύνολο των πληροφοριών που αφορούν οποιοδήποτε σύµβολο της νοηµατικής που είναι το επιµερους στοιχείο µιας χειρονοµίας. Στη συνέχεια η ενότητα αναφέρεται στο swml αρχείο του οποίου η µορφοποίηση είναι βασισµένη στη µορφή xml. Περιγράφονται τα µέρη από τα οποία αποτελείται µε περισσότερη έµφαση στα αποσπάσµατα που αφορούν τα σύνολα συµβόλων (sign_boxes). Επιπλέον εξηγείται ο τρόπος που συνδέεται κάποιο περιεχόµενο στο xml αρχείο signbox, µε τα gif αρχεία µέσα στα οποία αποδίδονται τα σύµβολα της νοηµατικής σαν γραφικά σχέδια. Στο ίδιο κεφάλαιο δίνεται η περιγραφή µιας δεύτερης εργασίας (SignBox Project) που είναι γραµµένη σε γλώσσα προγραµµατισµού C++, µε την εκτέλεση της οποίας δηµιουργείται ένα αρχείο εξόδου που αποτελείται µόνο από κωδικοποιηµένα σύνολα συµβόλων (signboxes). Αυτό είναι και το τελικό αρχείο που θα χρησιµοποιηθεί σαν είσοδος στις επόµενες εργασίες-µέρη αυτής της διπλωµατικής. Τέλος στο κεφάλαιο αυτό περιγράφεται η επόµενη εργασία που έχει υλοποιηθεί (XmlToBapfile Project) τα προγράµµατα της οποίας είναι γραµµένα επίσης σε C++. Είσοδος σε αυτήν είναι το αρχείο εξόδου της προηγούµενης εργασίας που αποτελείται από sign_boxes και µετά την εκτέλεση προκύπτουν ένα ή περισσότερα (ανάλογα την περίπτωση) bap αρχεία. Εν συνεχεία παραθέτονται και σχολιάζονται αποτελέσµατα της εκτέλεσης του συνόλου των προγραµµάτων της συγκεκριµένης εργασίας για διάφορες τιµές της εισόδου. Το κεφάλαιο 5 είναι αφιερωµένο στην αναλυτική περιγραφή της σύνθετης εργασίας Gesture Database 2 Project η οποία διαθέτει δύο επιλογές. Μέσα από τη µία εκτελείται η εργασία που περιγράφεται στο κεφάλαιο 3 δηλαδή το Gesture Database Project, ενώ µέσα από τη δεύτερη εκτελείται η εργασία του κεφαλαίου 5 δηλαδή το XmlToBapfile Project. Επίσης παρουσιάζονται κάποια παραδείγµατα από αρχεία εξόδου που προκύπτουν µετά την Σελίδα 9

Κεφάλαιο Ι -ΕΙΣΑΓΩΓΗ εκτέλεση της εργασίας µε την πρώτη αλλά και τη δεύτερη επιλογή και για διάφορες τιµές της εισόδου κάθε φορά. Στο κεφάλαιο 6 εξάγονται συµπεράσµατα για τα αποτελέσµατα τα οποία λαµβάνονται µετά την εκτέλεση των προγραµµάτων όπου περιέχονται οι τεχνικές που αναπτύχθηκαν στο σύνολο της εργασίας καθώς και για τις δυνατότητες αξιοπιστίας τέτοιων εφαρµογών ακόµα και για τις προοπτικές αξιοποίησής τους. Επίσης δίνεται µια περιληπτική περιγραφή κάποιας πιθανής επέκτασης της εργασίας µετά την προσθήκη και ενσωµάτωση σ αυτήν της αντίστοιχης, που θα αφορά το υπόλοιπο σώµα του ανθρωποειδούς µοντέλου (κορµός, πόδια) καθώς και το κεφάλι µε το πρόσωπο. Το κεφάλαιο 7 αποτελείται από παραρτήµατα στα οποία παρουσιάζονται κάποια βασικά κοµµάτια των προγραµµάτων στα οποία γίνονται αναφορές κατά την περιγραφή και ανάλυση της διπλωµατικής εργασίας στα παραπάνω κεφάλαια. Στο κεφάλαιο 8 παρουσιάζεται ο πίνακας µε τις εικόνες που χρησιµοποιήθηκαν σε όλη την έκταση αυτού του εγγράφου. Τέλος στο κεφάλαιο 9 δίνονται οι αναφορές και η βιβλιογραφία που χρησιµοποιήθηκε στην διπλωµατική εργασία. Σελίδα 10

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML 2. ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 KAI VRML 2.1 Τo πρότυπο MPEG και η ιστορική εξελιξή του έως το MPEG-4 Το πρότυπο ΜPEG είναι ο πλέον ελπιδοφόρος τρόπος διασύνδεσης και ενοποίησης διαφορετικών, µέχρι πρότινος, τεχνολογιών για την µετάδοση οπτικοακουστικής ( audio - visual ) πληροφορίας. Οι εκδόσεις ΜPEG-1 και ΜPEG-2 του προτύπου αναπτύχθηκαν ταυτόχρονα από διάφορες βιοµηχανίες και υιοθετήθηκαν επιτυχηµένα για πολλούς διαφορετικούς σκοπούς. Ενδεικτικά αναφέρουµε τη ψηφιακή µετάδοση ήχου και τηλεόρασης ( ΜPEG-2 ), διαδραστικό ( interactive ) video σε υπολογιστές (ΜPEG-1) και ταινίες σε compact discs ( CD s ). Τα πρότυπα αυτά επικεντρώθηκαν σε δυο κυρίαρχα ζητήµατα, τον προσδιορισµό της κωδικοποιηµένης αναπαράστασης φυσικού βίντεο και ήχου και την περιγραφή των διαδικασιών που απαιτούνται ώστε να ανακτήσουµε ευπαρουσίαστη εικόνα και ήχο από αυτές τις κωδικοποιηµένες αναπαραστάσεις. Στα πλαίσια αυτής της αναµενόµενης σύγκλισης των τεχνολογιών η τυποποίηση του προτύπου ΜPEG-4 συνδυάζει µερικά από τα τυπικά χαρακτηριστικά των προηγούµενων προτύπων, µε καινούρια τα οποία προέρχονται είτε από ήδη υπάρχουσες είτε από αναµενόµενες υλοποιήσεις πολυµέσων. Ορισµένα από αυτά τα χαρακτηριστικά είναι τα εξής: Ανεξαρτησία των εφαρµογών από τις λεπτοµέρειες χαµηλού επιπέδου (lowerlevel ). Σελίδα 11

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Χρησιµοποίηση σε ένα µεγάλο εύρος ταχυτήτων µετάδοσης, από µερικά Kbits/sec µέχρι λίγα Mbits/sec. ιαδραστικότητα όχι µόνο µε ολοκληρωµένα οπτικοακουστικά Bitstreams αλλά και µε µεµονωµένα οπτικοακουστικά αντικείµενα (Audio Visual Objects), τα οποία θα αναφερθούν παρακάτω) όπως σε µια HTML σελίδα στον παγκόσµιο ιστό (Web). Ικανότητα χειρισµού ταυτόχρονα φυσικού και συνθετικού περιεχόµενου όπως, επίσης, πληροφορίας σε πραγµατικό χρόνο ( real-time ) και σε µη πραγµατικό χρόνο (non-real-time). Ικανότητα σύνθεσης και παρουσίασης της πληροφορίας σύµφωνα µε τη διάδραση (interaction) και τις ανάγκες του χρήστη όπως στη γλώσσα γραφικών VRML και γενικότερα στα γραφικά υπολογιστών. Η ιδιαιτερότητά του συγκεκριµένου προτύπου σε σχέση µε προηγούµενα MPEG-1, MPEG-2 συνίσταται στην αντιµετώπιση της οπτικής πληροφορίας (εικονοσειράς) σαν µια σκηνή µέσα στην οποία βρίσκονται ξεχωριστές «µονάδες» εικόνας και video, που ονοµάζονται «video objects» (VOs), τα οποία αλλάζουν θέση, υφή και σχήµα µέσα στη σκηνή. ηλαδή υιοθετεί µια αντικειµενοστραφή (object-oriented) αρχιτεκτονική. Αυτό ακριβώς το χαρακτηριστικό επιτρέπει την επαναχρησιµοποίηση των εργαλείων κωδικοποίησης και των δεδοµένων, διότι η πληροφορία παρουσιάζεται µε τη µορφή µεµονωµένων κοµµατιών. Για παράδειγµα ένα οπτικοακουστικό αντικείµενο µπορεί να είναι ένα οµιλούν πρόσωπο (χωρίς φόντα (background)) και σε συνδυασµό µε άλλα δηµιουργούν µια σκηνή. Το οπτικό µέρος του προτύπου MPEG-4 αποσκοπεί στην κατασκευή εργαλειοθήκης που θα ικανοποιεί τις ανάγκες: Παγκόσµιας πρόσβασης και αντοχής σε περιβάλλοντα «σκληρού» θορύβου. Τα οπτικοακουστικά δεδοµένα πρέπει να διαδοθούν µέσα σε ετερογενή δικτυακά περιβάλλοντα, πιθανότατα υπό συνθήκες υψηλού θορύβου (όπως τα ασύρµατα κανάλια των κινητών). Σελίδα 12

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Υψηλής διαδραστικής λειτουργικότητας, ώστε να ανταποκριθεί στις απαιτήσεις του χρήση για πρόσβαση, επεξεργασία / αποθήκευση των δεδοµένων µε τον πιο ευέλικτο τρόπο. Κωδικοποίησης φυσικών και συνθετικών δεδοµένων. Οι επεξεργαστές γραφικών νέας γενιάς θα επιτρέπουν στα τερµατικά πολυµέσων να απεικονίζονται τα βασισµένα σε pixel δεδοµένα οπτικοακουστικά δεδοµένα µε τα συνθετικά (cartoon, συνθετικά πρόσωπα, κλπ.). Αυτή η συνύπαρξη αποτελεί το κυριότερο πλεονέκτηµα του MPEG-4. Επαρκούς συµπίεσης για αποθήκευση και µετάδοση οπτικοακουστικών δεδοµένων. Η βελτιωµένη ικανότητα κωδικοποίησης, ειδικότερα σε χαµηλές ταχύτητες (bit rates) κάτω των 64 Kbits/s συνεχίζει να είναι ένα σηµαντικό χαρακτηριστικό του προτύπου αυτού. 2.2 Παράµετροι Κίνησης Σώµατος (Βaps) Ένα από τα βασικά χαρακτηριστικά του προτύπου MPEG-4 [3]είναι η υποστήριξη 3D µοντέλων. Επιπλέον υποστηρίζει τη µετάδοση τρισδιάστατης κίνησης, ιδιαίτερα όταν σχετίζεται µε 3D µοντέλα προσώπου και σώµατος. Λόγω του ότι το προσφερόµενο εύρος ζώνης είναι περιορισµένο, οι γνωστές εφαρµογές βιντεοσυνδίασκεψης που υλοποιούνται µε διάφορες µεθόδους υψηλής συµπίεσης εικόνας, όταν χρησιµοποιούνται σε πραγµατικό χρόνο (real-time) δίνουν χαµηλής ευκρίνειας και ανάλυσης αποτέλεσµα όπως επίσης και χαµηλό ρυθµό ανανέωσης της εικόνας (frame-rate). Έτσι κρίνεται αναγκαία από τη µια πλευρά η αποστολή της ελάχιστης δυνατής πληροφορίας και από την άλλη η βέλτιστη κωδικοποίηση αυτής. Αυτό επιτυγχάνεται µε την αποστολή µόνο των παραµέτρων της στερεής κίνησης του µοντέλου του σώµατος που διατίθεται. Στη συνέχεια η κίνηση αναπαράγεται µε µετατόπιση του µοντέλου σύµφωνα µε τις ληφθείσες παραµέτρους. Σελίδα 13

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Το αντικείµενο σώµα είναι µια συλλογή από κόµβους οι οποίοι κινούνται από µία ακολουθία από bits (bitstream). Η γεωµετρία και η θέση των µελών του σώµατος περιγράφονται από δύο διαφορετικά σύνολα από bits. Το πρώτο λέγεται BIFS και περιέχει τις παραµέτρους ορισµού του σώµατος -Body Definition Parameters (BDPs) και το δεύτερο είναι το FBA το οποίο περιλαµβάνει τις παραµέτρους κίνησης -Body Animation Parameters (BAPs) οι οποίες περιγράφονται αναλυτικά παρακάτω. Οι παράµετροι ορισµού του σώµατος χρησιµοποιούνται για να προσαρµόσουν το γενικευµένο µοντέλο του ανθρώπινου σώµατος σε ένα συγκεκριµένο µοντέλο. Ελέγχουν τις ιδιότητες του ανατοµικού τµήµατος του ανθρώπινου µοντέλου, τη γεωµετρία του (τρισδιάστατες συντεταγµένες των σηµείων που το αποτελούν) και τα φωτοµετρικά χαρακτηριστικά. Ο ορισµός και η συντακτική αναπαράσταση των BDPs είναι βασισµένα στις προδιαγραφές του προτύπου H-Anim 1.1 [4]. Στο ανθρώπινο µοντέλο δύο είδη κόµβων ορίζονται: ο κόµβος τµήµατος (Segment Node), ο οποίος αφορά την τρισδιάστατη γεωµετρία και και τα χρωµατικά γνωρίσµατα των ανατοµικών τµηµάτων, ο κόµβος άρθρωσης (Joint Node), που ορίζει το κέντρο της τρισδιάστατης περιστροφής του κάθε τµήµατος. Οι παράµετροι ορισµού σώµατος, είναι συγκεκριµένοι για κάθε τρισδιάστατο ανθρώπινο µοντέλο. Οι παράµετροι κίνησης BAPs ορίζουν τις εξωτερικές ιδιότητες των τµηµάτων του µοντέλου, όπως την θέση του κάθενός από αυτά στον τρισδιάστατο χώρο σε σχέση µε τον κορµό του σώµατος. Έχουν σχεδιαστεί για την περιγραφή και την αναπαραγωγή της ανθρώπινης κίνησης µε τον κατά το δυνατόν ρεαλιστικότερο τρόπο. Έτσι λοιπόν σε αντίθεση µε τις παραµέτρους BDPs, είναι γενικής χρήσης. Αν δηλαδή ερµηνευτούν σωστά, ένα σύνολο από BAPs, θα παράγει αισθητά παρόµοια αποτελέσµατα κατά τη διάρκεια της κίνησης, όταν εφαρµοσθεί σε διαφορετικά ανθρώπινα µοντέλα, τα οποία καθορίζονται το καθένα από τις δικές του παραµέτρους ορισµού σώµατος. Περιλαµβάνουν ένα πλήρες σύνολο των βασικών κινήσεων, καθώς και πιο σύνθετες κινήσεις ενώ επιτρέπουν και υπερβολικές, για το Σελίδα 14

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML φυσικό ανθρώπινο µοντέλο, τιµές παραµέτρων. Εκφράζουν σε κανονικοποιηµένη µορφή τη στερεή κίνηση των αρθρώσεων και είναι δυνατόν να αποφέρουν υψηλού επιπέδου αποτελέσµατα όσον αφορά τη θέση και την κίνηση διαφορετικών µοντέλων σώµατος. Συνολικά οι παράµετροι κίνησης είναι 186 στον αριθµό. Οι 180 σχετίζονται µε κινήσεις επιµέρους µερών του σώµατος, ενώ οι 6 αφορούν τις πιο σύνθετες κινήσεις ολόκληρου του σώµατος. Στην παρούσα διπλωµατική εργασία χρησιµοποιούνται οι παράµετροι κίνησης των χεριών (από τους ώµους και κάτω), για την εκτίµηση της κίνησης των χεριών η οποία έχει ιδιαίτερη σηµασία σε εφαρµογές αναγνώρισης χειρονοµιών (gestures). Για τα δύο χέρια (αριστερό και δεξί) δίνονται στον παρακάτω πίνακα όπως αυτές ορίζονται από το πρότυπο. GROUP NAME BAP ID BAP NAME DESCRIPTION Left arm1 32 l_shoulder_flexion Forward-backward motion in the sagittal plane Right arm1 33 r_shoulder_flexion Forward-backward motion in the sagittal plane Left arm1 34 l_shoulder_abduct Sideward motion in the coronal plane Right arm1 35 r_shoulder_abduct Sideward motion in the coronal plane Left arm1 36 l_shoulder_twisting Rotation along the scapular axis Right arm1 37 r_shoulder_twisting Rotation along the scapular axis Left arm1 38 l_elbow_flexion Flexion-extension of the arm in the sagittal plane Right arm1 39 r_elbow_flexion Flexion-extension of the arm in the sagittal plane Left arm2 40 l_elbow_twisting Rotation of the forearm along Σελίδα 15

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML the upper arm axis. Right arm2 41 r_elbow_twisting Rotation of the forearm along the upper arm axis. Left arm1 42 l_wrist_flexion Rotation of the hand in the coronal plane Right arm1 43 r_wrist_flexion Rotation of the hand in the coronal plane Left arm2 44 l_wrist_pivot Rotation of the hand in the sagittal planes Right arm2 45 r_wrist_pivot Rotation of the hand in the sagittal planes Left arm2 46 l_wrist_twisting Rotation of the hand along the forearm axis Right arm2 47 r_wrist_twisting Rotation of the hand along the forearm axis Left hand2 123 l_pinky0_flexion Metacarpal flexing mobility of the pinky finger Right hand2 124 r_pinky0_flexion Metacarpal flexing mobility of the pinky finger Left hand1 125 l_pinky1_flexion First knukle of the pinky finger Right hand1 126 r_pinky1_flexion First knukle of the pinky finger Left hand2 127 l_pinky1_pivot Lateral mobility of the pinky finger Right hand2 128 r_pinky1_pivot Lateral mobility of the pinky finger Left hand2 129 l_pinky1_twisting Along the pinky finger axis Right hand2 130 r_pinky1_twisting Along the pinky finger axis Left hand1 131 l_pinky2_flexion Second knuckle of the pinky number Right hand1 132 r_pinky2_flexion Second knuckle of the pinky number Left hand1 133 l_pinky3_flexion Third knuckle of the pinky finger Right hand1 134 r_pinky3_flexion Third knuckle of the pinky finger Left hand2 135 l_ring0_flexion Metacarpal flexing mobility of the ring finger Right hand2 136 r_ring0_flexion Metacarpal flexing mobility of the ring finger Σελίδα 16

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Left hand1 137 l_ring1_flexion First knukle of the ring finger Right hand1 138 r_ring1_flexion First knukle of the ring finger Left hand2 139 l_ring1_pivot Lateral mobility of the ring finger Right hand2 140 r_ring1_pivot Lateral mobility of the ring finger Left hand2 141 l_ring1_twisting Along the ring finger axis Right hand2 142 r_ring1_twisting Along the ring finger axis Left hand1 143 l_ring2_flexion Second knuckle of the ring number Right hand1 144 r_ring2_flexion Second knuckle of the ring number Left hand1 145 l_ring3_flexion Third knuckle of the ring finger Right hand1 146 r_ring3_flexion Third knuckle of the ring finger Left hand2 147 l_middle0_flexion Metacarpal flexing mobility of the middle finger Right hand2 148 r_middle0_flexion Metacarpal flexing mobility of the middle finger Left hand1 149 l_middle1_flexion First knukle of the middle finger Right hand1 150 r_middle1_flexion First knukle of the middle finger Left hand2 151 l_middle1_pivot Lateral mobility of the middle finger Right hand2 152 r_middle1_pivot Lateral mobility of the middle finger Left hand2 153 l_middle1_twisting Along the middle finger axis Right hand2 154 r_middle1_twisting Along the middle finger axis Left hand1 155 l_middle2_flexion Second knuckle of the middle number Right hand1 156 r_middle2_flexion Second knuckle of the middle number Left hand1 157 l_middle3_flexion Third knuckle of the middle finger Right hand1 158 r_middle3_flexion Third knuckle of the middle finger Left hand2 159 l_index0_flexion Metacarpal flexing mobility of the index finger Right hand2 160 r_index0_flexion Metacarpal flexing mobility of the index finger Left hand1 161 l_index1_flexion First knukle of the index finger Right hand1 162 r_index1_flexion First knukle of the index finger Left hand2 163 l_index1_pivot Lateral mobility of the index finger Σελίδα 17

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Right hand2 164 r_index1_pivot Lateral mobility of the index finger Left hand2 165 l_index1_twisting Along the index finger axis Right hand2 166 r_index1_twisting Along the index finger axis Left hand1 167 l_index2_flexion Second knuckle of the index number Right hand1 168 r_index2_flexion Second knuckle of the index number Left hand1 169 l_index3_flexion Third knuckle of the index finger Right hand1 170 r_index3_flexion Third knuckle of the index finger Left hand1 171 l_thumb1_flexion First knukle of the thumb finger Right hand1 172 r_thumb1_flexion First knukle of the thumb finger Left hand1 173 l_thumb1_pivot Lateral mobility of the thumb finger Right hand1 174 r_thumb1_pivot Lateral mobility of the thumb finger Left hand2 175 l_thumb1_twisting Along the thumb finger axis Right hand2 176 r_thumb1_twisting Along the thumb finger axis Left hand1 177 l_thumb2_flexion Second knuckle of the thumb number Right hand1 178 r_thumb2_flexion Second knuckle of the thumb number Left hand1 179 l_thumb3_flexion Third knuckle of the thumb finger Right hand1 180 r_thumb3_flexion Third knuckle of the thumb finger Σχήµα 2.2.1 : Πίνακας παραµέτρων κίνησης χεριών Από τις παραπάνω παραµέτρους κίνησης των χεριών και των δακτύλων αυτές που δεν χρησιµοποιούνται στην εργασία είναι οι: l_pinky0_flexion, l_ring0_flexion, l_middle0_flexion, l_index0_flexion, r_pinky0_flexion, r_ring0_flexion, r_middle0_flexion, r_index0_flexion. Για κάθε παράµετρο προσδιορίζεται µια θετική κατεύθυνση κίνησης µε βάση την προτυποποίηση του MPEG-4. Για τον ανθρώπινο βραχίονα έχουν προβλεφθεί οι παρακάτω κινήσεις: Στο ύψος των ώµων: Σελίδα 18

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML 1. shoulder_flexion: έκταση 2. shoulder_abduct: κίνηση προς το σώµα 3. shoulder_twisting: περιστροφή γύρω από τον άξονα της ωµοπλάτης Στο ύψος του αγκώνα: 1. elbow_flexion: έκταση 2. elbow _twisting: περιστροφή του πήχυ γύρω από τον αξονά του Στο ύψος του καρπού: 1. wrist_flexion: έκταση 2. wrist_pivot: κίνηση ως προς τον κάθετο άξονα (µε αυτόν της έκτασης) 3. wrist_twisting: περιστροφή γύρω από τον άξονα του καρπού Οι κινήσεις αυτές παριστάνονται στο σχήµα που ακολουθεί. r_clav_rotate vt6 scap_abduct clav_abduct r_shoulder_flexion r_elbow_flexion r_elbow_twisting r_shoulder_ twisting vt5 zoom elbow_twisting shoulder_ twisiting shoulder_abduct r_wrist_pivot wrist_flexion r_wrist_twisting r_wrist_twisting Σχήµα 2.2.2 : Παράµετροι κίνησης βραχίονα Σελίδα 19

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Oι κινήσεις των χεριών έχουν µια σταθερή δοµή για τα πέντε δάκτυλα η οποία έχει την ακόλουθη µορφή: 1. Έναν παράγοντα ελευθερίας pivoting για την πλάγια κίνηση του δακτύλου. 2. Έναν παράγοντα ελευθερίας twisting για την περιστροφή του δακτύλου. 3. Τέσσερεις παράγοντες ελευθερίας flexing για το κλείσιµο κάθε φάλαγγας του δακτύλου (στον αντίχειρα υπάρχουν 3 παράγοντες ελευθερίας flexing) Στο παρακάτω σχήµα παριστάνονται οι κινήσεις των δακτύλων. Σχήµα 2.2.3 : Παράµετροι κίνησης χεριού Σελίδα 20

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML 2.3 Περιγραφή Βap αρχείων Οι τιµές των παραµέτρων κίνησης δίνονται σε τυποποιηµένα ASCII αρχεία (bapfiles),τα οποία µπορεί να διαβάζει η εφαρµογή του προτύπου MPEG-4 από έναν τοπικό δίσκο ή από το δίκτυο. Σε κάθε αρχείο bapfile περιέχεται µια µάσκα η οποία είναι µια σειρά από 0 και 1 που δίνει την πληροφορία για τα BAPs που αποστέλλονται. Έτσι τα BAPs που αποστέλλονται έχουν τιµή 1 στη µάσκα ενώ τα υπόλοιπα έχουν τιµή 0. Για τα BAPs που αποστέλλονται δίνονται επίσης οι αντίστοιχες τιµές τους. Πρόκειται για την ακολουθία των τιµών που υπάρχει µέσα στο αρχείο, µετά το τέλος της µάσκας. Ένα παράδειγµα αρχείου παραµέτρων κίνησης δίνεται στο παρακάτω σχήµα. #Header description 3.1 baps.bap 10 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 157079-157079 -157079-157079 -157079-157079 -157079-157079 -157079-130899 78539 Σχήµα 2.3.1 : Παράδειγµα bapfile Το bapfile που φαίνεται στο σχήµα περιέχει µόνο µια σειρά µε 0 και 1 η οποία αναφέρεται σε µια συγκεκριµένη χρονική στιγµή, δηλαδή σε µια θέση των µελών του ανθρώπινου µοντέλου που χρησιµοποιείται. Τα BAPs που αποστέλονται (τα 1) καθορίζουν το ποια ακριβώς είναι τα µέλη του µοντέλου τα οποία έχουν µια συγκεκριµένη θέση, διαφορετική από τη θέση αναφοράς (default) που φαίνεται στο επόµενο σχήµα. Οι τιµές που ακολουθούν τη µάσκα στο αρχείο, ορίζουν ακριβώς τις θέσεις των µελών αυτών, αφού κάθε µια είναι η κανονικοποιηµένη τιµή της κλίσης κάποιας άρθρωσης σε σχέση µε τον κατακόρυφο άξονα της θέσης αναφοράς. Η κανονικοποίηση των κλίσεων πραγµατοποιείται µε βάση τον τύπο: val x = π 10 5 180 Σελίδα 21

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML όπου π = 3.1415926535897932384626433832795 και val είναι η τιµή της κλίσης σε µοίρες. Στη θέση αναφοράς όλες οι τιµές στη µάσκα είναι ίσες µε 0. Σχήµα 2.3.2 : Θέση αναφοράς ανθρώπινου µοντελου Το παραπάνω bapfile λοιπόν περιγράφει µια θέση του µοντέλου. Υπάρχουν όµως και bapfiles τα οποία περιγράφουν την κίνηση του µοντέλου και διαφέρουν από το προαναφερόµενο. Περιέχουν παραπάνω από µια σειρές απο 0 και 1 (frames) κάθε µια απο τις οποίες αφορά µια θέση για κάποια χρονική στιγµή. Έτσι το σύνολο τους αποτελεί την ολοκληρωµένη κίνηση. Μετά από κάθε µάσκα αναγράφονται οι αντίστοιχες τιµές των BAPs που αποστέλονται. Σε αυτού του είδους τα bapfile όπως και προηγουµένως στην πρώτη µάσκα όλα τα BAPs που αποστέλονται έχουν τιµή 1, αλλά δεν µηδενίζονται στις επόµενες µάσκες ακοµά και αν δεν αποστελονται τα συγκεκριµένα τις επόµενες χρονικές στιγµές, επειδή κάθε επόµενη θέση έχει αλλάξει σε σχέση µε την προηγούµενη ανεξάρτητα από τη σχέση της µε τη θέση αναφοράς. Ένα bapfile κίνησης απεικονίζεται στο σχήµα που ακολουθεί. Σελίδα 22

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML #Header description 3.1 movement.bap 1 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 157079 157079 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 157079 157079 7853-7853 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 2 0 0 0 0 0 0 157079 157079 15707-15707 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 3 0 0 0 0 0 0 157079 157079 23561-23561 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Σχήµα 2.3.3 : Παράδειγµα bapfile κίνησης O αριθµός που ακολουθεί το όνοµα του αρχείου (πριν τη µάσκα) αφορά τον αριθµό των σειρών 0 και 1 δηλαδή των θέσεων που αλλάζει το µοντέλο ανά δευτερόλεπτο (frames per second) ενώ ο επόµενος (το 4 στην προκειµένη περίπτωση) είναι το πλήθος των µασκών-σειρών από 0 και 1 που υπάρχουν στο συγκεκριµένο bapfile. Ένα bap αρχείο διαβάζεται όπως προαναφέρθηκε από το λογισµικό MPEG-4. Η απεικόνισή του µε το «άνοιγµα» από το πρόγραµµα αυτό είναι µία εικόνα στατική ή κινούµενη που το αντιπροσωπεύει (σχήµα 2.3.4) Σελίδα 23

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Σχήµα 2.3.4 : Άνοιγµα bapfile µε MPEG-4 Η παράσταση αυτή της κίνησης µετατρέπεται στη µορφή του προτύπου H-Anim 1.1 (γωνίες µε άξονες) και είναι πλέον έτοιµη να εφαρµοσθεί σε οποιοδήποτε τρισδιάστατο ανθρώπινο µοντέλο συµβατό µε το παραπάνω πρότυπο. 2.4 Το πρότυπο VRML Η VRML (Virtual Reality Modeling Language) [5] ως ιδέα συνελήφθη την άνοιξη του 1994 στο πρώτο ετήσιο συνέδριο του WWW στην Γενεύη όπου συζητήθηκε η υποστήριξη διεπιφανειών εικονικής πραγµατικότητας (Virtual Reality Ιnterfaces) στον παγκόσµιο ιστό(world Wide Web). Ήταν η πρώτη προσπάθεια για την ύπαρξη ενός εργαλείου µε µία κοινή γλώσσα για την περιγραφή 3D κόσµων. Μετά από συζητήσεις και προτάσεις οι σύνεδροι κατέληξαν στη διατύπωση των προδιαγραφών της έκδοσης 1.0. Κατατέθηκαν αρκετές προτάσεις για την µορφή του αρχείου (file format), από τις οποίες επιλέχθηκε τελικά αυτή του Open Inventor της Silicon Graphics. Πάνω σε αυτό τη µορφοποίηση στηρίχθηκε η κατασκευή της VRML. Σελίδα 24

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Σχεδιάστηκε για να παρέχει ένα φιλικότερο περιβάλλον για τον παγκόσµιο ιστό. Ενσωµατώνει 3-D γραφικά, χρώµατα, υφή και ήχους σε έναν φαινοµενικό κόσµο τον οποίο ο χρήστης µπορεί να περιηγηθεί µε έναν κατάλληλο φυλλοµετρητή (browser). Το World Wide Web (WWW) είναι σήµερα η πιο σηµαντική υπηρεσία στο διαδίκτυο, λόγω της δυνατότητας ταυτόχρονης παρουσίασης κειµένου, γραφικών και multimedia που διαθέτει. Ωστόσο, η γλώσσα που χρησιµοποιείται για τη συγγραφή hypermedia κειµένων, η Hypertext Mark-Up Language (HTML), περιορίζει την απεικόνιση της πληροφορίας σε ένα δισδιάστατο πλαίσιο. Εποµένως, θα ήταν ζητούµενη η ανάπτυξη µιας τρισδιάστατης διεπιφάνειας, που προσεγγίζει πιο ρεαλιστικά τον πραγµατικό κόσµο. Πράγµατι, η ανάπτυξη µιας τέτοιας διεπιφάνειας δεν άργησε να ικανοποιηθεί και έτσι πολύ γρήγορα αναπτύχθηκε µια νέα γλώσσα προγραµµατισµού για το Internet, που έχει τη δυνατότητα να δηµιουργεί τρισδιάστατους κόσµους (worlds) και να τους ενσωµατώνει σε σελίδες WWW τρέχοντας πάνω σε πλατφόρµα λογισµικών φυλλοµέτρησης (browsers) όπως ο Netscape Navigator ή ο Microsoft Internet Explorer. H γλώσσα αυτή, που ονοµάστηκε Virtual Reality Mark-up Language και µετονοµάστηκε σε Virtual Reality Modeling Language, γνώρισε µια ευρύτατη διάδοση σε αξιοσηµείωτα µικρό χρονικό διάστηµα, γεγονός που την καθιστά ένα από τα πλέον δυναµικά εργαλεία ανάπτυξης εφαρµογών στο Web. Η VRML δίνει τη δυνατότητα µε ένα απλό editor να γράψει καποιος τους δικούς τους τρισδιάστατους κόσµους µε απλές εντολές (σε σχέση µε άλλα πακέτα γραφικών), έχοντας µόνο κάποιες βασικές γνώσεις γραφικών. Οι έτοιµες δοµές που παρέχει επιτρέπουν τη σχεδίαση βασικών ή και πλέον περίπλοκων σχηµάτων στο χώρο ακόµα και σε κάποιον που δεν έχει γνώσεις προγραµµατισµού. Ακόµη, όπως και η HTML, είναι ανεξάρτητη από την πλατφόρµα εκτέλεσης, επιτρέπει δηλαδή τη χρήση ενός παγκόσµια αποδεκτού προτύπου για τον προγραµµατισµό, ανεξάρτητα από το υλικό (hardware). Σελίδα 25

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Τέλος για την απεικόνιση των τρισδιάστατων κόσµων η VRML διαβάζεται από κατάλληλα προγράµµατα «πρόσθετα» για λογισµικά εξέτασης ιστοσελίδων (plugins). Για παράδειγµα µέσα από τον Internet Explorer το plug-in πρόγραµµα CosmoPlayer, παρέχει πλήρεις τέτοιες δυνατότητες προβολής. 2.5 Σύνθεση Μοντέλου VRML Για τη σύνθεση ενός συνθετικού ανθρώπινου µοντέλου χρησιµοποιούνται βασικά µοντέλα VRML όλων των µερών του σώµατος π.χ. βραχίονας, πλάτη, παλάµη, δάκτυλα κλπ, ενω είναι δυνατόν να προστεθεί και πληροφορία υφής σε κάποια τµήµατα. Έτσι στο τελικό VRML αρχείο είναι προσαρµοσµένο είτε το πλήρες ανθρώπινο µοντέλο είτε ένα σύνολο συγκεκριµένων περιοχών του ανθρώπινου σώµατος. Στο σχήµα που ακολουθεί φαίνονται δυο διαφορετικά ανθρώπινα µοντέλα VRML [4]. Για τη σύνθεση του VRML µοντέλου (H-Anim µοντέλο) µε τη χρήση των παραµέτρων κίνησης χρησιµοποιείται το λογισµικό Epflbody για το οποίο γίνεται λόγος σε επόµενο κεφάλαιο. Μέσω αυτού διαβάζεται ένα bap αρχείο και εφαρµοζονται οι παράµετροι σε ένα πλήρες ανθρώπινο µοντέλο έτσι ώστε να δηµιουργούνται VRML αρχεία εξόδου, κάθε ένα από τα οποία αντιστοιχεί σε κάποια χρονική στιγµή δηλαδή συγκεκριµένη θέση του συνόλου των µελών του µοντέλου, που περιέχεται στο bap αρχείο. Σελίδα 26

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Σχήµα 2.5.1 : Παραδείγµατα H-Anim µοντέλων Τα αρχεία VRML περιγράφουν µε ποιο τρόπο πρέπει να συνδεθούν µεταξύ τους στο χώρο τα δοµικά στοιχεία του ανθρώπινου µοντέλου, ώστε να αποδοθεί σωστά η επιθυµητή θέση-στάση του σώµατος, η οποία περιγράφεται ως κωδικοποιηµένη πληροφορία σε ένα bapfile. Τα δοµικά στοιχεία του ανθρώπινου µοντέλου χρησιµοποιούν τρισδιάστατη γεωµετρία για την περιγραφή του κάθε µέλους. Το κάθε µέλος λοιπόν προσδιορίζεται µε τη βοήθεια τριγωνικού πλέγµατος (polygon mesh) όπως φαίνεται παρακάτω. Σελίδα 27

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Σχήµα 2.5.2 : Πολυγωνική µορφή Mesh Με τον τρόπο αυτό η επιφάνεια κάθε µέλους προσεγγίζεται από ένα µεγάλο αλλά πεπερασµένο αριθµό τριγώνων. Για την ικανοποιητική περιγραφή της πολυγωνικής δοµής απαιτούνται µόνο οι συντεταγµένες των κορυφών των τριγώνων και η σειρά σύνδεσης των κορυφών. Κατά τη διαδικασία της σύνθεσης οι συντεταγµένες των σηµείων κάθε µέρους του σώµατος µετασχηµατίζονται κατάλληλα ώστε να περιγραφεί µε ακρίβεια η θέση του σώµατος η οποία αποδίδεται µε τις παραµέτρους κίνησης µέσα στο συγκεκριµένο bap αρχείο που συµµετέχει σαν είσοδος στην εργασία. Ο µετασχηµατισµός που χρησιµοποιείται αποτελείται από µια στερεή µετατόπιση και περιστροφή για κάθε µέλος του σώµατος σύµφωνα µε τον τύπο: X' = R X + T o οποίος αναλυτικότερα είναι: x' r 11 r 12 r 13 x t 1 y' = r 21 r 22 r 23 * y + t 2 z' r 31 r 32 r 33 z t 3 Σελίδα 28

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML όπου R είναι ένας 3 x 3 πίνακας περιστροφής και T ένα 3 x 1 διάνυσµα µεταφοράς. Ο R εκφράζει την περιστροφή του αντικειµένου γύρω από το σύστηµα συντεταγµένων ενώ το διάνυσµα µεταφοράς τη µετατόπιση από την αρχή των αξόνων αντίστοιχα. Τελικά το VRML αρχείο εξόδου περιέχει όλα τα δοµικά στοιχεία του ανθρώπινου µοντέλου που είναι απαραίτητα καθώς και τους πίνακες περιστροφής και µεταφοράς. 2.6 Σύστηµα συντεταγµένων της VRML Η VRML χρησιµοποιεί ένα δεξιόστροφο σύστηµα συντεταγµένων. ηλαδή τα θετικά x είναι προς τα δεξιά, τα θετικά y είναι προς τα πάνω και τα θετικά z είναι προς την πλευρά του θεατή (δηλαδή από την οθόνη προς τον θεατή), όπως φαίνεται και στην παρακάτω εικόνα. y x z y x z Σχήµα 2.6.1 : Το σύστηµα συντεταγµένων της VRML Σε πεδία συντεταγµένων χρειάζεται πάντα να προσδιορίζονται και οι τρεις συντεταγµένες. Η σειρά ορισµού τους είναι πάντα η x y z, έχοντας µεταξύ τους ένα ή περισσότερα κενά. Η διεύθυνση που ορίζει ο άξονας z είναι αυτή που θεωρείται ως διεύθυνση παρακολούθησης και γενικά ως η προεπιλεγµένη διεύθυνση όταν δεν Σελίδα 29

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML καθορίζεται κάποια άλλη. Ακόµη, οτιδήποτε και αν συµβεί σε ένα αντικείµενο µιας σκηνής (µετακίνηση περιστροφή κ.λ.π.), θεωρείται πάντα σε σχέση µε το κέντρο του αντικειµένου, µε εξαίρεση ορισµένες ειδικές περιπτώσεις που δεν ενδιαφέρουν άµεσα. 2.7 Κώδικας VRML αρχείου Ο κώδικας ενος παραδείγµατος ενός VRML αρχείου φαίνεται στο επόµενο σχήµα, ενώ στην εικόνα που το ακολουθεί απεικονίζεται το µέλος του µοντέλου το οποίο περιγράφεται από το συγκεκριµένο παράδειγµα του VRML αρχείου. #VRML V1.0 ascii Separator ShapeHints vertexordering COUNTERCLOCKWISE shapetype UNKNOWN_SHAPE_TYPE facetype UNKNOWN_FACE_TYPE DEF InfoSeparator Separator DEF Viewer Info string "walk" Separator MatrixTransform matrix 0.099400 0.029883 0.994599 0.000000-0.995047 0.002806 0.099360 0.000000 0.000178-0.999549 0.030014 0.000000-0.204664 0.370266-0.007846 1.000000 WWWInline name "Surfaces/Buffman_right_upper_arm.wrl" Separator MatrixTransform matrix -0.996373 0.048388 0.069999 0.000000-0.073985-0.086203-0.993527 0.000000-0.042041-0.995102 0.089470 0.000000-0.204616 0.102995 0.000179 1.000000 WWWInline name "Surfaces/Buffman_right_lower_arm.wrl" Σελίδα 30

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Separator MatrixTransform matrix 0.130397-0.093649-0.987029 0.000000-0.041478-0.995173 0.088942 0.000000-0.990594 0.029342-0.133652 0.000000-0.215583-0.156597 0.023519 1.000000 WWWInline name "Surfaces/r_palm.wrl" Σχήµα 2.7.1 : Κώδικας παραδείγµατος αρχείου VRML Σχήµα 2.7.2 : Το παραγόµενο συνθετικό µοντέλο χεριού Σελίδα 31

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Το VRML αρχείο του παραδείγµατος περιγράφει όπως ειπώθηκε παραπάνω ένα συγκεκριµένο στιγµιότυπο του ανθρώπινου µοντέλου. Σε αντιστοιχία µε τα bap αρχεία κίνησης, που έχουν ήδη περιγραφεί, υπάρχουν και VRML αρχεία κίνησης, µέσα από τα οποία προσδιορίζεται η κίνηση του ανθρώπινου µοντέλου, σύµφωνα µε την ακολουθία των διαδοχικών χρονικών στιγµών (frames), οι οποίες περιγράφονται στο αντίστοιχο bap αρχείο. Ο κώδικας τέτοιων αρχείων διαφέρει από αυτόν του σχήµατος 2.7.1 εφόσον µέσα σ αυτά ορίζονται και άλλες παράµετροι όπως ο αριθµός των στιγµιότυπων ανά µονάδα χρόνου. Ένα µέρος από τον περιεχόµενο κώδικα σε ένα τέτοιο αρχείο που αφορά ένα H-Anim µοντέλο το οποίο εκτελεί συγκεκριµένη κίνηση φαίνεται αµέσως παρακάτω. #VRML V2.0 utf8 # ----------------------------------------------------- # --- Body Hierarchy Convertor v1.0 --- # --- copyright LIG/EPFL --- # --- From BodyLib to VRML2 --- # ----------------------------------------------------- PROTO Humanoid [ field SFString name "default" field MFString info [] exposedfield MFNode joints [] exposedfield MFNode segments [] ] WorldInfo title IS name info IS info PROTO Joint [ exposedfield SFString name "" exposedfield SFVec3f translation 0 0 0 exposedfield SFRotation rotation 0 0 1 0 exposedfield SFVec3f scale 1 1 1 exposedfield SFRotation scaleorientation 0 0 1 0 exposedfield SFVec3f center 0 0 0 exposedfield MFNode children [] exposedfield MFFloat ulimit [ 0 0 0 ] exposedfield MFFloat llimit [ 0 0 0 ] ] Transform translation IS translation rotation IS rotation Σελίδα 32

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML scale IS scale scaleorientation IS scaleorientation center IS center children IS children PROTO Segment [ exposedfield SFString name "" exposedfield SFFloat mass 0 exposedfield SFVec3f centerofmass 0 0 0 exposedfield SFVec3f bboxcenter 0 0 0 exposedfield SFVec3f bboxsize -1-1 -1 exposedfield MFNode children [ ] ] Transform children IS children DEF hanim_humanoidroot Transform # --- Hierarchy Top Level center 0.000000 1.063043 0.000000 children [ # --- Hierarchy Top Level Children DEF Viewpoints Group children [ DEF FrontView Viewpoint position 0 1.1 3 orientation 0 0 1 0 description "Bob Front View" ] # --- End of Viewpoints Children # --- End of Viewpoints Group DEF hanim_bodytouch TouchSensor Transform # --- Hierarchy Top Level Group children [ # --- Hierarchy Top Level Children DEF hanim_sacroiliac Joint name "sacroiliac" ulimit [1.570797 1.570797 1.570797] llimit [-1.570797-1.570797-1.570797] center 0.000000 1.063043 0.000000 children [ # --- Childrens of hanim_sacroiliac DEF hanim_pelvis Segment name "pelvis" children Inline url "BParts/lod0/Bob_hip.wrl" Σχήµα 2.7.3 : Κώδικας παραδείγµατος αρχείου VRML που περιγράφει κίνηση του H-Anim Σελίδα 33

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Μέσα στον κώδικα του παραπάνω αρχείου υπάρχει το εξής τµήµα: PROTO Joint [ exposedfield SFString name "" exposedfield SFVec3f translation 0 0 0 exposedfield SFRotation rotation 0 0 1 0 exposedfield SFVec3f scale 1 1 1 exposedfield SFRotation scaleorientation 0 0 1 0 exposedfield SFVec3f center 0 0 0 exposedfield MFNode children [] exposedfield MFFloat ulimit [ 0 0 0 ] exposedfield MFFloat llimit [ 0 0 0 ] ] Το τµήµα αυτό είναι το αρχέτυπο του κόµβου µιας άρθρωσης και περιγράφει τη διασύνδεση του κόµβου της άρθρωσης και των πεδίων που επιτρέπουν τον ορισµό και του και την πρόσβαση σ αυτόν [6]. Ο κόµβος άρθρωσης χρησιµοποιείται σαν δοµικό διάγραµµα (building block) για την περιγραφή της συναρµολόγησης του ανθρωποειδούς µοντέλου. Κάθε άρθρωση του µοντέλου αντιπροσωπεύεται από έναν κόµβο. Οι κόµβοι είναι οργανωµένοι σε µια ιεραρχία η οποία περιγράφει τον συνολικό σκελετό του ανθρωποειδούς και ορίζει τις ενυπάρχουσες σχέσεις «γονέα-παιδιού» (parent-child) µεταξύ των κόµβων του σκελετού ενώ επίσης παρέχει πληροφορίες or information συγκεκριµένες για κάθε άρθρωση. Αναλυτικά κάποια περιεχόµενα πεδία στο παραπάνω κοµβικό πρότυπο: name: Το πεδίο «όνοµα» χρησιµοποιείται για τον προσδιορισµό της ταυτότητας της άρθρωσης. Κάθε κόµβός άρθρωσης έχει ένα όνοµα ορισµού (DEF name) το οποίο αντιστοιχεί στο πεδίο «όνοµα» (name) του συγκεκριµένου κόµβου. Θα πρέπει να υπάρχει ένα πρόθεµα µπροστά από αυτό που θα το διακρίνει ως όνοµα κόµβου κάποιου συγκεκριµένου µοντέλου και το οποίο θα µπορεί να είναι οτιδήποτε µε την προϋπόθεση ότι θα είναι το ίδιο για όλους τους κόµβους που ανήκουν στο εκάστοτε ανθρωποειδές µοντέλο. Τo πρόθεµα αυτό αποδεικνύεται χρήσιµο στην περίπτωση της Σελίδα 34

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML ύπαρξης περισσότερων του ενός ανθρωποειδούς στο ίδιο αρχείο. Τότε ανάλογα το πρόθεµα είναι δυνατή η διάκριση του µοντέλου στο οποίο ανήκει ο κάθε κόµβος άρθρωσης. Αν σε ένα αρχείο είναι αποθηκευµένο µόνο ένα ανθρωποειδές τότε το πρόθεµα θα πρέπει να είναι hanim_". Για παράδειγµα ο αριστερός ώµος θα πρέπει να έχει ένα όνοµα ορισµού όπως "hanim_l_shoulder". rotation: Το πεδίο «περιστροφή» προδιαγράφει την περιστροφή του συστήµατος συντεταγµένων του κόµβου της άρθρωσης. Η ύπαρξη του πεδίου αυτού είναι απαραίτητη. Στη θέση αναφοράς του ανθρώπινου µοντέλου που φαίνεται στην εικόνα 2 του κεφαλαίου 2.3 [7]οι τιµές για τις γωνίες µε τους άξονες για όλους τους κόµβους πρέπει να βρίσκονται στην εξ ορισµού τιµή τους δηλαδή την (0 0 1 0). center: Το πεδίο «κέντρο» καθορίζει µία αντιστάθµιση µετατόπισης από τη βάση του σώµατος του ανθρωποειδούς Επειδή οι τιµές κέντρου όλων των κόµβων ορίζονται αναφορικά στο ίδιο πλαίσιο συντεταγµένων, το µήκος οποιουδήποτε ανατοµικού τµήµατος που βρίσκεται µεταξύ δύο κόµβων, µπορεί να προσδιορισθεί υπολογίζοντας την απόσταση ανάµεσα στο κέντρο του κόµβου «γονέας» και το αντίστοιχο του κόµβου «παιδί». children: Στο πεδίο «παιδιά» περιέχεται µια οµάδα από άλλους κόµβους οι οποίοι έχουν το ρόλο των κόµβων απογόνων γι αυτόν. ulimit, llimit: Τα πεδία «άνω όριο» και «κάτω όριο» καθορίζουν το πάνω και το κάτω αντίστοιχα όριο περιστροφής του κόµβου. Περιέχουν τρία στοιχεία το καθένα τα οποία είναι διακριτές τιµές για τα όρια στους τρεις άξονες x, y και z. Έτσι στο πεδίο άνω όριο (ulimit) field αποθηκεύονται η µέγιστες τιµές για την περιστροφή γύρω απο τους τρεις άξονες, ενώ στο κάτω όριο (llimit) αποθηκεύονται η ελάχιστες τιµές για την περιστροφή γύρω απο τους άξονες. Σηµειώνεται ότι οι εξ ορισµού τιµές για τα δύο πεδία είναι [], πράγµα το οποίο σηµαίνει ότι αρχικά δεν υπάρχει περιορισµός όσον αφορά την περιστροφή των αρθρώσεων του µοντέλου. Σελίδα 35

Κεφάλαιο ΙΙ -ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ ΚΑΙ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΜΟΝΤΕΛΩΝ MPEG-4 ΚΑΙ VRML Στον κώδικα του παραπάνω αρχείου υπάρχει επίσης το τµήµα: PROTO Segment [ exposedfield SFString name "" exposedfield SFFloat mass 0 exposedfield SFVec3f centerofmass 0 0 0 exposedfield SFVec3f bboxcenter 0 0 0 exposedfield SFVec3f bboxsize -1-1 -1 exposedfield MFNode children [ ] ] Το κοµµάτι αυτό είναι το αρχέτυπο του κόµβου ενός ανατοµικού τµήµατος του ανθρωποειδούς µοντέλου [8]. Ο κόµβος τµήµατος χρησιµοποιείται για την περιγραφή των χαρακτηριστικών γνωρισµάτων των φυσικών συνδέσµων ανάµεσα στις αρθρώσεις του VRML µοντέλου. Each body part (λεκάνη, µηρός κτλ) του ανθρωποειδούς αντιπροσωπεύεται από ένα κόµβο τµήµατος. Οι κόµβοι αυτοί είναι οργανωµένοι στη σκελετική τους ιεραρχία και περιέχουν πληροφορίες ειδικές για κάθε ανατοµικό τµήµα του σώµατος. Αναλυτικά κάποια περιεχόµενα πεδία στο παραπάνω κοµβικό πρότυπο: name: Το πεδίο «όνοµα» θα πρέπει να υπάρχει έτσι ώστε να αναγνωρίζεται η ταυτότητας ενός ανατοµικού τµήµατος. Όπως ο κόµβος άρθρωσης έτσι και ο κόµβος τµήµατος έχει ένα όνοµα ορισµού (DEF name) που αντιστοιχεί στο πεδίο «όνοµα» (name) του συγκεκριµένου κόµβου και µπροστά από το οποίο θα πρέπει να υπάρχει ένα πρόθεµα που θα το διακρίνει ως όνοµα κόµβου κάποιου συγκεκριµένου µοντέλου. Όταν αναφέρεται σε κίνηση ανθρωποειδούς µοντέλου το πρόθεµα θα πρέπει να είναι "hanim_". Για παράδειγµα ο αριστερός µηρός θα πρέπει να έχει ένα όνοµα ορισµού όπως "hanim_l_thigh mass: Στο πεδίο «όγκος» (mass) απο8ηκεύεται ο συνολικός όγκος του µοντέλου. Σελίδα 36