ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα πολυδιάστατου ψηφιακού σήµατος (Εικόνες Εικονοσειρές)» Πακέτο Εργασίας 1: Ανάπτυξη βάσης δεδοµένων εικόνων και εικονοσειρών ΠΑΡΑ ΟΤΕΟ Π1. Περιγραφή της βάσης δεδοµένων. Καβάλα 2007
Στόχος του Πακέτου Εργασίας 1 Στόχος του Πακέτου Εργασίας 1 είναι ο σχεδιασµός και η δηµιουργία µίας βάσης δεδοµένων η οποία θα φιλοξενήσει τις ψηφιακές εικόνες και τις εικονοσειρές, οι οποίες µπορούν να αποτελέσουν την βάση για την διεξαγωγή πειραµάτων µε σκοπό την αξιολόγηση των σύγχρονων µεθόδων που θα προαχθούν και θα αναπτυχθούν στα πλαίσια του παρόντος υποέργου. Επίσης περιλαµβάνει την δηµιουργία ιστοσελίδας και λογισµικού διασύνδεσης της ιστοσελίδας µε την βάση δεδοµένων µε σκοπό την χρήση της βάσης δεδοµένων από το διαδίκτυο και την παρουσίαση στο διαδίκτυο των αποτελεσµάτων του υποέργου. Τα παλαιότερα συστήµατα βάσεων δεδοµένων είχαν την ικανότητα να χειρίζονται µόνο αριθµητικά και αλφαριθµητικά δεδοµένα (κείµενο). Σήµερα ωστόσο, ένα σηµαντικό ποσοστό της πληροφορίας βρίσκεται σε µορφές όπως εικόνα και video. Οι ψηφιακές οπτικοακουστικές πληροφορίες έχουν αυξηθεί υπερβολικά. Τεράστιες ποσότητες πληροφορίας σε µορφή εικόνων, ακουστικών και τηλεοπτικών στοιχείων παράγονται και αποθηκεύονται καθηµερινά. Η υποστήριξη των τύπων αυτών απαιτεί ταχύτητα στην επεξεργασία και περισσότερο χώρο αποθήκευσης λόγω του µεγάλου όγκου. Οι Βάσεις εδοµένων Πολυµέσων έχουν τη δυνατότητα χειρισµού των σύνθετων αυτών τύπων δεδοµένων χρησιµοποιώντας βελτιστοποιηµένες τεχνικές αναζήτησης. Η συµπίεση, και η αρχειοθέτηση των οπτικοακουστικών πληροφοριών έχουν γίνει δηµοφιλείς και ανέξοδες, και υπάρχει µια ευρεία σειρά διαθέσιµου υλικού και λογισµικού για την υποστήριξη τέτοιων στόχων. Κατά την αποθήκευση των πληροφοριών µας πρέπει να φροντίσουµε για την πιο εύκολη και ασφαλή ανάκτησή τους. Απαιτείται πρόσθετη εργασία προκειµένου να είναι αποτελεσµατική και αποδοτική. Παρακάτω αναφέρονται τρεις διαφορετικοί τρόποι αναζήτησης των αποθηκευµένων πολυµέσων που συνηθίζονται: - Ελεύθερο ξεφύλλισµα (Free Browsing): οι χρήστες κοιτάζουν βιαστικά µέσω µιας συλλογής εικόνων, ήχου, και τηλεοπτικών αρχείων, µέχρις ότου βρουν τις επιθυµητές πληροφορίες. - Ανάκτηση βασισµένη σε κείµενο (Text - based Retrieval): στα οπτικοακουστικά αρχεία έχει προστεθεί κείµενο κατά τη διάρκεια του σταδίου καταχώρησης. Στη
φάση ανάκτησης, αυτές οι πρόσθετες πληροφορίες χρησιµοποιούνται για να καθοδηγήσουν τις µηχανές αναζήτησης ώστε να βρουν τα επιθυµητά στοιχεία. - Ανάκτηση βασισµένη στο περιεχόµενο (Content based retrieval): οι χρήστες ψάχνουν την αποθήκη πολυµέσων που παρέχει τις πληροφορίες µε βάση το πραγµατικό περιεχόµενο της εικόνας, του ήχου, ή της κινούµενης εικόνας. Η µηχανή αναζήτησης µεταφράζει τις αναγκαίες πληροφορίες µε κάποιο τρόπο ώστε να ρωτηθεί η Βάση εδοµένων και να ανακτηθούν τα «υποψήφια» δεδοµένα που ικανοποιούν το αίτηµα του χρήστη. Οι πρώτες δύο µέθοδοι έχουν διάφορους περιορισµούς. Η περίπτωση του «ελεύθερου ξεφυλλίσµατος» είναι κουραστική, ανεπαρκής, και χρονοβόρα και γίνεται απολύτως µη πρακτική για τις µεγάλες βάσεις δεδοµένων. Η αναζήτηση και η ανάκτηση που βασίζονται στο κείµενο υποφέρουν από δύο µεγάλα προβλήµατα που συνδέονται µε τη φάση της καταχώρησης: - Η χρονοβόρος προσπάθεια της καταχώρησης των σχολίων µεµονωµένα για κάθε δεδοµένο και - Η ανακρίβεια που συνδέεται µε την υποκειµενική ανθρώπινη αντίληψη για το σχολιασµό του περιεχοµένου. Παρά τα προβλήµατα, η λέξη κλειδί είναι ακόµα η δηµοφιλέστερη µέθοδος αναζήτησης οπτικών πληροφοριών στον Ιστό. ιάφορες γενικής χρήσης µηχανές αναζήτησης έχουν επεκτείνει τις ικανότητές τους στην αναζήτηση των οπτικών µέσων µε τη βοήθεια λέξεων κλειδιά, όπως για παράδειγµα Στοά Εικόνων του Yahoo (http://gallery.yahoo.com/), ο Ερευνητής Πολυµέσων Lycos (http://multimedia.lycos.com/), και o AltaVista Ανιχτευτής Φωτογραφιών (http://www.altavista.com/sites/search/simage). Προκειµένου να υπερνικηθούν οι ανεπάρκειες και οι περιορισµοί της κείµενοβασισµένης ανάκτησης των προηγουµένως σχολιασµένων οπτικών στοιχείων, πολλοί ερευνητές, άρχισαν να ερευνούν τους πιθανούς τρόπους αναζήτησης των οπτικών πληροφοριών βασισµένους απλώς στο περιεχόµενό τους. Με άλλα λόγια, αντί να σχολιαστούν µε το χέρι χρησιµοποιώντας τις λέξεις κλειδιά, οι εικόνες και οι εικονοσειρές θα συντάσσονταν από το οπτικό περιεχόµενό τους, όπως το χρώµα, τη
σύσταση, τη µορφή των αντικειµένων κλπ. Η έρευνα στον τοµέα της αναζήτησης των οπτικών πληροφοριών µε βάση το περιεχόµενό τους άρχισε στις αρχές του 1990. Πολλές ερευνητικές οµάδες σε πανεπιστήµια, ερευνητικά ιδρύµατα καθώς και σε ιδιωτικές επιχειρήσεις εργάζονται ενεργά µέχρι και σήµερα για την άψογη αναζήτηση και ανάκτηση της επιθυµητής εικόνας και εικονοσειράς, δηλαδή γρήγορα, αποδοτικά και βέβαια χωρίς σφάλµατα. [James Z. Wang, INTEGRATED REGION- BASED IMAGE RETRIEVAL, KLUWER ACADEMIC PUBLISHERS] [Oge Marques Borko Furht, CONTENT-BASED IMAGE AND VIDEO RETRIEVAL, KLUWER ACADEMIC PUBLISHERS] Στο κείµενο που ακολουθεί περιγράφεται η βάση δεδοµένων εικόνων και εικονοσειρών που αναπτύχθηκε στα πλαίσια του υποέργου «ΑΝΑΚΤΗΣΗ ΚΑΙ ΠΡΟΣΤΑΣΙΑ ΠΝΕΥΜΑΤΙΚΩΝ ΙΚΑΙΩΜΑΤΩΝ ΣΕ Ε ΟΜΕΝΑ ΠΟΛΥ ΙΑΣΤΑΤΟΥ ΨΗΦΙΑΚΟΥ ΣΗΜΑΤΟΣ (ΕΙΚΟΝΕΣ ΕΙΚΟΝΟΣΕΙΡΕΣ)» του έργου «ΑΡΧΙΜΗ ΗΣ: ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΟ ΤΕΙ ΚΑΒΑΛΑΣ».
Π1. Περιγραφή της βάσης δεδοµένων. Μετά από βιβλιογραφική έρευνα και ανταλλαγή απόψεων µεταξύ των µελών της ερευνητικής οµάδας σχεδιάστηκε η µορφή της βάσης δεδοµένων εικόνων και εικονοσειρών, όπως εµφανίζεται στο Σχήµα 1. Καθορίστηκε µια ιεραρχική δοµή βασικών κατηγοριών ταξινόµησης των εικόνων που αποτελούν ουσιαστικά τις κωδικές λέξεις για την δεικτοδότηση των εικόνων και αντιστοιχούν σε πίνακες της βάσης δεδοµένων. Σχήµα 1 Με βάση την δοµή της ταξινόµησης µία εικόνα κατατάσσεται σε µία κατηγορία ανάλογα µε το περιεχόµενό της. Μία εικόνα µπορεί να κατατάσσεται σε περισσότερες από µία κατηγορίες εφόσον το περιεχόµενό της ανήκει σε περισσότερες από τις κατηγορίες αυτές. Για παράδειγµα αν µία εικόνα περιέχει ένα σκύλο και ένα δέντρο θα πρέπει να ενταχθεί τόσο στην κατηγορία ΖΩΑ όσο και στην κατηγορία ΦΥΤΑ. Η ιεραρχική δοµή επιτρέπει την εξέλιξη της βάσης δεδοµένων σε µικρότερες κατηγορίες. Έτσι αν κάποιος επιθυµεί µπορεί εύκολα να εισάγει ιεραρχικά χαµηλότερες κατηγορίες. Για παράδειγµα µπορεί να ορίσει για την κατηγορία ΖΩΑ τις ιεραρχικά χαµηλότερες κατηγορίες ΣΚΥΛΟΙ, ΓΑΤΕΣ και ΑΛΛΑ ΖΩΑ. Για την συγκεκριµένη εφαρµογή επιλέχθηκαν συνολικά 29 κατηγορίες σε ιεραρχική δοµή που φαίνεται στο Σχήµα 1. Οι κατηγορίες εµφανίζονται διαγραµµατικά χωρισµένες σε δύο µεγάλες οµάδες, το ΦΥΣΙΚΟ και το ΑΝΘΡΩΠΙΝΟ. Η κάθε οµάδα, περιέχει υποοµάδες οι οποίες περιέχουν άλλες υποοµάδες. Η κατηγορία εικόνων και εικονοσειρών µε θέµα φυσικά φαινόµενα και δηµιουργήµατα, για το ΦΥΣΙΚΟ, περιέχει τις υποκατηγορίες ΑΝΘΡΩΠΟΙ, ΦΥΤΑ, ΖΩΑ και ΤΟΠΙΑ. Η κατηγορία µε θέµα ανθρώπινες δηµιουργίες, για το ΑΝΘΡΩΠΙΝΟ, περιέχει τις υποκατηγορίες ΡΑΣΤΗΡΙΟΤΗΤΕΣ, ΚΑΤΑΣΚΕΥΕΣ και ΓΡΑΦΙΚΑ. Στη συνέχεια, η οµάδα ΑΝΘΡΩΠΟΙ (που περιέχεται στο ΦΥΣΙΚΟ), περιέχει τις κατηγορίες ΠΡΟΣΩΠΟ, ΑΤΟΜΑ και ΠΛΗΘΟΣ και τελειώνοντας µε την οµάδα ΦΥΣΙΚΟ, η οµάδα ΠΡΟΣΩΠΟ (που περιέχεται στο ΑΝΘΡΩΠΟΙ), περιέχει τις κατηγορίες ΑΝ ΡΑΣ και ΓΥΝΑΙΚΑ. Η οµάδα
ΡΑΣΤΗΡΙΟΤΗΤΕΣ (που περιέχεται στο ΑΝΘΡΩΠΙΝΟ), περιέχει τις κατηγορίες ΨΥΧΑΓΩΓΙΑ, ΚΟΙΝΩΝΙΚΕΣ, ΕΠΑΓΓΕΛΜΑ, ΠΟΛΙΤΙΚΕΣ και ΠΟΛΕΜΙΚΕΣ και η οµάδα ΨΥΧΑΓΩΓΙΑ, περιέχει δύο κατηγορίες, την ΜΟΥΣΙΚΗ και την ΑΘΛΗΤΙΣΜΟΣ. Η οµάδα ΚΑΤΑΣΚΕΥΕΣ (που περιέχεται στο ΑΝΘΡΩΠΙΝΟ), περιέχει τις κατηγορίες ΜΕΤΑΦΟΡΙΚΑ ΜΕΣΑ, ΚΤΙΡΙΑ και ΑΝΤΙΚΕΙΜΕΝΑ και η οµάδα ΚΤΙΡΙΑ, περιέχει τις κατηγορίες ΕΣΩΤΕΡΙΚΟ και ΕΞΩΤΕΡΙΚΟ. Τελειώνοντας µε την οµάδα ΑΝΘΡΩΠΙΝΟ, η οµάδα ΓΡΑΦΙΚΑ, περιέχει τις κατηγορίες CARTOONS, ΓΡΑΦΗΜΑΤΑ και INTROS. Περιεχόµενο κατηγοριών Ξεκινώντας από κάτω προς τα πάνω σύµφωνα µε τον πίνακα του σχήµατος 1, η κατηγορία ΑΝ ΡΑΣ, περιέχει εικόνες και εικονοσειρές που προβάλουν αποκλειστικά το πρόσωπο ενός άνδρα, από τη µέση και πάνω, µε ευδιάκριτα τα χαρακτηριστικά του προσώπου και σταθερό background χωρίς κίνηση της κάµερας για τα video. Το ίδιο ισχύει και για την κατηγορία ΓΥΝΑΙΚΑ, όπου περιέχονται εικόνες και εικονοσειρές µε πρόσωπα γυναικών. Η κατηγορία ΠΡΟΣΩΠΟ, περιέχει εικόνες και εικονοσειρές µε ένα ή και δύο πρόσωπα ανδρών και γυναικών, από τη µέση και πάνω, χωρίς απαραίτητα να είναι ευδιάκριτα όλα τα χαρακτηριστικά των προσώπων τους. Οι εικόνες και εικονοσειρές που προβάλουν δύο και περισσότερα άτοµα όπου διακρίνονται τα ανθρώπινα χαρακτηριστικά τους, ανήκουν στην κατηγορία ΑΤΟΜΑ, ενώ κάθε περίπτωση που έχει αρκετά άτοµα χωρίς να ξεχωρίζουν τα ανθρώπινα χαρακτηριστικά τους, ανήκει την κατηγορία ΠΛΗΘΟΣ. Κάθε άλλη περίπτωση όπου για παράδειγµα προβάλλεται το πρόσωπο ενός άνδρα, µε ευδιάκριτα τα χαρακτηριστικά του προσώπου του, χωρίς κίνηση του background αλλά διακρίνονται τα χέρια του, ανήκει στην κατηγορία ΑΝΘΡΩΠΟΙ. Στην κατηγορία ΦΥΤΑ ανήκουν εικόνες και εικονοσειρές που προβάλουν φυτά, δέντρα, κήπους, πάρκα κ.ά.. Στην κατηγορία ΖΩΑ ανήκουν τα ζώα όπου διακρίνονται τα χαρακτηριστικά του προσώπου ή του σώµατός τους. Στην κατηγορία ΤΟΠΙΑ ανήκουν βουνά, θάλασσες, κάµποι, ειδυλλιακά τοπία κ.ά.. Τέλος, η κατηγορία ΦΥΣΙΚΟ περιέχει εικόνες και εικονοσειρές που προβάλουν κάποιο φυσικό φαινόµενο ή κάτι που δεν είναι δηµιούργηµα του ανθρώπου και δεν µπορεί να περιληφθεί στις υποκατηγορίες ΑΝΘΡΩΠΟΙ, ΦΥΤΑ, ΖΩΑ και ΤΟΠΙΑ.
Στην κατηγορία ΑΝΘΡΩΠΙΝΟ, ξεκινώντας από κάτω προς τα πάνω όπως φαίνεται στο σχήµα 5, στην κατηγορία ΜΟΥΣΙΚΗ, ανήκουν εικόνες και εικονοσειρές που προβάλουν άτοµα να παίζουν µουσική µε κάποιο µουσικό όργανο, άτοµα να τραγουδάνε κ.ά.. Στην κατηγορία ΑΘΛΗΤΙΣΜΟΣ, ανήκουν άτοµα που ασχολούνται µε κάποιο άθληµα όπως κανό, σκι, ποδόσφαιρο και στην κατηγορία ΨΥΧΑΓΩΓΙΑ, ό,τι δεν περιλαµβάνεται στις ΜΟΥΣΙΚΗ και ΑΘΛΗΤΙΣΜΟΣ όπως κάποιο άτοµο να πλέκει ή να διαβάζει κάποιο βιβλίο. Στην κατηγορία ΚΟΙΝΩΝΙΚΕΣ, ανήκουν εικόνες και εικονοσειρές που προβάλουν κάποια βάφτιση, γάµο ή κηδεία. Στην κατηγορία ΕΠΑΓΓΕΛΜΑ, ανήκουν άτοµα εν ώρα εργασίας, όπως κάποιος εργάτης σε οικοδοµή ή κάποιος υπάλληλος σε γραφείο. Στην κατηγορία ΠΟΛΙΤΙΚΕΣ, ανήκουν άτοµα που συνεδριάζουν για παράδειγµα στη βουλή ή άτοµα σε κάποια συνάντηση πολιτικού περιεχοµένου. Στην κατηγορία ΠΟΛΕΜΙΚΕΣ, ανήκουν πολεµικές καταστάσεις όπως πλήθος εν ώρα µάχης και βοµβαρδισµών. Τελειώνοντας, στην κατηγορία ΡΑΣΤΗΡΙΟΤΗΤΕΣ, ανήκουν εικόνες και εικονοσειρές που δεν µπορούν να περιληφθούν στις υποκατηγορίες ΨΥΧΑΓΩΓΙΑ, ΚΟΙΝΩΝΙΚΕΣ, ΕΠΑΓΓΕΛΜΑ, ΠΟΛΙΤΙΚΕΣ και ΠΟΛΕΜΙΚΕΣ και χαρακτηρίζουν κάποια δραστηριότητα. Στην κατηγορία ΕΣΩΤΕΡΙΚΟ, ανήκουν εικόνες και εικονοσειρές που προβάλουν το εσωτερικό µέρος ενός κτιρίου, ενώ στην κατηγορία ΕΞΩΤΕΡΙΚΟ, ανήκουν αυτές που προβάλουν το εξωτερικό µέρος ενός κτιρίου. Στην κατηγορία ΚΤΙΡΙΑ, ανήκουν αυτές που προβάλουν πλήθος κτιρίων στα οποία δεν διακρίνονται τα χαρακτηριστικά τους. Στην κατηγορία ΜΕΤΑΦΟΡΙΚΑ ΜΕΣΑ, ανήκουν τα αυτοκίνητα, τα λεωφορεία, τα αεροπλάνα και κάθε είδους µεταφορικό µέσω. Στην κατηγορία ΑΝΤΙΚΕΙΜΕΝΑ, ανήκουν κάθε είδους αντικείµενα όπως ένα τασάκι, µπουκάλια, ρούχα, νοµίσµατα, καρέκλες κ.ά. και διακρίνονται τα χαρακτηριστικά τους. Τελειώνοντας, στην κατηγορία ΚΑΤΑΣΚΕΥΕΣ, ανήκουν εικόνες και εικονοσειρές που δεν µπορούν να περιληφθούν στις υποκατηγορίες ΜΕΤΑΦΟΡΙΚΑ ΜΕΣΑ, ΚΤΙΡΙΑ και ΑΝΤΙΚΕΙΜΕΝΑ. Στην κατηγορία CARTOONS, περιλαµβάνονται εικόνες και εικονοσειρές που προβάλουν κινούµενα σχέδια όπως οι υπερήρωες. Η κατηγορία ΓΡΑΦΗΜΑΤΑ, περιλαµβάνει διαγράµµατα, στατιστικούς πίνακες και η κατηγορία INTROS, περιλαµβάνει γραφικά, όπως εισαγωγές εκποµπών µε κινούµενα αντικείµενα ή
εξώφυλλα βιβλίων. Η κατηγορία ΓΡΑΦΙΚΑ, περιλαµβάνει ότι δεν µπορεί να περιληφθεί στις υποκατηγορίες CARTOONS, ΓΡΑΦΗΜΑΤΑ και INTROS. Τέλος, η κατηγορία ΑΝΘΡΩΠΙΝΟ, περιλαµβάνει εικόνες και εικονοσειρές που προβάλουν κάποιο δηµιούργηµα του ανθρώπου και δεν ανήκει στις υποκατηγορίες ΡΑΣΤΗΡΙΟΤΗΤΕΣ, ΚΑΤΑΣΚΕΥΕΣ και ΓΡΑΦΙΚΑ. Η βάση δεδοµένων αποτελείται από 29 πίνακες όσες και οι κατηγορίες που επιλέχθηκαν στον σχεδιασµό της βάσης. Ο κάθε πίνακας αποτελείται από εννέα πεδία από τα οποία το ένα είναι το πρωτεύον κλειδί του. Τα ονόµατα και οι τύποι των πεδίων είναι σε όλους τα ίδια και αυτό γιατί εξυπηρετεί το σκοπό για τον οποίο σχεδιάστηκαν. Ο σκοπός που εξυπηρετεί η οµοιότητα σχεδίασής τους είναι, ότι ο κάθε πίνακας καθορίζει µια κατηγορία και στον κάθε πίνακα-κατηγορία περιέχονται εικόνες και εικονοσειρές µε κοινό θέµα και διαφορετικά χαρακτηριστικά. Τα χαρακτηριστικά αυτών, αποτελούν τα πεδία του πίνακα στον οποίο περιέχονται. Έτσι, οι πίνακες διαφέρουν ως προς το θεµατικό περιεχόµενο και όχι ως προς τη δοµή τους. Όπως έχει ήδη αναφερθεί, τα πεδία είναι ίδια σε όλους τους πίνακες. Ο κάθε πίνακας αποτελείται, εκτός από τα έξι πεδία που χαρακτηρίζουν τις εικόνες και τις εικονοσειρές, από ένα πρωτεύον κλειδί και δύο υποθετικά πεδία για µελλοντική χρήση. Το πρωτεύον κλειδί εγγυάται τη µοναδικότητα κάθε εγγραφής. Επίσης ένα πεδίο χαρακτηρίζει αν πρόκειται για εικόνα ή εικονοσειρά. Τα υπόλοιπα πέντε πεδία χαρακτηριστικών περιγράφουν το πλάτος και το ύψος των εικόνων ή της εικονοσειράς, τη διάρκεια της εικονοσειράς, το όνοµα και τον τύπο του αρχείου. Η υλοποίηση της βάσης δεδοµένων περιγράφεται στη συνέχεια.