Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Προηγµένα Συστήµατα Υπολογιστών και Επικοινωνιών

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Προηγµένα Συστήµατα Υπολογιστών και Επικοινωνιών"

Transcript

1 Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ιατµηµατικό ιαπανεπιστηµιακό Πρόγραµµα Σπουδών : Προηγµένα Συστήµατα Υπολογιστών και Επικοινωνιών Αυτόµατη Εύρεση Ground-truth Εικόνων για την Εκπαίδευση Ταξινοµητών ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ του Τριαντάφυλλου Θ. Τσιρέλη Επιβλέπων: Αναστάσιος Ντελόπουλος Επίκουρος Καθηγητής Θεσσαλονίκη, Σεπτέµβριος 2010

2 Abstract Digital images are part of our everyday life and have become more easily accessible following the rapid advances in digital photography, networking and storage technologies. The everyday usage of this multimedia content in combination with its exponential growth have made efficient image management and retrieval a necessity. Image classification is a step towards this direction. Automatic retrieval of grount-truth is very important in cases where the training of classifiers is a requirement. In this paper a system for automatic generation of ground-truth images is described. The system classifies a dataset of 269,648 tagged images from Flickr based on their relevancy to a given concept. The goal of the system is the efficient retrieval of a sufficient number of images that can be used for the training of supervised classifiers. The semantic similarity between the tags that describe an image and the given concept is calculated and used as a relevancy metric between the image and the concept. The images are classified in ranked lists based on this relevancy metric. The system is comprised of parts for data pre-processing, synonym retrieval, Natural Language Processing and corpus-based semantic similarity calculations. Experiments were conducted concerning the evaluation of the classification results and the effective training of an SVM classifier. The experimental results indicate that the system is effective and that the training of other classifiers based on our approach can be efficient.

3 Περίληψη Οι ψηφιακές εικόνες είναι µέρος της καθηµερινής Ϲωής µας και έχουν γίνει ευπρόσιτες µε την τεράστια πρόοδο της ψηφιακής ϕωτογραφίας, του διαδικτύου και της αποθήκευσης δεδοµένων. Η καθηµερινή χρήση πολυµέσων σε συνδυασµό µε την εκθετική αύξηση τους έχει καταστήσει την διαχείριση και την ανάκτηση εικόνων αναγκαία. Η ταξινόµηση εικόνων είναι ένα ϐήµα προς αυτήν την κατεύθυνση. Η αυτόµατη παραγωγή σώµατος αληθείας είναι ση- µαντική σε περιπτώσεις όπου η εκπαίδευση ταξινοµητών είναι προϋπόθεση. Στην παρούσα διπλωµατική περιγράφουµε ένα σύστηµα αυτόµατης εύρεσης εικόνων αληθείας. Το σύστηµα ταξινοµεί ένα σύνολο εικόνων του Flickr µε ϐάση τη σχετικότητά τους µε κάποια δεδοµένη έννοια. Ο στόχος του συστήµατος είναι η ανάκτηση ενός ικανοποιητικού αριθµού εικόνων που µπορεί να χρησιµοποιηθεί για την εκπαίδευση επιβλεπόµενων ταξινοµητών. Υπολογίζεται η σηµασιολογική οµοιότητα ανάµεσα στις ετικέτες που περιγράφουν µια εικόνα και σε µια δεδοµένη έννοια και χρησιµοποιείται ως ένα µέτρο σχετικότητας µεταξύ της εικόνας και της έννοιας. Οι εικόνες ταξινο- µούνται σε λίστες µε σειρά σχετικότητας µε ϐάση αυτό το µέτρο. Το σύστηµα αποτελείται από µέρη προεπεξεργασίας δεδοµένων, εύρεσης συνωνύµων, ε- πεξεργασία ϕυσικής γλώσσας και υπολογισµούς σηµασιολογικής οµοιότητας λέξεων. Πειράµατα σχετικά µε την αξιολόγηση του συστήµατος και την αποτελεσµατική εκπαίδευση ενός SVM ταξινοµητή έλαβαν χώρα. Τα πειράµατα δείχνουν ότι το σύστηµα είναι αποτελεσµατικό και ότι η εκπαίδευση ταξινο- µητών ϐασισµένη στην προσέγγισή µας µπορεί να είναι αποδοτική.

4 ΠΕΡΙΕΧΟΜΕΝΑ Κατάλογος Σχηµάτων 8 Κατάλογος Πινάκων 12 I Εισαγωγή 13 1 Το Πρόβληµα Η αύξηση των ψηφιακών εικόνων Η ανάγκη για διαχείρηση των εικόνων Ταξινόµηση εικόνων Στόχος και οµή της Εργασίας Στόχος οµή

5 ΠΕΡΙΕΧΟΜΕΝΑ 5 II Θεωρητικό Υπόβαθρο 19 3 Ταξινοµητές Εικόνων Μη-επιβλεπόµενη ταξινόµηση Επιβλεπόµενη ταξινόµηση Αριθµός κατηγοριών Αξιολόγηση ταξινοµητών Σηµασιολογική Οµοιότητα Λέξεων Μέτρα ϐασισµένα σε συλλογές κειµένων Μέτρα ϐασισµένα σε λεξικολογικές ϐάσεις δεδοµένων Υβριδικά µέτρα III Υλοποίηση Συστήµατος 27 5 Εργαλεία και εδοµένα Python Natural Language Toolkit WordNet Corpora Brown corpus Stop-word corpus NUS-WIDE Στάδια Υλοποίησης και Λειτουργίας Καθορισµός έννοιας Εύρεση συνωνύµων

6 ΠΕΡΙΕΧΟΜΕΝΑ Επεξεργασία δεδοµένων Εύρεση οµοιότητας εικόνων - έννοιας Εύρεση σηµασιολογικής οµοιότητας Ϲευγών λέξεων Εύρεση σηµασιολογικής οµοιότητας συνόλων λέξεων ηµιουργία των δεδοµένων εκπαίδευσης IV Πειράµατα & Αποτελέσµατα 42 7 Αξιολόγηση Συστήµατος Μέθοδος αξιολόγησης ιαδικασία αξιολόγησης Αποτελέσµατα αξιολόγησης Καµπύλες ndcg Average ndcg Ανάλυση αποτελεσµάτων Εκπαίδευση SVM Support Vector Machines εδοµένα εδοµένα εκπαίδευσης εδοµένα ελέγχου Μέθοδοι αξιολόγησης Πειραµατική διαδικασία Αποτελέσµατα Ελεγχος Ελεγχος

7 ΠΕΡΙΕΧΟΜΕΝΑ Ανάλυση αποτελεσµάτων V Επίλογος 91 9 Συµπεράσµατα Προτάσεις Περαιτέρω Βελτίωσης 94 Βιβλιογραφία 96

8 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ 6.1 Καθορισµός έννοιας Εύρεση συνωνύµων Κάθε εικόνα Ι αντιπροσωπεύεται µε ένα σύνολο ετικετών (tags) Το µέτρο AAMS ανάµεσα σε δύο σύνολα λέξεων Συνοπτική λειτουργία του συστήµατος Κατηγοριοποίηση των επιλεγµένων εννοιών Καµπύλη ndcg για την έννοια animal Καµπύλη ndcg για την έννοια beach Καµπύλη ndcg για την έννοια bicycle Καµπύλη ndcg για την έννοια boat Καµπύλη ndcg για την έννοια building Καµπύλη ndcg για την έννοια butterfly Καµπύλη ndcg για την έννοια car Καµπύλη ndcg για την έννοια cloud

9 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ Καµπύλη ndcg για την έννοια computer Καµπύλη ndcg για την έννοια cow Καµπύλη ndcg για την έννοια desert Καµπύλη ndcg για την έννοια elephant Καµπύλη ndcg για την έννοια face Καµπύλη ndcg για την έννοια flower Καµπύλη ndcg για την έννοια food Καµπύλη ndcg για την έννοια football Καµπύλη ndcg για την έννοια frost Καµπύλη ndcg για την έννοια hand Καµπύλη ndcg για την έννοια house Καµπύλη ndcg για την έννοια moon Καµπύλη ndcg για την έννοια mountain Καµπύλη ndcg για την έννοια night Καµπύλη ndcg για την έννοια person Καµπύλη ndcg για την έννοια plane Καµπύλη ndcg για την έννοια police Καµπύλη ndcg για την έννοια pyramid Καµπύλη ndcg για την έννοια reflection Καµπύλη ndcg για την έννοια sky Καµπύλη ndcg για την έννοια snow Καµπύλη ndcg για την έννοια sport Καµπύλη ndcg για την έννοια sun Καµπύλη ndcg για την έννοια temple Καµπύλη ndcg για την έννοια train

10 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ Καµπύλη ndcg για την έννοια tree Καµπύλη ndcg για την έννοια waterfall Καµπύλη ndcg για την έννοια window Καµπύλη ndcg για την έννοια woman Γραφική παράσταση average ndcg Καµπύλη ndcg για τα 3 σενάρια της έννοιας boat Καµπύλη ndcg για τα 3 σενάρια της έννοιας flower Καµπύλη ndcg για τα 3 σενάρια της έννοιας moon Καµπύλη ndcg για τα 3 σενάρια της έννοιας plane Καµπύλη ndcg για τα 3 σενάρια της έννοιας tree average ndcg για τα 3 σενάρια της έννοιας boat average ndcg για τα 3 σενάρια της έννοιας flower average ndcg για τα 3 σενάρια της έννοιας moon average ndcg για τα 3 σενάρια της έννοιας plane average ndcg για τα 3 σενάρια της έννοιας tree Καµπύλη ndcg για τα 3 σενάρια της έννοιας boat Καµπύλη ndcg για τα 3 σενάρια της έννοιας flower Καµπύλη ndcg για τα 3 σενάρια της έννοιας moon Καµπύλη ndcg για τα 3 σενάρια της έννοιας plane Καµπύλη ndcg για τα 3 σενάρια της έννοιας tree average ndcg για τα 3 σενάρια της έννοιας boat average ndcg για τα 3 σενάρια της έννοιας flower average ndcg για τα 3 σενάρια της έννοιας moon average ndcg για τα 3 σενάρια της έννοιας plane

11 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ average ndcg για τα 3 σενάρια της έννοιας tree

12 ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ 5.1 Στατιστικά στοιχεία του Wordnet Λίστα εννοιών που χρησιµοποιήθηκαν Τιµές average ndcg Βέλτιστες τιµές C και γ για κάθε περίπτωση Τιµές Average ndcg Τιµές Average ndcg και Average Precision

13 Μέρος I Εισαγωγή 13

14 ΚΕΦΑΛΑΙΟ 1 ΤΟ ΠΡΟΒΛΗΜΑ 1.1 Η αύξηση των ψηφιακών εικόνων Η χρήση εικόνων στην ανθρώπινη Ϲωή και επικοινωνία δεν είναι κάτι το καινούριο. Οι «Ϲώντες σε σπηλιές» πρόγονοί µας Ϲωγράφιζαν εικόνες στους τοίχους των «κατοικιών» τους. Επίσης, η χρήση χαρτών και σχεδίων κατασκευής χρονολογείται στους προ-ρωµαϊκούς χρόνους. Στον εικοστό όµως αιώνα παρατηρήθηκε ασύγκριτη αύξηση στον αριθµό, τη διαθεσιµότητα και τη σηµασία των εικόνων, σε όλους τους τοµείς της Ϲωής µας. Οι εικόνες την σήµερον ηµέρα παίζουν έναν κρίσιµο ϱόλο σε τοµείς τόσο διαφορετικούς όσο η ιατρική, η δηµοσιογραφία, η διαφήµηση, η παιδεία και η ψυχαγωγία. Η τεχνολογία, µε τη µορφή εφευρέσεων όπως η ϕωτογραφία και η τηλεόραση, έχει παίξει έναν µεγάλο ϱόλο στην διευκόλυνση της σύλληψης και προβολής εικόνων. Παρ όλα αυτά, η πραγµατική τροχοπέδη για την επανάσταση της εικόνας υπήρξε ο ηλεκτρονικός υπολογιστής. Με την έλευση του ηλεκτρονικού υπολογιστή ήρθε και µια µεγάλη ποικιλία τεχνικών για ψηφιακή σύλληψη, ψηφιακή επεξεργασία, αποθήκευση και διάδοση των εικόνων. 14

15 Το Πρόβληµα 15 Η συµµετοχή των υπολογιστών στον τοµέα των εικόνων χρονολογείται το 1963 µε την κατασκευή απο τον Ivan Sutherland του λογισµικού Sketchpad [1] κατά τη διδακτορική του διατριβή. Το λογισµικό αυτό έκανε επίδειξη του πόσο είναι εφικτή η δηµιουργία και ο χειρισµός εικόνων µε ηλεκτρονικό υ- πολογιστή, καθώ και η αποθήκευσή τους. Το µεγάλο κόστος, όµως, του υλικού περιόρισε την χρήση του µέχρι τα µέσα του Μόλις η επεξεργασία εικόνων µε ηλεκτρονικό υπολογιστή έγινε προσιτή, γρήγορα διείσδυσε σε τοµείς στους οποίους η εικόνα παίζει σηµαντικό ϱόλο, όπως η µηχανική και η ιατρική. Επίσης, µουσεία και ϐιβλιοθήκες εικόνων είδαν γρήγορα τα πλεονεκτήµατα του να κάνουν τις συλλογές τους διαθέσιµες σε ηλεκτρονική µορφή. Η δηµιουργία του Παγκόσµιου Ιστού (World Wide Web) εκτίναξε την εκµετάλλευση των ψηφιακών εικόνων, δίνοντας τη δυνατότητα σε κάθε µέσο χρήστη να έχει πρόσβαση σε ποικιλίες δεδοµένων οπουδήποτε στον πλανήτη. 1.2 Η ανάγκη για διαχείρηση των εικόνων Με τον αριθµό των χρηστών και των δεδοµένων να αυξάνει εκθετικά, είναι ευνόητο ότι ένα ϐασικό πρόβληµα που ανακύπτει είναι η δυσκολία εύρεσης µιας επιθυµητής εικόνας µέσα σε αυτόν τον τεράστιο όγκο δεδοµένων. Σαν αποτέλεσµα, η εύκολη διαχείρηση του µεγάλου όγκου δεδοµένων και η εύ- ϱεση της Ϲητούµενης σε κάθε περίπτωσης εικόνας, έχει καταστεί πλέον µια αναγκαιότητα. Η αναγκαιότητα αυτή οδηγεί στην αναζήτηση µεθόδων αποτελεσµατικής οργάνωσης και αυτόµατης διαχείρησης των πληροφοριών, µεθόδων που κάνουν εύκολη την εύρεση σχετικών µε την αναζήτηση δεδοµένων. Βασικός παράγοντας είναι το γεγονός ότι η χρήση των µεθόδων αυτών ϑα πρέπει να είναι όσο το δυνατό πιο απλή και εύκολη, καθώς απευθύνεται στο µέσο χρήστη. Σε αυτή την κατεύθυνση, µια κατηγορία µεθόδων είναι µέθοδοι οι οποίες έχουν ως αντικείµενο την ταξινόµηση πληροφοριών µε ϐάση κάποιο κριτήριο.

16 Το Πρόβληµα 16 Με την ταξινόµηση επιτυγχάνεται η καλύτερη οργάνωση του µεγάλου όγκου των πληροφοριών και η ευκολότερη εύρεσή τους από κάθε ενδιαφερόµενο. Το πεδίο εφαρµογής αγγίζει το κάθε είδος πληροφορίας, είτε αυτή είναι κείµενο, είτε ήχος, είτε εικόνα, είτε ϐίντεο. 1.3 Ταξινόµηση εικόνων Σκοπός της ταξινόµησης εικόνων (image classification) είναι να αποφασιστεί αν µία εικόνα ανήκει σε µια συγκεκριµένη κατηγορία ή όχι. Πολλοί διαφορετικοί τύποι κατηγοριών έχουν προταθεί από προγενέστερες έρευνες. Για παράδειγµα, κατηγορίες µε ϐάση συγκεκριµένα αντικείµενα όπως ποδήλατα, αυτοκίνητα κτλ. ή κατηγορίες µε ϐάση σκηνές. Εστω, λοιπόν, ότι ϑέλουµε να ταξινοµήσουµε ψηφιακές εικόνες µε ϐάση µια συγκεκριµένη έννοια (concept) ή όχι. Να ϐρούµε δηλαδή ποιές ανήκουν στην κατηγορία που καθορίζει η έννοια και ποιές όχι. Ενας τρόπος µε τον οποίο µπορεί να λυθεί αυτό το πρόβληµα είναι η χρήση ενός δυαδικού ταξινοµητή εικόνων (ϐλ. 3.3). Στην περίπτωση επιβλεπόµενης ταξινόµησης (ϐλ. 3.2), ο δυαδικός ταξινοµητής µπορεί να εκπαιδευτεί από µια συλλογή εικόνων προσηµασµένων αν ανήκουν στην κατηγορία ή όχι (ground-truth images). Για την σωστή εκπαίδευση και την καλή απόδοση του ταξινοµητή, όµως, χρειάζεται ένας µεγάλος αριθµός τέτοιων εικόνων. Αν ο αριθµός των εικόνων αυτών ήταν µικρός, η εργασία καθορισµού για το ποιές είναι ϑετικές και ποιές αρνητικές ϑα µπορούσε να γίνει απο έναν ή παραπάνω χρήστες «µε το χέρι». υστυχώς ο µεγάλος αριθµός εικόνων κάνει απαγορευτικό τον «µε το χέρι» καθορισµό ground-truth εικόνων. Αυτό το γεγονός δίνει κίνητρο για την εύρεση µεθόδων οι οποίες αντιµετωπίζουν το πρόβληµα εύρεσης επαρκούς αριθµού εικόνων για την χρήση τους στην εκπαίδευση ταξινοµητών.

17 ΚΕΦΑΛΑΙΟ 2 ΣΤΟΧΟΣ ΚΑΙ ΟΜΗ ΤΗΣ ΕΡΓΑΣΙΑΣ 2.1 Στόχος Στην παρούσα διπλωµατική εργασία υλοποιείται, παρουσιάζεται και αξιολογείται ένα σύστηµα αυτόµατης εύρεσης ground-truth εικόνων. Το σύστηµα παίρνει ένα σύνολο εικόνων και, µε κριτήριο το κατά πόσο αυτές απεικονί- Ϲουν µια έννοια (concept), τις ταξινοµεί µε σειρά σχετικότητας (relevancy) σε ϑετικές και αρνητικές προς την έννοια. Σκοπός της υλοποίησης του συστήµατος είναι η ανάκτηση ενός επαρκούς αριθµού ground-truth εικόνων, οι οποίες ϑα χρησιµοποιηθούν ως δεδοµένα εκπαίδευσης στην εκπαίδευση ταξινοµητών εικόνων. 2.2 οµή Στο Μέρος II δίνουµε τις απαραίτητες ϐασικές γνώσεις που ϑα εφοδιάσουν τον αναγνώστη κατάλληλα ώστε να κατανοήσει καλύτερα την υλοποίηση και την αξιολόγηση του συστήµατος της παρούσας διπλωµατικής εργασίας. Στο 17

18 Στόχος και οµή της Εργασίας 18 Κεφάλαιο 3 δίνεται το ϐασικό ϑεωρητικό υπόβαθρο σχετικά µε τους ταξινο- µητές εικόνων και στο Κεφάλαιο 4 δίνονται οι ϐασικές γνώσεις για κάποια Ϲητήµατα σηµασιολογικής οµοιότητας λέξεων τα οποία αντιµετωπίστηκαν κατά την υλοποίηση του συστήµατος. Στο Μέρος III περιγράφεται η υλοποίηση του συστήµατος καθώς και η δοµή και λειτουργία του. Στο Κεφάλαιο 5 παρουσιάζονται τα εργαλεία και τα δεδοµένα που χρησιµοποιήθηκαν και στο Κεφάλαιο 6 παρουσιάζεται αναλυτικά η διαδικασία κατά την οποία υλοποποιήθηκε και λειτουργεί το σύστηµα. Στο Μέρος IV παρουσιάζονται τα πειράµατα που έλαβαν χώρα. Στο Κε- ϕάλαιο 7 γίνεται η εφαρµογή του συστήµατος, συλλέγονται αποτελέσµατα ταξινόµησης και αξιολογούνται σχετικά µε την αποδοτικότητα του συστήµατος. Στο Κεφάλαιο 8 γίνεται η χρήση αποτελεσµάτων ταξινόµησης του συστήµατός µας για την εκπαίδευση ενός SVM ταξινοµητή και αξιολογείται η αποδοτικότητά του. Τέλος, στο Μέρος V έχουµε τον επίλογο. Στο Κεφάλαιο 9 συνοψίζουµε και παρουσιάζουµε τα συµπεράσµατα στα οποία έχουµε καταλήξει και στο Κεφάλαιο 10 δίνουµε προτάσεις για περαιτέρω ϐελτίωση του συστήµατος.

19 Μέρος II Θεωρητικό Υπόβαθρο 19

20 ΚΕΦΑΛΑΙΟ 3 ΤΑΞΙΝΟΜΗΤΕΣ ΕΙΚΟΝΩΝ Η πιο ϐασική διάκριση των τεχνικών ταξινόµησης είναι αυτή σε επιβλεπόµενες τεχνικές (supervised) και σε µη-επιβλεπόµενες (unsupervised). Ο όρος «επίβλεψη» µας ϕέρνει στο νου την ιδέα ενός καθηγητή να καθοδηγείεπιβλέπει τη διαδικασία εκµάθησης. Ουσιαστικά, στην περίπτωσή µας, η κα- ϑοδήγηση αυτή έρχεται στη µορφή σηµασιοδοτηµένων (labeled) δεδοµένων. Η καθοδήγηση αυτή είναι απούσα στις τεχνικές µη-επιβλεπόµενης µάθησης. 3.1 Μη-επιβλεπόµενη ταξινόµηση Στην περίπτωση των τεχνικών µη επιβλεπόµενης µάθησης, έχουµε µη ση- µασιοδοτηµένα (unlabeled) δεδοµένα. Σκοπός είναι οι µη-σηµασιοδοτηµένες εικόνες να διαχωριστούν, χωρίς τη χρήση επιπλέον γνώσης, σε συστάδες (clusters) µε τέτοιο τρόπο ώστε τα περιεχόµενα µεταξύ των εικόνων µέσα στην ίδια συστάδα να είναι πιο όµοια σε σχέση µε αυτά εικόνων που ανήκων σε διαφορετικές συστάδες. Τα ϐασικά πλεονεκτήµατα των µεθόδων αυτών είναι ότι µπορούν να χειριστούν µεγάλους όγκους δεδοµένων και ότι δεν απαιτεί- 20

21 Ταξινοµητές Εικόνων 21 ται ϕάση εκπαίδευσης για την λειτουργία τους. Κάποιες µη-επιβλεπόµενες τεχνικές ταξινόµησης είναι οι k-means [2] και η ιεραρχική οµαδοποίηση (hierarchical clustering) [3]. 3.2 Επιβλεπόµενη ταξινόµηση Σε αυτό το είδος τεχνικών, τα δεδοµένα µας είναι σηµασιοδοτηµένα. Τα σηµασιοδοτηµένα δεδοµένα χωρίζονται σε δεδοµένα εκπαίδευσης (training data) και σε δεδοµένα δοκιµής (test data). Κάθε ένα από τα δεδοµένα εκπαίδευσης είναι ένα Ϲευγάρι µιας εισόδου, η οποία είναι συνήθως ένα διάνυσµα, και της αντίστοιχης επιθυµητής εξόδου της (supervisory signal). Κατά τη διαδικασία εκπαίδευσης, το σύστηµα αναλύει τα δεδοµένα εκπαίδευσης και κατασκευάζει µια συνάρτηση (inferred function) που απεικονίζει τις δεδοµένες εισόδους στις επιθυµητές εξόδους. Απώτερος στόχος είναι η συνάρτηση αυτή να µπορεί να προβλέψει τη σωστή έξοδο για οποιαδήποτε έγκυρη είσοδο στο σύστηµα, να µπορεί δηλαδή να γενικεύσει και για εισόδους µε άγνωστη έξοδο. Γι αυτό το λόγο τα δεδοµένα εκπαίδευσης πρέπει να είναι επαρκή. Τα δεδοµένα δοκιµής χρησιµοποιούνται για να ελεγχθεί κατά πόσο ο ταξινο- µητής λειτουργεί επιθυµητά. Κάποιες τεχνικές αυτής της κατηγορίας είναι οι Naive Bayes [4], k-nearest Neighbor (knn) [5], Support Vector Machines (SVM) [6, 7], τεχνητά νευρωνικά δίκτυα (artificial neural networks) και άλλες. Αξίζει να αναφέρουµε ότι υπάρχουν και τεχνικές στις οποίες δεν είναι όλα τα δεδοµένα σηµασιοδοτηµένα αλλά µόνο ένα µέρος τους. Οι τεχνικές αυτές ανήκουν στην κατηγορία της ηµι-επιβλεπόµενης ταξινόµησης (semisupervised classification).

22 Ταξινοµητές Εικόνων Αριθµός κατηγοριών Ενας επίσης σηµαντικός διαχωρισµός των προβληµάτων ταξινόµησης εικόνων είναι αυτός µε ϐάση το σε πόσες κατηγορίες µπορεί να ανήκει µία εικόνα [8]. ιακρίνουµε τρείς περιπτώσεις : Binary classification: Ο αριθµός των κατηγοριών στις οποίες µπορούν να ταξινοµηθούν οι εικόνες είναι δύο και κάθε εικόνα µπορεί να ανήκει µόνο σε µία από τις δύο κατηγορίες. Multi-class classification: Ο αριθµός των κατηγοριών στις οποίες µπορούν να ταξινοµηθούν οι εικόνες είναι µεγαλύτερος από δύο αλλά κάθε εικόνα µπορεί να ανήκει µόνο σε µία από τις πολλές κατηγορίες. Multi-label classification: Ο αριθµός των κατηγοριών στις οποίες µπορούν να ταξινοµηθούν οι εικόνες είναι µεγαλύτερος από δύο και κάθε εικόνα µπορεί να ανήκει σε µία ή παραπάνω από αυτές. 3.4 Αξιολόγηση ταξινοµητών Η απόδοση ενός ταξινοµητή εξαρτάται κατά ένα µεγάλο ϐαθµό στα χαρακτηριστικά των δεδοµένων προς ταξινόµηση. εν υπάρχει κάποιος ταξινοµητής ο οποίος έχει την καλύτερη απόδοση σε όλα τα προβλήµατα ταξινόµησης. Αυτό το ϕαινόµενο ίσως µπορεί να εξηγηθεί από το ϑεώρηµα no-free-lunch [9, 10]. Ετσι, στον τοµέα της αναγνώρισης προτύπων (pattern recognition), η σχέση µεταξύ των δεδοµένων προς ταξινόµηση και της απόδοσης του ταξινο- µητή είναι ένα πρόβληµα που δεν έχει επιλυθεί πλήρως. Εχουν ϐέβαια γίνει διάφορες έρευνες και πειράµατα προς αυτήν την κατεύθυνση, αλλά ακόµη ο καθορισµός του κατάλληλου ταξινοµητή για ένα συγκεκριµένο πρόβληµα είναι περισσότερο τέχνη παρά επιστήµη.

23 Ταξινοµητές Εικόνων 23 Για την αξιολόγηση των αποτελεσµάτων ταξινόµησης έχουν αναπτυχθεί διάφορες µετρικές. ύο ϐασικές µετρικές που έχουν υιοθετηθεί από την επιστηµονική κοινότητα είναι η ακρίβεια (precision) και ανάκληση (recall) [11, 12, 13]. υστυχώς, συνήθως ταξινοµητές µε καλή ανάκληση δεν έχουν τόσο καλή ακρίβεια και το αντίστροφο. Υπάρχει δηλαδή αυτή η ανταλλαγή (trade-off) ανάµεσα σε ανάκληση και ακρίβεια. Τα δύο µέτρα αυτά είναι ικανά να αξιολογήσουν αποτελέσµατα στα οποία δεν ενδιαφέρει η σειρά σχετικότητας µε το κριτήριο κατά το οποίο έχουν ταξινοµηθεί οι εικόνες. Ενα σηµαντικό µέτρο, το οποίο χρησιµοποιεί την ακρίβεια την ανάκληση, και µπορεί να χρησιµοποιηθεί για την αξιολόγηση αποτελεσµάτων στα οποία τα δεδοµένα είναι ταξινοµηµένα κατά σχετικότητα σε λίστες (ranked lists), είναι η µέση ακρίβεια (average precision) [11, 13]. Επίσης, πολύ σηµαντικές τεχνικές αξιολόγησης για τον ίδιο σκοπό είναι οι τεχνικές ϐασισµένες σε αθροιστικό κέρδος (cumulated gain-based) [14].

24 ΚΕΦΑΛΑΙΟ 4 ΣΗΜΑΣΙΟΛΟΓΙΚΗ ΟΜΟΙΟΤΗΤΑ ΛΕΞΕΩΝ Η σηµασιολογική οµοιότητα αναφέρεται στο ϐαθµό µε τον οποίο δύο έννοιες ή λέξεις συσχετίζονται σηµασιολογικά, ή όχι. Οι άνθρωποι είναι σε ϑέση να κρίνουν εύκολα εάν ένα Ϲευγάρι λέξεων συσχετίζεται µε κάποιο τρόπο. Πα- ϱαδείγµατος χάριν, οι περισσότεροι ϑα συµφωνούσαν ότι οι λέξεις µήλο και πορτοκάλι συσχετίζονται περισσότερο απ ότι οι λέξεις µήλο και οδοντόβουρτσα. Γενικότερα, όταν συγκρίνονται συγγενικές λέξεις όπως µήλο και πορτοκάλι ή ηλεκτρονικός υπολογιστής και πληκτρολόγιο, µπορούµε να πούµε ότι αυτές οι λέξεις έχουν στενή σχέση µεταξύ τους. Οντως, οι λέξεις µήλο και πορτοκάλι είναι υπώνυµα (is-a relation) του ϕρούτου και το πληκτρολόγιο είναι µερώνυµο (part-of realtion) του ηλεκτρονικού υπολογιστή. Εντούτοις, ακόµη και λέξεις οι οποίες δεν έχουν καµιά συγγένεια µεταξύ τους, µπορεί να συνδέονται σηµασιολογικά, όπως για παράδειγµα δέντρο και σκιά ή γυ- µναστική και ϐάρη. Συµπερασµατικά, δύο λέξεις µπορούν να συσχετίζονται σηµασιολογικά όχι µόνο εάν είναι συγγενικές (π.χ. υπώνυµα, µερώνυµα κτλ.) αλλά και όταν µοιράζονται οποιαδήποτε σηµασιολογική οµοιότητα. Πολλά διαφορετικά µέτρα καθορισµού σηµασιολογικής οµοιότητας µεταξύ των Ϲευγαριών λέξεων έχουν προταθεί. Κάποια από αυτά χρησιµοποιούν 24

25 Σηµασιολογική Οµοιότητα Λέξεων 25 στατιστικές τεχνικές και ϐασίζονται σε µεγάλες συλλογές κειµένων (corpora), κάποια άλλα χρησιµοποιούν λεξικολογικές ϐάσεις δεδοµένων, όπως λεξικά ή ϑησαύρους, ϐασιζόµενα στη γνώση που περιέχουν οι ϐάσεις αυτές και κάποια άλλα µέτρα συνδυάζουν τις παραπάνω προσεγγίσεις. 4.1 Μέτρα ϐασισµένα σε συλλογές κειµένων Οι περισσότερες τεχνικές αυτού του είδους (corpus-based measures) ϐασίζονται στην ιδέα των κοινών εµφανίσεων (co-occurences) δύο λέξεων. ύο λέξεις που έχουν πολλές κοινές εµφανίσεις σε ένα κείµενο, µια παράγραφο, µια πρόταση ή µια συγκεκριµένη απόσταση, τότε είναι πολύ πιθανό να είναι σηµασιολογικά όµοιες. Και αντίστροφα, αν δύο λέξεις είναι σηµασιολογικά όµοιες, τότε είναι πιθανό να έχουν πολλές κοινές εµφανίσεις. Για παράδειγ- µα, οι λέξεις αυτοκίνητο και όχηµα αναµένεται να έχουν έναν µεγάλο αριθµό κοινών εµφανιζόµενων λέξεων όπως οι : χώρος στάθµευσης, γκαράζ, ατύχηµα, κυκλοφορία κτλ., σε µια µεγάλη συλλογή κειµένων. Τα κυριότερα µέτρα αυτού του είδους είναι τα : Pointwise Mutual Information for Information Retrieval (PMI-IR) [15], Latent Semantic Analysis (LSA) [16], Hyperspace Analogues to Language (HAL) [17], µέτρο συνηµιτόνου (cosine measure) [18], απόκλιση Jensen-Shannon [19], συντελεστής Jaccard (Jaccard s coefficient) [20] και διάφορα άλλα [21, 22]. 4.2 Μέτρα ϐασισµένα σε λεξικολογικές ϐάσεις δεδοµένων Σ αυτήν την κατηγορία ανήκουν µέτρα καθορισµού σηµασιολογικής ο- µοιότητας λέξεων τα οποία ϐασίζονται στη γνώση που περιέχουν λεξικολογικές ϐάσεις δεδοµένων (knowledge-based measures). Καθώς οι λέξεις σε αυτού

26 Σηµασιολογική Οµοιότητα Λέξεων 26 του είδους τις ϐάσεις ακολουθούν µια ιεραρχία και σχηµατίζουν ένα σηµασιολογικό δίκτυο λέξεων, συνήθως αυτού του είδους τα µέτρα ϐασίζονται σε αποστάσεις κόµβων του δικτύου, δηλαδή των λέξεων. Τα περισσότερα µέτρα αυτού του είδους ϐασίζονται στο Wordnet [23]. Τα κυριότερα από αυτά είναι τα : µέτρο Resnik [24], µέτρο Lin [25], µέτρο Jiang- Conrath [26], µέτρο Leacock-Chodorow [27], µέτρο Wu-Palmer [28], µέτρο Banerjee-Pedersen [29] και άλλα [30, 31, 32]. 4.3 Υβριδικά µέτρα Τα υβριδικά µέτρα (Hybrid measures) χρησιµοποιούν και µέτρα που ϐασίζονται σε συλλογές κειµένων και µέτρα που ϐασίζονται στη γνώση. Για πα- ϱάδειγµα, το µέτρο που προτείνεται στο [33] χρησιµοποιεί δύο corpus-based µέτρα, τα PMI-IR και LSA και έξι knowledge-based µέτρα, τα Jiang-Conrath, Leacock-Chodorow, Lesk [34], Lin, Resnik, Wu-Palmer. Τα αποτελέσµατα συνδυάζονται και το µέτρο σηµασιολογικής οµοιότητας λέξεων που υπολογίστηκε χρησιµοποιείται για τον καθορισµό σηµασιολογικής οµοιότητας µεταξύ κειµένων. Το κύριο µειονέκτηµα αυτής της µεθόδου είναι ότι υπολογίζει την οµοιότητα των λέξεων από οκτώ διαφορετικές µεθόδους, µε αποτέλεσµα να µην είναι υπολογιστικά αποδοτική.

27 Μέρος III Υλοποίηση Συστήµατος 27

28 ΚΕΦΑΛΑΙΟ 5 ΕΡΓΑΛΕΙΑ ΚΑΙ Ε ΟΜΕΝΑ 5.1 Python Η Python [35] είναι µια δυναµική (dynamic), ερµηνευόµενη (interpreted) γλώσσα προγραµµατισµού υψηλού επιπέδου (high-level programming language) γενικής χρήσης. Η ϕιλοσοφία της δίνει έµφαση στην εύκολη αναγνωσιµότητα του κώδικα, συνδυαζόµενη µε την υπολογιστική δύναµη και στην εύκολη επέκτασή της σε εφαρµογές γραµµένες µε άλλες γλώσσες, όπως C/C++. Η γλώσσα Python δεν ανήκει σε κάποιο προγραµµατιστικό παράδειγµα (programming paradigm), εποµένως υποστηρίζει αντικειµενοστραφή objectoriented προγραµµατισµό, δοµηµένο (structured), συναρτησιοκεντρικό προγραµµατισµό (functional) και άλλες µορφές προγραµµατισµού. Χαρακτηρί- Ϲεται από ένα πλήρως δυναµικό σύστηµα τύπων και µια αυτόµατη διαχείριση µνήµης, παρόµοια µε αυτή των Ruby, Perl και Tcl. Μπορεί να χρησιµοποιηθεί σε ένα ευρύ πεδίο εφαρµογών, από διαδικτυακό προγραµµατισµό (network programming) και πρόσβαση σε ϐάσεις δεδο- 28

29 Εργαλεία και εδοµένα 29 µένων µέχρι σχεδιασµό γραφικών διεπαφών (GUIs), ηλεκτρονικών παιχνιδιών και τρισδιάστατων γραφικών. Επίσης είναι κατάλληλη για τις εργασίες διαχείρησης σειρών χαρακτήρων (character strings) και είναι σχετικά εύκολη στην εκµάθησή της. Η εφαρµογή υλοποιήθηκε εξ ολοκλήρου µε τη γλώσσα Python. Εκτός της στάνταρ ϐιβλιοθήκης της γλώσσας Python, χρησιµοποιήθηκαν και κάποια άλλα modules: NumPy: ιευκολύνει την χρήση πινάκων µεγάλων διαστάσεων µε αριθµητικά δεδοµένα, καθώς και τις πράξεις µε πίνακες τέτοιου είδους [36]. MatPlotLib: Χρησιµοποιείται στο σχεδιασµό γραφικών παραστάσεων τύπου MATLAB [37]. Psyco: Είναι ένας just-in-time (JIT) compiler που επιταχύνει την εκτέλεση προγραµµάτων γραµµένα σε Python [38] 5.2 Natural Language Toolkit Το Natural Language Toolkit (NLTK) [39] είναι ένα πακέτο εργαλείων, ϐιβλιοθηκών και προγραµµάτων για τη συµβολική και στατιστική επεξεργασία ϕυσικής γλώσσας (Natural Language Processing - NLP). ηµιουργήθηκε από το Τµήµα Επιστήµης Υπολογιστών και Πληροφοριών του πανεπιστηµίου της Pennsylvania και είναι γραµµένο στη γλώσσα Python. Το NLTK είναι κατάλληλο για εφαρµογές που αφορούν του τοµείς όπως γνωστική επιστήµη, τεχνητή νοηµοσύνη, ανάκτηση πληροφοριών, και µηχανική µάθηση. Στην παρούσα διπλωµατική το NLTK χρησιµοποιήθηκε για την µετατροπή κεφαλαίων γραµµάτων των λέξεων σε πεζά, για την εξαγωγή ϑέµατος από λέξεις (stemming), για την χρήση του WordNet και για τη χρήση και επεξεργασία του Brown coprus.

30 Εργαλεία και εδοµένα WordNet Το WordNet είναι µια λεξικολογική ϐάση δεδοµένων γνώσης της αγγλικής γλώσσας [23]. ηµιουργήθηκε και διατηρείται στο Γνωστικό Εργαστήριο Επιστήµης του Πανεπιστηµίου Princeton και περιέχει περισσότερους από όρους (ουσιαστικά, ϱήµατα, επίθετα και επιρρήµατα). Γίνεται ο διαχωρισµός µεταξύ ουσιαστικών, ϱηµάτων, επιθέτων και επιρρηµάτων διότι ακολουθούνται διαφορετικοί κανόνες γραµµατικής. Οι όροι οµαδοποιούνται σε σύνολα γνωστικών συνωνύµων που ονοµάζονται synsets. Κάθε synset εκ- ϕράζει µια ευδιάκριτη έννοια και περιέχει µια σύντοµη περιγραφή (gloss). Τα synsets και οι όροι τους διασυνδέονται µεταξύ τους µέσω σηµασιολογικών και λεξικολογικών σχέσεων και έτσι ορίζεται ένας ιεραρχηµένος σηµασιολογικός ιστός (semantic net). Σαν αποτέλεσµα, το WordNet µπορεί να χρησιµοποιη- ϑεί σε εφαρµογές τεχνητής νοηµοσύνης. POS Οροι Synsets Σύνολο λέξεων - σηµασιών Ουσιαστικά Ρήµατα Επίθετα Επιρρήµατα Σύνολο Πίνακας 5.1: Στατιστικά στοιχεία του Wordnet Στα πλαίσια της εργασίας, το WordNet χρησιµοποιήθηκε για την εύρεση συνωνύµων λέξεων (ϐλ. 6.2). Σηµειώνουµε ότι η χρήση του έγινε µέσω του Natural Language Toolkit, το οποίο παρέχει τη διεπαφή για την πρόσβαση στο WordNet.

31 Εργαλεία και εδοµένα Corpora Κατά την υλοποίηση του συστήµατος αναγκαία ήταν και η χρήση συλλογών κειµένων και λέξεων. Οι συλλογές κειµένων που χρησιµοποιήθηκαν είναι : Brown corpus Το Brown corpus [40] είναι µια συλλογή κειµένων της αγγλικής γλώσσας. Αποτελείται από 500 κείµενα 15 διαφορετικών ειδών (genres). Κάθε κείµενο αποτελείται περίπου από λέξεις. Ετσι, η συλλογή περιέχει συνολικά λέξεις. Το Brown corpus επιλέχθηκε ανάµεσα από άλλα corpora, για τους εξής λόγους : Η χρήση του είναι δωρεάν Είναι εύκολα προσβάσιµο από το Natural Language Toolkit Περιέχει κείµενα από διάφορες κατηγορίες (ειδήσεις, λογοτεχνία κτλ.) Το µέγεθός του είναι αρκετά µεγάλο και ικανοποιητικό για την εφαρ- µογή µας Το Brown corpus χρησιµοποιήθηκε στη διπλωµατική µας στο στάδιο υ- πολογισµού της σηµασιολογικής οµοιότητας µεταξύ Ϲευγών λέξεων Stop-word corpus Οι stop-words είναι λειτουργικές λέξεις οι οποίες µπορούν να αφαιρεθούν από κείµενα κατά την επεξεργασία τους σε εφαρµογές επεξεργασίας ϕυσικής

32 Εργαλεία και εδοµένα 32 γλώσσας, χωρίς να αλάξει κάτι. Οι λέξεις the και and είναι δύο τέτοια πα- ϱαδείγµατα. εν υπάρχει µια προκαθορισµένη συλλογή τέτοιων λέξεων την οποία να χρησιµοποιούν όλα τα εργαλεία επεξεργασίας ϕυσικής γλώσσας. Στην παρούσα εργασία χρησιµοποιήθηκε το stop-word corpus που συντάχθηκε από τον Martin Porter [41] και αποτελείται από stop-words για έντεκα γλώσσες. Χρησιµοποιήθηκε µε σκοπό το ϕιλτράρισµά τους από το Brown corpus. 5.5 NUS-WIDE Το NUS-WIDE [42] είναι µία ϐάση δεδοµένων εικόνων του διαδικτύου που δηµιουργήθηκε από το Εργαστήριο Αναζήτησης Πολυµέσων του Εθνικού Πανεπιστηµίου της Σινγκαπούρης. Η ϐάση αυτή περιλαµβάνει : εικόνες του Flickr [43] τις αντίστοιχες ετικέτες tags των εικόνων αυτών, µε συνολικό αριθµό µοναδικών ετικετών έξι τύπους χαρακτηριστικών χαµηλού επιπέδου (low-level features) από τις εικόνες αυτές (χρώµα, υφή κτλ.) ground-truth για 81 έννοιες Τα δεδοµένα του NUS-WIDE ήταν τα ϐασικά δεδοµένα που χρησιµοποιήσαµε τόσο στην υλοποίηση του συστήµατος, όσο και στα στάδια των πειρα- µάτων µας.

33 ΚΕΦΑΛΑΙΟ 6 ΣΤΑ ΙΑ ΥΛΟΠΟΙΗΣΗΣ ΚΑΙ ΛΕΙΤΟΥΡΓΙΑΣ 6.1 Καθορισµός έννοιας Αρχικά πρέπει να δοθεί η έννοια µε ϐάση την οποία ϑα αποφασίσει το σύστηµά µας ποιές εικόνες είναι ϑετικές και ποιές αρνητικές. Αφού δοθεί η έννοια, κάποιος ειδικός (expert), που µπορεί να είναι και ο χρήστης, µε ϐάση τη δεδοµένη έννοια δίνει ένα σύνολο λέξεων οι οποίες καθορίζουν την έννοια. Αυτές οι λέξεις πρέπει να σχετίζονται σηµασιολογικά στο µέγιστο δυνατό ϐαθ- µό µε την έννοια και να είναι όσο το δυνατό περισσότερες. Για παράδειγµα, αν η δεδοµένη έννοια είναι το αεροπλάνο, ο ειδικός ϑα µπορούσε να ϐρει τις λέξεις αεροπλάνο, ϕτερό, ουρανός, επιβάτης, πτήση, πιλοτήριο και άλλες. Εδώ πρέπει να επισηµάνουµε πως το στάδιο αυτό είναι πολύ σηµαντικό και πρέπει να δοθούν λέξεις οι οποίες σχετίζονται άµεσα µε την σηµασία της δεδοµένης έννοιας. Ετσι, είναι προτιµότερο ο ειδικός να δώσει λίγες λέξεις µε µεγάλη σηµασιολογική οµοιότητα, παρά πολλές όχι και τόσο σχετικές. Αν δοθούν άσχετες λέξεις, µπορούν να επηρεάσουν το αποτέλεσµα της ταξινόµησης. 33

34 Στάδια Υλοποίησης και Λειτουργίας 34 Ετσι, σε αυτό το στάδιο µε ϐάση µια έννοια C δίνουµε ένα σύνολο λέξεων W 1 = {w 11, w 12,..., w 1i,..., w 1m }, οι οποίες σηµασιολογικά σχετίζονται άµεσα µε την έννοια (Σχήµα 6.1). Σχήµα 6.1: Καθορισµός έννοιας 6.2 Εύρεση συνωνύµων Σε αυτό το στάδιο κάνουµε χρήση του WordNet και ϐρίσκουµε τα συνώνυµα των λέξεων του συνόλου W 1. Αναλυτικότερα, για κάθε λέξη του συνόλου λέξεων που καθορίζει την έννοια χρησιµοποιούµε το WordNet και ϐρίσκουµε τα συνώνυµά της. Κάνοντάς το αυτό για όλες τις λέξεις του W 1 καταλήγουµε σε ένα µεγαλύτερο σύνολο W 2 = {w 21, w 22,..., w 2j,..., w 2n }. Το W 2, εφόσον όλες οι λέξεις του W 1 ϐρίσκονται στο WordNet, είναι υπερσύνολο του W 1. Το στάδιο αυτό παρουσιάζεται παραστατικά στο Σχήµα Επεξεργασία δεδοµένων Οπως προαναφέρθηκε, τα δεδοµένα που ϑα χρησιµοποιήσουµε στην υ- λοποίηση του συστήµατός µας τα παίρνουµε από τη ϐάση NUS-WIDE. Από το σύνολο των δεδοµένων του NUS-WIDE αυτά που χρησιµοποιούµε σε αυτό το στάδιο της υλοποίησής µας είναι :

35 Στάδια Υλοποίησης και Λειτουργίας 35 Σχήµα 6.2: Εύρεση συνωνύµων Εικόνες : Χρησιµοποιούµε ολόκληρο το σύνολο των εικόνων του Flickr. Στο σύνολο των εικόνων αυτών δεν περιέχονται διπλές εικόνες, εικόνες µε πολύ µικρό µέγεθος, ούτε εικόνες µε ακατάλληλο λόγο διαστάσεων ύψους-πλάτους. Ετικέτες : Σε κάθε εικόνα αντιστοιχεί και ένα σύνολο ετικετών (tags) που την περιγράφουν. Οι ετικέτες κάθε εικόνας περιέχονται όλες στο WordNet. Η µορφή των δεδοµένων αυτών είναι ως εξής : κάθε εικόνα της ϐάσης χαρακτηρίζεται από ένα µοναδικό ID σε µία λίστα περιέχονται τα IDs και οι εικόνες που αντιστοιχούν σε αυτά σε µία λίστα περιέχονται τα IDs τα tags που αντιστοιχούν σε κάθε ID Εποµένως, αυτό που κάνουµε σε αυτό το στάδιο είναι να συνδέσουµε κάθε µία από τις εικόνες µε το tagset που αντιστοιχεί σε αυτήν. Ετσι, σχηµατίζουµε µια ϐάση δεδοµένων στην οποία κάθε εικόνα I συνδέεται µε ένα σύνολο ετικετών T = {t 1, t 2,..., t k,..., t l } που την αντιπροσωπεύουν (Σχήµα 6.3).

36 Στάδια Υλοποίησης και Λειτουργίας 36 Σχήµα 6.3: Κάθε εικόνα Ι αντιπροσωπεύεται µε ένα σύνολο ετικετών (tags) 6.4 Εύρεση οµοιότητας εικόνων - έννοιας Μέχρι εδώ, έχουµε ϕτάσει στο σηµείο όπου έχουµε µια έννοια C, η οποία χαρακτηρίζεται από ένα σύνολο λέξεων W 2, και ένα σύνολο εικόνων στο οποίο κάθε εικόνα I χαρακτηρίζεται από ένα σύνολο ετικετών T. Πώς είναι, λοιπόν, δυνατό να ϐρούµε την εννοιολογική οµοιότητα κάθε εικόνας I µε την έννοια C; Κάποιος εύλογα ϑα µπορούσε να σκεφτεί ότι µπορούµε να ϐρούµε την εννοιολογική οµοιότητα µεταξύ της έννοιας και κάθε εικόνας ϐρίσκοντας την σηµασιολογική οµοιότητα ανάµεσα στα δύο σύνολα λέξεων W 2 και T Εύρεση σηµασιολογικής οµοιότητας Ϲευγών λέξεων Για να ϐρούµε τη σηµασιολογική οµοιότητα µεταξύ δύο συνόλων λέξεων πρέπει πρώτα να ϐρούµε τη σηµασιολογική οµοιότητα όλων των Ϲευγών λέξεων µεταξύ του πρώτου και του δεύτερου συνόλου. Η διαδικασία καθορισµού σηµασιολογικής οµοιότητας µεταξύ δύο λέξεων που ακολουθήσαµε χρησιµοποιεί το corpus-based µέτρο PMI-IR [15] και περιγράφεται αναλυτικά στη συνέχεια : Κανονικοποίηση των συνόλων : Για κάθε λέξη των δύο συνόλων W 2 και T µετατρέπουµε τα κεφαλαία γράµµατα, εφόσον υπάρχουν, σε πεζά και κάνουµε εξαγωγή του ϑέµατός τους (stemming). Επίσης, στην περίπτω-

37 Στάδια Υλοποίησης και Λειτουργίας 37 ση που σε κάθε σύνολο υπάρχουν λέξεις που εµφανίζονται πάνω από µία ϕορές, τότε αυτές αφαιρούνται από το σύνολο στο οποίο ανήκουν. Κανονικοποίηση του corpus: Για κάθε λέξη σε κάθε κείµενο του Brown Corpus µετατρέπουµε τα κεφαλαία γράµµατα, εφόσον υπάρχουν, σε πεζά και κάνουµε εξαγωγή του ϑέµατός τους (stemming). Επίσης, κάνουµε αφαίρεση των stop-words και, στην περίπτωση που σε κάθε κεί- µενο υπάρχουν λέξεις που εµφανίζονται πάνω από µία ϕορές, τότε αυτές αφαιρούνται από το κείµενο στο οποίο ανήκουν. Υπολογισµός του PMI-IR: Το µέτρο αυτό, όπως αναφέρθηκε και στο 4.1 ϐασίζεται στην κοινή εµφάνιση (co-occurence) και στην ϐασική ιδέα ότι µια λέξη χαρακτηρίζεται από τα συµφαζόµενά της. Ο υπολογισµός του PMI-IR για δύο λέξεις word1 και word2 γίνεται ως εξής : P MI IR = log 2 probability(word1&word2) probability(word1)probability(word2) (6.1) Η Σχέση (6.1) στην περίπτωσή µας όπου ϑέλουµε να ϐρούµε το PMI- IR για όλα τα δυνατά Ϲεύγη µεταξύ των λέξεων των συνόλων W 2 και T γίνεται : P MI IR (w 2j, t k ) = log 2 probability(w 2j &t k ) probability(w 2j )probability(t k ) (6.2) για j = 1,..., n και k = 1,..., l Από τις τέσσερις παραλλαγές του µέτρου που προτείνονται στο [15], εµείς χρησιµοποιούµε την περίπτωση στην οποία λέµε ότι δύο λέξεις έχουν κοινή εµφάνιση όταν εµφανίζονται µαζί στο ίδιο κείµενο του corpus µας. Ετσι µας ενδιαφέρει ο αριθµός των κειµένων στα οποία οµο-εµφανίζονται. Αν εµφανίζονται µαζί πάνω από µια ϕορές στο ίδιο κείµενο, τότε εννοείται ότι αυτό δεν µας ενδιαφέρει. Ετσι, για κάθε δυνατό Ϲεύγος λέξεων, αν n word είναι ο αριθµός των κειµένων στα οποία

38 Στάδια Υλοποίησης και Λειτουργίας 38 εµφανίζεται µόνη της κάποια λέξη, n c είναι ο αριθµός των κειµένων στα οποία έχουµε κοινή εµφάνιση των δύο λέξεων και n είναι ο συνολικός αριθµός των κειµένων του corpus, τότε η Σχέση (6.2) γίνεται : P MI IR (w 2j, t k ) = log 2 n c n n w2j n tk n n = log 2 n c n w2j n tk n (6.3) Από τη Σχέση (6.3) ο λογάριθµος µπορεί να παραληφθεί χωρίς να επη- ϱεάσει τα αποτελέσµατά µας, αφού είναι γνησίως αύξουσα συνάρτηση. Επίσης, ο αριθµός των κειµένων του corpus µας είναι για κάθε Ϲευγάρι ο ίδιος, εποµένως µπορεί να παραληφθεί και αυτός. Ετσι καταλήγουµε στη Σχέση (6.4): P MI IR (w 2j, t k ) = n c n w2j n tk (6.4) Ετσι, µε ϐάση τη Σχέση (6.4) υπολογίζουµε τη σηµασιολογική οµοιότητα όλων των Ϲευγών που σχηµατίζονται µεταξύ των λέξεων του συνόλου W 2 και του συνόλου T Εύρεση σηµασιολογικής οµοιότητας συνόλων λέξεων Εχοντας ϐρεί την σηµασιολογική οµοιότητα όλων των Ϲευγών λέξεων µεταξύ των συνόλων W 2 και T, µπορούµε να υπολογίσουµε και την σηµασιολογική οµοιότητα του πρώτου συνόλου µε το δεύτερο. Για τον υπολογισµό της σηµασιολογικής οµοιότητας µεταξύ δύο συνόλων ϐασιστήκαµε σε µια διαδικασία που περιγράφεται στο [44]. Σε αυτή τη δηµοσίευση, η διαδικασία ονοµάζεται Average Aggregated Minimum Distance (AAMD). Λόγω του ότι στην παρούσα διπλωµατική µιλάµε για οµοιότητα (similarity) και επειδή σηµασιολογικά minimum distance=maximum similarity, εµείς ονοµάζουµε το συγκεκριµένο µέτρο Average Aggregated Maximum Similarity (AAMS), χωρίς ϐλάβη της γενικότητας.

39 Στάδια Υλοποίησης και Λειτουργίας 39 Το µέτρο αυτό λειτουργεί ϐρίσκοντας αρχικά για κάθε λέξη του πρώτου συνόλου την σηµασιολογικά κοντινότερη λέξη από το δεύτερο σύνολο, στη συνέχεια για κάθε λέξη του δεύτερου συνόλου την σηµασιολογικά κοντινότερη λέξη από το πρώτο σύνολο και, τελικά, υπολογίζει τον µέσο όρο των ελάχιστων αυτών αποστάσεων µε ϐάση το µέγεθος κάθε συνόλου, έτσι ώστε το µέτρο να είναι συµµετρικό. Το αποτέλεσµα είναι ένα µέτρο σηµασιολογικής οµοιότητας των δύο συνόλων. Ο υπολογισµός της AAMS ϕαίνεται παραστατικά στο Σχήµα 6.4. Σχήµα 6.4: Το µέτρο AAMS ανάµεσα σε δύο σύνολα λέξεων Αναλυτικότερα, αρχικά ορίζουµε ως οµοιότητα µεταξύ µιας λέξης και ε- νός συνόλου λέξεων την µέγιστη σηµασιολογική οµοιότητα µεταξύ της λέξεως αυτής και οποιασδήποτε λέξεως του συνόλου. Εχοντας υπολογίσει τις σηµασιολογικές οµοιότητες όλων των Ϲευγών λέξεων των δύο συνόλων, µε το µέτρο PMI-IR, η οµοιότητα µιας λέξης του συνόλου W 2 µε το σύνολο T είναι : sim(w 2j, T ) = max tk T {P MI IR(w 2j, t k )} (6.5)

40 Στάδια Υλοποίησης και Λειτουργίας 40 Αντίστοιχα, η οµοιότητα µιας λέξης του συνόλου T µε το σύνολο W 2 είναι : sim(t k, W 2 ) = max w2j W 2 {P MI IR(t k, w 2j )} (6.6) Ετσι, η τιµή το AAMS, που εκφράζει τη σηµασιολογική οµοιότητα των συνόλων W 2 και T υπολογίζεται µέσω της σχέσης 6.7. sim(w 2, T ) = AAMS(W 2, T ) = 1 n n sim(w 2j, T ) + 1 l j=1 l sim(t k, W 2 ) k=1 (6.7) Με αυτόν τον τρόπο, λοιπόν, υπολογίζουµε για κάθε εικόνα I την οµοιότητα AAMS του αντίστοιχου tagset T µε το σύνολο λέξεων W 2 που αντιπροσωπεύουν την έννοια C. 6.5 ηµιουργία των δεδοµένων εκπαίδευσης Στο στάδιο αυτό, αρχικά ταξινοµούµε τις εικόνες µε ϕθίνουσα σειρά, µε ϐάση τις τιµές AAMS που υπολογίσαµε στο προηγούµενο στάδιο. Ετσι, δη- µιουργείται µια λίστα που έχει τις εικόνες που είναι πιο σχετικές µε την έννοια στην αρχή και τις µη-σχετικές στο τέλος (ranked list). Στη συνέχεια, για ϑετικές εικόνες του training set που ϑέλουµε να σχηµατίσουµε παίρνουµε τον επιθυµητό αριθµό από τις περισσότερο σχετικές εικόνες µε την έννοια, δηλαδή αυτές που είναι στην κορυφή της λίστας (highestranked). Αντίστοιχα, για αρνητικές εικόνες του training set παίρνουµε τις µη-σχετικές µε την κάθε έννοια, δηλαδή τις τελευταίες της λίστας (lowestranked). Ετσι έχουµε τα δεδοµένα εκπαίδευσης (training data) για τον ταξινοµητή που ϑέλουµε να εκπαιδεύσουµε.

41 Στάδια Υλοποίησης και Λειτουργίας 41 Σχήµα 6.5: Συνοπτική λειτουργία του συστήµατος

42 Μέρος IV Πειράµατα & Αποτελέσµατα 42

43 ΚΕΦΑΛΑΙΟ 7 ΑΞΙΟΛΟΓΗΣΗ ΣΥΣΤΗΜΑΤΟΣ Εχοντας υλοποιήσει το σύστηµά µας, η πρώτη οµάδα πειραµάτων που διενεργήθηκαν αφορά την αξιολόγησή του. ιότι πρέπει να γίνει έλεγχος κατά πόσο λειτουργεί το σύστηµά µας και αν τα αποτελέσµατα που αυτό δίνει είναι τα επιθυµητά. 7.1 Μέθοδος αξιολόγησης Το µέτρο που χρησιµοποιούµε για την αξιολόγηση των αποτελεσµάτων του συστήµατός µας είναι το Normalized Discounted Cumulated Gain (ndcg) [14]. εδοµένης µιας ταξινοµηµένης λίστας, το µέτρο αυτό, ϑεωρεί ότι οι εικόνες που είναι ψηλότερα στη λίστα έχουν µεγαλύτερη αξία από αυτές που είναι χαµηλότερα. Οσο κατεβαίνουµε στη λίστα, η αξία ή κέρδος των εικόνων µειώνεται λογαριθµικά. Η τιµή του µέτρου είναι το κανονικοποιηµένο προς την ιδανική απόδοση αθροισµένο (συσσωρευµένο) κέρδος των ϑετικών εικόνων της ταξινοµηµένης λίστας. Αναλυτικότερα, για τον υπολογισµό του ndcg πρέπει πρώτα να υπολο- 43

44 Αξιολόγηση Συστήµατος 44 γιστούν τα Cumulated Gain (CG) και Discounted Cumulated Gain (DCG) [14]. Για µια ϑέση i της ταξινοµηµένης λίστας, η τιµή του CG υπολογίζεται από τη Σχέση (7.1): { G1 αν i = 1 CG i = CG i 1 + G i αλλιώς (7.1) Η τιµή G i είναι ϐαθµός σχετικότητας του στοιχείου που ϐρίσκεται στη ϑέση i. Η τιµή του CG δεν επηρεάζεται από τη σειρά των στοιχείων της ταξινοµηµένης λίστας. Αυτό σηµαίνει ότι µετακινώντας ένα στοιχείο από µια χαµηλότερη ϑέση της λίστας σε µια υψηλότερη, αυτό δεν ϑα αλλάξει την υπολογισµένη τιµή. Ενα ϐήµα παραπέρα είναι το DCG, το οποίο παίρνει υπόψη του τη σειρά των στοιχείων, µειώνοντας λογαριθµικά την αξία των στοιχείων όσο χαµηλότερα ϐρίσκονται αυτά στη λίστα. Για µια ϑέση i της ταξινοµηµένης λίστας, αν η ϐάση του λογαρίθµου είναι b, η τιµή του DCG υπολογίζεται από τη Σχέση (7.2): CG i DCG i = CG i 1 + G i log b i αν i < b αν i b (7.2) Ως συνέχεια των παραπάνω, για µια ϑέση i της ταξινοµηµένης λίστας, η τιµή του DCG υπολογίζεται από τη Σχέση (7.3): ndcg i = DCG i IDCG i (7.3) Το IDCG i είναι η ιδεατή τιµή του DCG στη ϑέση i, δηλαδή η τιµή που ϑα είχε το DCG στη ϑέση i στην περίπτωση ενός τέλειου ταξινοµητή. Η µέση τιµή του διανύσµατος ndcg µέχρι µια συγκεκριµένη ϑέση κατάταξης συνοψίζει το διάνυσµα ndcg µέχρι τη συγκεκριµένη ϑέση.

45 Αξιολόγηση Συστήµατος ιαδικασία αξιολόγησης Η διαδικασία που ακολουθήθηκε για την αξιολόγηση της απόδοσης του συστήµατός µας περιγράφεται στη συνέχεια. Επιλογή εννοιών : Επιλέγουµε τις έννοιες µε ϐάση τις οποίες το σύστη- µά µας ϑα κάνει ταξινόµηση των εικόνων. Τελικά καταλήγουµε στην επιλογή 37 εννοιών, όπως παρουσιάζεται στον Πίνακα 7.1. animal desert mountain sun beach elephant night temple bicycle face person train boat flower plane tree building food police waterfall butterfly football pyramid window car frost reflection woman cloud hand sky computer house snow cow moon sport Πίνακας 7.1: Λίστα εννοιών που χρησιµοποιήθηκαν Οι 37 έννοιες επιλέχθηκαν προσεκτικά κατά τέτοιο τρόπο ώστε να πλη- ϱούν τις παρακάτω προϋποθέσεις : 1. είναι σύµφωνες µε εκείνες τις έννοιες που καθορίζονται και σε άλλες σχετικές δηµοσιεύσεις [45, 46, 47, 48] 2. είναι σύµφωνες µε ετικέτες που εµφανίζονται συχνά στο Flickr 3. περιέχονται και γενικές έννοιες όπως Ϲώο, ϕυτό και πιο συγκεκρι- µένες όπως σκυλί, λουλούδια 4. ανήκουν σε διαφορετικές κατηγορίες όπως τοπίο, αντικείµενο, γεγονός, άνθρωπος και άλλες (Σχήµα 7.1)

46 Αξιολόγηση Συστήµατος 46 Σχήµα 7.1: Κατηγοριοποίηση των επιλεγµένων εννοιών

47 Αξιολόγηση Συστήµατος 47 Εφαρµογή συστήµατος : Για τις επιλεγµένες έννοιες εφαρµόζουµε τη µέ- ϑοδο που υλοποιήσαµε. Σαν αποτέλεσµα, για κάθε µια από τις 37 έννοιες το σύστηµα δίνει µια λίστα εικόνων σε σειρά σχετικότητας µε την εκάστοτε έννοια µε τις περισσότερο σχετικές εικόνες για κάθε έννοια στην κορυφή της λίστας και τις περισσότερο µη-σχετικές στο τέλος της λίστας. Επιλογή ϑετικών εικόνων : Με ϐάση την ταξινοµηµένη λίστα κάθε έννοιας κρατάµε τις 200 περισσότερο σχετικές εικόνες µε αυτήν. Αυτό το κάνουµε διότι για την αξιολόγηση µας ενδιαφέρει κατά πόσο οι εικόνες που µας δίνει το σύστηµά µας ως ϑετικές είναι όντως σχετικές µε την έννοια. Χειρωνακτικός έλεγχος και επισήµανση : Για κάθε ϑετική 200-άδα ε- λέγχουµε χειρωνακτικά µία-µία τις εικόνες και κάνουµε την ανάλογη επισήµανση (manual annotation). Η διαδικασία της επισήµανσης που ακολουθήθηκε είναι η εξής : εάν η εξεταζόµενη εικόνα περιέχει την αντίστοιχη έννοια για την οποία εξετάζεται, τότε επισηµαίνεται ως ϑετική. Εάν δεν περιέχει την αντίστοιχη έννοια ή αν δεν είναι σίγουρο ότι την περιέχει, τότε η εικόνα χαρακτηρίζεται αρνητική. Ακολουθώντας αυτή τη διαδικασία για κάθε µία από τις 200 εικόνες καθε µίας εκ των 37 εννοιών, έχουµε τις εικόνες αληθείας (ground-truth) γι αυτές τις έννοιες, ταξινοµηµένες σε λίστες µε σειρά σχετικότητας. Εφαρµογή µεθόδου αξιολόγησης : Εχοντας τις ταξινοµηµένες λίστες των ground-truth εικόνων, σε κάθε ϑετική µε την αντίστοιχη έννοια εικόνα ϐάζουµε το ϐαθµό 1 (G i = 1), ενώ σε κάθε αρνητική το ϐαθµό 0 (G i = 0). Στη συνέχεια, επιλέγουµε τη ϐάση του λογαρίθµου ίση µε 2 (b = 2). Τέλος, για κάθε έννοια υπολογίζουµε το ndcg i, µε το i να µεταβάλλεται από 1 έως 200 (δηλαδή το ndcg σε κάθε ϑέση της αντίστοιχης λίστας), καθώς και τις µέσες τιµές των διανυσµάτων.

48 Αξιολόγηση Συστήµατος Αποτελέσµατα αξιολόγησης Καµπύλες ndcg Παρουσιάζουµε τις καµπύλες των διανυσµάτων ndcg για κάθε έννοια, όπως προέκυψαν µετά από την εφαρµογή της διαδικασίας αξιολόγησης. Σχήµα 7.2: Καµπύλη ndcg για την έννοια animal

49 Αξιολόγηση Συστήµατος 49 Σχήµα 7.3: Καµπύλη ndcg για την έννοια beach Σχήµα 7.4: Καµπύλη ndcg για την έννοια bicycle

50 Αξιολόγηση Συστήµατος 50 Σχήµα 7.5: Καµπύλη ndcg για την έννοια boat Σχήµα 7.6: Καµπύλη ndcg για την έννοια building

51 Αξιολόγηση Συστήµατος 51 Σχήµα 7.7: Καµπύλη ndcg για την έννοια butterfly Σχήµα 7.8: Καµπύλη ndcg για την έννοια car

52 Αξιολόγηση Συστήµατος 52 Σχήµα 7.9: Καµπύλη ndcg για την έννοια cloud Σχήµα 7.10: Καµπύλη ndcg για την έννοια computer

53 Αξιολόγηση Συστήµατος 53 Σχήµα 7.11: Καµπύλη ndcg για την έννοια cow Σχήµα 7.12: Καµπύλη ndcg για την έννοια desert

54 Αξιολόγηση Συστήµατος 54 Σχήµα 7.13: Καµπύλη ndcg για την έννοια elephant Σχήµα 7.14: Καµπύλη ndcg για την έννοια face

55 Αξιολόγηση Συστήµατος 55 Σχήµα 7.15: Καµπύλη ndcg για την έννοια flower Σχήµα 7.16: Καµπύλη ndcg για την έννοια food

56 Αξιολόγηση Συστήµατος 56 Σχήµα 7.17: Καµπύλη ndcg για την έννοια football Σχήµα 7.18: Καµπύλη ndcg για την έννοια frost

57 Αξιολόγηση Συστήµατος 57 Σχήµα 7.19: Καµπύλη ndcg για την έννοια hand Σχήµα 7.20: Καµπύλη ndcg για την έννοια house

58 Αξιολόγηση Συστήµατος 58 Σχήµα 7.21: Καµπύλη ndcg για την έννοια moon Σχήµα 7.22: Καµπύλη ndcg για την έννοια mountain

59 Αξιολόγηση Συστήµατος 59 Σχήµα 7.23: Καµπύλη ndcg για την έννοια night Σχήµα 7.24: Καµπύλη ndcg για την έννοια person

60 Αξιολόγηση Συστήµατος 60 Σχήµα 7.25: Καµπύλη ndcg για την έννοια plane Σχήµα 7.26: Καµπύλη ndcg για την έννοια police

61 Αξιολόγηση Συστήµατος 61 Σχήµα 7.27: Καµπύλη ndcg για την έννοια pyramid Σχήµα 7.28: Καµπύλη ndcg για την έννοια reflection

62 Αξιολόγηση Συστήµατος 62 Σχήµα 7.29: Καµπύλη ndcg για την έννοια sky Σχήµα 7.30: Καµπύλη ndcg για την έννοια snow

63 Αξιολόγηση Συστήµατος 63 Σχήµα 7.31: Καµπύλη ndcg για την έννοια sport Σχήµα 7.32: Καµπύλη ndcg για την έννοια sun

64 Αξιολόγηση Συστήµατος 64 Σχήµα 7.33: Καµπύλη ndcg για την έννοια temple Σχήµα 7.34: Καµπύλη ndcg για την έννοια train

65 Αξιολόγηση Συστήµατος 65 Σχήµα 7.35: Καµπύλη ndcg για την έννοια tree Σχήµα 7.36: Καµπύλη ndcg για την έννοια waterfall

66 Αξιολόγηση Συστήµατος 66 Σχήµα 7.37: Καµπύλη ndcg για την έννοια window Σχήµα 7.38: Καµπύλη ndcg για την έννοια woman

67 Αξιολόγηση Συστήµατος Average ndcg Παρουσιάζουµε τις µέσες τιµές των διανυσµάτων ndcg για κάθε έννοια, όπως προέκυψαν µετά από την εφαρµογή της διαδικασίας αξιολόγησης. Σχήµα 7.39: Γραφική παράσταση average ndcg

68 Αξιολόγηση Συστήµατος 68 Concept Average ndcg animal beach bicycle boat building butterfly car cloud computer cow desert elephant face flower food football frost hand house moon mountain night person plane police pyramid reflection sky snow sport sun temple train tree waterfall window woman Πίνακας 7.2: Τιµές average ndcg

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. WordNet

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. WordNet ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ WordNet Σημασιολογικά Δίκτυα Ένα δίκτυο που αναπαριστά συσχετίσεις μεταξύ εννοιών. Οι κορυφές παριστάνουν έννοιες και οι ακμές σημασιολογικές

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 10 ο : Αποσαφήνιση εννοιών λέξεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 10 ο : Αποσαφήνιση εννοιών λέξεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 10 ο : Αποσαφήνιση εννοιών λέξεων Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση Οι συµφράσεις είναι ακολουθίες όρων οι οποίοι συνεµφανίζονται σε κείµενο µε µεγαλύτερη συχνότητα από εκείνη της εµφάνισης

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι Συστήματα Υποστήριξης Αποφάσεων Τα Συστήματα Υποστήριξης Αποφάσεων (Σ.Υ.Α. - Decision Support Systems, D.S.S.) ορίζονται ως συστήματα

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Τεχνικές NLP Σχεδιαστικά Θέματα Natural Language Processing Επεξεργασία δεδομένων σε φυσική γλώσσα Κατανόηση φυσικής γλώσσας από τη μηχανή

Διαβάστε περισσότερα

Σχεδιασµός βασισµένος σε συνιστώσες

Σχεδιασµός βασισµένος σε συνιστώσες Σχεδιασµός βασισµένος σε συνιστώσες 1 Ενδεικτικά περιεχόµενα του κεφαλαίου Ποια είναι τα "άτοµα", από τα οποία κατασκευάζονται οι υπηρεσίες; Πώς οργανώνουµε τις συνιστώσες σε ένα αρµονικό σύνολο; Τι είναι

Διαβάστε περισσότερα

Μεθοδολογίες παρεµβολής σε DTM.

Μεθοδολογίες παρεµβολής σε DTM. Μάθηµα : Αλγοριθµικές Βάσεις στη Γεωπληροφορική ιδάσκων : Συµεών Κατσουγιαννόπουλος Μεθοδολογίες παρεµβολής σε DTM.. Μέθοδοι παρεµβολής. Η παρεµβολή σε ψηφιακό µοντέλο εδάφους (DTM) είναι η διαδικασία

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Προεπεξεργασία Κειμένου Στόχος Επεξεργασίας Γραπτό κείμενο: Τρόπος επικοινωνίας Φέρει σημασιολογικό περιεχόμενο Αναζητούμε τρόπο να: Μετρήσουμε

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης Ειρήνη Καλδέλη ιπλωµατική Εργασία Περίληψη Εισαγωγή Τα τελευταία χρόνια η αλµατώδης ανάπτυξη της πληροφορικής έχει διευρύνει σε σηµαντικό βαθµό

Διαβάστε περισσότερα

Παρεµβολή και Προσέγγιση Συναρτήσεων

Παρεµβολή και Προσέγγιση Συναρτήσεων Κεφάλαιο 4 Παρεµβολή και Προσέγγιση Συναρτήσεων 41 Παρεµβολή µε πολυώνυµο Lagrage Εστω ότι γνωρίζουµε τις τιµές µιας συνάρτησης f (x), f 0, f 1,, f ν σε σηµεία x 0, x 1,, x ν, και Ϲητάµε να υπολογίσουµε

Διαβάστε περισσότερα

5.1 Συναρτήσεις δύο ή περισσοτέρων µεταβλητών

5.1 Συναρτήσεις δύο ή περισσοτέρων µεταβλητών Κεφάλαιο 5 ΣΥΝΑΡΤΗΣΕΙΣ ΠΟΛΛΩΝ ΜΕΤΑΒΛΗΤΩΝ 5.1 Συναρτήσεις δύο ή περισσοτέρων µεταβλητών Οταν ένα µεταβλητό µέγεθος εξαρτάται αποκλειστικά από τις µεταβολές ενός άλλου µεγέθους, τότε η σχέση που συνδέει

Διαβάστε περισσότερα

Αναγνώριση Προτύπων - Νευρωνικά ίκτυα

Αναγνώριση Προτύπων - Νευρωνικά ίκτυα ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ Αναγνώριση Προτύπων - Νευρωνικά ίκτυα ρ. Χαράλαµπος Π. Στρουθόπουλος Αναπληρωτής Καθηγητής

Διαβάστε περισσότερα

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα Τεχνητή Νοημοσύνη (Artificial Intelligence) Ανάπτυξη μεθόδων και τεχνολογιών για την επίλυση προβλημάτων στα οποία ο άνθρωπος υπερέχει (?) του υπολογιστή Συλλογισμοί

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Information Extraction

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Information Extraction ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Information Extraction Information Extraction Μορφή της πληροφορίας Δομημένα δεδομένα Relational Databases (SQL) XML markup Μη-δομημένα δεδομένα

Διαβάστε περισσότερα

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test)

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test) ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test) Θεοχαράτος Χρήστος Εργαστήριο Ηλεκτρονικής (ELLAB), Τµήµα Φυσικής, Πανεπιστήµιο Πατρών email: htheohar@upatras.gr http://www.ellab.physics.upatras.gr/users/theoharatos/default.htm

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών ΗΥ-6 Συστήµατα Ανάκτησης Πληροφοριών 7-8 Εαρινό Εξάµηνο Άσκηση Λύσεις ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Θεωρείστε µια

Διαβάστε περισσότερα

Ημι-εποπτευόμενη εκπαίδευση ταξινομητών για ανάκτηση εικόνων βάσει περιεχομένου από δείγματα μεταβλητής αξιοπιστίας

Ημι-εποπτευόμενη εκπαίδευση ταξινομητών για ανάκτηση εικόνων βάσει περιεχομένου από δείγματα μεταβλητής αξιοπιστίας Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Ημι-εποπτευόμενη εκπαίδευση ταξινομητών για ανάκτηση εικόνων βάσει περιεχομένου από δείγματα

Διαβάστε περισσότερα

Ανάκτηση πολυμεσικού περιεχομένου

Ανάκτηση πολυμεσικού περιεχομένου Ανάκτηση πολυμεσικού περιεχομένου Ανίχνευση / αναγνώριση προσώπων Ανίχνευση / ανάγνωση κειμένου Ανίχνευση αντικειμένων Οπτικές λέξεις Δεικτοδότηση Σχέσεις ομοιότητας Κατηγοριοποίηση ειδών μουσικής Διάκριση

Διαβάστε περισσότερα

11 Το ολοκλήρωµα Riemann

11 Το ολοκλήρωµα Riemann Το ολοκλήρωµα Riem Το πρόβληµα υπολογισµού του εµβαδού οποιασδήποτε επιφάνειας ( όπως κυκλικοί τοµείς, δακτύλιοι και δίσκοι, ελλειπτικοί δίσκοι, παραβολικά και υπερβολικά χωρία κτλ) είναι γνωστό από την

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Διακριτικές Συναρτήσεις

Διακριτικές Συναρτήσεις Διακριτικές Συναρτήσεις Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Θερµικός χάρτης των XYZ ξενοδοχείων σε σχέση µε τη γεωγραφική περιοχή τους P. Adamopoulos New

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Ο ΗΓΙΕΣ ΕΠΕΞΕΡΓΑΣΙΑΣ Ε ΟΜΕΝΩΝ ΚΑΙ ΣΥΓΓΡΑΦΗΣ ΤΗΣ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΤΟΥ ΕΡΓΑΣΤΗΡΙΟΥ ΦΥΣΙΚΗΣ ΙΙ

Ο ΗΓΙΕΣ ΕΠΕΞΕΡΓΑΣΙΑΣ Ε ΟΜΕΝΩΝ ΚΑΙ ΣΥΓΓΡΑΦΗΣ ΤΗΣ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΤΟΥ ΕΡΓΑΣΤΗΡΙΟΥ ΦΥΣΙΚΗΣ ΙΙ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ Τ. Ε. Ι. Σ Ε Ρ Ρ Ω Ν Ο ΗΓΙΕΣ ΕΠΕΞΕΡΓΑΣΙΑΣ Ε ΟΜΕΝΩΝ ΚΑΙ ΣΥΓΓΡΑΦΗΣ ΤΗΣ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΤΟΥ ΕΡΓΑΣΤΗΡΙΟΥ ΦΥΣΙΚΗΣ ΙΙ Προετοιµασία ιαβάστε καλά

Διαβάστε περισσότερα

Ερευνητικό Πρόγραµµα BalkaNet

Ερευνητικό Πρόγραµµα BalkaNet Ερευνητικό Πρόγραµµα BalkaNet 1 Ερευνητικό Πρόγραµµα BalkaΝet Χρηµατοδοτούµενο από την ΕΕ πρόγραµµα (IST-2000-29388) µε σκοπό την ανάπτυξη ενός πολύγλωσσου σηµασιολογικού λεξικού σύµφωνα µε τις αρχές του

Διαβάστε περισσότερα

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Μεταπτυχιακό Πρόγραµµα Σπουδών2007-2008 ιδάσκουσα: Κατερίνα Τοράκη (Οι διαλέξεις περιλαµβάνουν

Διαβάστε περισσότερα

Α ΤΑΞΗ. 1 η ΕΝΟΤΗΤΑ: Γνωρίζω τον υπολογιστή. Θα παρουσιαστεί µε τρόπο απλό και κατανοητό,

Α ΤΑΞΗ. 1 η ΕΝΟΤΗΤΑ: Γνωρίζω τον υπολογιστή. Θα παρουσιαστεί µε τρόπο απλό και κατανοητό, 1 η ΕΝΟΤΗΤΑ: Γνωρίζω τον υπολογιστή 1. εδοµένα, Πληροφορίες και Υπολογιστές 2. Πώς φτάσαµε στους σηµερινούς υπολογιστές 3. Το υλικό ενός υπολογιστικού συστήµατος 4. Το λογισµικό ενός υπολογιστικού συστήµατος

Διαβάστε περισσότερα

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Όνοµα: Νικολαΐδης Αντώνιος Επιβλέπων: Τ. Σελλής Περίληψη ιπλωµατικής Εργασίας Συνεπιβλέποντες: Θ. αλαµάγκας, Γ. Γιαννόπουλος

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Εισαγωγικό Φροντιστήριο

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Εισαγωγικό Φροντιστήριο ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Εισαγωγικό Φροντιστήριο Project του μαθήματος Εργασία 2 ατόμων Προφορική εξέταση για: Project (80%) Θεωρία (20%) Στο φροντιστήριο: Ζητήματα

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

Ανάλυση κατά Συστάδες. Cluster analysis

Ανάλυση κατά Συστάδες. Cluster analysis Ανάλυση κατά Συστάδες Cluster analysis 1 H ανάλυση κατά συστάδες είναι µια µέθοδος που σκοπό έχει να κατατάξει σε οµάδες τις υπάρχουσες παρατηρήσεις χρησιµοποιώντας την πληροφορία που υπάρχει σε κάποιες

Διαβάστε περισσότερα

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18 ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18 14 Νοεµβρίου, 2006 Γεώργιος Έλληνας Επίκουρος Καθηγητής ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Κεφάλαιο 7 Βασικά Θεωρήµατα του ιαφορικού Λογισµού

Κεφάλαιο 7 Βασικά Θεωρήµατα του ιαφορικού Λογισµού Σελίδα 1 από Κεφάλαιο 7 Βασικά Θεωρήµατα του ιαφορικού Λογισµού Στο κεφάλαιο αυτό θα ασχοληθούµε µε τα βασικά θεωρήµατα του διαφορικού λογισµού καθώς και µε προβλήµατα που µπορούν να επιλυθούν χρησιµοποιώντας

Διαβάστε περισσότερα

Παλαιότερες ασκήσεις

Παλαιότερες ασκήσεις Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY6 - Συστήµατα Ανάκτησης Πληροφοριών Παλαιότερες ασκήσεις η Σειρά Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Άσκηση ( η σειρά ασκήσεων

Διαβάστε περισσότερα

Βασική Εφικτή Λύση. Βασική Εφικτή Λύση

Βασική Εφικτή Λύση. Βασική Εφικτή Λύση Αλγεβρική Μορφή Γενική Μορφή Γραµµικού Προγραµµατισµού n µεταβλητών και m περιορισµών Εστω πραγµατικοί αριθµοί a ij, b j, c i R µε 1 i m, 1 j n Αλγεβρική Μορφή Γενική Μορφή Γραµµικού Προγραµµατισµού n

Διαβάστε περισσότερα

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Αλγόριθµοι Ευθυγράµµισης Τρισδιάστατων Αντικειµένων Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό & Καποδιστριακό Πανεπιστήµιο Αθηνών 20 Οκτωβρίου 2005 Εισαγωγή

Διαβάστε περισσότερα

οµή δικτύου ΣΧΗΜΑ 8.1

οµή δικτύου ΣΧΗΜΑ 8.1 8. ίκτυα Kohonen Το µοντέλο αυτό των δικτύων προτάθηκε το 1984 από τον Kοhonen, και αφορά διαδικασία εκµάθησης χωρίς επίβλεψη, δηλαδή δεν δίδεται καµία εξωτερική επέµβαση σχετικά µε τους στόχους που πρέπει

Διαβάστε περισσότερα

Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 - Project Σεπτεμβρίου Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος Εξέταση: Προφορική, στο τέλος της εξεταστικής. Θα βγει ανακοίνωση στο forum. Ομάδες

Διαβάστε περισσότερα

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου Γλωσσικη τεχνολογια Προεπεξεργασία Κειμένου Στόχος Επεξεργασίας Γραπτό κείμενο: Τρόπος επικοινωνίας Φέρει σημασιολογικό περιεχόμενο Αναζητούμε τρόπο να: Μετρήσουμε το πληροφοριακό περιεχόμενο Ποσοτικοποιήσουμε

Διαβάστε περισσότερα

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου J-GANNO ΓΕΝΙΚΕΥΜΕΝΟ ΠΑΚΕΤΟ ΥΛΟΠΟΙΗΣΗΣ ΤΕΧΝΗΤΩΝ ΝΕΥΡΩΝΙΚΩΝ ΙΚΤΥΩΝ ΣΤΗ ΓΛΩΣΣΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ JAVA Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β,

Διαβάστε περισσότερα

"The Project ARXIMIDIS ΙΙ is co-funded by the European Social Fund and National Resources EPEAEK ΙΙ "

The Project ARXIMIDIS ΙΙ is co-funded by the European Social Fund and National Resources EPEAEK ΙΙ Αρχιµήδης ΙΙ Ενίσχυση Ερευνητικών Οµάδων του ΤΕΙ Κρήτης Τίτλος Υποέργου: Εφαρµογές Τεχνητής Νοηµοσύνης στην Τεχνολογία Λογισµικού και στην Ιατρική Επιστηµονικός Υπεύθυνος: ρ Εµµανουήλ Μαρακάκης ραστηριότητα

Διαβάστε περισσότερα

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε.

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε. ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε. Άδειες Χρήσης Το

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1

Διαβάστε περισσότερα

Τηλεπισκόπηση. Κ. Ποϊραζίδης ΨΗΦΙΑΚΗ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ 18/6/2016

Τηλεπισκόπηση. Κ. Ποϊραζίδης ΨΗΦΙΑΚΗ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ 18/6/2016 ΨΗΦΙΑΚΗ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ Κ. Ποϊραζίδης Ψηφιακή Ανάλυση Εικόνας Η ψηφιακή ανάλυση εικόνας ασχολείται κυρίως με τέσσερις βασικές λειτουργίες: διόρθωση, βελτίωση, ταξινόμηση Με τον όρο ταξινόμηση εννοείται

Διαβάστε περισσότερα

2 + 0.5 2 + 0.25 + 1 + 0.5 2 + 0.25 + 1 + 0.5 2 + 0.25 2 + 0.5 0 0.125 + 1 + 0.5 1 0.125 + 1 + 0.75 1 0.125 1/5

2 + 0.5 2 + 0.25 + 1 + 0.5 2 + 0.25 + 1 + 0.5 2 + 0.25 2 + 0.5 0 0.125 + 1 + 0.5 1 0.125 + 1 + 0.75 1 0.125 1/5 IOYNIOΣ 23 Δίνονται τα εξής πρότυπα: x! = 2.5 Άσκηση η (3 µονάδες) Χρησιµοποιώντας το κριτήριο της οµοιότητας να απορριφθεί ένα χαρακτηριστικό µε βάση το συντελεστή συσχέτισης. Γράψτε εδώ το χαρακτηριστικό

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Τεχνικές κατασκευής δένδρων επιθεµάτων πολύ µεγάλου µεγέθους και χρήσης

Διαβάστε περισσότερα

Α. Ερωτήσεις Ανάπτυξης

Α. Ερωτήσεις Ανάπτυξης οµηµένος Προγραµµατισµός-Κεφάλαιο 7 Σελίδα 1 α ό 10 ΕΝΟΤΗΤΑ ΙΙΙ (ΠΡΟΓΡΑΜΜΑΤΑ) ΚΕΦΑΛΑΙΟ 7: Είδη, Τεχνικές και Περιβάλλοντα Προγραµµατισµού Α. Ερωτήσεις Ανάπτυξης 1. Τι ονοµάζουµε γλώσσα προγραµµατισµού;

Διαβάστε περισσότερα

ιαµέριση - Partitioning

ιαµέριση - Partitioning ιαµέριση - Partitioning ιαµέριση ιαµέριση είναι η διαµοίραση αντικειµένων σε οµάδες µε στόχο την βελτιστοποίηση κάποιας συνάρτησης. Στην σύνθεση η διαµέριση χρησιµοποιείται ως εξής: Οµαδοποίηση µεταβλητών

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Θ.Ε. ΠΛΗ31 (2004-5) ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ #3 Στόχος Στόχος αυτής της εργασίας είναι η απόκτηση δεξιοτήτων σε θέματα που αφορούν τα Τεχνητά Νευρωνικά Δίκτυα και ποιο συγκεκριμένα θέματα εκπαίδευσης και υλοποίησης.

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Αλγόριθµοι δροµολόγησης µε µέσα µαζικής µεταφοράς στο µεταφορικό δίκτυο των Αθηνών

Αλγόριθµοι δροµολόγησης µε µέσα µαζικής µεταφοράς στο µεταφορικό δίκτυο των Αθηνών 1 Αλγόριθµοι δροµολόγησης µε µέσα µαζικής µεταφοράς στο µεταφορικό δίκτυο των Αθηνών ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ της Κωτσογιάννη Μαριάννας Περίληψη 1. Αντικείµενο- Σκοπός Αντικείµενο της διπλωµατικής αυτής εργασίας

Διαβάστε περισσότερα

P (A) = 1/2, P (B) = 1/2, P (C) = 1/9

P (A) = 1/2, P (B) = 1/2, P (C) = 1/9 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών HY-1: Πιθανότητες - Χειµερινό Εξάµηνο 011 ιδάσκων : Π. Τσακαλίδης Λύσεις εύτερης Σειράς Ασκήσεων Ηµεροµηνία Ανάθεσης : /11/011 Ηµεροµηνία Παράδοσης : 1/11/011

Διαβάστε περισσότερα

1. ** α) Αν η f είναι δυο φορές παραγωγίσιµη συνάρτηση, να αποδείξετε ότι. β α. = [f (x) ηµx] - [f (x) συνx] β α. ( )

1. ** α) Αν η f είναι δυο φορές παραγωγίσιµη συνάρτηση, να αποδείξετε ότι. β α. = [f (x) ηµx] - [f (x) συνx] β α. ( ) Ερωτήσεις ανάπτυξης. ** α) Αν η f είναι δυο φορές παραγωγίσιµη συνάρτηση, να αποδείξετε ότι β ( f () f () ) + α ηµ d β α = [f () ηµ] - [f () συν] β α. ( ) β) Αν f () = ηµ, να αποδείξετε ότι f () + f ()

Διαβάστε περισσότερα

Ανάκτηση Δεδομένων (Information Retrieval)

Ανάκτηση Δεδομένων (Information Retrieval) Ανάκτηση Δεδομένων (Information Retrieval) Παύλος Εφραιμίδης Βάσεις Δεδομένων Ανάκτηση Δεδομένων 1 Information Retrieval (1) Βάσεις Δεδομένων: Περιέχουν δομημένη πληροφορία: Πίνακες Ανάκτηση Πληροφορίας

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΙΑΤΜΗΜΑΤΙΚΟ ΠΜΣ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ 2006-2007 2η Σειρά Ασκήσεων ΑΠΑΝΤΗΣΕΙΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΙΑΤΜΗΜΑΤΙΚΟ ΠΜΣ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ 2006-2007 2η Σειρά Ασκήσεων ΑΠΑΝΤΗΣΕΙΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΙΑΤΜΗΜΑΤΙΚΟ ΠΜΣ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ 2006-2007 2η Σειρά Ασκήσεων ΑΠΑΝΤΗΣΕΙΣ 1. ίνεται το γνωστό πρόβληµα των δύο δοχείων: «Υπάρχουν δύο δοχεία

Διαβάστε περισσότερα

Αλγόριθμοι Ταξινόμησης Μέρος 4

Αλγόριθμοι Ταξινόμησης Μέρος 4 Αλγόριθμοι Ταξινόμησης Μέρος 4 Μανόλης Κουμπαράκης Δομές Δεδομένων και Τεχνικές 1 Μέθοδοι Ταξινόμησης Βασισμένοι σε Συγκρίσεις Κλειδιών Οι αλγόριθμοι ταξινόμησης που είδαμε μέχρι τώρα αποφασίζουν πώς να

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Εργασία 1η Classification

Αναγνώριση Προτύπων Εργασία 1η Classification ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Αναγνώριση Προτύπων Εργασία 1η Classification Κιντσάκης Αθανάσιος 6667 Μόσχογλου Στυλιανός 6978 30 Νοεμβρίου,

Διαβάστε περισσότερα

Η ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές:

Η ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές: Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2005-2006 Εαρινό Εξάµηνο 1 η Σειρά Ασκήσεων (Αξιολόγηση Αποτελεσµατικότητας Ανάκτησης) Άσκηση 1 (4 βαθµοί) Θεωρείστε

Διαβάστε περισσότερα

Εξαγωγή κανόνων από αριθµητικά δεδοµένα

Εξαγωγή κανόνων από αριθµητικά δεδοµένα Εξαγωγή κανόνων από αριθµητικά δεδοµένα Συχνά το σύστηµα που θέλουµε να µοντελοποιήσουµε η να ελέγξουµε αντιµετωπίζεται ως µαύρο κουτί και η πληροφορία για τη λειτουργία του διατίθεται υπό µορφή ζευγών

Διαβάστε περισσότερα

«Κατηγοριοποίηση Ιστοσελίδων με Χρήση Τεχνικών Μηχανικής Μάθησης»

«Κατηγοριοποίηση Ιστοσελίδων με Χρήση Τεχνικών Μηχανικής Μάθησης» «Κατηγοριοποίηση Ιστοσελίδων με Χρήση Τεχνικών Μηχανικής Μάθησης» Η ιπλωµατική Εργασία παρουσιάστηκε ενώπιον του ιδακτικού Προσωπικού του Πανεπιστηµίου Αιγαίου Σε Μερική Εκπλήρωση των Απαιτήσεων για το

Διαβάστε περισσότερα

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Αντικείμενο Μελέτη και ανάπτυξη μεθόδων από τον χώρο της μηχανικής μάθησης για

Διαβάστε περισσότερα

Αλγόριθµοι και Πολυπλοκότητα

Αλγόριθµοι και Πολυπλοκότητα Αλγόριθµοι και Πολυπλοκότητα Ν. Μ. Μισυρλής Τµήµα Πληροφορικής και Τηλεπικοινωνιών, Πανεπιστήµιο Αθηνών Καθηγητής: Ν. Μ. Μισυρλής () Αλγόριθµοι και Πολυπλοκότητα 15 Ιουνίου 2009 1 / 26 Εισαγωγή Η ϑεωρία

Διαβάστε περισσότερα

HELECO 05. Αθανάσιος Νταγκούµας, Νίκος Λέττας, ηµήτρης Τσιαµήτρος, Γρηγόρης Παπαγιάννης, Πέτρος Ντοκόπουλος

HELECO 05. Αθανάσιος Νταγκούµας, Νίκος Λέττας, ηµήτρης Τσιαµήτρος, Γρηγόρης Παπαγιάννης, Πέτρος Ντοκόπουλος HELECO 05 ΟΙΚΟΝΟΜΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΕΣ ΕΠΙΠΤΩΣΕΙΣ ΑΠΟ ΤΗΝ ΕΦΑΡΜΟΓΗ ΕΝΟΣ ΣΥΣΤΗΜΑΤΟΣ ΙΑΧΕΙΡΙΣΗΣ ΚΑΤΑΝΑΛΩΣΗΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΣΕ ΕΥΡΩΠΑΪΚΟ ΕΠΙΠΕ Ο Αθανάσιος Νταγκούµας, Νίκος Λέττας, ηµήτρης Τσιαµήτρος,

Διαβάστε περισσότερα

Επέκταση του Ελληνικού WordNet µε Όρους Πληροφορικής και Σηµασιολογικές Σχέσεις Βασισµένες σε Μοντέλο Κατανόησης Κειµένου

Επέκταση του Ελληνικού WordNet µε Όρους Πληροφορικής και Σηµασιολογικές Σχέσεις Βασισµένες σε Μοντέλο Κατανόησης Κειµένου Επέκταση του Ελληνικού WordNet µε Όρους Πληροφορικής και Σηµασιολογικές Σχέσεις Βασισµένες σε Μοντέλο Κατανόησης Κειµένου Παναγιώτης Μπλίτσας 1 και Μαρία Γρηγοριάδου 2 1 ΠΜΣ «Βασική & Εφαρµοσµένη Γνωσιακή

Διαβάστε περισσότερα

Τεχνικές Εξόρυξης Δεδομένων

Τεχνικές Εξόρυξης Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:

Διαβάστε περισσότερα

Εργαστήριο Προγραμματισμού και τεχνολογίας Ευφυών συστημάτων (intelligence)

Εργαστήριο Προγραμματισμού και τεχνολογίας Ευφυών συστημάτων (intelligence) Εργαστήριο Προγραμματισμού και τεχνολογίας Ευφυών συστημάτων (intelligence) http://www.intelligence.tuc.gr Τμήμα Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Το εργαστήριο Ένα από τα 3 εργαστήρια του

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΜΕΤΑΔΟΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΛΙΚΩΝ Εξαγωγή χαρακτηριστικών μαστογραφικών μαζών και σύγκριση

Διαβάστε περισσότερα

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής: ΣΕΙΡΕΣ TAYLOR Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων Πολυώνυµο είναι κάθε συνάρτηση της µορφής: p( ) = a + a + a + a + + a, όπου οι συντελεστές α i θα θεωρούνται

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ: ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ: Η ΣΗΜΕΡΙΝΗ ΕΛΛΗΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ Ημερίδα παρουσίασης CLARIN-EL 1/10/2010 Πένυ Λαμπροπούλου Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ. "Αθηνά" ΧΑΡΤΟΓΡΑΦΗΣΗ ΧΩΡΟΥ ΓΤ ΓΙΑ ΚΑΕ Στο

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη ( )

Τεχνητή Νοημοσύνη ( ) Εβδομάδα Διάλεξη Ενδεικτικά θέματα διαλέξεων Ενδεικτικά θέματα εργαστηρίων/φροντιστηρίων 1 1 1 2 2 3 2 4 3 5 3 6 4 7 4 8 5 9 Τεχνητή Νοημοσύνη (2017-18) Γενικές πληροφορίες για το μάθημα. Εισαγωγή στην

Διαβάστε περισσότερα

Επίλυση Προβληµάτων µε Greedy Αλγόριθµους

Επίλυση Προβληµάτων µε Greedy Αλγόριθµους Επίλυση Προβληµάτων µε Greedy Αλγόριθµους Περίληψη Επίλυση προβληµάτων χρησιµοποιώντας Greedy Αλγόριθµους Ελάχιστα Δέντρα Επικάλυψης Αλγόριθµος του Prim Αλγόριθµος του Kruskal Πρόβληµα Ελάχιστης Απόστασης

Διαβάστε περισσότερα

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή Ανοικτή και Εξ Αποστάσεως Εκπαίδευση Χρησιµοποιώντας το Εκπαιδευτικό Περιβάλλον του MOODLE. Open and Distance Learning Using MOODLE Learning Environment Αθανάσιος Ι. Μάργαρης, Ευθύµιος. Κότσιαλος Πανεπιστήµιο

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Python & NLTK: Εισαγωγή

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Python & NLTK: Εισαγωγή ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Python & NLTK: Εισαγωγή Εισαγωγή Γιατί Python? Παρουσίαση NLTK Πηγές και χρήσιμα εργαλεία Φροντιστήριο σε Python Στο φροντιστήριο: Εισαγωγή στην Python Ζητήματα προγραμματισμού για

Διαβάστε περισσότερα

Ειδικές Επιστηµονικές Εργασίες

Ειδικές Επιστηµονικές Εργασίες Ειδικές Επιστηµονικές Εργασίες 2005-2006 1. Ανίχνευση προσώπων από ακολουθίες video και παρακολούθηση (face detection & tracking) Η ανίχνευση προσώπου (face detection) αποτελεί το 1 ο βήµα σε ένα αυτόµατο

Διαβάστε περισσότερα

Heapsort Using Multiple Heaps

Heapsort Using Multiple Heaps sort sort Using Multiple s. Λεβεντέας Χ. Ζαρολιάγκης Τµήµα Μηχανικών Η/Υ & Πληροφορικής 29 Αυγούστου 2008 sort 1 Ορισµός ify Build- 2 sort Πως δουλεύει Ιδιότητες 3 4 Προβλήµατα Προτάσεις Ανάλυση Κόστους

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 15η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ)

ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ) «ΣΠ0ΥΔΑI», Τόμος 47, Τεύχος 3o-4o, Πανεπιστήμιο Πειραιώς / «SPOUDAI», Vol. 47, No 3-4, University of Piraeus ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ) Υπό Γιάννης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία ΜΠΣ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΪΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ, ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάπτυξη λογισμικού σε γλώσσα προγραματισμού python για ομαδοποίηση

Διαβάστε περισσότερα

Είναι το ηλεκτρικό ρεύµα διανυσµατικό µέγεθος;

Είναι το ηλεκτρικό ρεύµα διανυσµατικό µέγεθος; Είναι το ηλεκτρικό ρεύµα διανυσµατικό µέγεθος; Για να εξετάσουµε το κύκλωµα LC µε διδακτική συνέπεια νοµίζω ότι θα πρέπει να τηρήσουµε τους ορισµούς που δώσαµε στα παιδιά στη Β Λυκείου. Ας ξεκινήσουµε

Διαβάστε περισσότερα

Τι είναι τα Συστήµατα Γεωγραφικών Πληροφοριών. (Geographical Information Systems GIS)

Τι είναι τα Συστήµατα Γεωγραφικών Πληροφοριών. (Geographical Information Systems GIS) Τι είναι τα Συστήµατα Γεωγραφικών Πληροφοριών (Geographical Information Systems GIS) ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ, ΤΜΗΜΑ ΓΕΩΓΡΑΦΙΑΣ ΧΑΛΚΙΑΣ ΧΡΙΣΤΟΣ Εισαγωγή στα GIS 1 Ορισµοί ΣΓΠ Ένα σύστηµα γεωγραφικών πληροφοριών

Διαβάστε περισσότερα

Α. ΤΕΙ ΚΡΗΤΗΣ Τµήµα Εφαρµοσµένης Πληροφορικής και Πολυµέσων Εργαστήριο Νευρωνικών Δικτύων

Α. ΤΕΙ ΚΡΗΤΗΣ Τµήµα Εφαρµοσµένης Πληροφορικής και Πολυµέσων Εργαστήριο Νευρωνικών Δικτύων Α. ΤΕΙ ΚΡΗΤΗΣ Τµήµα Εφαρµοσµένης Πληροφορικής και Πολυµέσων Εργαστήριο Νευρωνικών Δικτύων 5 BACKPROPAGATION MULTILAYER FEEDFORWARD ΔΙΚΤΥΑ Α. ΕΙΣΑΓΩΓΗ Τα νευρωνικά δίκτυα που εξετάσαµε µέχρι τώρα είχαν

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Πανεπιστήµιο Κύπρου Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Πανεπιστήµιο Κύπρου Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εργαστήριο Κυκλωµάτων και Μετρήσεων Εργαστήριο 6 Θεώρηµα Thevenin Λευκωσία, 2015 Εργαστήριο 6 Θεώρηµα Thevenin Σκοπός: Σκοπός

Διαβάστε περισσότερα

ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ. Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα

ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ. Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα πολυδιάστατου ψηφιακού σήµατος (Εικόνες Εικονοσειρές)» Πακέτο Εργασίας 1: Ανάπτυξη βάσης

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΙΣ Β ΣΕ Ε Σ Ι ΟΜΕΝ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ Β ΣΕ Ε Σ Ι ΟΜΕΝ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ Βασικές Έννοιες - εδοµένα { Νίκος, Μιχάλης, Μαρία, Θάλασσα, Αυτοκίνητο }, αριθµοί, π.χ. {1, 2, 3, 5, 78}, συµβολοσειρές (strings) π.χ. { Κώστας, 5621, ΤΡ 882, 6&5 #1, +

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Κεφάλαιο 9 ο Κ 5, 4 4, 5 0, 0 0,0 5, 4 4, 5. Όπως βλέπουµε το παίγνιο δεν έχει καµιά ισορροπία κατά Nash σε αµιγείς στρατηγικές διότι: (ΙΙ) Α Κ

Κεφάλαιο 9 ο Κ 5, 4 4, 5 0, 0 0,0 5, 4 4, 5. Όπως βλέπουµε το παίγνιο δεν έχει καµιά ισορροπία κατά Nash σε αµιγείς στρατηγικές διότι: (ΙΙ) Α Κ Κεφάλαιο ο Μεικτές Στρατηγικές Τώρα θα δούµε ένα παράδειγµα στο οποίο κάθε παίχτης έχει τρεις στρατηγικές. Αυτό θα µπορούσε να είναι η µορφή που παίρνει κάποιος µετά που έχει απαλείψει όλες τις αυστηρά

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις Παρασκευή 9 Ιανουαρίου 2007 5:00-8:00 εδοµένου ότι η

Διαβάστε περισσότερα

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems Ημερομηνία Παράδοσης: 0/1/017 την ώρα του μαθήματος ή με email: mkarabin@csd.uoc.gr Γενικές Οδηγίες α) Επιτρέπεται η αναζήτηση στο Internet και στην βιβλιοθήκη

Διαβάστε περισσότερα