ΑΝΑΖΗΤΗΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΕ ΑΔΟΜΗΤΑ ΔΙΚΤΥΑ ΟΜΟΤΙΜΩΝ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ. Υποβάλλεται στην
|
|
- Ἀλκαῖος Μελετόπουλος
- 8 χρόνια πριν
- Προβολές:
Transcript
1 ΑΝΑΖΗΤΗΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΕ ΑΔΟΜΗΤΑ ΔΙΚΤΥΑ ΟΜΟΤΙΜΩΝ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ Υποβάλλεται στην ορισθείσα από την Γενική Συνέλευση Ειδικής Σύνθεσης του Τμήματος Πληροφορικής Εξεταστική Επιτροπή από τον Βασίλειο Φωτόπουλο ως μέρος των Υποχρεώσεων για τη λήψη του ΜΕΤΑΠΤΥΧΙΑΚΟΥ ΔΙΠΛΩΜΑΤΟΣ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΕ ΕΞΕΙΔΙΚΕΥΣΗ ΣΤΟ ΛΟΓΙΣΜΙΚΟ Μάρτιος 2008
2 ii ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ Εισαγωγή Δομή της Διατριβής 6 ΚΕΦΑΛΑΙΟ 2. ΜΕΘΟΔΟΙ ΑΝΑΖΗΤΗΣΗΣ Περιβάλλον και Ορισμοί Forward Σχήμα Αναζήτησης Γενική Περιγραφή Βασικός Μηχανισμός Προώθησης Ερωτημάτων Ιδιότητα Εκμάθησης και Τυχαίες Προωθήσεις Ερωτημάτων Inverse Σχήμα Αναζήτησης Σύγκριση Ανάμεσα στο Inverse και στο Forward Σχήμα Αναζήτησης Βασικός Μηχανισμός Προώθησης Ερωτημάτων Ιδιότητα Εκμάθησης και Τυχαίες Προωθήσεις Ερωτημάτων 23 ΚΕΦΑΛΑΙΟ 3. ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ Εισαγωγικά Δημιουργία Δικτύου και Ερωτημάτων Σύγκριση των Σχημάτων με Βασικό Μηχανισμό Αναζήτησης k-walkers Κάθε Ερώτηση στο Q.S Απαντάται Δύσκολα Κάθε Ερώτηση στο Q.S Βρίσκει Απάντηση Αυξάνοντας το Πλήθος των Κόμβων Απάντησης ανά Ερώτημα στο Q.S Οι Caches Γεμίζουν με τον ίδιο Ρυθμό Σύγκριση των Σχημάτων με Βασικό Μηχανισμό Αναζήτησης k-walkers σε Δυναμικό Περιβάλλον Σύγκριση των Σχημάτων με Βασικό Μηχανισμό Αναζήτησης Constrained Flooding Σύγκριση Ανάμεσα σε Forward και Random Σχήμα με Βασικό Μηχανισμό Αναζήτησης k-walkers Σύνοψη Πειραμάτων 54 ΚΕΦΑΛΑΙΟ 4. ΣΧΕΤΙΚΗ ΔΟΥΛΕΙΑ 55 ΚΕΦΑΛΑΙΟ 5. ΣΥΜΠΕΡΑΣΜΑΤΑ 63 Σελ
3 iii ΕΥΡΕΤΗΡΙΟ ΠΙΝΑΚΩΝ Πίνακας Σελ Πίνακας 2.1 Περιεχόμενο της cache του κόμβου P μετά το τέλος εκτέλεσης της ερώτησης q 11 Πίνακας 2.2 Περιεχόμενο της cache του κόμβου Α μετά το τέλος εκτέλεσης της ερώτησης q 22 Πίνακας 3.1 Συμβολισμοί και ερμηνεία των παραμέτρων καθώς και τιμές για τις παραμέτρους που παραμένουν σταθερές σε όλες τις εκτελέσεις των πειραμάτων 30 Πίνακας 3.2 Τιμές παραμέτρων για τα πειράματα των ενοτήτων 3.3.1, 3.3.2, και αντίστοιχα 31 Πίνακας 3.3 Παράμετροι για το πείραμα Πίνακας 3.4 Παράμετροι για το πείραμα
4 iv ΕΥΡΕΤΗΡΙΟ ΣΧΗΜΑΤΩΝ Σχήμα Σελ Σχήμα 2.1 Παράδειγμα εκτέλεσης του Forward ì ηχανισμού αναζήτησης. Ο P υποβάλει την ερώτηση q ì ία χρονική στιγμή t. O Α 1 είναι ο ì οναδικός κόμβος στο δίκτυο που έχει στη LDC του έγγραφα που ικανοποιούν την q 10 Σχήμα 2.2 Το Πρόβλημα της επιλογής γειτόνων στο Forward σχήμα. Η πρώτη τυχαία επιλογή του P για μια q θα επηρεάσει ì ελλοντικές q παρόμοιες της q με αποτέλεσμα κάποιες διαδρομές να μην εξερευνώνται ποτέ 16 Σχήμα 2.3 Ο κόμβος C λαμβάνει σε 4 διαφορετικές χρονικές στιγμές T 1, T 2, T 3 και T 4 την ίδια ερώτηση q={t 1, t 2 }. Δίπλα σε κάθε κόμβο του δικτύου απεικονίζεται το πλήθος των εγγράφων που είναι σχετικά ως προς την q. Π.χ ο κόμβος A δεν έχει κανένα σχετικό έγγραφο ενώ ο κόμβος P 3 έχει Σχήμα 2.4 Ο P 1 υποβάλλει την q μια χρονική στιγμή t 1. Την χρονική στιγμή t 2 > t 1 ο P 2 υποβάλλει την q παρόμοια της q. Σε αυτό το περιβάλλον θεωρούμε ότι οι ερωτήσεις είναι διάσημες. Στα αριστερά απεικονίζεται η εκτέλεση των ερωτημάτων στο Forward ì ηχανισμό ενώ στα δεξιά στο Inverse. Με ans συμβολίζονται οι κόμβοι απάντησης ενώ με έντονη γραμμή απεικονίζονται ì ονοπάτια στα οποία οι κόμβοι εισάγουν στην cache ένα ερώτημα 19 Σχήμα 2.5 Ο P 1 υποβάλλει την q μια χρονική στιγμή t 1. Την χρονική στιγμή t 2 > t 1 ο P 2 υποβάλλει την q παρόμοια της q. Σε αυτό το περιβάλλον θεωρούμε ότι οι ερωτήσεις είναι σπάνιες. Στα αριστερά απεικονίζεται η εκτέλεση των ερωτημάτων στο Forward ì ηχανισμό ενώ στα δεξιά στο Inverse. Με ans συμβολίζονται οι κόμβοι απάντησης ενώ με έντονη γραμμή απεικονίζονται ì ονοπάτια στα οποία οι κόμβοι εισάγουν στην cache ένα ερώτημα 20 Σχήμα 3.1 Δεξιά εμφανίζεται η term locality για το Q.S 4% και αριστερά η term locality για Q.S 20%, κάθε μια ερώτηση αποτελείται από 2 όρους 32 Σχήμα 3.2 Σε δίκτυο με 1000 κόμβους υποβάλλονται 10 ξεχωριστές ερωτήσεις που επαναλαμβάνονται 100 φορές η κάθε μια. Κάθε μια ξεχωριστή ερώτηση την πρώτη φορά που υποβάλλεται βρίσκει κατά ì έσο όρο 0.36 κόμβους απάντησης. Οι παράμετροι του πειράματος απεικονίζονται στη στήλη του Πίνακα Σχήμα 3.3 Σε δίκτυο με 1000 κόμβους υποβάλλονται 10 ξεχωριστές ερωτήσεις που επαναλαμβάνονται 100 φορές η κάθε μια. Κάθε μια ξεχωριστή ερώτηση την πρώτη
5 v φορά που υποβάλλεται βρίσκει κατά ì έσο όρο 1 κόμβο απάντησης. Οι παράμετροι του πειράματος απεικονίζονται στη στήλη του πίνακα Σχήμα 3.4 Σε δίκτυο με 1000 κόμβους υποβάλλονται 10 ξεχωριστές ερωτήσεις που επαναλαμβάνονται 100 φορές η κάθε μια. Κάθε μια ξεχωριστή ερώτηση την πρώτη φορά που υποβάλλεται βρίσκει κατά ì έσο όρο 1.52 κόμβους απάντησης. Οι παράμετροι του πειράματος απεικονίζονται στη στήλη του πίνακα Σχήμα 3.5 Σε δίκτυο με 1000 κόμβους υποβάλλονται 10 ξεχωριστές ερωτήσεις που επαναλαμβάνονται 100 φορές η κάθε μια. Κάθε μια ξεχωριστή ερώτηση την πρώτη φορά που υποβάλλεται βρίσκει κατά ì έσο όρο 13 κόμβους απάντησης. Οι παράμετροι του πειράματος απεικονίζονται στη στήλη του πίνακα Σχήμα 3.6 To recall για τα τρία σχήματα αναζήτησης στην ì έγιστη τιμή του drop rate ίση με 30% 46 Σχήμα 3.7 Για κάθε ένα από τα τρία σχήματα αναζήτησης στα δεξιά απεικονίζονται τα συνολικά ì ηνύματα που παρήγαγε κατά ì έσο όρο κάθε ερώτημα ενώ στα δεξιά το recall. Κάθε καμπύλη σε κάθε γραφική αντιστοιχεί σε drop rate της τάξεως του 0%,10%,20% και 30% 47 Σχήμα 3.8 Σε δίκτυο με 1000 κόμβους υποβάλλονται 10 ξεχωριστές ερωτήσεις που επαναλαμβάνονται 100 φορές η κάθε μια. Κάθε μια ξεχωριστή ερώτηση την πρώτη φορά που υποβάλλεται βρίσκει κατά ì έσο όρο 3 κόμβους απάντησης. Οι παράμετροι του πειράματος απεικονίζονται στον πίνακα Σχήμα 3.9 Το Q.S είναι το ίδιο που χρησιμοποιήθηκε στο πείραμα Το ì έγεθος της αναζήτησης που πετυχαίνουν οι τεχνικές για κάθε μια ερώτηση είναι συγκρίσιμο με το πείραμα Σχήμα 3.10 Term locality για το Q.S 10x40 με 20%, κάθε μια ερώτηση αποτελείται από 2 όρους 51 Σχήμα 3.11 Σε ένα δίκτυο με 1000 κόμβους υποβάλλονται 10 ξεχωριστές ερωτήσεις από 10 διαφορετικούς κόμβους που ο κάθε ένας υποβάλλει κάθε ένα από τα ερωτήματα 40 φορές. Οι παράμετροι του πειράματος απεικονίζονται στο πίνακα
6 1 ΠΕΡΙΛΗΨΗ Βασίλειος Φωτόπουλος του Γεωργίου και της Παναγιώτας. MSc, Τμήμα Πληροφορικής, Πανεπιστήμιο Ιωαννίνων, Μάρτιος, Αναζήτηση Περιεχομένου σε Αδόμητα Δίκτυα Ομότιμων. Επιβλέποντες: Ευαγγελία Πιτουρά & Απόστολος Ζάρρας. Ένα από τα βασικότερα προβλήματα που έχει να αντιμετωπίσει η κοινότητα των αδόμητων ομότιμων συστημάτων (P2Ps) είναι η εύρεση αποτελεσματικών μεθόδων για την ανάκτηση πληροφορίας που διαμοιράζεται μεταξύ των κόμβων του δικτύου. Οι μέχρι τώρα προτεινόμενες μέθοδοι δεν κρίνονται αποτελεσματικές μιας και στηρίζονται κυρίως στην λογική της πλημμύρας ή σε κάποιο είδος γενικής (global) γνώσης που έχει κάθε κόμβος για το δίκτυο. Σε αυτή την διατριβή προτείνουμε μια καινούργια τεχνική αναζήτησης με πληροφορία, το Inverse σχήμα, για ανάκτηση πληροφορίας σε αδόμητα P2P δίκτυα. Η λογική του αλγορίθμου περιλαμβάνει δύο επιμέρους ιδέες: (1) Οι κόμβοι καταγράφουν σε μια cache που διατηρούν τοπικά τα ερωτήματα που υποβάλλονται στο δίκτυο από τους κόμβους της κοινότητας. (2) Κάθε νέο ερώτημα που υποβάλλεται, καθοδηγείται σε εκείνο το κομμάτι-τμήμα του δικτύου από όπου προέρχονται κόμβοι που υπέβαλλαν κατά το παρελθόν παρόμοια ερωτήματα. Το όνομα της τεχνικής αποδίδεται στο γεγονός ότι οι ερωτήσεις δεν κατευθύνονται προς τους κόμβους που έχουν την πληροφορία, αλλά σε αυτούς που σε μια προηγούμενη χρονική στιγμή την εντόπισαν. Ο κύριος ανταγωνιστής του Inverse σχήματος είναι ένα Forward σχήμα αναζήτησης το οποίο ακολουθεί την αντίστροφη λογική του Inverse. Πιο συγκεκριμένα, κάθε κόμβος καταγράφει στην cache του τα QueryHits μηνύματα που δημιουργούν και μεταδίδουν οι κόμβοι όταν απαντούν σε μια ερώτηση, γνωστοποιόντας με αυτόν τον τρόπο ένα κομμάτι της γνώσης τους. Στην συνέχεια κάθε νέο ερώτημα κατευθύνεται προς εκείνο το τμήμα του δικτύου στο οποίο κατά το παρελθόν υπήρξαν κόμβοι που ικανοποίησαν ένα παρόμοιο ερώτημα. Οι παραπάνω τεχνικές υλοποιήθηκαν με χρήση του προσομοιωτή OMNeT++ και συγκρίθηκαν σε διάφορα περιβάλλοντα. Τα αποτελέσματα δείχνουν πως αν και απλό, το Inverse σχήμα αναζήτησης χωρίς να κάνει χρήση QueryHits μηνυμάτων κατορθώνει και υπερτερεί έναντι του Forward σχήματος ως προς το recall. Δηλαδή, στο πλήθος των απαντήσεων που εντοπίζει μια ερώτηση ως προς το συνολικό πλήθος των αποτελεσμάτων που υπάρχουν για την συγκεκριμένη ερώτηση σε όλο το δίκτυο.
7 2 EXTENDED ABSTRACT IN ENGLISH Fotopoulos Bill. MSc, Computer Science Department, University of Ioannina, Greece. March Content Based Searching on Unstructured P2P Systems. Thesis Supervisors: Evaggelia Pitoura & Apostolos Zarras. Locating content in unstructured peer-to-peer networks is a challenging problem. Existing search mechanisms rely on either blind flooding queries to all peers, or routing queries to peers based on some form of global knowledge that each peer has about the network. Although flooding is robust and simple, it is not scalable. In this dissertation, we propose the Inverse searching schema which is an efficient, scalable yet simple mechanism for improving the information retrieval problem in unstructured P2P networks. The main idea of the Inverse schema consists of the following two concepts: (1) Each peer in the network keeps a local cache which contains the most recently submitted queries. (2) Each new query is forwarded to that region of the network where there is a peer which had previously submitted a similar query. The Inverse mechanism consists of four components: A cache which logs query messages coming from neighbors, a query similarity function which calculates the similarity of past queries against a new query, a ranking function which is an online neighbor ranking criterion and a basic searching mechanism which defines the way peers forward queries to selected neighbors. The main competitor of the Inverse schema is the Forward searching mechanism that follows a reverse logic. In particular, each peer forwards a new query to this region of the network where there is a peer which had previously provided an answer for a similar query. Each node reveals a piece of his content creating and forwarding a QueryHit message to the other peers of the community when he resolves a query. We implemented and compared the two searching mechanisms over various environments, using the OMNeT++ simulator. Our results indicate that Inverse mechanism outperforms Forward with respect to the well-known recall criterion (number of answers that a query found to the total number of results that exist in the network), without using QueryHits messages.
8 3 ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ 1.1 Εισαγωγή 1.2 Δομή της Διατριβής 1.1. Εισαγωγή Τα δίκτυα ομότιμων κόμβων (peer-to-peer systems (P2Ps)) είναι δίκτυα στα οποία κόμβοι έχοντας τον ρόλο τόσο του πελάτη (client) όσο και του εξυπηρετητή (server) ενώνονται με ακμές πάνω από το Διαδίκτυο (Internet) σχηματίζοντας με αυτόν τον τρόπο ένα ιδεατό (overlay) δίκτυο. Μέσα σε αυτά τα δίκτυα, κάθε κόμβος προσφέρει και αναζητεί ένα σύνολο πόρων που μπορεί να είναι από μια απλή συλλογή εγγράφων (μουσικά κομμάτια, βίντεο κτλ.) μέχρι και ένα σύνολο από υπηρεσίες (services). Τα κύρια χαρακτηριστικά των P2Ps είναι ο διπλός ρόλος του κάθε κόμβου στο δίκτυο, η μεγάλη κλιμάκωση (scale) όσον αφορά το πλήθος των κόμβων που συνδέονται μέσα σε αυτό και τέλος η δυναμικότητα ενός τέτοιου περιβάλλοντος μιας και κόμβοι εισέρχονται και εξέρχονται προς και από το δίκτυο κατά βούληση. Ένα από τα βασικότερα προβλήματα που έχει να αντιμετωπίσει ένας σχεδιαστής μιας P2P εφαρμογής είναι με ποιόν τρόπο θα δρομολογούνται τα ερωτήματα μέσα στο δίκτυο έτσι ώστε κάθε ερώτηση να εξετάζει (προωθείται σε) όσο το δυνατόν λιγότερους κόμβους μέχρι να ικανοποιηθεί. Αρχικά, η επιστημονική κοινότητα αντιμετώπισε το παραπάνω πρόβλημα κάτω από δυο οπτικές γωνίες. Στην πρώτη εξ αυτών συναντάμε τα δομημένα (structured) P2Ps π.χ CHORD [1] και CAN [2]. Σε αυτά τα συστήματα τόσο οι γείτονες κάθε κόμβου
9 4 που εισέρχεται στο σύστημα όσο και τα ίδια τα δεδομένα ορίζονται ρητά από το δοθέν πρωτόκολλο για το που οφείλουν να τοποθετηθούν. Το πλεονέκτημα τους είναι ότι η αναζήτηση είναι λογαριθμική, το μειονέκτημα τους συναντάται στο ότι το σύστημα δεν μπορεί να ανταπεξέλθει αποτελεσματικά όταν έχουμε μεγάλο ρυθμό αφίξεων και αναχωρήσεων κόμβων στοιχείο που είναι στενά συνδεδεμένο με την φύση αυτών των δικτύων. Στη δεύτερη περίπτωση συναντάμε τα αδόμητα (unstructured) P2Ps στα οποία δεν ορίζεται καμία δομή για το πως πρέπει να είναι συνδεδεμένοι οι κόμβοι στο δίκτυο ενώ η πληροφορία μπορεί να είναι οπουδήποτε. Οι λύσεις που έχουν δοθεί μπορεί να χωριστούν σε δύο κατηγορίες, στις τεχνικές αναζήτησης χωρίς πληροφορία (blind) και σε εκείνες με πληροφορία (informed). Χαρακτηριστικό παράδειγμα αναζήτησης χωρίς πληροφορία εκτελεί το σύστημα Gnutella [3] στο οποίο κάθε ερώτηση εξετάζει όλους τους κόμβους του δικτύου εωσότου ικανοποιηθεί. Μια παραλλαγή της πλημμύρας που εκτελεί η Gnutella και που σαν στόχο έχει να βελτιώσει την κλιμάκωση είναι οι k-random walkers [4] καθώς επίσης και παραλλαγές αυτού του σχήματος. Στις τεχνικές αναζήτησης με πληροφορία, στόχος είναι κάθε κόμβος να συντηρεί ευρετήρια (indexes) για το περιεχόμενο που φέρουν κάποιοι από τους κόμβους του συστήματος (π.χ οι γείτονες του) και έτσι με αυτόν τον τρόπο όταν έρχεται μια ερώτηση να συμβουλεύονται το ευρετήριο τους και να προωθούν το ερώτημα στους πιο κατάλληλους κόμβους, ήτοι σε αυτούς τους κόμβους που με μεγαλύτερη πιθανότητα σε σχέση με κάποιους άλλους θα ικανοποιήσουν την δοθείσα ερώτηση. Μια κοινή αδυναμία όλων των παραπάνω προσεγγίσεων είναι ότι περιορίζονται σε αναζήτηση βασιζόμενη σε κάποιο είδος αναγνωριστικού (match id-based searching) όπως για παράδειγμα το όνομα ενός αρχείου κάτι που σε σύγκριση με τις τωρινές μηχανές αναζήτησης θέτει έναν περιορισμό στις απαιτήσεις που έχει ένας χρήστης που επιθυμεί να πραγματοποιήσει πάνω σε ένα P2P σύστημα μια αναζήτηση περιεχομένου (content-based) μέσω ερωτήσεων που εκφράζονται με πολλαπλούς όρους (terms) ή λέξεις (words). Σε αυτήν την εργασία διερευνώνται τεχνικές αναζήτησης για ανάκτηση περιεχομένου σε αδόμητα P2P δίκτυα με τις ερωτήσεις να εκφράζονται μέσω λέξεων.
10 5 Αναφερόμαστε σε τεχνικές ì ε πληροφορία στις οποίες οι κόμβοι στο δίκτυο καταγράφουν τοπικά στις caches τους ερωτήσεις που υποβλήθηκαν κατά το παρελθόν και στην συνέχεια παρατηρώντας ομοιότητα μεταξύ νέων και παλιών ερωτημάτων προσπαθούν να κατευθύνουν το δοθέν ερώτημα σε εκείνον τον κόμβο που το περιεχόμενο του έχει μεγαλύτερη πιθανότητα να το ικανοποιήσει. Προτείνουμε μια καινούργια τεχνική αναζήτησης με πληροφορία, το Inverse σχήμα αναζήτησης, για ανάκτηση πληροφορίας σε αδόμητα P2P δίκτυα. Η λογική του αλγορίθμου βασίζεται σε δύο επιμέρους ιδέες: (1) Οι κόμβοι καταγράφουν σε μια cache που διατηρούν τοπικά τα ερωτήματα που υποβάλλονται στο δίκτυο από τους κόμβους της κοινότητας. (2) Κάθε νέο ερώτημα που υποβάλλεται, καθοδηγείται σε εκείνο το κομμάτι-τμήμα του δικτύου από όπου προέρχονται κόμβοι που ρώτησαν κατά το παρελθόν παρόμοια ερωτήματα. Το όνομα της τεχνικής αποδίδεται στο γεγονός ότι οι ερωτήσεις δεν κατευθύνονται προς τους κόμβους που έχουν την πληροφορία, αλλά σε αυτούς που σε μια προηγούμενη χρονική στιγμή την εντόπισαν. Ο κύριος ανταγωνιστής του Inverse σχήματος είναι ένα Forward σχήμα αναζήτησης το οποίο ακολουθεί την αντίστροφη λογική του Inverse. Πιο συγκεκριμένα, κάθε κόμβος καταγράφει στην cache του τα QueryHits μηνύματα που δημιουργούν και μεταδίδουν οι κόμβοι όταν απαντούν σε μια ερώτηση, γνωστοποιόντας με αυτόν τον τρόπο ένα κομμάτι της γνώσης τους. Στην συνέχεια κάθε νέο ερώτημα κατευθύνεται προς εκείνο το τμήμα του δικτύου στο οποίο κατά το παρελθόν υπήρξαν κόμβοι που ικανοποίησαν ένα παρόμοιο ερώτημα. Τόσο το Inverse όσο και το Forward σχήμα αναζήτησης ανήκουν στην κατηγορία των lazy αλγορίθμων μιας και η πληροφορία που κρατά και διατηρεί κάθε κόμβος στο σύστημα δεν απαιτεί για να αποκτηθεί κανένα επιπρόσθετο κόστος επικοινωνίας μεταξύ των κόμβων του P2P. Προφανώς η υπόθεση πάνω στην οποία στηρίζεται η παραπάνω λογική είναι ότι μέσα στο δίκτυο υποβάλλονται παρόμοιες μεταξύ τους ερωτήσεις (μεγάλο term locality) κάτι όμως που παρατηρείται εν γένει στα σημερινά συστήματα.
11 6 Ο στόχος της παρούσας εργασίας είναι διττός. Αρχικά θέλουμε να μελετήσουμε την συμπεριφορά του Inverse και Forward μηχανισμού αναζήτησης καθώς και να τα συγκρίνουμε σε διαφορετικά περιβάλλοντα. Επιπλέον, θέλουμε να εξετάσουμε γενικότερα αν η εφαρμογή της lazy-based λογικής σε ένα μηχανισμό αναζήτησης σε αδόμητα P2P δίκτυα μπορεί να βελτιώσει το recall του συστήματος σε σχέση με ένα τυχαίο μηχανισμό προώθησης των μηνυμάτων-ερωτημάτων Δομή της Διατριβής Η εργασία ακολουθεί στην συνέχεια την εξής δομή: Στο κεφάλαιο 2 αρχικά ορίζουμε το περιβάλλον κάτω από το οποίο θα εξετάσουμε τις προτεινόμενες τεχνικές αναζήτησης και στην συνέχεια προχωρούμε στην λεπτομερή περιγραφή τους. Στο κεφάλαιο 3 ακολουθεί ένα σύνολο πειραμάτων που πραγματοποιήθηκαν με σκοπό την σύγκριση των προτεινόμενων τεχνικών αναζήτησης. Στην συνέχεια στο κεφάλαιο 4 περιγράφεται ένα σύνολο σχετικών δουλειών. Τέλος, η διατριβή ολοκληρώνεται με την καταγραφή συμπερασμάτων και μελλοντικών επεκτάσεων της.
12 7 ΚΕΦΑΛΑΙΟ 2. ΜΕΘΟΔΟΙ ΑΝΑΖΗΤΗΣΗΣ 2.1 Περιβάλλον και Ορισμοί 2.2 Forward Σχήμα Αναζήτησης 2.3 Inverse Σχήμα Αναζήτησης 2.1. Περιβάλλον και Ορισμοί Θεωρούμε ένα αδόμητο P2P δίκτυο το οποίο αποτελείται από ένα σύνολο κόμβων {p 1,p 2,,p n }. Κάθε p i φέρει ένα μοναδικό id και συνδέεται άμεσα με ένα σύνολο κόμβων που αποτελούν τους γείτονες του στο δίκτυο. Επιπλέον κάθε p i φέρει μια συλλογή από έγγραφα (documents) τα οποία μπορεί να είναι οποιοσδήποτε πόρος που μπορεί να χαρακτηριστεί από ένα σύνολο όρων π.χ απλά έγγραφα, μουσικά αρχεία, βίντεο, υπηρεσίες κτλ. Στο εξής θα αναφερόμαστε στη συλλογή του p i ως Τοπική Συλλογή Εγγράφων (Local Document Collection (LDC)) θεωρώντας ότι αποτελείται από ένα σύνολο από έγγραφα LDC i = {d 1,d 2,,d m }. Όμοια με τους κόμβους έτσι και κάθε d i χαρακτηρίζεται από ένα id που είναι μοναδικό στο δίκτυο. Κάθε έγγραφο χαρακτηρίζεται από ένα σύνολο όρων (terms) από τα οποία αποτελείται-περιγράφεται, πιο συγκεκριμένα γράφουμε d i ={t 1, t 2, t n }. Μέσα στο P2P, κόμβοι υποβάλλουν ερωτήματα τα οποία αποτελούνται από ένα σύνολο όρων. Πιο συγκεκριμένα κάθε ερώτημα αναγνωρίζεται από ένα μοναδικό id και περιγράφεται ως εξής q i ={t 1,t 2,..t l }.
13 8 Θεωρούμε ότι ένα d i ικανοποιεί (ταιριάζει με) ένα q i αν και μόνο αν το q i είναι υποσύνολο του d i. Συνεπώς αναφερόμαστε σε συζευκτικές ερωτήσεις. Αντίστοιχα ένας κόμβος θεωρούμε ότι ικανοποιεί (είναι σχετικός με) ένα q i αν στην LDC του υπάρχει τουλάχιστον ένα d i το οποίο ταιριάζει με το q i. Θεωρώντας ότι μέσα σε ένα ρεύμα ερωτήσεων (query stream) υπάρχει μεγάλος βαθμός locality (όροι επαναλαμβάνονται συχνά) στόχος μας είναι να προτείνουμε lazy μεθόδους αναζήτησης οι οποίες θα εκμεταλλεύονται ομοιότητες μεταξύ των ερωτημάτων που υποβάλλονται με στόχο κάθε φορά να βελτιώνεται το recall. Το recall για μια ερώτηση q i ορίζεται ως το πλήθος των εγγράφων που εντοπίζει ο αλγόριθμος αναζήτησης ως προς το πλήθος των συνολικών, σχετικών ως προς την q i, εγγράφων που υπάρχουν σε όλο το δίκτυο. Θέτοντας το διαφορετικά, αν στο δίκτυο υποβληθούν n ως προς το πλήθος ίδιες (παρόμοιες) ερωτήσεις σε n διαφορετικές χρονικές στιγμές, επιθυμούμε το σύστημα μας να παρουσιάζει αύξηση στο recall. Ιδιότητα εκμάθησης: Θα λέμε ότι ένας προτεινόμενος μηχανισμός αναζήτησης εμφανίζει την ιδιότητα εκμάθησης αν το σύστημα που τον εφαρμόζει παρατηρεί αύξηση στο recall όταν υποβάλλονται σε αυτό ίδιες (παρόμοιες) ερωτήσεις Forward Σχήμα Αναζήτησης Ο Forward μηχανισμός αναζήτησης θεωρεί πως κάθε κόμβος στο δίκτυο διατηρεί μια cache στην οποία αποθηκεύει τις πιο πρόσφατες ερωτήσεις που υποβλήθηκαν κατά το παρελθόν. Βασική ιδέα του αλγορίθμου είναι η εξής: Μια δοθείσα ερώτηση q που φτάνει σε έναν κόμβο προωθείται προς εκείνον τον γείτονα του οποίου το υπογράφημα που ξεκινάει από αυτόν παρείχε απάντηση (ήταν σχετικό) ως προς μια ερώτηση q που υποβλήθηκε κατά το παρελθόν και είναι παρόμοια της q. Συνεπώς, η υπόθεση που κρύβεται πίσω από τη κεντρική ιδέα του Forward σχήματος είναι πως αν ένας κόμβος p είναι σχετικός ως προς μια ερώτηση q, ο ίδιος ο p θα είναι σε θέση να απαντήσει και μια ερώτηση q παρόμοια της q.
14 Γενική Περιγραφή Χωρίς να περιγράψουμε τον τρόπο με τον οποίο εκτελείται ο μηχανισμός προώθησης των ερωτημάτων του Forward σχήματος, στο σχήμα 2.1 δίνεται μια γενική εικόνα εκτέλεσης του μηχανισμού. Ο P υποβάλει μια δεδομένη χρονική στιγμή t στο δίκτυο μια ερώτηση q. Μια ερώτηση-μήνυμα q αποτελείται από τα παρακάτω πεδία: <QID, List of Terms, List of Peers, TTL} Το QID αποτελεί το αναγνωριστικό της ερώτησης και θεωρείται μοναδικό για κάθε ερώτηση που υποβάλλεται στο δίκτυο. Θεωρούμε ότι το QID αποτελείται από το id του κόμβου που υποβάλλει την ερώτηση σε συνδυασμό με έναν αύξοντα αριθμό για κάθε ερώτηση στο δίκτυο που υποβάλει ο συγκεκριμένος κόμβος. Στην συνέχεια υπάρχει μια λίστα από όρους στην οποία ο χρήστης περιγράφει τα έγγραφα που επιθυμεί να εντοπίσει. Το τρίτο πεδίο είναι μια λίστα από κόμβους οι οποίοι μέχρι στιγμής έχουν λάβει την ερώτηση. Τέλος, το TTL ορίζει το πλήθος των κόμβων που οφείλει να εξετάσει μια ερώτηση (βάθος αναζήτησης). Πιο συγκεκριμένα, ο κόμβος ερώτησης (querying) ορίζει μια συγκεκριμένη τιμή, στην συνέχεια κάθε ένας ενδιάμεσος κόμβος που λαμβάνει την ερώτηση ελαττώνει την τιμή του TTL κατά ένα, μόλις η τιμή του γίνει ίση με το 0 η ερώτηση διαγράφεται και η αναζήτηση σταματάει. Μόλις ένας κόμβος λάβει μια ερώτηση, αρχικά εξετάζει αν ο ίδιος έχει στην LDC του έγγραφα που την ικανοποιούν. Αν ναι (στο παράδειγμα ο A 1 ), τότε πλέον γίνεται απαντών (answering) κόμβος και δημιουργεί ένα QueryHit μήνυμα το οποίο ακολουθεί το αντίστροφο μονοπάτι της ερώτησης με στόχο να φτάσει στον κόμβο ερώτησης (στο παράδειγμα ο P). Το QueryHit μήνυμα αποτελείται από τα παρακάτω πεδία: <QID, List of Terms, List of Peers, Answering peer ID, List Of Relevant Documents> Τα πρώτα τρία πεδία είναι ίδια με αυτά του μηνύματος της ερώτησης και αντιγράφονται από αυτό στο QueryHit μήνυμα. Τα υπόλοιπα δυο πεδία είναι το id του κόμβου που παρέχει την απάντηση καθώς και μια λίστα με τα ids των εγγράφων που ικανοποιούν την ερώτηση.
15 10 Μόλις ο ερωτών κόμβος λάβει το QueryHit μήνυμα από έναν από τους γείτονες του ελέγχει να δει αν τα ids των εγγράφων που παρέχει ο απαντών κόμβος βρίσκονται ήδη στην LDC του. Αν όχι, δημιουργεί μια σύνδεση με τον απαντών κόμβο και κατεβάζει τα έγγραφα που δεν βρήκε στην LDC του. Διαφορετικά δεν κάνει καμία ενέργεια. A 1 P A q={t 1,t 2 } A 2 B Query B 1 B 2 QueryHit Σχήμα 2.1 Παράδειγμα εκτέλεσης του Forward ì ηχανισμού αναζήτησης. Ο P υποβάλει την ερώτηση q ì ία χρονική στιγμή t. O Α 1 είναι ο ì οναδικός κόμβος στο δίκτυο που έχει στη LDC του έγγραφα που ικανοποιούν την q Βασικός Μηχανισμός Προώθησης Ερωτημάτων Όταν ένας κόμβος λάβει ένα ερώτημα q, εκτελεί τοπικά και εντελώς αυτόνομα έναν αλγόριθμο μέσω του οποίου ταξινομεί τους γείτονες του ως προς το q. Στην ουσία αποδίδει σε κάθε έναν από τους γείτονες του ένα σκορ. Ο γείτονας με το μεγαλύτερο σκορ κρίνεται πιο σχετικός ως προς το δοθέν q και αυτό με την σειρά του προωθείται προς αυτόν. Η καρδιά του μηχανισμού προώθησης των ερωτημάτων στο Forward σχήμα αποτελείται από τα παρακάτω 4 τμήματα: 1. Μια cache στην οποία ο κάθε κόμβος καταγράφει για κάθε έναν από τους γείτονες του τα πιο πρόσφατα ερωτήματα για τα οποία παρείχαν απάντηση. 2. Μια συνάρτηση ομοιότητας για τον υπολογισμό ομοιότητας μεταξύ διαφορετικών ερωτημάτων που υποβάλλονται στο δίκτυο.
16 11 3. Μια συνάρτηση σκορ μέσω της οποίας κάθε κόμβος μόλις λαμβάνει μια ερώτηση θα υπολογίζει το σκορ που αντιστοιχεί σε κάθε γείτονα του ως προς το δοθέν ερώτημα. 4. Τέλος, ένας βασικός μηχανισμός αναζήτησης που θα ορίζει με ποιό τρόπο θα επικοινωνούν οι κόμβοι μεταξύ τους στο δίκτυο και δεν θα είναι άλλο από δυο ήδη γνωστά σχήματα αναζήτησης σε αδόμητα P2P: Τους k-walkers και ένα constrained flooding παρόμοιο με αυτό που χρησιμοποιεί η Gnutella [3]. Δομή και Διαχείριση της Cache Η cache του κάθε κόμβου στο δίκτυο γεμίζει μέσω των QueryHits μηνυμάτων. Για παράδειγμα η cache του P στο σχήμα 2.1 μετά το τέλος της ερώτησης q που υπέβαλλε θα φαίνεται όπως στον πίνακα 2.1: Πίνακας 2.1 Περιεχόμενο της cache του κόμβου P ì ετά το τέλος εκτέλεσης της ερώτησης q Query ID Set of Terms Connections & Timestamp Hits q {t 1,t 2 } B(0), A(5) Τ Κάθε εγγραφή της cache αντιστοιχεί σε μια ερώτηση που υποβλήθηκε στο δίκτυο. Για κάθε μια ερώτηση εκτός από το id της και το σύνολο των όρων που ουσιαστικά την αναγνωρίζουν μοναδικά καταγράφεται το πλήθος των εγγράφων που είδε ο κόμβος από κάθε γείτονα του. Τέλος, καταγράφεται και ένα timestamp που αφορά την πρώτη εμφάνιση QueryHit για μια ερώτηση. Η σωστή ερμηνεία του πίνακα 2.1 είναι η εξής: Από το υπογράφημα που ξεκινάει από τον γείτονα Α του P βρέθηκαν συνολικά 5 έγγραφα σχετικά με την q. Ενώ από το υπογράφημα που ξεκινάει από το γείτονα Β του P δεν βρέθηκε κανένα έγγραφο σχετικό με την q. Με αυτόν τον τρόπο εάν λάβει ο P στο μέλλον μια ερώτηση q παρόμοια ως προς την q θα είναι σε θέση να εκτιμήσει ποιος από τους γείτονες του (ή ποιο σωστά ποιο από τα υπογραφήματα που ξεκινούν από τους γείτονες του) είναι καταλληλότερος για να ικανοποιήσει την q.
17 12 Θα πρέπει να τονίσουμε ότι για την κάθε καταγεγραμμένη ερώτηση στην cache του κάθε κόμβου δεν υπάρχει η έννοια του βάθους της αναζήτησης. Για παράδειγμα ο P δεν γνωρίζει σε πόσα βήματα (hops) μακριά από τον γείτονα του A εντοπίστηκαν τα 5 σχετικά έγγραφα, ούτε επιπλέον γνωρίζουμε για το εάν αυτά τα 5 έγγραφα ανήκουν σε έναν ή παραπάνω από έναν κόμβους. Τέλος, όσον αφορά την replacement πολιτική που πρέπει να εφαρμοστεί επιλέγουμε να εκτελέσουμε τον αλγόριθμο LRU. Ποιο συγκεκριμένα κρατάμε στην cache ένα μέγιστο πλήθος από τις ποιο πρόσφατες ερωτήσεις που υποβλήθηκαν στο δίκτυο κατά το παρελθόν. Ανανεώνουμε το timestamp μιας ερώτησης q αν η τομή της με μια καινούργια q είναι διαφορετική του κενού συνόλου (ομοιότητα διαφορετική του 0). Ο λόγος της επιλογής του LRU σχήματος πέραν της απλότητας του ως προς την υλοποίηση κρίνεται κατάλληλος στο περιβάλλον μας αναλογιζόμενοι πρώτον τις συχνές αναχωρήσεις/εισόδους κόμβων από και προς το δίκτυο και δεύτερον για να πιάνουμε την term locality, παρόμοιες ερωτήσεις υποβάλλονται σε σχετικά κοντινό χρονικό διάστημα. Συνάρτηση Ομοιότητας Όπως τονίσαμε στην εισαγωγή της περιγραφής της Forward μεθόδου, όταν ένας κόμβος λάβει μια ερώτηση q οφείλει να υπολογίσει την ομοιότητα της q με όλες τις q ερωτήσεις που είναι την δεδομένη χρονική στιγμή στην cache του έτσι ώστε να εντοπίσει ποιος από τους γείτονες του έχει απαντήσει κατά το παρελθόν παρόμοιες ερωτήσεις ως προς την q. Αυτός λογικά θα μπορεί να απαντήσει καταλληλότερα και την ερώτηση q. Για να μπορούμε να υπολογίσουμε ομοιότητα μεταξύ ερωτημάτων θα χρησιμοποιήσουμε την ομοιότητα συνημίτονου. Η ομοιότητα συνημίτονου μεταξύ 2 διανυσμάτων-ερωτημάτων ορίζεται από την σχέση: q * q ' sim ( q, q' ). Είναι το εσωτερικό γινόμενο 2 διανυσμάτων q * q' προς το γινόμενο των νορμών τους, δίνοντας σαν σύνολο τιμών μια τιμή που ανήκει στο [0,1]. Όσο πιο κοντά στο 1 είναι η τιμή δυο ερωτημάτων τόσο πιο παρόμοια είναι μεταξύ τους.
18 13 Στο δικό μας περιβάλλον τα ερωτήματα που υπάρχουν στην cache ενός κόμβου μια δεδομένη χρονική στιγμή ορίζουν ένα διανυσματικό χώρο, όπου συνιστώσα-διάσταση είναι ένας όρος. Έτσι για παράδειγμα αν θεωρήσουμε ότι ένας κόμβος έχει στην cache του μια δεδομένη χρονική στιγμή 3 ερωτήματα τα q 1 ={t 1,t 2 }, q 2 ={t 1,t 3 } και q 3 ={t 4,t 5 } τότε οποιοδήποτε ερώτημα λάβει o κόμβος έστω το q ={t 4,t 7 } θα εκφραστεί με βάση το διάνυσμα {t 1,t 2,t 3,t 4,t 5,t 7 }. Συνεπώς το q θα γραφεί ως q ={0,0,0,1,0,1} ενώ τα υπάρχοντα ερωτήματα στην cache θα γραφούν ως q 1 ={1,1,0,0,0,0}, q 2 ={1,0,1,0,0,0} και q 3 ={0,0,0,1,1,0}. Να σημειώσουμε πως το μέτρο ομοιότητας που χρησιμοποιούμε είναι ανεξάρτητο της γενικής τεχνικής κάτι που σημαίνει ότι μπορεί να αντικατασταθεί από ένα οποιοδήποτε άλλο μέτρο και να αρχίσει πλέον να υπολογίζεται τοπικά από το κάθε κόμβο του συστήματος χωρίς να αλλάξει ο ευρύτερος μηχανισμός αναζήτησης. Παρόμοιες μετρικές που παρατίθενται στην λίστα [5], μπορεί να είναι το Jaccard coefficient, dice coefficient και το inner product. Επιπλέον, όπως τονίστηκε στην ενότητα 2.1, στην περίπτωση μας προσπαθούμε να επιλύουμε συζευκτικές ερωτήσεις συνεπώς δεν μας απασχολεί να χρησιμοποιήσουμε κάποιο μέτρο ομοιότητας μεταξύ ερωτημάτων και εγγράφων. Όπως ήδη έχουμε αναφέρει ένα έγγραφο θεωρείται σχετικό ως προς μια ερώτηση q αν απλά περιέχει όλους τους όρους της q. Συνάρτηση Σκορ Μόλις ένας κόμβος λάβει μια ερώτηση q υπολογίζει δυναμικά την συγκεκριμένη χρονική στιγμή, με βάση το περιεχόμενο της cache, ένα σκορ για κάθε έναν από τους γείτονες του. Οι γείτονες με το μεγαλύτερο σκορ αναγνωρίζονται ποιο σχετικοί ως προς την q συνεπώς σε αυτούς προωθείται η ερώτηση. Το μέτρο δίνεται από την σχέση: Score ( P, q ) sim ( q, q ) * R ( P, q ). i j queries answeared by p i Για να υπολογίσουμε την σχετικότητα ενός γείτονα P i ως προς μια q, υπολογίζουμε συναθροίστηκα την ομοιότητα ανάμεσα στην q και σε όλες τις ερωτήσεις (q j ) που j i j
19 14 είδαμε να απαντιόνται από το υπογράφημα που ξεκινάει από τον P i επί το πλήθος των αποτελεσμάτων (R(P i,q j )) που λάβαμε από τον P i. Είναι φανερό πως όσο περισσότερες όμοιες ερωτήσεις έχει απαντήσει ένας γείτονας και ταυτόχρονα όσο περισσότερα αποτελέσματα έχουμε λάβει από αυτόν τόσο μεγαλύτερο σκορ θα λάβει στην βαθμολόγηση (ranking). Με αυτόν τον τρόπο το σύστημα μας εκτελεί αναζήτηση με πληροφορία. Να σημειώσουμε τέλος πως στην περίπτωση που η cache είναι άδεια ή η νέα q που λαμβάνουμε είναι εντελώς ανόμοια με τις υπάρχουσες στην cache ερωτήσεις όλοι οι κόμβοι φέρουν το ίδιο σκορ που είναι ίσο με το μηδέν. Σε αυτήν την περίπτωση ο όλος μηχανισμός γίνεται τυχαίος. Δηλαδή η επιλογή των γειτόνων στους οποίους πρέπει να προωθηθεί η ερώτηση γίνεται με τυχαίο τρόπο. Βασικός Μηχανισμός Αναζήτησης Ο βασικός μηχανισμός αναζήτησης υλοποιεί τον τρόπο με τον οποίο οι κόμβοι επικοινωνούν-ανταλλάσουν μεταξύ τους μηνύματα. Σε αυτήν την περίπτωση θα θεωρήσουμε δύο υπάρχοντα γνωστά σχήματα τους k-walkers και ένα σχήμα constrained flooding. Στην ουσία μέσω αυτών των μηχανισμών ορίζεται το μέγεθος της αναζήτησης (search size) δηλαδή το πλήθος των κόμβων που εξετάζει κάθε ερώτημα που υποβάλλεται στο δίκτυο. Στην περίπτωση των k-walkers, ο ερωτών κόμβος αρχικά επιλέγει το πολύ k από τους γείτονες του για να προωθήσει την ερώτηση. Στην συνέχεια κάθε ένας από τους ενδιάμεσους κόμβους των k μονοπατιών επιλέγει έναν γείτονα του (διαφορετικό από αυτόν από τον οποίο έλαβε το ερώτημα) για να προωθήσει το ερώτημα έως ότου το πεδίο TTL γίνει ίσο με 0. Συνεπώς σε αυτήν την περίπτωση το μέγεθος της αναζήτησης είναι το πολύ k*ttl βήματα. Να σημειώσουμε ότι στην υλοποίηση μας θεωρούμε την απλή εκδοχή αυτού του σχήματος κάτι που σημαίνει ότι δεν ελέγχουμε για παράδειγμα αν τα μονοπάτια συμπίπτουν για να εξετάσουμε ακόμα περισσότερους διαφορετικούς κόμβους κ.ο.κ.
20 15 Στην περίπτωση του constrained flooding, ο κόμβος ερώτησης αλλά και κάθε ενδιάμεσος κόμβος που λαμβάνει μια ερώτηση την προωθεί σε ένα υποσύνολο των γειτόνων του. Στην υλοποίηση αυτού του μηχανισμού επιλέξαμε να είναι το 50% των γειτόνων του κάθε κόμβου. Ξανά όπως και πριν ο κόμβος που υποβάλλει το ερώτημα ορίζει το TTL που θα εκτελέσει η ερώτηση στο δίκτυο συνεπώς στην περίπτωση αυτή το μέγεθος της αναζήτησης ορίζεται σαν (d/2) 0 +(d/2) 1 + +(d/2) TTL, όπου d το μέσο πλήθος γειτόνων του κάθε κόμβου στο δίκτυο. Συνεπώς τα παραπάνω σχήματα ορίζουν το πλήθος των γειτόνων στους οποίους πρέπει να προωθηθεί μια ερώτηση, το με ποιόν τρόπο προκύπτουν αυτοί γίνεται με βάση την συνάρτηση σκορ που αναλύσαμε Ιδιότητα Εκμάθησης και Τυχαίες Προωθήσεις Ερωτημάτων Επειδή θέλουμε ο Forward μηχανισμός να έχει την ιδιότητα εκμάθησης οι πιο υποσχόμενες διαδρομές δεν μπορεί να επιλέγονται πάντα με βάση το σκορ που αποδίδει ένας κόμβος στους γείτονες του. Για να κατανοήσουμε το πρόβλημα θεωρούμε για παράδειγμα το P2P του σχήματος 2.2. Όταν ο P λάβει την ερώτηση q και έχει άδεια την cache ή υπάρχουν ερωτήσεις στην cache αλλά δεν είναι παρόμοιες με την q τότε η επιλογή του P γίνεται τυχαία για το που θα προωθηθεί η q. Αν επιλέξει τον A και C και λάβει από αυτούς κάποια αποτελέσματα στην συνέχεια οποιαδήποτε q παρόμοια της q θα οδηγείται συνεχώς προς τα υπογραφήματα που ορίζουν οι κόμβοι Α και C. Αυτό έχει σαν αποτέλεσμα οι άλλοι γείτονες (π.χ ο B) να μην εξερευνηθούν ποτέ αν κάθε φορά η επιλογή γίνεται με βάση την συνάρτηση σκορ. Συνεπώς στην περίπτωση των k-walkers ο κάθε κόμβος που αρχικοποιεί μια αναζήτηση επιλέγει οι μισοί από τους περίπατους να ακολουθήσουν τυχαίο μονοπάτι και οι άλλοι μισοί να προωθούν τα ερωτήματα χρησιμοποιώντας την πληροφορία της cache υπολογίζοντας δηλαδή σκορ για κάθε γείτονα. Όμοια στο σχήμα του constrained flooding ο κάθε κόμβος επιλέγει τους μισούς γείτονες με βάση την συνάρτηση σκορ ενώ τους υπόλοιπους τυχαία.
21 16 A B W P q C Σχήμα 2.2 Το πρόβλημα της επιλογής γειτόνων στο Forward σχήμα. Η πρώτη τυχαία επιλογή του P για μια q θα επηρεάσει ì ελλοντικές q παρόμοιες της q με αποτέλεσμα κάποιες διαδρομές να μην εξερευνώνται ποτέ Τέλος, θα δείξουμε μέσω παραδείγματος πως το Forward σχήμα στους k-walkers εμφανίζει την ιδιότητα εκμάθησης. Έστω ότι ο κόμβος C του δικτύου του σχήματος 2.3 συναντάται σε περιπάτους της ίδιας ερώτησης q={t 1,t 2 } η οποία υποβάλλεται στο δίκτυο 4 φορές από έστω 4 διαφορετικούς κόμβους τις χρονικές στιγμές T 1, T 2, T 3 και T 4. Τότε μια πιθανή εκτέλεση για τον C μπορεί να είναι η εξής: 1. O C είναι στο μονοπάτι και επιβάλλεται να κάνει τυχαία επιλογή και έστω επιλέγει τον P O C είναι στο μονοπάτι και επιβάλλεται να κάνει επιλογή με πληροφορία, επιλέγει τον P O C είναι στο μονοπάτι και επιβάλλεται να κάνει τυχαία επιλογή και έστω επιλέγει τον P O C είναι στο μονοπάτι και επιβάλλεται να κάνει επιλογή με πληροφορία, επιλέγει τον P 2 20 Οποιαδήποτε μελλοντική επιλογή με πληροφορία για όμοια ερώτηση θα δίνει 20 αποτελέσματα.
22 17 A 0 B 10 0 P 1 P 3 30 q={t 1,t 2 } (T 1 ) C P 2 20 q={t 1,t 2 } (T 2 ) q={t 1,t 2 } (T 3 ) q={t 1,t 2 } (T 4 ) P 1 10 Σχήμα 2.3 Ο κόμβος C λαμβάνει σε 4 διαφορετικές χρονικές στιγμές T 1, T 2, T 3 και T 4 την ίδια ερώτηση q={t 1, t 2 }. Δίπλα σε κάθε κόμβο του δικτύου απεικονίζεται το πλήθος των εγγράφων που είναι σχετικά ως προς την q. Π.χ ο κόμβος A δεν έχει κανένα σχετικό έγγραφο ενώ ο κόμβος P 3 έχει 30
23 Inverse Σχήμα Αναζήτησης Η βασική ιδέα του Inverse σχήματος αναζήτησης αποτελεί στην ουσία μια αντιστροφή του σκεπτικού που αναλύσαμε για το Forward σχήμα. Στο Inverse σχήμα οι κόμβοι καταγράφουν για κάθε ερώτηση που συναντούν, τον γείτονα από τον οποίο έφτασε η ερώτηση. Συνεπώς, στόχος του Inverse είναι να οδηγήσει τα ερωτήματα στους κόμβους εκείνους που προηγουμένως είχαν υποβάλλει παρόμοια ερωτήματα. Στο Inverse σχήμα αναζήτησης η υπόθεση του Forward αντιστρέφεται και αυτή με την σειρά της και ορίζεται πλέον ως εξής: ο κόμβος που ρωτάει κατά το παρελθόν ένα ερώτημα q, είναι σε θέση στο μέλλον να δώσει απάντηση για q παρόμοια του q. Με άλλα λόγια, σε αυτήν την περίπτωση γίνεται μια καταγραφή των ενδιαφερόντων που έχει κάθε κόμβος στο δίκτυο και εκφράζεται με βάση τις ερωτήσεις που αυτός πραγματοποιεί Σύγκριση Ανάμεσα στο Inverse και στο Forward Σχήμα Αναζήτησης Για να κατανοήσουμε καλύτερα το Inverse σχήμα και να εντοπίσουμε τις διαφορές του σε σχέση με το Forward θα περιγράψουμε δυο σενάρια εκτέλεσης των δύο τακτικών σε δύο διαφορετικά περιβάλλοντα όπως αυτά απεικονίζονται στα σχήματα 2.4 και 2.5 αντίστοιχα. Στα 2.4 (a) και 2.5 (a) εκτελείται το Forward σχήμα ενώ στα 2.4 (b) και 2.5 (b) το Inverse. Στο πρώτο περιβάλλον (σχήμα 2.4) θεωρούμε ότι υποβάλλεται μια ερώτηση q η οποία ικανοποιείται από ένα μεγάλο πλήθος κόμβων του δικτύου (διάσημη ερώτηση). Στο σχήμα 2.4 (a) εκτελείται το Forward σχήμα αναζήτησης, ο P 1 υποβάλει την q εκτελώντας έστω 3 περίπατους και έστω ότι σε κάθε περίπατο υπάρχει ένας κόμβος που ικανοποιεί την q (συμβολίζονται ως ans (answering peers)). Με έντονη γραμμή συμβολίζονται οι κόμβοι οι οποίοι εισάγουν στη cache τους την πληροφορία ότι ο κόμβος ans παρείχε απάντηση στην q. Στην συνέχεια ο P 2 υποβάλει μια ερώτηση q όμοια της q και εκτελεί και αυτός 3 έστω περιπάτους. Μόλις η q φτάνει στον P την οδηγεί προς τον κόμβο ans. Το ίδιο σενάριο εξελίσσεται και στο σχήμα 2.4 (b) με την διαφορά όμως ότι εδώ ακολουθείται το Inverse σχήμα. Συνεπώς μόλις η q προωθηθεί
24 19 στον P, ο P σε αυτήν την περίπτωση θα την οδηγήσει στον κόμβο που υπέβαλε την ερώτηση q κατά το παρελθόν, ήτοι στον P 1. Σε αυτό το σενάριο παρατηρούμε πως η πληροφορία που γίνεται cache λόγω της ερώτησης q είναι ίδια όσον αφορά στο πλήθος των κόμβων που την κατέγραψαν (οι caches γεμίζουν με τον ίδιο ρυθμό). Από την άλλη όμως παρατηρούμε πως το recall στη 2.4 (b) περίπτωση ενδέχεται να είναι μεγαλύτερο σε σχέση με αυτό της 2.4 (a). Θεωρείστε την περίπτωση που η q είναι ακριβώς ίδια με την q (similarity(q,q )=1). Σε αυτήν την περίπτωση ο P 2 θα συγκεντρώσει όλα τα έγγραφα που συγκέντρωσε ο P 1 μαζί με όλα εκείνα που θα συγκεντρώσει από τους δικούς του k τυχαίους περιπάτους. P 2, q P 2, q ans ans ans ans ans P ans P P 1, q P 1, q (a) Εκτέλεση Forward σχήματος (b) Εκτέλεση Inverse σχήματος Σχήμα 2.4 Ο P 1 υποβάλλει την q μια χρονική στιγμή t 1. Την χρονική στιγμή t 2 > t 1 ο P 2 υποβάλλει την q παρόμοια της q. Σε αυτό το περιβάλλον θεωρούμε ότι οι ερωτήσεις είναι διάσημες. Στα αριστερά απεικονίζεται η εκτέλεση των ερωτημάτων στο Forward ì ηχανισμό ενώ στα δεξιά στο Inverse. Με ans συμβολίζονται οι κόμβοι απάντησης ενώ με έντονη γραμμή απεικονίζονται ì ονοπάτια στα οποία οι κόμβοι εισάγουν στην cache ένα ερώτημα
25 20 Στο δεύτερο περιβάλλον (σχήμα 2.5) θεωρούμε ότι υποβάλλεται μια ερώτηση q η οποία ικανοποιείται από λίγους κόμβους του δικτύου (σπάνια ερώτηση). Αυτή η περίπτωση απεικονίζεται στα σχήματα 2.5 (a) και 2.5 (b) για Forward και Inverse σχήμα αναζήτησης αντίστοιχα. Σε αυτήν την περίπτωση αν η νέα ερώτηση q συναντήσει τον P, σε οποιοδήποτε από τα 2 σχήματα αναζήτησης το πλήθος των εγγράφων που θα εντοπίσει θα είναι το ίδιο. Όμως το πλήθος των κόμβων που καταγράφουν στις caches τους την ερώτηση q είναι μεγαλύτερο στο Inverse σχήμα παρά στο Forward (έντονες γραμμές). Αυτό σημαίνει ότι η πιθανότητα κάποια παρόμοια q να εντοπίσει έναν κόμβο P όπου κατέχει στην cache του πληροφορία για την q είναι μεγαλύτερη. Συνεπώς και εδώ το recall για την q στο Inverse σχήμα αναζήτησης φαίνεται να είναι μεγαλύτερο σε σχέση με αυτό του Forward. P 2, q P 2, q ans ans P P P 1, q (a) Εκτέλεση Forward σχήματος P 1, q (b) Εκτέλεση Inverse σχήματος Σχήμα 2.5 Ο P 1 υποβάλλει την q μια χρονική στιγμή t 1. Την χρονική στιγμή t 2 > t 1 ο P 2 υποβάλλει την q παρόμοια της q. Σε αυτό το περιβάλλον θεωρούμε ότι οι ερωτήσεις είναι σπάνιες. Στα αριστερά απεικονίζεται η εκτέλεση των ερωτημάτων στο Forward ì ηχανισμό ενώ στα δεξιά στο Inverse. Με ans συμβολίζονται οι κόμβοι απάντησης ενώ με έντονη γραμμή απεικονίζονται ì ονοπάτια στα οποία οι κόμβοι εισάγουν στην cache ένα ερώτημα
26 21 Η υπόθεση που γίνεται και στα δύο παραπάνω περιβάλλοντα, δηλαδή και στην περίπτωση κατά την οποία υποβάλλεται μια διάσημη ερώτηση αλλά και όταν υποβάλλεται μια σπάνια ερώτηση, είναι πως ο κόμβος ερώτησης P 1 βρίσκει πάντα έγγραφα κατά την αρχική αναζήτηση της q. Πρέπει να σημειώσουμε ότι στην περίπτωση κατά την όποια μια αναζήτηση είναι μη επιτυχής για μια ερώτηση q, τόσο το Forward όσο και το Inverse σχήμα δεν θα είναι σε θέση να εκτελέσουν αναζήτηση με πληροφορία για μελλοντική q παρόμοια της q. Πιο συγκεκριμένα, στην περίπτωση του Forward η cache θα είναι κενή, ενώ στην περίπτωση του Inverse η cache θα περιέχει μεν την q αλλά στην ουσία η αναζήτηση κατευθύνεται προς έναν κόμβο που δεν έχει σχετικά έγγραφα. Το τελευταίο όμως δεν σημαίνει ότι η q στην περίπτωση του Forward θα εντοπίσει μεγαλύτερο πλήθος σχετικών εγγράφων σε σχέση με την q, αντίθετα και οι δύο αναζητήσεις είναι τυχαίες. Απλά στην περίπτωση του Inverse υπάρχει ένα έξτρα αποθηκευτικό (storage) και επεξεργαστικό (processing) κόστος χωρίς κάποιο όφελος. Όπου όφελος, η εκτέλεση αναζήτησης με πληροφορία Βασικός Μηχανισμός Προώθησης Ερωτημάτων Στο Inverse σχήμα αναζήτησης δεν υπάρχει QueryHit μήνυμα όπως είχαμε στην περίπτωση του Forward. Εδώ οι caches των κόμβων γεμίζουν απλά και μόνο από την ερώτηση που λαμβάνουν. Μια ερώτηση-μήνυμα q αποτελείται από τα παρακάτω πεδία: <QID, List of Terms, TTL> Είναι ακριβώς το ίδιο μήνυμα με αυτό του Forward σχήματος μόνο που εδώ δεν εισέρχεται η λίστα με τους κόμβους που έχουν είδη λάβει την ερώτηση μιας και δεν υπάρχει QueryHit μήνυμα συνεπώς δεν υπάρχει και λόγος να κρατείται το αντίστροφο μονοπάτι που ακολούθησε η ερώτηση. Εδώ μόλις ένας κόμβος ικανοποιήσει μια q δημιουργεί σύνδεση με τον κόμβο που υπέβαλλε την ερώτηση δίνοντας του τα σχετικά ως προς την q έγγραφα.
27 22 Ο βασικός μηχανισμός του Inverse σχήματος αποτελείται από 4 τμήματα: 1. Μια cache στην οποία ο κάθε κόμβος καταγράφει για κάθε έναν από τους γείτονες του τις πιο πρόσφατες ερωτήσεις τις οποίες έλαβε από αυτούς. 2. Μια συνάρτηση ομοιότητας για τον υπολογισμό ομοιότητας μεταξύ διαφορετικών ερωτημάτων που υποβάλλονται στο δίκτυο. 3. Μια συνάρτηση σκορ μέσω της οποίας κάθε κόμβος μόλις λαμβάνει μια ερώτηση θα υπολογίζει το σκορ που αντιστοιχεί σε κάθε γείτονα του ως προς μια συγκεκριμένη ερώτηση. 4. Ένα βασικός μηχανισμός αναζήτησης που θα ορίζει με ποιόν τρόπο θα επικοινωνούν οι κόμβοι του δικτύου μεταξύ τους. Τα 2 και 4 είναι ακριβώς τα ίδια όπως περιγράφτηκαν στο Forward σχήμα αναζήτησης. Εκείνα τα τμήματα που διαφοροποιούνται λίγο είναι τα 1 και 3 τα οποία ορίζουμε παρακάτω. Δομή και Διαχείριση της Cache Η cache του κάθε κόμβου στο δίκτυο γεμίζει μέσω των ερωτημάτων-μηνυμάτων. Για παράδειγμα η cache του κόμβου Α στο σχήμα 2.1 αφότου λάβει την q από τον κόμβο P θα φαίνεται όπως στον πίνακα 2.2: Πίνακας 2.2 Περιεχόμενο της cache του κόμβου Α ì ετά το τέλος εκτέλεσης της ερώτησης q Query ID Set of Terms Peer from which Timestamp query received q {t 1,t 2 } P Τ Κάθε εγγραφή της cache αντιστοιχεί σε μια ερώτηση που υποβλήθηκε στο δίκτυο. Στην περίπτωση κατά την οποία ένας κόμβος λάβει την ίδια ερώτηση περισσότερες από μία φορές τότε θα εισάγει στην cache μόνο έναν γείτονα και συγκεκριμένα από τον πρώτο που την έλαβε. Η cache replacement πολιτική που θα εφαρμόσουμε και εδώ θα είναι ο LRU παρόμοια με το Forward σχήμα.
28 23 Η σωστή ερμηνεία του πίνακα 2.2 αναφέρει πως από το υπογράφημα που ξεκινάει από τον γείτονα P του Α υπάρχει ένας κόμβος μέσα σε αυτό που τον απασχόλησε κατά το παρελθόν (υπέβαλλε) μια ερώτηση q. Με αυτόν τον τρόπο εάν λάβει ο Α στο μέλλον μια ερώτηση q παρόμοια ως προς την q θα την οδηγήσει προς το υπογράφημα που ξεκινάει από τον P. Συνάρτηση Σκορ Όταν ένας κόμβος λάβει μια ερώτηση q τότε υπολογίζει το σκορ για κάθε γείτονα του με βάση την εξής συνάρτηση: Score ( P, q) sim( q, q) i j queries answeared by p i Σε σχέση με το αντίστοιχο κριτήριο του Forward ì ηχανισμού δεν υπάρχει στην συνάρτηση σκορ το πλήθος των εγγράφων που τελικά συγκέντρωσε κάθε ένας από τους κόμβους ερώτησης των q j ερωτημάτων που βρίσκονται στην cache. Συνεπώς σε αυτήν την περίπτωση, η q προωθείται σε εκείνο το υπογράφημα του όποιου οι κόμβοι ρώτησαν κατά το παρελθόν τις περισσότερες παρόμοιες ως προς την q ερωτήσεις. j Ιδιότητα Εκμάθησης και Τυχαίες Προωθήσεις Ερωτημάτων Στο Inverse σχήμα αναζήτησης επιθυμούμε όπως και στο Forward το recall του συστήματος να αυξάνεται όταν παρόμοιες ερωτήσεις υποβάλλονται σε αυτό. Όταν υποβάλλει ένας κόμβος μια ερώτηση στο δίκτυο και οι ενδιάμεσοι κόμβοι που λαμβάνουν την ερώτηση δεν μπορούν να επιτελέσουν προώθηση με πληροφορία (π.χ έχουν κενή cache) σε αυτήν την περίπτωση η προώθηση γίνεται με τυχαίο τρόπο. Αν και αυτή η τυχαία επιλογή στην αρχή επηρεάζει το recall για όλες τις επόμενες παρόμοιες ερωτήσεις που θα υποβληθούν, ο μηχανισμός του Inverse δεν χρησιμοποιεί QueryHits μηνύματα για να γνωρίζει πόσο είναι το πλήθος των εγγράφων που τελικά συγκέντρωσε ένα ερώτημα που υποβλήθηκε κατά το παρελθόν, απλά οδηγεί την νέα παρόμοια ερώτηση σε αυτόν. Συνεπώς με αυτόν τον τρόπο η πρώτη τυχαία επιλογή επηρεάζει το recall όλων των μελλοντικών παρόμοιων ερωτημάτων.
29 24 Πέρα όμως της πρώτης τυχαίας επιλογής εδώ παρατηρείται και ένα άλλο φαινόμενο που εμποδίζει την αύξηση του recall. Αν υποθέσουμε ότι έχουν υποβληθεί πολλές ίδιες ερωτήσεις στο δίκτυο τότε προωθώντας ένα ερώτημα μόνο προς κόμβους που κατά το παρελθόν υπέβαλαν παρόμοια ερωτήματα τότε στην ουσία η ερώτηση κατευθύνεται προς περιοχές που έχουν ήδη εξερευνηθεί. Συνεπώς κάθε νέα ερώτηση δεν θα είναι σε θέση να ανακαλύπτει καινούργια έγγραφα πλην εκείνων που συγκέντρωσαν οι προηγούμενοι κόμβοι ερώτησης. Για τους δυο παραπάνω λόγους και στο Inverse σχήμα αναζήτησης εκτός από τις προωθήσεις με πληροφορία επιλέγουμε να γίνονται και τυχαίες επιλογές γειτόνων για την προώθηση των ερωτημάτων. Ποιο συγκεκριμένα στην υλοποίηση των k-walkers ο κόμβος που υποβάλει την ερώτηση επιλέγει οι k/2 περίπατοι να επιτελέσουν αναζήτηση με πληροφορία (εάν καθίσταται δυνατό) ενώ οι άλλοι k/2 να κάνουν τυχαίες επιλογές. Όμοια στην περίπτωση του constrained flooding επιλέγουμε ο κάθε ενδιάμεσος κόμβος να επιλέγει τους μισούς γείτονες του με βάση την συνάρτηση σκορ (εάν καθίσταται δυνατό) και τους άλλους μισούς με τυχαίο τρόπο.
30 25 ΚΕΦΑΛΑΙΟ 3. ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ 3.1 Εισαγωγικά 3.2 Δημιουργία Δικτύου και Ερωτημάτων 3.3 Σύγκριση των Σχημάτων με Βασικό Μηχανισμό Αναζήτησης k-walkers 3.4 Σύγκριση των Σχημάτων με Βασικό Μηχανισμό Αναζήτησης k-walkers σε Δυναμικό Περιβάλλον 3.5 Σύγκριση των Σχημάτων με Βασικό Μηχανισμό Αναζήτησης Constrained Flooding 3.6 Σύγκριση Ανάμεσα σε Forward και Random Σχήμα με Βασικό Μηχανισμό Αναζήτησης k-walkers 3.7 Σύνοψη Πειραμάτων 3.1. Εισαγωγικά Σε αυτό το κεφάλαιο εκτελούμε μια σειρά πειραμάτων που σαν στόχο έχουν να συγκρίνουν κάτω από διαφορετικές οπτικές γωνίες τους αλγορίθμους αναζήτησης που περιγράψαμε στο 3 ο κεφάλαιο. Υλοποιήσαμε 3 διαφορετικούς αλγορίθμους αναζήτησης: 1. Random σχήμα αναζήτησης. 2. Inverse σχήμα αναζήτησης. 3. Forward σχήμα αναζήτησης. Ο κάθε αλγόριθμος υλοποιήθηκε με βασικό σχήμα αναζήτησης τους k-walkers και το constrained flooding σχήμα. Συνεπώς εξετάζουμε 6 διαφορετικές υλοποιήσεις.
31 26 Για την υλοποίηση των μεθόδων μας, χρησιμοποιήσαμε έναν ανοιχτού κώδικα προσομοιωτή τον ΟΜΝeΤ++[6]. Πρόκειται για ένα διακριτό βασιζόμενο σε γεγονότα (event-based) περιβάλλον προσομοίωσης υλοποιημένο σε γλώσσα C++ που χρησιμοποιείται ευρέως σε προσομοιώσεις δικτύων επικοινωνίας. Θεωρούμε 2 μετρικές πάνω στις οποίες θα πραγματοποιηθεί η σύγκριση των παραπάνω τεχνικών αναζήτησης: 1. Recall, ως προς μια ερώτηση q, είναι ο λόγος του πλήθους των εγγράφων που ανέκτησε ο αλγόριθμος ως προς το συνολικό πλήθος των σχετικών ως προς την q εγγράφων που υπάρχουν σε όλο το δίκτυο. 2. Overlapping recall, ορίζεται στην ουσία με τον ίδιον τρόπο που ορίζεται το recall μόνο που εδώ στον αριθμητή αθροίζονται όλες οι εμφανίσεις των εγγράφων ακόμα και για ένα συγκεκριμένο που εντοπίζεται πολλαπλές φορές. Διαφορετικά, στον αριθμητή δεν παίρνουμε τις μοναδικές εμφανίσεις κάθε εγγράφου αλλά το σύνολο των εμφανίσεων. Η πρώτη μετρική αποτελεί μια από τις κυριότερες μετρικές για αλγορίθμους αναζήτησης στο πεδίο της ανάκτησης πληροφορίας. Η δεύτερη μετρική αποτελεί για μας το μέτρο σύγκρισης ανάμεσα στον Random αλγόριθμο και τις 2 μεθόδους αναζήτησης με πληροφορία. Θέλουμε να τονίσουμε ότι οι 2 μέθοδοι αναζήτησης με πληροφορία που υλοποιούμε, τόσο δηλαδή το Forward όσο και το Inverse σχήμα σαν στόχο τους έχουν να αυξήσουν το overlapping recall. Το οποίο σημαίνει ότι εάν εξετάζουμε συνολικά x σε πλήθος κόμβους για μια ερώτηση q θέλουμε όσο το δυνατόν μεγαλύτερο ποσοστό από τους x να είναι σχετικοί ως προς την q. Θέλουμε δηλαδή να πούμε ότι οι μέθοδοι με αναζήτηση δεν κάνουν κάτι ιδιαίτερο ώστε να βρίσκουν συνεχώς και ξεχωριστά έγγραφα ο βασικός στόχος τους είναι απλά να βρίσκουν σχετικά έγγραφα. Προφανώς όσο ποιο μεγάλο είναι το overlapping recall τόσο θα αυξάνει και το recall. Συνεπώς αναφερόμαστε σε 2 κριτήρια τα οποία το μεν πρώτο δείχνει το πραγματικό κέρδος, όσο μεγαλύτερο τόσο καλύτερη και η μέθοδο που το εμφανίζει, ενώ το δεύτερο κριτήριο μαρτυρά την πληροφορία που χρησιμοποιεί κατά την προώθηση των ερωτημάτων η ì έθοδος αναζήτησης. Για να μπορέσουμε να συγκρίνουμε τους παραπάνω αλγορίθμους θα πρέπει όλοι να παρουσιάζουν το ίδιο μέγεθος αναζήτησης. Δηλαδή το μέσο πλήθος κόμβων που
32 27 εξετάζει κατά μέσο όρο κάθε ερώτηση πρέπει για όλες τις μεθόδους να είναι αν όχι ακριβώς το ίδιο, παρόμοιο. Όπως έχουμε ήδη αναφέρει το μέγεθος αναζήτησης για κάθε μέθοδο ορίζεται από το σχήμα των k-walkers ή αυτό του constrained flooding που θα χρησιμοποιήσουμε ανά περίσταση. Σε όλα τα πειράματα που πραγματοποιήσαμε, το ενδιαφέρον μας επικεντρώθηκε στους εξής δύο βασικούς άξονες: Πρώτον, θέλουμε να παρατηρήσουμε πως συμπεριφέρεται το Inverse σε σχέση με το Forward σχήμα ως προς το recall κάτω από διαφορετικά περιβάλλοντα. Δεύτερον, επιθυμούμε να δούμε τη συμπεριφορά του Random σχήματος σε σχέση με τις τακτικές αναζήτησης με πληροφορία. Θέλουμε δηλαδή να δούμε πόσο μια lazy-based αναζήτηση μπορεί να βελτιώσει το recall σε σχέση με μια απλοϊκή τυχαία επιλογή προώθησης μηνυμάτων Δημιουργία Δικτύου και Ερωτημάτων Θεωρούμε ως P2P δίκτυο ένα τυχαίο, μη κετευθυνόμενο γράφημα με συνολικό πλήθος κόμβων ίσο με 1000 και μέσο πλήθος γειτόνων για κάθε κόμβο ίσο με 5. Πιο συγκεκριμένα κάθε κόμβος έχει πιθανότητα 0.5% να συνδεθεί με έναν οποιοδήποτε άλλο κόμβο στο δίκτυο πλην του εαυτό του. Να σημειώσουμε ότι το δίκτυο σε όλα τα πειράματα-περιβάλλοντα που θα εκτελέσουμε θα είναι το ίδιο. Κάθε Σύνολο Ερωτήσεων (Query Set (Q.S)) που θα χρησιμοποιήσουμε αποτελείται από ένα σύνολο ξεχωριστών ερωτήσεων που θα επαναλαμβάνονται η κάθε μια εξ αυτών ένα σταθερό πλήθος φορών. Με αυτόν τον τρόπο αφενός μεν θα μπορέσουμε να επιτύχουμε ισχυρή locality στο ρεύμα ερωτήσεων, αφετέρου δε θα είναι και ελεγχόμενη, θα μπορούμε δηλαδή να διαπιστώσουμε πόσο μεγάλη η μικρή locality χρειάζονται οι αλγόριθμοι μας με πληροφορία για να βελτιώνουν το recall. Επιπλέον κάθε Q.S ορίζει και τον τρόπο με τον οποίο κατανέμονται τα έγγραφα στους κόμβους του δικτύου. Κάθε ένα Q.S έχει το ίδιο ποσοστό κόμβων που παρέχουν απάντηση σε κάθε μια από τις ερωτήσεις του Q.S. Αυτό το γεγονός το ορίζουμε ως Q.S x%, όπου x δηλώνει το % ποσοστό των κόμβων στο δίκτυο που
DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS
DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS Paper By: Gleb Skobeltsyn, Karl Aberer Presented by: Βασίλης Φωτόπουλος Agenda 1. Ορισμός του προβλήματος
Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας
Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας Σε ένα σύστημα φιλτραρίσματος πληροφορίας, ή αλλιώς σύστημα έκδοσης/συνδρομής, οι χρήστες εγγράφονται
Ανάκτηση Δεδομένων (Information Retrieval)
Ανάκτηση Δεδομένων (Information Retrieval) Παύλος Εφραιμίδης Βάσεις Δεδομένων Ανάκτηση Δεδομένων 1 Information Retrieval (1) Βάσεις Δεδομένων: Περιέχουν δομημένη πληροφορία: Πίνακες Ανάκτηση Πληροφορίας
HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems
HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems Ημερομηνία Παράδοσης: 0/1/017 την ώρα του μαθήματος ή με email: mkarabin@csd.uoc.gr Γενικές Οδηγίες α) Επιτρέπεται η αναζήτηση στο Internet και στην βιβλιοθήκη
Επεξεργασία Ερωτήσεων
Εισαγωγή Επεξεργασία Ερωτήσεων Σ Β Βάση εδομένων Η ομή ενός ΣΒ Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 1 Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 2 Εισαγωγή Εισαγωγή ΜΕΡΟΣ 1 (Χρήση Σ Β ) Γενική
Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής
Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Γιάννης Γαροφαλάκης Αν. Καθηγητής ιατύπωση του προβλήματος (1) Τα συστήματα αναμονής (queueing systems), βρίσκονται
Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά
Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων
Επεξεργασία Ερωτήσεων
Εισαγωγή Επεξεργασία Ερωτήσεων ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήματος 1. Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασμός) 2. Προγραμματισμός (Σχεσιακή Άλγεβρα, SQL) ημιουργία/κατασκευή Εισαγωγή εδομένων
Επεξεργασία Ερωτήσεων
Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Επεξεργασία Ερωτήσεων Αρχεία ευρετηρίου Κατάλογος συστήματος Αρχεία δεδομένων ΒΑΣΗ Ε ΟΜΕΝΩΝ Σύστημα Βάσεων εδομένων (ΣΒ ) Βάσεις Δεδομένων 2007-2008
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY6 - Συστήματα Ανάκτησης Πληροφοριών 007 008 Εαρινό Εξάμηνο Φροντιστήριο Retrieval Models Άσκηση Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα
Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Διπλωματική Εργασία με θέμα: Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού Καραγιάννης Ιωάννης Α.Μ.
Ανάκτηση Πληροφορίας
Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική
Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Εισαγωγή στην Επεξεργασία Ερωτήσεων Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα Βάσεις
Συστήματα Peer To Peer (P2P Systems) Γαλάνης Δημήτριος Παπαδημητρίου Χριστίνα
Συστήματα Peer To Peer (P2P Systems) Γαλάνης Δημήτριος Παπαδημητρίου Χριστίνα Τα Peer-To-Peer προσελκύουν το ενδιαφέρον Ακαδημαϊκά Προσπάθειες International Workshop on P2P Computing Global and P2P Computing
Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer
Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων
ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ - ΕΚΔΟΣΕΙΣ ΚΡΙΤΙΚΗ
Συναρτήσεις Προεπισκόπηση Κεφαλαίου Τα μαθηματικά είναι μια γλώσσα με ένα συγκεκριμένο λεξιλόγιο και πολλούς κανόνες. Πριν ξεκινήσετε το ταξίδι σας στον Απειροστικό Λογισμό, θα πρέπει να έχετε εξοικειωθεί
Ανάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Δρομολόγηση (Routing)
Δρομολόγηση (Routing) Περίληψη Flooding Η Αρχή του Βέλτιστου και Δυναμικός Προγραμματισμός ijkstra s Algorithm Αλγόριθμοi Δρομολόγησης Link State istance Vector Δρομολόγηση σε Κινητά Δίκτυα Δρομολόγηση
Εισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ Ε ΟΜΕΝΩΝ Αρχεία δεδομένων συστήματος Σύστημα Βάσεων εδομένων (ΣΒ ) 2 :
ΙΕΡΑΡΧΙΕΣ ΚΟΜΒΩΝ ΔΟΜΗΜΕΝΕΣ ΣΕ ΔΑΚΤΥΛΙΟ ΓΙΑ Ρ2Ρ ΣΥΣΤΗΜΑΤΑ ΒΑΣΙΣΜΕΝΑ ΣΕ RDF ΣΧΗΜΑΤΑ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ.
ΙΕΡΑΡΧΙΕΣ ΚΟΜΒΩΝ ΔΟΜΗΜΕΝΕΣ ΣΕ ΔΑΚΤΥΛΙΟ ΓΙΑ Ρ2Ρ ΣΥΣΤΗΜΑΤΑ ΒΑΣΙΣΜΕΝΑ ΣΕ RDF ΣΧΗΜΑΤΑ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ Υποβάλλεται στην ορισθείσα από την Γενική Συνέλευση Ειδικής Σύνθεσης του Τμήματος Πληροφορικής
ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων
Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας
Περιγραφή του εκπαιδευτικού/ μαθησιακού υλικού (Teaching plan)
On-the-fly feedback, Upper Secondary Περιγραφή του εκπαιδευτικού/ μαθησιακού υλικού (Teaching plan) Τάξη: Β Λυκείου Διάρκεια ενότητας Μάθημα: Φυσική Θέμα: Ταλαντώσεις (αριθμός Χ διάρκεια μαθήματος): 6X90
ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ
ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ ΠΛΟΣΚΑΣ ΝΙΚΟΛΑΟΣ Α.Μ. 123/04 ΕΠΙΒΛΕΠΩΝ: ΣΑΜΑΡΑΣ ΝΙΚΟΛΑΟΣ ΘΕΣΣΑΛΟΝΙΚΗ, ΙΟΥΝΙΟΣ 2007 Περιεχόμενα
Ο ΑΤΔ Λεξικό. Σύνολο στοιχείων με βασικές πράξεις: Δημιουργία Εισαγωγή Διαγραφή Μέλος. Υλοποιήσεις
Ο ΑΤΔ Λεξικό Σύνολο στοιχείων με βασικές πράξεις: Δημιουργία Εισαγωγή Διαγραφή Μέλος Υλοποιήσεις Πίνακας με στοιχεία bit (0 ή 1) (bit vector) Λίστα ακολουθιακή (πίνακας) ή συνδεδεμένη Είναι γνωστό το μέγιστο
Συνοπτική Μεθοδολογία Ασκήσεων IP Fragmentation. Ασκήσεις στο IP Fragmentation
Συνοπτική Μεθοδολογία Ασκήσεων IP Fragmentation Οι σημειώσεις που ακολουθούν περιγράφουν τις ασκήσεις IP Fragmentation που θα συναντήσετε στο κεφάλαιο 3. Η πιο συνηθισμένη και βασική άσκηση αναφέρεται
Ανάκτηση Πληροφορίας
Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing
Δροµολόγηση (Routing)
Δροµολόγηση (Routing) Περίληψη Flooding Η Αρχή του Βέλτιστου και Δυναµικός Προγραµµατισµός Dijkstra s Algorithm Αλγόριθµοi Δροµολόγησης Link State Distance Vector Δροµολόγηση σε Κινητά Δίκτυα Δροµολόγηση
ΚΕΦΑΛΑΙΟ 4. Τεχνική Ανίχνευσης του. Πτυχιακή Εργασία Σελίδα 95
ΚΕΦΑΛΑΙΟ 4 Τεχνική Ανίχνευσης του ICMP Echo Spoofing Πτυχιακή Εργασία Σελίδα 95 Περιεχόμενα ΕΙΣΑΓΩΓΗ 98 ΜΕΡΟΣ Α: Έλεγχος του Icmp Echo Reply Πακέτου 103 A.1. Ανίχνευση του spoofed Icmp Echo Request Πακέτου.
d dx ΠΑΡΑΓΩΓΟΣ ΣΥΝΑΡΤΗΣΗΣ
ΠΑΡΑΓΩΓΟΣ ΣΥΝΑΡΤΗΣΗΣ α) Η παράγωγος μιας συνάρτησης = f() σε ένα σημείο 0 εκφράζει το ρυθμό μεταβολής της συνάρτησης (ή τον παράγωγο αριθμό) στο σημείο 0. β) Γραφικά, η παράγωγος της συνάρτησης στο σημείο
Ανάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
3. Προσομοίωση ενός Συστήματος Αναμονής.
3. Προσομοίωση ενός Συστήματος Αναμονής. 3.1. Διατύπωση του Προβλήματος. Τα συστήματα αναμονής (queueing systems), βρίσκονται πίσω από τα περισσότερα μοντέλα μελέτης της απόδοσης υπολογιστικών συστημάτων,
Μελέτη Aποδοτικών Tρόπων Διαχείρισης Profiles σε Συστήματα Publish/Subscribe
Μελέτη Aποδοτικών Tρόπων Διαχείρισης Profiles σε Συστήματα Publish/Subscribe Μαρίνα Δρόσου Μυρτώ Ντέτσικα Γρηγόριος Τζώρτζης {mdrosou, mntetsik, gtzortzi} @ cs.uoi.gr Τμήμα Πληροφορικής, Πανεπιστήμιο Ιωαννίνων
9. Συστολικές Συστοιχίες Επεξεργαστών
Κεφάλαιο 9: Συστολικές συστοιχίες επεξεργαστών 208 9. Συστολικές Συστοιχίες Επεξεργαστών Οι συστολικές συστοιχίες επεξεργαστών είναι επεξεργαστές ειδικού σκοπού οι οποίοι είναι συνήθως προσκολλημένοι σε
App Inventor 3ο Μάθημα (Ζάρια - επέκταση)
App Inventor 3ο Μάθημα (Ζάρια - επέκταση) Μεταβλητές Δομή επιλογής If then Λογικές συνθήκες Στο μάθημα αυτό θα επεκτείνουμε την εφαρμογή ζάρια που αναπτύξαμε στο πρώτο μάθημα ώστε να εμφανίζει μήνυμα επιτυχίας
Ανάκτηση Πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 4: Μοντελοποίηση: Διανυσματικό μοντέλο Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ
ΑΡΧΗ 1ης ΣΕΛΙ ΑΣ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΑΓΩΝΙΣΜΑ ΠΕΡΙΟΔΟΥ : ΦΕΒΡΟΥΑΡΙΟΥ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ : 7 ΘΕΜΑ Α :
Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα 2 Βήματα Επεξεργασίας Τα βασικά βήματα στην επεξεργασία
ΘΕΜΑ 1: Αλγόριθμος Ford-Fulkerson
ΘΕΜΑ : Αλγόριθμος Ford-Fulkerson Α Να εξετάσετε αν ισχύει η συνθήκη συντήρησης της αρχικής ροής στο δίκτυο. Β Με χρήση του αλγορίθμου Ford-Fulkerson να βρεθεί η μέγιστη ροή που μπορεί να σταλεί από τον
Search and Replication in Unstructured Peer-to-Peer Networks
Search and Replication in Unstructured Peer-to-Peer Networks Presented in P2P Reading Group in 11/10/2004 Abstract: Τα µη-κεντρικοποιηµένα και µη-δοµηµένα Peer-to-Peer δίκτυα όπως το Gnutella είναι ελκυστικά
Ανάκτηση πολυμεσικού περιεχομένου
Ανάκτηση πολυμεσικού περιεχομένου Ανίχνευση / αναγνώριση προσώπων Ανίχνευση / ανάγνωση κειμένου Ανίχνευση αντικειμένων Οπτικές λέξεις Δεικτοδότηση Σχέσεις ομοιότητας Κατηγοριοποίηση ειδών μουσικής Διάκριση
ΣΥΝΕΚΤΙΚΟΤΗΤΑ ΓΡΑΦΗΜΑΤΩΝ
Συνεκτικότητα Γραφημάτων 123 ΚΕΦΑΛΑΙΟ 4 ΣΥΝΕΚΤΙΚΟΤΗΤΑ ΓΡΑΦΗΜΑΤΩΝ 4.1 Τοπική και Ολική Συνεκτικότητα Γραφημάτων 4.2 Συνεκτικότητα Μη-κατευθυνόμενων Γραφημάτων 4.3 Συνεκτικότητα Κατευθυνόμενων Γραφημάτων
ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ
Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 18 ου Πανελληνίου Συνεδρίου Στατιστικής (2005) σελ.247-256 ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ ΣΥΜΠΤΩΣΕΩΝ
Ερώτηση 1 η μεταγωγής κυκλώματος? : Ποια είναι τα κύρια χαρακτηριστικά της. Ερώτηση 2 η : Ποια είναι τα κύρια χαρακτηριστικά της μεταγωγής μηνύματος?
Μετάδοση Δεδομένων Δίκτυα Υπολογιστών 68 Ερώτηση 1 η μεταγωγής κυκλώματος? : Ποια είναι τα κύρια χαρακτηριστικά της Απάντηση : Στα δίκτυα μεταγωγής κυκλώματος (circuit switching networks), η μετάδοση των
Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)
Μαθηματικά Ενότητα 2: Διαφορικός Λογισμός Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό
Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2016-17 Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα) http://mixstef.github.io/courses/csintro/ Μ.Στεφανιδάκης Αφηρημένες
Έστω ένας πίνακας με όνομα Α δέκα θέσεων : 1 η 2 η 3 η 4 η 5 η 6 η 7 η 8 η 9 η 10 η
Μονοδιάστατοι Πίνακες Τι είναι ο πίνακας γενικά : Πίνακας είναι μια Στατική Δομή Δεδομένων. Δηλαδή συνεχόμενες θέσεις μνήμης, όπου το πλήθος των θέσεων είναι συγκεκριμένο. Στις θέσεις αυτές καταχωρούμε
Peer-to-Peer Technology
Peer-to-Peer Technology Συστήµατα Peer to Peer Καταργούν την αρχιτεκτονική Client-Server Στηρίζονται στην οµότιµη και εθελοντική συµπεριφορά των διαφόρων κόµβων Client Server Συστήµατα Peer to Peer Καταργούν
1. Σε ένα τουρνουά με 8 παίκτες μπορεί οι παίκτες να συμμετείχαν σε: 6,5,4,4,4,3,1,1 αγώνες αντίστοιχα;
Ασκήσεις υποδειγματικές για το θεωρητικό μέρος του μαθήματος Α1. Εξετάστε αν είναι Σωστή ή Λάθος κάθε μία από τις επόμενες προτάσεις. Εξηγείστε την απάντησή σας. 1. Σε ένα τουρνουά με 8 παίκτες μπορεί
ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ
Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ
Εργαστήριο 6 ο 7 ο / Ερωτήματα Ι
Εργαστήριο 6 ο 7 ο / Ερωτήματα Ι Απλά ερωτήματα Επιλογής Ερωτήματα με Ενώσεις πινάκων Ερωτήματα με Παραμετρικά Κριτήρια Ερωτήματα με Υπολογιζόμενα πεδία Απλά ερωτήματα Επιλογής Τα Ερωτήματα μας επιτρέπουν
Διαχρονικές δομές δεδομένων
Διαχρονικές δομές δεδομένων Μια τυπική δομή δεδομένων μεταβάλλεται με πράξεις εισαγωγής ή διαγραφής Π.χ. κοκκινόμαυρο δένδρο εισαγωγή 0 18 0 5 39 73 1 46 6 80 Αποκατάσταση ισορροπίας 5 39 73 0 46 6 80
Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων
Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Άσκηση 1 α) Η δομή σταθμισμένης ένωσης με συμπίεση διαδρομής μπορεί να τροποποιηθεί πολύ εύκολα ώστε να υποστηρίζει τις
ΑΣΚΗΣΗ 6 Συνδεσμολογία Αντιστάσεων ΙI (αντιστάσεις σε παράλληλη σύνδεση) Σκοπός
ΑΣΚΗΣΗ 6 Συνδεσμολογία Αντιστάσεων ΙI (αντιστάσεις σε παράλληλη σύνδεση) Σκοπός Σκοπός της άσκησης αυτής είναι ο σπουδαστής να μπορέσει να σχεδιάζει κύκλωμα αντιστάσεων σε παράλληλη σύνδεση και να μετράει
0 The quick brown fox leaped over the lazy lazy dog 1 Quick brown foxes leaped over lazy dogs for fun
Κ24: Προγραμματισμός Συστήματος - 1η Εργασία, Εαρινό Εξάμηνο 2018 Προθεσμία Υποβολής: Κυριακή 18 Μαρτίου, 23:59 Εισαγωγή Στην εργασία αυτή θα υλοποιήσετε μία μίνι μηχανή αναζήτησης (search engine). Οι
SilverPlatter WebSPIRS 4.1.
WebSPIRS 4.1. Η υπηρεσία WebSPIRS από τη SilverPlatter αποτελεί ένα φιλικό εργαλείο πρόσβασης και αναζήτησης σε περιεχόμενα βάσεων δεδομένων. Η Βιβλιοθήκη και Κέντρο Πληροφόρησης του Πανεπιστημίου Θεσσαλίας
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ 2013-2014
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ 2013-2014 Επιμέλεια: Ομάδα Διαγωνισμάτων από το Στέκι των Πληροφορικών Θέμα Α A1. Να γράψετε στο τετράδιό σας τους
Μη γράφετε στο πίσω μέρος της σελίδας
Εισαγωγή στο Σχεδιασμό & την Ανάλυση Αλγορίθμων Εξέταση Φεβρουαρίου 2016 Σελ. 1 από 7 Στη σελίδα αυτή γράψτε μόνο τα στοιχεία σας. Γράψτε τις απαντήσεις σας στις επόμενες σελίδες, κάτω από τις αντίστοιχες
Θέμα: Ανάπτυξη Βασικής Πλατφόρμας για Υπηρεσίες με Βάση το Προφίλ και τη Θέση (Profile & Location Based Services)
Θέμα: Ανάπτυξη Βασικής Πλατφόρμας για Υπηρεσίες με Βάση το Προφίλ και τη Θέση (Profile & Location Based Services) Επιβλέπων καθηγητής: Ι. Βασιλείου Συγγραφείς: Ιωάννης Κολτσίδας, Παναγιώτης Παπαδημητρίου
A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks
P2P 1,a) 1 1 1 P2P P2P P2P P2P A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks NARISHIGE Yuki 1,a) ABE Kota 1 ISHIBASHI Hayato 1 MATSUURA Toshio 1
ΑΠΟΔΟΤΙΚΗ ΑΠΟΤΙΜΗΣΗ ΕΡΩΤΗΣΕΩΝ OLAP Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ. Υποβάλλεται στην
ΑΠΟΔΟΤΙΚΗ ΑΠΟΤΙΜΗΣΗ ΕΡΩΤΗΣΕΩΝ OLAP Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ Υποβάλλεται στην ορισθείσα από την Γενική Συνέλευση Ειδικής Σύνθεσης του Τμήματος Πληροφορικής Εξεταστική Επιτροπή από την Χαρά Παπαγεωργίου
ΤΕΙ Κρήτης, Παράρτηµα Χανίων
ΠΣΕ, Τµήµα Τηλεπικοινωνιών & ικτύων Η/Υ Εργαστήριο ιαδίκτυα & Ενδοδίκτυα Η/Υ ( ηµιουργία συστήµατος µε ροint-tο-ροint σύνδεση) ρ Θεοδώρου Παύλος Χανιά 2003 Περιεχόµενα 1 ΕΙΣΑΓΩΓΗ...2 2 ΤΟ ΚΑΝΑΛΙ PΟINT-TΟ-PΟINT...2
ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007
Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΊΔΡΥΜΑ ΑΘΗΝΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΒΙΟΪΑΤΡΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΊΔΡΥΜΑ ΑΘΗΝΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΒΙΟΪΑΤΡΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΗΛΕΚΤΡΙΚΑ ΚΥΚΛΩΜΑΤΑ ΚΑΙ ΜΕΤΡΗΣΕΙΣ ΣΤΗ ΒΙΟΪΑΤΡΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 6: ΠΑΡΑΛΛΗΛΗ
Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ
Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΚΑΙ ΣΠΟΥΔΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ (Α ΜΕΡΟΣ: ΣΥΝΑΡΤΗΣΕΙΣ) Επιμέλεια: Καραγιάννης Ιωάννης, Σχολικός Σύμβουλος Μαθηματικών
II. Συναρτήσεις. math-gr
II Συναρτήσεις Παντελής Μπουμπούλης, MSc, PhD σελ blogspotcom, bouboulismyschgr ΜΕΡΟΣ 1 ΣΥΝΑΡΤΗΣΕΙΣ Α Βασικές Έννοιες Ορισμός: Έστω Α ένα υποσύνολο του συνόλου των πραγματικών αριθμών R Ονομάζουμε πραγματική
ΕΦΑΡΜΟΓΕΣ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ
ΕΦΑΡΜΟΓΕΣ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Dr. Christos D. Tarantilis Associate Professor in Operations Research & Management Science http://tarantilis.dmst.aueb.gr/ ΕΦΑΡΜΟΓΕΣ ΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Ι - 1- ΕΦΑΡΜΟΓΕΣΔΙΟΙΚΗΤΙΚΗΣΕΠΙΣΤΗΜΗΣ&
ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΕΝΝΟΙΩΝ ΕΝΤΑΣΗ ΚΑΙ ΔΥΝΑΜΙΚΟ ΣΕ ΗΛΕΚΤΡΙΚΟ ΠΕΔΙΟ ΠΟΥ ΔΗΜΙΟΥΡΓΕΙΤΑΙ ΑΠΟ ΔΥΟ ΣΗΜΕΙΑΚΑ ΦΟΡΤΙΑ
2 Ο ΣΥΝΕΔΡΙΟ ΣΤΗ ΣΥΡΟ ΤΠΕ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ 475 ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΕΝΝΟΙΩΝ ΕΝΤΑΣΗ ΚΑΙ ΔΥΝΑΜΙΚΟ ΣΕ ΗΛΕΚΤΡΙΚΟ ΠΕΔΙΟ ΠΟΥ ΔΗΜΙΟΥΡΓΕΙΤΑΙ ΑΠΟ ΔΥΟ ΣΗΜΕΙΑΚΑ ΦΟΡΤΙΑ Μαστρογιάννης Αθανάσιος Εκπαιδευτικός Δευτεροβάθμιας
Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub
Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub Σύνοψη Σ αυτό το κεφάλαιο θα περιγράψουμε τη δημιουργία φορμών, προκειμένου να εισάγουμε δεδομένα και να εμφανίζουμε στοιχεία από τους πίνακες
Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων
Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Σε αυτό το κεφάλαιο παρουσιάζουµε 2 βασικούς αλγορίθµους σύγκρισης ακολουθιών Βιολογικών εδοµένων τους BLAST & FASTA. Οι δυο αλγόριθµοι
Σειρά Προβλημάτων 3 Λύσεις
Σειρά Προβλημάτων 3 Λύσεις Άσκηση 1 Να δώσετε ασυμφραστικές γραμματικές που να παράγουν τις πιο κάτω γλώσσες: (α) {0 n 1 n n > 0} {0 n 1 2n n > 0} (β) {w {a,b} * η w ξεκινά και τελειώνει με το ίδιο σύμβολο
Κατακερματισμός. 4/3/2009 Μ.Χατζόπουλος 1
Κατακερματισμός 4/3/2009 Μ.Χατζόπουλος 1 H ιδέα που βρίσκεται πίσω από την τεχνική του κατακερματισμού είναι να δίνεται μια συνάρτησης h, που λέγεται συνάρτηση κατακερματισμού ή παραγωγής τυχαίων τιμών
Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης.
Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης. Ένα από τα γνωστότερα παραδείγματα των ΕΑ είναι ο Γενετικός
ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΠΛΑΤΦΟΡΜΑΣ OPENSMS WWW.OPENSMS.GR
ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΠΛΑΤΦΟΡΜΑΣ OPENSMS WWW.OPENSMS.GR Τηλέφωνο: 2810-211111 Διαδικασία εισόδου στο opensms Η πρόσβαση στην πλατφόρμα του opensms πραγματοποιείται με την εισαγωγή του Ονόματος χρήστη και του
Εργαστήριο «Βάσεις Οικολογικών Δεδομένων και Εφαρμογές»
2 Ενότητα 5 Φίλτρα & Ερωτήματα 3 4 5.1 Φίλτρα Για να εμφανίσετε επιλεκτικά κάποιες εγγραφές που πληρούν κάποια κριτήρια μπορείτε να χρησιμοποιήσετε το φιλτράρισμα με βάση την επιλογή, φιλτράρισμα εκτός
Οδηγίες Χρήσης της MySQL
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΗΜΕΙΩΣΕΙΣ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Οδηγίες Χρήσης της MySQL Διδάσκων: Γιάννης Θεοδωρίδης Συντάκτης Κειμένου: Βαγγέλης Κατσικάρος Νοέμβριος 2007 1 Περιεχόμενα Εισαγωγή...2
ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ
2013 ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ Περιήγηση στις δυνατότητες του λογισμικού και στον τρόπο χρήσης του ΟΜΑΔΑ ΕΡΓΟΥ ΔΙΕΥΘΥΝΣΗΣ
Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων
Ενότητα 4 Επεξεργασία πινάκων 36 37 4.1 Προσθήκη πεδίων Για να εισάγετε ένα πεδίο σε ένα πίνακα που υπάρχει ήδη στη βάση δεδομένων σας, βάζετε τον κέρσορα του ποντικιού στο πεδίο πάνω από το οποίο θέλετε
Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1
Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ.Χατζόπουλος 2 Δένδρο αναζήτησης είναι ένας ειδικός τύπος δένδρου που χρησιμοποιείται για να καθοδηγήσει την αναζήτηση μιας
Αντισταθμιστική ανάλυση
Αντισταθμιστική ανάλυση Θεωρήστε έναν αλγόριθμο Α που χρησιμοποιεί μια δομή δεδομένων Δ : Κατά τη διάρκεια εκτέλεσης του Α η Δ πραγματοποιεί μία ακολουθία από πράξεις. Παράδειγμα: Θυμηθείτε το πρόβλημα
Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.
Εισαγωγή Μετρήσεις-Σφάλματα Πολλές φορές θα έχει τύχει να ακούσουμε τη λέξη πείραμα, είτε στο μάθημα είτε σε κάποια είδηση που αφορά τη Φυσική, τη Χημεία ή τη Βιολογία. Είναι όμως γενικώς παραδεκτό ότι
ΗΥ240: Δοµές Δεδοµένων Εαρινό Εξάµηνο Ακαδηµαϊκό Έτος 2017 Διδάσκουσα: Παναγιώτα Φατούρου Προγραµµατιστική Εργασία - 1 ο Μέρος
ΗΥ240: Δοµές Δεδοµένων Εαρινό Εξάµηνο Ακαδηµαϊκό Έτος 2017 Διδάσκουσα: Παναγιώτα Φατούρου Προγραµµατιστική Εργασία - 1 ο Μέρος Ηµεροµηνία Παράδοσης: Δευτέρα, 3 Απριλίου 2017, ώρα 23:59. Τρόπος Παράδοσης:
ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας. Διάλεξη 13: Παραλλαγές Μηχανών Turing και Περιγραφή Αλγορίθμων
ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας Διάλεξη 13: Παραλλαγές Μηχανών Turing και Περιγραφή Αλγορίθμων Τι θα κάνουμε σήμερα Εισαγωγή Πολυταινιακές Μηχανές Turing (3.2.1) Μη Ντετερμινιστικές Μηχανές
4.3 Δραστηριότητα: Θεώρημα Fermat
4.3 Δραστηριότητα: Θεώρημα Fermat Θέμα της δραστηριότητας Η δραστηριότητα αυτή εισάγει το Θεώρημα Fermat και στη συνέχεια την απόδειξή του. Ακολούθως εξετάζεται η χρήση του στον εντοπισμό πιθανών τοπικών
Ανάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Θεωρία Γραφημάτων 6η Διάλεξη
Θεωρία Γραφημάτων 6η Διάλεξη Α. Συμβώνης Εθνικο Μετσοβειο Πολυτεχνειο Σχολη Εφαρμοσμενων Μαθηματικων και Φυσικων Επιστημων Τομεασ Μαθηματικων Φεβρουάριος 2016 Α. Συμβώνης (ΕΜΠ) Θεωρία Γραφημάτων 6η Διάλεξη
Δημιουργία Ευρετηρίων Συλλογής Κειμένων
Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 - Project Σεπτεμβρίου Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος Εξέταση: Προφορική, στο τέλος της εξεταστικής. Θα βγει ανακοίνωση στο forum. Ομάδες
Επεξεργασία Ερωτήσεων
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΣΔΒΔ Σύνολο από προγράµµατα για τη διαχείριση της ΒΔ Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ Αρχεία δεδοµένων συστήµατος Σύστηµα Βάσεων Δεδοµένων (ΣΒΔ)
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων
ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ AM: Δοµές Δεδοµένων Εξεταστική Ιανουαρίου 2014 Διδάσκων : Ευάγγελος Μαρκάκης 20.01.2014 ΥΠΟΓΡΑΦΗ ΕΠΟΠΤΗ: Διάρκεια εξέτασης : 2 ώρες και
Βασικές έννοιες. Κατανεμημένα Συστήματα 1
Βασικές έννοιες Κατανεμημένα Συστήματα 1 lalis@inf.uth.gr Ορισμός κατανεμημένου συστήματος Ένα σύστημα από ξεχωριστές ενεργές οντότητες (ονομάζονται «κόμβοι» ή «διεργασίες») που εκτελούνται ταυτόχρονα/ανεξάρτητα
Διερευνητική μάθηση We are researchers, let us do research! (Elbers and Streefland, 2000)
Διερευνητική μάθηση We are researchers, let us do research! (Elbers and Streefland, 2000) Πρόκειται για την έρευνα που διεξάγουν οι επιστήμονες. Είναι μια πολύπλοκη δραστηριότητα που απαιτεί ειδικό ακριβό
Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός
Κατευθυνόμενα γραφήματα Μαθηματικά Πληροφορικής 6ο Μάθημα Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Αθηνών Κατευθυνόμενο γράφημα G είναι ένα ζεύγος (V, E ) όπου V πεπερασμένο σύνολο του οποίου
Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 1: Προσομοίωση ενός συστήματος αναμονής
Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 1: Προσομοίωση ενός συστήματος αναμονής Γαροφαλάκης Ιωάννης Πολυτεχνική Σχολή Τμήμα Μηχ/κών Η/Υ & Πληροφορικής Περιεχόμενα ενότητας Διατύπωση του προβλήματος
ΑΛΓΟΡΙΘΜΟΙ ΑΝΟΠΤΗΣΗΣ: Ο ΑΛΓΟΡΙΘΜΟΣ ΤΗΣ ΑΠΟ ΟΧΗΣ ΚΑΤΩΦΛΙΟΥ (THRESHOLD ACCEPTING)
ΑΛΓΟΡΙΘΜΟΙ ΑΝΟΠΤΗΣΗΣ: Ο ΑΛΓΟΡΙΘΜΟΣ ΤΗΣ ΑΠΟ ΟΧΗΣ ΚΑΤΩΦΛΙΟΥ (THRESHOLD ACCEPTING) ΧΡΗΣΤΟΣ. ΤΑΡΑΝΤΙΛΗΣ ΚΛΑΣΙΚΟΙ ΕΥΡΕΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ Κλασικοί Ευρετικοί Classical Heuristics Κατασκευαστικοί Ευρετικοί Αλγόριθµοι
Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός
Κατευθυνόμενα γραφήματα Μαθηματικά Πληροφορικής 6ο Μάθημα Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Αθηνών Κατευθυνόμενο γράφημα G είναι ένα ζεύγος (V, E ) όπου V πεπερασμένο σύνολο του οποίου
Ξέρουμε ότι: Συνάρτηση-απεικόνιση με πεδίο ορισμού ένα σύνολο Α και πεδίο τιμών ένα σύνολο Β είναι κάθε μονοσήμαντη απεικόνιση f του Α στο Β.
Η έννοια της ακολουθίας Ξέρουμε ότι: Συνάρτηση-απεικόνιση με πεδίο ορισμού ένα σύνολο Α και πεδίο τιμών ένα σύνολο Β είναι κάθε μονοσήμαντη απεικόνιση f του Α στο Β. Δηλαδή: f : A B Η ακολουθία είναι συνάρτηση.
ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ Queuing Systems
ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ Queuing Systems Ουρές //1 εν σειρά, Θεώρημα Burke Ανοικτά Δίκτυα Ουρών arkov, Θεώρημα Jackson Εφαρμογή σε Δίκτυα Μεταγωγής Πακέτου Κλειστά Δίκτυα Ουρών arkov, Θεώρημα Gordon- Newell
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΠΑΝΕΛΛΑΔΙΚΩΝ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ
ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΠΑΝΕΛΛΑΔΙΚΩΝ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ 2014-2015 Πάτρα 5/5/2015 Ονοματεπώνυμο:.. Θέμα Α Α1. α. Να γράψετε στο τετράδιό σας τον
Πιθανοτικός Συμπερασμός: Πού βρίσκομαι στο πλέγμα; [ΠΛΗ 513] Αυτόνομοι πράκτορες - Project Εξαμήνου ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Πιθανοτικός Συμπερασμός: Πού βρίσκομαι στο πλέγμα; [ΠΛΗ 513] Αυτόνομοι πράκτορες - Project Εξαμήνου Γεωργαρά Αθηνά (A.M. 2011030065) ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
EFFICIENT TOP-K QUERYING OVER SOCIAL-TAGGING NETWORKS
EFFICIENT TOP-K QUERYING OVER SOCIAL-TAGGING NETWORKS Ralf Schenkel, Tom Crecelious, Mouna Kacimi, Sebastian Michel, Thomas Neumann, Josiane Xavier Parreira, Gerhard Weikum ΠΡΟΒΛΗΜΑ Εύρεση ενός αποτελεσματικού
Τη φυσική (MAC) διεύθυνση που δίνει ο κατασκευαστής του δικτυακού υλικού στις συσκευές του (π.χ. στις κάρτες δικτύου). Η περιοχή διευθύνσεων που
7.7 Πρωτόκολλο ARP 1 ύο είδη διευθύνσεων: MAC - IP Τη φυσική (MAC) διεύθυνση που δίνει ο κατασκευαστής του δικτυακού υλικού στις συσκευές του (π.χ. στις κάρτες δικτύου). Η περιοχή διευθύνσεων που µπορεί