Μέρος Γ Συστήματα Ομοτίμων (Peer to Peer Systems) και Ανάκτηση Πληροφοριών

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Μέρος Γ Συστήματα Ομοτίμων (Peer to Peer Systems) και Ανάκτηση Πληροφοριών"

Transcript

1 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Μέρος Γ Συστήματα Ομοτίμων (Peer to Peer Systems) και Ανάκτηση Πληροφοριών CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 1 Συστήματα Ομοτίμων (Peer-to-Peer Systems) Ανάκτηση Πληροφορίας

2 Διάρθρωση Κίνητρο Τύποι Ομότιμων Συστημάτων Υβριδικά Αποκεντρωμένα Ιεραρχικά Δομημένα Ομότιμα Συστήματα και Ανάκτηση Πληροφοριών CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 3 Ομότιμα Συστήματα: Κίνητρο Αξιοποίηση των ελεύθερων πόρων συστημάτων προσβάσιμων μέσω Internet για την επίλυση μεγάλων προβλημάτων (π.χ. δημιουργία συστημάτων πιο κλιμακόσιμων δημιουργία συστημάτων με μεγαλύτερη διαθεσιμότητα κατάργηση μονοπωλίων στην διάθεση της πληροφορίας αυτό οργάνωση αντί κεντρικής διαχείρισης (και εξόδων αυτής) CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 4 Ανάκτηση Πληροφορίας

3 P2P: Εφαρμογές Peer-to-Peer Applications Collaboration Resource Utilisation Instant Messaging Groupware Computation Bandwidth File Sharing Others Storage Napster Kazaa CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 5 Ομότιμα Συστήματα 1ης Γενιάς: Υβριδικά Napster Ονομάζονται και Υβριδικά Ομότιμα Συστήματα (Hybrid P2P systems) διότι υπάρχει ένας κεντρικός εξυπηρετητής Napster ( ): διαμοιρασμός MP3 Napster server 1: register (user, file names) 2: lookup (x) 3: peer 1 has x peer 1 peer 2 Centralized look up P2p file transfer 4: download x.mp3 CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 6 Ανάκτηση Πληροφορίας

4 Google (Client Server) vs. Napster (P2P) Καιοιδυοεφαρμογέςέχουντηνίδιακλίματα εκατομμύρια αναζητήσεις ημερησίως Terabytes δεδομένων Google Στηρίζεται σε περίπου μηχανές το στήσιμο μιας τέτοια εφαρμογής έχει μεγάλο κόστος (μόνο μια μεγάλη επιχείρηση μπορεί να κάνει τέτοια επένδυση) Napster ο server χρησιμοποιεί μόνο 100 μηχανές το κόστος αποθήκευσης και μεταφοράς των μουσικών αρχείων χρεώνεται στις μηχανές των χρηστών του συστήματος (γι αυτό ονομάζεται P2P) μικρό κόστος CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 7 Τα Πλεονεκτήματα των Ομοτίμων Συστημάτων Διαμερισμός πόρων αποθηκευτικών οι εκατομμύρια χρήστες του Napster αποθηκεύουν τα αρχεία, όχι ο εξυπηρετητής επικοινωνίας το κατέβασμα αρχείων γίνεται μεταξύ των χρηστών, ο εξυπηρετητής δεν παρεμβάλλεται εισαγωγής στοιχείων οι χρήστες του Napster εισάγουν τα αρχεία στο σύστημα οι χρήστες του Napster τα κατηγοριοποιούν Δίδαγμα: Η αποκέντρωση επιτρέπει τη δημιουργία εφαρμογών παγκόσμιας κλίμακας χωρίς την ανάγκη μεγάλων επενδύσεων αλλά με την αξιοποίηση των πόρων που ήδη υπάρχουν CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 8 Ανάκτηση Πληροφορίας

5 Ομότιμα Συστήματα 1ης Γενιάς: Υβριδικά Napster A central point of failure CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 9 Ομότιμα Συστήματα 1ης Γενιάς: Υβριδικά Σκοπός: Διαμοιρασμός υπολογιστικών πόρων (αξιοποίηση των περιόδων αδράνειας των εγγεγραμμένων ΗΥ) upload results Επεξεργασία δεδομένων ότανοηυείναιαδρανής Download raw data upload results Download raw data Επεξεργασία δεδομένων ότανοηυείναιαδρανής CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 10 Ανάκτηση Πληροφορίας

6 Ομότιμα Συστήματα 1ης Γενιάς: Αποκεντρωμένα GNUTELLA Δεν υπάρχει κανένας κεντρικός εξυπηρετητής Ονομάζονται και Αποκεντρωμένα (Decentralized P2P systems), Αδόμητα (Unstructured P2P systems), Pure P2P systems Gnutella (1999 now): CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 11 Ομότιμα Συστήματα 1ης Γενιάς: Αποκεντρωμένα GNUTELLA Δεν υπάρχει κανένας κεντρικός εξυπηρετητής Ονομάζονται και Αποκεντρωμένα (Decentralized P2P systems), Αδόμητα (Unstructured P2P systems), Pure P2P systems Gnutella (1999 now): q CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 12 Ανάκτηση Πληροφορίας

7 Ομότιμα Συστήματα 1ης Γενιάς: Αποκεντρωμένα GNUTELLA Κατακλυσμός Μηνυμάτων (Message Flooding or Gossiping) q CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 13 Ομότιμα Συστήματα 1ης Γενιάς: Αποκεντρωμένα GNUTELLA Κατακλυσμός Μηνυμάτων (Message Flooding) q CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 14 Ανάκτηση Πληροφορίας

8 Ομότιμα Συστήματα 1ης Γενιάς: Αποκεντρωμένα GNUTELLA Τα μηνύματα έχουν ένα TTL (time to live) tag TTL =2 q Επίσης, τα μηνύματα έχουν ένα ID για την αποτροπή κυκλικών αποστολών CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 15 GNUTELLA: Sketch of the protocol Ping Used to actively discover hosts on the network. A servent receiving a Ping descriptor is expectedtorespondwithoneormorepong descriptors. Pong The response to a Ping. Includes the address of a connected Gnutella servent and information regarding the amount of data it is making available to the network. Query The primary mechanism for searching the distributed network. A servent receiving a Query descriptor will respond with a QueryHit if a match is found against its local data set. QueryHit The response to a Query. This descriptor provides the recipient with enough information to acquire the data matching the corresponding Query. Push A mechanism that allows a firewalled servent to contribute file based data to the network. CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 16 Ανάκτηση Πληροφορίας

9 GNUTELLA: The protocol ΣυνήθωςκάθεκόμβοςπροωθείμιαεπερώτησησεC γείτονες (συνήθως C = 3) Τυπική τιμή TTL = 7 (πειράματα έδειξαν ότι η διάμετρος του Gnutella δικτύου είναι συνήθως 7) CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 17 Napster vs. Gnutella Napster (υπάρχει κεντρικός εξυπηρετητής) single point of failure στόχος νομικής επίθεσης Gnutella (δεν υπάρχει κεντρικός εξυπηρετητής) δεν υπάρχει single point of failure δεν μπορεί να γίνει εύκολα στόχος νομικής επίθεσης δεν απαιτεί καμία επένδυση δεν έχει κόστος διαχείρισης (administration) self organizing system however, free riders may occur CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 18 Ανάκτηση Πληροφορίας

10 GNUTELLA: Επιδόσεις Επιδόσεις Χρόνος αναζήτησης: Σχετικά μικρός Πλήθος Μηνυμάτων: Μεγάλο Κόστος αποθήκευσης: Μικρό (κάθε κόμβος γνωρίζει μόνο τους διπλανούς του) Κόστος ενημέρωσης: Μικρό (γείτονες) Ανθεκτικότητα σε σφάλματα: Μεγάλη CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 19 Ομότιμα Συστήματα 2ης Γενιάς Πρωτότυπα ερευνητικά συστήματα: Chord (MIT), CAN (Berkeley), OceanStore/Tapestry (Berkeley), Farsite (MSR), Spinglass/Pepper (Cornell), Pastry/PAST (Rice, MSR), Viceroy (Hebrew U), P Grid (EPFL), P2P Net (Magdeburg), Pier (Berkeley), Peers (Stanford), Kademlia (NYU), Bestpeer (Singapore), YouServ (IBM Almaden), Hyperion (Toronto), Piazza (UW Seattle), PlanetP (Rutgers), SkipNet (MSR), Μπορούμε να διακρίνουμε 2 μεγάλες κατηγορίες Ιεραρχικά Ομότιμα Συστήματα (Hierarchical P2P systems) Π.χ. Το σύστημα Kazaa Δομημένα Ομότιμα Συστήματα (Structured P2P systems) Π.χ. το σύστημα Chord CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 20 Ανάκτηση Πληροφορίας

11 Ιεραρχικά Ομότιμα Συστήματα (Hierarchical P2P Systems) Συστήματα: Morpheus, Kazaa, Limewire, JXTA Search, Gnutella 0.6 Hubs (or SuperPeers) Leaf nodes CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 21 Ιεραρχικά Ομότιμα Συστήματα (Hierarchical P2P Systems) Συνδυασμός Napster και Gnutella Gnutella-style Napster-style Napster-style Napster-style CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 22 Ανάκτηση Πληροφορίας

12 Ιεραρχικά Ομότιμα Συστήματα (Hierarchical P2P Systems) Searching relies on message passing between nodes. A query generated by a client node and is routed to a hub, (1) from one hub to another, or (2) from a hub to a leaf node. A response message ( queryhit ) is generated by a leaf node and routed back along the query path in reverse direction. Messages also include a TTL tag 4: peer 18 has x 3: peer 18 has x 1:lookup(x) 2:lookup(x) 5: download x CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 23 Ιεραρχικά Ομότιμα Συστήματα (Hierarchical P2P Systems) Επιδόσεις Χρόνος αναζήτησης: Πολύ μικρός Πλήθος Μηνυμάτων: Μικρό Κόστος αποθήκευσης: Μικρό στα φύλλα, Μεγάλο στους εξυπηρετητές ευρετηρίου Κόστος ενημέρωσης: Μικρό Ανθεκτικότητα σε σφάλματα: Μικρή CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 24 Ανάκτηση Πληροφορίας

13 Δομημένα Ομότιμα Συστήματα (Structured P2P Systems) Σκοπός: Γρήγορη εύρεση του κόμβου που περιέχει ένα κλειδί χωρίς τη χρήση κεντρικού εξυπηρετητή και ανταλλάσσοντας λίγα μηνύματα Εύκολο κομμάτι: κατανομή ευρετηρίου σε όλους τους κόμβους Δύσκολο: κατανομή ευρετηρίου σε όλους τους κόμβους με τέτοιο τρόπο ώστε να έχουμε γρήγορη αναζήτηση Συστήματα Freenet, Chord, CAN, Pastry, Tapestry, FreeNet, P Grid, Baton, etc CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 25 Δομημένα Ομότιμα Συστήματα Κοινά χαρακτηριστικά των δομημένων ομότιμων συστημάτων κάθε κόμβος διατηρεί ένα μικρό τμήμα του καθολικού ευρετηρίου (πίνακας δρομολόγησης) οι αναζητήσεις γίνονται με προώθηση μηνυμάτων προς τη «σωστή» κατεύθυνση Διαφορετικές Προσεγίσεις FreeNet: caching πληροφορίας ευρετηρίου κατά μήκος των μονοπατιών αναζήτησης Chord: κατασκευή ενός κατανεμημένου πίνακα κατακερματισμού (Distributed Hash Table, DHT) CAN: Δρομολόγηση βάσει d διάστατου χώρου P Grid: κατανομή ενός δυαδικού δένδρου αναζήτησης CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 26 Ανάκτηση Πληροφορίας

14 Το Πρόβλημα του Εντοπισμού Πόρου (Resource Location) Singing in the Rain SR.mp3 «Υπάρχω» stelios.mp p k d Singing in the Rain SR.mp «Υπάρχω» stelios.mp Singing in the Rain SingRain.mp3 Singing in the Rain SingRain.mp3 Έστω peer με δνση p που αποθηκεύει στοιχείο d που χαρακτηρίζεται από το κλειδί k Ζητούμενο: Δοθέντος k (ήσυνθήκηςπάνωστοk) εντόπισε τον peer που έχει το d, δηλαδή βρες το ζεύγος ευρετηρίου (k, p). (άρα το ευρετήριο μας αποτελείται από ζεύγη της μορφής (k, p)) Κρίσιμο ερώτημα: Πως μπορούμε να (α) φτιάξουμε, (β) συντηρήσουμε και (γ) να χρησιμοποιήσουμε ένα τέτοιο ευρετήριο χωρίς κεντρικό έλεγχο; CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 27 Freenet Σύστημα για δημοσίευση και ανάκτηση δεδομένων με έμφαση στην ανωνυμία (και τωνσυγγραφέωνκαιτωναναγνωστών) Τα κλειδιά και τα δεδομένα αποθηκεύονται κρυπτογραφημένα Μοιάζει με: Gnutella + cache at each node CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 28 Ανάκτηση Πληροφορίας

15 Freenet: Cache p k d Singing in the Rain SR.mp «Υπάρχω» stelios.mp One U2One.mp Dog song «Υπήρξα» Pop Singing in the Rain «Υπάρχω» Τμήμα του καθολικού ευρετηρίου Ένα αρχείο (ή τμήματα του σε πολλούς κόμβους) Huge distributed cache Αντίγραφα κάποιων αντικειμένων CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 29 Freenet: Εισαγωγή Νέου Πόρου Υπολογίζουμε το κλειδί τουνέουπόρου Φτιάχνεται η εγγραφή εισαγωγής και στέλνεται στον γείτονα με το πιο κοντινό κλειδί Κάθε κόμβος που λαμβάνει το νέο κλειδί, ελέγχει αν το κλειδί αυτό υπάρχει ήδη αν ναι, έχουμε σύγκρουση (collision), και άρα ο αρχικός κόμβος πρέπει να προτείνει ένα νέο κλειδί αν όχι, δρομολόγηση στον επόμενο κόμβο με τον ίδιο τρόπο Αν TTL = 0 και δεν είχαμε καμία σύγκρουση, τότε η τριάδα αποθηκεύεται σε όλους τους κόμβους του μονοπατιού που ακολουθήθηκε CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 30 Ανάκτηση Πληροφορίας

16 Freenet: Τρόπος Εντοπισμού Πόρου Έλευση επερώτησης k Αν η έγγραφή (p, k, d) είναιστηκρυφήμνήμηεπέστρεψετοd Αλλιώς προώθησε την επερώτηση στον κόμβο που έχει το πιο όμοιο κλειδί Η διαδικασία αυτή συνεχίζεται με αυτόν τον τρόπο έως ότου ευρεθεί το αναζητούμενο ή το TTL φτάσει την τιμή 0. Έλευση απάντησης (k, p, d) Η τριάδα εισάγεται στην κρυφή μνήμη Η παλαιότερη εγγραφή (least recently used) διαγράφεται από την κρυφή μνήμη Παρατηρήσεις Οι δρομολογήσεις που κάνουν οι κόμβου βελτιώνονται συν το χρόνο Οι κόμβοι τείνουν να έχουν στην κρυφή τους μνήμη εγγραφές με παρόμοια κλειδιά (άρα επιτυγχάνεται ένα είδος ομαδοποίησης) CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 31 Freenet k2? // dist(k,k2)= low k2? hit k? hit k? hit k? k? CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 32 Ανάκτηση Πληροφορίας

17 Chord CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 33 Chord (Distributed Hash Tables (DHT)) Κατακερματισμός (Hashing) κλειδιών (k) και διευθύνσεων (p) σε δυαδικά κλειδιά με m bits π.χ. m=6, h(«υπάρχω»)=11, h( )=3 Τα δυαδ. κλειδιά τοποθετούνται σε έναν κύκλο modulo 2^m Για m=8, κυκλική διάταξη των αριθμών Ένα κλειδί k εκχωρείται στον πρώτο κόμβο p τ.ω. h(p) >= h(k) 10 peers P={p1,,p10} 5 keys K={k1,,k5} m=6, mod 2 m =mod2 6 =[0..63] { h(pi) pi P} = {1, 8,14, 21, 32, 38,42,48,51,56} { h(ki) ki K} = {10, 24, 30, 38, 54} Αυτός ο κόμβος λέγεται successor(k) CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 34 Ανάκτηση Πληροφορίας

18 Chord : Απλόςτρόποςεντοπισμούκόμβων Έστω ότι κάθε κόμβος p ξέρει την δνση μόνο του επόμενου του ( του p με h(p ) > h(p)) // ask node n to find the successor of id n.find_successor(id) if (id in [n,successor]) return successor; else // forward the query around the circle return successor.find_successor(id); => Number of messages linear in the number of nodes! CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 35 Chord : Ένας πιο γρήγορος τρόπος εντοπισμού κόμβων με Πίνακες Δρομολόγησης Επιπλέον πληροφορία δρομολόγησης για επιτάχυνση Κάθε κόμβος n έχει έναν πίνακα δρομολόγησης με m εγγραφές οι m αυτοί κόμβοι έχουν εκθετικά αυξανόμενη απόσταση από τον n Η i εγγραφή του πίνακα έχει την δνση του πρώτου κόμβου με κλειδί μεγαλύτερο ή ίσο με n+2 i 1 finger[i] = successor (n + 2 i 1 ) CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 36 Ανάκτηση Πληροφορίας

19 Chord : Παράδειγμα Πίνακα Δρομολόγησης Finger table: finger[i] = successor (n + 2 i-1 ) n=8 finger[1] = succ(n+1) = succ(9) = 14 finger[2] = succ(n+2) = succ(10) = 14 finger[3] = succ(n+4) = succ(12) = 14 finger[4] = succ(n+8) = succ(16) = 21 finger[5] = succ(n+16) = succ(24) = 32 finger[6] = succ(n+32) = succ(40) = 42 CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 37 Chord: Εντοπισμός Πόρου με Πίνακες Δρομολόγησης Έστω μια επερώτηση k προς έναν κόμβο n Ο n κοιτάζει τον πίνακα δρομολόγησης του και επιλέγει τον μεγαλύτερο peer με κλειδί μικρότερο αυτού της επερώτησης. Αν δεν υπάρχει τέτοιος peer, τότε ο ίδιος είναι υπεύθυνος για το k (και άρα το ζητούμενο βρέθηκε) Αλλιώς προωθεί σε αυτόν την επερώτηση Αφού οι εγγραφές των πινάκων δρομολόγησης είναι εκθετικά αύξουσες, η αναζήτηση (με μεγάλη πιθανότητα) λαμβάνει λογαριθμικό χρόνο. CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 38 Ανάκτηση Πληροφορίας

20 Chord: Πλήθος μηνυμάτων: Ο(log N) Ν8 Ν42 Εύρεση του κόμβου που έχει το αναζητούμενο κλειδί με ανταλλαγή τριών μηνυμάτων Searchin finger table for the nodes which most immediatly precedes id Invoke find_successor from that node => Number of messages O(log N) CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 39 Chord: Είσοδος νέου κόμβου Ονέοςκόμβοςπρέπειναφτιάξειτονπίνακαδρομολόγησηςτου Το κόστος κατασκευής του είναι αυτό της αναζήτησης Οι άλλοι κόμβοι πρέπει να ενημερώσουν τους δικούς τους πίνακες CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 40 Ανάκτηση Πληροφορίας

21 Chord : Περίληψη Βασικά σημεία: Κάθε κόμβος αποθηκεύει πληροφορία για μικρό αριθμό κόμβων (m) Κάθε κόμβος ξέρει περισσότερα για τους κοντινούς του όρους (απ ότι για τους μακρινούς) Επιδόσεις Χρόνος αναζήτησης: O(log n) (με μεγάλη πιθανότητα) Πλήθος Μηνυμάτων: O(log n) (επιλεκτική δρομολόγηση μηνυμάτων) Κόστος αποθήκευσης: O(log n) (πίνακας δρομολόγησης) Κόστος εισόδου/εξόδου κόμβου: O(log^2 n) Κόστος ενημέρωσης: μικρό (περίπου σαν το κόστος αναζήτησης) Chord software 3000 lines of C++ code, Library to be linked with the application, provides a lookup(key) function: yields the IP address of the node responsible for the key, Notifies the node of changes in the set of keys thenodeisresponsiblefor CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 41 Chord CAN CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 42 Ανάκτηση Πληροφορίας

22 Δομημένα Ομότιμα Συστήματα CAN (Content Addressable Network) Βασίζεται στον κατακερματισμό κλειδιών στον κ διάστατο Καρτεσιανό χώρο (torus) (συνήθως κ=2 10) Κλειδί = σημείο του κ διάστατου χώρου κδιαστάσεις, Hash(key) = (x1,, xk) Κάθε κόμβος είναι υπεύθυνος για ένα κομμάτι του χώρου, μία ζώνη Αποθηκεύει το ευρετήριο των αντικειμένων των οποίων οι συντεταγμένες εμπίπτουνστηνζώνητου Κάθε κόμβος αποθηκεύει τις διευθύνσεις των κόμβων των διπλανών ζωνών Εύρεση πόρου = δρομολόγηση στις ζώνες CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 43 Δομημένα Ομότιμα Συστήματα CAN Παράδειγμα διαμέρισης του δισδιάστατου χώρου [0,1]x[0,1] σε 4 peers A, B, C, D 1 B (0-0.5, 0.5-1) C (0.5-1, 0.5-1) A (0-0.5, 0-0.5) D (0.5-1, 0-0.5) 0 1 CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 44 Ανάκτηση Πληροφορίας

23 Δομημένα Ομότιμα Συστήματα CAN ΕίσοδοςενόςνέουκόμβουΕ 1 C (0.5-1, ) B (0-0.5, 0.5-1) Ε (0.5-1, ) A (0-0.5, 0-0.5) D (0.5-1, 0-0.5) 0 1 CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 45 Δομημένα Ομότιμα Συστήματα CAN Ο Ε θέλει να ανακτήσει το αντικείμενο με συντεταγμένες (0.2, 0.2) 1 C (0.5-1, ) B (0-0.5, 0.5-1) Ε (0.5-1, ) A (0-0.5, 0-0.5) D (0.5-1, 0-0.5) 0 1 CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 46 Ανάκτηση Πληροφορίας

24 Δομημένα Ομότιμα Συστήματα CAN Αυξάνοντας τις διαστάσεις μειώνεται το μήκος του μονοπατιού αναζήτησης αυξάνεται το πλήθος των γειτόνων που πρέπει κάθε κόμβος να αποθηκεύει Πολυπλοκότητα αναζήτησης αν έχω n κόμβους και κ διαστάσεις: O( k k n) CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 47 Δομημένα Ομότιμα Συστήματα CAN Περίληψη Βασικά σημεία: Κάθε κόμβος αποθηκεύει πληροφορία για ένα τμήμα του διανυσματικού χώρου και γνωρίζει τις δνσεις των διπλανών του κόμβων Επιδόσεις Χρόνος αναζήτησης: O(k n 1/k ) (με μεγάλη πιθανότητα) Πλήθος Μηνυμάτων: O(k n 1/k ) (επιλεκτική δρομολόγηση μηνυμάτων) Κόστος αποθήκευσης: O(k) (πίνακας δρομολόγησης) Κόστος ενημέρωσης: μικρό (περίπου σαν το κόστος αναζήτησης) CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 48 Ανάκτηση Πληροφορίας

25 Περίληψη Ομότιμων Συστημάτων Έστω ότι στην Ελλάδα κατοικούν 1000 άτομακαικάθεέναςτουςέχειένατηλέφωνο Τρόποι εύρεσης του τηλεφώνου ενός κυρίου Χ Napster style Εύρεση τηλεφώνου τηλεφωνώντας στο του ΟΤΕ Gnutella style Εύρεση τηλεφώνου ρωτώντας όποιον βρούμε μπροστά μας (κ.ο.κ) Kazaa style Δεν υπάρχει ΟΤΕ για όλη την Ελλάδα, αλλά κάθε νομός έχει έναν τοπικό ΟΤΕ. Τηλεφωνούμε στον τοπικό και αν αυτός δεν το έχει, επικοινωνεί με τους υπόλοιπους τοπικούς ΟΤΕ CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 49 Περίληψη Ομότιμων Συστημάτων Freenet style Κάθε ένας έχει μια ατζέντα περιορισμένου μεγέθους. Εύρεση τηλεφώνου τηλεφωνώντας σε αυτόν που έχει το πλησιέστερο όνομα (π.χ. λεξικογραφικά), κ.ο.κ. Όταν τελικά βρεθεί, ενημερώνουμε την ατζέντα μας. Chord style Κάθε κάτοικος έχει μια ατζέντα με 10 τηλέφωνα (10 = log 1024) Η εύρεση του τηλεφώνου του κυρίου Χ θα γίνει με 10 τηλεφωνήματα (κατά μέσο όρο) CAN style Κάθε ένας ξέρει το τηλέφωνο των γειτόνων του αν όλοι οι Έλληνες ζουν σε μονοκατοικίες τότε κάθε ένας έχει 4 γείτονες (Βορ,Νοτ,Α,Δ) αν όλοι οι Έλληνες ζουν σε 1 πολυκατοικία τότε κάθε ένας έχει 6 γείτονες Για να τηλεφωνήσω σε κάποιον πρέπει να ξέρω που είναι το σπίτι του και τηλεφωνώ στο γείτονα μου που είναι προς εκείνη την κατεύθυνση (κ.ο.κ) Αν όλοι μένουν σε μονοκατοικίες τότε 2 * SQRT(1000) = 64 τηλεφωνήματα Αν όλοι μένουν σε μια πολυκατοικία τότε 3 * CubicRoot(1000) = 3 * 10 τηλεφωνήματα CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 50 Ανάκτηση Πληροφορίας

26 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ανάκτηση Πληροφοριών & Συστήματα Ομοτίμων (Peer to Peer Systems) & IR CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 51 Τι διαφέρει η Ανάκτηση σε P2P συστήματα από την Κατανεμημένη Ανάκτηση; Η ανάκτηση πληροροφιών σε συστήματα ομοτίμων είναι μια περίπτωση κατανεμημένης ανάκτησης Ιδιαιτερότητες των ομότιμων συστημάτων: Υπερβολικά μεγάλος αριθμός πηγών (peers) Μεγαλύτερη αυτονομία πηγών Έλλειψη Σταθερότητας, Ελέγχου, Προβλεψιμότητας (not stable, controllable, unpredictable) Επιτακτική ανάγκη για μείωση του κόστους επικοινωνίας CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 52 Ανάκτηση Πληροφορίας

27 Αρχιτεκτονικές Ομότιμων Συστημάτων Napster server 1: register (user, files) 2: lookup (x) 3: peer 1 has x peer 1 peer 2 4: download docx.mp3 q Gnutella-style Napster-style Napster-style Napster-style CAN (Content Addressable Network) Chord (DHT) CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 53 P2P and IR: Περίπτωση: Kατηγοριοποιημένα Έγγραφα Έστω ότι κάθε έγγραφο είναι ταξινομημένο σε μια κατηγορία ενός ελεγχόμενου ευρετηρίου (ODP, Yahoo!). Ο χρήστης κάνει αναζήτηση δίνοντας μια κατηγορία έγγραφο mp3 αρχείο κατηγορία εγγράφου τίτλος του mp3 αρχείου Άρα μπορούμε να φτιάξουμε ένα ομότιμο σύστημα τύπου Napster (Hybrid P2P) τύπου Gnutella (Pure P2P) τύπου Κazaa (Hierarchical P2P) τύπου Freenet (Structured P2P) τύπου Chord (Structured P2P) τύπου CAN (Structured P2P) Βέβαια έτσι θα μπορούμε να κάνουμε ανάκτηση μόνο βάσει του τίτλου (και όχι βάσει του περιεχομένου). CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 54 Ανάκτηση Πληροφορίας

28 P2P and Statistical IR Τυπικό Ευρετήριο P2P Τυπικό Ευρετήριο IRS (document partitioning) p k d Singing in the Rain SR.mp «Υπάρχω» stelios.mp Singing in the Rain SingRain.mp3 P1 cold <2,1> hot pease <1,1> <1,1> <2,1> porridge <1,1> <2,1> cold hot in not pease porridge pot the P2 <4,1> <4,1> <3,1> <4,1> <3,1> <4,2> <3,1> <4,2> <3,1> <3,1> cold <5,1> P3 hot <5,1> <6,1> in not pease porridge pot the <6,1> <5,1> <5,2> <5,2> <6,1> <6,1> <6,1> <6,1> CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 55 P2P and Statistical IR Τυπικό Ευρετήριο P2P Τυπικό Ευρετήριο IRS (term partitioning) p k d Singing in the Rain SR.mp «Υπάρχω» stelios.mp Singing in the Rain SingRain.mp3 cold <2,1> <4,1> <5,1> P1 hot <1,1> <4,1> <5,1> <6,1> in <3,1> <6,1> not <4,1> <5,1> P2 pease <1,1> <2,1> <3,1> <4,2> <5,2> <6,1> P3 porridge pot the <1,1> <2,1> <3,1> <4,2> <5,2> <3,1> <6,1> <3,1> <6,1> <6,1> CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 56 Ανάκτηση Πληροφορίας

29 Ομότιμα Συστήματα (P2P) και Ανάκτηση Πληροφοριών Διαφορές με Κατανεμημένη Ανάκτηση Napster style Gnutella style (local inv. Index) Freenet style (p,q, ans(q) ), >RES (p,q, ans(q) ), >RES * sim(q) Hiearchical PlanetP (Bloom filters) Chold style: key=1 term, a term pair, term partitioning CAN style: key = LSI vector psearch (LSI + CAN) document partitioning Result aggregation Γενικά: P2P & IR = αντικείμενο έρευνας σήμερα CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 57 P2P and IR: Ανεστραμμένα Ευρετήρια (Napster style) Ένας κεντρικός εξυπηρετητής αποθηκεύει όλα τα ανεστραμμένα ευρετήρια των κόμβων (1) (2) (3) (4) Napster server 1: register (user, files) Global Index 2: lookup (x) αδυναμίες: o εξυπηρετητής χρειάζεται πολύ χώρο χρονοβόρο upload των ευρετηρίων στον εξυπηρετητή, το κόστος αποτίμησης επερωτήσεων πάει εξ ολοκλήρου στον εξυπηρετητή Google, χωρίς το crawling (1) peer 1 3: peer 1 has x (συλλογή σελίδων) και peer 2 έχοντας έτοιμα κομμάτια του ευρετηρίου 4: download docx.mp3 CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 58 Ανάκτηση Πληροφορίας

30 P2P and IR: (Gnutella style) Κάθε κόμβος συντηρεί το ανεστραμμένο ευρετήριο των εγγράφων του. Αποτίμηση επερωτήσεων με κατακλυσμό μηνυμάτων Local Invert. Local IndexInvert. Index Αδυναμίες πολλά μηνύματα IDF =? CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 59 P2P and IR: (Gnutella style) Παραλλαγές του Kατακλυσμού μηνυμάτων BFS: Breadth First Search (=Gnutella) RBFS: κάθε κόμβος προωθεί ένα μήνυμα σε ένα τυχαίο ποσοστό (π.χ. 20%) των γνωστών του κόμβων + πιθανοκρατικός αλγόριθμος μπορεί το μήνυμα να μην πάει σε κόμβους που έχουν συναφή αντικείμενα 1 Random Walker: κάθε κόμβος προωθεί ένα μήνυμα σε έναν τυχαία επιλεγμένο κόμβο από τους γνωστούς του k Random Walkers: κάθε κόμβος προωθεί ένα μήνυμα σε κ τυχαία επιλεγμένους κόμβους από τους γνωστούς του + λιγότερα μηνύματα από το RDFS CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 60 Ανάκτηση Πληροφορίας

31 P2P and IR (Freenet style) Κάθε κόμβος: (α) συντηρεί το ανεστραμμένο ευρετήριο των εγγράφων του. (β) φτιάχνει ένα προφίλ των γειτόνων του βασισμένο στις επερωτήσεις του παρελθόντος (γ) έχει μια φόρμουλα βαθμολόγησης κόμβων που τη χρησιμοποιεί για επιλεκτική δρομολόγηση Προφιλ Γειτ. Προφιλ Γειτ. Προφιλ Γειτ. Προφιλ Γειτ. Local Invert. Local IndexInvert. Index Προφιλ Γειτ. Προφιλ Γειτ. Προφιλ Γειτ. CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 61 P2P and IR (Freenet-style) Προφιλ Γειτ. Προφιλ Γειτ. Προφιλ Γειτ. Προφιλ Γειτ. Local Invert. Local IndexInvert. Index Προφιλ Γειτ. Προφιλ Γειτ. Προφιλ Γειτ. CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 62 Ανάκτηση Πληροφορίας

32 Προφίλ Γειτόνων βάσει των προηγούμενων απαντήσεων p q ans(q) Singing in the Rain «Υπάρχω» One U2One.mp Dog song «Υπήρξα» Pop Singing in the Rain «Υπάρχω» 7 LRU (Least Recently Used) deletion policy Το προφίλ είναι τριάδες της μορφής (pj, q, ans(pj,q) ) όπου pj ένας γείτονας, q μια επερώτηση που απήντησε αυτός ο γείτονας, και ans(pj,q) το μέγεθος της απάντησης LRU update policy CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 63 Προφίλ Γειτόνων και Δρομολόγηση: >RES (περισσότερα αποτελέσματα) p q ans(q) Singing in the Rain «Υπάρχω» One U2One.mp Dog song «Υπήρξα» Pop Singing in the Rain «Υπάρχω» 7 Σκορ( )=16 Σκορ( )=8 Για την δρομολόγηση μιας επερώτησης επιλέγονται εκείνοι οι γείτονες που έχουν δώσει τα περισσότερα αποτελέσματα στο παρελθόν (εξ ου και το όνομα >RES). Συγκεκριμένα στις προηγούμενες m επερωτήσεις. Το σκορ ενός γείτονα pj είναι Score(pj) = Σ { ans(pj,qj) qj answered by pj in the past} CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 64 Ανάκτηση Πληροφορίας

33 Προφίλ Γειτόνων και Δρομολόγηση: >RES και ομοιότητα επερωτήσεων p q ans(q) Singing in the Rain «Υπάρχω» One U2One.mp Dog song «Υπήρξα» Pop Singing in the Rain «Υπάρχω» 7 Για την δρομολόγηση μιας επερώτησης q επιλέγονται εκείνοι οι γείτονες που έχoυν δώσει τα περισσότερα αποτελέσματα στο παρελθόν ( >RES) σε επερωτήσεις που είναι κοντινές με το q CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 65 Προφίλ Γειτόνων και Δρομολόγηση: >RES και ομοιότητα επερωτήσεων Το σκορ ενός γείτονα pj δοθείσας επερώτησης q, είναι: >RES Score(pj) = Σ { ans(pj,qj) qj answered by pj in the past} >RES και ομοιότητα επερωτήσεων Score(pj,q) = Σ { ans(pj,qj) *sim(qj, q) α qj answered by pj in the past} sim(qj, q): Π.χ. ομοιότητα συνημίτονου α: παράμετρος για το καθορισμό της σχετικής σπουδαιότητας της συνάφειας έναντι του μεγέθους απάντησης CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 66 Ανάκτηση Πληροφορίας

34 Προφίλ Γειτόνων και Δρομολόγηση: >RES και ομοιότητα επερωτήσεων p q ans(q) Singing in the Rain «Υπάρχω» One U2One.mp Dog song «Υπήρξα» Pop Singing in the Rain «Υπάρχω» 7 q1 =Singing q2 = Special Dog Song Πότεαυτήηπροσέγγισηείναικαλή; Απ: Όταν τα έγγραφα του κάθε κόμβου είναι σημασιολογικά κοντινά Επειδή αυτό όμως δεν συμβαίνει πάντα η επερώτηση προωθείται και σε έναν τυχαία επιλεγμένο γείτονα. // αυτό επίσης συμβάλει στην καλή εκκίνηση του συστήματος CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 67 Ανάκτηση Κειμένων σε Ιεραρχικά Ομότιμα Συστήματα (Kazaa style IR) Γενική Ιδέα: Κάνουμε ό,τι και στην κατανεμημένη, απλά εδώ έχουμε πολλούς μεσίτες Κάθε μεσίτης (εδώ super peer) έχει μια περιγραφή των περιεχομένων των υποκείμενων κόμβων Επιλογή Πηγής Ενοποίηση Αποτελεσμάτων Hubs Leaf nodes CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 68 Ανάκτηση Πληροφορίας

35 Ανάκτηση Κειμένων σε Ιεραρχικά Ομότιμα Συστήματα (Kazaa style IR) Περιγραφή των περιεχομένων των φύλλων Ανάγκη για μείωση του αποθηκευτικού χώρου στα Hubs???? Hubs Leaf nodes CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 69 Ανάκτηση Κειμένων σε Ιεραρχικά Ομότιμα Συστήματα (Kazaa style IR) Περιγραφή των περιεχομένων των άλλων Hub? HUBS Desr? Leaves Descr. Leaves Descr. Leaves Descr. Leaves Descr. Hubs Leaf nodes Η περιγραφή ενός HUB είναι η ένωση των περιγραφών των υποκείμενων του κόμβων (Πρόβλημα: χώρος) Καταγραφή προηγούμενων επερωτήσεων που έχουν απαντηθεί π.χ. >RES και ομοιότητα επερώτησης CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 70 Ανάκτηση Πληροφορίας

36 Ανάκτηση Κειμένων σε Ιεραρχικά Ομότιμα Συστήματα Επιλογές 1/ Λεξιλόγια των υποκείμενων κόμβων + συχνότητες εμφάνισης τους (δεν ξέρουμε το καθολικό λεξιλόγιο για να φτιάξουμε το διάνυσμα πηγής)? 2/ Λεξιλόγια των υποκείμενων κόμβων 3/ Λέξεις που εμφανίζονται πάνω από 1 φορά + συχνότητες τους λόγω του νόμου του Zipf, ο απαιτούμενος αποθηκευτικός χώρος μειώνεται στο μισό CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 71 Επανάληψη: Επιλογή Πηγής με Διανύσματα Πηγών IRS1=<0.4, 0.3,, 0.8> IRS2=<0.1, 0.9,, 0.4> IRS3=<0.8, 0.5,, 0.2> IRS1 IRS2 IRS3 IRS4 IRS5 Βλέπουμε κάθε συλλογή ως ένα μεγάλο έγγραφο Φτιάχνουμε ένα διάνυσμα για κάθε συλλογή (τύπου TF IDF) tfij: συνολικές εμφανίσεις του όρου i στη συλλογή j idfi: log(n/ni), όπου Ν το πλήθος των συλλογών, και ni το πλήθος των συλλογών που έχουν τον όρο i Υπολογίζουμε το βαθμό ομοιότητας κάθε νέας επερώτησης με το διάνυσμα κάθε συλλογής (π.χ. ομοιότητα συνημίτονου) Διατάσσουμε τιςσυλλογέςκαιεπιλέγουμετιςκορυφαίες Εναλλακτικά: Αντί για ένα, μπορούμεναπεριγράφουμεκάθεπηγήμεκδιανύσματα CS463 - Information Retrieval Yannis Tzitzikas, U. of Crete 72 Ανάκτηση Πληροφορίας

HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Μέρος Γ Συστήματα Ομοτίμων (Peer-to-Peer Systems) και Ανάκτηση Πληροφοριών

HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Μέρος Γ Συστήματα Ομοτίμων (Peer-to-Peer Systems) και Ανάκτηση Πληροφοριών Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Γιάννης Τζίτζικας ιάλεξη : 17b Ημερομηνία : 30-5-007 Μέρος Γ Συστήματα

Διαβάστε περισσότερα

HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Ανάκτηση Πληροφοριών & Συστήματα Ομοτίμων (Peer-to-Peer Systems) & IR

HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Ανάκτηση Πληροφοριών & Συστήματα Ομοτίμων (Peer-to-Peer Systems) & IR Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ανάκτηση Πληροφοριών & Συστήματα Ομοτίμων (Peer-to-Peer Systems)

Διαβάστε περισσότερα

(Peer-to-Peer Systems) και Ανάκτηση Πληροφοριών

(Peer-to-Peer Systems) και Ανάκτηση Πληροφοριών Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Γιάννης Τζίτζικας άλ ιάλεξη : Ημερομηνία : Μέρος Γ Συστήματα Ομοτίμων

Διαβάστε περισσότερα

Napster ( ): διαμοιρασμός MP3

Napster ( ): διαμοιρασμός MP3 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 006 HΥ46 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Μέρος Γ Συστήματα Ομοτίμων (Peer-to-Peer Systems) και Ανάκτηση Πληροφοριών

Διαβάστε περισσότερα

4 η Σειρά ασκήσεων (Συμπίεση, Ομαδοποίηση, Ευρετηρίαση Πολυμέσων, Κατανεμημένη Ανάκτηση)

4 η Σειρά ασκήσεων (Συμπίεση, Ομαδοποίηση, Ευρετηρίαση Πολυμέσων, Κατανεμημένη Ανάκτηση) Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 -Συστήματα Ανάκτησης Πληροφοριών 2005-2006 Εαρινό Εξάμηνο 4 η Σειρά ασκήσεων (Συμπίεση, Ομαδοποίηση, Ευρετηρίαση Πολυμέσων, Κατανεμημένη Ανάκτηση)

Διαβάστε περισσότερα

DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS

DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS Paper By: Gleb Skobeltsyn, Karl Aberer Presented by: Βασίλης Φωτόπουλος Agenda 1. Ορισμός του προβλήματος

Διαβάστε περισσότερα

Συστήματα Peer To Peer (P2P Systems) Γαλάνης Δημήτριος Παπαδημητρίου Χριστίνα

Συστήματα Peer To Peer (P2P Systems) Γαλάνης Δημήτριος Παπαδημητρίου Χριστίνα Συστήματα Peer To Peer (P2P Systems) Γαλάνης Δημήτριος Παπαδημητρίου Χριστίνα Τα Peer-To-Peer προσελκύουν το ενδιαφέρον Ακαδημαϊκά Προσπάθειες International Workshop on P2P Computing Global and P2P Computing

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing

Διαβάστε περισσότερα

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων

Διαβάστε περισσότερα

Parallel and Distributed IR

Parallel and Distributed IR Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη η και Κατανεμημένη η ΑΠ Γιάννης

Διαβάστε περισσότερα

Κατανεμημένα Συστήματα. Συστήματα Peer-to-Peer (P2P)

Κατανεμημένα Συστήματα. Συστήματα Peer-to-Peer (P2P) Κατανεμημένα Συστήματα Συστήματα Peer-to-Peer (P2P) Κωνσταντίνος Αντωνής 2011 Σκοπός Τα P2P είναι κατανεμημένες αρχιτεκτονικές που σχεδιάζονται με σκοπό τη διαμοίραση πόρων (περιεχομένου, αποθηκευτικού

Διαβάστε περισσότερα

Φροντιστήριο 5. Το πρώτο πράγµα λοιπόν που πρέπει να κάνουµε είναι να βρούµε τις πιθανότητες εµφάνισης των συµβόλων. Έτσι έχουµε:

Φροντιστήριο 5. Το πρώτο πράγµα λοιπόν που πρέπει να κάνουµε είναι να βρούµε τις πιθανότητες εµφάνισης των συµβόλων. Έτσι έχουµε: Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάµηνο Φροντιστήριο 5 Άσκηση 1 Θεωρείστε το αλφάβητο {α,β,γ,δ,ε} και την εξής φράση: «α α β γ

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας Μέτρα Απόδοσης Precision = # σχετικών κειμένων που επιστρέφονται # κειμένων που επιστρέφονται Recall = # σχετικών κειμένων που επιστρέφονται # συνολικών

Διαβάστε περισσότερα

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks P2P 1,a) 1 1 1 P2P P2P P2P P2P A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks NARISHIGE Yuki 1,a) ABE Kota 1 ISHIBASHI Hayato 1 MATSUURA Toshio 1

Διαβάστε περισσότερα

Ομότιμα συστήματα p2p systems ΠΡΙΝΕΑ ΜΑΡΙΑ 10 ΕΞΑΜΗΝΟ

Ομότιμα συστήματα p2p systems ΠΡΙΝΕΑ ΜΑΡΙΑ 10 ΕΞΑΜΗΝΟ Ομότιμα συστήματα p2p systems ΠΡΙΝΕΑ ΜΑΡΙΑ 10 ΕΞΑΜΗΝΟ ΠΕΡΙΛΗΨΗ P2P Εναλλακτική λύση των παραδοσιακών συστημάτων κεντρικών Η/Υ Κυριότερα συστήματα:napster κ Gnutella Μελέτη μέτρησης συστημάτων (μέτρηση

Διαβάστε περισσότερα

Peer-to-Peer Technology

Peer-to-Peer Technology Peer-to-Peer Technology Συστήµατα Peer to Peer Καταργούν την αρχιτεκτονική Client-Server Στηρίζονται στην οµότιµη και εθελοντική συµπεριφορά των διαφόρων κόµβων Client Server Συστήµατα Peer to Peer Καταργούν

Διαβάστε περισσότερα

P2P αρχιτεκτονικές. για Υλοποίηση Επιχειρησιακών Μοντέλων για Η- Εμπόριο. S3 Laboratory - Τεχνολογία Ηλεκτρονικού Εμπορίου

P2P αρχιτεκτονικές. για Υλοποίηση Επιχειρησιακών Μοντέλων για Η- Εμπόριο. S3 Laboratory - Τεχνολογία Ηλεκτρονικού Εμπορίου P2P αρχιτεκτονικές για Υλοποίηση Επιχειρησιακών Μοντέλων για Η- Εμπόριο P2P αρχιτεκτονική P2P δικτύωση: νέα μορφή προγραμματισμού κατανεμημένων εφαρμογών P2P δίκτυα: διαθέτουν κόμβους που αλληλεπιδρούν

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας άλ ιάλεξη :

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο

Διαβάστε περισσότερα

Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ

Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Γιάννης Τζίτζικας CS463 - Information Retrieval Systems Yannis Tzitzikas,

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #11 Suffix Arrays Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια χρήσης Το παρόν

Διαβάστε περισσότερα

ιαχείριση εδομένων σε Συστήματα Ομότιμων Κόμβων

ιαχείριση εδομένων σε Συστήματα Ομότιμων Κόμβων Εισαγωγή ιαχείριση εδομένων σε Συστήματα Ομότιμων Κόμβων Μεγάλος αριθμός από κόμβους (συνήθως υπολογιστές στην «άκρη» του διαδικτύου) Συμμετέχουν στον υπολογισμό Προσφέροντας πόρους (π.χ., μουσικά αρχεία)

Διαβάστε περισσότερα

Διπλωματική Εργασία. Ανάπτυξη και Πειραματισμός Αλγορίθμων Αναζήτησης Πόρων σε Διομότιμα Συστήματα (Peer-to-Peer networks)

Διπλωματική Εργασία. Ανάπτυξη και Πειραματισμός Αλγορίθμων Αναζήτησης Πόρων σε Διομότιμα Συστήματα (Peer-to-Peer networks) Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης Τμήμα Εφαρμοσμένης Πληροφορικής και Πολυμέσων Διπλωματική Εργασία Ανάπτυξη και Πειραματισμός Αλγορίθμων Αναζήτησης Πόρων σε Διομότιμα Συστήματα (Peer-to-Peer networks)

Διαβάστε περισσότερα

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2016-17 Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα) http://mixstef.github.io/courses/csintro/ Μ.Στεφανιδάκης Αφηρημένες

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #10 εικτοδότηση και Αναζήτηση Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια

Διαβάστε περισσότερα

Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας

Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας Σε ένα σύστημα φιλτραρίσματος πληροφορίας, ή αλλιώς σύστημα έκδοσης/συνδρομής, οι χρήστες εγγράφονται

Διαβάστε περισσότερα

Κατανεμημένα Συστήματα. Javascript LCR example

Κατανεμημένα Συστήματα. Javascript LCR example Κατανεμημένα Συστήματα Javascript LCR example Javascript JavaScript All JavaScript is the scripting language of the Web. modern HTML pages are using JavaScript to add functionality, validate input, communicate

Διαβάστε περισσότερα

Ανάκτηση Δεδομένων (Information Retrieval)

Ανάκτηση Δεδομένων (Information Retrieval) Ανάκτηση Δεδομένων (Information Retrieval) Παύλος Εφραιμίδης Βάσεις Δεδομένων Ανάκτηση Δεδομένων 1 Information Retrieval (1) Βάσεις Δεδομένων: Περιέχουν δομημένη πληροφορία: Πίνακες Ανάκτηση Πληροφορίας

Διαβάστε περισσότερα

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463 ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ COMPUTER SCIENCE DEPARTMENT UNIVERSITY OF CRETE Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463 4 η Σειρά Ασκήσεων Ψαράκη Μαρία-Γεωργία ΜΕΤ 556 psaraki@csd.uoc.gr Εαρινό Εξάμηνο 2008-2009

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 8: Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis) Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό

Διαβάστε περισσότερα

Ευρετήρια. Βάσεις Δεδομένων. Διδάσκων: Μαρία Χαλκίδη

Ευρετήρια. Βάσεις Δεδομένων. Διδάσκων: Μαρία Χαλκίδη Ευρετήρια Βάσεις Δεδομένων Διδάσκων: Μαρία Χαλκίδη Βασικές έννοιες Οι μηχανισμοί δεικτοδότησης χρησιμοποιούνται για να επιταχύνουν την προσπέλαση σε επιθυμητά δεδομένα. π.χ., author catalog in library

Διαβάστε περισσότερα

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible.

Physical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible. B-Trees Index files can become quite large for large main files Indices on index files are possible 3 rd -level index 2 nd -level index 1 st -level index Main file 1 The 1 st -level index consists of pairs

Διαβάστε περισσότερα

Αρχιτεκτονική υπολογιστών

Αρχιτεκτονική υπολογιστών 1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Αρχιτεκτονική υπολογιστών Ενότητα 4 : Κρυφή Μνήμη Καρβούνης Ευάγγελος Δευτέρα, 30/11/2015 Χαρακτηριστικά Θέση Χωρητικότητα Μονάδα Μεταφοράς

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΔΙΔΑΚΤΙΚΗΣ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΔΙΔΑΚΤΙΚΗΣ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑ ΔΙΔΑΚΤΙΚΗΣ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΑΤΕΥΘΥΝΣΗ : ΨΗΦΙΑΚΕΣ ΕΠΙΚΟΙΝΩΝΙΕΣ & ΔΙΚΤΥΑ Διπλωματική Εργασία Μελέτη των Μηχανισμών ασφάλειας που εφαρμόζονται

Διαβάστε περισσότερα

Μελέτη Aποδοτικών Tρόπων Διαχείρισης Profiles σε Συστήματα Publish/Subscribe

Μελέτη Aποδοτικών Tρόπων Διαχείρισης Profiles σε Συστήματα Publish/Subscribe Μελέτη Aποδοτικών Tρόπων Διαχείρισης Profiles σε Συστήματα Publish/Subscribe Μαρίνα Δρόσου Μυρτώ Ντέτσικα Γρηγόριος Τζώρτζης {mdrosou, mntetsik, gtzortzi} @ cs.uoi.gr Τμήμα Πληροφορικής, Πανεπιστήμιο Ιωαννίνων

Διαβάστε περισσότερα

Κατανεμημένα Συστήματα Ασκήσεις.

Κατανεμημένα Συστήματα Ασκήσεις. Κατανεμημένα Συστήματα Ασκήσεις 2016-2017 http://www.cslab.ece.ntua.gr/courses/distrib Άσκηση 1 3 διεργασίες, η P1, η P2 και η P3 στέλνουν μεταξύ τους multicast μηνύματα. Σε περίπτωση που θέλουμε να εξασφαλίσουμε:

Διαβάστε περισσότερα

Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ

Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2006 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Γιάννης

Διαβάστε περισσότερα

Search and Replication in Unstructured Peer-to-Peer Networks

Search and Replication in Unstructured Peer-to-Peer Networks Search and Replication in Unstructured Peer-to-Peer Networks Presented in P2P Reading Group in 11/10/2004 Abstract: Τα µη-κεντρικοποιηµένα και µη-δοµηµένα Peer-to-Peer δίκτυα όπως το Gnutella είναι ελκυστικά

Διαβάστε περισσότερα

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΗΥ463 Συστήµατα Ανάκτησης Πληροφοριών Εργασία: Ανεστραµµένο Ευρετήριο Εισαγωγή Σκοπός της εργασίας είναι η δηµιουργία ενός ανεστραµµένου ευρετηρίου για τη µηχανή αναζήτησης Μίτος, το

Διαβάστε περισσότερα

Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ

Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Γιάννης

Διαβάστε περισσότερα

Εργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση:

Εργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση: Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 2009-2010 Φθινοπωρινό Εξάμηνο Εργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση: Σκοπός αυτής της

Διαβάστε περισσότερα

Κατακερματισμός. 4/3/2009 Μ.Χατζόπουλος 1

Κατακερματισμός. 4/3/2009 Μ.Χατζόπουλος 1 Κατακερματισμός 4/3/2009 Μ.Χατζόπουλος 1 H ιδέα που βρίσκεται πίσω από την τεχνική του κατακερματισμού είναι να δίνεται μια συνάρτησης h, που λέγεται συνάρτηση κατακερματισμού ή παραγωγής τυχαίων τιμών

Διαβάστε περισσότερα

Τµήµα Πληροφορικής. Υλοποίηση LRU Cache ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ - ΕΡΓΑΣΙΑ 4. Φθινοπωρινό Εξάµηνο Διδάσκων: E. Μαρκάκης. Γενικά περί Caching

Τµήµα Πληροφορικής. Υλοποίηση LRU Cache ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ - ΕΡΓΑΣΙΑ 4. Φθινοπωρινό Εξάµηνο Διδάσκων: E. Μαρκάκης. Γενικά περί Caching ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τµήµα Πληροφορικής Φθινοπωρινό Εξάµηνο 2016 ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ - ΕΡΓΑΣΙΑ 4 Διδάσκων: E. Μαρκάκης Υλοποίηση LRU Cache Στην εργασία αυτή ζητείται να υλοποιήσετε σε Java τις βασικές

Διαβάστε περισσότερα

Topics in Database Systems: Data Management in Peer-to-Peer Systems

Topics in Database Systems: Data Management in Peer-to-Peer Systems ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Topics in Database Systems: Data Management in Peer-to-Peer Systems ASSIGNMENT 9: Peer-to-peer Systems Due: June 17, 2005 ιδάσκουσα: Ε. Πιτουρά ΜΑΡΓΑΡΙΤΗ ΣΠΥΡΙ

Διαβάστε περισσότερα

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων Εξάμηνο 7 ο Procedures and Functions Stored procedures and functions are named blocks of code that enable you to group and organize a series of SQL and PL/SQL

Διαβάστε περισσότερα

SEMANTIC DATA CACHING AND REPLACEMENT

SEMANTIC DATA CACHING AND REPLACEMENT SEMANTIC DATA CACHING AND REPLACEMENT Paper By: Shaul Dar, Michael J. Franklin, Bjorn Jonsson, Divesh Srivastava, Michael Tan Appeared: VLDB conference 1996 Presented by: Βασίλης Φωτόπουλος Agenda 1. Data-Shipping

Διαβάστε περισσότερα

HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Μοντέλα Ανάκτησης Ι

HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Μοντέλα Ανάκτησης Ι Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Μοντέλα Ανάκτησης Ι (Retrieval Models) Γιάννης Τζίτζικας άλ ιάλεξη

Διαβάστε περισσότερα

ΑΝΑΖΗΤΗΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΕ ΑΔΟΜΗΤΑ ΔΙΚΤΥΑ ΟΜΟΤΙΜΩΝ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ. Υποβάλλεται στην

ΑΝΑΖΗΤΗΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΕ ΑΔΟΜΗΤΑ ΔΙΚΤΥΑ ΟΜΟΤΙΜΩΝ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ. Υποβάλλεται στην ΑΝΑΖΗΤΗΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΕ ΑΔΟΜΗΤΑ ΔΙΚΤΥΑ ΟΜΟΤΙΜΩΝ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ Υποβάλλεται στην ορισθείσα από την Γενική Συνέλευση Ειδικής Σύνθεσης του Τμήματος Πληροφορικής Εξεταστική Επιτροπή

Διαβάστε περισσότερα

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing)

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing) ΕΠΛ231 Δομές Δεδομένων και Αλγόριθμοι 1 Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing) Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: - Διαχείριση Συγκρούσεων με Ανοικτή Διεύθυνση a) Linear

Διαβάστε περισσότερα

Διάλεξη 22: Τεχνικές Κατακερματισμού I (Hashing)

Διάλεξη 22: Τεχνικές Κατακερματισμού I (Hashing) Διάλεξη 22: Τεχνικές Κατακερματισμού I (Hashing) Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Ανασκόπηση Προβλήματος και Προκαταρκτικών Λύσεων Bit Διανύσματα Τεχνικές Κατακερματισμού & Συναρτήσεις

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του 510 σελίδες 1η

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3. Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY6 - Συστήματα Ανάκτησης Πληροφοριών 007 008 Εαρινό Εξάμηνο Φροντιστήριο Retrieval Models Άσκηση Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR)

Ανάκτηση Πληροφορίας (Information Retrieval IR) Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του αντικειµένου

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας

Διαβάστε περισσότερα

Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο

Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο Κατακερματισμός 1 Αποθήκευση εδομένων (σύνοψη) Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο Παραδοσιακά, μία σχέση (πίνακας/στιγμιότυπο) αποθηκεύεται σε ένα αρχείο Αρχείο δεδομένων

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

Επίπεδο δικτύου IP Forwading κτλ

Επίπεδο δικτύου IP Forwading κτλ Επίπεδο δικτύου IP Forwading κτλ (IP για που το έβαλες) Εργαστήριο Δικτύων Υπολογιστών 2014-2015 Τμήμα Μηχανικών Η/Υ και Πληροφορικής Επίπεδο δικτύου (Network layer) Επίπεδο εφαρμογής (Application layer):

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5: Μοντελοποίηση: Πιθανοκρατικό Μοντέλο Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα είναι μικρότεροι το 1000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Διάρκεια: 3,5 ώρες Καλή

Διαβάστε περισσότερα

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι

Λύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάμηνο 3 η Σειρά ασκήσεων (Ευρετηρίαση, Αναζήτηση σε Κείμενα και Άλλα Θέματα) (βαθμοί 12: όποιος

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Φροντιστήριο 3

Ανάκτηση Πληροφορίας. Φροντιστήριο 3 Ανάκτηση Πληροφορίας Φροντιστήριο 3 Τσιράκης Νίκος Νοέμβριος 2007 2 Περιεχόμενα Ανεστραμμένα Αρχεία Εισαγωγή Δημιουργία Συμπίεση Πιθανοτικά Μοντέλα 3 Ανεστραμμένα Αρχεία 4 Εισαγωγή Με ποιους τρόπους μπορούμε

Διαβάστε περισσότερα

Δρομολόγηση (Routing)

Δρομολόγηση (Routing) Δρομολόγηση (Routing) Περίληψη Flooding Η Αρχή του Βέλτιστου και Δυναμικός Προγραμματισμός ijkstra s Algorithm Αλγόριθμοi Δρομολόγησης Link State istance Vector Δρομολόγηση σε Κινητά Δίκτυα Δρομολόγηση

Διαβάστε περισσότερα

Βασικές έννοιες. Κατανεμημένα Συστήματα 1

Βασικές έννοιες. Κατανεμημένα Συστήματα 1 Βασικές έννοιες Κατανεμημένα Συστήματα 1 lalis@inf.uth.gr Ορισμός κατανεμημένου συστήματος Ένα σύστημα από ξεχωριστές ενεργές οντότητες (ονομάζονται «κόμβοι» ή «διεργασίες») που εκτελούνται ταυτόχρονα/ανεξάρτητα

Διαβάστε περισσότερα

Εξωτερική Αναζήτηση. Ιεραρχία Μνήμης Υπολογιστή. Εξωτερική Μνήμη. Εσωτερική Μνήμη. Κρυφή Μνήμη (Cache) Καταχωρητές (Registers) μεγαλύτερη ταχύτητα

Εξωτερική Αναζήτηση. Ιεραρχία Μνήμης Υπολογιστή. Εξωτερική Μνήμη. Εσωτερική Μνήμη. Κρυφή Μνήμη (Cache) Καταχωρητές (Registers) μεγαλύτερη ταχύτητα Ιεραρχία Μνήμης Υπολογιστή Εξωτερική Μνήμη Εσωτερική Μνήμη Κρυφή Μνήμη (Cache) μεγαλύτερη χωρητικότητα Καταχωρητές (Registers) Κεντρική Μονάδα (CPU) μεγαλύτερη ταχύτητα Πολλές σημαντικές εφαρμογές διαχειρίζονται

Διαβάστε περισσότερα

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα 2 Βήματα Επεξεργασίας Τα βασικά βήματα στην επεξεργασία

Διαβάστε περισσότερα

Υλοποίηση Αλγορίθμου Δρομολόγησης και Ισοκατανομής Φορτίου σε ομότιμο δίκτυο στο περιβάλλον PlanetLab ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Υλοποίηση Αλγορίθμου Δρομολόγησης και Ισοκατανομής Φορτίου σε ομότιμο δίκτυο στο περιβάλλον PlanetLab ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΕΘΝΙKO ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΕΠΙΚΟΙΝΩΝΙΩΝ, ΗΛΕΚΤΡΟΝΙΚΗΣ & ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Υλοποίηση Αλγορίθμου Δρομολόγησης και Ισοκατανομής Φορτίου

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΥΣΤΗΜΑΤΑ P2P ΣΥΣΤΗΜΑΤΑ ΝΕΦΟΥΣ ΚΑΤΑΝΕΜΗΜΕΝΑ ΣΥΣΤΗΜΑΤΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΥΣΤΗΜΑΤΑ P2P ΣΥΣΤΗΜΑΤΑ ΝΕΦΟΥΣ ΚΑΤΑΝΕΜΗΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΥΣΤΗΜΑΤΑ P2P ΣΥΣΤΗΜΑΤΑ ΝΕΦΟΥΣ Διδακτικές Σημειώσεις για το μάθημα ΚΑΤΑΝΕΜΗΜΕΝΑ ΣΥΣΤΗΜΑΤΑ Διδάσκων: Κωνσταντίνος Αντωνής Δρ. Μηχανικός

Διαβάστε περισσότερα

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2007-2008 Εαρινό Εξάµηνο Άσκηση 1 Φροντιστήριο 4 Θεωρείστε ένα έγγραφο με περιεχόμενο «αυτό είναι ένα κείμενο και

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηρίαση, Αποθήκευση και Οργάνωση Αρχείων (Indexing, Storage and

Διαβάστε περισσότερα

ΗΥ486 - Αρχές Κατανεμημένου Υπολογισμού Εαρινό Εξάμηνο Δεύτερη Προγραμματιστική Εργασία

ΗΥ486 - Αρχές Κατανεμημένου Υπολογισμού Εαρινό Εξάμηνο Δεύτερη Προγραμματιστική Εργασία ΗΥ486 - Αρχές Κατανεμημένου Υπολογισμού Εαρινό Εξάμηνο 2015-2016 Δεύτερη Προγραμματιστική Εργασία Γενική περιγραφή Στη δεύτερη προγραμματιστική εργασία καλείστε να υλοποιήσετε ένα διομότιμο σύστημα (Peer-to-

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ http://www.cslab.ece.ntua.gr Θέματα

Διαβάστε περισσότερα

Σύστηµα Προσοµοίωσης ικτύου για Aλγόριθµους Οµότιµων (peer-to-peer) Kόµβων.

Σύστηµα Προσοµοίωσης ικτύου για Aλγόριθµους Οµότιµων (peer-to-peer) Kόµβων. ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟ ΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Σύστηµα Προσοµοίωσης ικτύου για Aλγόριθµους Οµότιµων (peer-to-peer) Kόµβων.

Διαβάστε περισσότερα

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Κατακερματισμός. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Κατακερματισμός. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Δομές Δεδομένων Κατακερματισμός Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Λεξικό Dictionary Ένα λεξικό (dictionary) είναι ένας αφηρημένος τύπος δεδομένων (ΑΤΔ) που διατηρεί

Διαβάστε περισσότερα

Οργάνωση αρχείων: πως είναι τοποθετηµένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο

Οργάνωση αρχείων: πως είναι τοποθετηµένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο Κατακερµατισµός 1 Οργάνωση Αρχείων (σύνοψη) Οργάνωση αρχείων: πως είναι τοποθετηµένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο 1. Αρχεία Σωρού 2. Ταξινοµηµένα Αρχεία Φυσική διάταξη των εγγραφών

Διαβάστε περισσότερα

Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1

Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1 Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ.Χατζόπουλος 2 Δένδρο αναζήτησης είναι ένας ειδικός τύπος δένδρου που χρησιμοποιείται για να καθοδηγήσει την αναζήτηση μιας

Διαβάστε περισσότερα

(C) 2010 Pearson Education, Inc. All rights reserved.

(C) 2010 Pearson Education, Inc. All rights reserved. Connectionless transmission with datagrams. Connection-oriented transmission is like the telephone system You dial and are given a connection to the telephone of fthe person with whom you wish to communicate.

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας ιάλεξη : 14a

Διαβάστε περισσότερα

Δομές Δεδομένων και Αλγόριθμοι

Δομές Δεδομένων και Αλγόριθμοι Δομές Δεδομένων και Αλγόριθμοι Χρήστος Γκόγκος ΤΕΙ Ηπείρου Χειμερινό Εξάμηνο 2014-2015 Παρουσίαση 19 Hashing - Κατακερματισμός 1 / 23 Πίνακες απευθείας πρόσβασης (Direct Access Tables) Οι πίνακες απευθείας

Διαβάστε περισσότερα

Πληροφορική 2. Δομές δεδομένων και αρχείων

Πληροφορική 2. Δομές δεδομένων και αρχείων Πληροφορική 2 Δομές δεδομένων και αρχείων 1 2 Δομή Δεδομένων (data structure) Δομή δεδομένων είναι μια συλλογή δεδομένων που έχουν μεταξύ τους μια συγκεκριμένη σχέση Παραδείγματα δομών δεδομένων Πίνακες

Διαβάστε περισσότερα

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης

Δομές Ευρετηρίου: Διάρθρωση Διάλεξης Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2006 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ευρετηριασμός, Αποθήκευση και Οργάνωση Αρχείων Κειμένων (Indexing,

Διαβάστε περισσότερα

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Να γραφεί πρόγραμμα το οποίο δέχεται ως είσοδο μια ακολουθία S από n (n 40) ακέραιους αριθμούς και επιστρέφει ως έξοδο δύο ακολουθίες από θετικούς ακέραιους

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011 Διάρκεια Διαγωνισμού: 3 ώρες Απαντήστε όλες τις ερωτήσεις Μέγιστο Βάρος (20 Μονάδες) Δίνεται ένα σύνολο από N σφαιρίδια τα οποία δεν έχουν όλα το ίδιο βάρος μεταξύ τους και ένα κουτί που αντέχει μέχρι

Διαβάστε περισσότερα

Διάλεξη 16: Πρόβλημα Συμφωνίας. ΕΠΛ 432: Κατανεμημένοι Αλγόριθμοι

Διάλεξη 16: Πρόβλημα Συμφωνίας. ΕΠΛ 432: Κατανεμημένοι Αλγόριθμοι Διάλεξη 16: Πρόβλημα Συμφωνίας ΕΠΛ 432: Κατανεμημένοι Αλγόριθμοι Τι θα δούμε σήμερα Ορισμός του προβλήματος Συμφωνίας Αλγόριθμος Συμφωνίας με Σφάλματα Κατάρρευσης ΕΠΛ432: Κατανεµηµένοι Αλγόριθµοι 1 Πρόβλημα

Διαβάστε περισσότερα

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Διαχείριση εγγράφων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Απεικόνιση κειμένων για Information Retrieval Δεδομένου ενός κειμένου αναζητούμε μια μεθοδολογία απεικόνισης του γραμματικού χώρου

Διαβάστε περισσότερα

Επίπεδο Μεταφοράς. (ανεβαίνουμε προς τα πάνω) Εργαστήριο Δικτύων Υπολογιστών Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Επίπεδο Μεταφοράς. (ανεβαίνουμε προς τα πάνω) Εργαστήριο Δικτύων Υπολογιστών Τμήμα Μηχανικών Η/Υ και Πληροφορικής Επίπεδο Μεταφοράς (ανεβαίνουμε προς τα πάνω) Εργαστήριο Δικτύων Υπολογιστών 2014-2015 Τμήμα Μηχανικών Η/Υ και Πληροφορικής Επίπεδο Μεταφοράς(Transport layer) Επίπεδο εφαρμογής (Application layer): Συντονισμός

Διαβάστε περισσότερα

Peer-to-Peer Systems / Συστήματα Ομοτίμων

Peer-to-Peer Systems / Συστήματα Ομοτίμων Τμήμα Πληροφορικής Πανεπιστήμιο Κύπρου Peer-to-Peer Systems / Συστήματα Ομοτίμων Δημήτρης Ζεϊναλιπούρ Επισκέπτης Λέκτορας http://www.cs.ucy,ac,cy/~dzeina/ 1 Στόχοι Διάλεξης Μια γενική εισαγωγή στα Συστήματα

Διαβάστε περισσότερα

Υ- 01 Αρχιτεκτονική Υπολογιστών Ιεραρχία μνήμης: προχωρημένα θέματα

Υ- 01 Αρχιτεκτονική Υπολογιστών Ιεραρχία μνήμης: προχωρημένα θέματα Υ- 01 Αρχιτεκτονική Υπολογιστών Ιεραρχία μνήμης: προχωρημένα θέματα Αρης Ευθυμίου Το σημερινό μάθημα Εικονική μνήμη και κρυφές μνήμες Physical/Virtual indexing Σκοπός: μείωση hit Ome Τεχνικές σχετικές

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Όλοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι του 10000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Αν κάπου κάνετε κάποιες υποθέσεις

Διαβάστε περισσότερα

Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας. Υπηρεσίες Internet. ίκτυα Η/Υ. Επίπεδο Εφαρµογής. Ενότητα θ

Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας. Υπηρεσίες Internet. ίκτυα Η/Υ. Επίπεδο Εφαρµογής. Ενότητα θ Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας Υπηρεσίες Internet ίκτυα Η/Υ Επίπεδο Εφαρµογής O Παγκόσµιος Ιστός (World Wide Web) Ηλεκτρονική Αλληλογραφία (E-mail) Υπηρεσία FTP (File Transfer

Διαβάστε περισσότερα

Κινητά και Διάχυτα Συστήματα. Ενότητα # 6: Εφαρμογές DHT Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Κινητά και Διάχυτα Συστήματα. Ενότητα # 6: Εφαρμογές DHT Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Κινητά και Διάχυτα Συστήματα Ενότητα # 6: Εφαρμογές DHT Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του

Διαβάστε περισσότερα

Οι Διαδικτυακές ανάγκες μιας εταιρείας σε διευθύνσεις IPv4, έχουν ως εξής: Τμήμα Διοίκησης Προσωπικού & Οικονομικών Σύνολο απαιτούμενων διευθύνσεων

Οι Διαδικτυακές ανάγκες μιας εταιρείας σε διευθύνσεις IPv4, έχουν ως εξής: Τμήμα Διοίκησης Προσωπικού & Οικονομικών Σύνολο απαιτούμενων διευθύνσεων Άσκηση 1 Ethernet protocol Οι Διαδικτυακές ανάγκες μιας εταιρείας σε διευθύνσεις IPv4, έχουν ως εξής: Τμήμα Πωλήσεων Τμήμα Ανάπτυξης Προϊόντων Τμήμα Διοίκησης Προσωπικού & Οικονομικών Σύνολο απαιτούμενων

Διαβάστε περισσότερα

Advanced Data Indexing

Advanced Data Indexing Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων) Κατακερματισμός Hashing (1ο Μέρος) Η Αναζήτηση απαιτεί Δομές Λύσεις Για να υποστηριχθεί η αποδοτική αναζήτηση απαιτείται η χρήση κατάλληλων δομών-ευρετηρίων

Διαβάστε περισσότερα

Alternative to Balanced Trees, Comms of the ACM, 33(6), June 1990,

Alternative to Balanced Trees, Comms of the ACM, 33(6), June 1990, ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Πληροφορικής & Τηλεπικοινωνιών Μια σημείωση από τον Α. Δελή για το άρθρο: W. Pugh, Skip Lists: A Probabilistic Alternative to Balanced Trees, Comms of the ACM, 33(), June 10,

Διαβάστε περισσότερα

Ο ΑΤΔ Λεξικό. Σύνολο στοιχείων με βασικές πράξεις: Δημιουργία Εισαγωγή Διαγραφή Μέλος. Υλοποιήσεις

Ο ΑΤΔ Λεξικό. Σύνολο στοιχείων με βασικές πράξεις: Δημιουργία Εισαγωγή Διαγραφή Μέλος. Υλοποιήσεις Ο ΑΤΔ Λεξικό Σύνολο στοιχείων με βασικές πράξεις: Δημιουργία Εισαγωγή Διαγραφή Μέλος Υλοποιήσεις Πίνακας με στοιχεία bit (0 ή 1) (bit vector) Λίστα ακολουθιακή (πίνακας) ή συνδεδεμένη Είναι γνωστό το μέγιστο

Διαβάστε περισσότερα

Σύστημα Διαμοιρασμού Βιβλιογραφικών Αναφορών. Κοντοτάσιου Ιωάννα ΑΜ 3125 Μπέσσας Απόστολος ΑΜ 3171

Σύστημα Διαμοιρασμού Βιβλιογραφικών Αναφορών. Κοντοτάσιου Ιωάννα ΑΜ 3125 Μπέσσας Απόστολος ΑΜ 3171 Σύστημα Διαμοιρασμού Βιβλιογραφικών Αναφορών Κοντοτάσιου Ιωάννα ΑΜ 35 Μπέσσας Απόστολος ΑΜ 37 Το πρόβλημα των αναφορών Κάθε ερευνητική εργασία απαιτείται να αναφέρει τις βιβλιογραφικές αναφορές της. Ο

Διαβάστε περισσότερα

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing)

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing) Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing) Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Διαχείριση Συγκρούσεων με Ανοικτή Διεύθυνση a) Linear Probing, b) Quadratic Probing c) Double

Διαβάστε περισσότερα