Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ
|
|
- Ἀβειρὼν Αλεξάκης
- 8 χρόνια πριν
- Προβολές:
Transcript
1 Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Γιάννης Τζίτζικας CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 1 Διάρθρωση Περιεχομένου Μέρος A: Παράλληλη Ανάκτηση Πληροφοριών (Parallel IR) Μέρος B: Κατανεμημένη Ανάκτηση Πληροφοριών (Distributed IR) Επιλογή Πηγής Eνοποίηση Αποτελεσμάτων Μέρος Γ: Ανάκτηση Πληροφοριών σε Ομότιμα Συστήματα (Peer to Peer Systems) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 2 Ανάκτηση Πληροφορίας
2 Μέρος B Κατανεμημένη Ανάκτηση Πληροφοριών (Distributed Information Retrieval) Κατανεμημένη Ανάκτηση Πληροφοριών: Διάρθρωση Κίνητρο Σχέση μεταξύ Παράλληλης και Κατανεμημένης Αν. Πληροφοριών Σχεδιαστικά Ζητήματα Διαμέριση Συλλογών και Εγγράφων Επιλογή Πηγής Ενοποίηση Αποτελεσμάτων CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 4 Ανάκτηση Πληροφορίας
3 Κατανεμημένη ΑΠ: Κίνητρο Το κίνητρο για Παράλληλη ΑΠ ήταν η βελτίωση της απόδοσης Για την Κατανεμημένη ΑΠ δεν είναι μόνο αυτό. Είναι και η ανάγκη ενοποιημένης πρόσβασης στα έγγραφα πολλών συστημάτων ανάκτησης πληροφοριών CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 5 Κατανεμημένη Ανάκτηση Πληροφοριών TCP/IP IRS1 IRS2 IRS3 IRS4 IRS5 UofCrete UofAthens UofPatras CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 6 Ανάκτηση Πληροφορίας
4 Κατανεμημένη Ανάκτηση Πληροφοριών query IRS1 IRS2 IRS3 IRS4 IRS5 UofCrete UofAthens UofPatras CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 7 Κατανεμημένη Ανάκτηση Πληροφοριών answer ans1 ans2 ans3 ans4 ans5 IRS1 IRS2 IRS3 IRS4 IRS5 UofCrete UofAthens UofPatras CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 8 Ανάκτηση Πληροφορίας
5 Ποια η Σχέση μεταξύ Παράλληλης και Κατανεμημένης Ανάκτησης Πληροφοριών; Η κατανεμημένη μοιάζει με την παράλληλη αρχιτεκτονική MIMD Διαφορές με την MIMD το κανάλι επικοινωνίας μεταξύ των επεξεργαστών είναι πολύ πιο αργό δεν έχουμε τους ίδιους επεξεργαστές (όπως σε μια παράλληλη μηχανή) στην κατανεμημένη ο μεσίτης (broker) συχνά επιλέγει να χρησιμοποιήσει μόνο ένα υποσύνολο των υποκείμενων συστημάτων BUS IRS1 IRS2 IRS3 IRS4 IRS5 UofCrete UofAthens UofPatras CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 9 Σχέση μεταξύ Παράλληλης και Κατανεμημένης Αν. Πλ. Ποια προσέγγιση του Partitioned Parallel Processing κατάλληλη για την Κατανεμημένη Ανάκτηση; είναι document partitioning: ενδείκνυται για την κατανεμημένη ανάκτηση term partitioning: δεν είναι πολύ καλή διότι απαιτεί περισσότερη επικοινωνία (για αυτό σπάνια υιοθετείται από ένα κατανεμημένο σύστημα) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 10 Ανάκτηση Πληροφορίας
6 Κατανεμημένη Ανάκτηση: Σχεδιαστικά ζητήματα Server: receives requests, initiates a thread for each request, combines the intermediate results into the final answer Search Protocol for transmitting requests and results E.g. Z39.50, STARTS TCP/IP IRS1 IRS2 IRS3 IRS4 IRS5 UofCrete UofAthens UofPatras distribute documents across servers selection of the servers to receive a particular request combine the results of multiple servers CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 11 Διαμερισμός Συλλογών (Collection Partitioning) Δεν τίθεται τέτοιο ζήτημα αν τα υποκείμενα συστήματα είναι ετερογενή Σενάρια για την περίπτωση που υπάρχει κεντρικός έλεγχος: Semantic based partition of collections to servers Search Servers focusing on a particular subject area E.g. Maths, Physics, etc Semantic based partition of documents to servers π.χ. με χρήση ενός αλγορίθμου ομαδοποίησης (clustering) Replications of collections to all servers για βελτίωση throughput (μοιάζει με το multitasking) όταν οι συλλογές δεν είναι μεγάλες Τυχαία διανομή εγγράφων στους servers για βελτίωση της απόδοσης στην περίπτωση που η συλλογή είναι πολύ μεγάλη CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 12 Ανάκτηση Πληροφορίας
7 Επιλογή Πηγής (Source Selection) Q=«Lagrange multipliers» Source Selection: Επιλογή των συλλογών που είναι πιθανόν να έχουν συναφή έγγραφα με την τρέχουσα επερώτηση IRS1 IRS2 IRS3 IRS4 IRS5 MATHS MATHS PHILOSOPHY CHEMISTRY MATHS CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 13 Για ποιο λόγο να κάνουμε Επιλογή Πηγής; Η αναζήτηση σε κάθε συλλογή μπορεί: να είναι ακριβή σε χρόνο (αφού μπορεί να έχουμε εκατοντάδες συλλογές) να είναι ακριβή σε χρήμα (η αναζήτηση μπορεί να έχει χρηματικό κόστος) να καθορίσει την αποτελεσματικότητα (effectiveness) της ανάκτησης CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 14 Ανάκτηση Πληροφορίας
8 Επιλογή Πηγής: Επιλογή Όλων Κατάλληλη κυρίως για διαμερισμό μιας μεγάλης συλλογής πάνω από ένα τοπικό δίκτυο Εύκολη ενοποίηση αποτελεσμάτων για το Boolean model answer(q) = ans1(q) ansk(q) H ενοποίηση αποτελεσμάτων για τα στατιστικά μοντέλα είναι πιο δύσκολη (το ζήτημα αυτό θα μελετηθεί παρακάτω) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 15 Επιλογή Πηγής: Χειρονακτική Ομαδοποίηση και Επιλογή Θεματική οργάνωση συλλογών (χειρονακτικώς) πχ μαθηματικά, φυσική, ειδήσεις, κλπ προβλήματα χρονοβόρα διαδικασία, ευάλωτη σε ασυνέπειες/παραλείψεις, δεν θα δουλέψει καλά για μη συνηθισμένες επερωτήσεις Ο χρήστης επιλέγει τη θεματική κατηγορία Q=«Maths:Lagrange multipliers» Maths: 1,3 Physics: 3 Philosophy: 4,5 IRS1 IRS2 IRS3 IRS4 IRS5 CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 16 Ανάκτηση Πληροφορίας
9 Επιλογή Πηγής βάσει Κανόνων (Rule based) Τα περιεχόμενα κάθε συλλογής περιγράφονται σε μια Βάση Γνώσης Ένα Σύστημα Κανόνων επιλέγει τις πηγές για κάθε εισερχόμενη επερώτηση Αδυναμίες κόστος συγγραφής κανόνων ανάγκη συντήρησης των κανόνων (αν οι συλλογές είναι δυναμικές) Q=«Lagrange multipliers» KB IRS1 IRS2 IRS3 IRS4 IRS5 CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 17 Επιλογή Πηγής: Κατανομή Συναφών Εγγράφων (Relevant Document Distribution (RDD)) Φτιάξε μια βάση με επερωτήσεις και την πιθανή κατανομή των συναφών εγγράφων σε κάθε συλλογή (με κάποιο τρόπο) q1 S1 S2 S3 S4 S5 q2 S1 S2 S3 S4 S5 KB q3 S1 S2 S3 S4 S5 IRS1 IRS2 IRS3 IRS4 IRS5 CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 18 Ανάκτηση Πληροφορίας
10 Επιλογή Πηγής: Κατανομή Συναφών Εγγράφων (Relevant Document Distribution (RDD)) Για κάθε νέα επερώτηση q που λαμβάνει το σύστημα Βρίσκουμε τις κ πιο κοντινές επερωτήσεις στη βάση (similar past queries) Από τις κατανομές τους, εκτιμούμε πόσα συναφή έγγραφα με την νέα επερώτηση έχει κάθε πηγή Αποφασίζουμεπόσαέγγραφαναζητήσουμεαπό κάθε συλλογή (αν 0 δεν στέλνουμε επερώτηση ) q1 q2 S1 S2 S3 S4 S5 S1 S2 S3 S4 S5 KB q3 S1 S2 S3 S4 S5 IRS1 IRS2 IRS3 IRS4 IRS5 CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 19 Επιλογή Πηγής: Επερώτηση Βολιδοσκόπησης (Query Probing) Στέλνουμε μια επερώτηση βολιδοσκόπησης (probing query) σε κάθε συλλογή (που μπορεί να περιλαμβάνει μερικούς από τους όρους της επερώτησης) Kάθε συλλογή απαντά με στατιστικές πληροφορίες πχ: μέγεθος συλλογής, πόσα έγγραφα έχουν τον κάθε όρο, πόσα έγγραφα έχουν όλους τους όρους της επερώτησης, κλπ Bάσει αυτών των στοιχείων επιλέγουμε την πηγή Υποθέσεις η επεξεργασία των επερωτήσεων βολιδοσκόπησης είναι πολύ φθηνότερη περιέχουν λίγους όρους, δεν χρειάζεται να υπολογίσουμε βαθμούς συνάφειας ή να διατάξουμε τα έγγραφα ως προς τη συνάφεια τους CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 20 Ανάκτηση Πληροφορίας
11 Επιλογή Πηγής με Διανύσματα Πηγών IRS1=<0.4, 0.3,, 0.8> IRS2=<0.1, 0.9,, 0.4> IRS3=<0.8, 0.5,, 0.2> IRS1 IRS2 IRS3 IRS4 IRS5 Βλέπουμε κάθε συλλογή ως ένα μεγάλο έγγραφο Φτιάχνουμε ένα διάνυσμα για κάθε συλλογή (τύπου TF IDF) tfij: συνολικές εμφανίσεις του όρου i στη συλλογή j idfi: log(n/ni), όπου Ν το πλήθος των συλλογών, και ni το πλήθος των συλλογών που έχουν τον όρο i Υπολογίζουμε το βαθμό ομοιότητας κάθε νέας επερώτησης με το διάνυσμα κάθε συλλογής (π.χ. ομοιότητα συνημίτονου) Διατάσσουμε τιςσυλλογέςκαιεπιλέγουμετιςκορυφαίες CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 21 Επιλογή Πηγής με Διανύσματα Πηγών (ΙΙ) Μια αδυναμία: Μπορεί ο βαθμός ομοιότητας με μία συλλογή να είναι μεγάλος, αλλά να μην υπάρχει κανένα έγγραφο εκεί με μεγάλο βαθμό συνάφειας Ένας τρόπος αντιμετώπισης: Για κάθε συλλογή φτιάξε Ν/Β διανύσματα, δηλαδή ένα διάνυσμα για κάθε Β έγγραφα της συλλογής Αν Β = 1 τότε ο server είναι σαν να έχει το ευρετήριο όλων των συστημάτων Αν Β = Ν τότε έχουμε ένα διάνυσμα για κάθε συλλογή CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 22 Ανάκτηση Πληροφορίας
12 Επιλογή Πηγής: GlOSS (Glossary of Servers Server) Estimate the number of potentially relevant documents in a collection C for a Boolean AND query Q as: C df t t Q dft C : number of C the number of documents in the collection C docs in C that contain t Requires that for each collection C we have an entry in a centralized index centralized index is small, easy to maintain CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 23 Επιλογή Πηγής: ggloss και hgloss ggloss Extends the GlOSS approach to the vector space model Each collection is represented by its centroid vector Standard inner product similarity measure of query to each collection Rank collections accordingly hgloss (hierarchical GlOSS) Extends the ggloss approach to sets of ggloss indexes Each ggloss index is represented by its centroid vector CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 24 Ανάκτηση Πληροφορίας
13 Επιλογή Πηγής: Σύνοψη Προσεγγίσεις για μικρό αριθμό συλλογών Επιλογή Όλων Χειρονακτική Ομαδοποίηση (και χειρονακτική επιλογή) Επιλογή βάσει Κανόνων (Rule based selection) Κατανομή Συναφών Εγγράφων (Relevant document distribution (RDD)) Βολιδοσκόπηση Επερώτησης (Query Probing) Διανύσματα Πηγών Προσεγγίσεις για μεγάλο αριθμό συλλογών Διανύσματα Πηγών GlOSS CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 25 HARVEST A distributed architecture to gatherand distribute data usedbycia, NASA, US National Academy of Sciences User Replication Manager Broker Broker Gatherers: ευρετηριάζουν >=1 Web Server περιοδικά Brokers: απαντούν επερωτήσεις βασιζόμενοι στα ευρετήρια των gatherers ή άλλων brokers (και ενημερώνουν αυξητικά τα ευρετήρια τους) Object Cache Broker Broker Gatherer Gatherer Gatherer Gatherer Web site Web site Web site Web site Web site Web site CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 26 Ανάκτηση Πληροφορίας
14 Ενοποίηση Αποτελεσμάτων ( Results Merging, Fusion, Rank Aggregation,...) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 27 Ενοποίηση Αποτελεσμάτων Διάρθρωση Κατηγορίες Τεχνικών Ενοποίησης: Απομονωμένες και Ολοκληρωμένες Τεχνικές Ενοποίησης Round Robin interleaving Score based Weighted Score based Global statistics Μετα Μηχανές Αναζήτησης Ενοποίηση Διατάξεων (Rank Aggregation) Επιθυμητές Ιδιότητες Ενοποίηση κατά Borda Ενοποίηση κατά Condorcet Το Θεώρημα του Ανέφικτου του Κ. Arrow (Arrow s Impossibility theorem) Ενοποίηση κατά Kemeny Αποδοτικοί αλγόριθμοι υπολογισμού των κορυφαίων κ στοιχείων της ενοποιημένης διάταξης (Top K Rank Aggregation) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 28 Ανάκτηση Πληροφορίας
15 Ενοποίηση Αποτελεσμάτων answer =? ans1 ans2 ans3 ans4 ans5 IRS1 IRS2 IRS3 IRS4 IRS5 UofCrete UofAthens UofPatras CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 29 Περιπτώσεις Ενοποίηση Συνόλων (π.χ. απαντήσεων σε Exact Match Queries) answer(q) = ans1(q) ansk(q) Άρα η ενοποίηση αποτελεσμάτων για το Boolean model είναι εύκολη Ενοποίηση Διατάξεων (απαντήσεων Partial Match Queries) H ενοποίηση αποτελεσμάτων είναι πιο δύσκολη οι διατάξεις/σκορ δεν είναι πάντα συγκρίσιμες, αφού εξαρτώνται από τα στατιστικά τηςσυλλογήςτουκάθεσυστήματος(e.g. idf) υπάρχουν πολλοί διαφορετικοί τρόποι συνάθροισης διατάξεων Συχνά μας αρκεί η εύρεση των κορυφαίων στοιχείων της ενοποιημένης διάταξης CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 30 Ανάκτηση Πληροφορίας
16 Κατηγορίες Στρατηγικών Ενοποίησης Διατάξεων (A) Ολοκληρωμένες Τεχνικές (Integrated) Οι πηγές παρέχουν επιπρόσθετη πληροφορία που χρησιμοποιείται κατά την ενοποίηση Αδυναμίες: Στενό πεδίο εφαρμογής απαιτούν συμφωνία μεταξύ των πηγών (e.g. protocol) Συχνά λαμβάνουν υπόψη τους μέτρα όπως Precision/Recall, τα οποία δεν είναι πάντα «αντικειμενικά» ή συγκρίσιμα. (B) Απομονωμένες Μέθοδοι (Isolated) Δεν απαιτούν καμία επιπλέον πληροφορία από τις πηγές (μπορούν να εφαρμοστούν και στις μετα μηχανές αναζήτησης) Είναι ανεξάρτητες των τεχνικών ευρετηρίασης και των μοντέλων ανάκτησης των υποκείμενων συστημάτων Άρα κατάλληλες για δυναμικά περιβάλλοντα όπου υπάρχουν πολλά συστήματα των οποίων η λειτουργία εξελίσσεται συχνά και απρόβλεπτα Σχετικές τεχνικές: round robin interleaving, score based, Borda, Condorcet, download and re index the contents of the objects (web pages) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 31 Ενοποίηση Διατάξεων: Round Robin interleaving (isolated) (δηλαδή merge sort) Παράδειγμα: ans1(q) = <d10,d2, d30, d7> ans2(q) = <d4, d12, d5, d9> ANS(q) = < {d10,d4}, {d2,d12}, {d30,d5}, {d7,d9}> Προβλήματα στην πραγματικότητα όλα τα έγγραφα του ans1(q) μπορεί να είναι καλύτερα (πιο συναφή) από το 1οστοιχείοτηςans2(q) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 32 Ανάκτηση Πληροφορίας
17 Παράδειγμα: ans1(q) = < (d3,0.8), (d2,0.7) > ans2(q) = < (d5,0.6), (d6,0.3) > ans3(q) = < (d4,0.9) > Ενοποίηση Διατάξεων: Score based (isolated) ANS(q) = < d4, d3, d2, d5, d6> Προβλήματα τα σκορ διαφορετικών συστημάτων δεν είναι συγκρίσιμα (κανονικοποιημένα), αφού εξαρτώνται από τα στατιστικά της συλλογής του κάθε συστήματος (e.g. idf). CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 33 Ενοποίηση Διατάξεων: Weighted Score based Λαμβάνουμε υπόψη το σκορ της πηγής που υπολογίσαμε όταν κάναμε Επιλογή Πηγής (source selection) Πχ Score(IRS1) = 0.9 // υπολογίστηκε στη φάση επιλογής πηγής Score(IRS2) = 0.5 // υπολογίστηκε στη φάση επιλογής πηγής ans1(q) = <(d1, 0.7)> ans2(q) = <(d2, 0.9)> ANS(q) = < (d1, 0.63), (d2, 0.45)> // 0.63 = 0.9*0.7 Εδώ πολλαπλασιάσαμε το σκορ της πηγής με το σκορ των εγγράφων. Υπάρχουν και άλλες παραλλαγές (π.χ. [Callan94,95]) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 34 Ανάκτηση Πληροφορίας
18 Ενοποίηση Διατάξεων: Downlοad and re index/re score (isolated) ans1 ans2 IRS1 Vector Space Model IRS4 Extended Boolean Model Εδώ ανακτούμε τα έγγραφα των απαντήσεων κάθε πηγής, τα επαναευρετηριάζουμε και επαναυπολογίζουμε το βαθμό συνάφειας τους Μειονέκτημα Χρονοβόρα διαδικασία CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 35 Ενοποίηση Διατάξεων: Global term statistics (integrated) Μπορούμε να κάνουμε συγκρίσιμα τα σκορ διαφορετικών συστημάτων αν επιβάλουμε τα ίδια στατιστικά στοιχεία σε όλα τα συστήματα (global statistics) Τα στατιστικά αυτά στοιχεία μπορούν να αποκτηθούν στη φάση της επιλογής πηγής (πχ Διανύσματα Πηγής, Probe Queries, ) Αποτίμηση Επερωτήσεων σε 2 φάσεις στην 1η συλλέγονται τα στατιστικά (o server στέλνει την επερώτηση και οι πηγές απαντούν με τα στατιστικά των όρων που περιέχονται στην επερώτηση) στην 2η οserver στέλνει σε κάθε πηγή την επερώτηση μαζί με τα καθολικά στατιστικά των όρων της κάθε πηγή αποτιμά την επερώτηση με τα καθολικά στατιστικά και επιστρέφει την απάντηση Ο server λαμβάνει έτοιμα σκορ και απλά τα ενοποιεί (merge sort) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 36 Ανάκτηση Πληροφορίας
19 Ενοποίηση Διατάξεων: Global term statistics Παράδειγμα q= Hotels Crete idf(hotels)= log(2000/400) idf(crete)= log(2000/105) ans = score-based merging of ans1 ans2 ans1 ans2 S1 S2 S1 S2 N1 = 1000 N1Hotels = 300 N1Crete = 100 N2 = 1000 N2Hotels = 100 N2Crete = 5 S1 S2 S1 S2 CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 37 Ενοποίηση Αποτελεσμάτων Διάρθρωση Κατηγορίες Τεχνικών Ενοποίησης: Απομονωμένες και Ολοκληρωμένες Τεχνικές Ενοποίησης Round Robin interleaving Score based Weighted Score based Global statistics Μετα Μηχανές Αναζήτησης Ενοποίηση Διατάξεων (Rank Aggregation) Επιθυμητές Ιδιότητες Ενοποίηση κατά Borda Ενοποίηση κατά Condorcet Το Θεώρημα του Ανέφικτου του Κ. Arrow (Arrow s Impossibility theorem) Ενοποίηση κατά Kemeny Αποδοτικοί αλγόριθμοι υπολογισμού των κορυφαίων κ στοιχείων της ενοποιημένης διάταξης (Top K Rank Aggregation) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 38 Ανάκτηση Πληροφορίας
20 Μέτα μηχανές Αναζήτησης Μετα Μηχανές Αναζήτησης Server: receives requests, initiates a thread for each request, combines the intermediate results into the final answer «Search Protocol»: HTTP/HTML TCP/IP IRS1 IRS2 IRS3 IRS4 IRS5 Google AltaVista Lycos Μετα Μηχανή Αναζήτησης: Μηχανή αναζήτησης που προωθεί την επερώτηση σε πολλές μηχανές αναζήτησης και ενοποιεί τα αποτελέσματα που επιστρέφουν CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 40 Ανάκτηση Πληροφορίας
21 Γιατί φτιάχνουμε μετα μηχανές αναζήτησης; Καλύτερη κάλυψη: Το σύνολο των σελίδων που είναι γνωστές (ευρετηριασμένες) σε κάθε μηχανή είναι διαφορετικό Διάταξη Πλειοψηφούσας Γνώμης (consensus ranking) Η διαθεσιμότητα πολλών μηχανών μας δίνει την δυνατότητα να ορίσουμε ένα αθροιστικό (πλειοψηφικό) μέτρο συνάφειας Ενοποίηση αποτελεσμάτων = Πρόβλημα απόφασης ομάδας (group decision problem) Μείωση spam: Δύσκολα μια spam σελίδα μπορεί να ξεγελάσει όλες τις μηχανές CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 41 Ενδεικτικές μηχανές: Μετα Μηχανές Αναζήτησης Dogpile ( over Google, Yahoo!, msn, Ask Jeaves SurfWax( Metacrawler, SavvySearch, Βήματα Λειτουργίας Submit queries to host sites. Parse resulting HTML pages to extract search results. Integrate multiple rankings into a consensus ranking. Present integrated results to user. Διαφορές με την Κατανεμημένη Ανάκτηση Πληροφοριών οι υποκείμενες μηχανές δεν παρέχουν term statistics, άρα μπορούμε να χρησιμοποιήσουμε μόνο απομονωμένες (isolated) τεχνικές ενοποίησης αποτελεσμάτων οι υποκείμενες μηχανές δεν υποστηρίζουν την ίδια ερωτηματική γλώσσα CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 42 Ανάκτηση Πληροφορίας
22 Ενοποίηση Διατάξεων Ενοποίηση Διατάξεων: Rank Aggregation (or Meta Ranking) (isolated) Διατύπωση του Προβλήματος D: ένα σύνολο αντικειμένων (π.χ. εγγράφων) S1, Sk: ένα σύνολο διατάξεων του D Σκοπός: Ενοποίηση των διατάξεων S1,..Sk σε μία The metaphor: elections Objects Candidates Sources Electors Ordering by a system Elector s voting ticket Fused ordering Election list CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 44 Ανάκτηση Πληροφορίας
23 Διάρθρωση Ενοποίηση κατά Borda κατά Condorcet κατά Kemeny Επιθυμητές Ιδιότητες Τεχνικών Ενοποίησης Διατάξεων Το Θεώρημα του Ανέφικτου του Arrow Αποδοτικοί αλγόριθμοι υπολογισμού των κορυφαίων κ στοιχείων της ενοποιημένης διάταξης (Top K Rank Aggregation) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 45 Plurality Ranking (Απλή Πλειοψηφία) O υποψήφιοςμετιςπερισσότερεςπρώτεςθέσειςείναιονικητής. Έστω 6 πηγές (S1,,S6) και 4 σελίδες a,b,c,d. Κάθε σύστημα επιστρέφει μια γραμμική διάταξη των σελίδων: S1: <a,c,d,b> S2: <a,b,c,d> S3: <b,c,a,b> S4: <b,a,d,c> S5: <a,d,c,b> S6: <c,a,b,d> Μετράμε πόσες πρώτες θέσεις κατέλαβε κάθε σελίδα a: 3 b: 2 c: 1 d: 0 Άρα η τελική κατάταξη είναι η <a,b,c,d> CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 46 Ανάκτηση Πληροφορίας
24 Plurality Ranking (Απλή Πλειοψηφία) Κάποια προβλήματα 3 συστήματα <a,c,d,b> 6 συστήματα <a,d,c,b> 3 συστήματα <b,c,d,a> 5 συστήματα <b,d, c, a> 2 συστήματα <c,b,d,a> 5 συστήματα <c,d,b,a> 2 συστήματα <d,b,c,a> 4 συστήματα <d,c,b,a> Απόσυρση του d (που ήταν τελευταίο στην ενοποιημένη διάταξη) 3 συστήματα <a,c,b> 6 συστήματα <a,c,b> 3 συστήματα <b,c,a> 5 συστήματα <b,c, a> 2 συστήματα <c,b,a> 5 συστήματα <c,b,a> 2 συστήματα <b,c,a> 4 συστήματα <c,b,a> a:9 b:8 c:7 d:6 Τελική διάταξη: <a,b,c,d> a:9 b:10 c:11 Τελική διάταξη: <c,b,a> Αντίστροφη της αρχικής! CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 47 Plurality Ranking (Απλή Πλειοψηφία) Κάποια προβλήματα 3 συστήματα <a,c,d,b> 6 συστήματα <a,d,c,b> 3 συστήματα <b,c,d,a> 5 συστήματα <b,d, c, a> 2 συστήματα <c,b,d,a> 5 συστήματα <c,d,b,a> 2 συστήματα <d,b,c,a> 4 συστήματα <d,c,b,a> a:9 b:8 c:7 d:6 Τελική διάταξη: <a,b,c,d> Απόσυρση του d Τελική διάταξη: <c,b,a> Απόσυρση του a Τελική διάταξη: <d,c,b> Απόσυρση του b Τελική διάταξη: <d,c,a> Απόσυρση του c Τελική διάταξη: <d,b,a> CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 48 Ανάκτηση Πληροφορίας
25 Ενοποίηση Διατάξεων κατά Borda [Jean Charles Borda 1770] The votes of an object o V ( o) = i= 1.. k r i ( o) Reinvented (for the context of Meta-Searching) in [Tzitzikas 2001] r ( o) : the position of the object o in the ordering of system i S i The fused ordering Μ is derived by ordering the objects in ascending order wrt to their votes Example: S1 : < o1, o2, o3 > S2 : < o1, o3, o2 > S3 : < o3, o1, o2 > V ( o1 ) = = 4 V ( o2) = = 8 V ( o3) = = 6 M : < o1, o3, o2 > If each source S returns an ordered subset i position of o j in Oi, ri ( o j ) = F + 1 i if o j Oi otherwise O of Obj. where F = max{ O1,..., Ok } Γιατί; CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 49 The mean distance of the fused ordering 0 The level of agreement of the fused ordering 0: Ενοποίηση Διατάξεων κατά Borda [Tzitzikas, 2001] Βαθμός Συμφωνίας The distance between two orderings i and j: dist( i, j) = ri ( o) rj ( o) o O dist(0, i) Dem = i = 1.. k k linear transformation C Dem LA = C C: Max possible mean distance Dem LA = C inversion transformation C > 1,e.g.C = 2 High level may drive the user to read only the very first documents since probably they are the more relevant Low level may drive the user to read more documents CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 50 Ανάκτηση Πληροφορίας
26 Ενοποίηση Διατάξεων κατά Condorcet [1785] Condorcet: the winner is a candidate that defeats every other candidate in pairwise majority rule election S1: <a,b,c> S2: <b,a,c> S2: <c,a,b> a:b 2:1// τoa νικά το b δύο φορές (και χάνει μία) a:c 2:1// τoa νικά το c δύο φορές (και χάνει μία) Αρα η τελική κατάταξη κατά Condorset είναι: <a,b,c> CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 51 Ενοποίηση Διατάξεων κατά Condorcet [1785] S1: <a,b,c> S2: <b,c,a> S3: <c,a,b> a:b 2:1 a:c 1:2 c:b 1:2 // άρα το b δεν μπορεί να είναι o νικητής // άρα το a δεν μπορεί να είναι o νικητής // άρα το c δεν μπορεί να είναι o νικητής Δεν υπάρχει πάντα Condorcet νικητής! CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 52 Ανάκτηση Πληροφορίας
27 Borda vs Condorcet S1: <a,b,c> S2: <b,a,c> S2: <c,a,b> Condorcet a:b 2:1 a:c 2:1 Condorcet ordering: <a,b,c> Borda a: = 5 b: = 6 c: = 7 Borda ordering: <a,b,c> CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 53 Borda Condorcet Borda (1770) Member of French Academy of Sciences Noted for work in hydraulics, optics, navigation instrument Purpose: Reforming the election procedure of French Academy. Condorcet (1785) Viewed Borda as an enemy Finding best ordering by hypothesis testing Switch to propose Condorcet winner Criticize plurality method CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 54 Ανάκτηση Πληροφορίας
28 Borda Condorcet S1: <a,b,c,d,e> S2: <b,c,e,d,a> S3: <e,a,b,c,d> S4: <a,b,d,e,c> S5: <b,a,d,e,c> Borda a: = 11 b: = 9 c: =19 d: = 19 e: = 17 Borda winner : b Condorcet a:b 3:2 a:c 4:1 a:d 4:1 a:e :3:2 Condorcet winner a CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 55 Prurality Borda Condorcet 49 votes 48 votes 3 votes 1st x y z 2nd y z y 3rd z x x Prurality winner: x Borda winner: y Condorcet: z> x CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 56 Ανάκτηση Πληροφορίας
29 Condorcet and Order Θεωρείστε την περίπτωση τριών υποψηφίων (a,b,c) και 13 εκλεκτόρων a b a 5 b 8 c 6 11 Έχουμε συνοψίσει τις διατάξεις που έδωσαν οι εκλέκτορες κατασκευάζοντας έναν πίνακα C, όπου το C[i,j] εκφράζει πόσες φορές το i νικά το j c 7 2 Μπορούμε να υπολογίσουμε τη στήριξη (support) κάθε πιθανής γραμμικής διάταξης αθροίζοντας τη στήριξη της κάθε συσχέτισής της. <a,b,c> has support 25 a>b:8, a>c:6, b>c:11 <b,c,a> has support 23 a<b:5, c>a:7, b>c:11 CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 57 Ενοποίηση Διατάξεων κατά Kemeny (1959) (Kemeny developed BASIC language) Απόσταση (distance) μεταξύ δυο διατάξεων = πλήθος των διαφωνιών στη διάταξη ζευγαριών Παράδειγμα 1 r1 = <a,b,c> r2 = <b, a, c> K(r1, r2) = 1 (a > r1 b, a < r2 b) Παράδειγμα 2 r1 = <a, b, c, d> r2 = <b, d, a, c> K(r1, r2) = 3 (a > r1 b, a < r2 b) (a > r1 d, a < r2 d) (c > r1 d, c < r2 d) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 58 Ανάκτηση Πληροφορίας
30 Ενοποίηση Διατάξεων κατά Kemeny (1959) Kemeny Optimal Aggregation Η καλύτερη ενοποιημένη διάταξη είναι εκείνη που απέχει το λιγότερο από όλες τις διατάξεις Έστω n διατάξεις: r1, r2,, rn Ενοποιημένη διάταξη r = arg min K(r,ri) Η εύρεση της ενοποιημένης διάταξης είναι ακριβή (πρόβλημα NP-hard) Reconciles Borda and Condorcet CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 59 Ενοποίηση Διατάξεων: Επιθυμητές Ιδιότητες Ουδετερότητα (Neutrality) Καμία εναλλακτική δεν πρέπει να ευνοείται Pareto Optimality Αν X > Y (σε όλες τις διατάξεις) τότε X > Y (στην τελική) Μονοτονία (Monotonicity) // Ranking higher should not hurt a candidate αν o Χ προηγείται του Υ (Χ > Υ) στην τελική διάταξη, αλλαγή ενός ψηφοδελτίου YZX XΥZ, οχθα εξακολουθήσει να προηγείται Ανεξαρτησία από άσχετες εναλλακτικές (Independence from Irrelevant Alternatives) X > Y (στην τελική), αλλαγή ενός ψηφοδελτίου XZY ZXY, τo X>Y παραμένει στην τελική Συνέπεια (Consistency) Αν οι ψηφοφόροι διαιρεθούν σε δύο ομάδες και κάθε ομάδα αναδείξει τον ίδιο νικητή, τότε ο τελικός νικητής (αν λάβουμε υπόψη τις ψήφους και των 2 ομάδων) πρέπει να είναι ο ίδιος CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 60 Ανάκτηση Πληροφορίας
31 Arrow s Impossibility Theorem Kenneth J. Arrow, Social Choice and Individual Values (1951). Won Nobel Prize in 1972 No voting scheme over three or more alternatives can satisfy the following conditions Universality (no restriction on individual ordering. All orderings are achievable. Deterministic) Monotonicity Independence of irrelevant alternatives Pareto Optimality Non dictatorship (No voter in the society is a dictator in the sense that, there does not exist a single voter i in the society such that for every set of orderings in the domain and every pair of distinct social states x and y, if voter i strictly prefers x over y, x is socially selected over y.) Συμπέρασμα: δεν υπάρχει μια απολύτως ικανοποιητική συνάρτηση ενοποίησης διατάξεων CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 61 Διάρθρωση Ενοποίηση κατά Borda κατά Condorcet κατά Kemeny Επιθυμητές Ιδιότητες Τεχνικών Ενοποίησης Διατάξεων Το Θεώρημα του Ανέφικτου του Arrow Αποδοτικοί αλγόριθμοι υπολογισμού των κορυφαίων κ στοιχείων της ενοποιημένης διάταξης (Top K Rank Aggregation) CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 62 Ανάκτηση Πληροφορίας
32 Top k Rank Aggregation Έχουμε Ν αντικείμενα και τους βαθμούς τους βάσει m διαφορετικών κριτηρίων. Έχουμε έναν τρόπο να συνδυάζουμε τα m σκορ κάθε αντικειμένου σε ένα ενοποιημένο σκορ π.χ. min, avg, sum Στόχος: Βρες τα κ αντικείμενα με το υψηλότερο ενοποιημένο σκορ. Εφαρμογές: Υπολογισμός των κορυφαίων κ στοιχείων της απάντησης ενός ΣΑΠ που βασίζεται στο διανυσματικό μοντέλο (τα m κριτήρια είναι οι m όροι της επερώτησης) ενός μεσίτη (π.χ. μετα μηχανής αναζήτησης) πάνω από m Συστήματα Ανάκτησης Πληροφοριών μιας επερώτησης σε μια Βάση Πολυμέσων κριτήρια (και συνάμα χαρακτηριστικά/features): χρώμα, μορφή, υφή, CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 63 Άλλο ένα παράδειγμα εφαρμογής Ενοποίηση απαντήσεων σε Μεσολαβητές (middleware) πάνω από πηγές που αποθηκεύουν δομημένες πληροφορίες έστω μια υπηρεσία εύρεσης εστιατορίων βάσει τριών κριτηρίων: απόσταση από ένα σημείο κατάταξη εστιατορίου τιμή γεύματος, και άλλα όπου ο χρήστης μπορεί να ορίσει τον επιθυμητό τρόπο υπολογισμού του ενοποιημένου σκορ ενός εστιατορίου π.χ. Σκορ(εστΧ) = Stars(εστΧ)* *DistanceFromHome(εστΧ) η υπηρεσία αυτή υλοποιείται με χρήση τριών απομακρυσμένων υπηρεσιών (α) getrestaurantsbystars επιστρέφει όλα τα εστιατόρια σε φθίνουσα σειρά ως προς τα αστέρια που έχουν (κάθε εστιατόριο συνοδεύεται με ένα σκορ) (β) getrestaurantsbydistance(x,y) επιστρέφει όλα τα εστιατόρια σε φθίνουσα σειρά ως προς την απόσταση τους από ένα συγκεκριμένο σημείο με συντεταγμένες (x,y) // κάθε εστιατόριο συνοδεύεται από την απόσταση του από το (x,y) Πως μπορώ να ελαχιστοποιήσω το πλήθος των στοιχείων που πρέπει να διαβάσω από την απάντηση της κάθε υπηρεσίας, προκειμένου να βρω τα κορυφαία 5 εστιατόρια (βάσει σκορ όπως υπολογίζεται από της συνάρτηση βαθμολόγησης που έδωσε ο χρήστης); CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 64 Ανάκτηση Πληροφορίας
33 Εύρεση των κ κορυφαίων Απλοϊκός Αλγόριθμος 1/ Ανέκτησε ολόκληρες τις m λίστες 2/ Υπολόγισε το ενοποιημένο σκορ του κάθε αντικειμένου 3/ Ταξινόμησε τα αντικείμενα βάσει του σκορ και επέλεξε τα πρώτα κ Παρατηρήσεις Κόστος γραμμικό ως προς το μήκος των λιστών Δεν αξιοποιεί το γεγονός ότι οι λίστες είναι ταξινομημένες CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 65 Εύρεση των κ-κορυφαίων Παράδειγμα: Απλοϊκός Τρόπος Έστω οτι θέλουμε να συναθροίσουμε τις διατάξεις που επιστρέφουν 3 πηγές S1, S2, S3 και ο τρόπος συνάθροισης είναι το άθροισμα. S1 = < Α 0.9, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > S2 = < B 1.0, E 0.8, F 0.7, Α 0.7, C 0.5, H 0.5, G 0.5 > S3 = < Α 0.8, C 0.8, E 0.7, B 0.5, F 0.5, G 0.5, H 0.5 > Ο Απλοϊκός Τρόπος Score(Α) = = 2.4 Score(B) = = 2 Score(C) = = 2.1 Score(E) = = 2.2 Score(F) = = 1.7 Score(G) = = 1.5 Score(H) = = 1.5 Τελική διάταξη: < A, E, C, B, F, G, H> CS463 - Information Retrieval Systems Yannis Tzitzikas, U. of Crete 66 Ανάκτηση Πληροφορίας
HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Ενοποίηση
Διαβάστε περισσότεραHΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Ενοποίηση
Διαβάστε περισσότεραParallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2006 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Γιάννης
Διαβάστε περισσότεραParallel and Distributed IR
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη η και Κατανεμημένη η ΑΠ Γιάννης
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing
Διαβάστε περισσότερα4 η Σειρά ασκήσεων (Συμπίεση, Ομαδοποίηση, Ευρετηρίαση Πολυμέσων, Κατανεμημένη Ανάκτηση)
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 -Συστήματα Ανάκτησης Πληροφοριών 2005-2006 Εαρινό Εξάμηνο 4 η Σειρά ασκήσεων (Συμπίεση, Ομαδοποίηση, Ευρετηρίαση Πολυμέσων, Κατανεμημένη Ανάκτηση)
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 8: Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis) Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό
Διαβάστε περισσότεραInformation Integration from the
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Ενότητα Information Integration from the Information Retrieval (IR) perspective Διδάσκων: Γιάννης
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΦροντιστήριο 5. Το πρώτο πράγµα λοιπόν που πρέπει να κάνουµε είναι να βρούµε τις πιθανότητες εµφάνισης των συµβόλων. Έτσι έχουµε:
Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάµηνο Φροντιστήριο 5 Άσκηση 1 Θεωρείστε το αλφάβητο {α,β,γ,δ,ε} και την εξής φράση: «α α β γ
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας Μέτρα Απόδοσης Precision = # σχετικών κειμένων που επιστρέφονται # κειμένων που επιστρέφονται Recall = # σχετικών κειμένων που επιστρέφονται # συνολικών
Διαβάστε περισσότεραΠροτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης)
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 28-29 Εαρινό Εξάμηνο Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης &
Διαβάστε περισσότεραΠανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY6 - Συστήματα Ανάκτησης Πληροφοριών 007 008 Εαρινό Εξάμηνο Φροντιστήριο Retrieval Models Άσκηση Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα
Διαβάστε περισσότεραΛύση (από: Τσιαλιαμάνης Αναγνωστόπουλος Πέτρος) (α) Το trie του λεξιλογίου είναι
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών 2006-2007 Εαρινό Εξάμηνο 3 η Σειρά ασκήσεων (Ευρετηρίαση, Αναζήτηση σε Κείμενα και Άλλα Θέματα) (βαθμοί 12: όποιος
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΛΕΝΑ ΦΛΟΚΑ Επίκουρος Καθηγήτρια Τµήµα Φυσικής, Τοµέας Φυσικής Περιβάλλοντος- Μετεωρολογίας ΓΕΝΙΚΟΙ ΟΡΙΣΜΟΙ Πληθυσµός Σύνολο ατόµων ή αντικειµένων στα οποία αναφέρονται
Διαβάστε περισσότεραΘέμα : Retrieval Models. Ημερομηνία : 9 Μαρτίου 2006
ΗΥ-464: Συστήματα Ανάκτησης Πληροφορίας Informaton Retreval Systems Πανεπιστήμιο Κρήτης Άνοιξη 2006 Φροντιστήριο 2 Θέμα : Retreval Models Ημερομηνία : 9 Μαρτίου 2006 Outlne Prevous Semester Exercses Set
Διαβάστε περισσότεραΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007
Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο
Διαβάστε περισσότεραHΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Μοντέλα Ανάκτησης Ι
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Μοντέλα Ανάκτησης Ι (Retrieval Models) Γιάννης Τζίτζικας άλ ιάλεξη
Διαβάστε περισσότεραCondorcet winner. (1) Αν U j (x) > U j (y) τότε U i (x) > U i (y) και (2) Αν U i (y) > U i (x) τότε U j (y) > U j (x).
Οικονοµικό Πανεπιστήµιο Αθηνών Άνοιξη 2012 Τµήµα Οικονοµικής Επιστήµης ηµόσια Οικονοµική ΙI Η διαδικασία της ψηφοφορίας Ως µεθόδου παροχής των δηµοσίων αγαθών (για τα ιδιωτικά αγαθά, ο µηχανισµός των τιµών).
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5: Μοντελοποίηση: Πιθανοκρατικό Μοντέλο Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Διαβάστε περισσότεραΜία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων
Μία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων ΜΑΘΗΜΑ Ανάκτηση Πληροφορίας Παππάς Χρήστος Ιωάννινα, Ιανουάριος 2010 Διάρθρωση Εισαγωγή Πρόβλημα Σημαντικότητα Ενδιαφέροντα θέματα Τεχνικό
Διαβάστε περισσότεραFractional Colorings and Zykov Products of graphs
Fractional Colorings and Zykov Products of graphs Who? Nichole Schimanski When? July 27, 2011 Graphs A graph, G, consists of a vertex set, V (G), and an edge set, E(G). V (G) is any finite set E(G) is
Διαβάστε περισσότεραEE512: Error Control Coding
EE512: Error Control Coding Solution for Assignment on Finite Fields February 16, 2007 1. (a) Addition and Multiplication tables for GF (5) and GF (7) are shown in Tables 1 and 2. + 0 1 2 3 4 0 0 1 2 3
Διαβάστε περισσότεραΠανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας άλ ιάλεξη :
Διαβάστε περισσότεραΛΥΣΕΙΣ 2 ης ΣΕΙΡΑΣ ΑΣΚΗΣΕΩΝ
ΛΥΣΕΙΣ 2 ης ΣΕΙΡΑΣ ΑΣΚΗΣΕΩΝ Άσκηση 1 Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα 5 έγγραφα: Έγγραφο 1: «Computer Games» Έγγραφο 2: «Computer Games Computer Games» Έγγραφο 3: «Games Theory and
Διαβάστε περισσότεραOther Test Constructions: Likelihood Ratio & Bayes Tests
Other Test Constructions: Likelihood Ratio & Bayes Tests Side-Note: So far we have seen a few approaches for creating tests such as Neyman-Pearson Lemma ( most powerful tests of H 0 : θ = θ 0 vs H 1 :
Διαβάστε περισσότεραΠιθανοκρατικό μοντέλο
Πιθανοκρατικό μοντέλο Το μοντέλο MAP Αλέξανδρος Γκιμπερίτης Βασίλης Μπούργος Δημήτρης Σουραβλιάς 1 Εισαγωγικές έννοιες Κάθε έγγραφο d της συλλογής παριστάνεται από το δυαδικό διάνυσμα x = (x 1, x 2,...,
Διαβάστε περισσότεραQuery-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer
Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων
Διαβάστε περισσότεραHY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems
HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems Ημερομηνία Παράδοσης: 0/1/017 την ώρα του μαθήματος ή με email: mkarabin@csd.uoc.gr Γενικές Οδηγίες α) Επιτρέπεται η αναζήτηση στο Internet και στην βιβλιοθήκη
Διαβάστε περισσότεραParallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ
HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Γιάννης Τζίτζικας CS463 - Information Retrieval Systems Yannis Tzitzikas,
Διαβάστε περισσότεραHΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Ανάκτηση Πληροφοριών & Συστήματα Ομοτίμων (Peer-to-Peer Systems) & IR
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2007 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ανάκτηση Πληροφοριών & Συστήματα Ομοτίμων (Peer-to-Peer Systems)
Διαβάστε περισσότερα2. THEORY OF EQUATIONS. PREVIOUS EAMCET Bits.
EAMCET-. THEORY OF EQUATIONS PREVIOUS EAMCET Bits. Each of the roots of the equation x 6x + 6x 5= are increased by k so that the new transformed equation does not contain term. Then k =... - 4. - Sol.
Διαβάστε περισσότεραΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006
Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα είναι μικρότεροι το 1000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Διάρκεια: 3,5 ώρες Καλή
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Διαβάστε περισσότεραΠαλαιότερες ασκήσεις
Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY6 - Συστήµατα Ανάκτησης Πληροφοριών Παλαιότερες ασκήσεις η Σειρά Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Άσκηση ( η σειρά ασκήσεων
Διαβάστε περισσότεραPosting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΗΥ463 Συστήµατα Ανάκτησης Πληροφοριών Εργασία: Ανεστραµµένο Ευρετήριο Εισαγωγή Σκοπός της εργασίας είναι η δηµιουργία ενός ανεστραµµένου ευρετηρίου για τη µηχανή αναζήτησης Μίτος, το
Διαβάστε περισσότεραEFFICIENT TOP-K QUERYING OVER SOCIAL-TAGGING NETWORKS
EFFICIENT TOP-K QUERYING OVER SOCIAL-TAGGING NETWORKS Ralf Schenkel, Tom Crecelious, Mouna Kacimi, Sebastian Michel, Thomas Neumann, Josiane Xavier Parreira, Gerhard Weikum ΠΡΟΒΛΗΜΑ Εύρεση ενός αποτελεσματικού
Διαβάστε περισσότεραNowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in
Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in : tail in X, head in A nowhere-zero Γ-flow is a Γ-circulation such that
Διαβάστε περισσότεραReminders: linear functions
Reminders: linear functions Let U and V be vector spaces over the same field F. Definition A function f : U V is linear if for every u 1, u 2 U, f (u 1 + u 2 ) = f (u 1 ) + f (u 2 ), and for every u U
Διαβάστε περισσότεραC.S. 430 Assignment 6, Sample Solutions
C.S. 430 Assignment 6, Sample Solutions Paul Liu November 15, 2007 Note that these are sample solutions only; in many cases there were many acceptable answers. 1 Reynolds Problem 10.1 1.1 Normal-order
Διαβάστε περισσότεραΛύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)
Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών ΗΥ-6 Συστήµατα Ανάκτησης Πληροφοριών 7-8 Εαρινό Εξάµηνο Άσκηση Λύσεις ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης) Θεωρείστε µια
Διαβάστε περισσότεραThe challenges of non-stable predicates
The challenges of non-stable predicates Consider a non-stable predicate Φ encoding, say, a safety property. We want to determine whether Φ holds for our program. The challenges of non-stable predicates
Διαβάστε περισσότεραApproximation of distance between locations on earth given by latitude and longitude
Approximation of distance between locations on earth given by latitude and longitude Jan Behrens 2012-12-31 In this paper we shall provide a method to approximate distances between two points on earth
Διαβάστε περισσότεραΕπερωτήσεις σύζευξης με κατάταξη
Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις κατάταξης Top-K queries Οι επερωτήσεις κατάταξης επιστρέφουν τις k απαντήσεις που ταιριάζουν καλύτερα με τις προτιμήσεις του χρήστη. Επερωτήσεις κατάταξης Top-K
Διαβάστε περισσότεραMath 6 SL Probability Distributions Practice Test Mark Scheme
Math 6 SL Probability Distributions Practice Test Mark Scheme. (a) Note: Award A for vertical line to right of mean, A for shading to right of their vertical line. AA N (b) evidence of recognizing symmetry
Διαβάστε περισσότεραKLEE: A Framework for Distributed top-k Query Algorithms
KLEE: A Framework for Distributed top-k Query Algorithms Sebastian Michel Peter Triantafillou Gerhard Weikum VLDB 2005 Αντικείμενο της εργασίας Η εργασία αναφέρεται στο πρόβλημα των top-k queries που αφορούν
Διαβάστε περισσότεραΑνάκτηση Πληροφορίας
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 4: Μοντελοποίηση: Διανυσματικό μοντέλο Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης
Διαβάστε περισσότεραStatistical Inference I Locally most powerful tests
Statistical Inference I Locally most powerful tests Shirsendu Mukherjee Department of Statistics, Asutosh College, Kolkata, India. shirsendu st@yahoo.co.in So far we have treated the testing of one-sided
Διαβάστε περισσότεραSCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions
SCHOOL OF MATHEMATICAL SCIENCES GLMA Linear Mathematics 00- Examination Solutions. (a) i. ( + 5i)( i) = (6 + 5) + (5 )i = + i. Real part is, imaginary part is. (b) ii. + 5i i ( + 5i)( + i) = ( i)( + i)
Διαβάστε περισσότεραΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΜΕΤΑΠΤΥΧΙΑΚΟΥ ΔΙΠΛΩΜΑΤΟΣ ΕΙΔΙΚΕΥΣΗΣ ΕΠΙΣΤΗΜΗ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ του Γεράσιμου Τουλιάτου
Διαβάστε περισσότεραΗ ακρίβεια ορίζεται σαν το πηλίκο των ευρεθέντων συναφών εγγράφων προς τα ευρεθέντα έγγραφα. Άρα για τα τρία συστήµατα έχουµε τις εξής τιµές:
Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2005-2006 Εαρινό Εξάµηνο 1 η Σειρά Ασκήσεων (Αξιολόγηση Αποτελεσµατικότητας Ανάκτησης) Άσκηση 1 (4 βαθµοί) Θεωρείστε
Διαβάστε περισσότεραΗΜΥ 210 ΣΧΕΔΙΑΣΜΟΣ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. Χειµερινό Εξάµηνο ΔΙΑΛΕΞΗ 3: Αλγοριθµική Ελαχιστοποίηση (Quine-McCluskey, tabular method)
ΗΜΥ 210 ΣΧΕΔΙΑΣΜΟΣ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Χειµερινό Εξάµηνο 2016 ΔΙΑΛΕΞΗ 3: Αλγοριθµική Ελαχιστοποίηση (Quine-McCluskey, tabular method) ΧΑΡΗΣ ΘΕΟΧΑΡΙΔΗΣ Επίκουρος Καθηγητής, ΗΜΜΥ (ttheocharides@ucy.ac.cy)
Διαβάστε περισσότεραΨηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS
Ψηφιακή ανάπτυξη Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Learning Objective : SEO και Analytics Fabio Calefato Department of Computer
Διαβάστε περισσότεραLecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3
Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3 1 State vector space and the dual space Space of wavefunctions The space of wavefunctions is the set of all
Διαβάστε περισσότεραΠρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής
Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Να γραφεί πρόγραμμα το οποίο δέχεται ως είσοδο μια ακολουθία S από n (n 40) ακέραιους αριθμούς και επιστρέφει ως έξοδο δύο ακολουθίες από θετικούς ακέραιους
Διαβάστε περισσότεραΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007
Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Όλοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι του 10000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Αν κάπου κάνετε κάποιες υποθέσεις
Διαβάστε περισσότεραΠληροφοριακά Συστήματα
Πληροφοριακά Συστήματα Ανακτώντας Πληροφορία και Γνώση στον Παγκόσμιο Ιστό Γιάννης Τζίτζικας Επίκουρος Καθηγητής Τμήματος Επιστήμης Υπολογιστών και Συνεργαζόμενος Ερευνητής του ΙΤΕ-ΙΠ 3 Απριλίου 2015 Διάρθρωση
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Επεξεργασία Ερωτήσεων Αρχεία ευρετηρίου Κατάλογος συστήματος Αρχεία δεδομένων ΒΑΣΗ Ε ΟΜΕΝΩΝ Σύστημα Βάσεων εδομένων (ΣΒ ) Βάσεις Δεδομένων 2007-2008
Διαβάστε περισσότεραAbstract Storage Devices
Abstract Storage Devices Robert König Ueli Maurer Stefano Tessaro SOFSEM 2009 January 27, 2009 Outline 1. Motivation: Storage Devices 2. Abstract Storage Devices (ASD s) 3. Reducibility 4. Factoring ASD
Διαβάστε περισσότεραk A = [k, k]( )[a 1, a 2 ] = [ka 1,ka 2 ] 4For the division of two intervals of confidence in R +
Chapter 3. Fuzzy Arithmetic 3- Fuzzy arithmetic: ~Addition(+) and subtraction (-): Let A = [a and B = [b, b in R If x [a and y [b, b than x+y [a +b +b Symbolically,we write A(+)B = [a (+)[b, b = [a +b
Διαβάστε περισσότεραA Bonus-Malus System as a Markov Set-Chain. Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics
A Bonus-Malus System as a Markov Set-Chain Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics Contents 1. Markov set-chain 2. Model of bonus-malus system 3. Example 4. Conclusions
Διαβάστε περισσότεραPARTIAL NOTES for 6.1 Trigonometric Identities
PARTIAL NOTES for 6.1 Trigonometric Identities tanθ = sinθ cosθ cotθ = cosθ sinθ BASIC IDENTITIES cscθ = 1 sinθ secθ = 1 cosθ cotθ = 1 tanθ PYTHAGOREAN IDENTITIES sin θ + cos θ =1 tan θ +1= sec θ 1 + cot
Διαβάστε περισσότεραANSWERSHEET (TOPIC = DIFFERENTIAL CALCULUS) COLLECTION #2. h 0 h h 0 h h 0 ( ) g k = g 0 + g 1 + g g 2009 =?
Teko Classes IITJEE/AIEEE Maths by SUHAAG SIR, Bhopal, Ph (0755) 3 00 000 www.tekoclasses.com ANSWERSHEET (TOPIC DIFFERENTIAL CALCULUS) COLLECTION # Question Type A.Single Correct Type Q. (A) Sol least
Διαβάστε περισσότεραOrdinal Arithmetic: Addition, Multiplication, Exponentiation and Limit
Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit Ting Zhang Stanford May 11, 2001 Stanford, 5/11/2001 1 Outline Ordinal Classification Ordinal Addition Ordinal Multiplication Ordinal
Διαβάστε περισσότεραΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων
Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή Επεξεργασία Ερωτήσεων ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήματος 1. Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασμός) 2. Προγραμματισμός (Σχεσιακή Άλγεβρα, SQL) ημιουργία/κατασκευή Εισαγωγή εδομένων
Διαβάστε περισσότεραΕπεξεργασία Ερωτήσεων
Εισαγωγή Επεξεργασία Ερωτήσεων Σ Β Βάση εδομένων Η ομή ενός ΣΒ Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 1 Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 2 Εισαγωγή Εισαγωγή ΜΕΡΟΣ 1 (Χρήση Σ Β ) Γενική
Διαβάστε περισσότεραsubstructure similarity search using features in graph databases
substructure similarity search using features in graph databases Aleksandros Gkogkas Distributed Management of Data Laboratory intro Θα ενασχοληθούμε με το πρόβλημα των ερωτήσεων σε βάσεις γραφημάτων.
Διαβάστε περισσότεραExample Sheet 3 Solutions
Example Sheet 3 Solutions. i Regular Sturm-Liouville. ii Singular Sturm-Liouville mixed boundary conditions. iii Not Sturm-Liouville ODE is not in Sturm-Liouville form. iv Regular Sturm-Liouville note
Διαβάστε περισσότεραΗ Τεχνολογία στις Συνεργασίες των Βιβλιοθηκών
Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης Τμήμα Αρχειονομίας Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Η Τεχνολογία στις Συνεργασίες των Βιβλιοθηκών Σαράντος Καπιδάκης sarantos@ionio.gr Ομοιότητες
Διαβάστε περισσότεραPartial Differential Equations in Biology The boundary element method. March 26, 2013
The boundary element method March 26, 203 Introduction and notation The problem: u = f in D R d u = ϕ in Γ D u n = g on Γ N, where D = Γ D Γ N, Γ D Γ N = (possibly, Γ D = [Neumann problem] or Γ N = [Dirichlet
Διαβάστε περισσότεραΕργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση:
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών ΗΥ463 Συστήματα Ανάκτησης Πληροφοριών 2009-2010 Φθινοπωρινό Εξάμηνο Εργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση: Σκοπός αυτής της
Διαβάστε περισσότεραΕισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων
Βάσεις εδοµένων 2003-2004 Ευαγγελία Πιτουρά 1 ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Επεξεργασία Ερωτήσεων Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL)
Διαβάστε περισσότεραDISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS
DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS Paper By: Gleb Skobeltsyn, Karl Aberer Presented by: Βασίλης Φωτόπουλος Agenda 1. Ορισμός του προβλήματος
Διαβάστε περισσότεραΚεφάλαιο 4. Διαίρει και Βασίλευε (Divide and Conquer) Παύλος Εφραιμίδης V1.1,
Κεφάλαιο 4 Διαίρει και Βασίλευε (Divide and Conquer) Παύλος Εφραιμίδης V1.1, 2015-01-19 Χρησιμοποιήθηκε υλικό από τις αγγλικές διαφάνειες του Kevin Wayne. 1 Διαίρει και Βασίλευε (Divide-and-Conquer) Διαίρει-και-βασίλευε
Διαβάστε περισσότεραOptimal Impartial Selection
Optimal Impartial Selection Max Klimm Technische Universität Berlin Head of Junior Research Group Optimization under Uncertainty Einstein-Zentrum für Mathematik Introduction select member of a set of agents
Διαβάστε περισσότεραThe Simply Typed Lambda Calculus
Type Inference Instead of writing type annotations, can we use an algorithm to infer what the type annotations should be? That depends on the type system. For simple type systems the answer is yes, and
Διαβάστε περισσότεραCRASH COURSE IN PRECALCULUS
CRASH COURSE IN PRECALCULUS Shiah-Sen Wang The graphs are prepared by Chien-Lun Lai Based on : Precalculus: Mathematics for Calculus by J. Stuwart, L. Redin & S. Watson, 6th edition, 01, Brooks/Cole Chapter
Διαβάστε περισσότεραΣχεδιασμός Βάσεων Δεδομένων
Πανεπιστήμιο Πειραιώς Τμήμα Ψηφιακών Συστημάτων Σχεδιασμός Βάσεων Δεδομένων Εργαστήριο 4 Δρ. Βασιλική Κούφη Περιεχόμενα Υλοποίηση Βάσεως Δεδομένων Εκτέλεση ερωτημάτων SQL στην Βάση Δεδομένων BHMA 1. Σχεδιασμός
Διαβάστε περισσότεραΕισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων
Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ Ε ΟΜΕΝΩΝ Αρχεία δεδομένων συστήματος Σύστημα Βάσεων εδομένων (ΣΒ ) 2 :
Διαβάστε περισσότερα1. Financial New Times Year MAXk {FREQij} D D D D
Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY46 - Συστήματα Ανάκτησης Πληροφοριών 2004-2005 Εαρινό Εξάμηνο 2 η Σειρά ασκήσεων (Μοντέλα Ανάκτησης Πληροφοριών και Ευρετήρια) Ανάθεση: 6 Μαρτίου Παράδοση:
Διαβάστε περισσότεραGemini, FastMap, Applications. Εαρινό Εξάμηνο Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών
Gemini,, Applications Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών Εαρινό Εξάμηνο 2011-2012 Table of contents 1 Table of contents 1 2 Table of contents 1 2 3 Table of contents
Διαβάστε περισσότεραΑντισταθμιστική ανάλυση
Αντισταθμιστική ανάλυση Θεωρήστε έναν αλγόριθμο Α που χρησιμοποιεί μια δομή δεδομένων Δ : Κατά τη διάρκεια εκτέλεσης του Α η Δ πραγματοποιεί μία ακολουθία από πράξεις. Παράδειγμα: Θυμηθείτε το πρόβλημα
Διαβάστε περισσότεραΗ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ
Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Μεταπτυχιακό Πρόγραµµα Σπουδών2007-2008 ιδάσκουσα: Κατερίνα Τοράκη (Οι διαλέξεις περιλαµβάνουν
Διαβάστε περισσότεραΘα μιλήσουμε για ΜΟΝΤΕΛΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. Διαφάνειες του καθ. Γιάννη Τζίτζικα (Παν. Κρήτης)
Θα μιλήσουμε για ΜΟΝΤΕΛΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Διαφάνειες του καθ. Γιάννη Τζίτζικα (Παν. Κρήτης) http://www.ics.forth.gr/~tzitzik/ Για το πιθανοκρατικό του καθ. Απ. Παπαδόπουλου (Αριστοτέλειο Παν.) Κεφάλαιο
Διαβάστε περισσότεραΕυρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1
Ευρετήρια Ευαγγελία Πιτουρά 1 τιμή γνωρίσματος Ευρετήρια Ένα ευρετήριο (index) είναι μια βοηθητική δομή αρχείου που κάνει πιο αποδοτική την αναζήτηση μιας εγγραφής σε ένα αρχείο Το ευρετήριο καθορίζεται
Διαβάστε περισσότεραΤο εσωτερικό ενός Σ Β
Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL) ηµιουργία/κατασκευή Εισαγωγή εδοµένων
Διαβάστε περισσότεραΕπεξεργασία ερωτημάτων
Επεξεργασία ερωτημάτων Βάσεις Δεδομένων Διδάσκων: Μαρία Χαλκίδη Σε τι αφορά η επεξεργασία ερωτημάτων? Αναφέρεται στο σύνολο των δραστηριοτήτων που περιλαμβάνονται στην ανάκτηση δεδομένων από μία βάση δεδομένων
Διαβάστε περισσότεραPhysical DB Design. B-Trees Index files can become quite large for large main files Indices on index files are possible.
B-Trees Index files can become quite large for large main files Indices on index files are possible 3 rd -level index 2 nd -level index 1 st -level index Main file 1 The 1 st -level index consists of pairs
Διαβάστε περισσότεραΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 7η: Consumer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Ψηφιακή Οικονομία Διάλεξη 7η: Consumer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών Τέλος Ενότητας Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί
Διαβάστε περισσότεραΑνάπτυξη διαδικτυακής διαδραστικής εκπαιδευτικής εφαρμογής σε λειτουργικό σύστημα Android
Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Τμήμα Ηλεκτρονικών Μηχανικών Τ.Ε. Ανάπτυξη διαδικτυακής διαδραστικής εκπαιδευτικής εφαρμογής σε λειτουργικό σύστημα Android Πτυχιακή Εργασία Φοιτητής:
Διαβάστε περισσότεραSEMANTIC DATA CACHING AND REPLACEMENT
SEMANTIC DATA CACHING AND REPLACEMENT Paper By: Shaul Dar, Michael J. Franklin, Bjorn Jonsson, Divesh Srivastava, Michael Tan Appeared: VLDB conference 1996 Presented by: Βασίλης Φωτόπουλος Agenda 1. Data-Shipping
Διαβάστε περισσότεραBayesian statistics. DS GA 1002 Probability and Statistics for Data Science.
Bayesian statistics DS GA 1002 Probability and Statistics for Data Science http://www.cims.nyu.edu/~cfgranda/pages/dsga1002_fall17 Carlos Fernandez-Granda Frequentist vs Bayesian statistics In frequentist
Διαβάστε περισσότεραw o = R 1 p. (1) R = p =. = 1
Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών ΗΥ-570: Στατιστική Επεξεργασία Σήµατος 205 ιδάσκων : Α. Μουχτάρης Τριτη Σειρά Ασκήσεων Λύσεις Ασκηση 3. 5.2 (a) From the Wiener-Hopf equation we have:
Διαβάστε περισσότεραEvery set of first-order formulas is equivalent to an independent set
Every set of first-order formulas is equivalent to an independent set May 6, 2008 Abstract A set of first-order formulas, whatever the cardinality of the set of symbols, is equivalent to an independent
Διαβάστε περισσότεραInformation Retrieval
Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 10η 1 Αποτίμηση επίδοσης Μηχανών Αναζήτησης 2 Sec. 8.6 Μέτρα επίδοσης μιας μηχανής αναζήτησης Πόσο γρήγορα εκτελεί την διαδικασία
Διαβάστε περισσότεραΔιάλεξη 10: Αλγόριθμοι Ταξινόμησης II
ΕΠΛ231 Δομές Δεδομένων και Αλγόριθμοι 1 Διάλεξη 10: Αλγόριθμοι Ταξινόμησης II Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: - Οι αλγόριθμοι ταξινόμησης: Δ. QuickSort Γρήγορη Ταξινόμηση Ε. BucketSort
Διαβάστε περισσότεραMatrices and Determinants
Matrices and Determinants SUBJECTIVE PROBLEMS: Q 1. For what value of k do the following system of equations possess a non-trivial (i.e., not all zero) solution over the set of rationals Q? x + ky + 3z
Διαβάστε περισσότερα