Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Σχετικά έγγραφα
Information Retrieval

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων Ανάκτηση Πληροφοριών

Information Retrieval

MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole

MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole

MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole

Introduction to Information Retrieval

Ανάκτηση Πληροφορίας

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

Ανάκληση Πληπουοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Information Retrieval

6. Βαθμολόγηση, Στάθμιση Όρων, και το Μοντέλο Διανυσματικού Χώρου

Τι (άλλο) θα δούμε σήμερα;

Περιεχόμενα. Πίνακας συμβόλων σελίδα 10 Πρόλογος 13

Ανάκτηση Πληροφορίας (Information Retrieval IR)

Introduction and Boolean Retrieval. Slides by Manning, Raghavan, Schutze

Information Retrieval

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Μεταπτυχιακή Διπλωματική Εργασία. «Τεχνικές Δεικτοδότησης Συστημάτων Ανάκτησης Πληροφορίας με τη χρήση Wavelet Trees» Κατσίπη Δήμητρα ΑΜ: 741

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 6, 7: Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου.

Information Retrieval

Information Retrieval

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Εισαγωγή στο µάθηµα. Εισαγωγή στην Ανάκτηση Πληροφορίας. Απαιτήσεις του µαθήµατος

ΗΥ-100 Ειζαγωγή ζηην Επιζηήμη Υπολογιζηών

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Ανάκτηση Δεδομένων (Information Retrieval)

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Δημιουργία μιας επιτυχημένης παρουσίας στο διαδίκτυο

Information Retrieval

ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Retrieval Systems

Information Retrieval

(SEO) - Ανοίγοντας τους ορίζοντες τις ΜΜΕ Ελληνικής τουριστικής επιχείρησης στο ιαδίκτυο

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας. Φροντιστήριο 3

Ανάκτηση Πληροφορίας

ΜΥΕ003: Ανάκτηση Πληροφορίας

Information Retrieval

Ανάκτηση Πληροφορίας

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Συµπίεση Ευρετηρίου. Term weighting. ιδάσκων ηµήτριος Κατσαρός, Ph.D.

Social Web: lesson #4

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

Επεξεργασία & Οργάνωση Δεδομένων Κειμένου

Βάσεις Δεδομένων. Database Management Systems (DBMS) Συστήματα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ)

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΘΕΜΕΛΙΩΔΗΣ ΚΛΑΔΙΚΗ ΑΝΑΛΥΣΗ ΤΩΝ ΕΙΣΗΓΜΕΝΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΗΣ ΕΛΛΗΝΙΚΗΣ ΑΓΟΡΑΣ

4. Κατασκευή Ευρετηρίου

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ

Περίληψη διαβάθμισης

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Προσωπικό. Ιστοσελίδα μαθήματος. ΗΥ463 - Συστήματα Ανάκτησης Πληροφοριών. Διδακτικές μονάδες: 4 Προαπαιτούμενα. Εβδομαδιαίο Πρόγραμμα : Παρακολούθηση

«Μηχανή Αναζήτησης Αρχείων» Ημερομηνία Παράδοσης: 30/04/2015, 09:00 π.μ.

ΒΙΒΛΙΟΘΗΚΗ ΣΕΥΠ Γκουν Γκ ταβά τ Ε.

Πληροφοριακά Συστήματα

Ανάκτηση Πληροφορίας Εισαγωγή

MapReduce Εισαγωγή. MapReduce. ηµήτρης Λεβεντέας

ΝΟΜΙΚΑ ΖΗΤΗΜΑΤΑ ΑΠΟ ΤΗΝ ΧΡΗΣΗ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥ Η ΕΛΕΥΘΕΡΙΑ ΤΗΣ ΕΚΦΡΑΣΗΣ ΣΤΑ ΙΣΤΟΛΟΓΙΑ 1

February 2012 Source: Cyprus Statistical Service

Ανάκτηση Πληροφορίας. Φροντιστήριο 2

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

ΜΑΘΗΜΑ 4. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας. Λογισµικό Αναζήτησης & Ανάκτησης Πληροφοριών

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη

HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems. Μοντέλα Ανάκτησης Ι

Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Πληροφορικής. Ακαδηµαϊκό Έτος

Εύρεση & Διαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Διδάσκων Δημήτριος Κατσαρός

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 1 ο Μάθημα: Εισαγωγή. Δρ. Κωνσταντίνος Χ. Γιωτόπουλος

0 The quick brown fox leaped over the lazy lazy dog 1 Quick brown foxes leaped over lazy dogs for fun

ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση

Στρατηγική έρευνας. Στρατηγική έρευνας. Η ερευνητική διαδικασία στη βιβλιοθήκη αρχίζει από τη στιγμή που χρειάζεται

ΜΥΕ003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαια 4, 5: Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση

Information Retrieval

ΒΙΒΛΙΟΘΗΚΗ Γ Κ Ο Υ Ν Τ Α Β Α Ε.

Τµήµα Πληροφορικής. Υλοποίηση LRU Cache ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ - ΕΡΓΑΣΙΑ 4. Φθινοπωρινό Εξάµηνο Διδάσκων: E. Μαρκάκης. Γενικά περί Caching

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc.

Βασικές Υπηρεσίες Διαδικτύου. Επικοινωνίες Δεδομένων Μάθημα 2 ο

Προτεινόμενες Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσματικότητας της Ανάκτησης & Μοντέλα Ανάκτησης)

ΑΚΗΕΙ ΓΙΑ ΣΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΙΙ (7)

Ανάκτηση Πληροφορίας

Εβδομαδιαίο Εκπαιδευτικό Πρόγραμμα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Αναζήτηση Πληροφοριών στο Διαδίκτυο

Transcript:

Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 1η: 20/02/2017 1

Ειζαγωγή ζηο μάθημα & Ειζαγωγή ζηην Ανάκηηζη Πληροθορίας 2

Διδακτικό βοήθημα 1 Καλύπηει ηο ανηικείμενο ηοσ μαθήμαηος με θέμα: Διαβάθμιζη με βάζη ηην ανάλσζη σπερζσνδέζμων (Link Analysis Ranking) Είναι ζηην ελληνική 1η έκδοζη (2010) Αναλσηικό, ασζηηρά θεμελιωμένο, αλλά καηανοηηό 3

Διδακτικό βοήθημα 2 Καλύπηει ηο ανηικείμενο ηοσ μαθήμαηος με θέμα: Διαβάθμιζη με βάζη ηο περιετόμενο (Ανηεζηραμμένο Εσρεηήριο Inverted index) Είναι ζηην ελληνική (ΔΩΡΕΑΝ ηο pdf ηης αγγλικής) 1η έκδοζη (2012) Αναλσηικό & καηανοηηό, διδακηικές αζκήζεις 4

Αγορά εργασίας (2016): Νέοι απόφοιτοι σε Google και Facebook (δεδομένα από Paysa) 5

Αγορά εργασίας (2016): Google και Yahoo! Software Engineers (δεδομένα από Paysa) Google 7% studied at Carnegie Mellon University 70% know Java 83% have a Bachelors degree 37% are Asian Yahoo 18% studied at University of Southern California 72% know Java 81% have a Bachelors degree 54% are Asian 6

Αγορά εργασίας (2016): Google και Yahoo! Search Engineers (δεδομένα από Paysa) Google 36% of Search Engineers studied at M.I.T. 78% Search Engineers know Distributed systems 85% Search Engineers have a Bachelors degree 54% of Search Engineers are white Yahoo 14% of Search Engineers studied at University of California Los Angeles 64% of Search Engineers know Scalability 69% of Search Engineers have a Bachelors degree 51% of Search Engineers are Asian 7

Εισαγωγικά 8

Αδόμητα (text) vs. Δομημένα (database) δεδομένα το 1996 160 140 120 100 80 60 Unstructured Structured 40 20 0 Data volume Market Cap 9

Αδόμητα (text) vs. Δομημένα (database) δεδομένα το 2006 160 140 120 100 80 60 Unstructured Structured 40 20 0 Data volume Market Cap 10

Μερίδιο αγοράς στην Αναζήτηση στο Web 11

Μέγεθος του index της Google (Φεβ. 17) (http://worldwidewebsize.com/) 12

Μέγεθος του index της Bing (Φεβ. 17) (http://worldwidewebsize.com/) 13

Αδόμητα δεδομένα το 1650 Ποια έργα του Shakespeare περιέχουν τις λέξεις Brutus AND Caesar αλλά NOT Calpurnia? Θα μπορούσαμε να κάνουμε grep όλα τα έργα του Shakespeare για τις λέξεις Brutus και Caesar, και κατόπιν να διώξουμε τις γραμμές που περιέχουν την λέξη Calpurnia? Αργή προσέγγιση (για μεγάλες συλλογές) Το NOT Calpurnia δεν είναι εύκολο στον χειρισμό Άλλες λειτουργίες (π.χ., εύρεση της λέξης Romans κοντά στην countrymen) δεν είναι εφικτές Διατεταγμένη ανάκτηση (ranked retrieval) (να επιστραφούν τα καλύτερα έγγραφα) Σε επόμενες διάλέξεις 14

Πίνακας Terms-Documents Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony 1 1 0 0 0 1 Brutus 1 1 0 1 0 0 Caesar 1 1 0 1 1 1 Calpurnia 0 1 0 0 0 0 Cleopatra 1 0 0 0 0 0 mercy 1 0 1 1 1 1 worser 1 0 1 1 1 0 Brutus AND Caesar but NOT Calpurnia 1 εάν το έπγο πεπιέχει την λέξη, 0 διαφοπετικά 15

Διανύσματα όρων Έτσι, έχουμε ένα διάνυσμα με 0/1 για κάθε όρο Για να απαντήσουμε σε ένα ερώτημα: παίρνουμε τα διανύσματα για τους όρους Brutus, Caesar και Calpurnia (συμπληρωματικά) bitwise AND 110100 AND 110111 AND 101111 = 100100 16

Απαντήσεις στο ερώτημα Antony and Cleopatra, Act III, Scene ii Agrippa [Aside to DOMITIUS ENOBARBUS]: Why, Enobarbus, When Antony found Julius Caesar dead, He cried almost to roaring; and he wept When at Philippi he found Brutus slain. Hamlet, Act III, Scene ii Lord Polonius: I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. 17

Πώς δουλεύει μια μηχανή αναζήτησης Για παράδειγμα η Google http://inf-server.inf.uth.gr/courses/ce634/noexternalweb/how_google_search_works.mp4 18