Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Σχετικά έγγραφα
Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Συστήματα Αυτομάτου Ελέγχου. Ενότητα Α: Γραμμικά Συστήματα

Εισαγωγή στα Πληροφοριακά Συστήματα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Πληροφορικής. Ακαδηµαϊκό Έτος

Αυτοματοποιημένη χαρτογραφία

TEC610 Δυναμικές Εφαρμογές Διαδικτύου (ΣΤ εξάμηνο)

Μαθησιακές δραστηριότητες με υπολογιστή

Ανάκτηση Πληροφορίας

Τεχνολογία Πολυμέσων. Ενότητα # 2: Εφαρμογές πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Εφαρμογές Συστημάτων Γεωγραφικών Πληροφοριών

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας

Βάσεις Περιβαλλοντικών Δεδομένων

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Διαχείριση Πολιτισμικών Δεδομένων

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Τεχνολογίες & Εφαρμογές Πληροφορικής Ενότητα 1: Εισαγωγικό Μάθημα

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Εισαγωγή στην Επιστήμη των Υπολογιστών

Οργανωσιακή Συμπεριφορά Ενότητα 1: Η έννοια της οργάνωσης και διοίκησης

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Βάσεις Δεδομένων. Ενότητα 1: Εισαγωγή στις Βάσεις δεδομένων. Πασχαλίδης Δημοσθένης Τμήμα Ιερατικών σπουδών

Ιστορία της μετάφρασης

Συστήματα Πληροφοριών Διοίκησης Ενότητα 1: Η έννοια των Πληροφοριακών Συστημάτων

Πληροφοριακά Συστήματα & Περιβάλλον Ασκήσεις

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

Πληροφορική. Εργαστηριακή Ενότητα 3 η : Επεξεργασία Κελιών Γραμμών & Στηλών. Ι. Ψαρομήλιγκος Τμήμα Λογιστικής & Χρηματοοικονομικής

Γνωστική Ψυχολογία 3

Αλληλεπίδραση Ανθρώπου- Υπολογιστή & Ευχρηστία

TEC410 Ανάπτυξη Δικτυακών Τόπων (Δ εξάμηνο) Διδάσκων: Ανδρέας Γιαννακουλόπουλος Επιστημονικός συνεργάτης Εργαστηρίου: Στέλλα Λάμπουρα

Εισαγωγή στην Πληροφορική

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Αναγωγή _ Εξαγωγή & Έλεγχος. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Εισαγωγή στη Δασική Πληροφορική

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 1: Ορισμοί βασικών εννοιών: Μια πρώτη μοντελοποίηση. Ευαγγελίδης Γεώργιος Τμήμα Εφαρμοσμένης Πληροφορικής

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Πληροφορική. Εργαστηριακή Ενότητα 6 η : Ταξινόμηση & Ομαδοποίηση Δεδομένων

Σχεδίαση με Ηλεκτρονικούς Υπολογιστές

Ενότητα. Εισαγωγή στις βάσεις δεδομένων

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

Ανάκτηση Πληροφορίας (Information Retrieval IR)

ΕΙΣΑΓΩΓΗ ΜΑΘΗΜΑΤΟΣ ΟΙΚΟΝΟΜΙΚΗ ΓΕΩΓΡΑΦΙΑ. Υπεύθυνη μαθήματος Αναστασία Στρατηγέα Αναπλ. Καθηγ. Ε.Μ.Π.

Ανάκτηση Πληροφορίας Εισαγωγή

Ανάκτηση πληροφορίας

Εισαγωγή στη Δασική Πληροφορική

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

ΧΩΡΟΤΑΞΙΑ ΕΙΣΑΓΩΓΗ ΜΑΘΗΜΑΤΟΣ. Αναστασία Στρατηγέα. Υπεύθυνη Μαθήματος

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Εισαγωγή στην Επιστήμη των Υπολογιστών

Νέες Τεχνολογίες και Καλλιτεχνική Δημιουργία

Συστήματα Πολυμέσων. Ενότητα 1: Εισαγωγικά Θέματα Πολυμέσων. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΜΑΘΗΜΑ: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Τεχνολογία Πολυμέσων. Ενότητα # 7: Θεωρία πληροφορίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Εισαγωγή στην Πληροφορική

Η ΣΥΝΕΧΙΖΟΜΕΝΗ ΕΚΠΑΙΔΕΥΣΗ ΣΤΙΣ ΧΩΡΕΣ-ΜΕΛΗ ΤΗΣ Ε.Ε: ΘΕΣΜΟΙ ΚΑΙ ΠΡΑΚΤΙΚΕΣ

Ενότητα. Εισαγωγή στη Microsoft Access

Βιομηχανικοί Ελεγκτές

Βάσεις Περιβαλλοντικών Δεδομένων

Εφαρμογές Συστημάτων Γεωγραφικών Πληροφοριών

Εισαγωγή στα πολυμέσα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΨΥΧΟΠΑΙΔΑΓΩΓΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΜΕΘΟΔΟΛΟΓΙΑ

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Μοντελοποίηση Λογικών Κυκλωμάτων

Λογιστικές Εφαρμογές Εργαστήριο

Οργανωσιακή Συμπεριφορά Ενότητα 7: Κοινωνικοποίηση και διοίκηση της οργάνωσης

Ψηφιακή Σχεδίαση. Ενότητα: ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ No:05. Δρ. Μηνάς Δασυγένης. Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Υδραυλικά & Πνευματικά ΣΑΕ

Οικονομετρία. Πολλαπλή Παλινδρόμηση. Στατιστικός έλεγχος γραμμικού συνδυασμού συντελεστών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

Φωνολογική Ανάπτυξη και Διαταραχές

Προγραμματισμός Ηλεκτρονικών Υπολογιστών 1

ΜΑΘΗΜΑ: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Εισαγωγή στους Αλγορίθμους

Εφαρμογές Συστημάτων Γεωγραφικών Πληροφοριών

Αλληλεπίδραση Ανθρώπου- Υπολογιστή & Ευχρηστία

Θεωρίες Μάθησης και Εκπαιδευτικό Λογισμικό

Διαδικαστικός Προγραμματισμός

Ηλεκτρονικοί Υπολογιστές I

Εισαγωγή στα Πληροφοριακά Συστήματα

Βάσεις Δεδομένων Ενότητα 1

Διδακτική της Περιβαλλοντικής Εκπαίδευσης

Διαδικτυακές Εφαρμογές Ενότητα 7: Προσπέλαση ΒΔ με το JDBC

Εισαγωγή στην Επιστήμη των Υπολογιστών

Διαφωτισμός και διαμόρφωση των πολιτικών ιδεολογιών στην Ελλάδα

Θεωρία Πιθανοτήτων & Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Ψυχολογία Κινήτρων. Η ΘΕΩΡΙΑ ΤΟΥ ΚΙΝΗΤΡΟΥ ΕΠΙΤΕΥΞΗΣ Διδάσκουσα: Επίκ. Καθ. Γεωργία Α.

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

Εισαγωγή στους Αλγορίθμους

Διάλεξη #10. Διδάσκων: Φοίβος Μυλωνάς. Γραφικά με υπολογιστές. Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Χειμερινό εξάμηνο.

Εφαρμογή Υπολογιστικών Τεχνικών στην Γεωργία

Μάθηση σε νέα τεχνολογικά περιβάλλοντα

Μαθησιακές δραστηριότητες με υπολογιστή

Εισαγωγή στους Αλγορίθμους

Διοίκηση Εξωτερικής Εμπορικής Δραστηριότητας

Transcript:

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα Ιονίου Πανεπιστημίου» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 2

Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 3

Διαδικαστικά 1/5 Πρόγραμμα: Τρίτη, 3-5, Αίθουσα 2 Τετάρτη, 5-7, Αίθουσα 2 Ώρες γραφείου: Τετάρτη, 10-12, Ανάκτορα Web-site μαθήματος: http://di.ionio.gr/el/undergraduate- studies/undergraduate-modules/semester-6/67- information-retrieval.html http://e-class.ionio.gr/courses/dcs183/ 4

Διαδικαστικά 2/5 Τρόπος εξέτασης: Ο τελικός βαθμός κάθε φοιτητή προκύπτει από γραπτή εξέταση στο θεωρητικό κομμάτι του μαθήματος (παραδόσεις, διαφάνειες, σημειώσεις και βιβλίο). Προαιρετικές εργασίες bonus αυστηρά ατομικές! ο βαθμός τους προσδίδει 20%-30% (ανάλογα το θέμα) στον τελικό βαθμό Η επίτευξη της βάσης (5/10) στις γραπτές εξετάσεις είναι προαπαιτούμενο για να προσμετρηθεί η εργασία. 5

Ύλη/Συγγράμματα 3/5 Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze Introduction to Information Retrieval, Cambridge University Press, 2008 Baeza-Yates and Ribeiro-Neto Μodern Information Retrieval, Addision Wesley, 1999 6

Ύλη/Συγγράμματα 4/5 Βαζιργιάννης Μ., Χαλκίδη Μ. Εξόρυξη γνώσης από βάσεις δεδομένων και τον παγκόσμιο ιστό, Εκδόσεις Τυπωθήτω, 2005 Van Rijsbergen, C. J. Information Retrieval, Butterworths, 1979 7

Στόχοι 5/5 Στόχοι μαθήματος: Κατανόηση βασικών γενικών αρχών ανάκτησης πληροφορίας. Εξοικείωση με προχωρημένες έννοιες και αρχές της ανάκτησης πληροφορίας. Εξοικείωση με συστήματα ανάκτησης πληροφορίας. 8

Σήμερα και αύριο Ποια είναι τα κίνητρά μας??? Did You Know (2014) How will be the world in 2020? 9

Information overload 1/5 10

Information overload 2/5 11

Information overload 3/5 12

Information overload 4/5 13

Information overload 5/5 14

Σήμερα και αύριο Ποια είναι τα κίνητρά μας?? 1. Information overload!!! 2. Ψηφιακό πολυμεσικό περιεχόμενο Στις μέρες μας αποτελεί πολύτιμο περιουσιακό στοιχείο! Συνδέεται με μια ποικιλία αναδυόμενων και νέων πολυμεσικών υπηρεσιών ψυχαγωγίας για κινητά (3G, wi-fi, ) ενημέρωσης & πληροφόρησης edutainment 15

Τι είναι η «Ανάκτηση Πληροφορίας» Η Ανάκτηση Πληροφορίας μελετά προβλήματα που σχετίζονται με την αναπαράσταση (representation) αποθήκευση (storage) οργάνωση (organization) προσπέλαση (access) σε αντικείμενα πληροφορίας κείμενα, εικόνες, ήχοι, web pages, κ.λ.π. 16

Ορισμοί της Ανάκτησης Πληροφορίας Salton (1989): Τα συστήματα ανάκτησης πληροφορίας επεξεργάζονται αρχεία εγγραφών και αιτήσεις πληροφόρησης, και αναγνωρίζουν και ανακτούν από τα αρχεία συγκεκριμένες εγγραφές ως αποτέλεσμα των αιτήσεων πληροφόρησης. Η ανάκτηση συγκεκριμένων εγγραφών εξαρτάται από την ομοιότητα μεταξύ των εγγραφών και των ερωτημάτων, η οποία μετριέται συγκρίνοντας τις τιμές συγκεκριμένων χαρακτηριστικών των εγγραφών και των ερωτημάτων. Kowalski (1997): Ένα σύστημα ανάκτησης πληροφορίας είναι ένα σύστημα ικανό να αποθηκεύει, να ανακτά, και να συντηρεί πληροφορία. H πληροφορία μπορεί να αποτελείται από κείμενο, εικόνες, ήχους, βίντεο και άλλα πολυμεσικά αντικείμενα. 17

Πληροφοριακή Ανάγκη του Χρήστη «Να βρεθούν οι σελίδες όλων των πανεπιστημιακών τμημάτων στην Ελλάδα που διδάσκεται η Ανάκτηση Πληροφορίας. Στη σελίδα του κάθε τμήματος να αναφέρονται στοιχεία επικοινωνίας» «Να βρεθούν σελίδες σχετικές με ποδόσφαιρο» Στα συστήματα ανάκτησης πληροφορίας η πληροφοριακή ανάγκη του χρήστη μετατρέπεται σε ένα ερώτημα (query). 18

Ανάκτηση Πληροφορίας και όχι Δεδομένων Ανάκτηση δεδομένων (data retrieval) Καλά ορισμένη ερώτηση. Βρίσκονται αντικείμενα που ταιριάζουν απόλυτα με την ερώτηση. Ένα μόνο λάθος συνιστά καθολική αποτυχία. Ανάκτηση πληροφορίας (information retrieval) Η ερώτηση είναι ασαφής (fuzzy). Η σημασιολογία (semantics) είναι συχνά ελλιπής. Μερικά λάθη είναι ανεκτά. 19

Συστήματα Ανάκτησης Πληροφορίας (IR) Προσπαθούν να βρουν όλα τα αντικείμενα πληροφορίας που σχετίζονται με την ερώτηση του χρήστη. Προσπαθούν να μην ανακτήσουν κανένα αντικείμενο πληροφορίας που δεν σχετίζεται με την ερώτηση του χρήστη. Τα αποτελέσματα ταξινομούνται ανάλογα με το ποσοστό συσχέτισης (relevance). 20

Τυπική Περίπτωση Συστήματος IR Δεδομένα: Ένα σύνολο κειμένων σε φυσική γλώσσα. Μία ερώτηση του χρήστη με τη μορφή ακολουθίας όρων. Στόχος: Ένα σύνολο κειμένων, τα οποία: σχετίζονται με την ερώτηση βρίσκονται σε κατάταξη (ranked), ανάλογα με το βαθμό συσχέτισής τους με την ερώτηση. 21

Αρχιτεκτονική Συστήματος IR 22

Σύστημα Αναζήτησης στο Web 23

Σχετικότητα (relevance) Η σχετικότητα ενός κειμένου με την ερώτηση είναι υποκειμενική και μπορεί να απαιτεί από το κείμενο: Να είναι πάνω σε ένα συγκεκριμένο θέμα. Να είναι σύγχρονο (πρόσφατη πληροφορία). Να είναι αυθεντικό (από αξιόπιστη πηγή). Να ικανοποιεί τους στόχους του χρήστη και της χρήσης της πληροφορίας. Κύριο κριτήριο σχετικότητας: Ένα σύστημα IR πρέπει να ικανοποιεί την πληροφοριακή ανάγκη του χρήστη. 24

Παραδείγματα Συστημάτων IR Συμβατικά (κατάλογοι βιβλιοθηκών) Αναζήτηση μέσω λέξεων-κλειδιών, τίτλου συγγραφέα, κτλ. Βάσει-κειμένου (Lexis-Nexis, Google, FAST) Αναζήτηση μέσω όρων. Περιορισμένη αναζήτηση με ερωτήσεις σε φυσική γλώσσα Πολυμέσα (QBIC, WebSeek, SaFe) Αναζήτηση μέσω οπτικών χαρακτηριστικών (σχήμα, χρώμα, ) 25

Παραδείγματα Συστημάτων IR Συστήματα απάντησης ερωτήσεων (AskJeeves, Answerbus) Αναζήτηση μέσω (περιορισμένης) φυσικής γλώσσας Άλλα: Δια-γλωσσική ανάκτηση πληροφορίας Ανάκτηση μουσικής πληροφορίας 26

27

Συστήματα IR στο World Wide Web Αναζήτηση ιστοσελίδων http://www.google.com Αναζήτηση εικόνων http://images.google.com http://viral.image.ntua.gr Αναζήτηση περιεχομένου εικόνων http://wang.ist.psu.edu/image/ http://viral.image.ntua.gr Αναζήτηση απαντήσεων σε ερωτήσεις http://www.askjeeves.com 28

Ερευνητικά θέματα σχετικά με IR Αυτόματη κατηγοριοποίηση κειμένων (document categorization) Φιλτράρισμα πληροφορίας (π.χ. spam filtering) Δρομολόγηση πληροφορίας (information routing) Αυτόματη ομαδοποίηση κειμένων (document clustering) Εξαγωγή πληροφορίας (information extraction) 29

Ερωτήσεις - Απορίες 30