Εισαγωγή. CS 463: Information Retrieval Systems. Yannis Tzitzikas. University of Crete. Spring 05. Lecture : 1 Date :

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Εισαγωγή. CS 463: Information Retrieval Systems. Yannis Tzitzikas. University of Crete. Spring 05. Lecture : 1 Date : 22-2-2005"

Transcript

1 CS 463: Information Systems Εισαγωγή Yannis Tzitzikas University of Crete Spring 05 Lecture : 1 Date : ιάρθρωση ιάλεξης Γιατί χρειαζόµαστε Ανάκτηση Πληροφοριών (ΑΠ); ΤιείναιηΑΠ? Πλοήγηση και Ανάκτηση Μοντέλα Πλοήγησης Το βασικό πρόβληµα ΑΠ Ανάκτηση εδοµένων και Ανάκτηση Πληροφοριών Συνάφεια Η βασική προσέγγιση & αρχιτεκτονική ενός ΣΑΠ ΑΠ στον Παγκόσµιο Ιστό Άλλες λειτουργίες ΑΠ Ιστορική Αναδροµή Σχετικές Περιοχές 2 1

2 ΓιατίχρειαζόµαστεΑΠ? Για να μπορούμε να βρίσκουμε βρίσκουμε ψύλλους στ άχυρα Πόσο εύχρηστος θα ήταν ο Ιστός χωρίς μηχανές αναζήτησης; Ο Ιστός περιέχει δισεκατομμύρια σελίδες (Google indexes 4.2 billions) Ο κόσμος παράγει περίπου 2 exabytes (2 60 ) νέας πληροφορίας το χρόνο, 90% της οποίας είναι σε ψηφιακή μορφή και με 50% ετήσια αύξηση 3 Το πρόβληµα δεν είναι νέο "There is a growing mountain of research... The investigator is staggered by the findings and conclusions of thousands of other workers - conclusions which he cannot find time to grasp, much less remember. The summation of human experience is being expanded at a prodigious rate and the means we use for threading through the consequent maze to the momentarily important item is the same that was used in the days of the square rigged ships." V. Bush

3 ΤιναείναιηΑΠ? grep 5 ΤιναείναιηΑΠ; Μήπως οι µηχανές αναζήτησης όπως το Google, Lycos? Αρκετά αποτελεσµατικές (σε µερικά πράγµατα) Αναγνωρίσιµες και γνωστές Εµπορικά επιτυχηµένες (τουλάχιστον µερικές) Τισυµβαίνειόµωςπίσωαπότησκηνή ; Πως δουλεύουν? Πως µπορούµε να κρίνουµε αν δουλεύουν καλά; Πως µπορούµε να τις κάνουµε πιο αποτελεσµατικές; Πως µπορούµε να τις κάνουµε να λειτουργούν πιο γρήγορα; Υπάρχει τίποτα παραπάνω από αυτό που βλέπουµε στον Ιστό; 6 3

4 vs Browsing Query string Information need Browsing εν έχουµε επερώτηση µεσκοπόήχωρίςσκοπό (εξερεύνηση) 7 Types of Browsing (1) Επίπεδο (flat) πχ. µια λίστα εγγράφων (2) Οδηγούµενο από δοµή (structure guided) Υπάρχει δοµή (συνήθως ιεραρχική) Παραδείγµατα η οργάνωση αρχείων σε φακέλους το ευρετήριο του Yahoo! ή του ODP οµή µπορεί να υπάρχει και στο επίπεδο των εγγράφων πχ abstract, section 1,, αναφορές) 8 4

5 Παράδειγµα Hotels bysports bylocation SeaSports WinterSports Islands Mainland Islands Mainland Mainland Crete Pilio Olympus Crete Pilio Pilio Olympus SeaSports SeaSports WinterSports WinterSports 9 Types of Browsing (II) (3) Μη γραµµικό κείµενο (Hypertext) διευθυνόµενοι σύνδεσµοι (π.χ. HTML) διπλής κατεύθυνσης typed links, etc. (4) ιεπίπεδο µη γραµµικό κείµενο Τα έγγραφα ταξινοµούνται σε ένα εννοιολογικό σχήµα και από αυτήν την ταξινόµηση επάγονται οι συνδέσεις τους πχ DOMENICUS [Tzitzikas & Theodorakis, Hypertext 96] 10 5

6 Το σύστηµα οµήνικος Λειτουργίες Subject catalog Alphabetic lists Guided tours Query cards Schema-based generation of hyperlinks Semantic network Hypermedia structures run-time 11 οµήνικος: Αυτόµατη Παραγωγή Υπερκειµένου από Βάση Γνώσης Curators Painting title: The Musicians. OilPainting created by Caravaggio on 1595, belonging to the style of Baroque. The upper left part of the painting represents a Self-Portrait. Children This OilPainting has the title The Musicians and has been created by Caravaggio 12 6

7 οµήνικος Πλεονεκτήµατα διεπίπεδου hypertext Αυτόµατο διασύνδεση βάσει περιεχοµένου υνατότητα πολλαπλών παρουσιάσεων Συνέπεια, ακεραιότητα δεδοµένων και συνδέσµων Ισχυρή γλώσσα επερώτησης Εύκολη και γρήγορη εισαγωγή και ενηµέρωση στοιχείων 13 εδοµένα Το τυπικό πρόβληµα της Ανάκτησης Πλ. Μια συλλογή από έγγραφα µε κείµενο φυσικής γλώσσας D={d1,,dn} Μιαεπερώτηση qενόςχρήστησεµορφήσυµβολοσειράς (string) Ζητούµενο Ένα διατεταγµένο σύνολο από έγγραφα που είναι συναφή µε την επερώτηση <d5,d2,d7,d9> Query String IR System Document corpus 1. Doc5 2. Doc2 3. Doc7 4 Doc9 Ranked Relevant documents 14 7

8 User Information Need Παράδειγµα Find all docs containing information on college tennis teams which: (1) are maintained by a USA university and (2) participate in the NCAA tournament. Έµφαση στην ανάκτηση πληροφορίας (όχι δεδοµένων) 15 Data vs Information Ανάκτηση εδοµένων ποια έγγραφα περιέχουν αυτές τις λέξεις ; Καλά ορισµένη σηµασιολογία (δεδοµένων και επερωτήσεων) ένα λάθος αντικείµενο ισοδυναµεί µε αποτυχία ορθότητα (soundness), πληρότητα (completeness) Ανάκτηση Πληροφορίας βρες πληροφορίες σχετικές µε αυτό το θέµα η σηµασιολογία είναι αρκετά χαλαρή ανοχή σε µικρά σφάλµατα Σύστηµα Ανάκτησης Πληροφορίας (ΣΑΠ) : προσπαθεί να ερµηνεύσει το περιεχόµενο των εγγράφων και επερωτήσεων παραγάγει διάταξη των εγγράφων βάσει της συνάφειας η ένοια της συνάφειας είναι κυρίαρχο ζήτηµα 16 8

9 Συνάφεια (Relevance) εν υπάρχει τυπικός ορισµός της συνάφειας! Η συνάφεια είναι σε µεγάλο βαθµό υποκειµενική. Συναφές έγγραφο µπορεί να σηµαίνει: στο σωστό θέµα επίκαιρο (timely) έγκυρο (από αξιόπιστη πηγή). Ικανό να ικανοποιήσει τους σκοπούς του χρήστη (τη επιθυµητή χρήση της αναζητούµενηςπληροφορίας) (information need) Η βασική προσέγγιση ΑΠ Οι πιο επιτυχηµένες προσεγγίσεις είναι οι στατιστικές Γιατί όχι επεξεργασία φυσικής γλώσσας; Χειρονακτικά προσδιορισµένες επικεφαλίδες (headings) e.g. Library of Congress headings, Dewey Decimal headings η χειρονακτική ευρετηρίαση είναι ακριβή η χειρονακτική ευρετηρίαση απαιτεί συµφωνία (human agreement) 18 9

10 Πλήρες κείµενο => Όρους ευρετηρίου Docs Accents spacing stopwords Noun groups stemming Manual indexing structure structure Full text Index terms 19 Τα βασικά τµήµατα ενός ΣΑΠ Λειτουργίες Κειµένου (Text Operations) σχηµατίζουν τις λέξεις ευρετηρίου (tokens, index terms). Αφαίρεση λέξεων αποκλεισµού (Stopword removal), Stemming Ευρετηρίαση (Indexing) κατασκευάζειέναευρετήριο (inverted index) µε δείκτες από τις λέξεις προς τα έγγραφα Αναζήτηση (Searching) ανακτά τα έγγραφα που περιέχουν µια λέξη (της επερώτησης) από το inverted index. Κατάταξη (Ranking) διαβαθµίζει όλα τα ανακτηµένα αρχεία µε βάσει µια µετρική συνάφειας. ιεπαφή (User Interface) διευθύνει την αλληλεπίδραση µε το χρήστη Λειτουργίες επερώτησης (Query Operations) µετασχηµατίζουν την επερώτηση για βελτίωση της ανάκτησης: Επέκταση επερώτησης χρησιµοποιώντας έναν θησαυρό Μετασχηµατισµός επερώτησης µε ανάδραση συνάφειας 20 10

11 Η Αρχιτεκτονική ενός ΣΑΠ user need User Interface Text Operations Text Text user feedback query retrieved docs ranked docs Query Operations Searching Ranking logical view logical view Indexing inverted file Index DB Manager Module Text Database 21 Αναζήτηση στον Ιστό (Web Search) Εφαρµογή της ΑΠ σε έγγραφα HTML του Ιστού ιαφορές: Πρέπει να συλλέξουµε τη συλλογή κειµένων διασχίζοντας (crawling/spidering) τονιστό Μπορούµε νααξιοποιήσουµετηςδοµήτηςπληροφορίαςστην HTML (XML). Τα έγγραφα τροποποιούνται (χωρίς προειδοποίηση) Μπορούµε να αξιοποιήσουµε τη δοµή των συνδέσµων του Ιστού

12 Σύστηµα Αναζήτησης Ιστού Web Spider Document corpus Query String IR System 1. Page1 2. Page2 3. Page3.. Ranked Documents 23 Άλλα Task σχετικά µε την ΑΠ Question answering (απάντησηερωτήσεων) Agents (filtering, routing) Recommender systems Automatic clustering (αυτόµατηοµαδοποίηση) Cross-language retrieval Data and information mining (εξόρυξηδεδοµένωνκαι πληροφοριών) Information integration (εννοποίηση πληροφορίας) Knowledge management (διαχείρισηγνώσης) Meta-search (multi-database searching) (µέτα-αναζήτηση) Summarization (αυτόµατηπερίληψη)

13 Ενδεικτικά Συστήµατα IR Systems Verity, Fulcrum, Excalibur, Eurospider Hummingbird, Documentum Inquery, Smart, Okapi, Lemur, Indri Web search and in-house systems West, LEXIS/NEXIS, Dialog Lycos, AltaVista, Excite, Yahoo, Google, Nothern Light, Teoma, HotBot, Direct Hit, Ask Jeeves elibrary, Inquira Ιστορική Αναδροµή s: Initial exploration of text retrieval systems for small corpora of scientific abstracts, and law and business documents. Development of the basic Boolean and vector-space models of retrieval. Prof. Salton and his students at Cornell University are the leading researchers in the area s: Large document database systems, many run by companies: Lexis-Nexis Dialog MEDLINE 26 13

14 Ιστορική Αναδροµή (II) 1990 s: Searching FTPable documents on the Internet Archie WAIS Searching the World Wide Web Lycos Yahoo Altavista Organized Competitions NIST TREC Recommender Systems Ringo Amazon NetPerceptions Automated Text Categorization & Clustering s Ιστορική Αναδροµή (III) Link analysis for Web Search Google Automated Information Extraction Whizbang Fetch Burning Glass Question Answering TREC Q/A track Multimedia IR Image, Video, Audio and music Cross-Language IR DARPA Tides Document Summarization ΠριντονΙστόηΑΠεθεωρείτοότιείχεστενό πεδίο εφαρµογής Μετά την επινόηση του Web αυτό άλλαξε για τα καλά: οικουµενική δεξαµενή γνώσης ελεύθερη (και φθηνή) καθολική πρόσβαση έλλειψη κεντρικού ελέγχου σύνταξης 28 14

15 «Ιστορική»Αναδροµή (IV) Στο µέλλον ΑΠκαι context (ησωστήαπάντησηγιασέναεδώκαιτώρα) Επεξεργασία φυσικής γλώσσας Ενοποίηση µε άλλες τεχνολογίες Κατανεµηµένη, ετερογενήαπ 29 Σχετικές Περιοχές Databases Artificial Intelligence Machine Learning Information Natural Language Processing Library & Information Science 30 15

16 Comparing IR to Databases Databases IR Data Structured Unstructured Fields Defined (e.g. age, price) No fields (other than text) Queries Defined (e.g. SQL) Free text (natural language), Boolean Matching Exact (results are always «correct») Imprecise (need to measure effectiveness) 31 Τεχνητή Νοηµοσύνη (Artificial Intelligence) Παραδοσιακά εστιάζει στην παράσταση γνώσης (knolwedge representation) και τον συλλογισµό (reasoning). Φορµαλισµοί για παράσταση γνώσης και επερωτήσεων: First-order Predicate Logic Bayesian Networks Ηπρόσφατηδουλειάσε web ontologiesκαι intelligent information agents την φέρνει πιο κοντά στην ΑΠ 32 16

17 Μηχανική Μάθηση (Machine Learning) Εστιάζει στην ανάπτυξη υπολογιστικών συστηµάτων που βελτιώνουν τις επιδόσεις τους µε το χρόνο (αξιοποιώντας πρωθύστερη εµπειρία) Επιτηρούµενη Μάθηση (Supervised learning) Αυτόµατηταξινόµησηπαραδειγµάτωνβάσειµάθησηςαπό labeled training examples Μη-Επιτηρούµενη Μάθηση (Unsupervised learning) Αυτόµατηοµαδοποίηση unlabeled examples σεσηµαντικέςοµάδες (into meaningful groups). 33 ΜηχανικήΜάθηση:IR Directions Ταξινόµηση Κειµένου (Text Categorization) Αυτόµατη ιεραρχική ταξινόµηση (hierarchical classification, e.g.yahoo). Προσαρµόσιµο φιλτράρισµα/routing/σύσταση(recommending). Αυτόµατο φιλτράρισµα spam. Οµαδοποίηση Κειµένων (Text Clustering) Οµαδοποίηση των αποτελεσµάτων της αναζήτησης Αυτόµατος σχηµατισµός ιεραρχιών (Yahoo). Learning for Information Extraction Text Mining 34 17

18 Επεξεργασία Φυσικής Γλώσσας Natural Language Processing Παραδοσιακά εστιάζει την συντακτική (syntactic), σηµασιολογική (semantic) και pragmatic ανάλυση της φυσικής γλώσσας και οµιλίας Η ανάλυση του συντακτικού (δοµή φράσεων) και της σηµασιολογίας θα µπορούσε να επιτρέψει την ανάκτηση µέσω νοήµατος, αντί λέξεων. 35 Επεξεργασία Φυσικής Γλώσσας (ΙΙ) IR Directions: Μέθοδοι για αποσαφήνιση του νοήµατος των διφορούµενων λέξεων βάσει τωνσυµφραζοµένων (word sense disambiguation). Μέθοδοι αναγνώρισης συγκεκριµένων τµηµάτων πληροφορίας σε ένα έγγραφο (information extraction). Μέθοδοι απάντησης επερωτήσεων φυσικής γλώσσας από συλλογές κειµένου 36 18

19 Library and Information Science Focused on the human user aspects of information retrieval (human-computer interaction, user interface, visualization). Concerned with effective categorization of human knowledge. Concerned with citation analysis and bibliometrics (structure of information). Recent work on digital libraries brings it closer to CS & IR

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης

ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης ΕΠΛ660 Ανάκτηση Πληροφοριών και Μηχανές Αναζήτησης Introduction and Boolean Retrieval Διαδικαστικά Μεταπτυχιακό μάθημα Πληροφορικής Το μάθημα απευθύνεται επίσης σε: προπτυχιακούς φοιτητές (τελειόφοιτους)

Διαβάστε περισσότερα

Θοδωρής Πιτικάρης, Ιωάννης Τσαγκατάκης, Μιχάλης Νικητάκης, Γιώργος Παπαδουράκης Α. Τ. Ε. Ι ΚΡΗΤΗΣ

Θοδωρής Πιτικάρης, Ιωάννης Τσαγκατάκης, Μιχάλης Νικητάκης, Γιώργος Παπαδουράκης Α. Τ. Ε. Ι ΚΡΗΤΗΣ 11ο ΠΑΝΕΛΛΗΝΙΟ ΣΥΝΕΔΡΙΟ ΑΚΑΔΗΜΑΪΚΩΝ ΒΙΒΛΙΟΘΗΚΩΝ Θοδωρής Πιτικάρης, Ιωάννης Τσαγκατάκης, Μιχάλης Νικητάκης, Γιώργος Παπαδουράκης Α. Τ. Ε. Ι ΚΡΗΤΗΣ Theodoris Pitikaris, John Tsagatakis, Michael Nikitakis,

Διαβάστε περισσότερα

Θα μιλήσουμε για ΜΟΝΤΕΛΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. Διαφάνειες του καθ. Γιάννη Τζίτζικα (Παν. Κρήτης) http://www.ics.forth.

Θα μιλήσουμε για ΜΟΝΤΕΛΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. Διαφάνειες του καθ. Γιάννη Τζίτζικα (Παν. Κρήτης) http://www.ics.forth. Θα μιλήσουμε για ΜΟΝΤΕΛΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Διαφάνειες του καθ. Γιάννη Τζίτζικα (Παν. Κρήτης) http://www.ics.forth.gr/~tzitzik/ Γιατοπιθανοτικότουκαθ. Απ. Παπαδόπουλου (Αριστοτέλειο Παν.) Κεφάλαιο 2

Διαβάστε περισσότερα

Ομαδοποίηση Εγγράφων (Document Clustering)

Ομαδοποίηση Εγγράφων (Document Clustering) Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Ομαδοποίηση Εγγράφων (Document Clustering) Γιάννης Τζίτζικας ιάλεξη

Διαβάστε περισσότερα

Εθνικό Μετσόβιο Πολυτεχνείο. Εξαγωγή σχέσεων μεταξύ οντοτήτων από το αρχείο της εφημερίδας «ΤΑ ΝΕΑ» με χρήση τεχνικών μη-επιβλεπόμενης μάθησης

Εθνικό Μετσόβιο Πολυτεχνείο. Εξαγωγή σχέσεων μεταξύ οντοτήτων από το αρχείο της εφημερίδας «ΤΑ ΝΕΑ» με χρήση τεχνικών μη-επιβλεπόμενης μάθησης Εθνικό Μετσόβιο Πολυτεχνείο Σχολη Ηλεκτρολογων Μηχανικων και Μηχανικων Υπολογιστων Τομεας Τεχνολογιας Πληροφορικης και Υπολογιστων Εξαγωγή σχέσεων μεταξύ οντοτήτων από το αρχείο της εφημερίδας «ΤΑ ΝΕΑ»

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Πρακτική Εφαρµογή των Οντολογιών ως Εργαλεία Αναπαράστασης και ιαχείρισης Γνώσης στην

Διαβάστε περισσότερα

ΜΕΘΟ ΟΙ ΟΜΑ ΟΠΟΙΗΣΗΣ ΚΕΙΜΕΝΩΝ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙ ΙΚΕΥΣΗΣ. Υποβλήθηκε στην

ΜΕΘΟ ΟΙ ΟΜΑ ΟΠΟΙΗΣΗΣ ΚΕΙΜΕΝΩΝ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙ ΙΚΕΥΣΗΣ. Υποβλήθηκε στην i ΜΕΘΟ ΟΙ ΟΜΑ ΟΠΟΙΗΣΗΣ ΚΕΙΜΕΝΩΝ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙ ΙΚΕΥΣΗΣ Υποβλήθηκε στην ορισθείσα από την Γενική Συνέλευση Ειδικής Σύνθεσης του Τµήµατος Πληροφορικής Εξεταστική Επιτροπή από τον ΑΡΓΥΡΗ ΚΑΛΟΓΕΡΑΤΟ

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Αυτόµατη Θεµατική Κατηγοριοποίηση και Σηµασιολογική ιεύρυνση Ερωτηµάτων

Διαβάστε περισσότερα

meta-seeker: Αλγόριθμος ανατροφοδότησης εξατομικευμένης πληροφορίας από πολλαπλές Διαδικτυακές υπηρεσίες αναζήτησης

meta-seeker: Αλγόριθμος ανατροφοδότησης εξατομικευμένης πληροφορίας από πολλαπλές Διαδικτυακές υπηρεσίες αναζήτησης meta-seeker: Αλγόριθμος ανατροφοδότησης εξατομικευμένης πληροφορίας από πολλαπλές Διαδικτυακές υπηρεσίες αναζήτησης Η Διπλωματική Εργασία παρουσιάστηκε ενώπιον του Διδακτικού Προσωπικού του Πανεπιστημίου

Διαβάστε περισσότερα

Information Retrieval

Information Retrieval Introduction to Information Retrieval ΠΛΕ70: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά Διάλεξη 1: Εισαγωγή. Ανάκτηση Boole Κεφ. 1.1 Τι είναι η «Ανάκτηση Πληροφορίας»; Ανάγκη πληροφόρησης Βάση

Διαβάστε περισσότερα

Γενικές Έννοιες Ψηφιακών Αντικειµένων

Γενικές Έννοιες Ψηφιακών Αντικειµένων Επισκόπηση Θεµάτων Γενικές Έννοιες Ψηφιακών Αντικειµένων Ψηφιακή αποθήκευση και αναπαράσταση Ψηφιακά αντίγραφα Αναλυτική ή δοµική αναπαράσταση Ψηφιακό περιεχόµενο Τεκµήριο πόρος αντικείµενο Περιεχόµενο

Διαβάστε περισσότερα

Ανάκτηση Κειμένου (εισαγωγικά θέματα)

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Ανάκτηση Κειμένου και από τον Παγκόσμιο Ιστό Ανάκτηση Κειμένου (εισαγωγικά θέματα) Δεδομένων: Ακ. Έτος 2006-2007 ΓΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2 Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Βάσεις Κειμένων (document

Διαβάστε περισσότερα

Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ

Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2008 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Parallel and Distributed IR Παράλληλη και Κατανεμημένη ΑΠ Γιάννης

Διαβάστε περισσότερα

Π Α Ν Ε Π Ι Σ Τ Η Μ Ι Ο Π ΑΤ Ρ Ω Ν

Π Α Ν Ε Π Ι Σ Τ Η Μ Ι Ο Π ΑΤ Ρ Ω Ν Π Α Ν Ε Π Ι Σ Τ Η Μ Ι Ο Π ΑΤ Ρ Ω Ν ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Εφαρμογή εξόρυξης δεδομένων από τον παγκόσμιο ιστό και μοντελοποίησή του

Διαβάστε περισσότερα

Διδακτορική Διατριβή. Τεχνικές και Συστήματα Διαχείρισης Γνώσης στο Διαδίκτυο

Διδακτορική Διατριβή. Τεχνικές και Συστήματα Διαχείρισης Γνώσης στο Διαδίκτυο ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ Διδακτορική Διατριβή Τεχνικές και Συστήματα Διαχείρισης Γνώσης στο Διαδίκτυο Πηνελόπη Θ. Μαρκέλλου Επιβλέπων

Διαβάστε περισσότερα

Πανεπιστηµιο Πατρων Πολυτεχνικη Σχολη

Πανεπιστηµιο Πατρων Πολυτεχνικη Σχολη Πανεπιστηµιο Πατρων Πολυτεχνικη Σχολη Τµήµα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής ιπλωµατική Εργασία στα Πλαίσια του Μ..Ε. «Επιστήµη και Τεχνολογία Υπολογιστών» Τεχνικές Επαναδιατύπωσης Ερωτηµάτων

Διαβάστε περισσότερα

ιαχείριση Πληροφορίας στο ιαδίκτυο

ιαχείριση Πληροφορίας στο ιαδίκτυο Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ «ηµόκριτος» ιαχείριση Πληροφορίας στο ιαδίκτυο Βαγγέλης Καρκαλέτσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισµικού http://www.iit.demokritos.gr/skel ΕΚΕΦΕ,

Διαβάστε περισσότερα

ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ

ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ ΜΗΧΑΝΙΣΜΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ, ΑΝΑΛΥΣΗΣ, ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗΣ, ΕΞΑΓΩΓΗΣ

Διαβάστε περισσότερα

Περιεχόμενα. Πίνακας συμβόλων σελίδα 10 Πρόλογος 13

Περιεχόμενα. Πίνακας συμβόλων σελίδα 10 Πρόλογος 13 Περιεχόμενα Πίνακας συμβόλων σελίδα 10 Πρόλογος 13 1 Ανάκτηση Boole 21 1.1 Παράδειγμα προβλήματος ανάκτησης πληροφοριών 23 1.2 Μια πρώτη ματιά στη δημιουργία αντεστραμμένων ευρετηρίων 27 1.3 Επεξεργασία

Διαβάστε περισσότερα

ΘΕΜΑ: ΤΕΧΝΟΛΟΓΙΕΣ ΜΗΧΑΝΩΝ ΑΝΑΖΗΤΗΣΗΣ ΚΑΙ ΟΙ ΕΦΑΡΜΟΓΕΣ ΤΟΥΣ ΣΤΙΣ ΤΡΕΧΟΥΣΕΣ WEB SEARCH ENGINES. ΕΠΟΠΤΗΣ ΚΑΘΗΓΗΤΗΣ: ΣΤΕΡΓΙΟΣ ΠΑΠΑΔΗΜΗΤΡΙΟΥ

ΘΕΜΑ: ΤΕΧΝΟΛΟΓΙΕΣ ΜΗΧΑΝΩΝ ΑΝΑΖΗΤΗΣΗΣ ΚΑΙ ΟΙ ΕΦΑΡΜΟΓΕΣ ΤΟΥΣ ΣΤΙΣ ΤΡΕΧΟΥΣΕΣ WEB SEARCH ENGINES. ΕΠΟΠΤΗΣ ΚΑΘΗΓΗΤΗΣ: ΣΤΕΡΓΙΟΣ ΠΑΠΑΔΗΜΗΤΡΙΟΥ ΤΕΙ ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ:ΔΙΑΧΕΙΡΙΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: ΤΕΧΝΟΛΟΓΙΕΣ ΜΗΧΑΝΩΝ ΑΝΑΖΗΤΗΣΗΣ ΚΑΙ ΟΙ ΕΦΑΡΜΟΓΕΣ ΤΟΥΣ ΣΤΙΣ ΤΡΕΧΟΥΣΕΣ WEB SEARCH ENGINES. ΕΠΟΠΤΗΣ ΚΑΘΗΓΗΤΗΣ: ΣΤΕΡΓΙΟΣ

Διαβάστε περισσότερα

ΕΡΓΑΣΙΑ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΜΑΘΗΜΑΤΟΣ «ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΘΕΜΑ: «ΑΝΑΖΗΤΗΣΗ ΚΑΙ ΑΝΑΚΤΗΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΔΙΑΦΟΡΕΣ ΠΗΓΕΣ» ΚΑΘΗΓΗΤΡΙΑ: Κ.

ΕΡΓΑΣΙΑ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΜΑΘΗΜΑΤΟΣ «ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΘΕΜΑ: «ΑΝΑΖΗΤΗΣΗ ΚΑΙ ΑΝΑΚΤΗΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΔΙΑΦΟΡΕΣ ΠΗΓΕΣ» ΚΑΘΗΓΗΤΡΙΑ: Κ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών στην Επιστήμη της Πληροφορίας Διοίκηση και Οργάνωση Βιβλιοθηκών με έμφαση στις Νέες Τεχνολογίες της Πληροφορίας ΕΡΓΑΣΙΑ

Διαβάστε περισσότερα

ΕΞΑΤΟΜΙΚΕΥΣΗ Ι ΑΣΚΑΛΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΗΝ ΑΝΩΤΑΤΗ ΕΚΠΑΙ ΕΥΣΗ

ΕΞΑΤΟΜΙΚΕΥΣΗ Ι ΑΣΚΑΛΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΗΝ ΑΝΩΤΑΤΗ ΕΚΠΑΙ ΕΥΣΗ 1 ΕΞΑΤΟΜΙΚΕΥΣΗ Ι ΑΣΚΑΛΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΗΝ ΑΝΩΤΑΤΗ ΕΚΠΑΙ ΕΥΣΗ Γεώργιος Γιαννακόπουλος 1, Αγγελική Γκουβούση 1, Πέτρος Μπέλσης 2, Γεώργιος Παλιούρας 3, Χρήστος Παπαθεοδώρου 4, Ασηµίνα Ρόδη 1, Χρήστος

Διαβάστε περισσότερα

ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΣΕ ΣΥΣΤΗΜΑΤΑ ΣΥΣΤΑΣΕΩΝ

ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΣΕ ΣΥΣΤΗΜΑΤΑ ΣΥΣΤΑΣΕΩΝ ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΣΕ ΣΥΣΤΗΜΑΤΑ ΣΥΣΤΑΣΕΩΝ ι δ α κ τ ο ρ ι κ ή ι α τ ρ ι β ή ΕΥΑΝΘΙΑ Κ. ΦΑΛΙΑΓΚΑ Επιβλέπων: ΚΑΘΗΓΗΤΗΣ ΑΘΑΝΑΣΙΟΣ Κ. ΤΣΑΚΑΛΙ ΗΣ Μάιος 2012 Π Α Ν Ε Π Ι Σ Τ Η Μ

Διαβάστε περισσότερα

Αξιοποίηση Οντολογιών για τη Μοντελοποίηση Γνωστικών Πεδίων στην εξ Αποστάσεως Εκπαίδευση

Αξιοποίηση Οντολογιών για τη Μοντελοποίηση Γνωστικών Πεδίων στην εξ Αποστάσεως Εκπαίδευση Αξιοποίηση Οντολογιών για τη Μοντελοποίηση Γνωστικών Πεδίων στην εξ Αποστάσεως Εκπαίδευση Using Ontologies for Modeling Knowledge Domains in Distance Learning Γεωργία Σολωμού, Αγγελική Κουνέλη, Dr. Αχιλλέας

Διαβάστε περισσότερα

Μέρος Γ Συστήματα Ομοτίμων (Peer to Peer Systems) και Ανάκτηση Πληροφοριών

Μέρος Γ Συστήματα Ομοτίμων (Peer to Peer Systems) και Ανάκτηση Πληροφοριών HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Μέρος Γ Συστήματα Ομοτίμων (Peer to Peer Systems) και Ανάκτηση Πληροφοριών CS463 - Information Retrieval Yannis Tzitzikas, U.

Διαβάστε περισσότερα

Κεφάλαιο 1. Εισαγωγή 1

Κεφάλαιο 1. Εισαγωγή 1 Κεφάλαιο 1. Εισαγωγή 1 1.1 Η ανάγκη για Ανάκτηση Πληροφορίας Η επιστήµη της Ανάκτησης Πληροφορίας (ΑΠ στο εξής), ασχολείται µε την αναπαράσταση, την αποθήκευση, την οργάνωση και την πρόσβαση σε πληροφοριακά

Διαβάστε περισσότερα

Ποιότητα και εκπαιδευτική αποτελεσµατικότητα µέσων ασύγχρονης εκπαίδευσης από απόσταση, βασισµένη σε µοντελοποίηση µε τυπική γλώσσα

Ποιότητα και εκπαιδευτική αποτελεσµατικότητα µέσων ασύγχρονης εκπαίδευσης από απόσταση, βασισµένη σε µοντελοποίηση µε τυπική γλώσσα ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Ποιότητα και εκπαιδευτική αποτελεσµατικότητα µέσων ασύγχρονης εκπαίδευσης από απόσταση, βασισµένη σε µοντελοποίηση µε τυπική γλώσσα ιδακτορική διατριβή Κυριάκος Πατριαρχέας

Διαβάστε περισσότερα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Μηλιαράκη Σπυριδούλα Α.Μ. 3990065. Επιβλέπων Καθηγητής : Ίων Ανδρουτσόπουλος

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Μηλιαράκη Σπυριδούλα Α.Μ. 3990065. Επιβλέπων Καθηγητής : Ίων Ανδρουτσόπουλος ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Χειρισµός Ερωτήσεων Ορισµού σε Συστήµατα Ερωταποκρίσεων Μηλιαράκη Σπυριδούλα Α.Μ. 3990065 Επιβλέπων Καθηγητής : Ίων Ανδρουτσόπουλος ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ, 2003

Διαβάστε περισσότερα

Ανοικτό Πανεπιστήμιο Κύπρου

Ανοικτό Πανεπιστήμιο Κύπρου Ανοικτό Πανεπιστήμιο Κύπρου Σχολή Θετικών και Εφαρμοσμένων Επιστημών Μεταπτυχιακή Διατριβή στα Πληροφοριακά και Επικοινωνιακά Συστήματα Υλοποίηση διαδικτυακής εφαρμογής που θα προσφέρει αξιολογήσεις σε

Διαβάστε περισσότερα

Καθιστώντας µια υπηρεσία θεµατικής πλοήγησης στο διαδίκτυο συµβατή µε τις τεχνολογίες των συνδεδεµένων δεδοµένων

Καθιστώντας µια υπηρεσία θεµατικής πλοήγησης στο διαδίκτυο συµβατή µε τις τεχνολογίες των συνδεδεµένων δεδοµένων Καθιστώντας µια υπηρεσία θεµατικής πλοήγησης στο διαδίκτυο συµβατή µε τις τεχνολογίες των συνδεδεµένων δεδοµένων Κωνσταντίνος Κυπριανός 1 και Ιωάννης Παπαδάκης 1 1 Ιόνιο Πανεπιστήµιο, Τµήµα Αρχειονοµίας

Διαβάστε περισσότερα