Εισαγωγή στην Ανάκτηση Πληροφορίας και στις Εφαρµογές της. Εισαγωγικά

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Εισαγωγή στην Ανάκτηση Πληροφορίας και στις Εφαρµογές της. Εισαγωγικά"

Transcript

1 Εισαγωγή στην Ανάκτηση Πληροφορίας και στις Εφαρµογές της Εισαγωγικά ΑΠ: αναπαράσταση, αποθήκευση, οργάνωση και προσπέλαση σε αντικείµενα πληροφορίας Επίκεντρο η πληροφοριακή ανάγκη του χρήστη Πληροφοριακή ανάγκη χρήστη: Εντόπισεόλατακείµενα µε πληροφορίες σχετικά µε φοιτητές που (1) φοιτούν σε κάποια σχολή πληροφορικής, (2) συµµετέχουν σε κάποιο αθλητικό σύλλογο Έµφαση δίνεται στην ανάκτηση πληροφορ ίας και όχι δεδοµ ένων

2 Εισαγωγικά Ανάκτηση εδοµένων Ποια κείµενα περιέχουν ένα σύνολο keywords? Καλά ορισµένη σηµασιολογία (semantics) Ελάχιστα λανθασµένηαπάντησησυνιστά αποτυχία! Ανάκτηση Πληροφορίας Το ερώτηµα είναι ασαφές Ησηµασιολογία είναι συχνά ελλιπής Μικρά λάθη είναι ανεκτά Σύστηµα ΑΠ: Ερµηνεύει περιεχόµενα αντικειµένων πληροφορίας Παράγει µία κατάταξη που αναπαριστά σχετικότητα Εισαγωγικά ΑΠ τα τελευταία 30 χρόνια: Ταξινόµηση (classification) και κατηγοριοποίηση (categorization) Κειµένων Συστήµατα Βιβλιοθήκης και γλώσσες ιεπαφή χρηστών και οπτικοποίηση Εντούτοις η περιοχή θεωρείτο στενού ενδιαφέροντος Με την έλευση του ιαδικτύου: Παγκόσµια αποθήκη γνώσης Ελεύθερη (χαµηλού κόστους) προσπέλαση Πολλά προβλήµατα : ΑΠ προσφέρει λύσεις

3 Πεδία Εφαρµογής Web Search Engines Ψηφιακές Βιβλιοθήκες (Digital Libraries) Ανάκτηση Στοιχείων σε Peer to Peer Περιβάλλοντα Web Services Βιοπληροφορική Συστήµατα Προσαρµοστικών Πολυµέσων/Υπερµέσων Γειτονικές Περιοχές Βάσεις εδοµένων Συστήµατα Πολυµέσων Τεχνητή Νοηµοσύνη /Επεξεργασία Φυσικής Γλώσσας Εξόρυξη εδοµένων (Data Mining) Τεχνικές Μοντελοποίησης οµές εδοµένων Συµπίεση Κειµένων Συµπίεση οµών εδοµένων

4 Ανάκτηση Πληροφορίας Τα τελευταία χρόνια ως επιστηµονικό πεδίο 1945: Vannenar Bush s As we may think 1960+: Gerald Salton 1978: Πρώτο ACM SIGIR συνέδριο 1992: Πρώτο TREC συνέδριο Unstructured (text) vs. structured (database) data in Unstructured Structured Data volume Market Cap

5 Unstructured (text) vs. structured (database) data in Unstructured Structured Data volume Market Cap Μέθοδοι Προσέγγισης Computer Centered View (Ανάκτηση Πληροφορίας) - Κτίσιµο δοµών δεικτοδότησης - Γρήγορη Επεξεργασία Ερωτηµάτων - Ποιοτικοί αλγόριθµοι κατάταξης Human Centered View (Βιβλιοθηκονοµία και Επιστήµη Πληροφορήσης) - Μελέτη βασικών αναγκών του χρήστη - Καταγραφή συµπεριφοράς χρήστη

6 Βασικές Έννοιες Η ιεργασία του Χρήστη Ανάκτηση Βάση εδοµένων Φυλλοµέτρηση Ανάκτηση (Retrieval) Φυλλοµέτρηση (Browsing) Συνδυασµός (Hidden web) Επεξεργασία Κειµένων Σε τι format είναι; pdf/word/excel/html? Σε τι γλώσσα είναι; Ποιο σύνολο χαρακτήρων χρησιµοποιεί; Τα κείµενα µπορεί να περιέχουν όρους από διαφορετικές λέξεις Τι είναι ένα µοναδιαίο κείµενο; ένα αρχείο; ένα ; ένα µε επισυνάψεις; oµάδα αρχείων;

7 Λογική Όψη Κειµένων κείµενο + δοµή Κείµενο Αναγνώριση οµής τόνοι, κενά κλπ. κείµενο κοινές λέξεις οµάδες ουσιαστικών αποµάκρυνση καταλήξεων αυτόµατη ή χειροκίνητη δεικτοδότηση δοµή πλήρες κείµενο όροι δεικτοδότησης Η αναπαράσταση των κειµένων (λογική όψη) µπορεί να πάρει διάφορες µορφές σε µία συνέχεια αναπαραστάσεων ιεργασία Ανάκτησης

8 Τυπικός Ορισµός Μοντέλων Α.Π. Ένα µοντέλο ανάκτησης πληροφορίας είναι η τετράδα [D, Q, F, R(q i, d j )] όπου: 1) - D είναι ένα σύνολο από λογικές αναπαραστάσεις για τα κείµενα της συλλογής 2) - Q είναι ένα σύνολο από λογικές αναπαραστάσεις για τις πληροφοριακές ανάγκες του χρήστη. Αυτές οι αναπαραστάσεις καλούνται ερωτήµατα 3) - F είναι ένα υπόβαθρο για την µοντελοποίηση της αναπαράστασης των κειµένων, των ερωτηµάτων και των σχέσεων µεταξύ τους - R(q i, d j ) είναι µια συνάρτηση κατάταξης, ηοποίασυνδέει έναν πραγµατικό αριθµό µε έναερώτηµα q i Q και µια αναπαράσταση κειµένου d j D. Μια τέτοια κατάταξη ορίζει µια διάταξη πάνω στα κείµενα πάντα µε βάσητοερώτηµα. q- i. Μοντέλα Α.Π. Συνολοθεωρητικό Κλασσικά Μοντέλα Ασαφές (Fuzzy) Επεκτεταµένο Boolean ιαδικασία Χρήστη Ανάκτηση: Ad-hoc Φιλτράρισµα Φυλλοµέτρηση Boolean Vector space Πιθανοτικό οµηµένα Μοντέλα Μη επικαλυπτόµενες λίστες Κοντινοί κόµβοι Αλγεβρικό Γενικευµένο Vector Space Λανθ. Σηµασ. εικτοδότηση Νευρωνικά ίκτυα Πιθανοτικό ίκτυα Εξαγ. Συµπεράσµατος ίκτυα Πεποίθησης Φυλλοµέτρηση Επίπεδη Καθοδηγούµενη από δοµή Υπερκειµένου

9 Ανεστραµµένα Αρχεία Inverted file : Structure for the efficient location of the occurrences of a term inside a text collection. Structure : Set of inverted lists, that are stored inside a file in a disk. Inverted list: a list that contains the occurrences of a term inside the texts of a collection Structure of an inverted list [3] <1,2> <2,1> <4,3> number of documents in the inverted list that contain the specific term pair <d,f d,t > : the term appears in the document 1, twice Depending on the requirements of the application an inverted list record can contain various kinds of information (e.g. number of the paragraph where the term appears etc.) 17 Ανεστραµµένα Αρχεία d 1 d 2 d 3 t 1 t 2 t 3 t 4 t 5 t 2 t 1 t 3 t 5 t 4 t 2 t 1 t 4 t 2 t 1 Document Collection Algorithm for Inverted File creation Mapping terms to Inverted lists t 1 t 2 t 3 t 4 t 5 [3] <d 1,1> <d 2,1> <d 3,2> [3] <d 1,1> <d 2,1> <d 3,2> [2] <d 1,1> <d 2,1> [2] <d 1,1> <d 3,2> [2] <d 1,1> <d 2,1> Inverted file 18

10 Παγκόσµιος Ιστός WWW url καταλόγους (π.χ. Yahoo) Μηχανές Αναζήτησης τεράστιος, µη οµογενής µεταβάλλεται ραγδαία επικοινωνιακό κόστος Παγκόσµιος Ιστός URL = Universal Resource Locator Access method Host name Page name

11 Παγκόσµιος Ιστός Τεράστιο µέγεθος 2-10B στατικές σελίδες, διπλασιαζόµενες κάθε 8-12 µήνες Μέγεθος Λεξικού: άδες εκατοµµύρια λέξεις Παγκόσµιος Ιστός Γλώσσες/Κωδικοποιήσεις: Εκατοντάδες γλώσσες, W3C κωδικοποιήσεις: 55 Σελίδες : Αγγλικές 82%, Επόµενες 15: 13% Μεγάλος Ρυθµός Αλλαγής στις Σελίδες Ανοµοιογένεια στη µορφή: Εκατοµµύρια άνθρωποι δηµιουργούν σελίδες µε τη δικιά τους γραµµατική, λεξικό, στυλ Πολλές φορές οι σελίδες εξυπηρετούν εµπορικούς σκοπούς (marketing) Μεγάλος Ρυθµός Αλλαγής στις Σελίδες Επανάληψη της ίδιας πληροφορίας Συντακτική επανάληψη (30-40% πανοµοιότυπες) Σηµασιολογική οµοιότητα? Υψηλή Συνεκτικότητα Κατά µέσο όρο ~8 σύνδεσµοι/σελίδα Πολύπλοκη τοπολογία γράφου Bow-tie τοπολογία

12 Παγκόσµιος Ιστός Συλλογή:Οι προσπελάσιµες σελίδες στον παγκόσµιο ιστό: στατικές + δυναµικές Στόχος: Ανάκτηση υψηλής ποιότητας αποτελεσµάτων που να είναι σχετικά µε τις ανάγκες του χρήστη Ανάγκη Πληροφοριακή ενηµέρωση για κάποια πληροφορία (~40%) Απλής διαπέρασης µετακίνηση σε µία σελίδα (~25%) Transactional πραγµατοποίηση µίας συναλλαγής (web-mediated) (~35%) Προσπέλαση υπηρεσίας Κατέβασµα πληροφορίας Αγορά Υβριδικό Εύρεση καλού hub ιερευνητικό ψάξιµο see what s there Παγκόσµιος Ιστός Στατικές σελίδες κείµενο (html, xml), mp3, images, video,... υναµικές σελίδες = παράγονται κατ απαίτηση data base access the invisible web proprietary content, etc.

13 Παγκόσµιος Ιστός Κακώς σχηµατισµένες ερωτήσεις µικρές σε πλήθος όρων ανακριβείς όροι µηβέλτιστησύνταξη(80% ερωτήµατα χωρίς τελεστή) χαµηλή προσπάθεια Μεγάλη απόκλιση σε ανάγκες επίπεδα αναµονής γνώση bandwidth Τυπική συµπεριφορά Εστίαση στην πρώτη οθόνη, όχι feedback, ακολούθηση υπερδεσµών Παγκόσµιος Ιστός Ποσότητες που µπορούν να µετρηθούν Το σχετικό µέγεθος των µηχανών αναζήτησης προβλήµατα επέκταση κειµένων: π.χ. το Google δεικτοδοτεί σελίδες που δεν έχουν γίνει crawl δεικτοδοτώντας anchor-text. περιορισµός στα κείµενα: Μερικές µηχανές περιορίζουν το τι δεικτοδοτείται (πρώτες n λέξεις, µόνοσχετικέςλέξειςκ.λ.π.) Η κάλυψηµίας µηχανής σε σχέση µε κάποιαάλληδιεργασίαcrawling.

14 Τεχνικές Εκτίµησης Μεγέθους Ιδανική στρατηγική: παρήγαγε ένα τυχαίο URL και έλεγξε αν εµπεριέχεται στις διάφορες δοµές δεικτοδότησης. Πρόβληµα: τυχαία URLs δεν βρίσκονται εύκολα Πάρε δείγµα URLs τυχαία από κάθε µηχανή 20,000 τυχαία URLs από κάθε µηχανή ιατύπωσε random conjunctive query µε <200 αποτελέσµατα Επέλεξε ένα τυχαίοurl από τα κορυφαία 200 αποτελέσµατα Έλεγξε αν είναι παρόντα σε άλλες µηχανές Query with 8 rarest words. Look for URL match Υπολόγισε µέγεθος τοµής Τεχνικές Εκτίµησης Μεγέθους Choose random searches extracted from a local log or build random searches Use only queries with small results sets. Count normalized URLs in result sets. Use ratio statistics Advantage: Might be a good reflection of the human perception of coverage

15 Η οµή του Παγκόσµιου Ιστού /~newbie/ / / /leaf.htm Η οµή του Παγκόσµιου Ιστού Για τυχαίες σελίδες p1,p2: Pr[p1 να προσπελαύνεται από p2] ~ 1/4 Μέγιστη απόσταση µεταξύ 2 SCC κόµβων: >28 Μέση κατευθυνόµενη απόσταση µεταξύ 2 κόµβων: ~16 Μέση µη κατευθυνόµενη απόσταση: ~7

16 Power Laws - Γενικά ύο ποσότητες x και y συνδέονται µε έναν power law όταν y x -c log y = -c*log x y log y x log x Ένας γνωστός power law Κατανοµή Zipf y : συχνότητα λέξης σε κείµενο x : o x-οστός πιο συχνός όρος Power law για c=1 y 1/x

17 Power laws και στο Web? Broder et. al x = #links που εισέρχονται σε σελίδα i y = #σελίδων µε x εισερχόµενα links y x Power laws και στο Web? (συνέχεια) x = #links που εξέρχονται από σελίδα i y = #σελίδων µε x εξερχόµενα links y x -2.72

18 Χρησιµότητα Παρατήρησης Βοηθάει στην κατανόηση και πρόβλεψη της εξέλιξης του Web Βοηθάει στην κατασκευή νέων αλγορίθµων ταξινόµησης Εκτέλεση προσοµοιώσεων σε σχέση µε το Web Μοντελοποίηση του Web Μοντελοποίηση Γραφήµατος του Web Kumar et. al. Stochastic models for the Web Graph, FOCS 2000 t+1 v Οι πρώτοι t κόµβοι του Web

19 Μοντελοποίηση Γραφήµατος του Web Για τον t+1 φτιάξε d συνδέσµους d>1 Πως επιλέγεται ο ι-στος σύνδεσµος? Πιθανότητα 1-α ο i-στός σύνδεσµος του v t+1 v Πιθανότητα α µια τυχαία σελίδα Μοντελοποίηση Γραφήµατος του Web Όταν δηµιουργείται µια σελίδα αυτή ανήκει σε ένα θέµα. Μας ενδιαφέρει να αντιγράψουµε τους συνδέσµους µίας άλλης σελίδας στο θέµα Ή να εισάγουµε νέες ιδέες Το µοντέλο ακολουθεί Power laws! To µέσο πλήθος των σελίδων µε βαθµό d είναι: ( 2 α ) /(1 α ) ( ) Θ d

20 Επεκτάσεις Εµπορικά πιο σηµαντικές εφαρµογές: Enterprise search Peer-2-Peer (P2P) search Peer-to-Peer ίκτυα Όχι κεντρικός δεικτοδοτητής Κάθε κόµβος στο διαδίκτυο κτίζει και διαχειρίζεται το δικό του δείκτη Παραδείγµατα Gnutella Kazaa Bearshare Aimster Grokster Morpheus

21 Μηχανές Αναζήτησης Πρώτη γενιά - χρήση µόνο on page δεδοµένων κειµένου Συχνότητα λέξεων, γλώσσα εύτερη γενιά -- χρήση off-page, web-specific δεδοµένων Link (ή connectivity) ανάλυση Click-through δεδοµένα (σε ποια αποτελέσµατα γίνεται click on) Anchor-text (πως οι άνθρωποι αναφέρονται σε δεδοµένα) Τρίτη γενιά καταγραφή ανάγκης πίσω από ερώτηµα Σηµασιολογική ανάλυση σε τι αναφέρεται? Εστίαση σε ανάγκες χρηστών και όχι ερωτήµατα Προσδιορισµός context Βοήθεια στο χρήστη Ολοκλήρωση ψαξίµατος και ανάλυσης κειµένου Μηχανές Πρώτης Γενιάς Μοντέλο διανυσµατικού χώρου και Επεκταµένο Boolean µοντέλο Ταιριάσµατα: exact, prefix, phrase, Τελεστές: AND, OR, AND NOT, NEAR, Πεδία: TITLE:, URL:, HOST:, Συνήθως ο τελεστής AND υλοποιείται πιο εύκολα, και πιθανώς να είναι προτιµητέα ως η εκ των προτέρων επιλογή για µικρά ερωτήµατα ιάταξη TF παράγοντες: TF, άµεσα keywords, λέξεις σε τίτλους, άµεση έµφαση (headers), κ.λ.π. IDF παράγοντες: IDF, συνολικός αριθµός λέξεων στο corpus, συχνότητα στο query log, συχνότητα στη γλώσσα

22 Μηχανές εύτερηςγενιάς Κατάταξη - χρήση off-page, web-specific δεδοµένων - Link (ή connectivity) ανάλυση - Click-through δεδοµένα (σε ποια αποτελέσµατα οι άνθρωποι εστιάζουν) - Anchor-text (πως οι άνθρωποι αναφέρονται σε µία σελίδα) Crawling - Αλγόριθµοι δηµιουργίας του καλύτερου δυνατού corpus Μηχανές Τρίτης Γενιάς Query language determination and different ranking Integration of Search and Text Analysis Context determination spatial (user location/target location) query stream (previous queries) personal (user profile) Context use Result restriction Ranking modulation

23 Μηχανές Αναζήτησης ιαπερνώντας το διαδίκτυο (Crawling) ποιες σελίδες πρέπει να προσπελαστούν ; τι γίνεται όταν το περιεχόµενο των σελίδων µεταβάλλεται ; (refresh policy) πως ελαχιστοποιείται ο φόρτος ; πως η διαδικασία διαπέρασης γίνεται παράλληλα ;

24 Είδη Crawlers (Crawling) Κλασσικός Crawler επισκέπτεται ολόκληρο το παγκόσµιο ιστό και αντικαθιστά τη δοµή δεικτοδότησης. Περιοδικός Crawler επισκέπτεται τµήµατα του παγκοσµίου ιστού και ενηµερώνει υποσύνολο δοµής δεικτοδότησης Αυξητικός Crawler επιλεκτικά ψάχνει το παγκόσµιο Ιστό και αυξητικά µεταβάλλει τη δοµή δεικτοδότησης. Εστιασµένος Crawler επισκέπτεται σελίδες που σχετίζονται µε ένα συγκεκριµένο θέµα. Crawling - Επιλογή Σελίδων Μετρικές Σπουδαιότητας Interest Driven

25 Crawling - Επιλογή Σελίδων Μετρικές Σπουδαιότητας Interest Driven & Οµοιότητα Κειµένων If Q is the user interest then: A new approach to topic-specific web resource discovery Chakrabarti et al. 8 th WWW conference 1999 Crawling - Επιλογή Σελίδων Μετρικές Σπουδαιότητας Popularity Driven Location Driven

26 Context Graph Crawling Context Graph: Context graph created for each seed document. Root is the seed document. Nodes at each level show documents with links to documents at next higher level. Updated during crawl itself. Approach: 1. Construct context graph and classifiers using seed documents as training data. 2. Perform crawling using classifiers and context graph created. Context Graph Crawling

27 Crawling - Ανανέωση Σελίδων f (συχνότητα επισκεψιµότητας) =σταθερή f=f(λ i ) Crawling - Ανανέωση Σελίδων P 1 P 2

28 Crawling - Ανανέωση Σελίδων Synchronizing a database to improve freshness. Cho, Molina. In Pro-ceedings of the International Conference on Management of Data, Αποθήκευση Page Repository

29 Αποθήκευση Page Repository Κατανεµηµένο και αυξοµειώσιµο Φυσική Οργάνωση : αποδοτικό RPA και Streaming Access Log Hash Hash-Log Streaming +! -! + Access RPA ~ +! ~ Page Addition +! -! ~ Αποθήκευση Page Repository conflicts vs. freshness obsolete pages : µηχανισµός διαγραφής

30 ηµιουργία Ευρετηρίων Indexing ηµιουργία Ευρετηρίων Indexing text index inverted files suffix arrays signature files κατανεµηµένο συµπιεσµένο structure (link) index utility index : link : site

31 Ranking and Link Analysis O τρόπος διασύνδεσης των σελίδων µπορεί να µας δώσει σηµαντική επιπλέον πληροφορία! PageRank : The pagerank citation ranking:bringing order to the web. Lawrence Page, Sergey Brin, Rajeev Motwani, and Terry Winograd. Technical report, Computer Science Department, Stanford University,1998. (Google) HITS: Authoritative sources in a hyperlinked environment. Jon Kleinberg. Journal of the ACM, 46(5): , November (Clever IBM, πρόδροµος της Teoma). PageRank Κάθε σελίδα λαµβάνει µία βαθµολογία που εκφράζει την «σηµαντικότητα» της. #in_links= #in_links=

32 PageRank strongly connected graph PageRank random surfer model strongly connected assumption problem: rank leak, rank sink

33 PageRank random surfer model Λεπτοµέρειες Υπολογισµού (1) Μία αλυσίδα Markov αποτελείται από n καταστάσεις, και ένα n n πιθανοτικό πίνακα µεταβάσεων P. Σε κάθε βήµα, είµαστε σε µία µόνο από τις καταστάσεις. Για 1 i,j n, το στοιχείο P ij µας δίνει τη πιθανότητα το j να βρίσκεται στην επόµενη κατάσταση, υποθέτοντας ότι βρισκόµαστε στην κατάσταση i. Μία Markov chain είναι εργοδική εάν Υπάρχει µονοπάτι από κάθε κατάσταση σε άλλη Μπορούµε να βρισκόµαστε σε κάθε κατάσταση κάθε στιγµή µε µη µηδενική πιθανότητα.

34 Λεπτοµέρειες Υπολογισµού (2) Για κάθε εργοδική Markov αλυσίδα, υπάρχει µία Steady-state distribution. Έστω a = (a 1, a n ) το row vector µε τις steady-state πιθανότητες. Εάν η τρέχουσα θέση περιγράφεται µε a, τότε η επόµενη περιγράφεται µε ap. Άρα a=ap, και συνεπώς το a είναι το (αριστερό) ιδιοδιάνυσµα τουp. (αντιστοιχεί στο βασικό ιδιοδιάνυσµα τουp µε τη µεγαλύτερη ιδιοτιµή.) Hypertext Induced Topic Search (HITS) Χρησιµοποιεί µηχανισµό αξιολόγησης που εξαρτάται από ένα ερώτηµα Q. authority hub Q= greek university Authority : Hub: Universities Worldwide

35 Hypertext Induced Topic Search (HITS) Απάντηση στο Q max{d} S: focused subgraph (all the outgoing, a restricted number of the incoming) R S : root set (~10 3 ) Hypertext Induced Topic Search (HITS)

36 Hypertext Induced Topic Search (HITS) Hypertext Induced Topic Search (HITS)

37 Hypertext Induced Topic Search (HITS) Πολλαπλά σύνολα jaguar randomized algorithms abortion Tag/position heuristics Αύξησε βάρη όρων σε τίτλους σε tags Κοντά στην αρχή του κειµένου, στα κεφάλαια και sections

38 Χρήσεις του Anchor Text Όταν δεικτοδοτείται µία σελίδα, να δεικτοδοτείται επίσης και το anchor text των υπερδεσµών που δείχνουν σε αυτή. Γιαναδίνονταικατάλληλαβάρηστοναλγόριθµο hubs/authorities. Το Anchor text συνήθως είναι ένα παράθυρο µεγέθους 6-8 λέξεων, γύρω από ένα link anchor. h( x) a( y) xa y a( x) h( y) a( x) = w( x, y) h( y) yax h( x) = xay yax w( x, y) a( y) Web sites, όχι σελίδες Οι σελίδες σε ένα site δίνουν πληροφορίας για παραλλαγές ίδιου θέµατος

39 Web Mining Taxonomy Web Content Mining Keyword Term Association Similarity Search Classification Clustering Natural Language Processing

40 Web Usage Mining Ordering Duplicates Consecutive Maximal Support Association Rules N N N N Freq(X)/#transactions Episodes Y N N N Freq(X)/#timewindows Sequential patterns Y N N Y Freq(X)/#customers Forward sequences Y N Y Y Freq(X)/#forward sequences Maximal forward sequences Y Y Y Y Freq(X)/#clicks Βιβλιογραφία R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval, Addison Wesley, Christofer Manning, Pradhakar Raghavan, Hunrich Schutze, Introduction to Information Retrieval, Cambridge University Press, ( Ι. Witten, A. Moffat, T. Bell, Managing Gigabytes: Compressing and Indexing Documents and Images, Morgan Kaufmann Publishers, G. Salton, M. McGill, An Introduction to Modern Information Retrieval, New York: McGraw-Hill, Van Reijsbergen, Information Retrieval, London: Butterworths, 1979 Van Reijsbergen, The Geometry of Information Retrieval, Cambridge University Press, 2005 W.B. Frakes, R. Baeza-Yates, Information Retrieval: Data Structures and Algorithms, Prentice Hall, EngleWood Cliffs, NJ. USA Σηµειώσεις :

41 B. Allen, Information Tasks: Towards a User-Centered Approach to Information Systems. Academic Press, San Diego, CA, M. Attalah ed., Algorithms and Theory of Computation Handbook CRC Press D. Gusfield, Algorithms on Strings, Trees and Sequences, Cambridge University Press, V.S. Subrahmanian. Principles of Multimedia Database Systems, Morgan Kaufmann, Ian H. Witten, Alistair Moffat, and Timothy C. Bell, Managing Gigabytes: Compressing and Indexing Documents and Images, Morgan Kaufmann, S. Abiteboul, P. Buneman, D. Suciu, Data on the Web: From Relations to Semistructured Data and XML, Morgan Kaufmann, 1999

Αναζήτηση στο ιαδίκτυο

Αναζήτηση στο ιαδίκτυο Αναζήτηση στο ιαδίκτυο Εισαγωγή url WWW καταλόγους (π.χ. Yahoo) Μηχανές Αναζήτησης τεράστιος, µη οµογενής µεταβάλλεται ραγδαία επικοινωνιακό κόστος Εισαγωγή Web URL = Universal Resource Locator http://www.ceid.upatras.gr/ir/

Διαβάστε περισσότερα

Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Πληροφορικής. Ακαδηµαϊκό Έτος

Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Πληροφορικής. Ακαδηµαϊκό Έτος Ανάκτηση Πληροφορίας Εισαγωγή Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Πληροφορικής Ακαδηµαϊκό Έτος 2015-2016 Αντικείµενο IR Η Ανάκτηση Πληροφορίας (ΑΠ)

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας Εισαγωγή

Ανάκτηση Πληροφορίας Εισαγωγή Ανάκτηση Πληροφορίας Εισαγωγή Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Πληροφορικής Ακαδημαϊκό Έτος 2007-2008 Αντικείμενο IR Η Ανάκτηση Πληροφορίας (ΑΠ)

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #03 Βασικές έννοιες Ανάκτησης Πληροφορίας Δομή ενός συστήματος IR Αναζήτηση με keywords ευφυής

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014 Web Mining Χριστίνα Αραβαντινού aravantino@ceid.upatras.gr Ιούνιος 2014 1 / 34 Χριστίνα Αραβαντινού Web Mining Περιεχόµενα 1 2 3 4 5 6 2 / 34 Χριστίνα Αραβαντινού Web Mining Το Web Mining στοχεύει στην

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #14 Αναζήτηση στο Web Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια χρήσης

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR)

Ανάκτηση Πληροφορίας (Information Retrieval IR) Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του αντικειµένου

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων

Ανάκτηση Πληροφορίας (Information Retrieval IR) ιδακτικό βοήθηµα 2. Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ανάκτηση Πληροφορίας (Information Retrieval IR) Πανεπιστήµιο Θεσσαλίας Πολυτεχνική Σχολή Τµήµα Μηχ. Η/Υ, Τηλ/νιών & ικτύων Ακαδηµαϊκό Έτος 2005-2006 ιδακτικό βοήθηµα 1 Καλύπτει το 60% του 510 σελίδες 1η

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΔΟΥΒΛΕΤΗΣ ΧΑΡΑΛΑΜΠΟΣ ΕΠΙΒΛΕΠΟΝΤΕΣ ΚΑΘΗΓΗΤΕΣ Μαργαρίτης Κωνσταντίνος Βακάλη

Διαβάστε περισσότερα

Ανάκτηση πληροφορίας

Ανάκτηση πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ανάκτηση πληροφορίας Ενότητα 1: Εισαγωγή στην Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Web. Web p OutDegree(p) log 7 1/OutDegree(p) A New Difinition of Subjective Distance between Web Pages

Web. Web p OutDegree(p) log 7 1/OutDegree(p) A New Difinition of Subjective Distance between Web Pages Vol. 44 No. 1 Jan. 2003 Web 1 2, 3 4 Web p OutDegree(p) log 7 1/OutDegree(p) A New Difinition of Subjective Distance between Web Pages Yutaka Matsuo, 1 Yukio Ohsawa 2, 3 and Mitsuru Ishizuka 4 The pages

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5: Μοντελοποίηση: Πιθανοκρατικό Μοντέλο Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Retrieval Systems

ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Retrieval Systems ΗΥ-463 Συστήματα Ανάκτησης Πληροφοριών Information Systems Πανεπιστήμιο Κρήτης, Άνοιξη Γιάννης Τζίτζικας Lecture : 1 Date : 22-2- Title : Administration εδοµένα Το Αντικείµενο του Μαθήµατος Μια συλλογή

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #10 εικτοδότηση και Αναζήτηση Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια

Διαβάστε περισσότερα

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463 ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ COMPUTER SCIENCE DEPARTMENT UNIVERSITY OF CRETE Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463 4 η Σειρά Ασκήσεων Ψαράκη Μαρία-Γεωργία ΜΕΤ 556 psaraki@csd.uoc.gr Εαρινό Εξάμηνο 2008-2009

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΣΤΑ ΠΛΑΙΣΙΑ ΤΟΥ ΜΕΤΑΠΤΥΧΙΑΚΟΥ ΔΙΠΛΩΜΑΤΟΣ ΕΙΔΙΚΕΥΣΗΣ ΕΠΙΣΤΗΜΗ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ του Γεράσιμου Τουλιάτου

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Διδάζκων Δημήηριος Καηζαρός Διάλεξη 18η: 17/05/2017 1 Η μέθοδος BrowseRank 2 Εισαγωγή Η page importance, που αναπαριστά την αξία μιας σελίδας του Web, είναι παράγων-κλειδί για την

Διαβάστε περισσότερα

Social Web: lesson #4

Social Web: lesson #4 Social Web: lesson #4 looking for relevant information browsing searching monitoring recommendations Information Retrieval the inverted index Google.com the pagerank algorithm the value of words the price

Διαβάστε περισσότερα

DEIM Forum 2012 D2-1 606 8501 150 0002 2-15-1 28F E-mail: {tsukuda,ohshima,tanaka}@dl.kuis.kyoto-u.ac.jp, {miyamamoto,hiwasaki}@d-itlab.co.jp 1 Wikipedia Wikipedia HITS 1. Web Web Web 1 3 Wikipedia 2 Web

Διαβάστε περισσότερα

Εισαγωγή στην ανάλυση συνδέσμων

Εισαγωγή στην ανάλυση συνδέσμων Εισαγωγή στην ανάλυση συνδέσμων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μαρία Χαλκίδη Why link analysis? Why link analysis? The web is not just a collection of documents its hyperlinks are important!

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #04 Εισαγωγή στα Μοντέλα Ανάκτησης Πληροφορίας Boolean Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS

DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS DISTRIBUTED CACHE TABLE: EFFICIENT QUERY-DRIVEN PROCESSING OF MULTI-TERM QUERIES IN P2P NETWORKS Paper By: Gleb Skobeltsyn, Karl Aberer Presented by: Βασίλης Φωτόπουλος Agenda 1. Ορισμός του προβλήματος

Διαβάστε περισσότερα

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι 5 η Διάλεξη Μάθημα: Τεχνολογίες Διαδικτύου Περιεχόμενα 5 η διάλεξη Μηχανές αναζήτησης Αναζήτηση στο Web Ωραίο το Web και το Internet Μάθαμε

Διαβάστε περισσότερα

DEIM Forum 2014 A8-1, 606 8501 E-mail: {tsukuda,ohshima,kato,tanaka}@dl.kuis.kyoto-u.ac.jp 1 2,, 1. Google 1 Yahoo 2 Bing 3 Web Web BM25 [1] HITS [2] PageRank [3] Web 1 [4] 1http://www.google.com 2http://www.yahoo.com

Διαβάστε περισσότερα

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό. Εξόρυξη Δεδομένων 2010-2011 1

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό. Εξόρυξη Δεδομένων 2010-2011 1 Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό Εξόρυξη Δεδομένων: Ακ. Έτος 2010-2011 ΑΝΑΛΥΣΗ ΣΥΝΔΕΣΕΩΝ 1 Ανάκτηση Κειμένου (εισαγωγικά θέματα) Εξόρυξη Δεδομένων: Ακ. Έτος 2010-2011 ΑΝΑΛΥΣΗ ΣΥΝΔΕΣΕΩΝ

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #11 Suffix Arrays Φοίβος Μυλωνάς fmylonas@ionio.gr Ανάκτηση Πληροφορίας 1 Άδεια χρήσης Το παρόν

Διαβάστε περισσότερα

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 5 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι 5 η Διάλεξη Μάθημα: Τεχνολογίες Διαδικτύου Περιεχόμενα 5 η διάλεξη Μηχανές αναζήτησης Αναζήτηση στο Web Ωραίο το Web και το Internet Μάθαμε

Διαβάστε περισσότερα

Μελέτη Περίπτωσης: Random Surfer

Μελέτη Περίπτωσης: Random Surfer Μελέτη Περίπτωσης: Random Surfer Introduction to Programming in Java: An Interdisciplinary Approach Robert Sedgewick and Kevin Wayne Copyright 2008 March 1, 2016 11:10 tt Memex Memex. [Vannevar Bush, 1936]

Διαβάστε περισσότερα

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου E-commerce Networks & Applications Η διαφήμιση στο Internet Νίκος Κωνσταντίνου Εισαγωγή Ηαπλήδημιουργίαενόςsite δεν είναι πλέον αρκετή Μια επένδυση σε ανάπτυξη και συντήρηση δεν αποδίδει χωρίς διαφήμιση

Διαβάστε περισσότερα

Διαδανεισμός, Πρωτόκολλο z39.50 Στρατηγικές αναζήτησης

Διαδανεισμός, Πρωτόκολλο z39.50 Στρατηγικές αναζήτησης Διαδανεισμός, Πρωτόκολλο z39.50 Στρατηγικές αναζήτησης Σεμινάρια Βιβλιοθηκονόμων ΕΠΕΑΕΚ 2000 Φίλιππος Τσιμπόγλου Διευθυντής Βιβλιοθήκης Πανεπιστημίου Κύπρου e-mail ftsimp@ucy.ac.cy 2 3 Πρωτόκολλο Z.3950

Διαβάστε περισσότερα

Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα

Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα Εισαγωγή 1 Ζήτω οι Βάσεις εδοµένων!! Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα Μοντελοποίηση Αποθήκευση Επεξεργασία (εύρεση πληροφορίας σχετικής µε µια συγκεκριµένη ερώτηση) Σωστή Λειτουργία

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 7 ο : Ανάκτηση πληροφορίας Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος βασίζονται

Διαβάστε περισσότερα

ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ. και ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ

ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ. και ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ και ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ ΣΚΟΠΟΣ ΜΑΘΗΜΑΤΟΣ ΣΥΝΔΕΣΗ ΜΕ ΑΛΛΑ ΜΑΘΗΜΑΤΑ ΣΕ ΠΟΙΟΥΣ ΑΠΕΥΘΥΝΕΤΑΙ ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ ΟΡΓΑΝΩΣΗ ΠΗΓΕΣ ΔΙΔΑΣΚΟΝΤΕΣ 1o μάθημα: ΕΙΣΑΓΩΓΗ Τί είναι Γεωπληροφορική

Διαβάστε περισσότερα

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589) Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589) Μεγαλοοικονόμου Βασίλειος Τμήμα Μηχ. Η/ΥκαιΠληροφορικής Επιστημονικός Υπεύθυνος Στόχος Προτεινόμενου Έργου Ανάπτυξη μεθόδων

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα

Πληροφοριακά Συστήματα Πληροφοριακά Συστήματα Ανακτώντας Πληροφορία και Γνώση στον Παγκόσμιο Ιστό Γιάννης Τζίτζικας Επίκουρος Καθηγητής Τμήματος Επιστήμης Υπολογιστών και Συνεργαζόμενος Ερευνητής του ΙΤΕ-ΙΠ 3 Απριλίου 2015 Διάρθρωση

Διαβάστε περισσότερα

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εισαγωγή

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εισαγωγή ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Εισαγωγή Συστάσεις Ι Ποιός είμαι εγώ: Email: tsap@cs.uoi.gr Γραφείο: Β.3 Προτιμώμενες ώρες γραφείου: 11:00-18:00 Ενδιαφέροντα Web mining, Social networks, User Generated Content Mobile

Διαβάστε περισσότερα

Θέμα : Retrieval Models. Ημερομηνία : 9 Μαρτίου 2006

Θέμα : Retrieval Models. Ημερομηνία : 9 Μαρτίου 2006 ΗΥ-464: Συστήματα Ανάκτησης Πληροφορίας Informaton Retreval Systems Πανεπιστήμιο Κρήτης Άνοιξη 2006 Φροντιστήριο 2 Θέμα : Retreval Models Ημερομηνία : 9 Μαρτίου 2006 Outlne Prevous Semester Exercses Set

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3.

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY463 - Συστήματα Ανάκτησης Πληροφοριών Εαρινό Εξάμηνο. Φροντιστήριο 3. Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών HY6 - Συστήματα Ανάκτησης Πληροφοριών 007 008 Εαρινό Εξάμηνο Φροντιστήριο Retrieval Models Άσκηση Θεωρείστε μια συλλογή κειμένων που περιέχει τα ακόλουθα

Διαβάστε περισσότερα

Τι είναι ένα δίκτυο υπολογιστών; Αρχιτεκτονική επιπέδων πρωτοκόλλων. Δικτυακά πρωτόκολλα

Τι είναι ένα δίκτυο υπολογιστών; Αρχιτεκτονική επιπέδων πρωτοκόλλων. Δικτυακά πρωτόκολλα Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2014-15 Δίκτυα υπολογιστών (και το Διαδίκτυο) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Τι είναι ένα δίκτυο υπολογιστών;

Διαβάστε περισσότερα

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Ψηφιακή ανάπτυξη Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Learning Objective : SEO και Analytics Fabio Calefato Department of Computer

Διαβάστε περισσότερα

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Διαδικαστικά

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Διαδικαστικά ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Διαδικαστικά Συστάσεις Ι Ποιός είμαι εγώ: Email: tsap@cs.uoi.gr Γραφείο: Β.3 Προτιμώμενες ώρες γραφείου: 11:00-18:00 Ενδιαφέροντα Web mining, Social networks, User Generated Content Mobile

Διαβάστε περισσότερα

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 11η: 09/05/2007 1 Ζητήµατα Μεγάλης-Κλίµακας

Διαβάστε περισσότερα

Τεχνικές Εξόρυξης Δεδομένων

Τεχνικές Εξόρυξης Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:

Διαβάστε περισσότερα

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων Αναστάσιος Σκαρλατίδης 1,2 anskarl@iit.demokritos.gr επιβλέπων: Καθ. Βούρος Γ. 1 1 Τµήµα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστηµάτων Πανεπιστήµιο

Διαβάστε περισσότερα

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Δομές Δεδομένων Συμβολοσειρές Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Συμβολοσειρές Συμβολοσειρές και προβλήματα που αφορούν συμβολοσειρές εμφανίζονται τόσο συχνά που

Διαβάστε περισσότερα

ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ

ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ Ο Οργανισμός Βιομηχανικής Ιδιοκτησίας (Ο.Β.Ι.) ιδρύθηκε το 1987 (Ν.1733/1987), είναι νομικό πρόσωπο ιδιωτικού δικαίου, οικονομικά ανεξάρτητο και διοικητικά αυτοτελές.

Διαβάστε περισσότερα

FirstSearch (OCLC) Βασικά χαρακτηριστικά:

FirstSearch (OCLC) Βασικά χαρακτηριστικά: FirstSearch (OCLC) Η Βιβλιοθήκη & Κέντρο Πληροφόρησης του Πανεπιστημίου Θεσσαλίας έχει εξασφαλίσει online πρόσβαση μέσω της υπηρεσίας FirstSearch της OCLC Online Computer Library Center, Inc. σε 12 βιβλιογραφικές

Διαβάστε περισσότερα

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό. Εξόρυξη Δεδομένων 2008-2009 1

Ανάκτηση Κειμένου (εισαγωγικά θέματα) Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό. Εξόρυξη Δεδομένων 2008-2009 1 Θέματα σχετικά με Εξόρυξη από τον Παγκόσμιο Ιστό Ανάκτηση Κειμένου (εισαγωγικά θέματα) Εξόρυξη Δεδομένων: Ακ. Έτος 2008-2009 ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2 Εξόρυξη Δεδομένων 2008-2009 1 Ανάκτηση Πληροφορίας Βάσεις

Διαβάστε περισσότερα

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Όνοµα: Νικολαΐδης Αντώνιος Επιβλέπων: Τ. Σελλής Περίληψη ιπλωµατικής Εργασίας Συνεπιβλέποντες: Θ. αλαµάγκας, Γ. Γιαννόπουλος

Διαβάστε περισσότερα

6 Εικόνα εξώφυλλου: Λωρίδα του Mobius (Σύνθεση). Νικόλαος Μπαλκίζας 10

6 Εικόνα εξώφυλλου: Λωρίδα του Mobius (Σύνθεση). Νικόλαος Μπαλκίζας 10 6 ΕΡΓΑΣΙΑ 1 «Η Μηχανή Αναζήτησης Google» 6 Εικόνα εξώφυλλου: Λωρίδα του Mobius. 2005. (Σύνθεση). Νικόλαος Μπαλκίζας 10 Η Μηχανή Αναζήτησης Google 7 Εισαγωγή Η εύρεση χρήσιμων πληροφορίων στον Παγκόσμιο

Διαβάστε περισσότερα

Μελέτη Πολιτικών Χρονοδροµολόγησης σε Κατανεµηµένα Συστήµατα Πλοηγητών. Όνοµα : Ελένη Τσιακκούρη

Μελέτη Πολιτικών Χρονοδροµολόγησης σε Κατανεµηµένα Συστήµατα Πλοηγητών. Όνοµα : Ελένη Τσιακκούρη Μελέτη Πολιτικών Χρονοδροµολόγησης σε Κατανεµηµένα Συστήµατα Πλοηγητών Όνοµα : Ελένη Τσιακκούρη οµή Παρουσίασης Εισαγωγή Στόχοι Προηγούµενη Έρευνα Πλαίσιο Εργασίας Βασικά Στάδια Αρχιτεκτονική Συστήµατος

Διαβάστε περισσότερα

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl

Posting File. D i. tf key1 [position1 position2 ] D j tf key2... D l.. tf keyl ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΗΥ463 Συστήµατα Ανάκτησης Πληροφοριών Εργασία: Ανεστραµµένο Ευρετήριο Εισαγωγή Σκοπός της εργασίας είναι η δηµιουργία ενός ανεστραµµένου ευρετηρίου για τη µηχανή αναζήτησης Μίτος, το

Διαβάστε περισσότερα

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Διαχείριση εγγράφων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Απεικόνιση κειμένων για Information Retrieval Δεδομένου ενός κειμένου αναζητούμε μια μεθοδολογία απεικόνισης του γραμματικού χώρου

Διαβάστε περισσότερα

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer

Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval. Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Query-Driven Indexing for Scalable Peer-to-Peer Text Retrieval Gleb Skobeltsyn, Toan Luu, Ivana Podnar Zarko, Martin Rajman, Karl Aberer Περιγραφή του προβλήματος Ευρετηριοποίηση μεγάλων συλλογών εγγράφων

Διαβάστε περισσότερα

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ζητήµατα Μεγάλης-Κλίµακας Υλοποίησης του PageRank. Αρχιτεκτονική Μηχανής Αναζήτησης

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ζητήµατα Μεγάλης-Κλίµακας Υλοποίησης του PageRank. Αρχιτεκτονική Μηχανής Αναζήτησης Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη η: 09/0/00 Ζητήµατα Μεγάλης-Κλίµακας Υλοποίησης

Διαβάστε περισσότερα

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή Ανοικτή και Εξ Αποστάσεως Εκπαίδευση Χρησιµοποιώντας το Εκπαιδευτικό Περιβάλλον του MOODLE. Open and Distance Learning Using MOODLE Learning Environment Αθανάσιος Ι. Μάργαρης, Ευθύµιος. Κότσιαλος Πανεπιστήµιο

Διαβάστε περισσότερα

ΜΑΘΗΜΑ 4. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας. Λογισµικό Αναζήτησης & Ανάκτησης Πληροφοριών

ΜΑΘΗΜΑ 4. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας. Λογισµικό Αναζήτησης & Ανάκτησης Πληροφοριών ΜΑΘΗΜΑ 4 130 Λογισµικό Αναζήτησης & Ανάκτησης Πληροφοριών Συστήµατα αυτοµατοποίησης βιβλιοθηκών Z- clients & servers Λογισµικό διαχείρισης αιτηµάτων ILL Λογισµικό υλοποίησης OpenURL Πράκτορες αναζήτησης

Διαβάστε περισσότερα

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Μεταπτυχιακό Πρόγραµµα Σπουδών2007-2008 ιδάσκουσα: Κατερίνα Τοράκη (Οι διαλέξεις περιλαµβάνουν

Διαβάστε περισσότερα

User Behavior Analysis for a Large2scale Search Engine

User Behavior Analysis for a Large2scale Search Engine 25 2 2006 4 Vol. 25 2 April 2006 1) 1 2 1 (1. 100871 ; 2. 730000) : URL Heaps URL Zipf URL URL User Behavior Analysis for a Large2scale Search Engine Wang Jimin 1 2 and Peng Bo 1 (1. School of Electronics

Διαβάστε περισσότερα

interactivecommunication Search Marketing White Paper Φεβρουάριος 2007 2007, Cybertechnics Ltd. All rights reserved.

interactivecommunication Search Marketing White Paper Φεβρουάριος 2007 2007, Cybertechnics Ltd. All rights reserved. interactivecommunication White Paper Φεβρουάριος 2007 2007, Cybertechnics Ltd. All rights reserved. ToSearchenginemarketing, ή SEM, αποτελείται απόμια σειρά marketing μεθόδων για την αύξηση τηςεμφάνισηςτου

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας Μέτρα Απόδοσης Precision = # σχετικών κειμένων που επιστρέφονται # κειμένων που επιστρέφονται Recall = # σχετικών κειμένων που επιστρέφονται # συνολικών

Διαβάστε περισσότερα

ER-Tree (Extended R*-Tree)

ER-Tree (Extended R*-Tree) 1-9825/22/13(4)768-6 22 Journal of Software Vol13, No4 1, 1, 2, 1 1, 1 (, 2327) 2 (, 3127) E-mail xhzhou@ustceducn,,,,,,, 1, TP311 A,,,, Elias s Rivest,Cleary Arya Mount [1] O(2 d ) Arya Mount [1] Friedman,Bentley

Διαβάστε περισσότερα

Κεφάλαιο 1. Εισαγωγή 1

Κεφάλαιο 1. Εισαγωγή 1 Κεφάλαιο 1. Εισαγωγή 1 1.1 Η ανάγκη για Ανάκτηση Πληροφορίας Η επιστήµη της Ανάκτησης Πληροφορίας (ΑΠ στο εξής), ασχολείται µε την αναπαράσταση, την αποθήκευση, την οργάνωση και την πρόσβαση σε πληροφοριακά

Διαβάστε περισσότερα

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks P2P 1,a) 1 1 1 P2P P2P P2P P2P A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks NARISHIGE Yuki 1,a) ABE Kota 1 ISHIBASHI Hayato 1 MATSUURA Toshio 1

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 8: Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis) Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό

Διαβάστε περισσότερα

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός Ανάκληση Πληποφοπίαρ Information Retrieval Διδάζκων Δημήηριος Καηζαρός Διάλεξη 4η: 04/03/2017 1 Phrase queries 2 Ερωτήματα φράσεως Έστω ότι επιθυμούμε ν απαντήσουμε ερωτήματα της μορφής stanford university

Διαβάστε περισσότερα

Κεφάλαιο 5. Ανάκτηση Πληροφορίας στον Παγκόσµιο Ιστό

Κεφάλαιο 5. Ανάκτηση Πληροφορίας στον Παγκόσµιο Ιστό Κεφάλαιο 5. Ανάκτηση Πληροφορίας στον Παγκόσµιο Ιστό 5.1 Βασικές Έννοιες Στην ενότητα αυτή παρουσιάζονται ορισµένες βασικές έννοιες σχετικά µε την Ανάκτηση Πληροφορίας στον Παγκόσµιο Ιστό. Αρχικά δίνεται

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ 5//013 ο ΓΛΩΣΣΑ ΚΑΙ ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ Ενότητες Εισαγωγή Συστήματα Aνάκτησης πληροφορίας Κατασκευή ερωτημάτων Δεικτοδότηση Αναζήτηση στο

Διαβάστε περισσότερα

substructure similarity search using features in graph databases

substructure similarity search using features in graph databases substructure similarity search using features in graph databases Aleksandros Gkogkas Distributed Management of Data Laboratory intro Θα ενασχοληθούμε με το πρόβλημα των ερωτήσεων σε βάσεις γραφημάτων.

Διαβάστε περισσότερα

Πώς λειτουργεί το Google?

Πώς λειτουργεί το Google? Πώς λειτουργεί το Google? Στα άδυτα του Γίγαντα της Αναζήτησης! Το να ψάξουμε κάτι στο Google είναι κάτι τόσο καθημερινό για τους περισσότερους από εμάς, που το θεωρούμε δεδομένο. Αυτό που ίσως ξεχνάμε

Διαβάστε περισσότερα

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems

Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009. HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Πανεπιστήμιο Κρήτης, Τμήμα Επιστήμης Υπολογιστών Άνοιξη 2009 HΥ463 - Συστήματα Ανάκτησης Πληροφοριών Information Retrieval (IR) Systems Στατιστικά Κειμένου Text Statistics Γιάννης Τζίτζικας άλ ιάλεξη :

Διαβάστε περισσότερα

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc.

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc. IEEE Xplore, Institute of Electrical and Electronics Engineers Inc. Μέσω της υπηρεσίας IEEE Xplore παρέχεται πρόσβαση στα περιεχόμενα, στις περιλήψεις και στα πλήρη κείμενα (full text) άρθρων από επιστημονικά

Διαβάστε περισσότερα

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Σε αυτό το κεφάλαιο παρουσιάζουµε 2 βασικούς αλγορίθµους σύγκρισης ακολουθιών Βιολογικών εδοµένων τους BLAST & FASTA. Οι δυο αλγόριθµοι

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2010-2011 ΑΣΚΗΣΗ Συγκομιδή και δεικτοδότηση ιστοσελίδων Σκοπός της άσκησης είναι η υλοποίηση ενός ολοκληρωμένου συστήματος συγκομιδής και δεικτοδότησης ιστοσελίδων.

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 11 ο : Αυτόματη παραγωγή περιλήψεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 11 ο : Αυτόματη παραγωγή περιλήψεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 11 ο : Αυτόματη παραγωγή περιλήψεων Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος

Διαβάστε περισσότερα

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο

Φροντιστήριο 4. Άσκηση 1. Λύση. Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών Εαρινό Εξάµηνο Πανεπιστήµιο Κρήτης, Τµήµα Επιστήµης Υπολογιστών HY463 - Συστήµατα Ανάκτησης Πληροφοριών 2007-2008 Εαρινό Εξάµηνο Άσκηση 1 Φροντιστήριο 4 Θεωρείστε ένα έγγραφο με περιεχόμενο «αυτό είναι ένα κείμενο και

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από εδοµένα (data mining)

Εξόρυξη Γνώσης από εδοµένα (data mining) Εξόρυξη νώσης από εδοµένα (data mining) Ε.Κ.Ε.Φ.Ε. ηµόκριτος Ινστ. Πληροφορικής και Τηλεπικοινωνιών εώργιος Παλιούρας Email: paliourg@iit.demokritos.gr WWW: http://www.iit.demokritos.gr/~paliourg Περιεχόµενα

Διαβάστε περισσότερα

Η Τεχνολογία στις Συνεργασίες των Βιβλιοθηκών

Η Τεχνολογία στις Συνεργασίες των Βιβλιοθηκών Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης Τμήμα Αρχειονομίας Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Η Τεχνολογία στις Συνεργασίες των Βιβλιοθηκών Σαράντος Καπιδάκης sarantos@ionio.gr Ομοιότητες

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Φροντιστήριο 2

Ανάκτηση Πληροφορίας. Φροντιστήριο 2 Ανάκτηση Πληροφορίας Φροντιστήριο 2 Τσιράκης Νίκος Νοέμβριος 2007 2 Περιεχόμενα Querying Lexicon access Μοντέλα Φυλλομέτρησης 3 Querying 4 Querying Πως χρησιμοποιούμε ένα ευρετήριο για να εντοπίσουμε πληροφορίες

Διαβάστε περισσότερα

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2014-15. Δίκτυα υπολογιστών. (και το Διαδίκτυο)

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2014-15. Δίκτυα υπολογιστών. (και το Διαδίκτυο) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2014-15 Δίκτυα υπολογιστών (και το Διαδίκτυο) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Τι είναι ένα δίκτυο υπολογιστών;

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας

Διαβάστε περισσότερα

Bizagi Modeler: Συνοπτικός Οδηγός

Bizagi Modeler: Συνοπτικός Οδηγός Bizagi Modeler: Συνοπτικός Οδηγός Α. Τσαλγατίδου - Γ.-Δ. Κάπος Πρόγραμμα Μεταπτυχιακών Σπουδών Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών 2017-2018 Bizagi Modeler Εμπορική εφαρμογή για μοντελοποίηση

Διαβάστε περισσότερα

Εισαγωγή. web σελίδα Βάσεις εδοµένων Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα

Εισαγωγή. web σελίδα  Βάσεις εδοµένων Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα Βάσεις εδοµένων Εισαγωγή Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα Μοντελοποίηση Αποθήκευση Επεξεργασία (εύρεση πληροφορίας σχετικής µε µια συγκεκριµένη ερώτηση) Σωστή Λειτουργία (αποτυχίες

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα 6: Υπερκείμενο - Υπερμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Τεχνολογία Πολυμέσων. Ενότητα 6: Υπερκείμενο - Υπερμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ Τεχνολογία Πολυμέσων Ενότητα 6: Υπερκείμενο - Υπερμέσα Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Ο αλγόριθμος PageRank της Google

Ο αλγόριθμος PageRank της Google Ο αλγόριθμος PageRank της Google 1 Η μηχανή αναζήτησης Google Το Google ξεκίνησε σαν μια κολεγιακή εργασία από τον Larry Page και τον Sergey Brin το 1996 με σκοπό την κατασκευή μιας μηχανής αναζήτησης

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

SilverPlatter WebSPIRS 4.1.

SilverPlatter WebSPIRS 4.1. WebSPIRS 4.1. Η υπηρεσία WebSPIRS από τη SilverPlatter αποτελεί ένα φιλικό εργαλείο πρόσβασης και αναζήτησης σε περιεχόμενα βάσεων δεδομένων. Η Βιβλιοθήκη και Κέντρο Πληροφόρησης του Πανεπιστημίου Θεσσαλίας

Διαβάστε περισσότερα

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Ψηφιακή ανάπτυξη Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS Learning Objective : Βασικά συστατικά του Web Fabio Calefato Department of

Διαβάστε περισσότερα

About Ολοκληρωμένο Πληροφοριακό Σύστημα παρακολούθησης συλλογής, επεξεργασίας και ανάλυσης δημοσιότητας OCR Speech to Text Big Data Analytics

About Ολοκληρωμένο Πληροφοριακό Σύστημα παρακολούθησης συλλογής, επεξεργασίας και ανάλυσης δημοσιότητας OCR Speech to Text Big Data Analytics USER MANUAL About Η πλατφόρμα Innews είναι το κορυφαίο Ολοκληρωμένο Πληροφοριακό Σύστημα (ΟΠΣ) παρακολούθησης, συλλογής, επεξεργασίας και ανάλυσης δημοσιότητας στην ελληνική επικράτεια. Η Innews αναβαθμίζεται

Διαβάστε περισσότερα

Βάσεις εδοµένων & Πολυµέσα

Βάσεις εδοµένων & Πολυµέσα Βάσεις εδοµένων & Πολυµέσα Κουρέλης Στάθης Παρουσίαση πρακτικού µέρους 4ης εργασίας Καθηγητής: κ. Στυλιαράς Γ. Αθήνα - Απρίλιος 2009 Εισαγωγή Οι Βάσεις εδοµένων Πολυµέσων παρέχουν χαρακτηριστικά που επιτρέπουν

Διαβάστε περισσότερα

ίκτυα - Internet Υπηρεσίες Internet O Παγκόσµιος Ιστός (World Wide Web) Ηλεκτρονική Αλληλογραφία (E-mail) Υπηρεσία FTP (File Transfer Protocol)

ίκτυα - Internet Υπηρεσίες Internet O Παγκόσµιος Ιστός (World Wide Web) Ηλεκτρονική Αλληλογραφία (E-mail) Υπηρεσία FTP (File Transfer Protocol) Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Κέρκυρα ίκτυα - Internet 2 Υπηρεσίες Internet O Παγκόσµιος Ιστός (World Wide Web) ΜηχανέςΑναζήτησηςστοWeb Ηλεκτρονική Αλληλογραφία (E-mail) Υπηρεσία

Διαβάστε περισσότερα

Ενότητα 9 Ξένα Σύνολα που υποστηρίζουν τη λειτουργία της Ένωσης (Union-Find)

Ενότητα 9 Ξένα Σύνολα που υποστηρίζουν τη λειτουργία της Ένωσης (Union-Find) Ενότητα 9 (Union-Find) ΗΥ240 - Παναγιώτα Φατούρου 1 Έστω ότι S 1,, S k είναι ξένα υποσύνολα ενός συνόλου U, δηλαδή ισχύει ότι S i S j =, για κάθε i,j µε i j και S 1 S k = U. Λειτουργίες q MakeSet(X): επιστρέφει

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από εδοµένα (Data Mining)

Εξόρυξη Γνώσης από εδοµένα (Data Mining) ΠΜΣ Πληροφορικής Πανεπιστηµίου Πειραιά Εξόρυξη Γνώσης από εδοµένα (Data Mining) Αποθήκες εδοµένων Γιάννης Θεοδωρίδης Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιά http://isl.cs.unipi.gr/db/courses/dm "Πυραµίδα"

Διαβάστε περισσότερα

Πίνακας περιεχοµένων

Πίνακας περιεχοµένων Πίνακας περιεχοµένων ΠΡΩΤΟ ΜΕΡΟΣ... 1 Κεφάλαιο 1 Εισαγωγή στα συστήµατα ρευµάτων δεδοµένων... 3 1.1 Εισαγωγή... 3 1.2 Η ανεπάρκεια των συµβατικών Σ Β... 4 1.3 Το µοντέλο ρεύµατος δεδοµένων... 7 1.4 Ερωτήµατα

Διαβάστε περισσότερα