Ανάκτηση Δεδομένων (Information Retrieval)



Σχετικά έγγραφα
ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι Ενότητα 3:

Διαχείριση Πολιτισμικών Δεδομένων

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Πανεπιστήμιο Πειραιώς Τμήμα Ψηφιακών Συστημάτων Μανουσόπουλος Χρήστος

Βάσεις Δεδομένων ΗγλώσσαSQL (Structured Query Language)

Βάσεις Δεδομένων Η γλώσσα SQL (Structured Query Language) Εισαγωγή στην SQL (2) Ιστορικά Στοιχεία. SQL - Structured Query Language (1)

Οι εντολές CREATE TABLE, ALTER TABLE, CREATE KEY, ALTER KEY.

Βάσεις Περιβαλλοντικών Δεδομένων

Postgress ΣΤΟΧΟΣ ΣΧΕΤΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ ΥΛΙΚΟ. ΠΕΡΙΒΑΛΛΟΝ ΓΙΑ ΕΞΑΣΚΗΣΗ pgadmin ΥΠΟΒΑΘΡΟ. Συναρτήσεις στην PostgreSQL. 1. Γενικά

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

Οι εντολές CREATE TABLE, ALTER TABLE, CREATE KEY, ALTER KEY.

Αποθηκευμένες Διαδικασίες Stored Routines (Procedures & Functions)

Ηλεκτρονικοί Υπολογιστές II

Η SQL αποτελείται από δύο υποσύνολα, τη DDL και τη DML.

Σχεδιασμός Βάσεων Δεδομένων

Τμήμα Διοίκησης Επιχειρήσεων

Βάσεις Δεδομένων 2η εργαστηριακή άσκηση

Βάσεις Δεδομένων 5η εργαστηριακή άσκηση

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Ενεργές ΒΔ. Παύλος Εφραιμίδης pefraimi <at> ee.duth.gr. Βάσεις Δεδομένων Ενεργές ΒΔ 1

Τεχνολογία Πολιτισμικού Λογισμικού

2 ο Σύνολο Ασκήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Βάσεις Δεδομένων Ι Ευρετήρια/Indexes. (...και επιδόσεις ΣΔΒΔ) Views (Όψεις) Φώτης Κόκκορας (MSc/PhD) Τμήμα Τεχνολογίας Πληροφορικής & Τηλεπ/νιών

Ορισµοί Σχεσιακού Μοντέλου και Τροποποιήσεις Σχέσεων σε SQL

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 4ο Μάθημα: SQL - Παράδειγμα. Δρ. Κωνσταντίνος Χ.

Ιατρική Πληροφορική. Δρ. Π. ΑΣΒΕΣΤΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΒΙΟΪΑΤΡΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ Τ.Ε.

Ορισμοί Σχεσιακού Μοντέλου και (απλές)τροποποιήσεις Σχέσεων στην SQL. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Ιατρική Πληροφορική. Δρ. Π. ΑΣΒΕΣΤΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΒΙΟΪΑΤΡΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ Τ. Ε. Χρήσιμοι Σύνδεσμοι

PHPMyAdmin: Σύντομος οδηγός για αρχάριους

H SQL είναι η γλώσσα για όλα τα εμπορικά σχεσιακά συστήματα διαχείρισης βάσεων δεδομένων

Ορισμοί Σχεσιακού Μοντέλου και Τροποποιήσεις Σχέσεων σε SQL

Αρχιτεκτονική Συστημάτων Βάσεων Δεδομένων. Κατηγορίες χρηστών ΣΔΒΔ Αρχιτεκτονική ANSI/SPARC Γλώσσες ερωτημάτων Μοντέλα δεδομένων Λειτουργίες ΣΔΒΔ

Ανοικτά Ακαδημαϊκά Μαθήματα

Πανεπιστήµιο Ιωαννίνων Τµήµα Μαθηµατικών Μάθηµα: Βάσεις εδοµένων (741) Εργαστηριακό Τεστ Οµάδα: Α 18/11/2004

Ορισμοί Σχεσιακού Μοντέλου και Τροποποιήσεις Σχέσεων σε SQL

Βασικές Εντολές SQL. Θεωρία & Εντολές SQL. Γραμμή Εντολών MS-DOS (MySQL)

ΚΕΡΑΜΟΠΟΥΛΟΣ ΕΥΚΛΕΙΔΗΣ

Βάσεις Δεδομένων. Βασίλειος Βεσκούκης Εισαγωγή στη γλώσσα SQL (Structured Query Language) Η γλώσσα SQL

Εισαγωγή στην Oracle Spatial 10g

Έννοιες Διαχείρισης Βάσεων Δεδομένων και Αρχιτεκτονική

Εισαγωγή στην PostgreSQL Spatial 8.1

Βάσεις δεδομένων. (10 ο μάθημα) Ηρακλής Βαρλάμης

ΕΠΛ 342 Βάσεις εδοµένων

Παράδειγμα Insert Update Delete Alter.. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγή στη MySQL (2)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. 1 ο ΣΧΟΛΕΙΟ ΚΩΔΙΚΑ «Βασικά Θέματα Προγραμματισμού στην Ανάπτυξη Δυναμικών Διαδικτυακών Εφαρμογών» (Part 3) Ουρανία Σμυρνάκη

ΕΝΑΥΣΜΑΤΑ ΣΤΗΝ POSTGRES

Τεχνολογία Πολιτισμικού Λογισμικού

Ακεραιότητα και Ασφάλεια Μέρος 1 Σχεδιασμός Βάσεων Δεδομένων

ΣΧΕΔΙΑΣΜΟΣ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ ΕΡΓΑΣΤΗΡΙΟ 3

Εισαγωγή στην πληροφορική

PostgreSQL. Oracle. Εαρινό Εξάμηνο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

Διαχείριση Πολιτισμικών Δεδομένων

Το σχεσιακό μοντέλο βάσεων δεδομένων

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ. Επιλέγει όλες τις πλειάδες, από μια σχέση R, που ικανοποιούν τη συνθήκη επιλογής.

databases linux - terminal (linux / windows terminal)

Βάσεις Δεδομένων Ι SQL Μέρος 3 ο. (Constraints & Joins) Φώτης Κόκκορας (MSc/PhD) Τμήμα Μηχανικών Πληροφορικής ΤΕ

ΕΣΔ 232: ΟΡΓΑΝΩΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΗ ΚΟΙΝΩΝΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. Ακαδημαϊκό Έτος , Εαρινό Εξάμηνο. Εργαστηριακή Άσκηση 4 7/02/2012

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Σχεδίαση Βάσεων Δεδομένων

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 3ο Μάθημα: Εισαγωγή στην SQL. Δρ. Κωνσταντίνος Χ.

10 η Διάλεξη Python Βάσεις δεδομένων στη python

Ανοικτά Ακαδημαϊκά Μαθήματα

Ανάκτηση Πληροφορίας

Ορισµοί Σχεσιακού Μοντέλου και Τροποποιήσεις Σχέσεων σε SQL

Βάσεις Δεδομένων Ι SQL Μέρος 1 ο. Φώτης Κόκκορας (MSc/PhD) Τμήμα Μηχανικών Πληροφορικής ΤΕ

ΗΛΕΚΤΡΟΝΙΚΟ ΚΑΤΑΣΤΗΜΑ

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Το Μοντέλο των Οντοτήτων Συσχετίσεων Entity Relationship Model. Νικόλαος Ζ. Ζάχαρης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ

ΦΡΟΝΤΙΣΤΗΡΙΟ ΣΤΗ ΓΛΩΣΣΑ SQL

Βάσεις Δεδομένων (Ε) Εισαγωγή στην υλοποίηση σχεσιακών βάσεων δεδομένων

Βάςεισ Δεδομζνων Ι. Ενότητα 7: Ειςαγωγή ςτην γλώςςα_sql. Δρ. Σςιμπίρθσ Αλκιβιάδθσ Σμιμα Μθχανικϊν Πλθροφορικισ ΣΕ

Σχεδίαση και Χρήση Βάσεων Δεδομένων. Χρήση της MySQL. Γιώργος Πυρουνάκης -

ΗΓλώσσαSQL. Εισαγωγή Βασικές Έννοιες Τύποι Δεδομένων Ορισμός Δεδομένων Χειρισμός Δεδομένων

Διάλεξη 16: SQL DML IV, SQL DCL, SQL TCL. Διδάσκων: Παναγιώτης Ανδρέου

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ

(Μέρος 3:Γλώσσα Ορισµού, Γλώσσα Τροποποίησης, Ενσωµατωµένη SQL) Βάσεις εδοµένων Ευαγγελία Πιτουρά 2

Ορισμοί Σχεσιακού Μοντέλου και (απλές)τροποποιήσεις Σχέσεων στην SQL. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Περιγραφή του EcoTruck

Τεχνολογία Πολιτισμικού Λογισμικού

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Βάσεις Δεδομένων (4 ο εξάμηνο) Εργαστήριο MySQL #3

ΦΡΟΝΤΙΣΤΗΡΙΟ ΣΤΗ ΓΛΩΣΣΑ SQL

Σχεδίαση Βάσεων Δεδομένων

ΗΥ-360 Αρχεία και Βάσεις Δεδομένων Διδάσκων: Δ. Πλεξουσάκης. Φροντιστήριο SQL Examples Ξένου Ρουμπίνη

Προσοµοίωση τροχιάς σε Oracle Spatial 8i DBMS

Τμήμα Πληροφορικής ΑΠΘ

Εργαστήριο βάσεων δεδομένων. Εισαγωγή στη MySQL (2)

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Βάσεις Δεδομένων

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 9β: SQL (Διαχείριση εγγραφών, Όψεις, Περιορισμοί, Εναύσματα) Ευαγγελίδης Γεώργιος. Τμήμα Εφαρμοσμένης Πληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ

Βάσεις Δεδομένων. Σχεσιακό Μοντέλο Δεδομένων. Βασίλειος Βεσκούκης Ορισμός Βάσης Δεδομένων Δομή Περιορισμοί

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑIΟΥ & ΑΕΙ ΠΕΙΡΑΙΑ Τ.Τ.

Αναλυτικές λειτουργίες ΣΓΠ

ΚΕΦΑΛΑΙΟ ΤΡΙΤΟ ΕΝΤΟΛΕΣ SQL

ΚΕΡΑΜΟΠΟΥΛΟΣ ΕΥΚΛΕΙΔΗΣ

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Transcript:

Ανάκτηση Δεδομένων (Information Retrieval) Παύλος Εφραιμίδης Βάσεις Δεδομένων Ανάκτηση Δεδομένων 1

Information Retrieval (1) Βάσεις Δεδομένων: Περιέχουν δομημένη πληροφορία: Πίνακες Ανάκτηση Πληροφορίας (Information Retrieval): Αφορά μη δομημένη πληροφορία ελεύθερο κείμενο ήχο εικόνα video Βάσεις Δεδομένων Ανάκτηση Δεδομένων 2

Information Retrieval (2) Βάσεις Δεδομένων: Υπάρχει συγκεκριμένη μοναδική απάντηση στα ερωτήματα Ανάκτηση Πληροφορίας (Information Retrieval): Αναζητάμε δεδομένα με βάση το βαθμό σχετικότητάς τους με κάποιο ερώτημα Βάσεις Δεδομένων Ανάκτηση Δεδομένων 3

Information Retrieval (3) Ανάκτηση Πληροφορίας: Όλοι έχουμε πρακτική εμπειρία με την ανάκτηση πληροφορίας: Η αναζήτηση δεδομένων στο διαδίκτυο με βάση τις μηχανές αναζήτησης είναι ένα χαρακτηριστικό παράδειγμα αναζήτησης πληροφορίας Αναζήτηση στο Διαδίκτυο: Σχηματίζουμε ένα ερώτημα με τους όρους που δίνουμε Παίρνουμε ως απάντηση μια λίστα διευθύνσεων ταξινομημένη με βάση το βαθμό σχετικότητάς τους Προαιρετικά επαναπροσδιορίζουμε το ερώτημα ώστε να βελτιώσουμε το αποτέλεσμα Βάσεις Δεδομένων Ανάκτηση Δεδομένων 4

Information Retrieval (4) Δύο πολύ βασικά κριτήρια την αξιολόγηση της ανάκτησης πληροφορίας: Ανάκληση (Recall): Πόσα από όλα τα σχετικά κείμενα που υπάρχουν βρέθηκαν Ακρίβεια (Precision): Από τα κείμενα που βρέθηκαν, πόσα έχουνπράγματισχέσημετηνερώτηση Τα δύο κριτήρια σχετίζονται άμεσα μεταξύ τους με ένα trade-off: Μπορούμε με προφανή τρόπο να βελτιώσουμε το ένα εις βάρος του άλλου Όσο πιο πολλά κείμενα συμπεριληφθούν στην απάντηση τόσο καλύτερο αναμένεται να είναι το recall όμως αντίστοιχα μπορεί να αυξηθεί και το ποσοστό των μη σχετικών κειμένων (μείωση του Precision) Βάσεις Δεδομένων Ανάκτηση Δεδομένων 5

Information Retrieval (5) Η λειτουργία ενός συστήματος Ανάκτησης Πληροφορίας για κείμενα (Ανάκτηση Κειμένων - Text Retrieval) περιλαμβάνει ορισμένα στάδια: Όλα τα κείμενα της συλλογής κειμένων αναλύονται Διακρίνονται οι λέξεις Κάθε λέξη ανάγεται στη ρίζα/λήμμα της λέξης Αξιολογείται η σημασία κάθε λέξης με βάση κριτήρια όπως: Σε πόσα κείμενα εμφανίζεται Πόσες φορές εμφανίζεται συνολικά Πόσες φορές εμφανίζεται στο υπό εξέταση κείμενο Λέξεις που είναι πολύ κοινές διαγράφονται από τους indexes της ανάκτηση πληροφορίας (stop list words) Η παραπάνω μεθοδολογία συμπληρώνεται με πιο προηγμένες τεχνικές: Χρήση θησαυρών λέξεων Εντοπισμό εκφράσεων (2 ή περισσότερες λέξεις μαζί) Σημασιολογική πληροφορία Βάσεις Δεδομένων Ανάκτηση Δεδομένων 6

Information Retrieval (6) Όταν εξετάζεται ένα ερώτημα τότε: Αναλύεται το ερώτημα με επεξεργασία όμοια με αυτή που αναλύονται τα μεμονωμένα κείμενα της συλλογής, δηλαδή διακρίνονται οι λέξεις του ερωτήματος ανάγεται (σε ορισμένες περιπτώσεις) κάθε λέξη στο λήμμα της λέξης Το επεξεργασμένο ερώτημα συγκρίνεται με όλα τα κείμενα της συλλογής Η σύγκριση του ερωτήματος με τα κείμενα της συλλογής μπορεί να γίνει αποδοτικά με χρήση αντεστραμμένων δεικτών (ένα είδος ευρετηρίου) Βάσεις Δεδομένων Ανάκτηση Δεδομένων 7

Full-Text Search Τα σύγχρονα ΣΔΒΔ υποστηρίζουν τεχνικές ανάκτησης κειμένων Συγκεκριμένα επιτρέπουν τον ορισμό indexes για full-text αναζήτηση σε στήλες που περιλαμβάνουν ελεύθερο κείμενο Βάσεις Δεδομένων Ανάκτηση Δεδομένων 8

Παράδειγμα σε Oracle (1) CREATE TABLE Documents ( CODE INTEGER CONSTRAINT PrimKey PRIMARY KEY, TITLE VARCHAR(40), TEXT VARCHAR(256) ); INSERT INTO Documents VALUES (1, 'Giannis', 'this is the text of the first document'); INSERT INTO Documents VALUES (2, 'Kostas', 'this is the text of the second document'); INSERT INTO Documents VALUES (3, 'Maria', 'this is the text of the third document'); INSERT INTO Documents VALUES (4, 'Eleni', 'this is the text of the forth document'); Βάσεις Δεδομένων Ανάκτηση Δεδομένων 9

Παράδειγμα σε Oracle (2) CREATE INDEX myindex ON documents(text) INDEXTYPE IS CTXSYS.CONTEXT; ALTER INDEX myindex rebuild; SELECT CODE, SCORE(1) text FROM documents WHERE CONTAINS(text, 'third', 1) > 0; SELECT CODE, SCORE(1) text FROM documents WHERE CONTAINS(text, 'document third', 1) > 0; SELECT CODE, SCORE(1) score, text FROM documents WHERE CONTAINS(text, 'document third', 1) > 0; Βάσεις Δεδομένων Ανάκτηση Δεδομένων 10

Text Retrieval στον SQL Server sp_fulltext_table sp_fulltext_catalog -- Execute a full-text query against the new table. SELECT article_title FROM FulltextTest WHERE CONTAINS(article_title, ' "Steven Buchanan" AND "ice skating" ') Βάσεις Δεδομένων Ανάκτηση Δεδομένων 11

Πηγές/Αναφορές Εγχειρίδια Oracle Εγχειρίδια SQL Server Βάσεις Δεδομένων Ανάκτηση Δεδομένων 12