Βάσεις Δεδομένων. Database Management Systems (DBMS) Συστήματα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ)



Σχετικά έγγραφα
Διαχείριση Δεδομένων

Ramez Elmasri and Shamkant B. Navathe Ελληνική Εκδόσεις Δίαυλος, Επιμέλεια Μ.Χατζόπουλος Διαφάνεια 1-1

Διαχείριση Πολιτισμικών Δεδομένων

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο

Ανάκτηση Πληροφορίας Εισαγωγή

Ανάκτηση πληροφορίας

Βάσεις Δεδομένων. Βασίλειος Βεσκούκης 2006 Ρ.Κορακίτης, Β.Βεσκούκης, Θ.Καραλόπουλος, Γ.Πανόπουλος

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. 1 ο ΣΧΟΛΕΙΟ ΚΩΔΙΚΑ «Βασικά Θέματα Προγραμματισμού στην Ανάπτυξη Δυναμικών Διαδικτυακών Εφαρμογών» (Part 3) Ουρανία Σμυρνάκη

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Συστήματα Διαχείρισης Βάσεων Δεδομένων

Δεδομένα και Πληροφορίες

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

Απόστολος Παπαδόπουλος Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Πληροφορικής. Ακαδηµαϊκό Έτος

Έννοιες Διαχείρισης Βάσεων Δεδομένων και Αρχιτεκτονική

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εισαγωγή στα Συστήματα Βάσεων Δεδομένων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

Εισαγωγή στις βασικές έννοιες των Βάσεων Δεδομένων

Information Technology for Business

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Πληροφοριακού Συστήματος Ενημέρωσης Καιρικών Συνθηκών

Βάσεις εδοµένων. Βασίλειος Βεσκούκης, Εµµ. Στεφανάκης ΜΟΝΤΕΛΟΠΟΙΗΣΗ Ε ΟΜΕΝΩΝ, ΚΛΑΣΙΚΑ ΜΟΝΤΕΛΑ Ε ΟΜΕΝΩΝ

Ανάκτηση πληροφορίας

Πληροφορική ΙΙ Εισαγωγή στις Βάσεις Δεδομένων. Τμήμα Λογιστικής

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Επιβλέπων: ΠΟΤΗΡΑΚΗΣ ΑΝΤΩΝΙΟΣ

Εισαγωγή στην Πληροφορική

Ανάκτηση Πληροφορίας

Εισαγωγή στα Συστήµατα Βάσεων Δεδοµένων

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Information Retrieval

Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα

Αρχιτεκτονική Συστημάτων Βάσεων Δεδομένων. Κατηγορίες χρηστών ΣΔΒΔ Αρχιτεκτονική ANSI/SPARC Γλώσσες ερωτημάτων Μοντέλα δεδομένων Λειτουργίες ΣΔΒΔ

Ανάκτηση Δεδομένων (Information Retrieval)

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων. Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 1: Ορισμοί βασικών εννοιών: Μια πρώτη μοντελοποίηση. Ευαγγελίδης Γεώργιος Τμήμα Εφαρμοσμένης Πληροφορικής

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εισαγωγή στα Συστήματα Βάσεων Δεδομένων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Επεξεργασία Ερωτήσεων

Εισαγωγή στα Συστήµατα Βάσεων Δεδοµένων

Σχεδίαση Βάσεων Δεδομένων

Βάσεις Δεδομένων Ενότητα 1

Πληροφορική 2. Βάσεις Δεδομένων (Databases)

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

Βάσεις Δεδομένων Ι. 5 ο Φροντιστήριο. Πέρδικα Πολίνα [perdika]

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ - ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΒΔ - ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΟΝΤΕΛΟ ΟΝΤΟΤΗΤΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ

Εισαγωγή στην πληροφορική

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ

Διάμετροι και αποστάσεις πλανητών.

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Ερωτήσεις σε Ημι-δομημένα δεδομένα. 13/5/2008 Μ.Χατζόπουλος 1

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΔΕΔΟΜΕΝΑ ΚΑΙ ΠΛΗΡΟΦΟΡΙΕΣ

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΕΙΣΑΓΩΓΗ

Αποθηκευμένες Διαδικασίες Stored Routines (Procedures & Functions)

Εισαγωγή στα Συστήματα Βάσεων εδομένων

Επισκόπηση Μαθήµατος

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

Βάσεις Δεδομένων Ι Ευρετήρια/Indexes. (...και επιδόσεις ΣΔΒΔ) Views (Όψεις) Φώτης Κόκκορας (MSc/PhD) Τμήμα Τεχνολογίας Πληροφορικής & Τηλεπ/νιών

Εισαγωγή. Βάσεις Δεδομένων : Εισαγωγή 1

Information Retrieval

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ασκήσεις και ερωτήσεις

Ενότητα. Εισαγωγή στις βάσεις δεδομένων

Σχεδιασμός Βάσεων Δεδομένων

Βάσεις Δεδομένων. Ενότητα 3: Σχεδιασμός και Διαχείριση Βάσεων Δεδομένων. Αθανάσιος Σπυριδάκος Τμήμα Διοίκησης Επιχειρήσεων

Ανάκτηση Πληροφορίας

ΕΙΣΑΓΩΓΗ ΣΤΙΣ Β ΣΕ Ε Σ Ι ΟΜΕΝ

Διάλεξη 02: Βάσεις Δεδομένων Εισαγωγή. Διδάσκων: Παναγιώτης Ανδρέου

ΤΙΤΛΟΣ ΕΡΓΑΣΙΑΣ. Πετρογεωργάκης Μανούσος Σπυρόπουλος Σταύρος

Βάσεις Δεδομένων Εισαγωγή

Ψηφιακή οργάνωση πολιτισμικής πληροφορίας

MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole

MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole

Copyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση Διαφάνεια 16-1

Εισαγωγή. Καλή Ακαδημαϊκή Χρονιά! Τι θα δούμε σήμερα: Τα βασικά Την ιστορία (μέλλον) Μια γρήγορη ματιά στο τι θα δούμε στο μάθημα

Βάσεις δεδομένων. Π. Φιτσιλής

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Μονάδα Διασφάλισης Ποιότητας. ΜΟΔΙΠ Πανεπιστημίου Δυτικής Μακεδονίας. Κωδικός Πράξης ΟΠΣ: Επιχειρησιακό Πρόγραμμα:

Εισαγωγή στην Πληροφορική

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Συστήματα Πολυμέσων. Ανάπτυξη Πολυμεσικών Εφαρμογών Ι

Εισαγωγή στην Επιστήμη των Υπολογιστών

Δείχτες Επιτυχίας και Δείχτες Επάρκειας

MYE003: Ανάκτηση Πληροφορίας Διδάσκουσα: Ευαγγελία Πιτουρά. Κεφάλαιο 1: Εισαγωγή. Ανάκτηση Boole

Διαχείριση Πολιτισμικών Δεδομένων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

Επεξεργασία Ερωτήσεων

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

ΕΠΛ 001: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗς ΠΛΗΡΟΦΟΡΙΚΗΣ. Εφαρμογές της Πληροφορικής

Εισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων

Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών

Από τα Δεδομένα στην Πληροφορία: Διδακτικό Σενάριο για Εισαγωγή στη Γλώσσα SQL. Σ. Φίλου Β. Βασιλάκης

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business.

ΟΝΟΜΑΤΕΠΩΝΥΜΟ : Αντικείμενα: Βάσεις δεδομένων, σχέσεις μεταξύ πινάκων, ερωτήματα, φόρμες και αναφορές.

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος

ΣΥΣΤΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΕΠΙΧΕΙΡΗΜΑΤΙΚΩΝ ΠΟΡΩΝ

Transcript:

Βάσεις Δεδομένων Συστήματα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ) Database Management Systems (DBMS) Αυγερινός Αραμπατζής avi@ee.duth.gr www.aviarampatzis.com

Περιεχόμενα 1. Παραδοσιακές και νέες εφαρμογές ΒΔ 2. Ορισμός ΒΔ και ΣΔΒΔ, παραδείγματα 3. Χαρακτηριστικά ΒΔ σε σύγκριση με επεξεργασία αρχείων 4. Εργαζόμενοι με ΒΔ και ΣΔΒΔ 5. Πλεονεκτήματα χρήσης ΣΔΒΔ 6. Πότε δεν πρέπει να χρησιμοποιείται ΣΔΒΔ / μειονεκτήματα 7. Συγγενικά αντικείμενα: Εξόρυξη Δεδομένων, Ανάκτηση Πληροφοριών 8. Κοινωνικές επιπτώσεις Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 2

Εφαρμογές Βάσεων Δεδομένων Παραδοσιακές εφαρμογές Τράπεζες, κρατήσεις ξενοδοχείου/ταξιδιού, κατάλογος βιβλιοθήκης, web-shop, supermarket Νέες εφαρμογές Οι περισσότερες αποθηκευμένες πληροφορίες είναι κείμενο ή αριθμοί. ΒΔ πολυμέσων (εικόνες, video, ήχος) Γεωγραφικά πληροφοριακά συστήματα (χάρτες, καιρός) ΒΔ πραγματικού χρόνου, χρονο-σειρών (οικονομικά δεδομένα) Ενεργές ΒΔ (έλεγχος βιομηχανικών & παραγωγικών διαδικασιών) Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 3

Οργάνωση αρχείων vs. οργάνωση βάσης δεδομένων 4

Βάση Δεδομένων Αναπαριστά κάποια άποψη του πραγματικού κόσμου (μικρόκοσμος), πχ. τμήμα ΗΜΜΥ Αλλαγές στο μικρόκοσμο αντανακλώνται στη ΒΔ Λογικά συνεκτική συλλογή δεδομένων κάποιας εγγενής σημασίας Μια τυχαία διευθέτηση δεδομένων δεν είναι ΒΔ Σχεδιάζεται, χτίζεται, και γεμίζει με δεδομένα, για κάποιο συγκεκριμένο σκοπό Προορίζεται για συγκεκριμένες ομάδες χρηστών (πχ. Καθηγητές, Γραμματεία, κλπ) και προκαθορισμένες εφαρμογές (πχ. Βαθμολόγιο). Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 5

Σύστημα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ) Μία συλλογή προγραμμάτων που επιτρέπουν δημιουργία και συντήρηση μιας ΒΔ δλδ, είναι γενικής χρήσης σύστημα λογισμικού Διευκολύνει τον ορισμό, κατασκευή, χειρισμό, και διαμοιρασμό ΒΔ, για διάφορες εφαρμογές πχ. MySQL, Oracle, Microsoft Access, κ.α. Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 6

Ένα απλουστευμένο Σύστημα ΒΔ Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 7

Τα νοητικά επίπεδα της υλοποίησης μιας βάσης δεδομένων 8

Παράδειγμα ΒΔ: Πανεπιστήμιο Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 9

Χαρακτηριστικά των ΒΔ Σε σύγκριση με την οργάνωση/επεξεργασία αρχείων, οι ΒΔ προσφέρουν: Αυτο-περιγραφική φύση κατάλογος με μετα-δεδομένα Απομόνωση προγραμμάτων από δεδομένα, αφαίρεση δεδομένων Πολλαπλές όψεις δεδομένων / Παραγόμενα δεδομένα Κοινή χρήση δεδομένων και επεξεργασία δοσοληψιών από πολλούς χρήστες Έλεγχος ταυτόχρονης προσπέλασης Δοσοληψίες (απομόνωση, ατομικότητα) Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 10

Εργαζόμενοι με ΒΔ - προσκήνιο Διαχειριστές Σχεδιαστές Διαχείριση λογισμικού ΣΔΒΔ και απαραίτητου υλικού Εξουσιοδότηση προσπέλασης, ασφάλεια Υπεύθυνοι για την απόδοση του συστήματος Επικοινωνία με του χρήστες, κατανόηση των απαιτήσεων, σχεδιασμός ΒΔ, δημιουργία όψεων για διαφορετικές ομάδες χρηστών Τελικοί χρήστες Περιστασιακοί, απλοϊκοί, εξειδικευμένοι, μεμονωμένοι Εισαγωγή στοιχείων, ενημέρωση, ανάκτηση Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 11

Εργαζόμενοι με ΒΔ - παρασκήνιο Σχεδιαστές και κατασκευαστές των ΣΔΒΔ Υλοποίηση καταλόγου, γλώσσας επερωτήσεων, επεξεργαστών διεπαφής, προσπέλασης δεδομένων, ασφάλειας Επικοινωνία του ΣΔΒΔ με λειτουργικό και μεταγλωττιστές Κατασκευαστές (προαιρετικών) εργαλείων Πακέτα διευκόλυνσης σχεδιασμού και χρήσης ΒΔ, παρακολούθησης απόδοσης, διεπαφές φυσικής γλώσσας ή γραφικών, κ.α. Χειριστές και προσωπικό συντήρησης λειτουργία και συντήρηση του περιβάλλοντος υλικού & λογισμικού Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 12

Πλεονεκτήματα χρήσης ΣΔΒΔ (1/6) Έλεγχος των πλεονασμών Μείωση μόχθου, χώρου, ασυμβατότητας Περιορισμός μη-εξουσιοδοτημένης προσπέλασης Μόνιμες δομές δεδομένων & αντικείμενα προγραμμάτων Αποτελεσματική επεξεργασία επερωτήσεων Ευρετήρια, ενδιάμεση μνήμη, βελτιστοποίηση Παροχή μηχανισμών εφεδρικών αντιγραφών και ανάκαμψης Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 13

Πλεονεκτήματα χρήσης ΣΔΒΔ (2/6) Πολλαπλές διεπαφές (interfaces) χρηστών Γλώσσες επερωτήσεων, πχ SQL Φόρμες και κωδικούς εντολών Διεπαφές μενού / GUI (πχ phpmyadmin) Διεπαφές φυσικής γλώσσας Διεπαφές γλωσσών προγραμματισμού C++, php (για εφαρμογές Web) Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 14

Πλεονεκτήματα χρήσης ΣΔΒΔ (3/6) Παράσταση πολύπλοκων συσχετίσεων μεταξύ των δεδομένων Επιβολή περιορισμών ορθότητας Τύπων δεδομένων (πχ INT, CHAR, κλπ) Συσχετίσεων πχ κάθε Διδασκαλία πρέπει να σχετίζεται με ένα Μάθημα Μοναδικότητα τιμών πχ αριθμός μητρώου Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 15

Πλεονεκτήματα χρήσης ΣΔΒΔ (4/6) Συμπερασμός με χρήση κανόνων Πχ, προσδιορισμός προαγωγής φοιτητή Δραστηριότητες με χρήση κανόνων Ενεργές ΒΣ: ενεργούς κανόνες που ενεργοποιούν αυτόματα ενέργειες όταν συμβούν κάποια γεγονότα και συνθήκες Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 16

Πλεονεκτήματα χρήσης ΣΔΒΔ (5/6) Επιβολή τυποποίησης σε μεγάλους οργανισμούς Μείωση χρόνου ανάπτυξης εφαρμογών Η ανάπτυξη εκτιμάται μεταξύ 1/6 και 1/4 Ευελιξία / εύκολη αλλαγή δομής ΒΔ ανάλογα με νέες απαιτήσεις Νέα ομάδα χρηστών Νέο αρχείο Επέκταση αρχείου Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 17

Πλεονεκτήματα χρήσης ΣΔΒΔ (6/6) Διαθεσιμότητα ενημερωμένων πληροφοριών Η ενημέρωση από ένα χρήστη είναι αυτόματα διαθέσιμη σε όλους τους χρήστες Οικονομία κλίμακας Ενοποίηση δεδομένων και εφαρμογών, ελαττώνοντας άχρηστες επικαλύψεις Λιγότερο υλικό / εξοπλισμός Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 18

Πότε δεν πρέπει να χρησιμοποιούνται ΣΔΒΔ Η ΒΔ και εφαρμογές είναι απλές και καλά ορισμένες, και δεν αναμένεται να αλλάξουν Πιεστικές απαιτήσεις λειτουργίας σε πραγματικό χρόνο Δεν απαιτείται προσπέλαση πολλών χρηστών Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 19

Συγγενικό Αντικείμενο: Εξόρυξη Δεδομένων (Data Mining) Ο τομέας της επιστήμης υπολογιστών που ασχολείται με την ανακάλυψη προτύπων σε συλλογές δεδομένων Αποθήκη δεδομένων: Μια στατική συλλογή δεδομένων απ όπου θα γίνει η εξόρυξη Σημαντικό εργαλείο σε: Μάρκετινγκ, διαχείριση αποθήκης, έλεγχο ποιότητας, εντοπισμό απάτης, κ.α. Είδαμε κάποιες τεχνικές στο μάθημα Ανάκτηση Πληροφοριών και Εξόρυξη Δεδομένων (6ο εξ.) Classification & clustering (for text documents) Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 20

Συνηθισμένες Στρατηγικές Εξόρυξης Δεδομένων Περιγραφή κλάσεων (Classification) Ποιοι αγοράζουν μικρά οικονομικά οχήματα; Διάκριση κλάσεων (Classification) Αγορά μεταχειρισμένου vs καινούργιου αυτοκινήτου Ανάλυση συστάδων (Clustering, Cluster labeling) Δύο συστάδες θεατών μιας ταινίας: 4-10 και 25-40 ετών. Ανάλυση συσχετισμών Αγορά μπύρας -> Αγορά ξηρών καρπών Ανάλυση αποκλίσεων Υποκλοπή στοιχείων πιστωτικής κάρτας Σειριακή ανάλυση προτύπων Οικονομικά συστήματα, κλιματολογικές συνθήκες

Συγγενικό Αντικείμενο: Ανάκτηση Πληροφοριών είναι η εύρεση υλικού, κυρίως εγγράφων (documents) αδόμητης φύσης (unstructured) που συνήθως έχουν τη μορφή κειμένου (text), το οποίο ικανοποιεί μια ανάγκη πληροφόρησης (information need) από μεγάλες συλλογές (συνήθως αποθηκευμένες σε υπολογιστές)

Ανάκτηση Πληροφοριών vs Βάσεις Δεδομένων (1/4) Δομημένα δεδομένα συνήθως αναφέρονται σε δεδομένα σε Πίνακες ( tables ) Employee Manager Salary Smith Jones 50000 Chang Smith 60000 Ivy Smith 50000 Ερωτήματα: π.χ. Salary < 60000 AND Manager = Smith. 23

Ανάκτηση Πληροφοριών vs Βάσεις Δεδομένων (2/4) Ερώτημα SQL: SELECT όνομα FROM πλανήτες WHERE δορυφόροι < 3 κωδικός όνομα διάμετρος δορυφόροι 1 Ερμής 4880 0 2 Αφροδίτη 12103.6 0 3 Γη 12756.3 1 4 Αρης 6794 2 5 Δίας 142984 63 6 Κρόνος 120536 34 7 Ουρανός 51118 21 8 Ποσειδώνας 49532 13 9 Πλούτωνας 2274 3 Το ερώτημα είναι σαφές, προσδιορίζει επακριβώς τη συνθήκη που πρέπει να ικανοποιεί κάθε αποτέλεσμα που εμφανίζεται στην έξοδο.

Ανάκτηση Πληροφοριών vs Βάσεις Δεδομένων (3/4) Συλλογή εγγράφων d1 : Ο κομήτης του Χάλεϋ μας επισκέπτεται περίπου κάθε εβδομήντα έξι χρόνια. d2 : Ο κομήτης του Χάλεϋ πήρε το όνομά του από τον αστρονόμo Εντμοντ Χάλεϋ. d3 : Ενας κομήτης διαγράφει ελλειπτική τροχιά. d4 : Ο πλανήτης Αρης έχει δύο φυσικούς δορυφόρους, το Δείμο και το Φόβο. d5 : Ο πλανήτης Δίας έχει 63 γνωστούς φυσικούς δορυφόρους. d6 : Ενας κομήτης έχει μικρότερη διάμετρο από ότι ένας πλανήτης. d7 : Ο Αρης είναι ένας πλανήτης του ηλιακού μας συστήματος. Πληροφοριακή ανάγκη: πληροφορίες για τον κομήτη του Χάλεϋ Ερώτημα: Χάλεϋ Διαισθητικά αντιλαμβανόμαστε ότι τα έγγραφα d1 και d2 σχετίζονται περισσότερο με το ερώτημα από ότι τα υπόλοιπα έγγραφα.

Ανάκτηση Πληροφοριών vs Βάσεις Δεδομένων (4/4) Χαρακτηριστικό ΣΔΒΔ ΣΑΠ είδος δεδομένων δομημένα αδόμητα, ημι-δομημένα τύπος δεδομένων αριθμητικά, αλφαριθμητικά έγγραφα (κειμένου) γλώσσα ερωτημάτων SQL φυσική γλώσσα, λέξεις κλειδιά (keywords) ερώτημα σαφές ασαφές αποτελέσματα χωρίς βαθμολόγηση βαθμολογημένα

Ημιδομημένα δεδομένα Στην πραγματικότητα, δεν υπάρχουν αμιγώς μη-δομημένα δεδομένα π.χ., αυτή η διαφάνεια έχει διακριτές ζώνες όπως Title και Bullets Web pages? «Ημιδομημένη» αναζήτηση όπως: Title contains data AND Bullets contain search και βέβαια υπάρχει πάντα η γλωσσική δομή 27

Αδόμητα (κείμενο) vs. Δομημένα (βάσεις δεδομένων) δεδομένα το 1996 28

Αδόμητα (κείμενο) vs. Δομημένα (βάσεις δεδομένων) δεδομένα το 2009 29

Κοινωνικές Επιπτώσεις της Τεχνολογίας των ΒΔ Προβλήματα Συλλέγονται μεγάλες ποσότητες προσωπικών δεδομένων Συχνά χωρίς τη γνώση ή τη ρητή αποδοχή των επηρεαζόμενων ανθρώπων Η συγχώνευση δεδομένων παράγει νέες, πιο διεισδυτικές πληροφορίες Τα σφάλματα διασπείρονται σε μεγάλο βαθμό και είναι δύσκολο να διορθωθούν Λύσεις Οι υπάρχουσες νομικές επανορθώσεις είναι συχνά δύσκολο να εφαρμοστούν Η αρνητική δημοσιότητα μπορεί να είναι πιο αποτελεσματική Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 30

Αναφορές Βιβλίο μαθήματος, Κεφάλαιο 1 Cristopher D. Manning, Prabhakar Raghavan and Hinrich Schutze. Εισαγωγή στην Ανάκτηση Πληροφοριών, Κεφ. 1. J. Glenn Brookshear, Η Επιστήμη των Υπολογιστών: Μια Ολοκληρωμένη Παρουσίαση (δέκατη αμερικανική έκδοση), Κεφ. 9. Βάσεις Δεδομένων Συστήματα Διαχείρησης Βάσεων Δεδομένων (ΣΔΒΔ) 31