ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ Ενότητα 7: Βάσεις Δεδομένων (Θεωρία) Πασχαλίδης Δημοσθένης Τμήμα Ιερατικών Σπουδών
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο TEI Δυτικής Μακεδονίας και στην Ανώτατη Εκκλησιαστική Ακαδημία Θεσσαλονίκης» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3
Σκοποί ενότητας Εισαγωγή στην έννοια των βάσεων δεδομένων και της χρήσης τους ως αφηρημένα εργαλεία για την αναζήτηση και εξαγωγή πληροφοριών με διαισθητικό τρόπο. 4
Περιεχόμενα ενότητας Ορισμοί - Βασικές Αρχές. Το Σχεσιακό Μοντέλο. Αντικειμενοστρεφείς Βάσεις Δεδομένων. Διατήρηση Ακεραιότητας Βάσης Δεδομένων. Παραδοσιακές δομές αρχείων. Εξόρυξη δεδομένων. Κοινωνικές επιπτώσεις. 5
Βάση Δεδομένων Ορισμός Μια συλλογή δεδομένων που είναι πολυδιάστατη. Οι εσωτερικές συνδέσεις μεταξύ των καταχωρήσεων καταστούν την πληροφορία προσιτή από διάφορες οπτικές γωνίες. 6
Βάση Δεδομένων Ορισμός 2 Βάση δεδομένων είναι μια οργανωμένη συλλογή δεδομένων τα οποία σχετίζονται μεταξύ τους. Ένα πρόγραμμα διαχείρισης βάσεων δεδομένων (όπως η Microsoft Access) επιτρέπει να καταχωρούμε, να οργανώνουμε και να επεξεργαζόμαστε δεδομένα. Τα δεδομένα και οι πληροφορίες που απορρέουν από αυτές έχουν κοινά χαρακτηριστικά, καθώς και συγκεκριμένο σκοπό ή θέμα. 7
Βάση Δεδομένων Ορισμός 3 Δεδομένα είναι οι τιμές που καταχωρούμε σε μια βάση δεδομένων. Μερικοί από τους συνηθισμένους τύπους δεδομένων που μπορούμε να καταχωρούμε στις βάσεις δεδομένων είναι: Κείμενο ~ Γραφικά ~ Αριθμοί ~ Ώρες ~ Εικόνες ~ Γραφήματα ~ Ημερομηνίες. 8
Βάση Δεδομένων Ορισμός 4 Πληροφορίες είναι τα δεδομένα που ανακτούμε από μια βάση δεδομένων, τα οποία είναι οργανωμένα με τέτοιον τρόπο ώστε να έχουν νόημα για το άτομο που τα εξετάζει. Άρα σε μια βάση δεδομένων αποθηκεύουμε δεδομένα και ανακτούμε πληροφορίες. 9
Οργάνωση αρχείων σε σχέση με οργάνωση βάσης δεδομένων. Σχήμα: Οργάνωση αρχείων σε σχέση με οργάνωση βάσης δεδομένων. Πηγή: BROOKSHEAR (2004). 10
Τα νοητικά επίπεδα υλοποίησης μιας βάσης δεδομένων Σχήμα: Τα νοητικά επίπεδα της υλοποίησης μιας βάσης δεδομένων. Πηγή: BROOKSHEAR (2004). 11
Ο ρόλος των σχημάτων Σχήμα: Μία περιγραφή της δομής μιας ολόκληρης βάσης δεδομένων που χρησιμοποιείται από το λογισμικό της ΒΔ για τη διατήρηση της ΒΔ. Subschema: Μια περιγραφή εκείνου μόνο του τμήματος της βάσης δεδομένων που είναι σχετικές με τις ανάγκες ενός συγκεκριμένου χρήστη. Χρησιμοποιείται για προστασία ευαίσθητων δεδομένων από μη εξουσιοδοτημένο προσωπικό. 12
Σύστημα Διαχείρισης Βάσεων Δεδομένων Σύστημα Διαχείρισης Βάσεων Δεδομένων (ΣΔΒΔ): Ένα επίπεδο λογισμικού που χειρίζεται μια βάση δεδομένων απαντώντας στα αιτήματα των εφαρμογών. Κατανεμημένη βάση δεδομένων: Μια βάση δεδομένων που αποθηκεύεται σε πολλούς υπολογιστές. Η ΣΔΒΔ αποκρύπτει αυτή την οργανωτική λεπτομέρεια από τους χρήστες της. Ανεξαρτησία δεδομένων : Η ικανότητα να αλλάζει η οργάνωση μιας βάσης δεδομένων χωρίς να αλλάζει το λογισμικό της εφαρμογής που την χρησιμοποιεί. 13
Μοντέλα βάσεων δεδομένων Μοντέλο βάσης δεδομένων: Μια νοητική εικόνα μιας βάσης δεδομένων. Σχεσιακό μοντέλο βάσης δεδομένων. Αντικειμενοστραφές μοντέλο βάσης δεδομένων. 14
Το Σχεσιακό Μοντέλο Σχέση - Relation: Ένας ορθογώνιος πίνακας. Χαρακτηριστικό - Attribute: Μια στήλη στον πίνακα. Πλειάδα - Tuple: Μια γραμμή στον πίνακα. 15
Μια σχέση που περιέχει πληροφορίες υπαλλήλων Σχήμα: Μια σχέση που περιέχει πληροφορίες υπαλλήλων. Πηγή: BROOKSHEAR (2004). 16
Σχεσιακός σχεδιασμός Αποφυγή πολλαπλών εννοιών μέσα σε μια σχέση Μπορεί να οδηγήσει σε πλεονάζοντα δεδομένα. Η διαγραφή μιας πλειάδας μπορεί να διαγράψει αναγκαίες, αλλά άσχετες πληροφορίες. 17
Βελτιώνοντας το σχεσιακό σχεδιασμό Διαίρεση - Decomposition: Ο διαχωρισμός των στηλών μιας σχέσης σε δύο ή περισσότερες σχέσεις, με επανάληψη των στηλών για να διατηρηθούν οι σχέσεις. Μη-απωλεστική διαίρεση: Μια «σωστή» διαίρεση που δεν χάνει καμία πληροφορία. 18
Μια σχέση που περιέχει πλεονασμό Σχήμα: Μια σχέση που περιέχει πλεονασμό. Πηγή: BROOKSHEAR (2004). 19
Βάση δεδομένων υπαλλήλων που αποτελείται από τρεις σχέσεις Σχήμα: Βάση δεδομένων υπαλλήλων που αποτελείται από τρεις σχέσεις. Πηγή: BROOKSHEAR (2004). 20
Εύρεση των υπηρεσιών στις οποίες έχει εργαστεί ο υπάλληλος 23Y34 Σχήμα: Εύρεση των υπηρεσιών στις οποίες έχει εργαστεί ο υπάλληλος 23Y34. Πηγή: BROOKSHEAR (2004). 21
Μια σχέση και μια προτεινόμενη διαίρεση Σχήμα: Μια σχέση και μια προτεινόμενη διαίρεση. Πηγή: BROOKSHEAR (2004). 22
Κανόνες σχεδιασμού σχεσιακής βάσης δεδομένων (1/2) Κάθε οντότητα πρέπει να παριστάνεται ως ένας ξεχωριστός πίνακας. Κάθε στήλη του πίνακα αντιστοιχεί σε μια ιδιότητα της οντότητας. Κάθε γραμμή πρέπει να είναι μοναδική. 23
Κανόνες σχεδιασμού σχεσιακής βάσης δεδομένων (2/2) Κάθε στήλη έχει μια δική της μοναδική ονομασία. Η στήλη που αποτελεί το πρωτεύον κλειδί μιας οντότητας, δεν πρέπει να είναι ποτέ κενή. Αποκλείεται να υπάρχουν δύο ή και περισσότερες γραμμές που να περιέχουν την ίδια τιμή στο πρωτεύον κλειδί. 24
Σχεσιακές λειτουργίες Select: επιλογή γραμμών (εγγραφών). Project: επιλογή στηλών. Join: Συγκεντρώνει πληροφορίες από δύο ή περισσότερες σχέσεις. 25
Η λειτουργία SELECT Σχήμα: Η λειτουργία SELECT. Πηγή: BROOKSHEAR (2004). 26
Η λειτουργία PROJECT Σχήμα: Η λειτουργία PROJECT. Πηγή: BROOKSHEAR (2004). 27
Η λειτουργία JOIN (1/2) Σχήμα: Η λειτουργία JOIN. Πηγή: BROOKSHEAR (2004). 28
Η λειτουργία JOIN (2/2) Σχήμα: Η λειτουργία JOIN. Πηγή: BROOKSHEAR (2004). 29
Μια εφαρμογή της λειτουργίας JOIN Σχήμα: Μια εφαρμογή της λειτουργίας JOIN. Πηγή: BROOKSHEAR (2004). 30
Structured Query Language (SQL) Operations to manipulate tuples. Insert. Update. Delete. Select. 31
SQL Examples select EmplId, Dept from ASSIGNMENT, JOB where ASSIGNMENT.JobId = JOB.JobId and ASSIGNMENT.TermData = * insert into EMPLOYEE values ( 43212, Sue A. Burt, 33 Fair St., 444661111 ) 32
SQL Examples (continued) delete from EMPLOYEE where Name = G. Jerry Smith update EMPLOYEE set Address = 1812 Napoleon Ave. where Name = Joe E. Baker 33
Εξόρυξη δεδομένων-data Mining Εξόρυξη δεδομένων: Ο τομέας της επιστήμης των υπολογιστών που ασχολείται με την ανακάλυψη προτύπων (patterns) σε συλλογές δεδομένων. Data Warehouse: Μία στατιστική συλλογή δεδομένων προς εξόρυξη. Data cube: Τα στοιχεία που παρουσιάζονται από πολλές οπτικές γωνίες για την ενεργοποίηση εξόρυξης. 34
Μορφές εξόρυξης δεδομένων Περιγραφή κλάσεων. Διάκριση κλάσεων. Ανάλυση συστάδων. Ανάλυση συσχτισμών. Ανάλυση αποκλίσεων. Σειριακή ανάλυση προτύπων. 35
Βιβλιογραφία BROOKSHEAR, J. G. (2004), Computer Science: An Overview, 9th Edition, ISBN13: 9780321247261. 36
Τέλος Ενότητας
Σημείωμα Αναφοράς Copyright Ανώτατη Εκκλησιαστική Ακαδημία ΘΕσσαλονίκης, Δημοσθένης Πασχαλίδης. «ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ». Έκδοση: 1.0. Θεσσαλονίκη 2015. 38
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Μη Εμπορική Χρήση Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] http://creativecommons.org/licenses/by-nc-sa/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο. που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο. που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο. Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. 39
Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς. το Σημείωμα Αδειοδότησης. τη δήλωση Διατήρησης Σημειωμάτων. το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει). μαζί με τους συνοδευόμενους υπερσυνδέσμους. 40
Σημείωμα Χρήσης Έργων Τρίτων Το Έργο αυτό κάνει χρήση των ακόλουθων έργων: Εικόνες/Σχήματα/Διαγράμματα/Φωτογραφίες. BROOKSHEAR, J. G. (2004), Computer Science: An Overview, 9th Edition, ISBN13: 9780321247261. 41