Συστήματα Διαχείρισης Βάσεων Δεδομένων Εβδομάδα 6η: 16 Δεκεμβρίου Δρ. Σιασιάκος Κωνσταντίνος ΑΤΕΙ-Χαλκίδας Σχολή Διοίκησης και Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων
Βιβλιογραφία 1. HTML Μαθήματα από το απλό στο σύνθετο. Δρ. Συμεών Ρετάλης, Γιώργος Τσέλιος. Εκδόσεις Καστανιώτη. 2. Συστήματα Διαχείρισης Βάσεων Δεδομένων. Raghu Ramakrishnan, Johannes Gehrke. Δεύτερη Έκδοση. Εκδόσεις Τσιόλα. 3. Εισαγωγή στην επικοινωνία ανθρώπου υπολογιστή. Ν. Αβούρης. Εκδόσεις Δίαυλος. 4. Τεχνολογία Πολυμέσων. Θεωρία και Πράξη. Σ.Ν. Δημητριάδης, Α.Σ. Πομπόρτσης, Ε.Γ. Τριανταφύλλου. Εκδόσεις Τσιόλα. 5. Internet 6 se 1. Joe Kraynak & Joe Habraken. Εκδόσεις Β. Γκιούρδας. Σελίδα 1
ΒΑΣΕΙΣΔΕΔΟΜΕΝΩΝ - Ορισμοί ΔΕΔΟΜΕΝΑ (DATA) Γνωστά γεγονότα / περιστατικά που καταγράφονται και έχουν νόημα ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ (DATABASE) Μία ΟΛΟΚΛΗΡΩΜΕΝΗ συλλογή Δεδομένων που συσχετίζονται, η οποία αποθηκεύεται (συνήθως) σε δευτερεύουσα Μνήμη ΗΒάση Δεδομένων αναπαριστά ένα υποσύνολο των στοιχείων που μπορούμε να συλλέξουμε για τον μικρόκοσμο(πεδίο αναφοράς) μιας εφαρμογής. ΣΥΣΤΗΜΑ ΔΙΟΙΚΗΣΗΣ / ΔΙΑΧΕΙΡΙΣΗΣ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ (DATABASE MANAGEMENT SYSTEM - DBMS) Μια αυτοτελής συλλογή από τμήματα λογισμικού (προγράμματα) για την δημιουργία, επεξεργασία και την συντήρηση βάσεων δεδομένων. ΣΥΣΤΗΜΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ (DATABASE SYSTEM) Το λογισμικό (DBMS) μαζί με τη Βάση Δεδομένων. Σελίδα 2
ΗΙεραρχίατων Δεδομένων Βάση Δεδομένων Μια συλλογή Αλληλένδετων Δεδομένων Αρχείο Μια συλλογή όμοιων εγγραφών Last Name Adams Jefferson Αρχείο Προσωπικών Δεδομένων First Name George Mary Αρχείο Ιστορίας πιστώσεων Address 123 Lancelot Dr. 1779 Washington Ave. Αρχείο Δεδομένων Συναλλαγών Phone Number 704-555-1234 704-555-6789 SSN 987-76-5432 123-45-6789 Εγγραφή Πεδίο Byte Bit Jefferson Mary 1779 Washington Ave. 704-555-6789 123-45-6789 Jefferson (Last Name) Mary (First Name) 1779 Washington Ave. (Address) 704-555-6789 (Phone Number) 1234-56-789 (Social Security No.) M A R Y 0 (or 1) Σελίδα 3
Οπαραδοσιακόςτρόποςεπεξεργασίαςφακέλων Το κάθε τμήμα στην επιχείρηση αναπτύσσει τις δικές του ειδικές εφαρμογές. Αυτές χρειάζονται στοιχεία από ένα αρχείο που είναι συνήθως υποσύνολο του συνολικού αρχείου. Αυτά τα υποσύνολα οδηγούν σε πολλά διπλά και τριπλά δεδομένα, ανελαστικότητα στην επεξεργασία και χαμένο αποθηκευτικό χώρο Σελίδα 4
Ονέοςτρόποςενοποίησηςτων βάσεων δεδομένων Σελίδα 5
Problems with the Traditional File Environment Data redundancy Program-Data dependence Lack of flexibility Poor security Lack of data-sharing and availability Σελίδα 6
ΤαΤέσσεραβασικάμέρη ενόςσυστήματοςδιαχείρισης ΒΔ (DBMS) DBMS Γλώσσα Ορισμού Δεδομένων Ορίζει τη δομή και το περιεχόμενο της ΒΔ Γλώσσα Χειρισμού Δεδομένων Χειρίζεται τα Δεδομένα για τις Εφαρμογές που Χρησιμοποιούν Τη ΒΔ Λεξικό Δεδομένων Ένα ηλεκτρονικό κείμενο που παρέχει αναλυτικές πληροφορίες για κάθε δεδομένο που βρίσκεται στην ΒΔ. (Δικαιώματα χρηστών, υπεύθυνος ενημέρωσης της ΒΔ κ.α.) Υπηρεσίες και Αναφορές Λογισμικό που παράγει αναφορές και καθιστά την Βάση Δεδομένων user-friendly Σελίδα 7
ΧαρακτηριστικάκαιΙδιότητεςτων DBMS Αυτοπεριγραφική Φύση των Συστημάτων Βάσεων Δεδομένων Ομογένεια στην Δημιουργία, Πρόσβαση και Έλεγχο των Δεδομένων Μοίρασμα (SHARING) δεδομένων και χρήση από πολλούς χρήστες Υποστήριξη κανόνων Ακεραιότητας, Ασφάλειας, Δικαιοδοσίας στα Δεδομένα Κεντρικός έλεγχος Λειτουργίας (Database Administration) Πολλαπλοί Τρόποι Πρόσβασης Έλεγχος Συνδρομικότητας και Μηχανισμοί για Ανάκαμψη Τυποποιήσεις Αύξηση της Παραγωγικότητας στην Ανάπτυξη Εφαρμογών Απομόνωση Προγραμμάτων και Δεδομένων ΑΦΑΙΡΕΣΗ ΔΕΔΟΜΕΝΩΝ (Abstraction) ΑΠΟΔΟΣΗ!!! (Performance - Performance Performance) Σελίδα 8
ΜοντέλαΔεδομένων Φυσικό μοντέλο: Οργάνωση και παρουσίαση των δεδομένων όπως αυτά είναι αποθηκευμένα στα μέσα αποθήκευσης Λογικό μοντέλο: Οργάνωση και παρουσίαση των δεδομένων όπως τα αντιλαμβάνεται ο τελικός χρήστης της εφαρμογής Σελίδα 9
Οργάνωση Βάσεων Δεδομένων Ιεραρχικόμοντέλοδεδομένων (Hierarchical Data Model) Δικτυωτόμοντέλοδεδομένων (Network Data Model) Σχεσιακό μοντέλο δεδομένων (Relational Data Model) Αντικειμενοστραφήςμοντέλοδεδομένων (Object-oriented Model) Σελίδα 10
File Organization Terms and Concepts Entity: Person, place, thing, event about which information is maintained Attribute: Description of a particular entity Key field: Identifier field used to retrieve, update, sort a record Σελίδα 11
Entitities and Attributes Σελίδα 12
Μιαιεραρχική βάση δεδομένων γιαένα σύστημαανθρώπινουδυναμικού Αναπαράσταση δεδομένων σε μορφή δένδρου Αλλαγές απαιτούν μεγάλο κόστος Μικρή ευελιξία Συστήματα κράτησης αεροπορικών θέσεων Σελίδα 13
Network DBMS Αναπαράσταση δεδομένων σε μορφή δικτύου (παραλλαγή του Ιεραρχικού μοντέλου) Χρήσιμο για σχέσεις M-Μ Μειώνει τον πλεονασμό της πληροφορίας Δύσκολη συντήρηση & αλλαγή Παράδειγμα: Φοιτητές & μαθήματα που παρακολουθούν Σελίδα 14
Hierarchical and Network DBMS Disadvantages Outdated Less flexible compared to RDBMS Lack support for ad-hoc and English language-like queries Σελίδα 15
Οργάνωση Βάσεων Δεδομένων: Σχεσιακό μοντέλοδεδομένων Αναπαράσταση δεδομένων σε μορφή δυσδιάστατων πινάκων που ονομάζονται ΣΧΕΣΕΙΣ Πίνακας: ΣΧΕΣΗ Γραμμή: ΕΓΓΡΑΦΗ (ή TUPLE) Στήλη: ΠΕΔΙΟ Βασικές πράξεις επί των πινάκων (ΣΧΕΣΕΩΝ): Select: Επιλέγει τις εγγραφές από τον αντίστοιχο πίνακα οι οποίες πληρούν κάποια συνθήκη και κατασκευάζει ένα νέο πίνακα. Join: Ενώνει πίνακες με βάση κάποιο κοινό τους ΠΕΔΙΟ Project: Κατασκευάζει ένα νέο πίνακα θεωρώντας ένα υποσύνολο των στηλών κάποιου άλλου πίνακα Είδη συσχετίσεων ανάμεσα στους πίνακες: ΕΝΑ-ΠΡΟΣ-ΕΝΑ (1:1) ΕΝΑ-ΠΡΟΣ-ΠΟΛΛΑ (1:Ν) ΠΟΛΛΑ-ΠΡΟΣ-ΠΟΛΛΑ (Ν:Μ) Σελίδα 16
Το σχεσιακό μοντέλο δεδομένων Σελίδα 17
Three Basic Operations in a Relational Database Select: Select: Creates subset of rows that meet specific criteria Join: Join: Combines relational tables to provide users with information Project: Project: Enables users to create new tables containing only relevant information Σελίδα 18
Object-Oriented Databases Object-oriented DBMS: Stores data and procedures as objects that can be retrieved and shared automatically Object-relational DBMS: Provides capabilities of both objectoriented and relational DBMS Σελίδα 19
ΔημιουργίαΒάσηςΔεδομένων Νοητή Σχεδίαση Αφαιρετικό μοντέλο από την επιχειρηματική πλευρά Ομαδοποίηση δεδομένων Σχέσεις ανάμεσα στα διάφορα στοιχεία Καταγραφή των αναγκών των χρηστών Σελίδα 20
ΔημιουργίαΒάσηςΔεδομένων Φυσική σχεδίαση Κατασκευή λεπτομερούς μοντέλου από ειδικούς σε ΒΔ Διάγραμμα οντοτήτων-συσχετίσεων (E-R Diagram) Κανονικοποίηση ΒΔ (εξάλειψη πλεοναζόντων στοιχείων και απλοποίηση συσχετίσεων) Υλοποίηση σύμφωνα με διαθέσιμο Υλικό / Λογισμικό Σελίδα 21
Data Independence Applications insulated from how data is structured and stored. Logical data independence: Protection from changes in logical structure of data. Physical data independence: Protection from changes in physical structure of data. * One of the most important benefits of using a DBMS! Σελίδα 22
Η γλώσσα ΤεχνολογίαΔιοίκησηςΔεδομένων SQL - παγκόσμια σταθερά σε ΒΔ Sequel 75 (System R) SQL86 H Πρώτη προσπάθεια για τυποποίηση SQL89 referential integrity SQL92 SQL3 agents, client/server, embedded SQL, dynamic SQL (cursors), temporary tables, standard error codes object SQL Ιδιότητες αρμονία με DCE, X/Open multimedia (text, audio, video, BLOBs) Σελίδα 23
Διοικητικές Απαιτήσεις για Συστήματα ΒάσεωνΔεδομένων ΔΙΟΙΚΗΣΗ ΔΕΔΟΜΕΝΩΝ ΤΕΧΝΟΛΟΓΙΑ & ΔΙΑΧΕΙΡΙΣΗ ΒΔ ΣΥΣΤΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ ΜΕΘΟΔΟΛΟΓΙΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΜΟΝΤΕΛΟΠΟΙΗΣΗΣ ΔΕΔΟΜΕΝΩΝ ΧΡΗΣΤΕΣ Σελίδα 24
ΟΙΧΡΗΣΤΕΣΤΩΝ DBMS Διαχειριστές (Database Administrators) Υπεύθυνοι για την διαχείριση της Βάσης (βοηθούν χρήστες να ορίζουν όψεις, επιλέγουν εναλλακτικές δομές μνήμης και μεθόδους πρόσβασης, επίσης είναι υπεύθυνοι για την ασφάλεια και την ακεραιότητα της Βάσης, για την απόδοση του Συστήματος, κλπ.) Σχεδιαστές (Database Designers) Υπεύθυνοι για τον Σχεδιασμό και Ανάπτυξη της Βάσης Αναλυτές Συστημάτων και Προγραμματιστές (Application Programmers / Systems Analysts) Αναπτύσσουν τις Εφαρμογές Τελικοί Χρήστες (End-Users) Κάνουν χρήσεις των εφαρμογών, κάνουν ερωταποκρίσεις, κλπ. Περιστασιακοί (CASUAL USERS), Παραμετρικοί (PARAMETRIC) (π.χ., ταμίας τραπέζης έτοιμα από την εφαρμογή) και Εξειδικευμένοι (SOPHISTICATED) Σελίδα 25
ΑΛΛΟΙΣΗΜΑΝΤΙΚΟΙΧΡΗΣΤΕΣ Database Designers and Implementers Αυτοί που αναπτύσσουν τα ΙΔΙΑ τα DBMS Tool Developers Αυτοί που αναπτύσσουν εργαλεία για καλύτερη χρήση των DBMS (design tools, performance tools, ειδικές προσβάσεις / διεπαφές.) Operators and Maintenance Personnel Βοηθούν τον Διαχειριστή, κάνουν συντήρηση, κλπ. Σελίδα 26
Βασικές Αρχές της Επιτυχημένης Διαχείρισης ΒΔ (1/2) Χρήση της ΒΔ για βελτίωση της Λήψης Αποφάσεων Πολλές εταιρίες συλλέγουν τεράστιους όγκους δεδομένων, αλλά λίγες τους χρησιμοποιούν σωστά Μια εταιρία μπορεί να κερδίσει και να διατηρήσει τους πελάτες της με το να αναλύει προσεκτικά τα δεδομένα Οι ΒΔ είναι ανταγωνιστικά <<όπλα>> στα χέρια των επιχειρήσεων Πολλές εταιρίες ψάχνουν εξονυχιστικά διάφορες δημόσιες ΒΔ για χρήσιμες πληροφορίες που θα τις ωφελήσουν σε σχέση με άλλες. Σελίδα 27
Βασικές Αρχές της Επιτυχημένης Διαχείρισης ΒΔ (2/2) Ησχεδίαση της Βάσης θα πρέπει να ικανοποιούν τις ανάγκες για επικοινωνία του χρήστη Η αποθηκευμένη στην ΒΔ πληροφορία πρέπει να είναι εύκολο να ανακτηθεί από οποιονδήποτε που την χρειάζεται για να λάβει αποφάσεις Σχεδίαση για διασφάλιση της Βάσης Μια ΒΔ με πολύτιμα δεδομένα επιβάλλεται να φυλάσσεται Οι επιχειρηματίες θα πρέπει να σχεδιάζουν τον προϋπολογισμό τους με γνώμονα ότι για λόγους ασφαλείας θα πρέπει να αναβαθμίζουν συνεχώς τις δικλίδες της ΒΔ καθώς εξελίσσεται η τεχνολογία Σελίδα 28
Γλώσσεςσεένα DBMS (1) Γλώσσα Ορισμού των Δεδομένων -Data Definition Language (DDL) Χρησιμοποιείται για να ορισθεί το conceptual schema της Βάσης Αυτό αποθηκεύεται στον Κατάλογο (CATALOG). Συχνά, η DDL χρησιμοποιείται για τον ορισμό όψεων και φυσικών δομών. Σε ορισμένα DBMS γίνεται διαχωρισμός μεταξύ: SDL - Storage Definition Language (φυσικές( δομές) VDL - View Definition Language (όψεις( όψεις) Γλώσσα Επεξεργασίας Δεδομένων -Data Manipulation Language (DML) - Για την πρόσβαση (retrieval) και αλλαγές των δεδομένων (insert, delete, update) - Δυο βασικές οικογένειες: : Procedural DML, Declarative DML Σελίδα 29
Γλώσσες σε ένα DBMS (2) Query Language Ένα υποσύνολο μόνο για ερωταποκρίσεις - RETRIEVAL Data Sub-language Η DML και η DDL μαζί. Host Language Μια ΓΛΩΣΣΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ (COBOL, C, etc..) όπου εμφυτεύονται εντολές της DML Σελίδα 30
DBMS: ΤρόποιΠρόσβασης Αυτόνομη Query language Interface API (Application Programming Interface) για εμφυτευμένες Γλώσσες Pre-Compiler Procedure Calls (subroutines) Προσβάσεις μη-τεχνικών Χρηστών Menu-based, graphics-based, forms-based, φυσική γλώσσα, κλπ. Παραμετρικές Προσβάσεις (function keys) Προσβάσεις για Αναφορές RGL) Πρόσβαση του Διαχειριστή - DBA Δημιουργία Λογαριασμών, Δικαιοδοσίες, κλπ Ρύθμιση παραγόντων Συστήματος Αλλαγές Περιγραφών, Δομών, κλπ. Σελίδα 31
Βήματαγιατην Χρήση ενός DBMS Προμήθεια του DBMS Εκπαίδευση Χρηστών Ορισμός των περιγραφών (Schemas) της Βάσης Εισαγωγή Δεδομένων στη Βάση Υλοποίηση των Προγραμμάτων της Εφαρμογής Συνεχείς ΑΛΛΑΓΕΣ στη Βάση και την Εφαρμογή Σελίδα 32
ΓιατίΝΑ ΜΗΝ χρησιμοποιήσω DBMS ;;; Κόστος Υψηλότατη αρχική επένδυση Τεράστιο Πρόσθετο Κόστος (Overhead) για την ασφάλεια, ανάκαμψη ακεραιότητα, και συνδρομικότητα (κόστος στην απόδοση του Συστήματος). Πότε δεν χρειάζεται για την εφαρμογή Η Βάση Δεδομένων και η Εφαρμογή είναι πολύ απλές και σταθερές Ο χρόνος για απόδοση είναι πολύ σημαντικός (overhead του DBMS) Δεν απαιτείται πρόσβαση από πολλούς χρήστες Σελίδα 33
DBMS : ΟιΠαλιοίΠρωταγωνιστές Αυτά τα Συστήματα παρουσιάστηκαν και έλαμψαν στην δεκαετία του 80 Πολλές εγκαταστάσεις ΑΚΟΜΗ υπάρχουν αλλά δεν γίνονται πωλήσεις IMS (IBM) -- Hierarchical Model (γλώσσα( DL/1) I-D-S S (Honeywell) -- Network DBTG (Integrated Data Store) IDMS (Cullinane) - Network (Integrated Data Mgmnt System) TOTAL (Cincom) - Network IMAGE (Hewlett-Packard) - Network SYSTEM 2000 (Intel-MRI) - Inverted (ad-hoc model) Other Inverted: ADABAS (Software AG), Model 204 (CCA)... Σελίδα 34
DBMS : ΟιΠρωταγωνιστές (α) DB2, σε κάθε IBM ή IBM-compatible πλατφόρμα ORACLE 8 (8i) SYBASE INFORMIX INGRES currently called, Computer Associates-Ask Group Άλλοι (Φθίνουν ): Rdb (έκλεισε( έκλεισε), Gupta Quadbase, Ralma, Watcom, XDB,... Οι MPP πρωταγωνιστές (massively parallel): Terradata (ο( μεγαλύτερος), Tandem (NonStop SQL), Oracle Parallel Server, Informix, Sybase (Navigator), DB2, DEC, Οι αναδυόμενοι: ILLUSTRA, O2 (έκλεισε), etc. Σελίδα 35
DBMS : ΟιΠρωταγωνιστές (β) Οι μεγάλοι στον κόσμο των Windows / PC Microsoft SQL Server (Powersoft) (Gupta) Χαρακτηριστικά: (a) SQL πρόσβαση (gateways) (b) Εξαίρετα για Client-Server (DBMS) (c) Μοιάζουν πολύ με τα «μεγάλα» DBMS Σελίδα 36
DBMS : ΟιΠρωταγωνιστές (γ) Ακόμη στο PC Paradox (Borland) Microsoft Access Q&A (Symantec) FileMaker Pro (Claris Corp.) DataEase Express Approach (Lotus) Alpha Four Παλαιότερα: : xbase, dbase, FoxPro, MicroRIM... Συνήθως έχουν ένα υποσύνολο των δυνατοτήτων των μεγάλων DBMS Σελίδα 37
ΤεχνολογίαΔιοίκησηςΔεδομένων ΝΕΕΣ ΤΑΣΕΙΣ Massively-Parallel DBMS o Shared Memory, Shared Disks, Shared Nothing Object-oriented Database Systems o o Versant, O2, Ontos, Itasca, ODMG Standards Object-Relational Database Systems o UniSQL, Oracle 8, Document Management Systems o Text retrieval Hypermedia DBs o Κόμβοι που κρατούν Text Multimedia DBMS o image exchange, compression, user interfaces Σελίδα 38
ΤεχνολογίαΔιοίκησηςΔεδομένων ΝΕΕΣ ΤΑΣΕΙΣ (συνέχεια) Active DBMS (Database Intelligence) o o Triggering Events Business Rules Knowledge Base Managament Systems o o Artificial Inteliigence and DBMS περιορισμοί Temporal DBMS (TSQL) Spatial DBMS o o Γεωμετρικά σημεία Εφαρμογές σε GIS (Geographic Information Systems) PC-BASED DBMS! o dbase, Paradox, CA-Clipper, Access,... Σελίδα 39
ΕΞΕΛΙΞΗστηνΤεχνολογίαΒάσεων Δεδομένων Simple Data Management Global Enterprise Management Early 80s Late 80s Early - Mid 90s Late 90s -21st C Prerelational Early Relational Simple OLTP Client-server Relational Active Database Data Warehouse & Hi-end OLTP Enterprise -capable Relational Packaged & Vertical Applications Internet Computing Simple transactions, on-line backup & recovery Stored procedures, triggers Scaleable OLTP, parallel query, partitioning, cluster support, row-level locking, high availability Support for all types of data, extensibility, objects Middleware (messaging, queues, events) Java, CORBA, Web interfaces Σελίδα 40
ΤεχνολογίαΔιοίκησηςΔεδομένων OLAP Ανάλυση σε πολυδιάστατο χώρο o o Πωλήσεις ΑΝΑ (Προϊόν, Πελάτη, Χρόνο) Κύβος drill down, rollup Essbase, Commander, Oracle Express, SAS, Excel Data Warehouses Νέα μορφή για Decision Support Systems Redbrick, Oracle DW, Informix, Sybase, Micro Strategy Data Mining Σελίδα 41
On-Line Analytical Processing (OLAP) Multidimensional Database Technology OLAP ROLAP, MOLAP HOLAP (Hybrid OLAP), WOLAP (Web OLAP) ευέλικτη, υψηλής απόδοσης πρόσβαση και ανάλυση μεγάλου όγκου σύνθετων δεδομένων - από διαφορετικές εφαρμογές Visualization of business data (πολυδιάστατα( πολυδιάστατα) data mining, query & reporting, statistical analysis, multidimensional analysis Enterprise Decision Support Systems Ad-hoc reporting and Analytical Power (analytical discovery ) Σελίδα 42
Data Warehouse Πρόκειται για μια μεγάλη Βάση Δεδομένων που αποτελείται από μικρότερες ΒΔ που περιέχουν χρήσιμα δεδομένα και σχεδιάστηκαν για την υποστήριξη αποφάσεων Σελίδα 43
Ομοιότητες καιδιαφορέςμιαςβδ και ενός Data Warehouse Ένα Data Warehouse είναι κατά πολύ μεγαλύτερο από μια ΒΔ γιατί αποτελείται από ένα σύνολο αλληλένδετων ΒΔ. Μια ΒΔ συνήθως ανανεώνεται συχνά ενώ το Data warehouses όχι. Τόσο οι ΒΔ όσο και τα Data Warehouses υποστηρίζουν τα online queries και δημιουργία γρήγορων περιλήψεων για τους Διαχειριστές. Τα Data warehouses είναι ιδανικά για να αποθηκεύσουν μεγάλες ποσότητες δεδομένων διότι το λογισμικό που τα υποστηρίζει είναι σχεδιασμένο για αυτό το σκοπό. Οι ΒΔ συνήθως οργανώνονται γύρω από Τμήματα(Departments) ήλειτουργίες (marketing), ενώ τα Data warehouses, σχεδιάζονται έτσι ώστε να αποδίδουν μια γενικότερη εικόνα ολόκληρου του οργανισμού. Σελίδα 44
Components of a Data Warehouse Σελίδα 45
Αρχιτεκτονική Data Warehouse Clients GIS OLAP DSS Data Mart Data Mart Administration Agent Meta Database Data Warehouse Wrappers/ Loaders Sources Text File DB External data Σελίδα 46
H Αγοράγια Data Warehouses Μια βιομηχανία των $20 Δις σε δύο χρόνια ($12 Δις H/W και $8 Δις σε υπηρεσίες Μέσο κόστος για ένα DW έργο: $3 εκατ. Σύνηθες μέγεθος DW τα 50Gb με 400Gb META Group Report του 1996 (Orlando, Fl) Παρόμοια μεγέθη από άλλους (π.χ. Gartner Group) Σελίδα 47
Data Mining Είναι ηαυτοματοποιημένη ανάλυση μεγάλων όγκων δεδομένων με στόχο να αποκαλυφθούν τάσεις και σχέδια που με την κλασσική ανάλυση που ακολουθούν οι ΒΔ δεν θα αποκαλύπτονταν. Σελίδα 48
Data Warehousing and Datamining Datamining Tools for analyzing large pools of data Find hidden patterns and infer rules to predict trends Σελίδα 49
ΤεχνολογίαΔιοίκησηςΔεδομένων / Πληροφοριών Κατανεμημένη Επεξεργασία και Δεδομένα Επεξεργασία σε πολλαπλά (γεωγραφικά σε απόσταση) συστήματα Τρόποι Κατανομής Δεδομένων: o o Fragmentation / Partitioning (Δύσκολη Υλοποίηση) Replication / Duplication (Παρουσιάζει Ρίσκα, π.χ., συγχρονισμός) Κατανεμημένα (Distributed) DBMS ή Multidatabases ή Federated DBMS και Heterogeneous DDBMS Σελίδα 50
ΤεχνολογίαΔιοίκησηςΔεδομένων Αρχιτεκτονικές Κατανεμημένων DBMS Πως κατανέμονται τα δεδομένα: Κάθε μονάδα έχει μοναδικό σημείο αλλαγής, κατανεμημένες αλλαγές στο ελάχιστο, τα δεδομένα όσο πιο κοντά γίνεται στα προγράμματα, DRDA - Distributed Relational Database Architecture (IBM) o o Πρόσβαση σε κατανεμημένα δεδομένα για κάθε πλατφόρμα της IBM (MVS, VM, OS/400, OS/2, AIX, ) Βασίζεται στο SNA RDA - Remote Data Access (ISO) o o o o Όλοι οι μεγάλοι προμηθευτές DBMS (εκτός ΙΒΜ) Βασίζεται στο OSI (Open System Interconnection) σχεδιασμένη για μετεφερσιμότητα (portability) SAG (SQL Access Group) Σελίδα 51
ΤεχνολογίαΔιοίκησηςΔεδομένων Κατανομή σε CLIENT/SERVER Mία ακόμη διαμάχη με δύο διαφορετικά αποτελέσματα: ODBC (από( την Microsoft), X/Open CLI --- 1992, 1994 o Open Database Connectivity IDAPI (από( τις Borland, IBM, Novell) --- 1992 o Integrated Database Application Programming Interface Στο επίπεδο του SQL Call-level level Interface (CLI) MIDDLEWARE Κάθε σύνολο προγραμμάτων ή διαδικασιών που επιτρέπει δυο πολύ διαφορετικά προγράμματα να συλλειτουργούν (interoperate) Σελίδα 52
ΚατανεμημένεςΒάσειςΔεδομένων Πρόκειται για Βάσεις Δεδομένων κατανεμημένων σε γεωγραφικά απομακρυσμένα υπολογιστικά συστήματα. Σελίδα 53
Distributing Databases Distributed database Stored in more than one physical location Partitioned database Duplicated database Σελίδα 54
Distributed Databases Σελίδα 55
ΤρόποικατανομήςΒΔ Αναπαραγωγή και τοποθέτηση αντιγράφων της ΒΔ του πελάτη σε διαφορετικές τοποθεσίες CUSTOMER DATABASE New York Chicago Raleigh CUSTOMER DATABASE Portland Διαχωρισμός της ΒΔ του πελάτη και τοποθέτηση των κομματιών της σε σχετικές τοποθεσίες New York Chicago Raleigh Portland Σελίδα 56
ΤεχνολογίαΔιοίκησηςΔεδομένων SHARED / INTERNET DATABASES web databases, electronic catalogues, directories, servers, etc. Web Databases (Ειδικό Client/Server -- XML-based) Databases στο web (electronic market places) είναι συνήθως ΠΟΛΥ ΠΟΛΥ ΜΕΓΑΛΕΣ (VERY LARGE) >> 100 GB (1 GB = 109 Bytes) συχνά, της τάξης του TB (1TB = 1012 Bytes) μερικές φορές, της τάξης του PT (1PT = 1015 Bytes) (π.χ..,.., UPS database = 3PB, Walmart s = 4PB) Σελίδα 57
ΤοΠαρόνστιςΒάσειςΔεδομένων OLTP applications Large amounts of data Simple data, simple queries and updates Update statement from debit/credit transaction: UPDATE accounts SET abalance = abalance + :delta WHERE aid =:aid; Typically update intensive Large number of concurrent users (transactions) Data warehousing applications Large amounts of data Simple data but complex querying Typically read intensive Large number of users Σελίδα 58
ΤοΠαρόνστιςΒάσειςΔεδομένων These applications require: Large users/transactions High performance High availability (7x24 operations) Scalability High levels of security Administrative support Good utilities Σελίδα 59
Databases and the Web Hypermedia database Organizes data as network of nodes Links nodes in pattern specified by user Supports text, graphic, sound, video and executable programs Σελίδα 60
A Hypermedia Database Σελίδα 61
Databases and the Web Database server Computer in a client/server environment runs a DBMS to process SQL statements and perform database management tasks Application server Software handling all application operations Σελίδα 62
Linking Internal Databases to the Web Σελίδα 63
XML-enabled DBMS DBMS Integrate with other facilities Generate XML Store XML Xml-enable the database system Store XML data/documents in the database server Querying and searching of structured and unstructured XML Generate XML data from the database server Add XML capabilities in supporting database facilities Σελίδα 64
Σελίδα 65