Υποστήριξη Αποφάσεων. Γεώργιος Ευαγγελίδης. (βασισμένο στο κεφ. 23 του βιβλίου «Συστήματα Διαχείρισης Βάσεων Δεδομένων»)

Σχετικά έγγραφα
Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Αποθήκες εδοµένων και Εξόρυξη Γνώσης. (Data Warehousing & Data Mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης

Συστήματα OLAP. Πασχάλης Θρήσκος, PhD Λάρισα

Άμεση Αναλυτική Επεξεργασία (OLAP)

Εξόρυξη Γνώσης από εδοµένα (Data Mining)

Data Warehouse Τ χνο χνο ογίες Υπ οστήριξης Λήψης Αριστο Αριστ μένης Μακρής Διοικητικώ τικ ν ώ Απο Απ φάσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΕΠΛ342: Βάσεις Δεδομένων. Χειμερινό Εξάμηνο Φροντιστήριο 10 ΛΥΣΕΙΣ. Επερωτήσεις SQL

Αποθήκες Δεδομένων & Πολυδιάστατη Ανάλυση

Εξόρυξη Γνώσης από εδοµένα (Data Mining)

Άμεση Αναλυτική Επεξεργασία (OLAP)

ΑΠΟΔΟΤΙΚΗ ΑΠΟΤΙΜΗΣΗ ΕΡΩΤΗΣΕΩΝ OLAP Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ. Υποβάλλεται στην

11.1. Θεωρητικό υπόβαθρο για τους κύβους δεδομένων και την πολυδιάστατη ανάλυση

Data Cube. Μ.Χατζόπουλος 1

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

4. ΔΗΜΙΟΥΡΓΙΑ ΜΟΝΤΕΛΟΥ ΠΟΛΥΔΙΑΣΤΑΤΗΣ ΑΝΑΛΥΣΗΣ

Instruction Execution Times

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 5: SQL (Απλή SELECT) Ευαγγελίδης Γεώργιος. Τμήμα Εφαρμοσμένης Πληροφορικής ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Data Warehouse Refreshment via ETL tools. Panos Vassiliadis

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 6: SQL (Συζεύξεις, Εμφώλευση, Ομαδοποίηση) Ευαγγελίδης Γεώργιος. Τμήμα Εφαρμοσμένης Πληροφορικής ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

Copyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση, ίαυλος ιαφάνεια 29-1

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι

Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Αριστομένης Μακρής

Ανάλυση Δεδομένων (Data Analysis) Άμεση Αναλυτική Επεξεργασία (OLAP) Λειτουργίες Συνάθροισης στην SQL (windowing, ranking)

Τμήμα Πληροφορικής ΑΠΘ

GREECE BULGARIA 6 th JOINT MONITORING

Assalamu `alaikum wr. wb.

Approximation of distance between locations on earth given by latitude and longitude

SQL Data Manipulation Language

υπηρεσίες / services ΜΕΛΕΤΗ - ΣΧΕΔΙΑΣΜΟΣ PLANNING - DESIGN ΕΜΠΟΡΙΚΗ ΜΕΛΕΤΗ COMMERCIAL PLANNING ΕΠΙΠΛΩΣΗ - ΕΞΟΠΛΙΣΜΟΣ FURNISHING - EQUIPMENT

6.1. Dirac Equation. Hamiltonian. Dirac Eq.

ΑΛΕΞΑΝΔΡΕΙΟ Τ.Ε.Ι ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Εργαστήριο Βάσεων Δεδομένων. Δικαιώματα Χρηστών Προβολές


ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΝΑΥΤΙΛΙΑΚΩΝ ΣΠΟΥΔΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΝΑΥΤΙΛΙΑ

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Γιπλυμαηική Δπγαζία. «Ανθπυποκενηπικόρ ζσεδιαζμόρ γέθςπαρ πλοίος» Φοςζιάνηρ Αθανάζιορ. Δπιβλέπυν Καθηγηηήρ: Νηθφιανο Π. Βεληίθνο

Σχεδιασμός Πληροφοριακών Συστημάτων. Σημειώσεις

Προηγμένα Πληροφοριακά Συστήματα. Ακαδημαϊκό Έτος

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ. Βασικές Ενότητες Πρόσθετες Ενότητες Entry Start Λογιστικές Εφαρμογές xline ERP ATLANTIS ERP

1. Πόσοι αριθμοί μικρότεροι του διαιρούνται με όλους τους μονοψήφιους αριθμούς;

Αποθήκες Δεδομένων. Αρχιτεκτονική, Μοντέλο Δεδομένων και Σχεδίαση

Αποθήκες Δεδομένων. Αποθήκες και εξόρυξη δεδομένων 6 ο εξάμηνο

The Nottingham eprints service makes this work by researchers of the University of Nottingham available open access under the following conditions.

Δημιουργία Λογαριασμού Διαχείρισης Business Telephony Create a Management Account for Business Telephony

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

ΧΡΗΣΙΜΕΣ ΠΛΗΡΟΦΟΡΙΕΣ ALTEC ΚΕΦΑΛΑΙΟ. ALTEC xline ERP ALTEC ATLANTIS II ERP ALTEC ATLANTIS II PAYROLL. ALTEC xline PAYROLL

Εργαστήριο Βάσεων Δεδομένων

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

Ιωσηφίδης Ελευθέριος

Database System Concepts and Architecture (Αρχιτεκτονική, οµές, και Μοντέλα)

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

ΘΕΜΑΤΑ. Ερώτηση 1 Κατά τη Φυσική Αποθήκευση (Physical storage) μιας ΒΔ αποθηκεύονται στον δίσκο τα:


Βασικές Ενότητες Πρόσθετες Ενότητες Entry... Start... Λογιστικές Εφαρμογές... Βασικές Ενότητες... Πρόσθετες Ενότητες...

Bring Your Own Device (BYOD) Legal Challenges of the new Business Trend MINA ZOULOVITS LAWYER, PARNTER FILOTHEIDIS & PARTNERS LAW FIRM

Βάσεις Δεδομένων. Βασίλειος Βεσκούκης Εισαγωγή στη γλώσσα SQL (Structured Query Language) Η γλώσσα SQL

ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ: Λήψη απόφασης, Συστήματα Υποστήριξης Αποφάσεων, OLAP Ανάλυση, Περιβαλλοντική Εκπαίδευση ΕΙΣΑΓΩΓΗ

Math 6 SL Probability Distributions Practice Test Mark Scheme

Συνεργατική Λήψη Αποφάσεων. Υποστήριξη στη Συνεργατική. Αποφάσεων. ιάρθρωση ενότητας. Η προτεινόµενη προσέγγιση. γνώσης και επιχειρηµατολογίας

Fourier Series. MATH 211, Calculus II. J. Robert Buchanan. Spring Department of Mathematics

ΗΥ-360 Αρχεία και Βάσεις Δεδομένων Διδάσκων: Δ. Πλεξουσάκης. Φροντιστήριο SQL Examples ΙΙ Ξένου Ρουμπίνη

ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ. Παρουσίαση 2 ο μέρος:

Every set of first-order formulas is equivalent to an independent set

C.S. 430 Assignment 6, Sample Solutions

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής

Σχεδιασμός Βάσεων Δεδομένων

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 7β: SQL (Πρακτική Εξάσκηση 1) Ευαγγελίδης Γεώργιος. Τμήμα Εφαρμοσμένης Πληροφορικής ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

ΣΧΕΣΙΑΚΟ ΜΟΝΤΕΛΟ Relational Model. SQL Μαθ. #11

Η SQL αποτελείται από δύο υποσύνολα, τη DDL και τη DML.

ίκτυο προστασίας για τα Ελληνικά αγροτικά και οικόσιτα ζώα on.net e-foundatio // itute: toring Insti SAVE-Monit

ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -2

TMA4115 Matematikk 3

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ. Επιλέγει όλες τις πλειάδες, από μια σχέση R, που ικανοποιούν τη συνθήκη επιλογής.

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Βασικές Ενότητες Πρόσθετες Ενότητες Ανεξαρτήτως Χρηστών Λογιστικές Εφαρμογές Entry Start Services...

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

The Simply Typed Lambda Calculus

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 7α: SQL (NULL, Διαίρεση) Ευαγγελίδης Γεώργιος. Τμήμα Εφαρμοσμένης Πληροφορικής ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων: Μέρος Β

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εισαγωγή στις Αποθήκες εδομένων

Βασικές Ενότητες Πρόσθετες Ενότητες Ανεξαρτήτως Χρηστών Entry Start Services... Λογιστικές Εφαρμογές Retail...

EE512: Error Control Coding

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

Η SQL ως γλώσσα ερωτημάτων. Υπενθυμίζουμε: Σχέση = Πίνακας Πλειάδα = Εγγραφή = Γραμμή (Πίνακα) Πεδίο = Γνώρισμα (Σχέσης) = Στήλη (Πίνακα)

Finite Field Problems: Solutions

Ευρωπαϊκός Αριθμός 112.

Εισαγωγή στις Αποθήκες εδομένων

Aluminum Electrolytic Capacitors (Large Can Type)

Συνοπτική επισκόπηση αγοράς & εργαλείων ΒΙ

Scrum framework: Ρόλοι

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

Solutions to the Schrodinger equation atomic orbitals. Ψ 1 s Ψ 2 s Ψ 2 px Ψ 2 py Ψ 2 pz

Ολοκληρωµένη λύση επιλεκτικής συγκέντρωσης, αναδιοργάνωσης δεδοµένων και παραγωγής πληροφορίας

Ηλεκτρονικοί Υπολογιστές II

Βάσεις δεδομένων. (8 ο μάθημα) Ηρακλής Βαρλάμης

GROUP BY, HAVING, COUNT, MIN, MAX, SUM, AVG, ROLLUP.

Transcript:

Υποστήριξη Αποφάσεων Γεώργιος Ευαγγελίδης (βασισμένο στο κεφ. 23 του βιβλίου «Συστήματα Διαχείρισης Βάσεων Δεδομένων»)

Εισαγωγικά Οι επιχειρήσεις θέλουν να μπορούν να αναλύουν τα δεδομένα τους. Γιατί; Απαιτείται δυνατότητα: σύνθεσης δεδομένων από όλα τα τμήματά τους περίπλοκης και διαδραστικής ανάλυσης των δεδομένων αυτών

Έννοιες Data Warehousing σύνθεση και διαχείριση δεδομένων από πολλές πηγές OLAP (vs. OLTP) Πολύπλοκα SQL αιτήματα, όψεις, πολυδιάστατη θεώρηση των δεδομένων (κύβοι), διαδραστικά αιτήματα Data Mining

Data Warehousing Συγκέντρωση δεδομένων και αθροιστικής πληροφορίας από μεγάλες χρονικές περιόδους Πολλά GB ή ΤΒ Στατικά δεδομένα Απαίτηση για μικρούς χρόνους απόκρισης

Data Warehousing (συνέχεια) Συγχώνευση δεδομένων από διαφορετικές πηγές (σημασιολογικές συγκρούσεις) Διαφορετικές νομισματικές μονάδες Διαφορετικά ονόματα για τα ίδια πεδία Διαφορετικά σχήματα για παρόμοιους πίνακες

Data Warehousing (συνέχεια) Καθαρισμός δεδομένων (διόρθωση λαθών, ελλιπούς πληροφορίας) Μετατροπή δεδομένων για να υπακούουν σε κοινό σχήμα Φόρτωμα δεδομένων Ανανέωση δεδομένων σε τακτά χρονικά διαστήματα Διαγραφή παλιών (άχρηστων) δεδομένων Διατήρηση βάσης μεταδεδομένων

Data Warehousing (συνέχεια) Πολύπλοκα «παραδοσιακά» SQL αιτήματα Αιτήματα OLAP Αλγόριθμοι για εξόρυξη πληροφορίας Εργαλεία οπτικοποίησης πληροφορίας Στατιστική ανάλυση Παραγωγή αναφορών

OLTP vs. Data Warehouse DBs

Παράδειγμα

Πιθανά αιτήματα Πως πήγαν οι πωλήσεις του προϊόντος widget τον τελευταίο μήνα σε σχέση με τις πωλήσεις των 5 τελευταίων ετών; Σε σχέση με το υποκατάστημα, την περιοχή, την ευρύτερη περιοχή; 2. Υπάρχει διαφορά στις πωλήσεις ανάλογα με την περιοχή; Υπάρχουν συγκεκριμένες τάσεις; 3. Υπήρξαν περισσότερες επιστροφές του προϊόντος σε σχέση με το τελευταίο έτος; Που οφείλονται οι επιστροφές; 4. Μήπως συγκεκριμένοι πωλητές τα καταφέρνουν καλύτερα από άλλους;

Πολυδιάστατο μοντέλο δεδομένων Measures (μετρήσεις): sales Dimensions (διαστάσεις): product, location, time

Ιεραρχίες διαστάσεων

Πράξεις OLAP Roll-up (σύμπτυξη) αύξηση επιπέδου συνάθροισης Drill-down (ανάπτυξη) μείωση επιπέδου συνάθροισης Slice-and-dice (φέτες και κύβοι) επιλογές με ισότητα ή διάστημα τιμών (μείωση των διαστάσεων των δεδομένων) Pivot (περιστροφή) συνάθροιση σε επιλεγμένες διαστάσεις (μας δίνει cross-tabulations)

Σύγκριση με αιτήματα SQL SELECT SUM(S.sales) FROM Sales S, Times T, Locations L WHERE S.timeid=T.timeid AND S.timeid=L.timeid GROUP BY T.year, L.state SELECT SUM(S.sales) FROM Sales S, Times T WHERE S.timeid=T.timeid GROUP BY T.year SELECT SUM(S.sales) FROM Sales S, Location L WHERE S.timeid=L.timeid GROUP BY L.state SELECT SUM(S.sales) FROM Sales S

Εναλλακτικές Υλοποιήσεις Relational OLAP (ROLAP) Τα δεδομένα βρίσκονται σε ένα σχεσιακό DBMS SQL με επεκτάσεις για την υποστήριξη και αποδοτική εκτέλεση αιτημάτων OLAP Multidimensional OLAP (MOLAP) Χρησιμοποιούνται ειδικές δομές δεδομένων για την αποθήκευση των πολυδιάστατων δεδομένων Οι λειτουργίες OLAP εκτελούνται πάνω στις δομές αυτές Hybrid OLAP (HOLAP) Συνδυασμός ROLAP και MOLAP Η πολλή πληροφορία βρίσκεται στη σχεσιακή βάση Η συναθροιστική πληροφορία σε διασυνδεμένο MOLAP

Codd s rules for OLAP [Codd93] Multi-Dimensional Concept View: The user should be able to see the data as being multidimensional insofar as it should be easy to 'pivot' or 'slice and dice'. (See later.) Transparency: The OLAP functionality should be provided behind the user's existing software without adversely affecting the functionality of the 'host'. Accessibility: OLAP should allow the user to access diverse data stores but see the data within a common 'schema' provided by the OLAP tool.

Consistent Reporting Performance: There should not be significant degradation in performance with large numbers of dimensions or large quantities of data. Client-Server Architecture: Since much of the data is on mainframes, and the users work on PCs, the OLAP tool must be able to bring the two together! Generic Dimensionality: Data dimensions must all be treated equally. Functions available for one dimension must be available for others. Dynamic Sparse Matrix Handling: The OLAP tool should be able to work out for itself the most efficient way to store sparse matrix data. Multi User Support

Unrestricted Cross-Dimensional Operations: e.g., individual office overheads are allocated according to total corporate overheads divided in proportion to individual office sales. Intuitive Data Manipulation: Navigation should be done by operations on individual cells rather than menus. Flexible Reporting: Row and column headings must be capable of more than one dimension each, and of displaying subsets of any dimension. Unlimited Dimensions and Aggregation Levels: At least 15 dimensions may be required, and within each there may be many hierarchical levels.

Θέματα Υλοποίησης Bitmap Index Join Indexes Views (Όψεις) Top N queries

Bitmap index

Join Indexes D1 x D2 x F για κάθε αίτημα που εμπλέκει τις συγκεκριμένες διαστάσεις Εναλλακτικά πολλά Di x F ευρετήρια και μετά χρήση τομής μπορούν να χρησιμοποιηθούν ευρετήρια bitmap

Υλοποίηση Όψεων CREATE VIEW RegionalSales( category, sales, state) AS SELECT P. category, S. sales, L. state FROM Products P, Sales S, Locations L WHERE P. pid= S. pid AND S. locid= L. locid SELECT R. category, R. state, SUM (R. sales) FROM RegionalSales AS R GROUP BY R. category, R. state SELECT R. category, R. state, SUM (R. sales) FROM ( SELECT P. category, S. sales, L. state FROM Products P, Sales S, Locations L WHERE P. pid= S. pid AND S. locid= L. locid) AS R GROUP BY R. category, R. state

Όψεις και ευρετήρια Έστω ότι έχουμε ένα Β+δέντρο πάνω στα πεδία: [category, state, sales] SELECT R. state, SUM (R. sales) FROM RegionalSales R WHERE R. category= Laptop GROUP BY R. state SELECT R. state, SUM (R. sales) FROM RegionalSales R WHERE R. state= Wisconsin GROUP BY R. category

Top N queries SELECT P. pid, P. pname, S. sales FROM Sales S, Products P WHERE S. pid= P. pid AND S. locid= 1 AND S. timeid= 3 ORDER BY S. sales DESC OPTIMIZE FOR 10 ROWS SELECT P. pid, P. pname, S. sales FROM Sales S, Products P WHERE S. pid= P. pid AND S. locid= 1 AND S. timeid= 3 AND S. sales > c ORDER BY S. sales DESC