Απνζήθεο Γεδνκέλσλ θαη Δμόξπμε Γεδνκέλσλ:

Σχετικά έγγραφα
Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων. Αποθήκες και εξόρυξη δεδομένων 6 ο εξάμηνο

ΑΛΛΑΓΗ ΟΝΟΜΑΣΟ ΚΑΙ ΟΜΑΔΑ ΕΡΓΑΙΑ, ΚΟΙΝΟΥΡΗΣΟΙ ΦΑΚΕΛΟΙ ΚΑΙ ΕΚΣΤΠΩΣΕ ΣΑ WINDOWS XP

Βάσεις Δεδομέμωμ. Εξγαζηήξην V. Τκήκα Πιεξνθνξηθήο ΑΠΘ

Εισαγωγή στις Αποθήκες εδοµένων

ΑΝΑΣΚΟΠΗΣΗ. Αποθήκες και Εξόρυξη Δεδομένων

H ΜΑΓΕΙΑ ΤΩΝ ΑΡΙΘΜΩΝ

Αποθήκες Δεδομένων. Αρχιτεκτονική, Μοντέλο Δεδομένων και Σχεδίαση

ΡΤΘΜΙΕΙ ΔΙΚΣΤΟΤ ΣΑ WINDOWS

Εξόπυξη Δεδομένων. ΑΠΟΘΗΚΔΣ ΓΔΓΟΜΔΝΩΝ Data Warehouses. Απνζήθεο Γεδνκέλσλ 1

Δξγαιεία Καηαζθεπέο 1 Σάμε Σ Δ.Κ.Φ.Δ. ΥΑΝΙΧΝ ΠΡΧΣΟΒΑΘΜΙΑ ΔΚΠΑΙΓΔΤΗ. ΔΝΟΣΗΣΑ 11 ε : ΦΧ ΔΡΓΑΛΔΙΑ ΚΑΣΑΚΔΤΔ. Καηαζθεπή 1: Φαθόο κε ζσιήλα.

ΓΗΑΓΩΝΗΣΜΑ ΣΤΑ ΜΑΘΖΜΑΤΗΚΑ. Ύλη: Μιγαδικοί-Σσναρηήζεις-Παράγωγοι Θεη.-Τετν. Καη Εήηημα 1 ο :

Άσκηση 1 - Μοπυοποίηση Κειμένου

Απνηειέζκαηα Εξσηεκαηνινγίνπ 2o ηεηξάκελν

Αζκήζεις ζτ.βιβλίοσ ζελίδας 13 14

Κευάλαιο 8 Μονοπωλιακή Συμπεριφορά- Πολλαπλή Τιμολόγηση

Ενδεικτικά Θέματα Στατιστικής ΙΙ

ΔΕΟ 13. Ποσοτικές Μέθοδοι. θαη λα ππνινγίζεηε ην θόζηνο γηα παξαγόκελα πξντόληα. Να ζρεδηαζηεί γηα εύξνο πξντόλησλ έσο

B-Δέλδξα. Τα B-δέλδξα ρξεζηκνπνηνύληαη γηα ηε αλαπαξάζηαζε πνιύ κεγάισλ ιεμηθώλ πνπ είλαη απνζεθεπκέλα ζην δίζθν.

ΑΠΛΟΠΟΙΗΗ ΛΟΓΙΚΩΝ ΤΝΑΡΣΗΕΩΝ ΜΕ ΠΙΝΑΚΕ KARNAUGH

ΔΦΑΡΜΟΜΔΝΑ ΜΑΘΗΜΑΣΙΚΑ ΣΗ ΧΗΜΔΙΑ Ι ΘΔΜΑΣΑ Α επηέκβξηνο Να ππνινγηζηνύλ νη κεξηθέο παξάγσγνη πξώηεο ηάμεο ηεο ζπλάξηεζεο f(x,y) =

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΔΣΑΙΡΔΙΑ ΠΑΓΚΤΠΡΙΟ ΓΙΑΓΩΝΙ ΜΟ

ΜΑΘΗΜΑΣΑ ΦΩΣΟΓΡΑΦΙΑ. Ειζαγωγή ζηη Φωηογραθία. Χριζηάκης Σαζεΐδης EFIAP

Σήκαηα Β Α Γ Γ Δ Λ Η Σ Ο Ι Κ Ο Ν Ο Μ Ο Υ Γ Ι Α Λ Δ Ξ Η - ( 2 ) ΕΙΣΑΓΨΓΗ ΣΤΙΣ ΤΗΛΕΠΙΚΟΙΝΨΝΙΕΣ

ΑΝΤΗΛΙΑΚΑ. Η Μηκή ζθέθηεθε έλαλ ηξόπν, γηα λα ζπγθξίλεη κεξηθά δηαθνξεηηθά αληειηαθά πξντόληα. Απηή θαη ν Νηίλνο ζπλέιεμαλ ηα αθόινπζα πιηθά:

Κβαντικοί Υπολογισμοί. Πέκπηε Γηάιεμε

x-1 x (x-1) x 5x 2. Να απινπνηεζνύλ ηα θιάζκαηα, έηζη ώζηε λα κελ ππάξρνπλ ξηδηθά ζηνπο 22, 55, 15, 42, 93, 10 5, 12

Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο κόζηος ανά μονάδα παραγωγής. Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο ζηαθερό κόζηος ανά μονάδα παραγωγής

iii. iv. γηα ηελ νπνία ηζρύνπλ: f (1) 2 θαη

x x x x tan(2 x) x 2 2x x 1

ΠΑΡΑΡΣΗΜΑ Δ. ΔΤΡΔΗ ΣΟΤ ΜΔΣΑΥΗΜΑΣΙΜΟΤ FOURIER ΓΙΑΦΟΡΩΝ ΗΜΑΣΩΝ

Κεθάλαιο 7. Πξνζθνξά ηνπ θιάδνπ Μ. ΨΥΛΛΑΚΗ

TOOLBOOK (μάθημα 2) Δεκηνπξγία βηβιίνπ θαη ζειίδσλ ΠΡΟΑΡΜΟΓΗ: ΒΑΛΚΑΝΙΩΣΗ ΔΗΜ. ΕΚΠΑΙΔΕΤΣΙΚΟ ΠΕ19 1 TOOLBOOK ΜΑΘΗΜΑ 2

ΜΗΧΑΝΟΛΟΓΙΚΟ ΣΧΔΓΙΟ ΙΙ

ΚΕΦ. 2.3 ΑΠΟΛΤΣΗ ΣΘΜΗ ΠΡΑΓΜΑΣΘΚΟΤ ΑΡΘΘΜΟΤ

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΤΙΚΗ ΣΚΥΤΑΛΟΓΡΟΜΙΑ 2015 ΓΙΑ ΤΟ ΓΥΜΝΑΣΙΟ Τεηάπηη 28 Ιανουαπίου 2015 ΛΔΥΚΩΣΙΑ Τάξη: Α Γυμναζίου

Δπηιέγνληαο ην «Πξνεπηινγή» θάζε θνξά πνπ ζα ζπλδέεζηε ζηελ εθαξκνγή ζα βξίζθεζηε ζηε λέα ρξήζε.

Αιγόξηζκνη Γνκή επηινγήο. Πνιιαπιή Δπηινγή Δκθωιεπκέλεο Δπηινγέο. Δηζαγωγή ζηηο Αξρέο ηεο Δπηζηήκεο ηωλ Η/Υ. introcsprinciples.wordpress.

Α. Εηζαγσγή ηεο έλλνηαο ηεο ηξηγσλνκεηξηθήο εμίζσζεο κε αξρηθό παξάδεηγκα ηελ εκx = 2

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΔΣΑΙΡΔΙΑ ΠΑΓΚΤΠΡΙΟ ΓΙΑΓΩΝΙΜΟ Α ΛΤΚΔΙΟΤ. Ημεπομηνία: 10/12/11 Ώπα εξέτασηρ: 09:30-12:30 ΠΡΟΣΔΙΝΟΜΔΝΔ ΛΤΔΙ

(Ενδεικηικές Απανηήζεις) ΘΔΜΑ Α. Α1. Βιέπε απόδεημε Σει. 262, ζρνιηθνύ βηβιίνπ. Α2. Βιέπε νξηζκό Σει. 141, ζρνιηθνύ βηβιίνπ

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Α Γυμνασίου ΥΟΛΕΙΟ..

Μονοψϊνιο. Αγνξά κε ιίγνπο αγνξαζηέο. Δύναμη μονοψωνίος Η ηθαλόηεηα πνπ έρεη ν αγνξαζηήο λα επεξεάζεη ηελ ηηκή ηνπ αγαζνύ.

Άμεσοι Αλγόριθμοι: Προσπέλαση Λίστας (list access)

Α Ο Κ Η Α Μ Α Ζ Η Η Ρ Η ( S E A R C H )

ΘΔΚΑ ΡΖΠ ΑΛΑΓΛΩΟΗΠΖΠ

Εισαγωγή στις Αποθήκες εδομένων

ΔΙΑΓΩΝΙΣΜΑ ΣΤΗ ΦΥΣΙΚΗ. Ύλη: Εσθύγραμμη Κίνηζη

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ. Οξηδόληηα θαη θαηαθόξπθε κεηαηόπηζε παξαβνιήο

ΠΑΝΔΛΛΑΓΗΚΔ ΔΞΔΣΑΔΗ Γ ΣΑΞΖ ΖΜΔΡΖΗΟΤ ΓΔΝΗΚΟΤ ΛΤΚΔΗΟΤ Γευηέρα 11 Ηουνίου 2018 ΔΞΔΣΑΕΟΜΔΝΟ ΜΑΘΖΜΑ: ΜΑΘΖΜΑΣΗΚΑ ΠΡΟΑΝΑΣΟΛΗΜΟΤ. (Ενδεικηικές Απανηήζεις)

ΚΔΦ. 2.4 ΡΗΕΔ ΠΡΑΓΜΑΣΗΚΩΝ ΑΡΗΘΜΩΝ

Γοκή επαλάιευες Δληοιές Όζο & Μέτρης_όηοσ

Εισαγωγή στις Αποθήκες εδομένων

Δπαστηπιότητα 1 - ανάπτςξη, μεταγλώττιση, αποσυαλμάτωση και. εκτέλεση ππογπάμματορ

Οργάνωση και Δομή Παρουσιάσεων

Case Study. Παξαθάηω παξνπζηάδνπκε βήκα - βήκα κε screenshots έλα παξάδεηγκα ππνβνιήο κηαο εξγαζίαο θαη ηελ παξαγωγή ηνπ Originality Report.

ΑΠΑΝΤΗΣΔΙΣ ΓΙΚΤΥΑ ΥΠΟΛΟΓΙΣΤΩΝ II ΔΠΑΛ

EL Eνωμένη στην πολυμορυία EL A8-0046/319. Τροπολογία

ISO/IEC 27001:2005 Certificate No: IS Aegate Ltd 2011 All rights reserved

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Απαντήσεις θέματος 2. Παξαθάησ αθνινπζεί αλαιπηηθή επίιπζε ησλ εξσηεκάησλ.

Παιχνίδι γλωζζικής καηανόηζης με ζχήμαηα!

α) ηε κεηαηόπηζε x όηαλ ην ζώκα έρεη κέγηζην ξπζκό κεηαβνιήο ζέζεο δ) ην κέγηζην ξπζκό κεηαβνιήο ηεο ηαρύηεηαο

Διατείριση Φσσικών Καταστρουών: ACTIVE LANDSLIDE INVENTORY MAPPING AND SUSCEPTIBILITY ZONING

Έλαο πίνακας σσμβόλων ππνζηεξίδεη δύν βαζηθέο ιεηηνπξγίεο:

Κογιζηική Ιόζηοσς Ενόηηηα 2: Ιαηά Παραγγελία Ιοζηολόγηζη- ΑΣΙΗΣΕΘΣ ΛΕΚΕΤΗΣ


Αντισταθμιστική ανάλυση

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Α Γυμνασίου ΥΟΛΕΙΟ..

Σρήκα Α. Γξάθνπκε ηα ζηνηρεία ηνπ Πξνκεζεπηή θαη παηάκε Δηζαγσγή. Σρήκα Β1

ΑΠΟΛΤΣΗΡΙΔ ΔΞΔΣΑΔΙ Γ ΣΑΞΗ ΔΠΔΡΙΝΟΤ ΓΔΝΙΚΟΤ ΛΤΚΔΙΟΤ ΑΒΒΑΣΟ 23 MAΪΟΤ ΑΔΠΠ

Οδηγίες τρήζης για λειηοσργία μεηαθοράς καναλιών ζε υηθιακό δέκηη OST-7060 HD

Δξγαζηεξηαθή άζθεζε 03. Σηεξενγξαθηθή πξνβνιή ζην δίθηπν Wulf

ΔΙΑΓΩΝΙΣΜΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΕΚΦΩΝΗΣΕΙΣ. Διάρκεια: 3 ώρες Ημερομηνία: 12/5/2019 Έκδοση: 1 η. Τα sites blogs που συμμετέχουν (σε αλφαβητική σειρά):

Έκδοζη /10/2014. Νέα λειηοσργικόηηηα - Βεληιώζεις

ΧΩΡΙΚΕΣ ΣΧΕΣΕΙΣ ΚΑΙ ΓΕΩΜΕΤΡΙΚΕΣ ΕΝΝΟΙΕΣ

Πολυεπίπεδα/Διασυμδεδεμέμα Δίκτυα

Σημεία Ασύπματηρ Ππόσβασηρ (Hot-Spots)

ΕΓΧΕΙΡΙΔΙΟ ΕΚΔΟΗ 8.0.0

Διαδικαζία μεηαθοράς δεδομένων Εκκαθαριζηικής για ηο Eιδικό ζημείωμα περαίωζης Φ.Π.Α

Α Καθοπιζμόρ απμοδιοηήηυν - 1 επικεθαλήρ 1. Γ Αςηοτία ζηη ζήπαγγα Β 1 επικεθαλήρ εξ. ζηελεσορ. Ε Ποζοηική ανάλςζη Γ 3 εξ.

Εςθςή ζςζηήμαηα επισειπήζεων και αξιολόγηζη

f '(x)g(x)h(x) g'(x)f (x)h(x) h'(x) f (x)g(x)

ΗΜΔΡΟΜΗΝΙΑ. ΟΝΟΜΑΣΔΠΩΝΤΜΟ.. ΒΑΘΜΟΛΟΓΙΑ..

Να ζρεδηάζεηο ηξόπνπο ζύλδεζεο κηαο κπαηαξίαο θαη ελόο ιακπηήξα ώζηε ν ιακπηήξαο λα θσηνβνιεί.

1. Οδηγίερ εγκαηάζηαζηρ και σπήζηρ έξςπνυν καπηών και τηθιακών πιζηοποιηηικών με σπήζη ηος λογιζμικού Μοzilla Thunderbird

Βάσεις Δεδομέμωμ. Δξγαζηήξην Ι. Τκήκα Πιεξνθνξηθήο ΑΠΘ

Διαηιμήζεις για Αιολικά Πάρκα. Κώδικες 28, 78 και 84

Εξγαζηήξην Πιεξνθνξηθήο

Hellas online Προεπιλεγμένες ρσθμίσεις για FritzBox Fon WLAN 7140 (Annex B) FritzBox Fon WLAN Annex B ( )

ΣΥΣΤΗΜΑΤΑ ΑΛΓΕΒΡΑ Α ΛΥΚΕΙΟΥ. 1. Να ιπζνύλ ηα ζπζηήκαηα. 1 0,3x 0,1y x 3 3x 4y 2 4x 2y ( x 1) 6( y 1) (i) (ii)

ΟΣΑ Επηρεηξεζηαθή Ννεκνζύλε. Ελόηεηα: Ad1.2.2 «Ση θξύβεηαη» πίζω από κηα Επηρεηξεζηαθή Αλαθνξά (report): XML & XSD γηα αξράξηνπο

Άζκηζη ζτέζης κόζηοσς-τρόνοσ (Cost Time trade off) Καηαζκεσαζηική ΑΔ

ΠΑΝΔΛΛΑΓΗΚΔ ΔΞΔΣΑΔΗ Γ ΣΑΞΖ ΖΜΔΡΖΗΟΤ ΓΔΝΗΚΟΤ ΛΤΚΔΗΟΤ ΚΑΗ ΔΠΑΛ ΣΔΣΑΡΣΖ 25 ΜΑΨΟΤ 2016 ΔΞΔΣΑΕΟΜΔΝΟ ΜΑΘΖΜΑ: ΑΡΥΔ ΟΗΚΟΝΟΜΗΚΖ ΘΔΧΡΗΑ ΠΡΟΑΝΑΣΟΛΗΜΟΤ - ΔΠΗΛΟΓΖ

Επαναληπτική Άσκηση - Δέντρα

5 η Δργαζηηριακή Άζκηζη Κσκλώμαηα Γσαδικού Αθροιζηή/Αθαιρέηη

Γηζδηάζηαηνη Πίλαθεο

ΔΡΓΑΙΑ 1. Γιαδικησακά πληροθοριακά σζηήμαηα. Ομάδα Δργαζίας: Μεηαπηστιακοί Φοιηηηές. ηέθανος Κονηοβάς ΑΔΜ :283. Πάζτος Βαζίλειος ΑΔΜ :288

Δξγαιεία Καηαζθεπέο 1 Σάμε Δ Δ.Κ.Φ.Δ. ΥΑΝΗΩΝ ΠΡΩΣΟΒΑΘΜΗΑ ΔΚΠΑΗΓΔΤΖ. ΔΝΟΣΖΣΑ 2 ε : ΤΛΗΚΑ ΩΜΑΣΑ ΔΡΓΑΛΔΗΑ ΚΑΣΑΚΔΤΔ. Καηαζθεπή 1: Ογθνκεηξηθό δνρείν

Κεθάιαην 20. Ελαχιστοποίηση του κόστους

Transcript:

Απνζήθεο Γεδνκέλσλ θαη Δμόξπμε Γεδνκέλσλ: Απνζήθεο Γεδνκέλσλ: Μέξνο Α http://datalab.csd.auth.gr/~gounaris/courses/dwdm/

Δπραξηζηίεο Οη δηαθάλεηεο ηνπ καζήκαηνο ζε γεληθέο γξακκέο αθνινπζνύλ ην ζύγγξακκα «Δηζαγσγή ζηελ Δμόξπμε θαη ηηο Απνζήθεο Γεδνκέλσλ» Αξρηθέο εθδόζεηο από κέξνο ησλ δηαθαλεηώλ εηνηκάζηεθαλ από ηνλ Γξ. Α. Ναλόπνπιν. Xξεζηκνπνηήζεθε επηπιένλ πιηθό από ηα βηβιία «Introduction to Data Mining» ησλ Tan, Steinbach, Kumar, θαη «Data Mining: Concepts and Techniques» ησλ Jiawei Han, Micheline Kamber. 2

Τη ζα εμεηάζνπκε Κίλεηξν Δηζαγσγηθέο έλλνηεο Θέκαηα ζρεδίαζεο 3

Πξνβιήκαηα ζρεζηαθώλ ΒΓ Σηηο Δπηρεηξεζηαθέο Βάζεηο, ηηο πεξηζζόηεξεο θνξέο, ηα δεδνκέλα δελ έρνπλ θαιή πνηόηεηα (ειιηπή ζηνηρεία, ζόξπβνο, θαη αζπλέπεηεο) Δίλαη εηεξνγελή, ιόγσ αλεμαξηεζίαο ησλ ΒΓ Π.ρ., πειάηεο πνπ έρεη θαηαρσξεζεί κε δηαθνξεηηθά ζηνηρεία ζηε βάζε ηνπ ηκήκαηνο πσιήζεσλ θαη ζηε βάζε ηνπ ηκήκαηνο κάξθεηηλγθ. Οη Δπηρεηξεζηαθέο Βάζεηο δηαηεξνύλ δεδνκέλα κόλν γηα ηελ ηξέρνπζα θαηάζηαζε. κέζσ δηαδηθαζηώλ ελεκέξσζεο (εηζαγσγέο/δηαγξαθέο). Π.ρ., ζηε βάζε ηνπ ηκήκαηνο πξνκεζεηώλ δηαηεξνύληαη κόλν όζνη πξνκεζεπηέο ζπλεξγάδνληαη απηή ηε ζηηγκή ελώ κπνξεί λα ρξεηαζζνύλ δεδνκέλα θαη γηα πξνκεζεπηέο πνπ ζπλεξγαδόηαλ ζην παξειζόλ (λα ζπγθξηζνύλ νη ηηκέο ηνπο) 4

Πξνβιήκαηα ζρεζηαθώλ ΒΓ (ζπλέρεηα) Η αλάιπζε ησλ δεδνκέλσλ δελ είλαη εύθνιν λα επηηεπρζεί κε εξγαιεία όπσο ε γιώζζα SQL. Πξνθύπηνπλ πεξίπινθα εξσηήκαηα ηα νπνία δελ είλαη εύθνιν λα ζπληαρζνύλ. Γείηε παξαδείγκαηα από ην TPC-H. Tα Σρεζηαθά ΣΓΒΓ ζην θπζηθό επίπεδν δελ είλαη ζρεδηαζκέλα γηα λα αληαπνθξίλνληαη ζηηο απαηηήζεηο ηέηνησλ πεξίπινθσλ εξσηεκάησλ. Χξεηαδόκαζηε δηαθνξεηηθά επξεηήξηα. Τα δεδνκέλα νξγαλώλνληαη κε Γηάγξακκα Οληνηήησλ- Σπζρεηίζεσλ (ΓΟΣ) θαη αξρώλ όπσο ε θαλνληθνπνίεζε. Αιιά παξάγνληαη πεξίπινθεο βάζεηο ζην λνεηηθό επίπεδν. Γηα αλάιπζε ρξεηαδόκαζηε απινύζηεξα κνληέια. 5

Απνζήθεο δεδνκέλσλ Η ηερλνινγία ησλ απνζεθώλ δεδνκέλσλ πξνζθέξεη νινθιήξσζε εηεξνγελώλ πεγώλ δεδνκέλσλ θαη πιαηθόξκα γηα απνδνηηθή αλάιπζε ηζηνξηθώλ δεδνκέλσλ. Μία απνζήθε δεδνκέλσλ απνηειεί κία ζπιινγή δεδνκέλσλ πνπ επηιέγνληαη από ηηο Δπηρεηξεζηαθέο Βάζεηο, νινθιεξώλνληαη, ελώ ζηε ζπλέρεηα ηα δεδνκέλα ζηελ ΑΓ αλαιύνληαη κε δηαδηθαζίεο όπσο ε On-line Analytical Processing (OLAP) ή ε εμόξπμε δεδνκέλσλ. 6

Απνζήθεο δεδνκέλσλ 7

Δπηηπρία απνζεθώλ δεδνκέλσλ Πξνζέιθπζε γξήγνξα ην επηρεηξεκαηηθό ελδηαθέξνλ. Πξώηεο πξνζπάζεηεο ζηα κέζα ηεο δεθαεηίαο ηνπ 1990, νπόηε νη απνζήθεο δεδνκέλσλ εμειίρζεθαλ ζε αγνξά ηεο ηάμεο ησλ 2 δηζ $ Οη πξώηεο πξνζπάζεηεο είραλ πνζνζηό επηηπρίαο κόιηο 20% Ήδε από ηα ηέιε ηεο δεθαεηίαο ηνπ 1990, ην 95% ησλ 1000 επηρεηξήζεσλ ηνπ Fortune αλέπηπζζαλ απνζήθεο δεδνκέλσλ, νπόηε ε αγνξά ησλ απνζεθώλ δεδνκέλσλ αλήξζε νηθνλνκηθά ζην ύςνο ησλ 7 δηζ $. Δθηηκήζεθε όηη ζε 3 ρξόληα από ηελ αλάπηπμε κίαο απνζήθεο δεδνκέλσλ, ε απόζβεζε γίλεηαη ζε πνζνζηό 400%. 8

Οξηζκόο απνζήθεο δεδνκέλσλ Σύκθσλα κε ηνλ Inmon (1996) νξίδνπκε κία πξνζαλαηνιηζκέλε πξνο ην ζέκα (subjectoriented), νινθιεξσκέλε (integrated), ρξνληθά κεηαβαιιόκελε (time-variant), θαη κε πηεηηθή ζπιινγή δεδνκέλσλ κε ζθνπό ηελ ππνζηήξημε ιήςεο απνθάζεσλ. 9

«Πξνζαλαηνιηζκέλε πξνο ην ζέκα» Οξγαλώλεηαη γύξσ από ζεκαληηθά ζέκαηα όπσο π.ρ., πείξακα, πειάηεο, πξντόλ, πσιήζεηο, θιπ. Δπηθεληξώλεηαη ζηε κνληεινπνίεζε θαη αλάιπζε δεδνκέλσλ γηα ηνπο ππεπζύλνπο ιήςεο (ζηξαηεγηθώλ) απνθάζεσλ, όρη γηα ηηο θαζεκεξηλέο ιεηηνπξγίεο ή ζπλαιιαγέο. Παξέρεη κία απιή ζηελ θαηαλόεζε θαη ζπλνπηηθή όςε ζπγθεθξηκέλσλ πηπρώλ ηνπ ζέκαηνο απνθιείνληαο κε ρξήζηκα δεδνκέλα γηα ππνζηήξημε απνθάζεσλ. 10

«Οινθιεξσκέλε» Γεκηνπξγείηαη από νινθιήξσζε πνιιώλ θαη εηεξνγελώλ πεγώλ δεδνκέλσλ Σρεζηαθέο ΒΓ, αξρεία, εγγξαθέο ζπλαιιαγώλ, πεγέο από ηνλ παγθόζκην ηζηό, θ.ν.θ. Τερληθέο θαζαξηζκνύ θαη νινθιήξσζεο είλαη απαξαίηεην λα εθαξκνζηνύλ γηα λα εγγπεζεί ε ζπλέπεηα ζε νλνκαηνινγία, δνκέο, κέηξα ηδηνηήησλ ζε όια ηα δεδνκέλα αλεμαξηήησο από πνπ πξνέξρνληαη Π.ρ., ηηκή μελνδνρείνπ: λόκηζκα, θόξνο, πξσηλό, θιπ. Όηαλ ηα δεδνκέλα θνξηώλνληαη ζηελ απνζήθε, κεηαζρεκαηίδνληαη. 11

«Χξνληθά Μεηαβαιόκελε» Ο ρξνληθόο νξίδνληαο ηεο ΑΓ είλαη ζεκαληηθά επξύηεξνο από απηόλ ησλ επηρεηξεζηαθώλ ΒΓ. Δπηρεηξεζηαθέο ΒΓ: ηξέρνπζα ηηκή δεδνκέλσλ ΑΓ: ηα δεδνκέλα παξέρνπλ πιεξνθνξίεο θαη από ηζηνξηθή ζθνπηά (π.ρ., ηηκέο ησλ ηειεπηαίσλ 5-10 ρξόλσλ) Κάζε θύξηα δνκή ζηελ ΑΓ Πεξηέρεη, είηε άκεζα, είηε έκκεζα, ην ζηνηρείν ηνπ ρξόλνπ Τα θιεηδηά ζηηο απιέο ΒΓ δελ πεξηέρνπλ θάηη ηέηνην ζπλήζσο 12

«Με πηεηηθή» Η ΑΓ απνζεθεύεηαη θπζηθά. Αιιαγέο ζηα ηξέρνληα επηρεηξεζηαθά δεδνκέλα δελ επεξεάδνπλ απηόκαηα ηηο ΑΓ. Οη ΑΓ δελ ρξεηάδνληαη κεραληζκνύο επεμεξγαζίαο ζπλαιιαγώλ, αλάθηεζεο θαη ειέγρνπ ηαπηνρξνληζκνύ. Αληίζεηα, απαηηνύλ 2 βαζηθέο ιεηηνπξγίεο: Αξρηθή θόξησζε δεδνκέλσλ θαη πξόζβαζε ζηα δεδνκέλα. 13

Γηαθνξέο ΑΓ θαη ΒΓ Χαρακτηριστικό Σχεζιακό ΣΓΒΓ Αποθήκη Γεδομένων Σκοπός «ηξέμηκν» θαζεκεξηλώλ δηεξγαζηώλ Υπνζηήξημε απνθάζεσλ Λειηοσργία Γηεθπαηξέσζε ζπλαιιαγώλ Δμαγσγή πιεξνθνξίαο Χρήζηες Καηώηεξνη εξγαδόκελνη, DBAs Υςειόβαζκα ζηειέρε, αλαιπηέο Αριθμός Χρηζηών (κέρξη) ρηιηάδεο (κέρξη) εθαηνληάδεο Δεδομένα Τξέρνληα, απνκνλσκέλα Ιζηνξηθά, νινθιεξσκέλα Ενδεικηικό Μέγεθος <100GΒ 10s-100s TB Στεδιαζμός ΟΣ θαλνληθνπνίεζε Μνληει/ζε δηαζηάζεσλ, απνθαλ/ζε Χρήζη Δπαλαιεπηηθή Ad-hoc Προζπέλαζη Αλάγλσζε/εγγξαθή (θπξίσο) αλάγλσζε Ενημέρωζη Σπλερήο Πεξηνδηθή Μονάδα εργαζίας Σύληνκεο, απιέο ζπλαιιαγέο Πεξίπινθα εξσηήκαηα Χρόνοι διεκπαιρέωζης <sec Mins-hours #προζπελ. εγγραθές 10s 1000000s Μονάδα απόδοζης Σπλαιιαγέο/sec Φξόλνο απόθξηζεο ACID Ναη Όρη Καηάλογοι Β-δέλδξα Καηάινγνη bitmap 14

Αξρηηεθηνληθή απνζεθώλ δεδνκέλσλ ETL: Extract-Transform-Load +διαδικαζίερ ενημέπωζηρ (triggers, log sniff) bottom-up vs. topdown 15

Έλα πξαγκαηηθό ETL παξάδεηγκα Dayal et al. Data Integration Flows for Business Intelligence, EDBT 09 16

Σύγθξηζε ΑΓ θαη εηεξνγελώλ ΣΓΒΓ Τππηθή νινθιήξσζε εηεξνγελώλ ΒΓ: έκθαζε ζηελ επεμεξγαζία εξσηήζεσλ αλάπηπμε wrappers/mediators πάλσ από ηηο δηάθνξεο ΒΓ Όηαλ ππνβάιιεηαη έλα εξώηεκα, κε ηε βνήζεηα κεηα-θαηαιόγνπ, ην εξώηεκα κεηαθξάδεηαη ζε ππνεξσηήκαηα ηα νπνία κπνξνύλ λα απαληεζνύλ από ηηο εηεξνγελεηο ΒΓ πνπ απαξηίδνπλ ην ζύζηεκα. Καηόπηλ, ηα επηκέξνπο απνηειέζκαηα ελσπνηνύληαη ώζηε λα παξαρζεί ε ηειηθή απάληεζε. Πεξίπινθν θηιηξάξηζκα πιεξνθνξηώλ, αληαγσληζκόο γηα πόξνπο ΑΓ: έκθαζε ζε πςειή απόδνζε, ελεκέξσζε δεδνκέλσλ Οη πιεξνθνξίεο έρνπλ νινθιεξσζεί από πξηλ θαη είλαη δηαζέζηκεο γηα απεπζείαο εξσηήκαηα θαη αλάιπζε 17

Back-End Δξγαιεία ΑΓ Δμαγσγή Γεδνκέλσλ Λήςε δεδνκέλσλ από πνιιέο, εηεξνγελείο ΒΓ. Καζαξηζκόο Γεδνκέλσλ Δληνπηζκόο ιαζώλ ζηα δεδνκέλα θαη δηόξζσζή ηνπο όπνπ είλαη δπλαηόλ. Μεηαζρεκαηηζκόο Γεδνκέλσλ Σηε κνξθή ηεο ΑΓ από ηε κνξθή πνπ είραλ αξρηθά. Φόξησζε Ταμηλόκεζε, πεξίιεςε, νινθιήξσζε, ππνινγηζκόο όςεσλ, έιεγρνο αθεξαηόηεηαο, δεκηνπξγία επξεηεξίσλ. Αλαλέσζε Αλαπαξαγσγή ελεκεξώζεσλ από ηηο επηρεηξεζηαθέο ΒΓ ζηελ ΑΓ. 18

Κύβνο δεδνκέλσλ Γιαζηάζειρ-Μέηπα Ιεραρχίες 19

Σρήκα αζηέξα 20

OLAP Δύθνιε δηαηύπσζε αλαιπηηθώλ εξσηήζεσλ επί θύβσλ θαη γξήγνξε εθηέιεζή ηνπο Roll-up: Παξάγεη θύβν δεδνκέλσλ κε κεησκέλν επίπεδν ιεπηνκέξεηαο όηαλ (α) ζε θάπνηεο δηαζηάζεηο επηιέγνπκε αλώηεξν επίπεδν ζηελ ηεξαξρία ηνπο ή (β) αθαηξνύκε θάπνηεο δηαζηάζεηο Drill-down: Παξάγεη θύβν δεδνκέλσλ κε απμεκέλν επίπεδν ιεπηνκέξεηαο όηαλ (α) ζε θάπνηεο δηαζηάζεηο επηιέγνπκε θαηώηεξν επίπεδν ζηελ ηεξαξρία ηνπο ή (β) πξνζζέηνπκε θάπνηεο δηαζηάζεηο Slice: Παξάγεη θύβν εθαξκόδνληαο επηινγή ζε κία κόλν δηάζηαζε (αληηζηνηρεί ζηηο πξάμεηο επηινγήο θαη πξνβνιήο) Dice: Παξάγεη θύβν εθαξκόδνληαο επηινγή ζε κία πεξηζζόηεξεο δηαζηάζεηο Pivot: Παξάγεη θύβν κε άιιε δηάηαμε ησλ δηαζηάζεσλ 21

OLAP 22

OLAP θαη ζπλάζξνηζε Γηα ηελ εθαξκνγή OLAP πξάμεσλ απαηηείηαη ν νξηζκόο ηνπ ηξόπνπ παξαγσγήο ησλ θύβσλ-απνηειεζκάησλ, κέζσ κίαο ζπλαζξνηζηηθήο ζπλάξηεζεο Οη βαζηθέο ζπλαζξνηζηηθέο ζπλαξηήζεηο είλαη αζξνίζκαηνο (sum), πιήζνπο (count), κέζνπ όξνπ (avg), κεγίζηνπ (max), θαη ειαρίζηνπ (min). 23

OLAP θαη ζπλάζξνηζε 24

Κύβνο Γεδνκέλσλ Κύβνο δεδνκέλσλ: Πιέγκα Κπβνεηδώλ (cuboids) all 0-D(apex) cuboid time item location supplier 1-D cuboids time, item time, location item, location time, supplier item, supplier time, location, supplier location, supplier 2-D cuboids 3-D cuboids time, item, location time, item, supplier item, location, supplier time, item, location, supplier 4-D(base) cuboid 25

Τξεηο ηύπνη ζρεκάησλ Σρήκα αζηέξα: Έλαο πίλαθαο γεγνλόησλ ζηε κέζε πνπ ζπλδέεηαη κε πνιινύο πίλαθεο δηαζηάζεσλ. Σρήκα ληθάδαο: Τξνπνπνίεζε ηνπ ζρήκαηνο αζηέξα κε ηελ έλλνηα όηη θάπνηνη πίλαθεο δηαζηάζεσλ είλαη θαλνληθνπνηεκέλνη, ζρεκαηίδνληαο ζρήκα ρηνλν-ληθάδαο. Αζηεξηζκνί γεγνλόησλ: Πνιιαπινί πίλθαθεο γεγνλόησλ κνηξάδνληαη πίλαθεο δηαζηάζεσλ. 26

Παξάδεηγκα Σρήκαηνο Αζηέξα time time_key day day_of_the_week month quarter year branch branch_key branch_name branch_type Measures Sales Fact Table time_key item_key branch_key location_key units_sold dollars_sold avg_sales item item_key item_name brand type supplier_type location location_key street city state_or_province country 27

Παξάδεηγκα Σρήκαηνο Νηθάδαο time time_key day day_of_the_week month quarter year Sales Fact Table time_key item_key item item_key item_name brand type supplier_key supplier supplier_key supplier_type branch branch_key branch_name branch_type Measures branch_key location_key units_sold dollars_sold avg_sales location location_key street city_key city city_key city state_or_provin ce country 28

Παξάδεηγκα Σρήκαηνο Αζηεξηζκνύ time time_key day day_of_the_week month quarter year Sales Fact Table time_key item_key item item_key item_name brand type supplier_type Shipping Fact Table time_key item_key shipper_key branch_key from_location branch location_key location to_location branch_key branch_name branch_type units_sold dollars_sold avg_sales location_key street city province_or_state country dollars_cost units_shipped shipper Measures shipper_key shipper_name location_key shipper_type 29

Μνληεινπνίεζε κε δηαζηάζεηο: Βήκαηα ζρεδηάζεο 4 ζρεδηαζηηθά βήκαηα γηα ζρήκα αζηέξα: Δπηινγή ηεο δηαδηθαζίαο πνπ ζα κνληεινπνηεζεί Δπηινγή επηπέδνπ ιεπηνκέξεηαο Δπηινγή ησλ πηλάθσλ δηαζηάζεσλ Δπηινγή ησλ αξηζκεηηθώλ γεγνλόησλ 30

Παξάδεηγκα e-βηβιηνπσιείν 20 ππνθαηαζηήκαηα ζε πέληε γεσγξαθηθά δηακεξίζκαηα ηεο Διιάδαο Σε θάζε ππνθαηάζηεκα ππάξρνπλ 3 μερσξηζηά ηκήκαηα: ησλ βηβιίσλ, ησλ ειεθηξνληθώλ κέζσλ (π.ρ., πνιπκεζηθνί ηίηινη), θαη ησλ εηδώλ γξαθείνπ (π.ρ., ζηπιό, ραξηί). Κάζε ππνθαηάζηεκα έρεη πεξίπνπ 20000 δηαθξηηά πξντόληα πξνο πώιεζε. Κάζε πξντόλ αλαγλσξίδεηαη από ηνλ ξαβδν-θσδηθό ηνπ (bar-code). Οη επηρεηξεκαηηθέο δηαδηθαζίεο ηνπ βηβιηνπσιείνπ πεξηιακβάλνπλ: πσιήζεηο, πξνκήζεηεο απνζήθεπζε πξντόλησλ. Μία από ηηο ζεκαληηθόηεξεο απνθάζεηο ζηελ επηρείξεζε, απνηειεί ε ηηκνιόγεζε ησλ πξντόλησλ. Γεδνκέλα πσιήζεσλ ιακβάλνληαη εύθνια ζηα ζεκεία πώιεζεο (κε ρξήζε ξαβδνθσδηθώλ) Γεδνκέλα ιακβάλνληαη θαηά ηελ παξάδνζε πξντόλησλ από ηνπο πξνκεζεπηέο θαη θαηά ηε δηαδηθαζία ηεο απνγξαθήο ζηηο απνζήθεο 31

Τα 4 βήκαηα γηα ην βηβιηνπσιείν Δπηινγή ηεο δηαδηθαζίαο πνπ ζα κνληεινπνηεζεί Πξνηεξαηόηεηα ζηε κνληεινπνίεζε ηεο δηαδηθαζίαο πσιήζεσλ (πιένλ θξίζηκε) Δπηινγή επηπέδνπ ιεπηνκέξεηαο όζν ην δπλαηόλ κεγαιύηεξν επίπεδν ιεπηνκέξεηαο: θαηαγξάθνπκε μερσξηζηά θάζε αηνκηθή ζπλαιιαγή ελόο πειάηε Δπηινγή ησλ πηλάθσλ δηαζηάζεσλ («πνηεο πιεξνθνξίεο πεξηγξάθνπλ θάζε γξακκή ηνπ πίλαθα γεγνλόησλ») πειάηεο, πξντόλ, εκεξνκελία, ππνθαηάζηεκα, ζπλαιιαγή (εθθπιηζκέλε δηάζηαζε) Δπηινγή ησλ αξηζκεηηθώλ γεγνλόησλ (ηη κεηξάκε ζε θάζε γξακκή ηνπ πίλαθα γεγνλόησλ) αξηζκόο ηεκαρίσλ, θόζηνο πώιεζεο 32

Σρήκα αζηέξα γηα ην βηβιηνπσιείν 33

Πίλαθεο δηαζηάζεσλ Κωδικόρ Πελάηη Ονομαζί α Γιεύθςνζη Καηοικίαρ Πόλη Νομόρ Γιαμέπιζμα Φύλλο 1 Α. Νίκος Δπμού 10 Αθήνα Αηηικήρ η. Δλλάδα Άππεν 2 Μ. Βάνος Αιώλος 23 Θεζ/νίκη Θεζ/νίκηρ Μακεδονία Θήλλς Πιήξε θαη πεξηγξαθηθά νλόκαηα (ΟΧΙ θσδηθνπνηήζεηο) Όζν ην δπλαηόλ πεξηζζόηεξεο ηδηόηεηεο Τερλεηά θύξηα θιεηδηά 34

Από-θαλνληθνπνίεζε Κωδικόρ Ημεπομηνίαρ Ημεπομηνία Ημέπα Δβδομάδαρ Μήναρ Έηορ Οικονομικό Έηορ Καηαναλωηική Πεπίοδορ 1 1/1/07 Γεςηέπα Ιαν 2007 Ο2006 Νέο Έηορ 151 1/6/07 Παπαζκεςή Ιοςν 2007 Ο2007 Δκπηώζειρ Απιόηεηα Απνηειεζκαηηθόηεηα (απνθπγή joins) Γελ θεξδίδνπκε ρώξν (GB fact table vs MB dimensions) Γελ έρνπκε ελεκεξώζεηο 35

Τύπνη πηλάθσλ γεγνλόησλ Πίλαθεο γεγνλόησλ ζπλαιιαγώλ Γεγνλόηα θάπνηα ρξνληθή ζηηγκή Πίλαθεο γεγνλόησλ πεξηνδηθήο θσηνγξάθεζεο Μέηξεζε ελόο κεγέζνπο αλά πεξηνδηθά ρξνληθά δηαζηήκαηα Πίλαθεο γεγνλόησλ ζπζζσξεπηηθήο θσηνγξάθεζεο Αλαπαξηζηά έλα πιήξε θύθιν δσήο 36

Παξάδεηγκα βηβιηνπσιείνπ Γςζκολία ζηον ςπολογιζμό ηων διαθέζιμων ηεμασίων ανά σπονική ζηιγμή Ημιαθποίζιμο απιθμ. γεγονόρ Αςξημένερ απαιηήζειρ σώπος 37

ζπλέρεηα Μεγαλύηεπορ απιθμόρ πινάκων διαζηάζεων 38

Σύκθσλεο δηαζηάζεηο Δπαλαρξεζηκνπνίεζε Απνθπγή επαλνξηζκνύ θαη απνθιίζεσλ Αξρηηεθηνληθή δηαδξόκνπ (bus architecture) Ημεπομηνία Πποϊόν Υποκαηάζηημα Πελάηηρ Ππομηθεςηήρ Πωλήζειρ Απογπαθή Ππομήθειερ Παπαδόζειρ 39

Χεηξηζκόο κεηαβνιώλ Κωδικόρ Ονομαζία Καηηγοπία Ραβδοκωδικόρ 10 Διζαγωγή ζηη Java Βιβλίο 123456 Από βιβλίο γίνεται CD Κωδικόρ Ονομαζία Καηηγοπία Ραβδοκωδικόρ 10 Διζαγωγή ζηη Java CD 123456 Χάλνπκε ηελ πξνεγνύκελε θαηάζηαζε (νη πσιήζεηο πξηλ ηελ αιιαγή ζα πξνζππνινγίδνληαη ζηα CD) 40

Χεηξηζκόο κεηαβνιώλ Κωδικόρ Ονομαζία Καηηγοπία Ραβδοκωδικόρ 10 Διζαγωγή ζηη Java Βιβλίο 123456 Από βιβλίο γίνεται CD Κωδικόρ Ονομαζία Καηηγοπία Ραβδοκωδικόρ 10 Διζαγωγή ζηη Java Βιβλίο 123456 25 Διζαγωγή ζηη Java CD 123456 - Γεν σάνοςμε ηην πποηγούμενη καηάζηαζη - Γςναηό μόνο λόγω ηεσνηηού κλειδιού - Δναλλάκηικά, πποζθέηοςμε νέα ζηήλη «Πποηγούμενη Καηηγοπία» - Για πολύ γπήγοπα μεηαβαλλόμενερ ιδιόηηηερ, μποπούμε να δημιοςπγήζοςμε ξεσωπιζηό πίνακα μικποδιάζηαζηρ 41