Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής. Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Mining) Επισκόπηση περιοχής. Γιάννης Θεοδωρίδης

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής. Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Mining) Επισκόπηση περιοχής. Γιάννης Θεοδωρίδης"

Transcript

1 Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Mining) Επισκόπηση περιοχής Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων version: πληµµύρα από δεδοµένα Παράγονται όλο και περισσότερα δεδοµένα: Τραπεζικά, τηλεπικοινωνιακά,... Επιστηµονικά δεδοµένα: αστρονοµικά, βιολογικά κλπ. Κείµενα στο web κ.α. Αποθηκεύονται όλο και περισσότερα δεδοµένα: Γρήγορη και φθηνή τεχνολογία αποθήκευσης Ικανά Σ Β για µεγάλες Β 2 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 1

2 Παραδείγµατα Το ευρωπαϊκό Very Long Baseline Interferometry (VLBI) διαθέτει 16 τηλεσκόπια, καθένα από τα οποία παράγει 1 Gigabit/second αστρονοµικά δεδοµένα σε συνόδους παρατήρησης των 25 ηµερών η αποθήκευση και ανάλυση τέτοιου όγκου δεδοµένων είναι πρόβληµα Ο τηλεπικοινωνιακός κολοσός AT&T χειρίζεται δισεκατοµµύρια κλήσεις / µέρα τόσο µεγάλος είναι ο όγκος των δεδοµένων που αυτά δεν αποθηκεύονται η ανάλυση γίνεται «στον αέρα» (on the fly) Η Β της επιχείρησης λιανεµπορίου Wal-Mart είναι της τάξης των 24 Tbytes Το UC Berkeley έκανε την εκτίµηση ότι µέσα στο 2002 παρήχθησαν 5 Exa-bytes (5 εκατοµµύρια TBytes) δεδοµένων!!! 3 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Τάσεις ανάπτυξης Ονόµος του Moore Η ταχύτητα των υπολογιστών διπλασιάζεται κάθε 18 µήνες Ο νόµος της αποθήκευσης Τα δεδοµένα που αποθηκεύονται διπλασιάζονται κάθε 9 µήνες Κατά συνέπεια... πολύ λίγα από αυτά τα δεδοµένα µπορεί να κοιτάξει (και να αναλύσει) οάνθρωπος processing storage Άρα χρειάζεται η ανακάλυψη γνώσης µέσα από τα δεδοµένα (Knowledge Discovery in Data - KDD) για να δώσει νόηµα και χρήση στα δεδοµένα 4 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 2

3 Περιεχόµενα Εισαγωγή στη διαδικασία «Ανακάλυψης Γνώσης από εδοµένα» Ορισµός, βασικέςτεχνικέςεξόρυξηςγνώσης(data mining) Αποθήκες δεδοµένων Κύβοι, λειτουργίες πολυδιάστατης ανάλυσης δεδοµένων (OLAP) Η διαδικασία της προπαρασκευής δεδοµένων Καθαρισµός, µετασχηµατισµός, µείωση δεδοµένων 5 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Περιεχόµενα Εισαγωγή στη διαδικασία «Ανακάλυψης Γνώσης από εδοµένα» Ορισµός, βασικέςτεχνικέςεξόρυξηςγνώσης(data mining) Αποθήκες δεδοµένων Κύβοι, λειτουργίες πολυδιάστατης ανάλυσης δεδοµένων (OLAP) Η διαδικασία της προπαρασκευής δεδοµένων Καθαρισµός, µετασχηµατισµός, µείωση δεδοµένων 6 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 3

4 Ορισµός της διαδικασίας KDD Η ανακάλυψη γνώσης από δεδοµένα (Knowledge Discovery in Data KDD) είναι η µη τετριµµένη διαδικασία εύρεσης έγκυρων, πρωτότυπων, πιθανώς χρήσιµων και οπωσδήποτε κατανοητών προτύπων (patterns) µέσα στα δεδοµένα. Τι δεν είναι data mining επεξεργασία ερωτήσεων βάσεων δεδοµένων χρήση προγρµµάτων µηχανικής µάθησης ή στατιστικής Εναλλακτικές µεταφράσεις του όρου data mining: «εξόρυξη δεδοµένων» «εξόρυξη γνώσης από δεδοµένα» «όρυξη δεδοµένων» 7 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Σχετικά επιστηµονικά πεδία Τεχνητή Νοηµοσύνη (Μηχανική Μάθηση) Οπτικοποίηση Πληροφορίας Ανακάλυψη Γνώσης από εδοµένα (KDD) Στατιστική Βάσεις εδοµένων 8 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 4

5 ιαδικασία ανακάλυψης γνώσης Ολοκλήρωση Ερµηνεία & Αξιολόγηση Knowledge Πρωτογενή δεδοµένα Επιλογή & καθαρισµός Αποθήκη εδοµένων (data warehouse) Μετασχηµατισµός Εξόρυξη Γνώσης (Data Mining Μετ/να εδοµένα δεδοµένα στόχος (target data) Πρότυπα (patterns) και Κανόνες (rules) Γνώση Κατανόηση 9 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Εξόρυξη γνώσης από δεδοµένα Data mining (ένας ευρύς ορισµός): Η διαδικασία ηµιαυτόµατης ανάλυσης µεγάλων Β µε στόχο την εύρεση χρήσιµης πληροφορίας «γνώσης» π.χ.: «καλύτεροι πελάτες είναι αυτοί µε σπουδέςµεταπτυχιακού επιπέδου (ανεξαρτήτως ύψους εισοδήµατος) ή αυτοίµε υψηλά εισοδήµατα (ανεξαρτήτως επιπέδου σπουδών) Παράδειγµα αναπαράστασης: δέντρο απόφασης (decision tree) Πώς θα προκύψει ένα τέτοιο πρότυπο (pattern) από µια µεγάλη Β ; 10 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 5

6 Παράδειγµα Decision Tree 11 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Εφαρµογές Data Mining Market analysis and management target marketing, customer relation management, market basket analysis, cross selling, market segmentation Risk analysis and management Forecasting, customer retention, improved underwriting, quality control, competitive analysis Fraud detection and management αλλά και... Intelligent query answering Text / Web mining (news group, , documents) 12 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 6

7 Τι δεδοµένα αναλύουµε table data - fixed # of columns time series text - free-form transactions (association rules) anonymized data spatial data (2D 3-D) web clickstream links or networks images / video XML data web content music / audio 34.0% 33.0% 28.3% 25.5% 14.2% 10.4% 8.5% 8.5% 7.5% 6.6% 5.7% 4.7% 70.8% Source: (Jul. 2006) 13 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Βήµατα εξόρυξης γνώσης µεθοδολογία CRISP-DM Business understanding Data understanding Data preparation Modeling Evaluation Deployment 14 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 7

8 Τεχνικές DM Supervised learning (Classification / Prediction) Decision Trees, Neural Nets, Bayesian classification Unsupervised learning (Clustering) Hierarchical, partitional, density-based Association rule mining κ.α. Refund Yes No MarSt NO Single, Divorced TaxInc < 80K > 80K YES NO Married NO 15 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Κατηγοριοποίηση (Classification) Ταξινόµηση, Πρόβλεψη Εκµάθηση µιας τεχνικής να προβλέπει την κλάση ενός στοιχείου επιλέγοντας από προκαθορισµένες τιµές Προσεγγίσεις: στατιστικές µέθοδοι δένδρα αποφάσεων νευρωνικά δίκτυα ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 8

9 Κατηγοριοποίηση (Classification) έντρα Αποφάσεων (decision trees) Y 3 if X > 5 then blue else if Y > 3 then blue else if X > 2 then green else blue 2 5 X 17 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Συσταδοποίηση (Clustering) Οµαδοποίηση Εύρεση µιας φυσικής οµαδοποίησης των δεδοµένων, χωρίς προκαθορισµό τωνοµάδων C 1 C 2 C 3 C 4 Οµαδοποίηση βάσει απόστασης (Εκλείδειας ή άλλης) στατιστικής κατανοµής ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 9

10 Εξόρυξη κανόνων συσχετίσεων Εύρεση ταυτόχρονων εµφανίσεων δεδοµένων (άρα, πιθανήςσυσχέτισηςήεξάρτησης) µέσα σε ένα «καλάθι» δεδοµένων 19 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Ανάλυση χρονολογικών σειρών Μπορούµε ναβρούµε τάσεις(κύκλους, εποχιακές συµπεριφορές) και να κάνουµε εκτίµηση µελλοντικών τιµών 20 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 10

11 Οι πιο δηµοφιλείς τεχνικές DM Decision Trees/Rules Regression Clustering Statistics (descriptive) Visualization Association rules Sequence / Time series analysis Neural Nets SVM Bayesian 62.6% 51.2% 50.2% 46.3% 32.5% 26.1% 17.2% 17.2% 15.8% 15.8% Source: (Mar. 2007) 21 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης "Πυραµίδα" Επιχειρηµατικής Ευφυίας (Business Intelligence BI) Making Decisions Managing Director Data Presentation Visualization Techniques Data Mining Information Discovery Business Analyst Data Analyst Data Exploration Statistical Analysis, Querying and Reporting Data Warehouses / Data Marts OLAP, MDA Data Sources Paper, Files, Information Providers, Database Systems, OLTP DBA 22 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 11

12 Case Study -1 απευθείας προώθηση προϊόντων & CRM Οι εταιρείες που κάνουν απευθείας προώθηση προϊόντων (direct marketing) χρησιµοποιούν µοντέλα και τεχνικές εξόρυξης γνώσης Η µοντελοποίηση είναι πιο εφικτή από την αλλαγή συµπεριφοράς του πελάτη Πετυχηµένη ιστορία (success story) Ο τηλεπικοινωνιακός παροχέας Verizon Wireless µείωσε τη «διαρροή πελατών» (churn) από 2% σε 1.5% 23 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Case Study -2 Ασφάλεια και ανίχνευση απάτης Ανίχνευση απάτης (Fraud Detection) σε αγορές µε πιστωτικές κάρτες Ξέπλυµα χρήµατος Απάτη στην τηλεφωνία AT&T, Bell Atlantic, British Telecom/MCI Καταπολέµηση τροµοκρατίας ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 12

13 Data Mining και ιδιωτικό απόρρητο TIA: Terrorism (πρώην Total) Information Awareness Program Επιστηµονικό πρόγραµµα χρηµατοδοτούµενο από το Υπουργείο Άµυνας των ΗΠΑ διακόπηκε από το Κογκρέσο µερικές από τις λειτουργίες του µεταφέρθηκαν στις υπηρεσίες πληροφοριών CAPPS II φωτογράφηση όλων των επιβατών των αεροµεταφορών έχει προκαλέσει αντιδράσεις (από επιβάτες, εταιρείες, κυβερνήσεις) Οι τεχνικές Data Mining αναζητούν πρότυπα, όχι ανθρώπους! Υπάρχουν τεχνικές λύσεις που µπορούν να περιορίσουν την πρόσβαση σε προσωπικά δεδοµένα Αντικατάσταση ευαίσθητων δεδοµένων µε ανώνυµους κωδικούς (data anonymization) Κατανεµηµένα δεδοµένα κατανεµηµένος υπολογισµός (distributed data mining) 25 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Ερευνητικά προβλήµατα... Scaling up for huge data 41% Mining text 29% Automating data cleaning 27% Dealing with cost-sensitive data 26% Mining data streams 18% Mining links and networks 17% Unified theory of DM 16% DM for biological problems 14% DM with privacy 8.9% Mining images 7.1% DM for security applications 5.4% Distributed (multi-agent) DM 3.6% Source: (Nov. 2005) 26 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 13

14 Περιεχόµενα Εισαγωγή στη διαδικασία «Ανακάλυψης Γνώσης από εδοµένα» Ορισµός, βασικέςτεχνικέςεξόρυξηςγνώσης(data mining) Αποθήκες δεδοµένων Κύβοι, λειτουργίες πολυδιάστατης ανάλυσης δεδοµένων (OLAP) Η διαδικασία της προπαρασκευής δεδοµένων Καθαρισµός, µετασχηµατισµός, µείωση δεδοµένων 27 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης "Πυραµίδα" Επιχειρηµατικής Ευφυίας (Business Intelligence BI) Making Decisions End User Data Presentation Visualization Techniques Data Mining Information Discovery Business Analyst Data Analyst Data Exploration Statistical Analysis, Querying and Reporting Data Warehouses / Data Marts OLAP, MDA Data Sources Paper, Files, Information Providers, Database Systems, OLTP DBA 28 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 14

15 Μεθοδολογία OLAP βήµατα αναλυτικής διαδικασίας: από την αναζήτηση και µεταφορά των δεδοµένων έως την τελική διάθεση των αποτελεσµάτων της ανάλυσης Source: SPSS 29 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Αποθήκες εδοµένων Ορισµός (κατά W. Inmon): Οι Αποθήκες εδοµένων (data warehouses) αποτελούν day ID day month quarter year salesman ID dept dept desc div div desc day ID product ID salesman ID location ID quantity turnover product ID description type type description location ID zip code state city θεµατο-κεντρικά (subject-oriented), συγκεντρωµένα (integrated), µε χρονική διάσταση (time-variable), µη ευµετάβλητα (non-volatile) συστήµατα διαχείρισης πληροφοριακών δεδοµένων για την υποστήριξη των διαδικασιών λήψης αποφάσεων Πληροφοριακά δεδοµένα: υποστηρίζουν άλλες (πέρα των καθηµερινών) λειτουργίες της επιχείρησης, όπως σχεδιασµό και πρόβλεψη. 30 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 15

16 Περισσότερα για τον ορισµό τωνα Θεµατο-κεντρικά: Οργανώνονται γύρω από συγκεκριµένα θέµατα, όπως πελάτες, προϊόντα, πωλήσεις. εν συµπεριλαµβάνουν πλευρές (δεδοµένα) των θεµάτων που δεν συνεισφέρουν στη διαδικασία λήψης αποφάσεων Συγκεντρωµένα:... Κατασκευάζονται µε συγκέντρωση πολλαπλών, πιθανώς ετερογενών πηγών δεδοµένων (σχεσιακές Β, αρχεία κ.α.) Εφαρµόζονται τεχνικές καθαρισµού και ολοκλήρωσης δεδοµένων (για την εξασφάλιση συνέπειας) 31 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Περισσότερα για τον ορισµό τωνα Με χρονική διάσταση: Ο χρονικός ορίζοντας στις Α είναι ευρύτερος αυτού των Β (ιστορική πληροφορία π.χ. γιατατελευταία5-10 έτη) Η έννοια του χρόνου είναι αναπόσπαστο τµήµα µιας Α Μη ευµετάβλητα: Οι Α αποθηκεύονται ξεχωριστά από τις (επιχειρησιακές) Β. εν υπάρχει η έννοια της τροποποίησης δεδοµένων (άρα δεν υπάρχουν θέµατα επεξεργασίας συναλλαγών, ανάνηψης, ελέγχου συνδροµικότητας). Υπάρχει µόνο η λειτουργία φόρτωσης δεδοµένων είτε πλήρως (full loading) είτε αυξητικά (incremental loading) 32 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 16

17 Αρχιτεκτονική Α other sources Metadata Monitor & Integrator OLAP Server Operational DBs Extract Transform Load Refresh Data Warehouse Serve Analysis Query Reports Data mining Data Marts Data Sources Data Storage OLAP Engine Front-End Tools 33 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Από τους πίνακες στους κύβους Product Ο κύβος δεδοµένων κρατά συνοπτικές πληροφορίες για κάποιο τµήµα της εµπλεκόµενης πληροφορίας day ID day month quarter year day ID product ID location ID Έστω το σχήµα Β : day (day_id, day, month, quarter, year) product (product_id, description, type, type_description) location (location_id, zip code, state, city) sales (day_id, product_id, location_id, units_sold, price) Day Sales (fact table) quantity turnover product ID description type type description Location location ID zip code state city ηεντολήsql που τροφοδοτεί τον κεντρικό πίνακα (fact table) της Α είναι: SELECT s.day_id, s.product_id, s.location_id, sum(s.units_sold) AS quantity, sum(s.units_sold * s.price) AS turnover FROM day d, product p, location l, sales s WHERE s.day_id = d.day_id and s.product_id = p.product_id and s.location_id = l.location_id GROUP BY s.day_id, s.product_id, s.location_id 34 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 17

18 Πολυδιάστατο µοντέλο δεδοµένων Το πολυδιάστατο µοντέλο δεδοµένων απεικονίζει τα δεδοµένα σε µορφή κύβου Ένας κύβος δεδοµένων επιτρέπει τη µοντελοποίηση και θεώρηση των δεδοµένων σε πολλαπλές διαστάσεις. Το σχήµα αποτελείται από: Πίνακες διαστάσεων (dimension tables) µε πληροφορία για τις διαστάσεις του κύβου Πίνακες γεγονότων (fact tables) µε µέτρα και κλειδιά προς τους σχετιζόµενους πίνακες διαστάσεων 35 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Όψη κύβου δεδοµένων Product all Πωλήσεις (µέση τιµή, πωληθείσαποσότητακοκ.) Date προϊόντος 123 στο Dallas την 3/1/ all Dallas Houston Seattle Location all 36 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 18

19 Λογικό Σχήµα Α Μοντελοποίηση Α : µέτρα και διαστάσεις Σχήµα αστέρα(star schema): ένας πίνακας γεγονότων στο κέντρο που περιβάλλεται από πίνακες διαστάσεων Σχήµα χιονονιφάδας(snowflake schema): βελτίωση του σχήµατος αστέρα, µεκάποιαδιάστασηναείναικανονικοποιηµένη σε σύνολο µικρότερων πινάκων διαστάσεων Αστερισµοί γεγονότων (fact constellations): περισσότεροι του ενός πίνακες γεγονότων που µοιράζονται από κοινού πίνακες διαστάσεων µπορεί να θεωρηθεί και ως συλλογή σχηµάτων αστέρων γι αυτό και εναλλακτικά ονοµάζεται σχήµα γαλαξία. 37 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Σχήµα αστέρα Product Day day ID day month quarter year Sales (fact table) day ID product ID location ID quantity turnover product ID description type type description Location location ID zip code state city 38 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 19

20 Σχήµα χιονονιφάδας Day day ID day month quarter year Sales (fact table) day ID product ID location ID quantity turnover Product product ID description type Location location ID zip code Product Types type type description Zip codes zip code state city 39 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Αστερισµός γεγονότων Sales (fact table) day ID product ID location ID quantity Shipping (fact table) Product product ID description type Day day ID day month quarter year turnover Location location ID zip code day ID product ID shipper ID from-location to-location shipping-cost units-shipped Shipper shipper ID name type 40 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 20

21 sum Date sum Dallas Houston Seattle Βασικές λειτουργίες OLAP: Location Αναλυτική επεξεργασία δεδοµένων (Online Analytical Processing OLAP): παρέχει πιο πολύπλοκες ερωτήσεις απ ότι η επεξεργασία συναλλαγών (OLTP). Pr od uc t Αναλυτική επεξεργασία δεδοµένων sum Συσσώρευση (roll-up) Ένα κελί Εµβάθυνση (drill-down) Πολλά κελιά Τεµαχισµός (slice) Κοµµάτιασµα (dice) 41 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Κοµµάτιασµα (dice): εξέταση υποκύβου µε επιλογή δύο ή περισσοτέρων διαστάσεων sum Date sum Dallas Houston Seattle Location Τεµαχισµός (slice): εξέταση υποκύβου µε επιλογή µίας διάστασης. Pr od uc t Βασικές λειτουργίες OLAP sum Συσσώρευση (roll-up): πιο γενική διάσταση (άνοδος στην ιεραρχία) Εµβάθυνση (drill-down): πιο λεπτοµερής διάσταση (κάθοδος στην ιεραρχία) 42 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 21

22 Αρχιτεκτονικές OLAP Servers Relational OLAP (ROLAP) ένα σχεσιακό DBMS αποθεκεύει και διαχειρίζεται τα δεδοµένα του warehouse ένα OLAP middle ware υποστηρίζει τις λειτουργίες OLAP εκµεταλλεύεται τις δυνατότητες του DBMS (βελτιστοποίηση κλπ.) κλιµακώνεται καλά Multidimensional OLAP (MOLAP) µηχανή αποθήκευσης πολυδιάστατων δεδοµένων βαζισµένη σε arrays (τεχνικές αραιών µητρών - sparse matrix techniques) γρήγορη δεικτοδότηση πάνω στις (προ-υπολογισµένες) συνόψεις Hybrid OLAP (HOLAP) ευέλικτο σχήµα, σχεσιακό στο χαµηλό επίπεδο και πίνακες στο υψηλό επίπεδο 43 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Η ανάγκη για συντήρηση Α... ξεχωριστής από τη Β Θέµατα επίδοσης των δύο συστηµάτων Σ Β ρυθµισµένο να έχει καλές επιδόσεις σε OLTP: µέθοδοι προσπέλασης, ευρετήρια, έλεγχος συνδροµικότητας, ανάνηψη Α ρυθµισµένη να έχει καλές επιδόσεις σε OLAP: σύνθετες λειτουργίες OLAP, πολυδιάστατη θεώρηση δεδοµένων. ιαφορετικές λειτουργίες πάνω σε διαφορετικά δεδοµένα: Ιστορικά δεδοµένα: Οι αποφάσεις των στελεχών εµπλέκουν δεδοµένα του παρελθόντος, οι Β συντηρούν δεδοµένα του παρόντος Συγκέντρωση δεδοµένων: Οι Α απαιτούν συγκεντρωτικά πληροφορία (συναθροίσεις, συνόψεις) από δεδοµένα που προέρχονται από ετερογενείς πηγές Β 44 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 22

23 Εργασία Κατεβάστε από το site του µαθήµατος και διαβάστε τις εργασίες S. Chaudhuri et al.: Database technology for decision support systems. IEEE Computer, Dec. 2001, pp R. J. Brachman et al.: Mining business databases. Communications of the ACM, Nov. 1996, pp Γράψτε σε 2-3 σελίδες τις ιδέες σας πάνω στα εξής: 1. Τόσο τα συστήµατα OLAP / Data Warehousing όσο και τα εργαλεία Data Mining κάνουν ανάλυση των δεδοµένων µιας επιχείρησης ή οργανισµού. Όµως a. Ποιες οι βασικές διαφορές τους; b. Τι µπορεί να κάνει το ένα που δεν µπορεί να κάνει το άλλο; 2. Ποια από τα ζητήµατα µε τα οποία καταπιάνεται η εργασία σας τράβηξαν περισσότερο το ενδιαφέρον και γιατί; (2-3 ζητήµατα το πολύ) Παράδοση: σε 2 εβδοµάδες από σήµερα 45 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Περιεχόµενα Εισαγωγή στη διαδικασία «Ανακάλυψης Γνώσης από εδοµένα» Ορισµός, βασικέςτεχνικέςεξόρυξηςγνώσης(data mining) Αποθήκες δεδοµένων Κύβοι, λειτουργίες πολυδιάστατης ανάλυσης δεδοµένων (OLAP) Η διαδικασία της προπαρασκευής δεδοµένων Καθαρισµός, µετασχηµατισµός, µείωση δεδοµένων 46 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 23

24 Προπαρασκευή δεδοµένων... Γιατί? Τα δεδοµένα στον πραγµατικό κόσµο είναι«βρώµικα» ελλιπή: έλλειψη τιµών χαρακτηριστικών, έλλειψη ενδιαφερόντων χαρακτηριστικών, µόνο αθροιστικά δεδοµένα λανθασµένα: που περιέχουν λάθη ή outliers ασυνεπή: που περιέχουν ασυµφωνίες σε κωδικούς και ονόµατα Κακή ποιότητα στα δεδοµένα κακή ποιότητα στην εξόρυξη γνώσης! Ποιοτικές αποφάσεις πρέπει να βασίζονται σε ποιοτικά δεδοµένα Οι Α χρειάζονται συνεπή ολοκλήρωση ποιοτικών δεδοµένων 47 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Εργασίες Προπαρασκευής εδοµένων Καθαρισµός δεδοµένων Συµπλήρωση ελλιπών τιµών, εντοπισµός θορύβου, επίλυση ασυνεπειών Μετασχηµατισµός δεδοµένων Εξοµάλυνση, κανονικοποίηση τιµών Μείωση δεδοµένων Μείωση διαστάσεων (χαρακτηριστικών), µείωση πλήθους δεδοµένων ιακριτοποίηση δεδοµένων Από συνεχείς σε διακριτές τιµές ή διαστήµατα τιµών 48 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 24

25 Ελλιπή δεδοµένα Τα δεδοµένα µπορεί να µην είναι πάντοτε διαθέσιµα Π.χ., πολλέςεγγραφέςδενέχουντιµή για αρκετά χαρακτηριστικά, όπως το εισόδηµα ενόςπελάτη Ελλιπή δεδοµένα µπορεί να υπάρχουν για διάφορους λόγους: Μηχανική βλάβη ιαγραφή λόγω ασυνέπειας µε άλλα καταγεγραµµένα δεδοµένα Καθόλου εισαγωγή λόγω διαφωνίας ή επειδή θεωρήθηκαν ασήµαντα Συχνάχρειάζεταινασυµπεράνουµε τα ελλιπή δεδοµένα 49 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Πώς διαχειριζόµαστε ελλιπή δεδοµένα Αγνοούµε την εγγραφή συνήθως όταν λείπει η κλάση (αν υποθέσουµε ότι κάνουµε κατηγοριοποίηση - αναποτελεσµατική όταν το ποσοστό των τιµών που λείπουν ανά χαρακτηριστικό ποικίλει αρκετά) Συµπληρώνουµε την τιµή χειρωνακτικά Κουραστικό µη πρακτικό! Χρήση µίας γενικής σταθεράς για να συµπληρώσουµε την τιµή π.χ., άγνωστο Χρήση της µέσης τιµής του χαρακτηριστικού Χρήση της µέσης τιµής του χαρακτηριστικού για όλα τα δείγµατα που ανήκουνστηνίδιακλάση: εξυπνότερο! Χρήση της πιο «πιθανής» τιµής: εξαγωγή συµπεράσµατος µέσω Bayesian formula ή δένδρων απόφασης 50 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 25

26 Λανθασµένα δεδοµένα ( θόρυβος ) Θόρυβος: τυχαίο λάθος ή απόκλιση από µία µετρηµένη µεταβλητή Λανθασµένες τιµές χαρακτηριστικών µπορεί να οφείλονται σε Ελαττωµατικά όργανα συλλογής δεδοµένων Προβλήµατα κατά την εισαγωγή Προβλήµατα κατά τη µετάδοση των δεδοµένων Τεχνολογικοί περιορισµοί Ασυνέπεια στην συµφωνηµένη ονοµατολογία Άλλα προβλήµατα δεδοµένων που απαιτούν καθαρισµό ιπλές εγγραφές Ατελή δεδοµένα Ασυνεπή δεδοµένα 51 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Πώς διαχειριζόµαστε λανθασµένα δεδοµένα Συσταδοποίηση (clustering) Ανακάλυψη και αφαίρεση των «µη φυσιολογικών» δεδοµένων (outliers) Παλινδρόµηση (regression) Εξοµάλυνση µέσω προσαρµογής των δεδοµένων σε συναρτήσεις παλινδρόµησης... και άλλες: Μέθοδος τοποθέτησης σε κουτιά bins (Binning method) Συνδυασµένη επιθεώρηση από υπολογιστή και άνθρωπο ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 26

27 Ανάλυση συστάδων και εντοπισµός outliers Με συσταδοποίηση (µε χρήση ειδικών τεχνικών), οµαδοποιούµε τα δεδοµένα ανακαλύπτοντας ταυτόχρονα και outliers 53 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Παλινδρόµηση Ψάχνουµε την πιο αντιπροσωπευτική συνάρτηση για τα δεδοµένα µας Γραµµική Παλινδρόµηση Y = α + β X Τα δεδοµένα µοντελοποιούνται ώστε να ανήκουν σε ευθεία γραµµή Αναζητούµε δύοπαραµέτρους, α και β X 1 Π.χ. µε τηµέθοδο των ελάχιστων τετραγώνων (least squares) Τα outliers είναι αυτά που απέχουν «πολύ» από την τιµή που προκύπτει από τη συνάρτηση παλινδρόµησης Y 1 Y 1 y y = x + 1 x 54 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 27

28 Μετασχηµατισµός δεδοµένων Εξοµάλυνση: αφαίρεση θορύβου από δεδοµένα Κανονικοποίηση: κλιµάκωση σε ένα µικρότερο, καθορισµένο εύρος τιµών min-max κανονικοποίηση z-score κανονικοποίηση κανονικοποίηση µε δεκαδική κλιµάκωση Κατασκευή χαρακτηριστικών Νέα χαρακτηριστικά δηµιουργούνται από τα ήδη υπάρχοντα 55 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Κανονικοποίηση δεδοµένων min-max κανονικοποίηση v mina v ' = ( new_ maxa new_ mina) + new_ min maxa mina A z-score κανονικοποίηση v ' = v mean std Dev A A κανονικοποίηση µε δεκαδικήκλιµάκωση στο ( ) v v'= όπου j ο µικρότερος ακέραιος για τον οποίο max( v' )<1 j ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 28

29 Στρατηγικές Μείωσης δεδοµένων Οι Α αποθηκεύουν terabytes δεδοµένων: Πολύπλοκη ανάλυση δεδοµένων µπορεί να διαρκέσει πολύ χρόνο για όλο τον όγκο των δεδοµένων Μείωση δεδοµένων Με είσοδο µία µειωµένη αναπαράσταση του συνόλου δεδοµένων πολύ µικρότερη σε όγκο παράγονται τα ίδια (ή σχεδόν τα ίδια) αναλυτικά αποτελέσµατα Στρατηγικές µείωσης Μείωση διαστάσεων (χαρακτηριστικών) Μείωση πλήθους δεδοµένων κ.α. 57 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Μείωση διαστάσεων Επιλογή χαρακτηριστικών (π.χ., επιλογή υποσυνόλου χαρακτηριστικών): Επιλογή ελάχιστου συνόλου χαρακτηριστικών τέτοια ώστε η κατανοµή πιθανότητας των διαφορετικών κλάσεων δεδοµένων των τιµών για αυτά τα χαρακτηριστικά είναι το δυνατόν εγγύτερα στην αρχική κατανοµή δοσµένων των τιµών όλων των χαρακτηριστικών Ευριστικές µέθοδοι: Επαγωγή µε δένδρα απόφασης(decision-tree induction) Ανάλυση κυρίων συνιστωσών (principal components analysis PCA) 58 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 29

30 Παράδειγµα επαγωγής µε Α Αρχικό σύνολο χαρακτηριστικών: {A1, A2, A3, A4, A5, A6} A4? A1? A6? Class 1 Class 2 Class 1 Class 2 Τα χαρακτηριστικά Α2, Α3, Α5 δεν εµπλέκονται στο Α, άρα απαλείφονται Μειωµένοσύνολοχαρακτηριστικών: {A1, A4, A6} 59 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Μείωση πλήθους δεδοµένων Παραµετρικές µέθοδοι Υποθέτουµε ότι τα δεδοµένα ακολουθούν κάποιο µοντέλο, υπολογίζουµε τιςπαραµέτρους του µοντέλου, αποθηκεύουµε µόνο τις παραµέτρους, και αποβάλλουµε τα δεδοµένα (εκτός πιθανών outliers) Μη-παραµετρικές µέθοδοι εν υποθέτουν µοντέλα Βασικές τεχνικές: ιστογράµµατα, συσταδοποίηση, δειγµατοληψία 60 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 30

31 Ιστογράµµατα Μία δηµοφιλής τεχνική µείωσης δεδοµένων ιαµερισµός των δεδοµένων σε «κάδους» και αποθήκευση µέσου όρου κάθε «κάδου» ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης ειγµατοληψία Επιλογή ενός αντιπροσωπευτικού υποσυνόλου των δεδοµένων Ηαπλήτυχαίαδειγµατοληψία µπορεί να έχει χαµηλή απόδοση µετην παρουσία ασύµµετρων δεδοµένων ιαστρωµατωµένη δειγµατοληψία: Προσέγγιση του ποσοστού κάθε κλάσης (ή υπο-πληθυσµού ενδιαφέροντος) σε όλητηβ Αρχικά δεδοµένα ιαστρωµατωµένο δείγµα 62 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 31

32 ιακριτοποίηση Τρεις τύποι χαρακτηριστικών: Ονοµαστικά (nominal)-τιµές από µη διατεταγµένο σύνολο χρώµα, όνοµα,... ιατεταγµένα (Ordinal) - τιµές από διατεταγµένο σύνολο βαθµολογία (Α Β Γ), ικανοποίηση (υψηλή µέτρια χαµηλή),... Συνεχή (Continuous) πραγµατικοί αριθµοί βάρος, ύψος, µισθός, ηλικία,... ιακριτοποίηση : ιαχωρισµός του εύρους τιµών συνεχών χαρακτηριστικών σε διαστήµατα Γιατί; µείωση χώρου δεδοµένων, προετοιµασία για περαιτέρω ανάλυση 63 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης ιακριτοποίηση για αριθµητικά δεδοµένα Χρησιµοποιούνται µέθοδοι που έχουµε ήδηµελετήσει Binning Ιστογράµµατα Συσταδοποίηση... αλλά και άλλες µέθοδοι ιακριτοποίηση βασισµένη στην εντροπία Κατάτµηση µε φυσικό διαµερισµό 64 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 32

33 Σύνοψη ενότητας Η διαδικασία Ανακάλυψης Γνώσης από τα εδοµένα (KDD) αποτελεί ισχυρό εργαλείο στη στρατηγική των οργανισµών και τη λήψη αποφάσεων Οι βασικοί µηχανισµοί KDD είναι: ηπολυδιάστατηανάλυσηδεδοµένων (OLAP) πάνω σε κύβους όψεις Αποθήκων εδοµένων και η εξόρυξη γνώσης από δεδοµένα (data mining) Ανάλυση συστάδων, κατηγοριοποίηση, ανακάλυψη συσχετίσεων κλπ. Βασικό προαπαιτούµενο της διαδικασίας KDD αποτελεί η προπαρασκευή δεδοµένων Καθαρισµός, µετασχηµατισµός, µείωση και διακριτοποίηση δεδοµένων 65 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Page 33

Εξόρυξη Γνώσης από εδοµένα (Data Mining)

Εξόρυξη Γνώσης από εδοµένα (Data Mining) ΠΜΣ Πληροφορικής Πανεπιστηµίου Πειραιά Εξόρυξη Γνώσης από εδοµένα (Data Mining) Αποθήκες εδοµένων Γιάννης Θεοδωρίδης Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιά http://isl.cs.unipi.gr/db/courses/dm "Πυραµίδα"

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από εδοµένα (Data Mining)

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Αποθήκες εδοµένων Γιάννης Θεοδωρίδης, Νίκος Πελέκης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

ΠΜΣ Πληροφορικής Πανεπιστηµίου Πειραιά. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εισαγωγή. Γιάννης Θεοδωρίδης

ΠΜΣ Πληροφορικής Πανεπιστηµίου Πειραιά. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εισαγωγή. Γιάννης Θεοδωρίδης ΠΜΣ Πληροφορικής Πανεπιστηµίου Πειραιά Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εισαγωγή Γιάννης Θεοδωρίδης Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιά http://isl.cs.unipi.gr/db/courses/dm πληµµύρα από δεδοµένα

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής. Αποθήκες εδοµένων και Εξόρυξη Γνώσης. (Data Warehousing & Data Mining) Εισαγωγή

Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής. Αποθήκες εδοµένων και Εξόρυξη Γνώσης. (Data Warehousing & Data Mining) Εισαγωγή Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Εισαγωγή Γιάννης Θεοδωρίδης, Νίκος Πελέκης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Αποθήκες εδοµένων και Εξόρυξη Γνώσης. (Data Warehousing & Data Mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Αποθήκες εδοµένων και Εξόρυξη Γνώσης. (Data Warehousing & Data Mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Αποθήκες εδοµένων Γιάννης Θεοδωρίδης, Νίκος Πελέκης Εργαστήριο Πληροφοριακών Συστηµάτων http://infolab.cs.unipi.gr

Διαβάστε περισσότερα

Αποθήκες Δεδομένων & Πολυδιάστατη Ανάλυση

Αποθήκες Δεδομένων & Πολυδιάστατη Ανάλυση Αποθήκες Δεδομένων & Πολυδιάστατη Ανάλυση Γιάννης Θεοδωρίδης InfoLab, Τμήμα Πληροφορικής, Πανεπιστήμιο Πειραιά http://infolab.cs.unipi.gr version: Nov.2009 Πηγές Το κύριο μέρος των διαφανειών προέρχεται

Διαβάστε περισσότερα

Εξόρυξη Γνώσης µε SQL Server 2005 Analysis Services

Εξόρυξη Γνώσης µε SQL Server 2005 Analysis Services Εξόρυξη Γνώσης µε SQL Server 2005 Analysis Services Γεράσιµος Μαρκέτος Οµάδα ιαχείρισης εδοµένων, Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιώς (http://isl.cs.unipi.gr/db) οµή παρουσίασης SQL Server 2005 Επιχειρηµατική

Διαβάστε περισσότερα

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης

Διαβάστε περισσότερα

Ανάλυση Δεδομένων (Data Analysis) Άμεση Αναλυτική Επεξεργασία (OLAP) Λειτουργίες Συνάθροισης στην SQL (windowing, ranking)

Ανάλυση Δεδομένων (Data Analysis) Άμεση Αναλυτική Επεξεργασία (OLAP) Λειτουργίες Συνάθροισης στην SQL (windowing, ranking) ΒΔ για Λήψη Αποφάσεων Ανάλυση Δεδομένων (Data Analysis) Άμεση Αναλυτική Επεξεργασία (OLAP) Λειτουργίες Συνάθροισης στην SQL (windowing, ranking) Οργάνωση ιστορικής πληροφορίας σε Αποθήκες Δεδομένων (Data

Διαβάστε περισσότερα

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής Data Mining: Στοχεύοντας στους σωστούς πελάτες To CRM front-office πελατών Οι Προμηθευτές Οι Πελάτες ΟΟργανισμός Τροφοδότηση ενεργειών Μάρκετινγκ ΒΙ Απόταδεδομέναστηγνώση Επιχειρηματική Γνώση Επιχειρηματικοί

Διαβάστε περισσότερα

Διδάσκοντες: Μαρία Χαλκίδη

Διδάσκοντες: Μαρία Χαλκίδη Αποθήκες και Εξόρυξη Δεδομένων 6 ο εξάμηνο Τμήμα Ψηφιακών Συστημάτων Παν. Πειραιά Διδάσκοντες: Μαρία Χαλκίδη Μαθήματα σχετικά με Διαχείριση Δεδομένων στο Πρόγραμμα Σπουδών Δομές Δεδομένων (3 ο εξάμηνο)

Διαβάστε περισσότερα

Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Αριστομένης Μακρής

Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Αριστομένης Μακρής Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Τεχνολογίες Υποστήριξης Λήψης Διοικητικών Αποφάσεων OLTP (On Line Transaction Processing) Επιχειρηματικές Εφαρμογές (Σχεσιακές

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

Άμεση Αναλυτική Επεξεργασία (OLAP)

Άμεση Αναλυτική Επεξεργασία (OLAP) Άμεση Αναλυτική Επεξεργασία (OLAP) Άμεση Αναλυτική Επεξεργασία (OLAP) Άμεση Αναλυτική Επεξεργασία (Online Analytical Processing - OLAP) Ανάλυση βασισμένη σε ένα κύβο OLAP Κύβος OLAP (OLAP Cube) Μια πολυδιάστατη

Διαβάστε περισσότερα

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Η συνολική εικόνα Τοπικές Βάσεις Βάσεις Κεντρικών Συστημάτων Βάσεις Τρίτων Ποιοτική Αναβάθμιση δεδομένων Λογισμικό Επικοινωνιών DATA WAREHOUSE Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Warehouse

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Φροντιστήριο 4

Ανάκτηση Πληροφορίας. Φροντιστήριο 4 Ανάκτηση Πληροφορίας Φροντιστήριο 4 Τσιράκης Νίκος Νοέμβριος 2007 2 Περιεχόμενα Ροές Δεδομένων 3 Ανάκτηση Πληροφορίας - Φροντιστήριο 4 - Νοέμβριος 2007 Ροές Δεδομένων 4 Εισαγωγή Οι παραδοσιακές βάσεις

Διαβάστε περισσότερα

Συνοπτική επισκόπηση αγοράς & εργαλείων ΒΙ

Συνοπτική επισκόπηση αγοράς & εργαλείων ΒΙ Συνοπτική επισκόπηση αγοράς & εργαλείων ΒΙ Μιχάλης Μεταξάς Innovatia ΕΠΕ Agenda Αναφορά σε στοιχεία της µελέτης «Συγκέντρωση, ανάλυση και αξιολόγηση εργαλείων και λογισµικού Επιχειρηµατικής Ευφυΐας» Ορισµοί

Διαβάστε περισσότερα

Ολοκληρωµένη λύση επιλεκτικής συγκέντρωσης, αναδιοργάνωσης δεδοµένων και παραγωγής πληροφορίας

Ολοκληρωµένη λύση επιλεκτικής συγκέντρωσης, αναδιοργάνωσης δεδοµένων και παραγωγής πληροφορίας e.nfo Ολοκληρωµένη λύση επιλεκτικής συγκέντρωσης, αναδιοργάνωσης δεδοµένων και παραγωγής πληροφορίας Εξασφάλιση της εξειδικευµένης λύσης business intelligence για κάθε επιχείρηση πελάτης Τράπεζα Πειραιώς

Διαβάστε περισσότερα

Business Development, SAP Hellas 01/12/2007

Business Development, SAP Hellas 01/12/2007 Επιχειρηµατική Ευφυΐα Απότηνιδέαστηνπράξη Παναγιώτης Θεοφάνους Business Development, SAP Hellas 01/12/2007 Περιεχόµενα 1. SAP Εταιρικόπροφίλ 2. Επιχειρηµατική Ευφυΐα - Η ανάγκη 3. SAP Business Intelligence

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Πρόγραµµα Μεταπτυχιακών Σπουδών «Πληροφορική» Μεταπτυχιακή ιατριβή Τίτλος ιατριβής Ονοµατεπώνυµο Φοιτητή Πατρώνυµο Υλοποίηση Αποθήκης Μεταναστευτικών εδοµένων OLAP

Διαβάστε περισσότερα

Άμεση Αναλυτική Επεξεργασία (OLAP)

Άμεση Αναλυτική Επεξεργασία (OLAP) 1 Άμεση Αναλυτική Επεξεργασία (OLAP) 2 Περιεχόμενα Εφαρμογές στις Αποθήκες Δεδομένων Άμεση Αναλυτική Επεξεργασία (OLAP) Γεγονότα και Διαστάσεις Κύβοι και Ιεραρχίες διαστάσεων Πράξεις OLAP Αρχιτεκτονικές

Διαβάστε περισσότερα

Copyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση, ίαυλος ιαφάνεια 29-1

Copyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση, ίαυλος ιαφάνεια 29-1 ιαφάνεια 29-1 Εφαρµογές Βάσεων εδοµένων ΠΜΣ 510 ευτέρα 6-9 Αίθουσα Α Ώρες Γραφείου ευτέρα 5-6 (και οποιαδήποτε άλλη ώρα είµαι στο γραφείο ικτυακός τόπος www.di.uoa.gr/~pms510 Ύλη Αποθήκες δεδοµένων Εξόρυξη

Διαβάστε περισσότερα

Συστήματα OLAP. Πασχάλης Θρήσκος, PhD Λάρισα

Συστήματα OLAP. Πασχάλης Θρήσκος, PhD Λάρισα Συστήματα OLAP Πασχάλης Θρήσκος, PhD Λάρισα 2016-2017 «Τα συστήματα άμεσης αναλυτικής επεξεργασίας (OLTP) χρησιμοποιούνται για να απαντηθούν ερωτήματα πάνω σε πολυδιάστατα δεδομένα πολύ γρήγορα» Wikipedia

Διαβάστε περισσότερα

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών M.I.S. «Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» Μεταπτυχιακός Φοιτητής: Επιβλέπων Καθηγητής: Εξεταστής Καθηγητής: Τορτοπίδης Γεώργιος Μηχανικός

Διαβάστε περισσότερα

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining)

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Εξόρυξη Γνώσης από Χωρικά εδοµένα (spatial data mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης

Διαβάστε περισσότερα

Εξόρυξη Δεδομένων Data Mining

Εξόρυξη Δεδομένων Data Mining Εξόρυξη Δεδομένων Data Mining Η συνολική εικόνα ενός συστήματος BI/BA Επιχειρηματική Γνώση Από τα δεδομένα στη γνώση Επιχειρηματι κοί Κανόνες Μετα- Δεδομένα Δομή Βάσης Δεδομένων Συγκεντρωτικά Δεδομένα

Διαβάστε περισσότερα

Big Data/Business Intelligence

Big Data/Business Intelligence Big Data/Business Intelligence 5 8 Φεβρουαρίου 2018 ΓΕΝΙΚΑ Το μάθημα αποτελείται από δύο ενότητες, η πρώτη σε Big Data και Data Analytics και η δεύτερη σε Business Intelligence. Η πρώτη ενότητα παρέχει

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Προεπεξεργασία εδοµένων

Προεπεξεργασία εδοµένων Προεπεξεργασία εδοµένων Αποθήκες και Εξόρυξη εδοµένων 2 ο Μάθηµα ιδάσκων: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδοµένων- πυρήνας της διαδικασίας

Διαβάστε περισσότερα

ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ. Παρουσίαση 2 ο μέρος:

ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ. Παρουσίαση 2 ο μέρος: ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ Παρουσίαση 2 ο μέρος: Λήψη αποφάσεων Η λήψη αποφάσεων αποτελεί κεντρική δραστηριότητα σε όλα τα επίπεδα λειτουργίας μιας επιχείρησης, από τον σχεδιασμό δράσεων,

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

14Ιαν Νοε

14Ιαν Νοε Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Επανάληψη Γιάννης Θεοδωρίδης, Νίκος Πελέκης Εργαστήριο Πληροφοριακών Συστηµάτων http://infolab.cs.unipi.gr

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Επιχειρηματική ευφυΐα ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου Επιχειρηματική ευφυΐα Η πλειονότητα των ατόμων μιας επιχείρησης έχουν ανάγκη υποστήριξης

Διαβάστε περισσότερα

Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ

Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ Βασίλης Γ. Αγγέλης Δρ. Μηχανικός Η/Υ και Πληροφορικής Η ΕΠΑΝΑΣΤΑΣΗ ΤΟΥ ΚΡΙΟΥ Μετατρέψτε τα δεδομένα σας σε κέρδος Αθήνα Κάθε γνήσιο αντίγραφο έχει την υπογραφή του συγγραφέα Έκδοση 1 η, Copyright 2007

Διαβάστε περισσότερα

ΔΙΑΔΙΚΤΥΑΚΟ ΣΥΣΤΗΜΑ ΒΕΛΤΙΣΤΗΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΝΕΡΓΕΙΑΚΩΝ ΠΟΡΩΝ E.M.I.R. - Energy Management & Intelligent Reporting

ΔΙΑΔΙΚΤΥΑΚΟ ΣΥΣΤΗΜΑ ΒΕΛΤΙΣΤΗΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΝΕΡΓΕΙΑΚΩΝ ΠΟΡΩΝ E.M.I.R. - Energy Management & Intelligent Reporting ΔΙΑΔΙΚΤΥΑΚΟ ΣΥΣΤΗΜΑ ΒΕΛΤΙΣΤΗΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΝΕΡΓΕΙΑΚΩΝ ΠΟΡΩΝ E.M.I.R. - Energy Management & Intelligent Reporting Διαδικτυακό OLAP Σύστημα Λήψης Αποφάσεων και δημιουργίας έξυπνων προσαρμοστικών γραφημάτων

Διαβάστε περισσότερα

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6. Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εξόρυξη Γνώσης από χωρικά δεδοµένα (κεφ. 8) Γιάννης Θεοδωρίδης Νίκος Πελέκης http://isl.cs.unipi.gr/db/courses/dwdm Περιεχόµενα

Διαβάστε περισσότερα

ΑΛΕΞΑΝΔΡΕΙΟ Τ.Ε.Ι ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΑΛΕΞΑΝΔΡΕΙΟ Τ.Ε.Ι ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΛΕΞΑΝΔΡΕΙΟ Τ.Ε.Ι ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Πτυχιακή Εργασία Οι τεχνολογίες OLAP και Data warehousing Του φοιτητή: Δαραβίγκα Δημήτριου Αρ. Μητρώου: 05/2933 Επιβλέπων

Διαβάστε περισσότερα

Αποθήκες Δεδομένων. Αρχιτεκτονική, Μοντέλο Δεδομένων και Σχεδίαση

Αποθήκες Δεδομένων. Αρχιτεκτονική, Μοντέλο Δεδομένων και Σχεδίαση Αποθήκες Δεδομένων Αρχιτεκτονική, Μοντέλο Δεδομένων και Σχεδίαση Περιεχόμενα Αποθήκες Δεδομένων Ορισμοί και χαρακτηριστικά αποθηκών δεδομένων Διαφορές βάσεων και αποθηκών δεδομένων Μοντέλα αποθηκών δεδομένων

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Επιχειρηματική ευφυΐα ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου @ 2017 Επιχειρηματική ευφυΐα Η πλειονότητα των εργαζομένων μιας επιχείρησης έχουν

Διαβάστε περισσότερα

Αποθήκες Δεδομένων. Αποθήκες και εξόρυξη δεδομένων 6 ο εξάμηνο

Αποθήκες Δεδομένων. Αποθήκες και εξόρυξη δεδομένων 6 ο εξάμηνο Αποθήκες Δεδομένων Αποθήκες και εξόρυξη δεδομένων 6 ο εξάμηνο Τι είναι Αποθήκες Δεδομένων? Αποθήκη Δεδομένων (Data Warehouse): Μία ΒΔ στήριξης αποφάσεων που διατηρείται ξεχωριστά από τη λειτουργική ΒΔ

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από εδοµένα (data mining)

Εξόρυξη Γνώσης από εδοµένα (data mining) Εξόρυξη νώσης από εδοµένα (data mining) Ε.Κ.Ε.Φ.Ε. ηµόκριτος Ινστ. Πληροφορικής και Τηλεπικοινωνιών εώργιος Παλιούρας Email: paliourg@iit.demokritos.gr WWW: http://www.iit.demokritos.gr/~paliourg Περιεχόµενα

Διαβάστε περισσότερα

Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα

Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα Εισαγωγή 1 Ζήτω οι Βάσεις εδοµένων!! Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα Μοντελοποίηση Αποθήκευση Επεξεργασία (εύρεση πληροφορίας σχετικής µε µια συγκεκριµένη ερώτηση) Σωστή Λειτουργία

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΔΟΥΒΛΕΤΗΣ ΧΑΡΑΛΑΜΠΟΣ ΕΠΙΒΛΕΠΟΝΤΕΣ ΚΑΘΗΓΗΤΕΣ Μαργαρίτης Κωνσταντίνος Βακάλη

Διαβάστε περισσότερα

ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ: Λήψη απόφασης, Συστήματα Υποστήριξης Αποφάσεων, OLAP Ανάλυση, Περιβαλλοντική Εκπαίδευση ΕΙΣΑΓΩΓΗ

ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ: Λήψη απόφασης, Συστήματα Υποστήριξης Αποφάσεων, OLAP Ανάλυση, Περιβαλλοντική Εκπαίδευση ΕΙΣΑΓΩΓΗ Η Αναλυτική Επεξεργασία Δεδομένων (On Line Analytical Processing) στην Υποστήριξη Αποφάσεων των Υπευθύνων Περιβαλλοντικής Εκπαίδευσης των Διευθύνσεων Εκπαίδευσης Γιώργος Ραβασόπουλος 1, Ιωάννα Παπαιωάννου

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 1: Εισαγωγή Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Επιχειρηματική ευφυΐα ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου @ 2018 Επιχειρηματική ευφυΐα Η πλειονότητα των εργαζομένων μιας επιχείρησης έχουν

Διαβάστε περισσότερα

Τεχνικές Εξόρυξης Δεδομένων

Τεχνικές Εξόρυξης Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:

Διαβάστε περισσότερα

Εισαγωγή στις Αποθήκες εδομένων

Εισαγωγή στις Αποθήκες εδομένων Εξόρυξη Δεδομένων: Ακ. Έτος 2007-2008 Αποθήκες Δεδομένων 1 Εισαγωγή: OLTP Παραδοσιακή ιαχείριση εδομένων με Σ Β Σύστημα Επεξεργασίας οσοληψιών On-Line Transaction Processing (OLTP) Εισαγωγή στις Αποθήκες

Διαβάστε περισσότερα

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα Τεχνητή Νοημοσύνη (Artificial Intelligence) Ανάπτυξη μεθόδων και τεχνολογιών για την επίλυση προβλημάτων στα οποία ο άνθρωπος υπερέχει (?) του υπολογιστή Συλλογισμοί

Διαβάστε περισσότερα

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εισαγωγή στην Εξόρυξη Δεδομένων Πασχάλης Θρήσκος, PhD Λάρισα

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εισαγωγή στην Εξόρυξη Δεδομένων Πασχάλης Θρήσκος, PhD Λάρισα 1 ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Εισαγωγή στην Εξόρυξη Δεδομένων Πασχάλης Θρήσκος, PhD Λάρισα 2016-2017 2 Τα δεδομένα πολλαπλασιάζονται με γεωμετρική πρόοδο Οι χρήστες συσκευών επιθυμούν εξεζητημένη και εκλεπτυσμένη

Διαβάστε περισσότερα

Εµβάθυνση στις έννοιες: Ανάλυση, β) Εξαγωγή Αναφορών (Enterprise Reporting & Online Analytical Processing / OLAP). Παραδείγµατα.

Εµβάθυνση στις έννοιες: Ανάλυση, β) Εξαγωγή Αναφορών (Enterprise Reporting & Online Analytical Processing / OLAP). Παραδείγµατα. Εµβάθυνση στις έννοιες: α) Εξερεύνηση Βάσεων εδοµένων και Ανάλυση, β) Εξαγωγή Αναφορών (Enterprise Reporting & Online Analytical Processing / OLAP). Παραδείγµατα. ΠΕΤΑ: ΟΤΑ Επιχειρησιακή Νοηµοσύνη [Bc1.1.2

Διαβάστε περισσότερα

ΝΕΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ, ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ, ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ, ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΕΙΣΑΓΩΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΝΕΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ, ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ, ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ, ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΕΙΣΑΓΩΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ Α' ΕΞΑΜΗΝΟ 1 Α.1010 Μικροοικονομική (Microeconomics) ΜΓΥ Υ 2 2 4 8 5 2 Α.1020 Χρηματοοικονομική Λογιστική (Financial Accounting) ΜΓΥ Υ 2 2 2 6 10 6 3 Α.1030 Αρχές Οργάνωσης και Διοίκησης Επιχειρήσεων (Principles

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Θεμελιώδεις Αρχές Συστημάτων Βάσεων Δεδομένων

Θεμελιώδεις Αρχές Συστημάτων Βάσεων Δεδομένων Θεμελιώδεις Αρχές Συστημάτων Βάσεων Δεδομένων Β. Μεγαλοοικονόμου Εισαγωγή στην Εξόρυξη Δεδομένων Γενική Επισκόπηση- Σχεσιακό μοντέλο Σχεσιακό Μοντέλο -SQL Συναρτησιακές εξαρτήσεις & Κανονικοποίηση Φυσικός

Διαβάστε περισσότερα

Information Technology for Business

Information Technology for Business Information Technology for Business! Lecturer: N. Kyritsis, MBA, Ph.D. Candidate!! e-mail: kyritsis@ist.edu.gr Διαχείριση Επιχειρηματικών Δεδομένων - Databases Ορισμός Βάσης Δεδομένων Συλλογή συναφών αρχείων

Διαβάστε περισσότερα

Advanced Analytics Software Training.

Advanced Analytics Software Training. ΠΡΟΓΡΑΜΜΑ JAN - JUL 2017 Advanced Analytics Software Training. STATISTICS MODELING DEPLOYMENT Predicta S.A. Χατζηκωνσταντή 18, Αθήνα, 115 24 T. +30 210 69 31 040 F. +30 210 69 31 079 E. info@predicta.gr

Διαβάστε περισσότερα

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business. e-mail: kyritsis@ist.edu.

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business. e-mail: kyritsis@ist.edu. Managing Information Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business e-mail: kyritsis@ist.edu.gr Διαχείριση Γνώσης Knowledge Management Learning Objectives Ποιοί

Διαβάστε περισσότερα

Ευφυή Συστήματα και Εξόρυξη Δεδομένων. Προεπεξεργασία Δεδομένων

Ευφυή Συστήματα και Εξόρυξη Δεδομένων. Προεπεξεργασία Δεδομένων Ευφυή Συστήματα και Εξόρυξη Δεδομένων Προεπεξεργασία Δεδομένων 1 Ενότητα 3: Προ-επεξεργασία Δεδομένων Προ-επεξεργασία Δεδομένων: Επισκόπηση Καθαρισμός Δεδομένων Ενσωμάτωση Δεδομένων Περιορισμός και Μετασχηματισμός

Διαβάστε περισσότερα

Τι είναι πληροφοριακό σύστημα

Τι είναι πληροφοριακό σύστημα Τι είναι πληροφοριακό σύστημα Ένας ορισμός είναι ότι ένα πληροφοριακό σύστημα είναι ένα σύνολο αλληλοσυνδεόμενων μερών που συνεργάζονται για τη συλλογή, επεξεργασία, αποθήκευση και διάχυση πληροφοριών

Διαβάστε περισσότερα

Υποστήριξη Αποφάσεων. Γεώργιος Ευαγγελίδης. (βασισμένο στο κεφ. 23 του βιβλίου «Συστήματα Διαχείρισης Βάσεων Δεδομένων»)

Υποστήριξη Αποφάσεων. Γεώργιος Ευαγγελίδης. (βασισμένο στο κεφ. 23 του βιβλίου «Συστήματα Διαχείρισης Βάσεων Δεδομένων») Υποστήριξη Αποφάσεων Γεώργιος Ευαγγελίδης (βασισμένο στο κεφ. 23 του βιβλίου «Συστήματα Διαχείρισης Βάσεων Δεδομένων») Εισαγωγικά Οι επιχειρήσεις θέλουν να μπορούν να αναλύουν τα δεδομένα τους. Γιατί;

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα 6ο Πανελλήνιο Συνέδριο των Εκπαιδευτικών για τις ΤΠΕ «Αξιοποίηση των Τεχνολογιών της Πληροφορίας και της Επικοινωνίας στη Διδακτική Πράξη» Σύρος 6-8 Μαϊου 2011 Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά

Διαβάστε περισσότερα

Data Cube. Μ.Χατζόπουλος 1

Data Cube. Μ.Χατζόπουλος 1 Data Cube Μ.Χατζόπουλος Μ.Χατζόπουλος 1 Ανάλυση εδοµένων Εξαγωγή συναθροιστικών δεδοµένων από µια βάση δεδοµένων Οπτικοποίηση των αποτελεσµάτων Μπορούνοιπαραδοσιακέςεπίπεδεςβάσειςδεδοµένων; Οι σχεσιακές

Διαβάστε περισσότερα

Τι προσφέρουν τα Τµήµατα Πληροφορικής. ... το Εργαστήριο Πληροφοριακών Συστηµάτων του Πα.Πει. Ερευνητικές δραστηριότητες σε GI Ενδεικτικές εργασίες

Τι προσφέρουν τα Τµήµατα Πληροφορικής. ... το Εργαστήριο Πληροφοριακών Συστηµάτων του Πα.Πει. Ερευνητικές δραστηριότητες σε GI Ενδεικτικές εργασίες ΗΓεωπληροφορικήστα Τµήµατα Πληροφορικής Γιάννης Θεοδωρίδης Τµήµα Πληροφορικής Πανεπιστήµιο Πειραιά Περιεχόµενα... Τι προσφέρουν τα Τµήµατα Πληροφορικής το Τµήµα Πληροφορικής του Παν/µίου Πειραιά... το

Διαβάστε περισσότερα

Συνεργατική Λήψη Αποφάσεων. Υποστήριξη στη Συνεργατική. Αποφάσεων. ιάρθρωση ενότητας. Η προτεινόµενη προσέγγιση. γνώσης και επιχειρηµατολογίας

Συνεργατική Λήψη Αποφάσεων. Υποστήριξη στη Συνεργατική. Αποφάσεων. ιάρθρωση ενότητας. Η προτεινόµενη προσέγγιση. γνώσης και επιχειρηµατολογίας Υποστήριξη στη Συνεργατική Λήψη Αποφάσεων Νίκος Καρακαπιλίδης Industrial Management & Information Systems Lab MEAD, University of Patras, Greece nikos@mech.upatras.gr ιάρθρωση ενότητας Συνεργατική Λήψη

Διαβάστε περισσότερα

Οι «κύκλοι» της επιχειρησιακής νοηµοσύνης. Μέθοδοι και Τεχνικές εξερεύνησης των

Οι «κύκλοι» της επιχειρησιακής νοηµοσύνης. Μέθοδοι και Τεχνικές εξερεύνησης των Οι «κύκλοι» της επιχειρησιακής νοηµοσύνης. Μέθοδοι και Τεχνικές εξερεύνησης των δεδοµένων για την απόκτηση γνώσης (Knowledge Discovery). Eπιχειρησιακή νοηµοσύνη σε ένα σύγχρονο οργανισµό: Data Warehouses.

Διαβάστε περισσότερα

Πληροφοριακά Συστήµατα

Πληροφοριακά Συστήµατα Nell Dale John Lewis Chapter 12 Πληροφοριακά Συστήµατα Στόχοι Ενότητας Η κατανόηση της έννοιας «Πληροφοριακό Σύστηµα» Επεξήγηση της οργάνωσης λογιστικών φύλλων (spreadsheets) Επεξήγηση της ανάλυσης δεδοµένων

Διαβάστε περισσότερα

ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -2

ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -2 ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚ. ΜΗΧ. ΚΑΙ ΜΗΧ. ΥΠΟΛΟΓΙΣΤΩΝ ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ ΑΠΟΘΗΚΕΣ Ε ΟΜΕΝΩΝ ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ -1 ΕΙΣΑΓΩΓΗ ΑΠΟΘΗΚΕΣ Ε ΟΜΕΝΩΝ ΚΑΙ ΑΝΑΛΥΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ

Διαβάστε περισσότερα

Σχεδιασμός Επεξεργασίας και Τηλεπεξεργασίας

Σχεδιασμός Επεξεργασίας και Τηλεπεξεργασίας Ενότητα 9 Σχεδιασμός Επεξεργασίας και Τηλεπεξεργασίας Πληροφοριακά Συστήματα Διοίκησης ΙI Ι Διδάσκων: Νίκος Καρακαπιλίδης 9-1 Στόχοι & αντικείμενο ενότητας Σχεδιασμός επεξεργασίας Επεξεργασία κατά δεσμίδες

Διαβάστε περισσότερα

Το εσωτερικό ενός Σ Β

Το εσωτερικό ενός Σ Β Επεξεργασία Ερωτήσεων 1 Εισαγωγή ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL) ηµιουργία/κατασκευή Εισαγωγή εδοµένων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ. Παραγωγικές Λειτουργίες Επιχείρησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ. Παραγωγικές Λειτουργίες Επιχείρησης ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΙΟΙΚΗΣΗ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΜΑΘΗΜΑ: Οικονοµικές, Εµπορικές και Παραγωγικές Λειτουργίες

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Διακριτικές Συναρτήσεις

Διακριτικές Συναρτήσεις Διακριτικές Συναρτήσεις Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Θερµικός χάρτης των XYZ ξενοδοχείων σε σχέση µε τη γεωγραφική περιοχή τους P. Adamopoulos New

Διαβάστε περισσότερα

Αναλυτικές λειτουργίες ΣΓΠ

Αναλυτικές λειτουργίες ΣΓΠ Αναλυτικές λειτουργίες ΣΓΠ Γενικά ερωτήµατα στα οποία απαντά ένα ΣΓΠ Εντοπισµού (locaton) Ιδιότητας (condton) Τάσεων (trend) ιαδροµών (routng) Μορφών ή προτύπων (pattern) Και µοντέλων (modellng) παραδείγµατα

Διαβάστε περισσότερα

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος + Περιγραφή Μαθήματος Τίτλος Κωδικός Αριθμός του Πληροφοριακά Συστήματα Μαθήματος : Επίπεδο Τύπος του Μαθήματος : ΠΡΟΠΤΥΧΙΑΚΟ - ΥΠΟΧΡΕΩΤΙΚΟ Έτος Σπουδών Εξάμηνο : 5 Ε Αριθμός Ευρωπαϊκών Πιστωτικών Μονάδων

Διαβάστε περισσότερα

Εισαγωγή στις Αποθήκες εδομένων

Εισαγωγή στις Αποθήκες εδομένων Εισαγωγή στις Αποθήκες εδομένων ιαφάνειες βασισμένες σε σχετικές διαφάνειες του Πάνου Βασιλειάδη Εξόρυξη Δεδομένων: Ακ. Έτος 2008-2009 Αποθήκες Δεδομένων 1 Εισαγωγή: OLTP Παραδοσιακή ιαχείριση εδομένων

Διαβάστε περισσότερα

Συστήματα Επιχειρηματικής Ευφυίας. Εισαγωγικές Έννοιες

Συστήματα Επιχειρηματικής Ευφυίας. Εισαγωγικές Έννοιες Συστήματα Επιχειρηματικής Ευφυίας Εισαγωγικές Έννοιες Περιεχόμενα Επιχειρηματική Ευφυΐα: Παραδείγματα Επιχειρηματική Ευφυΐα: Ορισμοί Χρησιμότητα - Σημασία της Επιχειρηματικής Ευφυΐας Δυνατότητες - Οφέλη

Διαβάστε περισσότερα

Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων

Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων Κεφάλαιο 11 Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων 11.1 Λήψη αποφάσεων και πληροφοριακά συστήματα Η επιχειρηματική αξία της βελτιωμένης λήψης αποφάσεων Είναι εφικτό να αποτιμηθεί σε κάποιον

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΙΣ Β ΣΕ Ε Σ Ι ΟΜΕΝ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ Β ΣΕ Ε Σ Ι ΟΜΕΝ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ Βασικές Έννοιες - εδοµένα { Νίκος, Μιχάλης, Μαρία, Θάλασσα, Αυτοκίνητο }, αριθµοί, π.χ. {1, 2, 3, 5, 78}, συµβολοσειρές (strings) π.χ. { Κώστας, 5621, ΤΡ 882, 6&5 #1, +

Διαβάστε περισσότερα

Εισαγωγή στα Πληροφοριακά Συστήματα

Εισαγωγή στα Πληροφοριακά Συστήματα Εισαγωγή στα Πληροφοριακά Συστήματα Ενότητα 3: Η έννοια της ΠΛΗΡΟΦΟΡΙΑΣ - INFORMATION Κωνσταντίνος Ταραμπάνης Τμήμα Οργάνωσης & Διοίκησης Επιχειρήσεων ΕΙΣΑΓΩΓΗ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Κωνσταντίνος Ταραμπάνης

Διαβάστε περισσότερα

Είδη Groupware. Λογισμικό Συνεργασίας Ομάδων (Groupware) Λογισμικό Groupware. Υπάρχουν διάφορα είδη groupware ανάλογα με το αν οι χρήστες εργάζονται:

Είδη Groupware. Λογισμικό Συνεργασίας Ομάδων (Groupware) Λογισμικό Groupware. Υπάρχουν διάφορα είδη groupware ανάλογα με το αν οι χρήστες εργάζονται: Μάθημα 10 Συστήματα Διάχυσης και Διαχείρισης Γνώσης Chapter 10 Knowledge Transfer In The E-world Chapter 13 Knowledge Management Tools and Knowledge Portals Συστήματα Διάχυσης και Διαχείρισης Γνώσης Λογισμικό

Διαβάστε περισσότερα

Business Intelligence Tools Avecon, data mining techniques online analytical processing OLAP Avecon Εξοικονόμηση κόστους: DataMATRIX3

Business Intelligence Tools Avecon, data mining techniques online analytical processing OLAP Avecon Εξοικονόμηση κόστους: DataMATRIX3 Οι επιχειρήσεις αναγνωρίζουν πλέον την δύναμη και την ανταγωνιστικότητα που αποκτούν με την ενσωμάτωση επιχειρηματικών εφαρμογών ευφυΐας - Business Intelligence Tools. Οι εφαρμογές B.I παρέχουν στις επιχειρήσεις

Διαβάστε περισσότερα

1. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

1. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ 1. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ Τα δεδομένα που θα επεξεργασθούμε στη διάρκεια του εργαστηρίου παραχωρήθηκαν από την εταιρεία ICAP ειδικά για τις ανάγκες του μαθήματος. Τα δεδομένα αυτά αντλήθηκαν από την

Διαβάστε περισσότερα

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Αναζήτηση Γνώσης σε Ιατρικά Δεδομένα στον SQL Server 2005

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Αναζήτηση Γνώσης σε Ιατρικά Δεδομένα στον SQL Server 2005 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΙΑΤΡΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Αναζήτηση Γνώσης σε Ιατρικά Δεδομένα στον SQL Server 2005 ΠΑΠΑΔΟΠΟΥΛΟΣ ΘΩΜΑΣ

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΛΗΘΥΣΜΟΙ ΔΕΙΓΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΕΔΟΜΕΝΩΝ Περιγραφική Στατιστική Με τις στατιστικές μεθόδους επιδιώκεται: - η συνοπτική αλλά πλήρης και κατατοπιστική παρουσίαση των ευρημάτων μιας

Διαβάστε περισσότερα

Εισαγωγή στην εξόρυξη δεδομένων. ή Εισαγωγή στην εξόρυξη γνώσης από δεδομένα

Εισαγωγή στην εξόρυξη δεδομένων. ή Εισαγωγή στην εξόρυξη γνώσης από δεδομένα Εισαγωγή στην εξόρυξη δεδομένων ή Εισαγωγή στην εξόρυξη γνώσης από δεδομένα 1 Δεδομένα, δεδομένα, δεδομένα... Παράγονται όλο και περισσότερα δεδομένα: Τραπεζικά, τηλεπικοινωνιακά,... Επιστημονικά δεδομένα:

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης 1 ΕΙΣΑΓΩΓΗ (1) Ταξινόμηση ΠΣ ανάλογα με τις λειτουργίες που υποστηρίζουν: Συστήματα Επεξεργασίας Συναλλαγών ΣΕΣ (Transaction

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΙΟΙΚΗΣΗΣ. Ανάπτυξη Πληροφοριακών Συστηµάτων Επισκόπηση Π.Σ. & τεχνικές για Ανάλυση και Ανάπτυξη. πληροφοριακών συστηµάτων

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΙΟΙΚΗΣΗΣ. Ανάπτυξη Πληροφοριακών Συστηµάτων Επισκόπηση Π.Σ. & τεχνικές για Ανάλυση και Ανάπτυξη. πληροφοριακών συστηµάτων Ανάπτυξη Πληροφοριακών Συστηµάτων Επισκόπηση Π.Σ. & τεχνικές για Ανάλυση και Ανάπτυξη πληροφοριακών συστηµάτων οµή παρουσίασης Τεχνολογική-Ιστορική Επισκόπηση Φάσεις Ανάπτυξης Πληροφοριακού Συστήµατος

Διαβάστε περισσότερα

Εισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων

Εισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων Βάσεις εδοµένων 2003-2004 Ευαγγελία Πιτουρά 1 ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήµατος Επεξεργασία Ερωτήσεων Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασµός) Προγραµµατισµός (Σχεσιακή Άλγεβρα, SQL)

Διαβάστε περισσότερα

Data Warehouse Refreshment via ETL tools. Panos Vassiliadis

Data Warehouse Refreshment via ETL tools. Panos Vassiliadis Data Warehouse Refreshment via ETL tools Panos Vassiliadis Data Warehouse Environment 2 Extract-Transform-Load (ETL) Extract Transform & Clean Load Sources DSA DW 3 Importance ETL market has a steady increase

Διαβάστε περισσότερα

Συστήματα Πληροφοριών Διοίκησης

Συστήματα Πληροφοριών Διοίκησης ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Συστήματα Πληροφοριών Διοίκησης Ενότητα 2: Γενική θεώρηση και κατάταξη συστημάτων πληροφοριών διοίκησης Διονύσιος Γιαννακόπουλος, Καθηγητής Τμήμα

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ MANAGEMENT INFORMATION SYSTEMS (M.I.S.)

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ MANAGEMENT INFORMATION SYSTEMS (M.I.S.) ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ MANAGEMENT INFORMATION SYSTEMS (M.I.S.) 1.1 Κωνσταντίνος Ταραμπάνης Καθηγητής Τμήμα Οργάνωσης και Διοίκησης Επιχειρήσεων Πανεπιστήμιο Μακεδονίας Γρ. 307 2310-891-578 kat@uom.gr

Διαβάστε περισσότερα

Οδηγός εφαρµογής τεχνικών Επιχειρηµατικής Ευφυΐας στις Ελληνικές Ακαδηµαϊκές Βιβλιοθήκες

Οδηγός εφαρµογής τεχνικών Επιχειρηµατικής Ευφυΐας στις Ελληνικές Ακαδηµαϊκές Βιβλιοθήκες ΜΟΝΑ Α ΙΑΣΦΑΛΙΣΗΣ ΠΟΙΟΤΗΤΑΣ ΑΚΑ ΗΜΑΪΚΩΝ ΒΙΒΛΙΟΘΗΚΩΝ 1 Ο ΗΓΟΣ Οδηγός εφαρµογής τεχνικών Επιχειρηµατικής Ευφυΐας στις Ελληνικές Ακαδηµαϊκές Βιβλιοθήκες ΜΟΝΑ Α ΙΑΣΦΑΛΙΣΗΣ ΠΟΙΟΤΗΤΑΣ ΙΩΑΝΝΙΝΑ ΑΚΑ ΗΜΑΪΚΩΝ ΒΙΒΛΙΟΘΗΚΩΝ

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Πρόγραµµα Μεταπτυχιακών Σπουδών «Πληροφορική»

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Πρόγραµµα Μεταπτυχιακών Σπουδών «Πληροφορική» Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Πρόγραµµα Μεταπτυχιακών Σπουδών «Πληροφορική» Μεταπτυχιακή ιατριβή Τίτλος ιατριβής Ονοµατεπώνυµο Φοιτητή Πατρώνυµο Συλλογή, ιασταύρωση, ιαχείριση και Επιχειρησιακή

Διαβάστε περισσότερα

Ένα σύνολο αλληλοσχετιζόμενων συστημάτων που συλλέγουν, επεξεργάζονται, αποθηκεύουν και διανέμουν πληροφορίες

Ένα σύνολο αλληλοσχετιζόμενων συστημάτων που συλλέγουν, επεξεργάζονται, αποθηκεύουν και διανέμουν πληροφορίες Συστήματα Επιχειρηματικής Ευφυΐας (BI Business Intelligence) Οι πιέσεις του περιβάλλοντος Πληροφοριακά Συστήματα Ένα σύνολο αλληλοσχετιζόμενων συστημάτων που συλλέγουν, επεξεργάζονται, αποθηκεύουν και

Διαβάστε περισσότερα

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι Συστήματα Υποστήριξης Αποφάσεων Τα Συστήματα Υποστήριξης Αποφάσεων (Σ.Υ.Α. - Decision Support Systems, D.S.S.) ορίζονται ως συστήματα

Διαβάστε περισσότερα

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Στόχος Θεματικής Ενότητας Οι μαθητές να περιγράφουν τους βασικούς τομείς της Επιστήμης των Υπολογιστών και να μπορούν

Διαβάστε περισσότερα

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων Αναστάσιος Σκαρλατίδης 1,2 anskarl@iit.demokritos.gr επιβλέπων: Καθ. Βούρος Γ. 1 1 Τµήµα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστηµάτων Πανεπιστήµιο

Διαβάστε περισσότερα