Σχετικά έγγραφα
Σηµειώσεις Βάσεων εδοµένων. Σύγχρονες Τάσεις και Εφαρµογές. Γιάννης Θεοδωρίδης. Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιά.

Εξόρυξη Γνώσης από εδοµένα (Data Mining)

Εισαγωγή. Τι είναι µια βάση δεδοµένων;

Εισαγωγή. web σελίδα Βάσεις εδοµένων Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα

Εξόρυξη Γνώσης από εδοµένα (Data Mining)

Εισαγωγή. Βάσεις εδομένων

Εισαγωγή. Βάσεις Δεδομένων : Εισαγωγή 1. Βάσεις εδομένων

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

Architecture οf Integrated Ιnformation Systems (ARIS)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

Αντικείµενο: Θεµελιώδες πρόβληµα της επιστήµης µας εδοµένα

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Τι προσφέρουν τα Τµήµατα Πληροφορικής. ... το Εργαστήριο Πληροφοριακών Συστηµάτων του Πα.Πει. Ερευνητικές δραστηριότητες σε GI Ενδεικτικές εργασίες

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Πρόγραμμα Σεμιναρίων Φεβρουαρίου - Ιουλίου

Διδάσκοντες: Μαρία Χαλκίδη

Πρόγραμμα Σεμιναρίων Φεβρουαρίου - Ιουλίου

Εισαγωγή στα Συστήματα Βάσεων Δεδομένων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Αποθήκες Δεδομένων & Πολυδιάστατη Ανάλυση

«ΑΓΡΟΤΟΥΡΙΣΜΟΣ ΚΑΙ ΤΟΠΙΚΗ ΑΝΑΠΤΥΞΗ: Ο ΡΟΛΟΣ ΤΩΝ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΣΤΗΝ ΠΡΟΩΘΗΣΗ ΤΩΝ ΓΥΝΑΙΚΕΙΩΝ ΣΥΝΕΤΑΙΡΙΣΜΩΝ»

Database System Concepts and Architecture (Αρχιτεκτονική, οµές, και Μοντέλα)

Πρόγραμμα Σεμιναρίων Σεπτεμβρίου Δεκεμβρίου

Πρόγραμμα Σεμιναρίων Σεπτεμβρίου - Δεκεμβρίου

ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική»

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Αποθήκες εδοµένων και Εξόρυξη Γνώσης. (Data Warehousing & Data Mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης

Test Data Management in Practice

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Τεχνολογίες και Εφαρμογές Διαδικτύου. Σχεδίαση Συστήματος

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΠΑΝΔΠΙΣΗΜΙΟ ΜΑΚΔΓΟΝΙΑ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΠΟΤΓΧΝ ΣΜΗΜΑΣΟ ΔΦΑΡΜΟΜΔΝΗ ΠΛΗΡΟΦΟΡΙΚΗ

Πρόγραμμα Σεμιναρίων Σεπτεμβρίου - Δεκεμβρίου

(1 ο μάθημα)

Microsoft Visual Studio Γιώργος Καµαρινός Developer Programs Marketing Manager Microsoft Hellas

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 133: ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΡΓΑΣΤΗΡΙΟ 3 Javadoc Tutorial

ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ 6-2

ΠΜΣ Πληροφορικής Πανεπιστηµίου Πειραιά. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εισαγωγή. Γιάννης Θεοδωρίδης

Bayesian modeling of inseparable space-time variation in disease risk

Assalamu `alaikum wr. wb.

Ασφάλεια σε χώρους αναψυχής: Ένα σύστημα από έξυπνα αντικείμενα

Ανάλυση Δεδομένων (Data Analysis) Άμεση Αναλυτική Επεξεργασία (OLAP) Λειτουργίες Συνάθροισης στην SQL (windowing, ranking)

Web 論 文. Performance Evaluation and Renewal of Department s Official Web Site. Akira TAKAHASHI and Kenji KAMIMURA

Εισαγωγή στα Συστήµατα Βάσεων Δεδοµένων

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

ΔΙΑΔΙΚΤΥΑΚΟ ΣΥΣΤΗΜΑ ΒΕΛΤΙΣΤΗΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΝΕΡΓΕΙΑΚΩΝ ΠΟΡΩΝ E.M.I.R. - Energy Management & Intelligent Reporting

Ολοκληρωµένη λύση επιλεκτικής συγκέντρωσης, αναδιοργάνωσης δεδοµένων και παραγωγής πληροφορίας

ER-Tree (Extended R*-Tree)

Πληροφοριακά Συστήµατα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ. Σχολή Τεχνολογικών Εφαρμογών Τμήμα Εφαρμοσμένης Πληροφορικής & Πολυμέσων

Business Development, SAP Hellas 01/12/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΙΟΙΚΗΣΗΣ II ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΜΑΘΗΜΑ: ΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Αρχεία και Βάσεις Δεδομένων

Lecture 3: Introduction III

ΔΝΓΔΙΚΣΙΚΔ ΑΠΑΝΣΗΔΙ 3 εο ΓΡΑΠΣΗ ΔΡΓΑΙΑ

Συνοπτική επισκόπηση αγοράς & εργαλείων ΒΙ

ΤΟ ΤΡΑΠΕΖΙΚΟ ΣΥΣΤΗΜΑ- ΟΙ ΣΥΓΧΡΟΝΕΣ ΤΡΑΠΕΖΙΚΕΣ ΥΠΗΡΕΣΙΕΣ- ΧΡΗΜΑΤΟΙΚΟΝΟΜΙΚΉ ΑΝΑΛΥΣΗ ΤΩΝ ΤΕΣΣΑΡΩΝ ΣΥΣΤΗΜΙΚΩΝ ΤΡΑΠΕΖΩΝ

ENTERPRISE EUROPE NETWORK HELLAS ΒΙΟΤΕΧΝΙΚΟ ΕΠΙΜΕΛΗΤΗΡΙΟ ΑΘΗΝΑΣ

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Bring Your Own Device (BYOD) Legal Challenges of the new Business Trend MINA ZOULOVITS LAWYER, PARNTER FILOTHEIDIS & PARTNERS LAW FIRM

EE512: Error Control Coding

Cloud Computing & Data Management (Υπολογιστικά Νέφη & Διαχείριση Δεδομένων)

CYTA Cloud Server Set Up Instructions

Τ.Ε.Ι. ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΔΗΜΟΣΙΩΝ ΣΧΕΣΕΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΣ

Εξόρυξη Γνώσης µε SQL Server 2005 Analysis Services

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ. «Θεσμικό Πλαίσιο Φωτοβολταïκών Συστημάτων- Βέλτιστη Απόδοση Μέσω Τρόπων Στήριξης»

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

TaxiCounter Android App. Περδίκης Ανδρέας ME10069

Εισαγωγή στις Βάσεις Δεδομένων

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Σχεδιασμός Βάσεων Δεδομένων

ΣΤΥΛΙΑΝΟΥ ΣΟΦΙΑ

Démographie spatiale/spatial Demography

Δίκτυα Επικοινωνιών ΙΙ: OSPF Configuration

Ηλεκτρονικός Άτλαντας της Νήσου Λέσβου.

Reminders: linear functions

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΥΨΗΛΩΝ ΤΑΣΕΩΝ

The Simply Typed Lambda Calculus

Context-aware και mhealth

Transient Voltage Suppression Diodes: 1.5KE Series Axial Leaded Type 1500 W

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ»

ΔΙΑΚΗΡΥΞΗ ΔΑΠΜ

ΗΥ 360 Αρχεία και Βάσεις Δεδομένων

Εισαγωγή. Βάσεις Δεδομένων : Εισαγωγή 1

Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής. Αποθήκες εδοµένων και Εξόρυξη Γνώσης. (Data Warehousing & Data Mining) Εισαγωγή

ίκτυο προστασίας για τα Ελληνικά αγροτικά και οικόσιτα ζώα on.net e-foundatio // itute: toring Insti SAVE-Monit

Ανοικτά Ακαδημαϊκά Μαθήματα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ. Παραγωγικές Λειτουργίες Επιχείρησης

Μιχάλης Βαφόπουλος, vafopoulos.org

1) Abstract (To be organized as: background, aim, workpackages, expected results) (300 words max) Το όριο λέξεων θα είναι ελαστικό.

Εκτίμηση κινδύνου και μέτρα ασφαλείας για την προστασία προσωπικών δεδομένων

υπηρεσίες / services ΜΕΛΕΤΗ - ΣΧΕΔΙΑΣΜΟΣ PLANNING - DESIGN ΕΜΠΟΡΙΚΗ ΜΕΛΕΤΗ COMMERCIAL PLANNING ΕΠΙΠΛΩΣΗ - ΕΞΟΠΛΙΣΜΟΣ FURNISHING - EQUIPMENT

Managing Information.! Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business!!

σ σ σ :

Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1

«Χρήσεις γης, αξίες γης και κυκλοφοριακές ρυθμίσεις στο Δήμο Χαλκιδέων. Η μεταξύ τους σχέση και εξέλιξη.»

Oracle. Tεχνολογίες Υποδοµής για την Περιφερειακή Ανάπτυξη. Αντώνης Ν. Λίνας Senior Sales Consultant Business Solutions Oracle Hellas

Τμήμα Πολιτικών και Δομικών Έργων

Μηχανισμοί πρόβλεψης προσήμων σε προσημασμένα μοντέλα κοινωνικών δικτύων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΜΑΡΙΟΛΑΚΟΣ Η., ΦΟΥΝΤΟΥΛΗΣ Ι., ΣΠΥΡΙΔΩΝΟΣ Ε., ΑΝΔΡΕΑΔΑΚΗΣ Ε., ΚΑΠΟΥΡΑΝΗ, Ε.

Transcript:

Πανεπιστήµιο Πειραιώς, Τµήµα Πληροφορικής ΠΜΣ «Προηγµένα Συστήµατα Πληροφορικής» Προηγµένα Θέµατα Βάσεων εδοµένων Σύγχρονες Τάσεις και Εφαρµογές Γιάννης Θεοδωρίδης, Νίκος Πελέκης InfoLab, Τµήµα Πληροφορικής, Πανεπιστήµιο Πειραιά http://infolab.cs.unipi.gr version: Jan. 2009 Περιεχόµενα Το χθες... το σήµερα...... και το αύριο των Βάσεων εδοµένων Αναλυτικότερα θα δούµε µη παραδοσιακούς τρόπους σχεδίασης Β... πώς υποστηρίζουµε αντικείµενα στις Β τι είναι µια XML Β πώς εκτελούµε πολυδιάστατη ανάλυση µε στόχο τη λήψη αποφάσεων... και θα συνεχίσουµε µε σύγχρονες τάσεις και εφαρµογές Β όπως: Χρονική, χωρική, πολυµεσική (εικόνες κ.α.) πληροφορία Εν κινήσει και προσωπικές Β, ρεύµατα δεδοµένων,... Ευχαριστίες: µέροςτουυλικούβασίζεταισεδιαφάνειεςτωντ. Σελλή (ΕΜΠ), Ι. Ιωαννίδη (ΕΚΠΑ), Π. Βασιλειάδη (Παν/µιοΙωαννίνων) ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Ιστορία των Β (1) Late 60's: network (CODASYL) & hierarchical (IMS) DBMS. Low-level record-at-a-time DML, i.e. physical data structures reflected in DML (no data independence) 1970: Codd's paper -- the relational model. The most influential paper in DB research (Turing award). Data independence. Allows for schema and physical storage structures to change under the covers. Truly important theory, led to "paradigm shift" in thinking and in practice. 3 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Ιστορία των Β (2) mid 70's: 2 full-function (sort of) prototypes Ancestors of essentially all today's commercial systems Ingres: UCB 1974-77 (Stonebraker & colleagues) Led to Ingres Corp (CA), Sybase, MS SQL Server. System R: IBM San Jose (now Almaden) Led to IBM's DB2, Oracle. Both were viable starting points, proved practicality of relational approach. Beautiful example of theory practice!! 4 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Ιστορία των Β (3) 80's commercialization of relational systems 1979: Oracle v.2 is the first commercial RDBMS SQL becomes de-facto standard. 90 s: the age of maturity network & hierarchical essentially dead (though commonly in use!) relational becomes mainstream improvements in terms of transactional facilities, performance and stability RDBMS s as back-end for internet front-ends Application Servers and middleware object relational (support for ADT s) 5 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Σήµερα: ο όρος-κλειδί είναι... Κλιµάκωση σε τεράστιους όγκους πληροφορίας! Παραδείγµατα: EOSDIS (NASA s Earth Observing System Data and Information System): 1 Tb/day, keep it all for 15 years (they need tertiary storage for that) WalMart: 365 node system, 6Tb online, 4billion row table, 200million updates daily, 4000 queries/day, 1500 users/week The world produces between 1 and 2 exabytes of unique information per year, which is roughly 250 megabytes for every man, woman, and child on earth Source: Lyman & Varian. How much information? http://www.sims.berkeley.edu/research/projects/how-much-info-2003/ 6 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Αύριο: ό,τι πουν οι «σοφοί» Senior database researchers gather every few years to assess the state of database research and to recommend problems and problem areas that deserve additional focus. Laguna Beach, Calif. in 1989, Palo Alto, Calif. (Lagunitas) in 1990, Palo Alto, Calif. (Lagunitas II) in 1995, Cambridge, Mass. in 1996, Asilomar, Calif. in 1998, Lowell, Mass. in 2003 Claremont, Calif. in 2008 7 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Lowell report, 2003 Integration of Text, Data, Code, and Streams Information Fusion Sensor Data and Sensor Networks Multimedia Queries Reasoning about Uncertain Data Personalization Data Mining Self Adaptation Privacy Trustworthy Systems New User Interfaces One-Hundred-Year Storage Query Optimization 8 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Όχι πια βάσεις «δεδοµένων» it is time to stop grafting new constructs onto the traditional architecture of the past. Instead, we should rethink basic DBMS architecture with an eye toward supporting: Structured data Text, space, time, image, and multimedia data Procedural data, that is data types and the methods that encapsulate them Triggers Data streams and queues as co-equal first-class components within the DBMS architecture - both its interface and its implementation - rather than as afterthoughts grafted onto a relational core 9 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Claremont report, 2008 Revisiting database engines broadening range of applicability (streams, readmostly analytics, ), improving performance for specific domains, Declarative programming for emerging platforms data parallelism (e.g. Map- Reduce), enterprise application programming (e.g. Ruby on Rails), etc. Interplay of structured and unstructured data e.g. extract structure and meaning from un- and semi-structured data Cloud data services manageability /scalability aspects, specialized services, Mobile applications and virtual worlds heterogeneous data streams management, privacy issues, 10 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Βιβλιογραφία Αξίζει να διαβάσετε τις 2 πιο πρόσφατες σχετικές αναφορές Claremont report (2008) http://db.cs.berkeley.edu/claremont/claremontreport08.pdf Lowell report (2003) http://research.microsoft.com/~gray/lowell/ 11 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Ας ξεκινήσουµε...... µε µη παραδοσιακούς τρόπους σχεδίασης Β...... και µε σύγχρονες τάσεις και εφαρµογές Β... 12 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Αντικείµενα στις Β - OODBMS Κλάσεις (classes), Αντικείµενα (objects), Μέθοδοι (methods), class Person : public d_object { public: d_string name; d_string address; }; class Account : public d_object { private: d_long balance; public: d_long number; d_set <d_ref<customer>> owners; int find_balance(); int update_balance(int delta); }; 13 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Αντικείµενα στις Β - ORDBMS οµηµένοι τύποι (Structured types) create type Publisher as (name varchar(20), branch varchar(20)) create type Book as (title varchar(20), author-array varchar(20) array [10], pub-date date, publisher Publisher, keyword-set setof(varchar(20))) Παράδειγµα ορισµού πίνακα: create table books of Book Παράδειγµα εισαγωγής εγγραφής: insert into books values (`Compilers, array[`smith,`jones ], Publisher( McGraw Hill,`New York ), set(`parsing,`analysis )) 14 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

What s XML? W3C Standard since 1998 Subset of SGML (ISO Standard Generalized Markup Language) Data-description markup language HTML text-rendering markup language De facto format for data exchange on Internet Electronic commerce Business-to-business (B2B) communication 15 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Core XML Technologies XML Validation: Contract for Data Exchange DTD, Relax N/G, XML Schema XML API: Programmatic Access to XML DOM, SAX Transformation Languages for Data Exchange and Display XSL, XSLT, XPATH, XQuery 16 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

An XML Document <? xml version=" 1.0"?> <! DOCTYPE sigmodrecord SYSTEM sigmodrecord. dtd"> <sigmodrecord> <issue> <volume> 1</ volume> <number> 1</ number> <articles> <article> <title> XML Research Issues</ title> <initpage> 1</ initpage> <endpage> 5</ endpage> <authors> <author AuthorPosition=" 00"> Tom Hanks</ author> </ authors> </ article> </ articles> </ issue> 17 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης XML and Databases Data stored in SQL databases need to be published in XML for data exchange Specification schemes for publishing needed Efficient publishing algorithms needed Storage and retrieval of XML documents Need to support mapping schemes Need to support data manipulation XML API-s 18 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Storing XML Storage foundation of efficient XML processing XML demands own storage techniques Characteristics of XML data: Optional elements & values, repetition, choice, inherent order, large text fragments, mixed content Characteristics of XML queries: Document order & structure, full-text search, transformation Goals of tutorial Existing storage features for XML New storage features for XML 19 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Αποθήκες εδοµένων (Business Intelligence BI) Making Decisions End User Data Presentation Visualization Techniques Data Mining Information Discovery Business Analyst Data Analyst Data Exploration Statistical Analysis, Querying and Reporting Data Warehouses / Data Marts OLAP, MDA Data Sources Paper, Files, Information Providers, Database Systems, OLTP DBA 20 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Μεθοδολογία OLAP βήµατα αναλυτικής διαδικασίας: από το σχεδιασµό της ανάλυσης,... στη συγκέντρωση και οργάνωση των απαραίτητων δεδοµένων... την ανάλυσή τους και παρουσίαση των αποτελεσµάτων και τελικά... την εκµετάλευση των όποιων συµπερασµάτων Source: SPSS 21 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Αποθήκες εδοµένων ένα παράδειγµα Product Time time ID day_of_week month quarter year Sales time ID product ID location ID quantity turnover product ID description type type description Location location ID zip code city state 22 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Όψη κύβου δεδοµένων 123 150 200 sum Product Date 00-1 00-2 00-3 00-4 Πωλήσεις (µέση τιµή, πωληθείσα ποσότητα κοκ.) 4 ου τριµήνου προϊόντος 123 στο Dallas sum Dallas Houston Seattle Location sum 23 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Χρονικές βάσεις δεδοµένων Ποια η ανάγκη για χρονικές βάσεις δεδοµένων; εξαγωγή χρονικών συµπερασµάτων σε βάσεις γνώσεων εξαγωγή συµπερασµάτων σχετικά µε την ιστορία γεγονότων στο παρελθόν, σχεδιασµός µελλοντικών πράξεων και πρόβλεψη συνεπειών, λογισµός πάνω στην περίοδο εγκυρότητας της τιµής των δεδοµένων. 24 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

ΦΥΣΗ ΤΟΥ ΧΡΟΝΟΥ Τα µοντέλα χρόνου ταξινοµούνται ανάλογα µε: την πυκνότητα του χρόνου, το είδος και το µέγεθος των στοιχειωδών χρονικών µονάδων, το µοντέλο εξέλιξης του χρόνου, τις διαστάσεις του χρόνου, τις πράξεις στο χρόνο. 25 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης ΕΙ ΟΣ ΤΟΥ ΧΡΟΝΟΥ Γεγονός: µια αποµονωµένη στιγµή στο χρόνο. ιάστηµα (interval): ο χρόνος µεταξύ δύο γεγονότων. ιάρκεια (duration): ένα ποσό χρόνου µε σταθερό µήκος, αλλά χωρίς καθορισµένα άκρα. Περιορισµένο χρονικό διάστηµα (span): µια κατευθυνόµενη διάρκεια χρόνου (θετική ή αρνητική). 26 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

ΠΡΑΞΕΙΣ ΣΤΟ ΧΡΟΝΟ - ΣΧΕΣΕΙΣ ΤΟΥ ALLEN Y X before Y X equals Y X meets Y X overlaps Y X during Y X starts Y X finishes Y X X X X X X X - 27 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Χρονολογικές σειρές (time series) Σύνολο τιµών χαρακτηριστικών στον άξονα του χρόνου { <t 1, a 1 >, <t 2, a 2 >,, <t n, a n > } Παραδείγµατα: πωλήσεις προϊόντων τηλεπικοινωνιακά δεδοµένα ιατρικά σήµατα ακολουθίες περιβαλλοντικών µετρήσεων... 28 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Ανάλυση χρονολογικών σειρών Ανάλυση χρονολογικών σειρών: η ανακάλυψη προτύπων στις τιµές. Είδη προτύπων: Τάση : συστηµατική µη επαναλαµβανόµενη αλλαγή στο χρόνο (π.χ. σταθερή αύξηση) Κύκλος : επαναλαµβανόµενη συµπεριφορά Εποχιακό πρότυπο : παρόµοιες τιµές σε συγκεκριµένες περιόδους µέρα, µήνα, έτος κλπ. - του χρόνου Μη φυσιολογικά δεδοµένα (outliers) : στοιχεία που δεν µπορούν να κατηγοριοποιηθούν 29 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Βάσεις Χωρικών εδοµένων Απαίτηση για ειδική διαχείριση των µη-αλφαριθµητηικών δεδοµένων κατάλληλες γλώσσες επερωτήσεων ειδικές µέθοδοι δεικτοδότησης θέµατα βελτιστοποίησης ερωτήσεων Υποστήριξη χωρικών τελεστών βρες το κοντινότερο νοσοκοµείο βρες όλες τις πόλεις που βρίσκονται σε απόσταση 5Km από ακτές 30 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Βάσεις Χωρικών εδοµένων Αναλυτικά για... Μοντέλα εδοµένων Γλώσσες Επερωτήσεων Μέθοδοι εικτοδότησης Αρχιτεκτονική Συστηµάτων 31 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Μοντέλα εδοµένων ύο βασικές προσεγγίσεις - raster model - vector model R R R R R R R R R H Y-Axis River House X-Axis 32 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Μέθοδοι εικτοδότησης R-tree A F G K D E H J I B A B C M D E F G H I J K L M N N L C 33 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης Παράδειγµα Consider a spatial dataset with: County boundary (dashed white line) Census block - name, population, boundary (dark line) Water bodies (dark polygons) Satellite Imagery (gray scale pixels) Storage in a SDBMS table: create table census_blocks ( name string, population number, boundary polygon ); 34 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

Ρεύµατα δεδοµένων Data streams differ from conventional stored relation model: Data elements in the stream arrive online System has no control over order in which data elements to be processed Data streams are potentially unbounded in size Once an element from a data stream has been processed, it is discarded or archived. It cannot be retrieved easily unless it is stored in memory, which is small relative to the size of data streams Operating in data stream model does not preclude use of data in conventional stored relations. 35 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης DBMS versus DSMS Persistent relations One-time queries Random access Unbounded disk store Only current state matters Passive repository Relatively low update rate No real-time services Assume precise data Access plan determined by query processor, physical DB design Transient streams Continuous queries Sequential access Bounded main memory History/arrival-order is critical Active stores Possibly multi-gb arrival rate Real-time requirements Data stale/imprecise Unpredictable/variable data arrival and characteristics 36 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης

The Database Model User/Application Register Query Results Database Query Processor Software to access Stored Data Memory Data Base Management System (DBMS) Stored Data 37 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης The Data Stream Model User/Application Register Query Results Stream Query Processor Software to access Streaming Data Data Stream Management System (DSMS) Scratch Space (Memory and/or Disk) 38 ΠΑ.ΠΕΙ. Γιάννης Θεοδωρίδης