Εργαστήριο Σημασιολογικού Ιστού

Σχετικά έγγραφα
Εργαστήριο Σημασιολογικού Ιστού

Ενότητα 3: Τα δεδομένα στο Web. (και η σημασιολογία τους semantics )

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Εργαστήριο Σημασιολογικού Ιστού

Εισαγωγή στους Υπολογιστές

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 2: Μοντελο Συσχετίσεων Οντοτήτων, Μελέτη Περίπτωσης: Η βάση δεδομένων των CD

Αυτοματοποιημένη χαρτογραφία

Σχεδίαση με Ηλεκτρονικούς Υπολογιστές

Εφαρμογές Συστημάτων Γεωγραφικών Πληροφοριών

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Συστήματα Αυτομάτου Ελέγχου. Ενότητα Α: Γραμμικά Συστήματα

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Εργαστήριο Σημασιολογικού Ιστού

Ψηφιακή Τεχνολογία σε Ακαδημαϊκό Περιβάλλον

Προγραμματισμός Η/Υ. Χειρισμός Αρχείων. ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Τεχνολογιών Φυσικού Περιβάλλοντος

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΠΛΗΡΟΦΟΡΙΚΗ. Ενότητα: Εργαστηριακές Ασκήσεις. Καθηγήτρια: Ι.

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Μάρκετινγκ Αγροτικών Προϊόντων

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

Λογιστικές Εφαρμογές Εργαστήριο

Πληροφορική. Εργαστηριακή Ενότητα 3 η : Επεξεργασία Κελιών Γραμμών & Στηλών. Ι. Ψαρομήλιγκος Τμήμα Λογιστικής & Χρηματοοικονομικής

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Εισαγωγή στους Αλγορίθμους

Μάρκετινγκ Αγροτικών Προϊόντων

Τεχνολογίες & Εφαρμογές Πληροφορικής Ενότητα 1: Εισαγωγικό Μάθημα

Πληροφορική ΙΙ Θεματική Ενότητα 13

Προγραμματισμός Η/Υ. 7 η ενότητα: Αρχεία. Τμήμα. Τεχνολόγων Περιβάλλοντος. ΤΕΙ Ιονίων Νήσων. Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων

Πληροφορική. Εργαστηριακή Ενότητα 1 η : Εισαγωγή στα Λογιστικά Φύλλα με το MS Excel. Ι. Ψαρομήλιγκος Τμήμα Λογιστικής & Χρηματοοικονομικής

Ιστορία της μετάφρασης

TEC610 Δυναμικές Εφαρμογές Διαδικτύου (ΣΤ εξάμηνο)

Εισαγωγή στους Υπολογιστές

Γενικά Μαθηματικά Ι. Ενότητα 15: Ολοκληρώματα Με Ρητές Και Τριγωνομετρικές Συναρτήσεις Λουκάς Βλάχος Τμήμα Φυσικής

Μάρκετινγκ Αγροτικών Προϊόντων

Θεωρία Πιθανοτήτων & Στατιστική

Εισαγωγή στους Αλγορίθμους

Δομημένος Προγραμματισμός

Δομές Δεδομένων Ενότητα 3

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Διδακτική Φυσικών Επιστημών στην Προσχολική Εκπαίδευση

Θερμοδυναμική - Εργαστήριο

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

ΜΑΘΗΜΑ: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Εισαγωγή στον Προγραμματισμό Η/Υ (Fortran 90/95/2003)

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Λογιστική Κόστους Ενότητα 8: Κοστολογική διάρθρωση Κύρια / Βοηθητικά Κέντρα Κόστους.

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι Ενότητα 3:

Διαδικαστικός Προγραμματισμός

Εκκλησιαστικό Δίκαιο. Ενότητα 10η: Ιερά Σύνοδος της Ιεραρχίας και Διαρκής Ιερά Σύνοδος Κυριάκος Κυριαζόπουλος Τμήμα Νομικής Α.Π.Θ.

Οδηγίες Οργάνωσης Μαθήματος στην Ιδρυματική πλατφόρμα του open e class. Σύνταξη: MY-AOC

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΣΙΑ ΠΑΝΕΠΙΣΗΜΙΟ ΚΡΗΣΗ

Σχεδιασμός Υπαιθρίων Εκμεταλλεύσεων

Σύγχρονες Εφαρμογές Τεχνολογιών της Πληροφορίας και των Επικοινωνιών

Δομημένος Προγραμματισμός

1 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΜΑΘΗΜΑ: ΗΛΕΚΤΡΟΤΕΧΝΙΑ-ΗΛΕΚΤΡΟΝΙΚΗ ΕΡΓΑΣΤΗΡΙΟ

Εισαγωγή στην Διοίκηση Επιχειρήσεων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Πληροφορική. Εργαστηριακή Ενότητα 6 η : Ταξινόμηση & Ομαδοποίηση Δεδομένων

Λογιστική Κόστους Ενότητα 10: Ασκήσεις Προτύπου Κόστους Αποκλίσεων.

TEC410 Ανάπτυξη Δικτυακών Τόπων (Δ εξάμηνο) Διδάσκων: Ανδρέας Γιαννακουλόπουλος Επιστημονικός συνεργάτης Εργαστηρίου: Στέλλα Λάμπουρα

Προγραμματισμός και Εφαρμογές Υπολογιστών

Συμπεριφορά Καταναλωτή

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Σχεδίαση με Ηλεκτρονικούς Υπολογιστές

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Prim

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Ηλεκτρονικοί Υπολογιστές I

Βάσεις Δεδομένων. Ενότητα 5: ΚΑΝΟΝΙΚΟΠΟΙΗΣΗ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ. Πασχαλίδης Δημοσθένης Τμήμα Ιερατικών σπουδών

Ψηφιακή Τεχνολογία σε Ακαδημαϊκό Περιβάλλον

ΗΛΕΚΤΡΟΝΙΚΗ ΙIΙ Ενότητα 6

Εισαγωγή στους Αλγορίθμους

Ενδεικτικές λύσεις ασκήσεων διαχείρισης έργου υπό συνθήκες αβεβαιότητας

Διδακτική Πληροφορικής

Μακροοικονομική Θεωρία Ι

Λογισμός 3. Ενότητα 19: Θεώρημα Πεπλεγμένων (γενική μορφή) Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Εργαστήριο Σημασιολογικού Ιστού

Δομές Δεδομένων. Ενότητα 11: Τεχνικές Κατακερματισμού. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής.

Ανθή Μαρία Κουρνιάτη. Νίκος Κουρνιάτης

Στατιστική. 6 ο Μάθημα: Διαστήματα Εμπιστοσύνης και Έλεγχοι Υποθέσεων. Γεώργιος Μενεξές Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Θεωρία Πιθανοτήτων & Στατιστική

Λογικός Προγραμματισμός Ασκήσεις

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

ΕΡΓΑΣΤΗΡΙΟ ΦΥΣΙΚΗΣ Ι ΘΕΩΡΙΑ ΣΦΑΛΜΑΤΩΝ. Κανονισμός Μαθήματος και Εργαστηρίου Καθηγήτρια Γεωργά Σταυρούλα Τμήμα Φυσικής

Διοικητική Λογιστική

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Αναγωγή _ Εξαγωγή & Έλεγχος. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Μαθηματικά στην Πολιτική Επιστήμη:

Μάρκετινγκ Αγροτικών Προϊόντων

Διδακτική Πληροφορικής

Ανθή Μαρία Κουρνιάτη. Νίκος Κουρνιάτης

Διαχείριση Χρόνου & Δίκτυα στη Διοίκηση Έργων. Κηρυττόπουλος Κωνσταντίνος Επ. Καθηγητής ΕΜΠ

Ανθή Μαρία Κουρνιάτη. Νίκος Κουρνιάτης

Ενότητα. Εισαγωγή στις βάσεις δεδομένων

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Kruskal

Transcript:

Εργαστήριο Σημασιολογικού Ιστού Ενότητα 2: Εισαγωγή στην Οργάνωση των Σημασιολογικών Δεδομένων Μ.Στεφανιδάκης 13-2-2016.

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Ιόνιο Πανεπιστήμιο» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 10-1

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons

Ποιο το κατάλληλο μοντέλο δεδομένων; Τα σημασιολογικά δεδομένα πρέπει να εκτεθούν ώς έχουν (raw) Ποιο είναι το κατάλληλο μοντέλο οργάνωσης; Και πώς θα εμπεριέχονται και τα μεταδεδομένα; Ας ξεκινήσουμε με ένα απλό μοντέλο: δεδομένα σε μορφή πίνακα (tabular data) Η σημασιολογία των δεδομένων προκύπτει έμμεσα από τη θέση τους (γραμμή-στήλη) Τύπος Αριθμός Λεωφορεία 58.519 ΙΧ 2.062.880 Οδοποιητικά 7.642 Εκχιονιστικά 6 Ποδήλατα 8.540.192

Η έμμεση σημασιολογία του πίνακα Κάθε γραμμή αντιστοιχεί σε μία βασική οντότητα (entity) δεδομένων Έμμεση πληροφορία Κάθε στήλη αντιστοιχεί σε μια ιδιότητα (attribute) Ρητή πληροφορία, αν υπάρχει περιγραφή στηλών.. Οντότητα i Τύπος Αριθμός. Λεωφορεία 58.519 ΙΧ 2.062.880 Οδοποιητικά 7.642 Εκχιονιστικά. 6 Ποδήλατα 8.540.192 Ιδιότητα j

Δοκιμάστε και εσείς! Διαλέξτε ένα ωρολόγιο πρόγραμμα στο τρέχον εξάμηνο π.χ. του Η' εξαμήνου Προσπαθήστε να εκφράσετε την περιεχόμενη πληροφορία σε μορφή πίνακα Για βοήθεια, σκεφτείτε πώς θα οργανώνατε την πληροφορία στο σχεσιακό μοντέλο Θα καταλήξετε χονδρικά στους εξής σχεσιακούς πίνακες: Καθηγητής, Μάθημα, Αίθουσα, Εξάμηνο και Διάλεξη Η Διάλεξη (ένα γεμάτο κελί του αρχικού ωρολογίου pdf) είναι η κομβική οντότητα που συνδέεται με όλες τις άλλες Διαθέτει επίσης πληροφορία ώρας και ημέρας

Δοκιμάστε και εσείς! Χρησιμοποιήστε τη Διάλεξη ως κομβική οντότητα πληροφορίας του ωρολογίου προγράμματος Κάθε γραμμή του πίνακα θα είναι εκφράζει μια τέτοια οντότητα (διάλεξη) Και η υπόλοιπη πληροφορία θα τοποθετηθεί στις στήλες, ως ιδιότητες κάθε διάλεξης Προσοχή! το ζητούμενο δεν είναι να αναπαράγετε τον πίνακα του ωρολογίου προγράμματος ως έχει!

Μοντέλο και Μορφή Αποθήκευσης Η μορφή πίνακα είναι ένα μοντέλο οργάνωσης δεδομένων (data model) Προσδιορίζει τον τρόπο δόμησης της πληροφορίας Η δομημένη πληροφορία όμως Πρέπει να αποθηκευτεί ως ακολουθία bytes Και να μεταδοθεί μεταξύ παραγωγού και καταναλωτή Συνεπώς, πέρα από το μοντέλο των δεδομένων, είναι απαραίτητο ένα μορφότυπο σειριοποίησης (serialization format) των δεδομένων

Η μορφή αποθήκευσης CSV Comma Separated Values Ένα..μη πρότυπο πρότυπο (τουλάχιστον μέχρι πρόσφατα) Με πολλές διαλέκτους (σχεδόν κάθε εφαρμογή έχει τη δική της!) Για εξαγωγή-εισαγωγή μεγάλων σετ δεδομένων σε μορφή πίνακα από-σε βάσεις δεδομένων Έλεγχος Ιδιοτήτων: Ανοικτό πρότυπο: ΝΑΙ Χρήση στο Web: ΝΑΙ (αν και όχι τόσο συχνά) Ευκολία προγραμματισμού: ΝΑΙ (βιβλιοθήκες για πολλές γλώσσες) Ρητά μεταδεδομένα: ΟΧΙ (προαιρετικά, ονόματα στηλών στην πρώτη γραμμη)

Δοκιμάστε και εσείς! Βήμα 1 ο : Αποθηκεύστε τον πίνακα που φτιάξατε προηγουμένως σε μορφή csv μέσω της εφαρμογής spreadsheet Βήμα 2 ο : Γράψτε πρόγραμμα Python που διαβάζει το αρχείο csv και μπορεί να απαντήσει σε κάθε ένα από τα: Τι διδάσκεται την ώρα/μέρα Χ στην αίθουσα Υ; Ποιες μέρες διδάσκει ο Χ το μάθημα Υ; Τι μαθήματα έχει σήμερα το εξάμηνο Χ; Ποιος διδάσκει την ημέρα Χ στην αίθουσα Υ; κ.ο.κ Στην επόμενη σελίδα: ανάγνωση CSV μέσω Python

Python και ανάγνωση αρχείου CSV import csv # open csv file for reading ifp = open('test.csv','r',newline='',encoding='utf-8') # create csv reader object ir = csv.reader(ifp) # defaults to excel 'dialect' # read first row (headers) hdrow = next(ir) # iterate over table rows in csv file for row in ir: # each row is a list of strings # (table column values for this row) # do something with each row here... ifp.close()

Προσθήκη ρητού αναγνωριστικού (id) Οικείο σχήμα από τις σχεσιακές βάσεις... Κάθε βασική οντότητα διαθέτει μοναδικό αναγνωριστικό Θεωρήστε προς το παρόν ότι αυτός είναι ο μοναδικός πίνακας στον κόσμο! id Τύπος Αριθμός 1 Λεωφορεία 58.519 2 ΙΧ 2.062.880 3 Οδοποιητικά 7.642 4 Εκχιονιστικά 6 5 Ποδήλατα 8.540.192

Το μετα-μοντέλο EAV Μια νέα μεταμόρφωση: το μοντέλο Entity-Attribute-Value Μορφή τριάδας (triple): (Οντότητα, Ιδιότητα, Τιμή) Η Οντότητα συμβολίζεται με το ρητό αναγνωριστικό της Ως Ιδιότητες μπαίνουν οι (ρητές ή εννοούμενες) επικεφαλίδες των στηλών Ως Τιμές χρησιμοποιούνται τα περιεχόμενα των κελιών στις διασταυρώσεις γραμμών-στηλών Όλα τα μεταδεδομένα (ιδιότητες) δηλώνονται ρητά Ο εφιάλτης του σχεσιακού μοντέλου!!! Πλήρης απο-κανονικοποίηση (denormalization)

Παράδειγμα μετασχηματισμού Έστω ο πίνακας (δείχνεται μια γραμμή μόνο) id Engine Weight(kg) Tracks(mm) Boom(m)............... 38rb V8 60000 850 18...............

Δεδομένα κατά το μοντέλο EAV Η μία αυτή γραμμή παράγει από μόνη της τις εξής τριάδες Entity Attribute Value 38rb Engine V8 38rb Weight(kg) 60000 38rb Tracks(mm) 850 38rb Boom(m) 18 Κάθε άλλη γραμμή του αρχικού πίνακα θα μετασχηματιστεί επίσης στις αντίστοιχες τριάδες!

Δοκιμάστε και εσείς! Φτιάξτε πρόγραμμα Python Διαβάστε το csv αρχείο σας με το ωρολόγιο πρόγραμμα Για κάθε μία γραμμή αποθηκεύστε σε ένα νέο csv τις τριάδες που παράγονται από τη γραμμή αυτή Σύμφωνα με το μοντέλο EAV import csv # open file for csv writing ofp = open('out.csv','w',newline='',encoding='utf-8') # create csv writer (default format) ow = csv.writer(ofp) # write a row of values in csv file ow.writerow([ent,attr,val]) # close output file ofp.close()