Εργαστήριο Σημασιολογικού Ιστού



Σχετικά έγγραφα
Εργαστήριο Σημασιολογικού Ιστού

Ενότητα 3: Τα δεδομένα στο Web. (και η σημασιολογία τους semantics )

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ EXCEL ΣΤΟ GRETL

Εργαστήριο Σημασιολογικού Ιστού

FORTRAN και Αντικειμενοστραφής Προγραμματισμός

Εισαγωγή στους Υπολογιστές

2. Εισαγωγή Δεδομένων σε Σχεσιακή Βάση Δεδομένων

Εργαστήριο Σημασιολογικού Ιστού

5 η Διάλεξη Python - Αρχεία

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

Πληροφοριακά Συστήματα Διοίκησης

Γράφοι τριάδων και το πρότυπο RDF

Λειτουργικά Συστήματα (ΙΙ) (διαχείριση αρχείων)

Πληροφοριακά Συστήματα Διοίκησης

5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

Προγραμματισμός Η/Υ. Χειρισμός Αρχείων. ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Τεχνολογιών Φυσικού Περιβάλλοντος

ΔΙΑΧΕΙΡΙΣΗ ΩΡΟΛΟΓΙΩΝ ΠΡΟΓΡΑΜΜΑΤΩΝ

Κάνουμε κλικ πάνω στην επικεφαλίδα όπου υπάρχει το αντίστοιχο γράμμα της στήλης.

Προγραμματισμός ταμειακής ροής για αγορές υλικών

Τµήµα Πληροφορικής. Δοµές Δεδοµένων - Εργασία 2. Φθινοπωρινό Εξάµηνο Διδάσκων: E. Μαρκάκης

Εργαστήριο Σημασιολογικού Ιστού

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

Πληροφορική ΙΙ Θεματική Ενότητα 13

Επεξεργασία πολλαπλών φύλλων εργασίας - Γραφημάτων Excel

Χρόνοι Μετάδοσης και Διάδοσης

Θέματα Τελικής Εξέτασης. ΠΡΟΣΟΧΗ: Οι απαντήσεις πάνω στα ΘΕΜΑΤΑ

Σηµερινή ατζέντα µαθήµατος... Προηγούµενα αναφερθήκαµε. Σήµερα θα συνεχίσουµε µε τις δοµές τους

Σηµερινή ατζέντα µαθήµατος... Προηγούµενα αναφερθήκαµε. Σήµερα θα συνεχίσουµε µε τις δοµές τους

Περιγραφή των Δεδομένων

Διαχείριση Έργων Πληροφορικής Εργαστήριο

Κεφάλαιο 12: Είσοδος και έξοδος δεδομένων σε αρχεία

ΜΑΘΗΜΑ Άνοιγμα Της Εφαρμογής Υπολογιστικών Φύλλων. 2. Κύρια Οθόνη Της Εφαρμογής Υπολογιστικών Φύλλων ΣΤΟΧΟΙ:

Βάσεις Δεδομένων. Εισαγωγή για το Εργαστήριο. Δρ. Τιάκας Ελευθέριος. Τμήμα Πληροφορικής ΑΠΘ

Εργασία Μαθήματος Αξία: 40% του τελικού σας βαθμού Ανάθεση: Παράδοση:

(Κεφάλαιο 2.7 και 12) Αρχεία στην C. (Διάλεξη 15)

Εισαγωγή στους Υπολογιστές

./mydiz {-c -a -x -m -d -p -j} <archive-file> <list-of-files/dirs>

Σύντοµο Εγχειρίδιο Χρήσης. του Λογισµικού Στατιστικής Επεξεργασίας. SPSS for Windows v. 8.0

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Βάσεις Δεδομένων (4 ο εξάμηνο) Εργαστήριο MySQL #2

Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ. Αρχεία Δεδομένων. Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD

Λειτουργικό Σύστημα: διαχείριση πόρων. Τι είναι ένα αρχείο ; Διαχείριση αρχείων. Λειτουργικά Συστήματα (ΙΙ) (διαχείριση αρχείων)

Διαχείριση Ωρολογίων Προγραμμάτων

Διαχείριση Ωρολογίων Προγραμμάτων Εκπαιδευτικών

Δημιουργώντας τον πίνακα διάστασης

SÔntomec plhroforðec gia to glpsol (glpk)

ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ. Εφαρμογή κατασκευής Προγράμματος εξεταστικών περιόδων. εφαρμογής

Η γλώσσα προγραμματισμού C

Λειτουργικό Σύστημα: διαχείριση πόρων. Διαχείριση αρχείων. Τι είναι ένα αρχείο ; Λειτουργικά Συστήματα (ΙΙ) (διαχείριση αρχείων)

1. Από το κεντρικό site του Ιδρύματος επιλέγουμε το σύνδεσμο "Γραμματείες Τμημάτων".

Σχεδίαση Βάσεων Δεδομένων

30 / 3 /

Διάλεξη 2. Μεταβλητές - Δομές Δεδομένων - Eίσοδος δεδομένων - Έξοδος: Μορφοποίηση - Συναρτήσεις. Διοργάνωση : ΚΕΛ ΣΑΤΜ

Εισαγωγή στη Βιοπληροφορική

Προγραμματισμός Η/Υ (ΤΛ2007 )

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

Διαχείριση Περιεχομένου Παγκόσμιου Ιστού και Γλωσσικά Εργαλεία ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ FILE & PROCESS HANDLING



ΕΠΛ031 - Εισαγωγή στον Προγραμματισμό

Eισαγωγή στο λογισμικό QGis

ΠΛΗΡΟΦΟΡΙΚΗ Ι ΕΡΓΑΣΤΗΡΙΟ 1. Θέμα εργαστηρίου: Εισαγωγή στην Python και στο IDLE

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Βάσεις Δεδομένων 3η εργαστηριακή άσκηση

Περιεχόμενα. Πρόλογος 9. Ευχαριστίες 11. Εισαγωγή Κατανόηση των δεδομένων Βασικές τεχνικές ανάλυσης δεδομένων 41

Ηλεκτρονική Υπηρεσία Ολοκληρωμένης Διαχείρισης Συγγραμμάτων και Λοιπών Βοηθημάτων ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΕΦΑΡΜΟΓΗΣ ΓΡΑΜΜΑΤΕΙΩΝ

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014

Δομημένος Προγραμματισμός (ΤΛ1006)

Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη. χρήση συναρτήσεων ομαδοποίησης κατά την εκτέλεση ενός ερωτήματος προβολής

2 ο Μάθημα. Χωρικές Βάσεις Δεδομένων και Γεωγραφικά Πληροφοριακά Συστήματα

Οδηγίες χρήσης. Ιδρυματικό Καταθετήριο ΤΕΙ Κρήτης

ΠΛΗΡΟΦΟΡΙΚΗ ΙΙ Python. 1η Ομάδα Ασκήσεων

Ενότητα 14 Γραφικές Παραστάσεις

4. ΔΗΜΙΟΥΡΓΙΑ ΜΟΝΤΕΛΟΥ ΠΟΛΥΔΙΑΣΤΑΤΗΣ ΑΝΑΛΥΣΗΣ

, α/α: 1. Εξόδου» Παιδείας» αποθετήριοο

Σχεδιασμός Βάσεων Δεδομένων

Εργαστήριο 2ο. Περίγραμμα Εργαστηριακής Άσκησης

Σύνταξη. Βιβλιοθήκη και Κέντρο Πληροφόρησης Α.Π.Θ. Υπηρεσία Ηλεκτρονικών Μαθημάτων. Μιχάλης Γερόλιμος Σουλτάνα Κάργα Νίκη Καλιακούδα Δέσποινα Παπαδάκη

Οδηγίες για τη Ανάπτυξη Ανοικτών Ψηφιακών Μαθημάτων

Επίλυση προβλήματος με Access

Σενάριο Μαθήματος με τίτλο: «Εργαλεία Έκφρασης και Δημιουργίας: Ζωγραφική και Επεξεργασία Εικόνας (με το Pixlr και με το Gimp)»

Εισαγωγή στον Προγραμματισμό Η/Υ (Fortran 90/95/2003)

Ηλεκτρονικοί Υπολογιστές II

Ολοκληρωμένο σύστημα διαχείρισης παρουσιών στο Τ.Ε.Ι. Σερρών

Αυτοματοποιημένη χαρτογραφία

Μεθόδων Επίλυσης Προβλημάτων

Βάσεις Δεδομένων. Μιχάλης Μαλιάππης

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Management Classes Create Class Create Class Management Classes List of Classes

Πως θα αποθηκεύσει τη λίστα με τα ψώνια του και θα την ανακτήσει στο Σ/Μ; και πως θα προσθέσει στη λίστα του επιπλέον προϊόντα;

Οδηγός συγγραφής αναφοράς

Transcript:

Εργαστήριο Σημασιολογικού Ιστού Ενότητα 2: Εισαγωγή στην Οργάνωση των Σημασιολογικών Δεδομένων Μ.Στεφανιδάκης 15-2-2015.

Ποιο το κατάλληλο μοντέλο δεδομένων; Τα σημασιολογικά δεδομένα πρέπει να εκτεθούν ώς έχουν (raw) Ποιο είναι το κατάλληλο μοντέλο οργάνωσης; Και πώς θα εμπεριέχονται και τα μεταδεδομένα; Ας ξεκινήσουμε με ένα απλό μοντέλο: δεδομένα σε μορφή πίνακα (tabular data) Η σημασιολογία των δεδομένων προκύπτει έμμεσα από τη θέση τους (γραμμή-στήλη) Τύπος Αριθμός Λεωφορεία 58.519 ΙΧ 2.062.880 Οδοποιητικά 7.642 Εκχιονιστικά 6 Ποδήλατα 8.540.192

Η έμμεση σημασιολογία του πίνακα Κάθε γραμμή αντιστοιχεί σε μία βασική οντότητα (entity) δεδομένων Έμμεση πληροφορία Κάθε στήλη αντιστοιχεί σε μια ιδιότητα (attribute) Ρητή πληροφορία, αν υπάρχει περιγραφή στηλών.. Οντότητα i Τύπος Αριθμός. Λεωφορεία 58.519 ΙΧ 2.062.880 Οδοποιητικά 7.642 Εκχιονιστικά. 6 Ποδήλατα 8.540.192 Ιδιότητα j

Δοκιμάστε και εσείς! Διαλέξτε ένα ωρολόγιο πρόγραμμα στο τρέχον εξάμηνο π.χ. του Η' εξαμήνου Προσπαθήστε να εκφράσετε την περιεχόμενη πληροφορία σε μορφή πίνακα Για βοήθεια, σκεφτείτε πώς θα οργανώνατε την πληροφορία στο σχεσιακό μοντέλο Θα καταλήξετε χονδρικά στους εξής σχεσιακούς πίνακες: Καθηγητής, Μάθημα, Αίθουσα, Εξάμηνο και Διάλεξη Η Διάλεξη (ένα γεμάτο κελί του αρχικού ωρολογίου pdf) είναι η κομβική οντότητα που συνδέεται με όλες τις άλλες Διαθέτει επίσης πληροφορία ώρας και ημέρας

Δοκιμάστε και εσείς! Χρησιμοποιήστε τη Διάλεξη ως κομβική οντότητα πληροφορίας του ωρολογίου προγράμματος Κάθε γραμμή του πίνακα θα είναι εκφράζει μια τέτοια οντότητα (διάλεξη) Και η υπόλοιπη πληροφορία θα τοποθετηθεί στις στήλες, ως ιδιότητες κάθε διάλεξης Προσοχή! το ζητούμενο δεν είναι να αναπαράγετε τον πίνακα του ωρολογίου προγράμματος ως έχει!

Μοντέλο και Μορφή Αποθήκευσης Η μορφή πίνακα είναι ένα μοντέλο οργάνωσης δεδομένων (data model) Προσδιορίζει τον τρόπο δόμησης της πληροφορίας Η δομημένη πληροφορία όμως Πρέπει να αποθηκευτεί ως ακολουθία bytes Και να μεταδοθεί μεταξύ παραγωγού και καταναλωτή Συνεπώς, πέρα από το μοντέλο των δεδομένων, είναι απαραίτητο ένα μορφότυπο σειριοποίησης (serialization format) των δεδομένων

Η μορφή αποθήκευσης CSV Comma Separated Values Ένα..μη πρότυπο πρότυπο (τουλάχιστον μέχρι πρόσφατα) Με πολλές διαλέκτους (σχεδόν κάθε εφαρμογή έχει τη δική της!) Για εξαγωγή-εισαγωγή μεγάλων σετ δεδομένων σε μορφή πίνακα από-σε βάσεις δεδομένων Έλεγχος Ιδιοτήτων: Ανοικτό πρότυπο: ΝΑΙ Χρήση στο Web: ΝΑΙ (αν και όχι τόσο συχνά) Ευκολία προγραμματισμού: ΝΑΙ (βιβλιοθήκες για πολλές γλώσσες) Ρητά μεταδεδομένα: ΟΧΙ (προαιρετικά, ονόματα στηλών στην πρώτη γραμμη)

Δοκιμάστε και εσείς! Βήμα 1 ο : Αποθηκεύστε τον πίνακα που φτιάξατε προηγουμένως σε μορφή csv μέσω της εφαρμογής spreadsheet Βήμα 2 ο : Γράψτε πρόγραμμα Python που διαβάζει το αρχείο csv και μπορεί να απαντήσει σε κάθε ένα από τα: Τι διδάσκεται την ώρα/μέρα Χ στην αίθουσα Υ; Ποιες μέρες διδάσκει ο Χ το μάθημα Υ; Τι μαθήματα έχει σήμερα το εξάμηνο Χ; Ποιος διδάσκει την ημέρα Χ στην αίθουσα Υ; κ.ο.κ Στην επόμενη σελίδα: ανάγνωση CSV μέσω Python

Python και ανάγνωση αρχείου CSV import csv # open csv file for reading ifp = open('test.csv','r',newline='',encoding='utf-8') # create csv reader object ir = csv.reader(ifp) # defaults to excel 'dialect' # read first row (headers) hdrow = next(ir) # iterate over table rows in csv file for row in ir: # each row is a list of strings # (table column values for this row) # do something with each row here... ifp.close()

Προσθήκη ρητού αναγνωριστικού (id) Οικείο σχήμα από τις σχεσιακές βάσεις... Κάθε βασική οντότητα διαθέτει μοναδικό αναγνωριστικό Θεωρήστε προς το παρόν ότι αυτός είναι ο μοναδικός πίνακας στον κόσμο! id Τύπος Αριθμός 1 Λεωφορεία 58.519 2 ΙΧ 2.062.880 3 Οδοποιητικά 7.642 4 Εκχιονιστικά 6 5 Ποδήλατα 8.540.192

Το μετα-μοντέλο EAV Μια νέα μεταμόρφωση: το μοντέλο Entity-Attribute-Value Μορφή τριάδας (triple): (Οντότητα, Ιδιότητα, Τιμή) Η Οντότητα συμβολίζεται με το ρητό αναγνωριστικό της Ως Ιδιότητες μπαίνουν οι (ρητές ή εννοούμενες) επικεφαλίδες των στηλών Ως Τιμές χρησιμοποιούνται τα περιεχόμενα των κελιών στις διασταυρώσεις γραμμών-στηλών Όλα τα μεταδεδομένα (ιδιότητες) δηλώνονται ρητά Ο εφιάλτης του σχεσιακού μοντέλου!!! Πλήρης απο-κανονικοποίηση (denormalization)

Παράδειγμα μετασχηματισμού Έστω ο πίνακας (δείχνεται μια γραμμή μόνο) id Engine Weight(kg) Tracks(mm) Boom(m)............... 38rb V8 60000 850 18...............

Δεδομένα κατά το μοντέλο EAV Η μία αυτή γραμμή παράγει από μόνη της τις εξής τριάδες Entity Attribute Value 38rb Engine V8 38rb Weight(kg) 60000 38rb Tracks(mm) 850 38rb Boom(m) 18 Κάθε άλλη γραμμή του αρχικού πίνακα θα μετασχηματιστεί επίσης στις αντίστοιχες τριάδες!

Δοκιμάστε και εσείς! Φτιάξτε πρόγραμμα Python Διαβάστε το csv αρχείο σας με το ωρολόγιο πρόγραμμα Για κάθε μία γραμμή αποθηκεύστε σε ένα νέο csv τις τριάδες που παράγονται από τη γραμμή αυτή Σύμφωνα με το μοντέλο EAV import csv # open file for csv writing ofp = open('out.csv','w',newline='',encoding='utf-8') # create csv writer (default format) ow = csv.writer(ofp) # write a row of values in csv file ow.writerow([ent,attr,val]) # close output file ofp.close()