ΕΡΓΑΣΙΑ : DATASET WEATHER ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ

Σχετικά έγγραφα
«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Εξόρυξη Γνώσης - το εργαλείο WEKA

Αποθήκες και Εξόρυξη Δεδομένων

(classification) 2 ΠΑ.ΠΕΙ. ΓιάννηςΘεοδωρίδης 4.1

Αποθήκες και Εξόρυξη Δεδομένων

14Ιαν Νοε

2o μέρος εργασίας (Αρχείο cpu)

Διάλεξη 06: Αλγόριθμοι εκμάθησης ΜέροςΒ Bayes, ΚανόνεςΣυσχέτισης, ΑδρανήςΕκμάθηση & Ομαδοποίηση

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη01Εισαγωγή

, και για h 0, . Άρα. Α2. Μια συνάρτηση f λέγεται γνησίως αύξουσα σε ένα διάστημα Δ του πεδίου ορισμού της, όταν για οποιαδήποτε σημεία x.

Κατηγοριοποίηση (Εποπτευόμενη μάθηση)

(training data) (test data)

Αποθήκες και Εξόρυξη Δεδομένων

ΔΕΟ 13 - Ποσοτικές Μέθοδοι: Επιχειρησιακά Μαθηματικά. Κεφάλαιο 1: Συναρτήσεις μιας μεταβλητής

F x h F x f x h f x g x h g x h h h. lim lim lim f x

2.3 Επιπλέον συναρτήσεις για δισδιάστατα γραφικά

Data Mining. Εισαγωγικά και Προηγµένα Θέµατα Εξόρυξης Γνώσης. Κατηγοριοποίηση (κεφ. 4)

Μονάδες 10 ΦΡΟΝΤΙΣΤΗΡΙΑ ΦΛΩΡΟΠΟΥΛΟΥ Σελίδα 1

Α4. Να χαρακτηρίσετε τις προτάσεις που ακολουθούν, γράφοντας στο τετράδιό σας δίπλα στο γράµµα που αντιστοιχεί σε κάθε πρόταση, τη λέξη Σωστό, αν η

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 30 ΜΑΪΟΥ 2014

ΜΕΤΑΒΟΛΕΣ-ΝΟΜΟΙ ΤΩΝ ΑΕΡΙΩΝ

> μεγαλύτερο <= μικρότερο ή ίσο < μικρότερο == ισότητα >= μεγαλύτερο ή ίσο!= διαφορετικό

Υπερπροσαρμογή (Overfitting) (1)

Αλγόριθμοι Μηχανικής Μάθησης σε Πολυεπεξεργαστικά Περιβάλλοντα

ΔΕΟ 13 - Ποσοτικές Μέθοδοι: Επιχειρησιακά Μαθηματικά. Κεφάλαιο 1: Συναρτήσεις μιας μεταβλητής

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΥΠΟΛΟΓΙΣΜΟΣ Εντολές επιλογής και αποφάσεων 1 ο Φύλλο Εργασιών Εισαγωγικές ασκήσεις για την εντολή if ΑΠΑΝΤΗΣΕΙΣ

ΕΝΔΕΙΚΤΙΚΕΣ ΛΥΣΕΙΣ ΔΙΑΓΩΝΙΣΜΑΤΟΣ ΜΑΪΟΣ 2018 ΜΑΘΗΜΑΤΙΚΑ (ΑΛΓΕΒΡΑ) Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΕΠΑΛ

Σχήµα 4.1: Εισαγωγή βρόγχου while-loop.

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΠΛΗΡΟΦΟΡΙΚΗ Ι (MATLAB) Ενότητα 5

3 ο Εργαστήριο Μεταβλητές, Τελεστές

ΘΕΜΑ Α ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ

ÖÑÏÍÔÉÓÔÇÑÉÏ ÈÅÌÅËÉÏ ÇÑÁÊËÅÉÏ ÊÑÇÔÇÓ

Δημιουργία τρισδιάστατου παιχνιδιού οδήγησης 1ο μέρος

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

Ημερομηνία: Τετάρτη 12 Απριλίου 2017 Διάρκεια Εξέτασης: 3 ώρες ΕΚΦΩΝΗΣΕΙΣ

4 ο Εργαστήριο Τυχαίοι Αριθμοί, Μεταβλητές Συστήματος

ΛΥΣΕΙΣ ΕΞΕΤΑΣΗΣ ΣΤΟ ΜΑΘΗΜΑ «ΤΕΧΝΟΛΟΓΙΑ ΜΕΤΡΗΣΕΩΝ» ΗΜΕΡΟΜΗΝΙΑ: 28/01/2013

Ασκήσεις επανάληψης στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου, χ. Έτος του Μανώλη Ψαρρά Άσκηση 1 η

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 05: Αλγόριθμοι εκμάθησης Μέρος Α Δένδρα&Κανόνες

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Τεχνητή Νοημοσύνη ΙΙ. Ενότητα : Μηχανική Μάθηση. Σγάρμπας Κυριάκος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών

Ευφυής Προγραμματισμός

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΘΕΜΑΤΑ ΚΑΙ ΑΠΑΝΤΗΣΕΙΣ ΠΑΝΕΛΛΑΔΙΚΩΝ ΕΞΕΤΑΣΕΩΝ 2014

1. Κατασκευάστε ένα διάνυσμα με στοιχεία τους ζυγούς αριθμούς μεταξύ του 31 και 75

Εισαγωγή στους Υπολογιστές

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

ΑΝΑΣΚΟΠΗΣΗ. Αποθήκες και Εξόρυξη Δεδομένων

Λύσεις των θεμάτων ΔΕΥΤΕΡΑ 19 ΙΟΥΝΙΟΥ 2017 ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΕΠΑΛΗΘΕΥΣΗ (VERIFICATION) ΚΑΙ ΕΓΚΥΡΟΠΟΙΗΣΗ (VALIDATION) ΒΚ

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΝΕΟ ΣΥΣΤΗΜΑ Γ ΗΜΕΡΗΣΙΩΝ

ΟΜΟΣΠΟΝΔΙΑ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑΔΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2019 B ΦΑΣΗ ΜΑΘΗΜΑΤΙΚΑ / ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

x. Αν ισχύει ( ) ( )

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΩΝ & ΤΑΞΗΣ ΕΣΠΕΡΙΝΩΝ ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΠΑΝΕΛΛΑ ΙΚΕΣ ΕΞΕΤΑΣΕΙΣ HMEΡΗΣΙΩΝ & ΕΣΠΕΡΙΝΩΝ ΕΠΑΓΓΕΛΜΑΤΙΚΩΝ ΛΥΚΕΙΩΝ

Συστήματα Βιομηχανικών Διεργασιών 6ο εξάμηνο

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Ευφυής Προγραμματισμός

ΦΥΛΛΟ ΕΞΟΙΚΕΙΩΣΗΣ ΜΕ ΤΟ ΕΙΚΟΝΙΚΟ ΕΡΓΑΣΤΗΡΙΟ

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 3 ΣΕΛΙΔΕΣ

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Επαναληπτικές ασκήσεις

ΑΝΑΠΑΡΑΣΤΑΣΗ ΔΕΔΟΜΕΝΩΝ. Η αγαπημένη γεύση παγωτού των παιδιών

Συστήματα Αναμονής (Queuing Systems)

P(A ) = 1 P(A). Μονάδες 7

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 6 ΣΕΛΙΔΕΣ

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ

Σειρά Προβλημάτων 1 Λύσεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών. HY-217: Πιθανότητες -Χειµερινό Εξάµηνο 2012 ιδάσκων : Π. Τσακαλίδης. Λύσεις : Τέταρτη Σειρά Ασκήσεων

ΣΤΕΡΕΟΣΚΟΠΙΚΕΣ ΕΙΚΟΝΕΣ

ΓΡΑΠΤΕΣ ΠΡΟΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΙΟΥΝΙΟΥ

ΕΡΓΑΣΤΗΡΙΟ ΙV. ΤΜΗΜΑ ΙΕΘΝΟΥΣ ΕΜΠΟΡΙΟΥ ΜΑΘΗΜΑΤΙΚΑ ΟΙΚΟΝΟΜΙΚΗΣ ΑΝΑΛΥΣΗΣ Ι Μονοβασίλης Θεόδωρος

MATHematics.mousoulides.com

Αποθήκες και Εξόρυξη Δεδομένων

Π Α Ν Ε Λ Λ Η Ν Ι Ε Σ Μ Α Θ Η Μ Α Τ Ι Κ Α K A I Σ Τ Ο Ι Χ Ε Ι Α Σ Τ Α Τ Ι Σ Τ Ι Κ Η Σ

ΜΑΘΗΜΑ 7: ΠΕΡΙΣΤΡΟΦΗ (συνέχεια)

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΤΕΣΣΕΡΙΣ (4)

Εργαστήριο 4. Άóêçóç 1. Άóêçóç 2. Χημικοί. Plot Sec x, x, 2 π, 2π. p1 Plot Abs 1 Abs x, x, 3, 3. 1 In[3]:= f x_ : 2 π. p2 Plot f x, x, 3,

ΖΗΤΗΜ Α 1 Ο. Α1. Τι είναι το ραβδόγραµµα και πότε χρησιµοποιείται; 5) Α2. Σε τι διακρίνονται οι µεταβλητές και τι είναι οι τιµές τους;

5.3 ΛΟΓΑΡΙΘΜΙΚΗ ΣΥΝΑΡΤΗΣΗ. x, τότε ισχύει f(4) f(2). x τότε ισχύει. αν 1.

Συστήματα Γνώσης. Πρακτικό Κομμάτι Μαθήματος Πρόγραμμα Πέτρα Ψαλίδι - Χαρτί. Νίκος Βασιλειάδης, Αναπλ. Καθηγητής Τμήμα Πληροφορικής

Εισαγωγή στη Στατιστική

Πολυδιάστατα Δεδομένα

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ. Θέματα: - Ερμηνεία και κατασκευή γραφικών παραστάσεων - Ερμηνεία πινάκων - Πιθανότητες

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

3. Τρισδιάστατα γραφικά

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΤΑΞΗ

Transcript:

ΕΡΓΑΣΙΑ : DATASET WEATHER ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ Το dataset weather περιέχει 4 μεταβλητές (outlook, temperature, humidity, windy) και 14 καταχωρήσεις για το καθένα από αυτά. Με βάση αυτές εξετάζεται το γεγονός για το αν θα γίνει το παιχνίδι ή όχι. Η μεταβλητή outlook μπορεί να είναι sunny, overcast, rainy, η μεταβλητή windy μπορεί να είναι true ή false, η μεταβλητή temperature και η μεταβλητή humidity είναι ποσοτικές μεταβλητές (numerical). Όλες αυτές οι μεταβλητές υποδεικνύουν αν θα γίνει το παιχνίδι (play) που μπορεί να πάρει yes ή no. Με βάση τα δεδομένα μπορεί να προκύψουν κανόνες για το αν θα γίνει το παιχνίδι ή όχι π.χ. if outlook=sunny and humidity>83 then play=no. Παρακάτω ακολουθούν διάφορα παράθυρα που προέκυψαν με την βοήθεια του weka: Σχήμα 1 Στο παραπάνω σχήμα παρατηρούμε ότι για το outlook έχουμε 5 sunny ( οι 2 είναι yes και οι 3 no ), 4 overcast (όλες είναι yes) και 5 runny ( 3 είναι yes και οι 2 no ) καταχωρήσεις. Το μπλέ χρώμα είναι η καταχώρηση yes και το κόκκινο χρώμα η κατά χώρηση no για το αν θα γίνει το παιχνίδι.

Σχήμα 2 Όσο αφορά την θερμοκρασία (temperature) παρατηρούμε ότι στο διάστημα από 64-74.5 υπάρχουν 8 μετρήσεις-καταχωρήσεις από τις οποίες οι 5 είναι yes (θα γίνει το παιχνίδι)και οι 3 no (δεν θα γίνει το παιχνίδι). Αντίστοιχα στο διάστημα 74.5-85 υπάρχουν 6 μετρήσεις-καταχωρήσεις από τις οποίες οι 4 είναι yes (θα γίνει το παιχνίδι)και οι 2 no (δεν θα γίνει το παιχνίδι). Το μπλέ χρώμα είναι η καταχώρηση yes και το κόκκινο χρώμα η κατά χώρηση no για το αν θα γίνει το παιχνίδι. Σχήμα 3

Όσο αφορά την υγρασία (humidity) παρατηρούμε ότι στο διάστημα από 65-80.5 υπάρχουν 7 μετρήσεις-καταχωρήσεις από τις οποίες οι 6 είναι yes (θα γίνει το παιχνίδι) και οι 1 no (δεν θα γίνει το παιχνίδι). Αντίστοιχα στο διάστημα 80.5-96 υπάρχουν 7 μετρήσεις-καταχωρήσεις από τις οποίες οι 4 είναι yes (θα γίνει το παιχνίδι)και οι 3 no (δεν θα γίνει το παιχνίδι). Για το outlook έχουμε 5 sunny ( οι 2 είναι yes και οι 3 no ), 4 overcast (όλες είναι yes) και 5 runny ( 3 είναι yes και οι 2 no ) καταχωρήσεις. Το μπλέ χρώμα είναι η καταχώρηση yes και το κόκκινο χρώμα η κατά χώρηση no για το αν θα γίνει το παιχνίδι.ο Πίνακας 1 μας παρουσιάζει επιπλέον το είδος της μεταβλητής (Type:Numeric), αν υπάρχουν ελλειπούσες τιμές (missing) καθώς και την μέγιστη και την ελάχιστη τιμή. Την μέση τιμή και την τυπική απόκλιση των μετρήσεων της συγκεκριμένης ματαβλητής. Όμοια και για την μεταβλητή θερμοκρασίας. Επίσης, το unique είναι τα outliers που έχουμε στην συγκεκριμένη μεταβλητή. Πίνακας 1

Σχήμα 4 Αντίστοιχο του Σχήματος 1 είναι το Σχήμα 4. παρατηρούμε ότι για το windy έχουμε 8 καταχωρήσεις FALSE ( 6 yes και 2 no)και 6 TRUE (3 yesκαι 3 no).το μπλέ χρώμα είναι η καταχώρηση yes και το κόκκινο χρώμα η κατά χώρηση no για το αν θα γίνει το παιχνίδι ή όχι. Ο παρακάτω πίνακας μας δείχνει αν υπάρχουν ελλειπούσες τιμές (missing) στις μετρήσεις τις συγκεκριμένης ματαβλητής windy. Συγκεκριμένα δεν υπάρχουν. Επίσης αναφέρει το τύπο της ματαβλητής (Type: Nominal) καθώς και τον αροθμό των TRUE και FALSE της ματαβλητής. Όμοια και για την μεταβλητή outlook. Εδώ τα outliers δεν υπάρχουν. Πίνακας 2 Σχήμα 5 Το παραπάνω σχήμα παρουσιάζει ότι από τις 14 καταχωρήσεις των 4 μεταβλητών που έγιναν στις 9 θα πραγματοποιηθεί το παιχνίδι και στις 5 όχι. Το μπλέ χρώμα είναι η καταχώρηση yes και το κόκκινο χρώμα η κατά χώρηση no για το αν θα γίνει το παιχνίδι ή όχι.

Plot 1 Η παραπάνω γραφική παράσταση μας δείχνει ότι στην περίπτωση της μεταβλητής outlook όπου έχουν γίνει οι εξής καταχωρήσεις: 5 sunny ( οι 2 είναι yes και οι 3 no ), 4 overcast (όλες είναι yes) και 5 runny ( 3 είναι yes και οι 2 no ) καταχωρήσεις. Το μπλέ χρώμα είναι η καταχώρηση yes και το κόκκινο χρώμα η κατά χώρηση no για το αν θα γίνει το παιχνίδι ή όχι. Όμοιες γραφικές παραστάσεις προκύπτουν και για τις υπόλοιπες μεταβλητές. Παρακάυω ακολουθεί μια γραφική παράσταση της θερμοκρασίας με το παιχνίδι αν θα γίνει ή όχι. Ανάλογα με το τιμή έχει η θερμοκρασία το παιχνίδι θα γίνει ή όχι.

Plot 2