ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 03: Προεπεξεργασία & Επιλογή Δεδομένων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 03: Προεπεξεργασία & Επιλογή Δεδομένων"

Transcript

1 ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας Διάλεξη 03: Προεπεξεργασία & Επιλογή Δεδομένων

2 Προεπεξεργασία δεδομένων Ο μετασχηματισμός των δεδομένων σε μορφή κατάλληλη και αποδοτική για την επιλεγμένη (?) μέθοδο μάθησης Σύνολο τεχνασμάτων που εφαρμόζονται με κύριο στόχο την αύξηση του βαθμού αξιοπιστίας Κάποιες φορές λειτουργούν, κάποιες όχι, και, μέχρι σήμερα, είναι δύσκολο να γνωρίζει κανείς εκ των προτέρων την αποτελεσματικότητά τους Καθώςοπλέοναξιόπιστοςοδηγόςείναιημέθοδος δοκιμής & σφάλματος ( trial & error ), ηγνώσηκαι κατανόηση των τεχνασμάτων αυτών είναι εξαιρετικά σημαντική 2

3 Τεχνοτροπίες προεπεξεργασίας δεδομένων Επιλογή χαρακτηριστικών (attributes) Διακριτοποίηση χαρακτηριστικών Μετασχηματισμός δεδομένων Καθαρισμός δεδομένων 3

4 Επιλογή χαρακτηριστικών Στις περισσότερες εφαρμογές, ο αριθμός των χαρακτηριστικών είναι υπερβολικά μεγάλος για τον αποτελεσματικό χειρισμό τους από τα σχήματα εκμάθησης Τα περισσότερα χαρακτηριστικά συχνά η συντριπτική πλειοψηφία τους είναι ευκρινώς μη συσχετιζόμενα ή περιττά. Κατά συνέπεια, πρέπει να επιλεγεί υποσύνολο των δεδομένων προς χρήση στη διαδικασία εκμάθησης Οι μέθοδοι εκμάθησης εκ φύσεως επιτελούν τη διαδικασία επιλογής των κατάλληλων χαρακτηριστικών και απόρριψης των υπολοίπων Ωστόσο η αποδοτικότητά τους μπορεί συχνά να βελτιωθεί μέσω της προεπιλογής 4

5 Διακριτοποίηση χαρακτηριστικών Απολύτως αναγκαία στην περίπτωση που κάποια χαρακτηριστικά είναι αριθμητικά αλλά η επιλεγμένη μέθοδος εκμάθησης μπορεί να χειριστεί μόνο ρητά (categorical) χαρακτηριστικά Ακόμα και οι μέθοδοι που μπορούν να χειριστούν αριθμητικά χαρακτηριστικά πολλές φορές παράγουν καλύτερα αποτελέσματα ή λειτουργούν ταχύτερα αν τα χαρακτηριστικά έχουν διακριτοποιηθεί Το αντίστροφο πρόβλημα, στο οποίο κατηγορικά χαρακτηριστικά μετατρέπονται σε αριθμητικά, προκύπτει επίσης, αν και λιγότερο συχνά 5

6 Μετασχηματισμός δεδομένων Ημορφήτωνδεδομένων, είτεηφύσητουαλγορίθμου εκμάθησης, συχνά υποδεικνύουν διάφορους μετασχηματισμούς των δεδομένων Αναγκαίοι για την ανάδειξη ιδιαιτεροτήτων ή και διαφορετικών γωνιών θέασης του συνόλου των δεδομένων Πλήθος τεχνικών Μαθηματικοί μετασχηματισμοί Βασισμένοι στη γνώση πεδίου Λογικοί μετασχηματισμοί Αλλαγή δομής / μορφής δεδομένων 6

7 Καθαρισμός δεδομένων Τα ακάθαρτα δεδομένα συνιστούν σημαντικό πρόβλημα Η αναγκαιότητα εξοικείωσης με τα δεδομένα έχει ήδη υποδειχθεί: Κατανόηση περιεχομένου χαρακτηριστικών, συμβάσεων κωδικοποίησης, σημαντικότητας άγνωστων ή και επαναλαμβανόμενων τιμών, θορύβου μέτρησης, λαθών καταγραφής, συστηματικών λαθών Απλές μέθοδοι οπτικοποίησης συχνά βοηθούν κατά πολύ Αυτοματοποιημένες μέθοδοι καθαρισμού δεδομένων, εντοπισμού τιμών προς εξαίρεση και ανωμαλιών 7

8 Επιλογή χαρακτηριστικών Οι περισσότεροι αλγόριθμοι εκμάθησης έχουν σχεδιαστεί ώστε να επιλέγουν τα πλέον κατάλληλα χαρακτηριστικά για τη διαμόρφωση των αποφάσεών τους Η ύπαρξη περισσότερων χαρακτηριστικών επομένως οδηγεί κατά τη θεωρία σε περισσότερο αποδοτική εκπαίδευση Ωστόσο: "Ποια η διαφορά μεταξύ θεωρίας και πράξης; Δεν υπάρχει διαφορά - στη θεωρία. Αλλά στην πράξη υπάρχει." Στην πράξη, ηπροσθήκημησχετικώνχαρακτηριστικών συχνά συγχύζει τα συστήματα μηχανικής μάθησης 8

9 Επιλογή χαρακτηριστικών Βέλτιστη μέθοδος επιλογής: χειροκίνητη, βασισμένη σε βαθιά κατανόηση του προβλήματος και των εκφραζόμενων από τα χαρακτηριστικά Αυτοματοποιημένες μέθοδοι: επίσης χρήσιμες Η μείωση των διαστάσεων των δεδομένων Βελτιώνει την απόδοση των αλγορίθμων εκπαίδευσης Παρέχει μία περισσότερο συμπαγή και κατανοητή απεικόνιση της αντίληψης στόχου, εστιάζοντας στις συναφείς μεταβλητές 9

10 Επιλογή χαρακτηριστικών Δύο μέθοδοι επιλογής υποσυνόλου χαρακτηριστικών Μέθοδος διήθησης (filter): ανεξάρτητη αποτίμηση, βασισμένη στα γενικά χαρακτηριστικά των δεδομένων Μέθοδος ενσωμάτωσης (wrapper): προσκόλληση της διαδικασίας επιλογής στη διαδικασία εκπαίδευσης και αποτίμηση του υποσυνόλου με βάση την τελική απόδοση του αλγορίθμου εκμάθησης Δεν υπάρχει οικουμενικά αποδεκτό μέτρο της σχετικότητας ενός χαρακτηριστικού, γεγονός που καθιστά την επιλογή υποσυνόλου δύσκολη διαδικασία 10

11 Μέθοδος διήθησης Εύρεση υποσυνόλου χαρακτηριστικών επαρκούς για το διαχωρισμό όλων των υποδειγμάτων Επιλογή μικρότερου δυνατού συνόλου χαρακτηριστικών που ικανοποιεί την απαίτηση αυτή (μέσω εξαντλητικής (exhaustive) αναζήτησης) Χρήση διαφορετικού αλγορίθμου εκμάθησης (για παράδειγμα C4.5, 1R) για επιλογή χαρακτηριστικών Για παράδειγμα, μπορεί να εφαρμοστεί ένα αλγόριθμος δένδρου απόφασης στο σύνολο δεδομένων και στη συνέχεια να επιλεγούν τα χαρακτηριστικά εκείνα που ενυπάρχουν στο δένδρο και μόνο αυτά. Μάθηση βασισμένη στα υποδείγματα για απόδοση βαρύτητας στα χαρακτηριστικά (Instance based Learning) Επίσης εφαρμόσιμη, ωστόσο αδυνατεί να υποδείξει τα περιττά χαρακτηριστικά 11

12 Αναζήτηση στο χώρο των χαρακτηριστικών Αριθμός των υποσυνόλων χαρακτηριστικών εκθετικός ως προς τον αριθμό των χαρακτηριστικών εξαντλητική αναζήτηση: μη πρακτική & κοστοβόρα Συνήθεις προσεγγίσεις: άπληστη (greedy) αναζήτηση Επιλογή προς τα εμπρός (forward selection) Απαλοιφή προς τα πίσω (backward elimination) Περισσότερο εξελιγμένες στρατηγικές: Αναζήτηση διπλής κατεύθυνσης (bidirectional) Αναζήτηση καλύτερου πρώτου (best-first): δύναται να εντοπίσει τη βέλτιστη λύση Αναζήτηση δέσμης (beam): απλοποίηση της αναζήτησης καλύτερου πρώτου Γενετικοί αλγόριθμοι (genetic algorithms) 12

13 Παράδειγμα: Υποσύνολα χαρακτηριστικών (δεδομένα καιρού) 13

14 Μέθοδος ενσωμάτωσης Ενσωμάτωση της διαδικασίας επιλογής στην εκμάθηση Κριτήριο αποτίμησης: απόδοση διασταυρωμένης επικύρωσης (cross-validation) Δαπάνη χρόνου Άπληστη αναζήτηση, k χαρακτηριστικά k 2 χρόνος Πρότερη κατάταξη χαρακτηριστικών γραμμική στο k Εξαντλητική αναζήτηση 2 k time RaceSearch, Schemata RankSearch Τελικό κριτή συνιστά το ύψος του σφάλματος σε νέα δεδομένα 14

15 Διακριτοποίηση χαρακτηριστικών Μερικοί αλγόριθμοι ταξινόμησης και ομαδοποίησης χειρίζονται μόνο ονομαστικά χαρακτηριστικά και δεν μπορούν να χειριστούν όσα βρίσκονται σε αριθμητική μορφή Η χρήση των αριθμητικών χαρακτηριστικών προϋποθέτει την προηγούμενη διακριτοποίησή τους σε ξεχωριστά υποσύνολα τιμών Ακόμα και οι αλγόριθμοι μάθησης που μπορούν να χειριστούν αριθμητικά χαρακτηριστικά, συχνά λειτουργούν πολύ πιο γρήγορα όταν χρησιμοποιούνται μόνο με διακριτά χαρακτηριστικά Επομένως, ποιος ο βέλτιστος τρόπος διακριτοποίησης των αριθμητικών χαρακτηριστικών πριν τη διαδικασία εκμάθησης; Για παράδειγμα, εφαρμογή αλγορίθμου σε Διακριτοποιημένο σε k τιμές χαρακτηριστικό ή σε k 1 δυαδικά χαρακτηριστικά που κωδικοποιούν τα σημεία τομής 15

16 Διακριτοποίηση χωρίς επίβλεψη Διακρίβωση διαστημάτων χωρίς γνώση της τάξης στην οποία ανήκει το υπόδειγμα Μοναδική λύση κατά την ομαδοποίηση Δύο προσεγγίσεις: Διαστήματα σταθερού εύρους (equal-interval binning) Διαστήματα σταθερής συχνότητας (equal-frequency binning) (καλείται επίσης εξισορρόπηση ιστογράμματος (histogram equalization)) Υποδεέστερης αξιοπιστίας έναντι των τεχνικών με επίβλεψη σε εργασίες ταξινόμησης 16

17 Διακριτοποίηση με επίβλεψη Μέθοδος εντροπίας Θεωρείται ως η πλέον αποδοτική & αξιόπιστη Κατασκευή δένδρου απόφασης για τη διακριτοποίηση του χαρακτηριστικού Χρήση του μεγέθους της εντροπίας ως κριτήριο διαχωρισμού των τιμών του αρχικού συνόλου Αρχήελαχίστουμήκουςπεριγραφής(minimum description length (MDL)) ως κριτήριο διακοπής 17

18 Παράδειγμα: Διακριτοποίηση χαρακτηριστικού θερμοκρασίας Temperature Play Yes No Yes Yes Yes No No Yes Yes Yes No Yes Yes No Temperature < 71,5 διαχωρισμός του εύρους σε 4 yes & 2 no / 5 yes & 3 no Μέτρο κέρδους πληροφορίας βασισμένο στην εντροπία n info = p()log i 2( p()) i i= 1 info([4,2]) = -(4/(4+2))*log 2 (4) (2/(4+2))* log 2 (2) info([4, 2],[5,3])=(6/14)*info([4, 2])+(8/14)* info([5, 3])= bits 18

19 Παράδειγμα: Διακριτοποίηση χαρακτηριστικού θερμοκρασίας 19

20 Σχέση αρχής ελαχίστου μήκους περιγραφής Για την εφαρμογή της αρχής MDL : Λαμβάνονται υπ όψιν Σημείο τομής (log 2 [N 1] bits) Κατανομή τάξεων σε κάθε υποσύνολο Σύγκριση απαιτούμενου μήκους περιγραφής πριν και μετά την προσθήκη σημείου τομής N υποδείγματα Αρχικό σύνολο: k τάξεις, εντροπία E Πρώτο υποσύνολο: k 1 τάξεις, εντροπία E 1 Δεύτερο υποσύνολο: k 2 τάξεις, εντροπία E 2 k log 2( N 1) log 2(3 2) ke+ k1e1+ k2e2 info > + N N Συνιστά τη μη διακριτοποίηση της θερμοκρασίας 20

21 Διακριτοποίηση με επίβλεψη: άλλες μέθοδοι Αντικατάσταση διαδικασίας από πάνω προς τα κάτω (top-down) με προσέγγιση από κάτω προς τα πάνω (bottom-up) Αντικατάσταση αρχής MDL με τεστ Χ 2 Χρήση δυναμικού προγραμματισμού για την εύρεση βέλτιστου διαχωρισμού σε k-διαστήματα με βάση δοσμένο κριτήριο Υπολογιστικό κόστος με κριτήριο εντροπίας Ν 2 χρόνος Υπολογιστικό κόστος με κριτήριο σφάλματος Ν χρόνος 21

22 Σφάλμα ή εντροπία; Ερώτηση: Είναι δυνατόν, υποθέτοντας βέλτιστη διακριτοποίηση, δύο γειτονικά διαστήματα να περιέχουν υποδείγματα που ανήκουν κατά πλειοψηφία στην ίδια τάξη? Προφανής απάντηση: Όχι. Γιατί, εάν ναι, Συγχώνευση των δύο Απελευθέρωση ενός διαστήματος Χρήση του αλλού (προσέγγιση διακριτοποίησης με βάση κριτήριο σφάλματος) Σωστή απάντηση: Ναι. (η διακριτοποίηση με κριτήριο εντροπίας μπορεί να το υλοποιήσει) 22

23 Σφάλμα ή εντροπία; Πρόβλημα δύο τάξεων, δύο χαρακτηριστικών Αληθές μοντέλο Βέλτιστη διακριτοποίηση των a1, a2 Η μέθοδος εντροπίας εντοπίζει μεταβολές στην κατανομή των τάξεων 23

24 Αντίστροφο πρόβλημα διακριτοποίησης Μετατροπή ονομαστικών τιμών σε αριθμητικές 1.Χαρακτηριστικό δείκτης (indicator) Δεν κάνει χρήση πληροφορίας περί κατάταξης 2.Κωδικοποίηση ονομαστικού χαρακτηριστικού μέσω κατάταξης σε δυαδικά χαρακτηριστικά Δύναται να χρησιμοποιηθεί από κάθε διατεταγμένο χαρακτηριστικό Προτιμητέα έναντι μετατροπής σε ακέραιο (ηοποία προυποθέτει βαθμονόμηση Γενικά: κωδικοποίηση υποσυνόλου των χαρακτηριστικών ως δυαδικά 24

25 Μετασχηματισμός δεδομένων Ένα πρόβλημα εξόρυξης γνώσης από δεδομένα σπάνια περιορίζεται στην απλή εφαρμογή ενός αλγορίθμου σε ένα σύνολο δεδομένων Μέθοδοι μετασχηματισμού των δεδομένων, όπως οι περί διακριτοποίησης, υπάρχουν διαθέσιμοι σε μεγάλο πλήθος και χρησιμοποιούνται σχεδόν σε κάθε περίπτωση Κάθε πρόβλημα είναι διαφορετικό Απαιτείται κατανόηση των δεδομένων Επίσης εξέτασή τους από διαφορετικές γωνίες θέασης με δημιουργικό τρόπο ώστε να φθάσει κανείς στην κατάλληλη οπτική Ο μετασχηματισμός σε διάφορες μορφές συμβάλλει προς αυτή την κατεύθυνση 25

26 Γενικά περί μετασχηματισμών Συχνά η φύση των δεδομένων υποδεικνύει μαθηματικούς μετασχηματισμούς Για παράδειγμα, αφαίρεση ημερομηνιών για εύρεση ηλικίας Μετασχηματισμοί πιθανά να υποδεικνύονται επίσης από γνωστές ιδιότητες του αλγορίθμου εκμάθησης Για παράδειγμα, κανονικοποίηση για βελτίωση απόδοσης Δεν είναι απαραίτητα μαθηματικοί, μπορούν για παράδειγμα να αποτυπώνουν την κοινή λογική ή τη γνώση πεδίου Για παράδειγμα, ημερομηνίες αργιών, ατομικοί αριθμοί χημικών στοιχείων 26

27 Είδη μετασχηματισμού Συγχώνευση ονομαστικών χαρακτηριστικών Προσθήκη νέων χαρακτηριστικών Προσθήκη θορύβου στα δεδομένα (για παράδειγμα για έλεγχο αξιοπιστίας) Μεταλλαγή συγκεκριμένου ποσοστού Σύγχυση δεδομένων (obfuscate) Τυχαιοποίηση σειράς, παραγωγή τυχαίου υποσυνόλου Απομάκρυνση υποδειγμάτων (με ειδικά χαρακτηριστικά ή όχι) Απομάκρυνση τιμών προς εξαίρεση (outliers) Μετατροπή αραιών (sparse) δεδομένων σε μη αραιά και αντιστρόφως Μετασχηματισμοί κειμένου & χρονοσειρών 27

28 Ανάλυση Κύριων Συνιστωσών (Principal Components Analysis) Σύνολο δεδομένων με k αριθμητικά χαρακτηριστικά Ένανέφοςσημείωνσεέναχώροk-διαστάσεων τα αστέρια στον ουρανό, ένα σμήνος μελισσών στο χώρο, ένα διάγραμμα διασποράς στο χαρτί. Τα χαρακτηριστικά αντιπροσωπεύουν τις συντεταγμένες. Ηεπιλογήαξόνων το σύστημα συντεταγμένων είναι αυθαίρετη Η απεικόνιση του σμήνους είναι εξίσου καλή για κάθε επιλογή αξόνων Στην εξόρυξη γνώσης από δεδομένα, συχνά υπάρχει προτιμώμενο σύστημα συντεταγμένων Καθορίζεται όχι από κάποια εξωτερική παραδοχή αλλά από τα ίδιαταδεδομένα 28

29 Ανάλυση Κύριων Συνιστωσών Για κάθε επιλογή συστήματος συντεταγμένων: το νέφος των σημείων χαρακτηρίζεται από συγκεκριμένη διακύμανση (variance) σε κάθε κατεύθυνση δηλώνει τη διασπορά γύρω από τη μέση τιμή σε αυτή την κατεύθυνση Υπό τη συνθήκη ότι το σύστημα συντεταγμένων είναι ορθογώνιο, η συνολική διακύμανση είναι σταθερή. PCA: επέλεξε το σύστημα συντεταγμένων ως εξής Τοποθέτησε τον πρώτο άξονα στην κατεύθυνση μέγιστης διακύμανσης Επέλεξε τον δεύτερο άξονα κάθετα στον πρώτο, μεγιστοποιώντας πάλι τη διακύμανση Με μαθηματική διατύπωση: βρες τα ιδιοδιανύσματα του διαγωνοποιημένου πίνακα συνδιακύμανσης επι των αρχικών συντεταγμένων. αυτά αποτελούν του άξονες του μετασχηματισμένου χώρου και οι ιδιοτιμές αποδίδουν τη διακύμανση κατά μήκος των αξόνων. 29

30 Ανάλυση Κύριων Συνιστωσών Παράδειγμα 30

31 Ανάλυση Κύριων Συνιστωσών Η διακύμανση ανά άξονα (συνιστώσα / component) εκφράζεται ως % επί του (σταθερού) συνόλου Για παράδειγμα, η πρώτη συνιστώσα ερμηνεύει το χ% της συνολικής διασποράς Μπορεί κανείς να επιλέξει προς χρήση τις πιο σημαντικές (κύριες / principal) συνιστώσες και μόνο αυτές- και να αποβάλλει τις υπόλοιπες Η μέθοδος χρησιμοποιείται συχνά πριν την εφαρμογή των αλγορίθμων εκπαίδευσης για τον καθαρισμό των δεδομένων και την αναπαραγωγή των χαρακτηριστικών Σημείωση: η κλίμακα των χαρακτηριστικών επηρεάζει το αποτέλεσμα της PCA Κοινή πρακτική αποτελεί η κανονικοποίηση όλων των χαρακτηριστικών (μέση τιμή: 0, τυπική απόκλιση: 1) πριν την εφαρμογή της μεθόδου 31

32 Τυχαίες προβολές Υπολογιστικό κόστος PCA (#διαστάσεων) 3 χρόνος Απλούστερη εναλλακτική: τυχαία προβολή των δεδομένων σε υποχώρο προκαθορισμένου αριθμού διαστάσεων Όπως είναι αναμενόμενο, οι τυχαίες προβολές έχουν χαμηλότερη απόδοση της PCA Ωστόσο, πειραματικά αποτελέσματα υποδεικνύουν πως η απόκλιση δεν είναι πολύ μεγάλη και τείνει να μειωθεί καθώς ο αριθμός των διαστάσεων αυξάνεται 32

33 Μετατροπή κειμένου σε χαρακτηριστικά Χαρακτηριστικά που περιέχουν συμβολοσειρές (strings) κειμένου Συχνά οι τιμές τους αποτελούν ολόκληρο κείμενο Πώς αντιμετωπίζονται; Αποσύνθεση του κειμένου σε χαρακτηριστικά συμβολοσειρών παραγράφους, προτάσεις, φράσεις ή συνήθως λέξεις Ημετατροπήσελέξεις(tokenization) είναι πολυσύνθετη Αριθμοί, σύνταξη, στίξη, διαχωριστής πεδίου (delimeter), γλωσσικές συμβάσεις, συχνέςήμηλέξεις, Οι συχνότητες fij της λέξης i στο έγγραφο j μπορούν να μετασχηματιστούν με διάφορους τρόπους log (1 + fij). TF x IDF term frequency times inverse document frequency. 33

34 Μετατροπή χρονοσειρών σε χαρακτηριστικά Σε δεδομένα χρονοσειρών κάθε υπόδειγμα αντιπροσωπεύει διαφορετική χρονική στιγμή τα χαρακτηριστικά δίδουν τιμές συσχετιζόμενες με αυτό το στιγμιότυπο για παράδειγμα πρόβλεψη καιρού, πρόβλεψη τιμών μετοχής Πολύ συνήθης είναι η αντικατάσταση των τιμών ενός χαρακτηριστικού με τη διαφορά (Δ) τους με αυτές ενός χρονικά προηγούμενου υποδείγματος Σε κάποιες περιπτώσεις, τα υποδείγματα δε λαμβάνονται περιοδικά, γι αυτό και συνοδεύονται από χαρακτηριστικό ένδειξης χρόνου (timestamp) Ηδιαφοράτωνtimestamps αποτελεί το χρονικό βήμα του υποδείγματος Σε άλλες περιπτώσεις, κάθε χαρακτηριστικό αφορά διαφορετικό στιγμιότυπο, οπότε η χρονοσειρά ουσιαστικά προσδιορίζεται από το ένα προς το άλλο χαρακτηριστικό και όχι υπόδειγμα 34

35 Αυτοματοποιημένος καθαρισμός δεδομένων Η χαμηλή ποιότητα των δεδομένων αποτελεί σοβαρό πρόβλημα για την εξόρυξη γνώσης από αυτά Τα λάθη σε μεγάλες βάσεις δεδομένων αποτελούν περισσότερο κανόνα παρά εξαίρεση Οι τιμές των χαρακτηριστικών, πολλές φορές ακόμα και των τάξεων, είναι συχνά ανακριβείς, αναξιόπιστες και ακάθαρτες Συμβατική μέθοδος αντιμετώπισης: προσεκτικός έλεγχος των δεδομένων Στην έκταση των προβλημάτων που πραγματεύονται, ίσως αδύνατος Αυτοματοποιημένες μέθοδοι: Εντοπισμός διαταραχών Συνδυασμός αλγορίθμων μάθησης 35

36 Βελτίωση δένδρων απόφασης Για τη βελτίωση ενός δένδρου απόφασης: Ιδεατή λύση: έλεγχος λανθασμένα ταξινομημένων υποδειγμάτων από εμπειρογνώμονα Προσέγγιση μηχανική μάθησης στο πρόβλημα: απομάκρυνση λανθασμένα ταξινομημένων υποδειγμάτων και επανεκπαίδευση Θόρυβος χαρακτηριστικών και θόρυβος τάξεων Ο θόρυβος στα χαρακτηριστικά πρέπει να παραμένει ανέπαφος στο σύνολο δεδομένων (προσοχή: όχι εκπαίδευση σε καθαρό σύνολο και έλεγχος σε μη καθαρό σύνολο) Συστημικός θόρυβος στην τάξη (για παράδειγμα αντικατάσταση μίας τάξης με μία άλλη): πρέπει επίσης να παραμείνει στα δεδομένα εκπαίδευσης Μη συστημικός θόρυβος τάξης: απομάκρυνσή του από το σύνολο εκπαίδευσης, αν αυτό είναι δυνατό 36

37 Ανθεκτική παλινδρόμηση Ανθεκτική (robust) στατιστική μέθοδος επιλαμβάνεται του προβλήματος των τιμών προς εξαίρεση (outliers) Για την ανθεκτικότητα της παλινδρόμησης (regression): Ελαχιστοποίηση του απολύτου σφάλματος, όχι του τετραγωνικού σφάλματος Απομάκρυνση outliers (για παράδειγμα 10% των σημείων που απέχουν περισσότερο από την επιφάνεια παλινδρόμησης) Ελαχιστοποίηση της μεσαίας τιμής (median) και όχι του μέσου (mean) των τετραγώνων (για outliers στον x και y άξονα) Λαμβάνει υπ όψιν το ήμισυ τα περισσότερο συναφή, σε όρους απόστασης, δεδομένα Υψηλό υπολογιστικό κόστος 37

38 Παράδειγμα ανθεκτικής παλινδρόμησης 38

39 Εφαρμογή στο weka 39

40 Αποτίμηση & επιλογή χαρακτηριστικών Αναζήτηση στο χώρο των υποσυνόλων χαρακτηριστικών και αποτίμηση του καθενός Το περιβάλλον εργασίας παρέχει 4 μεθόδους αποτίμησης υποσυνόλου χαρακτηριστικών 7 μεθόδους αναζήτησης σε υποσύνολα χαρακτηριστικών (άρα και 2401 συνδυασμούς τους!) Μία ταχύτερη αλλά λιγότερο ακριβής μέθοδος είναι η αποτίμηση κάθε χαρακτηριστικού χωριστά ταξινόμηση και απόρριψη όσων δεν ικανοποιούν ορισμένη τιμή του κριτηρίου Το περιβάλλον εργασίας παρέχει 8 μεθόδους αποτίμησης μοναδιαίου χαρακτηριστικού μέθοδο κατάταξης 40

41 Select attributes Select attributes sheet Choose & format Attribute Evaluator & Search Method Attribute Selection Mode (full training set / cross-validation) Select attribute Start / stop Attribute selection output Result list 41

42 Αποτίμηση υποσυνόλου χαρακτηριστικών Μέθοδοι διήθησης (filter methods) CfsSubsetEval Consider the predictive value of each subset evaluator attribute individually, along with the degree of redundancy among them ConsistencySubsetEval Project training set onto attribute set and measure consistency in class values Μέθοδοι ενσωμάτωσης (wrapper methods) ClassifierSubsetEval Use a classifier to evaluate attribute set WrapperSubsetEval Use a classifier plus cross-validation 42

43 Μέθοδοι αναζήτησης BestFirst Greedy hill-climbing with backtracking ExhaustiveSearch Search exhaustively GeneticSearch Search using a simple genetic algorithm GreedyStepwise Greedy hill-climbing without backtracking; optionally generate ranked list of attributes RaceSearch Use race search methodology RandomSearch Search randomly RankSearch Sort the attributes and rank promising subsets using an attribute subset evaluator Μέθοδος κατάταξης Ranker Rank individual attributes (not subsets) according to their evaluation 43

44 Αποτίμηση μοναδιαίου χαρακτηριστικού ChiSquaredAttributeEval Compute the chi-squared statistic of each attribute with respect to the class GainRatioAttributeEval Evaluate attribute based on gain ratio InfoGainAttributeEval Evaluate attribute based on information gain OneRAttributeEval Use OneR s methodology to evaluate attributes PrincipalComponents Perform principal components analysis and transformation ReliefFAttributeEval Instance-based attribute evaluator SVMAttributeEval Use a linear support vector machine to determine the value of attributes SymmetricalUncertAttributeEval Evaluate attribute based on symmetric uncertainty 44

45 Filter Preprocess sheet Filter Choose (supervised / unsupervised, attribute / instance) Apply 45

46 Φίλτρα χαρακτηριστικών χωρίς επίβλεψη (Unsupervised attribute filters) Προσθήκη & απομάκρυνση χαρακτηριστικών Add Add a new attribute, whose values are all marked as missing Copy Copy a range of attributes in the dataset Remove Remove attributes RemoveType Remove attributes of a given type (nominal, numeric, string, or date) RemoveUseless Remove constant attributes, along with nominal attributes that vary too much Define attribute, eg. first-3,5,9-last / except 46

47 Φίλτρα χαρακτηριστικών χωρίς επίβλεψη (Unsupervised attribute filters) AddCluster Add a new nominal attribute representing the cluster assigned to each instance by a given clustering algorithm AddExpression Create a new attribute by applying a specified mathematical function to existing attributes ClusterMembership Use a clusterer to generate cluster membership values, which then form the new attributes Normalize Scale all numeric values in the dataset to lie within the interval [0,1] Standardize Standardize all numeric attributes to have zero mean and unit variance NumericTransform Transform a numeric attribute using any Java function Operators +, -, *, /, ^ functions log/exp, abs/sqrt, floor/ceil/rint, sin/cos/tan Define attribute, eg. A7 Expression eg. a1^2*a5/log(a7*4.0) 47

48 Φίλτρα χαρακτηριστικών χωρίς επίβλεψη (Unsupervised attribute filters) Αλλαγή τιμών SwapValues Swap two values of an attribute MergeTwoValues Merge two values of a given attribute: Specify the index of the two values to be merged ReplaceMissingValues Replace all missing values for nominal and numeric attributes with the modes and means of the training data Τυχαιοποίηση AddNoise Change a percentage of a given nominal attribute s values Obfuscate Obfuscate the dataset by renaming the relation, all attribute names, and nominal and string attribute values RandomProjection Project the data onto a lower-dimensional subspace using a random matrix 48

49 Φίλτρα χαρακτηριστικών χωρίς επίβλεψη (Unsupervised attribute filters) Μετατροπές Discretize Convert numeric attributes to nominal: Specify which attributes, number of bins, whether to optimize the number of bins, and output binary attributes. Use equal-width (default) or equal-frequency binning PKIDiscretize Discretize numeric attributes using equal-frequency binning, where the number of bins is equal to the square root of the number of values (excluding missing values) MakeIndicator Replace a nominal attribute with a Boolean attribute. Assign value 1 to instances with a particular range of attribute values; otherwise, assign 0. By default, the Boolean attribute is coded as numeric NominalToBinary Change a nominal attribute to several binary ones, one for each value NumericToBinary Convert all numeric attributes into binary ones: Nonzero values become 1 FirstOrder Apply a first-order differencing operator to a range of numeric attributes 49

50 Φίλτρα χαρακτηριστικών χωρίς επίβλεψη (Unsupervised attribute filters) Μετατροπές συμβολοσειρών StringToNominal Convert a string attribute to nominal StringToWordVector Convert a string attribute to a vector that represents word occurrence frequencies; you can choose the delimiter(s) and there are many more options Χρονοσειρές TimeSeriesTranslate Replace attribute values in the current instance with the equivalent value in some previous (or future) instance TimeSeriesDelta Replace attribute values in the current instance with the difference between the current value and the value in some previous (or future) instance 50

51 Φίλτρα υποδειγμάτων χωρίς επίβλεψη (Unsupervised instance filters) Τυχαιοποίηση & δειγματοληψία υποσυνόλου Randomize Randomize the order of instances in a dataset Normalize Treat numeric attributes as a vector and normalize it to a given length Resample Produce a random subsample of a dataset, sampling with replacement RemoveFolds Output a specified cross-validation fold for the dataset RemovePercentage Remove a given percentage of a dataset RemoveRange Remove a given range of instances from a dataset RemoveWithValues Filter out instances with certain attribute values RemoveMisclassified Remove instances incorrectly classified according to a specified classifier useful for removing outliers Αραιά Υποδείγματα NonSparseToSparse Convert all incoming instances to sparse format SparseToNonSparse Convert all incoming sparse instances into nonsparse format 51

52 Φίλτρα με επίβλεψη (Supervised Filters) Χρήζουνιδιαίτερηςπροσοχής, καθώς στην πραγματικότητα δεν συνιστούν λειτουργίες προεπεξεργασίας Οι διαμερίσεις των δεδομένων ελέγχου απαιτείται να μη λαμβάνουν υπ όψιν τις τιμές των τάξεων των υποδειγμάτων ελέγχου, καθώς αυτές υποτίθεται πως είναι άγνωστες. Φίλτρα χαρακτηριστικών Discretize Convert numeric attributes to nominal NominalToBinary Convert nominal attributes to binary, using a supervised method if the class is numeric ClassOrder Randomize, or otherwise alter, the ordering of class values AttributeSelection Provides access to the same attribute selection methods as the Select attributes panel Φίλτρα υποδειγμάτων Resample Produce a random subsample of a dataset, sampling with replacement SpreadSubsample Produce a random subsample with a given spread between class frequencies, sampling with replacement StratifiedRemoveFolds Output a specified stratified cross-validation fold for the dataset 52

53 Τέλος Επόμενη διάλεξη: ΑπεικόνισηΓνώσης, Αξιοπιστία&Αποτίμηση 53

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΧΟΥΧΟΥΜΗΣ ΙΩΑΝΝΗΣ Το σύνολο των

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά Μάιος 2008 Τα δεδομένα που έχουμε προς επεξεργασία χωρίζονται σε τρία μέρη: 1. Τα δεδομένα εκπαίδευσης (training set) που αποτελούνται από 2528

Διαβάστε περισσότερα

Ι. Preprocessing (Επεξεργασία train.arff):

Ι. Preprocessing (Επεξεργασία train.arff): Ονοματεπώνυμο: Κατερίνα Αργύρη Δ.Π.Μ.Σ: Εφαρμοσμένες Μαθηματικές Επιστήμες Ακαδ. Έτος: 2008-2009 1 Για την παρούσα εργασία διατίθενται τρία σύνολα δεδομένων: Δεδομένα Εκπαίδευσης (train set αρχείο train.arff):

Διαβάστε περισσότερα

Αποθήκες και Εξόρυξη Δεδομένων

Αποθήκες και Εξόρυξη Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Αποθήκες και Εξόρυξη Δεδομένων 1 Ο Εργαστήριο Εισαγωγή στο WEKA (Preprocessing Select Attributes) Στουγιάννου Ελευθερία estoug@unipi.gr -2- ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή

Διαβάστε περισσότερα

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ : ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ ΠΙΘΑΝΟΝΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΓΑΣΙΑ 08: ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ 1 Ο ΣΤΑΔΙΟ: Πριν εφαρμόσουμε οποιοδήποτε αλγόριθμο

Διαβάστε περισσότερα

ιατµηµατικό Μεταπτυχιακό Πρόγραµµα Σπουδών ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ

ιατµηµατικό Μεταπτυχιακό Πρόγραµµα Σπουδών ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ιατµηµατικό Μεταπτυχιακό Πρόγραµµα Σπουδών ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Τελική Εργασία στο µάθηµα Αλγόριθµοι Εξόρυξης

Διαβάστε περισσότερα

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης

Διαβάστε περισσότερα

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση Η μορφή των δεδομένων και η σημασία της Δεδομένα input Αλγόριθμοι Εξόρυξης

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 15η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

Homework 3 Solutions

Homework 3 Solutions Homework 3 Solutions Igor Yanovsky (Math 151A TA) Problem 1: Compute the absolute error and relative error in approximations of p by p. (Use calculator!) a) p π, p 22/7; b) p π, p 3.141. Solution: For

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση Η πληροφορία στη σύγχρονη επιχείρηση Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Πέραν του ανθρώπινου δυναμικού, η πληροφορία αποτελεί τον πλέον πολύτιμο

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα είναι μικρότεροι το 1000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Διάρκεια: 3,5 ώρες Καλή

Διαβάστε περισσότερα

ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ (Οι ερωτήσεις µε κίτρινη υπογράµµιση είναι εκτός ύλης για φέτος) ΕΙΣΑΓΩΓΗ Q1. Οι Πρωταρχικοί τύποι (primitive types) στη Java 1. Είναι όλοι οι ακέραιοι και όλοι οι πραγµατικοί

Διαβάστε περισσότερα

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE)

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE) EPL 603 TOPICS IN SOFTWARE ENGINEERING Lab 5: Component Adaptation Environment (COPE) Performing Static Analysis 1 Class Name: The fully qualified name of the specific class Type: The type of the class

Διαβάστε περισσότερα

Σκοπός του μαθήματος

Σκοπός του μαθήματος Σκοπός του μαθήματος Στο μάθημα αυτό γίνεται εφαρμογή, με τη βοήθεια του υπολογιστή και τη χρήση του στατιστικού προγράμματος S.P.S.S., της στατιστικής θεωρίας που αναπτύχθηκε στα μαθήματα «Εισαγωγή στη

Διαβάστε περισσότερα

Εργαστήριο στατιστικής Στατιστικό πακέτο S.P.S.S.

Εργαστήριο στατιστικής Στατιστικό πακέτο S.P.S.S. Σημειώσεις για το μάθημα Εργαστήριο στατιστικής Στατιστικό πακέτο S.P.S.S. Παπάνα Αγγελική E mail: papanagel@yahoo.gr, agpapana@gen.auth.gr Α.Τ.Ε.Ι. Θεσσαλονίκης ΠΑΡΑΡΤΗΜΑ ΚΑΤΕΡΙΝΗΣ Τμήμα Τυποποίησης και

Διαβάστε περισσότερα

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής Να γραφεί πρόγραμμα το οποίο δέχεται ως είσοδο μια ακολουθία S από n (n 40) ακέραιους αριθμούς και επιστρέφει ως έξοδο δύο ακολουθίες από θετικούς ακέραιους

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS CHAPTER 5 SOLVING EQUATIONS BY ITERATIVE METHODS EXERCISE 104 Page 8 1. Find the positive root of the equation x + 3x 5 = 0, correct to 3 significant figures, using the method of bisection. Let f(x) =

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Όλοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι του 10000 εκτός αν ορίζεται διαφορετικά στη διατύπωση του προβλήματος. Αν κάπου κάνετε κάποιες υποθέσεις

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΟΝ ΕΝΤΟΠΙΣΜΟ ΓΕΩΧΗΜΙΚΗΣ ΑΝΩΜΑΛΙΑΣ Στατιστική ανάλυση του γεωχημικού δείγματος μας δίνει πληροφορίες για τον

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΕΛΕΝΑ ΦΛΟΚΑ Επίκουρος Καθηγήτρια Τµήµα Φυσικής, Τοµέας Φυσικής Περιβάλλοντος- Μετεωρολογίας ΓΕΝΙΚΟΙ ΟΡΙΣΜΟΙ Πληθυσµός Σύνολο ατόµων ή αντικειµένων στα οποία αναφέρονται

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ DATA MINING ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ 1 ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ Αφού δεν γνωρίζουμε κάποιο τρόπο για να επιλέξουμε εκ των προτέρων την πιο κατάλληλη και αποδοτική μέθοδο μάθησης

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Ζητήματα ηήμ με τα δεδομένα

Ζητήματα ηήμ με τα δεδομένα Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών

Διαβάστε περισσότερα

2 Composition. Invertible Mappings

2 Composition. Invertible Mappings Arkansas Tech University MATH 4033: Elementary Modern Algebra Dr. Marcel B. Finan Composition. Invertible Mappings In this section we discuss two procedures for creating new mappings from old ones, namely,

Διαβάστε περισσότερα

Τεχνικές Προβλέψεων. Προετοιμασία & Ανάλυση Χρονοσειράς

Τεχνικές Προβλέψεων. Προετοιμασία & Ανάλυση Χρονοσειράς ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων Προετοιμασία & Ανάλυση Χρονοσειράς http://www.fsu.gr

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 7: Παρουσίαση δεδομένων-περιγραφική στατιστική Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

EE512: Error Control Coding

EE512: Error Control Coding EE512: Error Control Coding Solution for Assignment on Finite Fields February 16, 2007 1. (a) Addition and Multiplication tables for GF (5) and GF (7) are shown in Tables 1 and 2. + 0 1 2 3 4 0 0 1 2 3

Διαβάστε περισσότερα

Rule Based systems Συστήματα Βασισμένα σε κανόνες

Rule Based systems Συστήματα Βασισμένα σε κανόνες Rule Based systems Συστήματα Βασισμένα σε κανόνες Τμήματα ενός έμπειρου συστήματος βασισμένου σε κανόνες Βάση Γνώσης (Κανόνες) Μηχανισμός Εξαγωγής Συμπερασμάτων Χώρος Εργασίας (Γεγονότα) Μηχανισμός Επεξήγησης

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διαλέξεις 5 6 Principal component analysis EM for Gaussian mixtures: μ k, Σ k, π k. Ορίζουμε το διάνυσμα z (διάσταση Κ) ώστε K p( x θ) = π ( x μ, Σ ) k = k k k Eκ των υστέρων

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΠΙΧ Οικονομετρικά Πρότυπα Διαφάνεια 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

Γραµµικός Προγραµµατισµός (ΓΠ)

Γραµµικός Προγραµµατισµός (ΓΠ) Γραµµικός Προγραµµατισµός (ΓΠ) Περίληψη Επίλυση δυσδιάστατων προβληµάτων Η µέθοδος simplex Τυπική µορφή Ακέραιος Προγραµµατισµός Προγραµµατισµός Παραγωγής Προϊόν Προϊόν 2 Παραγωγική Δυνατότητα Μηχ. 4 Μηχ.

Διαβάστε περισσότερα

Second Order Partial Differential Equations

Second Order Partial Differential Equations Chapter 7 Second Order Partial Differential Equations 7.1 Introduction A second order linear PDE in two independent variables (x, y Ω can be written as A(x, y u x + B(x, y u xy + C(x, y u u u + D(x, y

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/2006 ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 11/3/26 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Ολοι οι αριθμοί που αναφέρονται σε όλα τα ερωτήματα μικρότεροι το 1 εκτός αν ορίζεται διαφορετικά στη διατύπωση

Διαβάστε περισσότερα

9. Ανάλυση κυρίων συνιστωσών *Principal Component Analysis)

9. Ανάλυση κυρίων συνιστωσών *Principal Component Analysis) 1 9. Ανάλυση κυρίων συνιστωσών *Principal Component Analysis) Προαπαιτούμενα: MULTISPEC και η πολυφασματική εικόνα του φακέλου \Multispec_tutorial_Files\Images and Files \ salamina_multispectral.tiff Σκοπός:

Διαβάστε περισσότερα

Μηχανική Μάθηση Hypothesis Testing

Μηχανική Μάθηση Hypothesis Testing ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Μηχανική Μάθηση Hypothesis Testing Γιώργος Μπορμπουδάκης Τμήμα Επιστήμης Υπολογιστών Procedure 1. Form the null (H 0 ) and alternative (H 1 ) hypothesis 2. Consider

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011 Διάρκεια Διαγωνισμού: 3 ώρες Απαντήστε όλες τις ερωτήσεις Μέγιστο Βάρος (20 Μονάδες) Δίνεται ένα σύνολο από N σφαιρίδια τα οποία δεν έχουν όλα το ίδιο βάρος μεταξύ τους και ένα κουτί που αντέχει μέχρι

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

Τεχνικές Συµπίεσης Βίντεο. Δρ. Μαρία Κοζύρη Τµήµα Πληροφορικής Πανεπιστήµιο Θεσσαλίας

Τεχνικές Συµπίεσης Βίντεο. Δρ. Μαρία Κοζύρη Τµήµα Πληροφορικής Πανεπιστήµιο Θεσσαλίας Τεχνικές Συµπίεσης Βίντεο Δρ. Μαρία Κοζύρη Τµήµα Πληροφορικής Πανεπιστήµιο Θεσσαλίας Ενότητα 3: Entropy Coding Δρ. Μαρία Κοζύρη Τεχνικές Συµπίεσης Βίντεο Ενότητα 3 2 Θεωρία Πληροφορίας Κωδικοποίηση Θεµελιώθηκε

Διαβάστε περισσότερα

κωδικοποίηση κτλ) Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές

κωδικοποίηση κτλ) Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές Στάθης Κλωνάρης 1. Εισαγωγή 2. Εισαγωγή Δεδομένων Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές 2. Διαχείριση μεταβλητών (Τύπος Ετικέτα, κωδικοποίηση

Διαβάστε περισσότερα

Μορφοποίηση υπό όρους : Μορφή > Μορφοποίηση υπό όρους/γραμμές δεδομένων/μορφοποίηση μόο των κελιών που περιέχουν/

Μορφοποίηση υπό όρους : Μορφή > Μορφοποίηση υπό όρους/γραμμές δεδομένων/μορφοποίηση μόο των κελιών που περιέχουν/ Μορφοποίηση υπό όρους : Μορφή > Μορφοποίηση υπό όρους/γραμμές δεδομένων/μορφοποίηση μόο των κελιών που περιέχουν/ Συνάρτηση round() Περιγραφή Η συνάρτηση ROUND στρογγυλοποιεί έναν αριθμό στον δεδομένο

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 7α: Impact of the Internet on Economic Education Τμήμα Εφαρμοσμένης Πληροφορικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως

Διαβάστε περισσότερα

(C) 2010 Pearson Education, Inc. All rights reserved.

(C) 2010 Pearson Education, Inc. All rights reserved. Connectionless transmission with datagrams. Connection-oriented transmission is like the telephone system You dial and are given a connection to the telephone of fthe person with whom you wish to communicate.

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 1ο Τι είναι το SPSS; Statistical Package for the Social Sciences Λογισμικό για διαχείριση και στατιστική ανάλυση δεδομένων σε γραφικό περιβάλλον http://en.wikipedia.org/wiki/spss

Διαβάστε περισσότερα

4.6 Autoregressive Moving Average Model ARMA(1,1)

4.6 Autoregressive Moving Average Model ARMA(1,1) 84 CHAPTER 4. STATIONARY TS MODELS 4.6 Autoregressive Moving Average Model ARMA(,) This section is an introduction to a wide class of models ARMA(p,q) which we will consider in more detail later in this

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 7 ο : Ανάκτηση πληροφορίας Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος βασίζονται

Διαβάστε περισσότερα

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική Κατηγοριοποίηση Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης 2 ο Φροντιστήριο Σκούρα Αγγελική skoura@ceid.upatras.gr Μηχανική Μάθηση Η μηχανική μάθηση είναι μια περιοχή της τεχνητής νοημοσύνης η οποία αφορά

Διαβάστε περισσότερα

Σήματα και Συστήματα ΙΙ

Σήματα και Συστήματα ΙΙ Σήματα και Συστήματα ΙΙ Ενότητα 3: Διακριτός και Ταχύς Μετασχηματισμός Fourier (DTF & FFT) Α. Ν. Σκόδρας Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Επιμέλεια: Αθανάσιος Ν. Σκόδρας, Καθηγητής

Διαβάστε περισσότερα

Διδάσκουσα: Χάλκου Χαρά,

Διδάσκουσα: Χάλκου Χαρά, Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr Επιβλεπόμενοι Μη Επιβλεπόμενοι Ομάδα Κατηγορία Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών

Διαβάστε περισσότερα

Second Order RLC Filters

Second Order RLC Filters ECEN 60 Circuits/Electronics Spring 007-0-07 P. Mathys Second Order RLC Filters RLC Lowpass Filter A passive RLC lowpass filter (LPF) circuit is shown in the following schematic. R L C v O (t) Using phasor

Διαβάστε περισσότερα

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο

Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων. Εξάμηνο 7 ο Εργαστήριο Ανάπτυξης Εφαρμογών Βάσεων Δεδομένων Εξάμηνο 7 ο Oracle SQL Developer An Oracle Database stores and organizes information. Oracle SQL Developer is a tool for accessing and maintaining the data

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 2: Επεξεργασία Δεδομένων Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Στατιστική ΙΙΙ(ΣΤΑΟ 230) Χρονολογικές Σειρες-Κινητοι Μέσοι, Αφελείς Μέθοδοι και Αποσύνθεση (εκδ. 2η)

Στατιστική ΙΙΙ(ΣΤΑΟ 230) Χρονολογικές Σειρες-Κινητοι Μέσοι, Αφελείς Μέθοδοι και Αποσύνθεση (εκδ. 2η) Στατιστική ΙΙΙ-(ΣΤΑΟ 230) Χρονολογικές Σειρες-Κινητοι Μέσοι, Αφελείς Μέθοδοι και Αποσύνθεση (εκδ. 2η) Γεώργιος Τσιώτας Τμήμα Οικονομικών Επιστημών Σχολή Κοινωνικών Επιστημών Πανεπιστήμιο Κρήτης Στατιστική

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δειγμάτων, που διαχωρίζονται βάσει ενός επαναλαμβανόμενου και ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για εξαρτημένα δείγματα ως προς δύο παράγοντες,

Διαβάστε περισσότερα

6.3 Forecasting ARMA processes

6.3 Forecasting ARMA processes 122 CHAPTER 6. ARMA MODELS 6.3 Forecasting ARMA processes The purpose of forecasting is to predict future values of a TS based on the data collected to the present. In this section we will discuss a linear

Διαβάστε περισσότερα

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ Εφαρμογές Ποσοτικές Ανάλυσης με το Excel 141 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Ανάλυση Δεδομένων Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής

Διαβάστε περισσότερα

ΗΜΥ 210 ΣΧΕΔΙΑΣΜΟΣ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. Χειµερινό Εξάµηνο ΔΙΑΛΕΞΗ 3: Αλγοριθµική Ελαχιστοποίηση (Quine-McCluskey, tabular method)

ΗΜΥ 210 ΣΧΕΔΙΑΣΜΟΣ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. Χειµερινό Εξάµηνο ΔΙΑΛΕΞΗ 3: Αλγοριθµική Ελαχιστοποίηση (Quine-McCluskey, tabular method) ΗΜΥ 210 ΣΧΕΔΙΑΣΜΟΣ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Χειµερινό Εξάµηνο 2016 ΔΙΑΛΕΞΗ 3: Αλγοριθµική Ελαχιστοποίηση (Quine-McCluskey, tabular method) ΧΑΡΗΣ ΘΕΟΧΑΡΙΔΗΣ Επίκουρος Καθηγητής, ΗΜΜΥ (ttheocharides@ucy.ac.cy)

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Business English Ενότητα # 9: Financial Planning Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ Κ. Ποϊραζίδης Η ταξινόμηση εικόνας αναφέρεται στην ερμηνεία με χρήση υπολογιστή των τηλεπισκοπικών εικόνων. Παρόλο που ορισμένες διαδικασίες έχουν τη δυνατότητα να συμπεριλάβουν πληροφορίες

Διαβάστε περισσότερα

Απόκριση σε Μοναδιαία Ωστική Δύναμη (Unit Impulse) Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο. Απόστολος Σ.

Απόκριση σε Μοναδιαία Ωστική Δύναμη (Unit Impulse) Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο. Απόστολος Σ. Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο The time integral of a force is referred to as impulse, is determined by and is obtained from: Newton s 2 nd Law of motion states that the action

Διαβάστε περισσότερα

Section 9.2 Polar Equations and Graphs

Section 9.2 Polar Equations and Graphs 180 Section 9. Polar Equations and Graphs In this section, we will be graphing polar equations on a polar grid. In the first few examples, we will write the polar equation in rectangular form to help identify

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

1. Πειραματικά Σφάλματα

1. Πειραματικά Σφάλματα . Πειραματικά Σφάλματα Σκοπός της εκτέλεσης ενός πειράματος στη Φυσική είναι ο προσδιορισμός ποσοτικός ή/και ποιοτικός- κάποιων φυσικών μεγεθών που περιγράφουν ένα συγκεκριμένο φαινόμενο. Ο ποιοτικός προσδιορισμός

Διαβάστε περισσότερα

A Bonus-Malus System as a Markov Set-Chain. Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics

A Bonus-Malus System as a Markov Set-Chain. Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics A Bonus-Malus System as a Markov Set-Chain Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics Contents 1. Markov set-chain 2. Model of bonus-malus system 3. Example 4. Conclusions

Διαβάστε περισσότερα

w o = R 1 p. (1) R = p =. = 1

w o = R 1 p. (1) R = p =. = 1 Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών ΗΥ-570: Στατιστική Επεξεργασία Σήµατος 205 ιδάσκων : Α. Μουχτάρης Τριτη Σειρά Ασκήσεων Λύσεις Ασκηση 3. 5.2 (a) From the Wiener-Hopf equation we have:

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Αναλυτικές λειτουργίες ΣΓΠ

Αναλυτικές λειτουργίες ΣΓΠ Αναλυτικές λειτουργίες ΣΓΠ Γενικά ερωτήµατα στα οποία απαντά ένα ΣΓΠ Εντοπισµού (locaton) Ιδιότητας (condton) Τάσεων (trend) ιαδροµών (routng) Μορφών ή προτύπων (pattern) Και µοντέλων (modellng) παραδείγµατα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 133: ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΡΓΑΣΤΗΡΙΟ 3 Javadoc Tutorial

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 133: ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΡΓΑΣΤΗΡΙΟ 3 Javadoc Tutorial ΕΡΓΑΣΤΗΡΙΟ 3 Javadoc Tutorial Introduction Το Javadoc είναι ένα εργαλείο που παράγει αρχεία html (παρόμοιο με τις σελίδες στη διεύθυνση http://docs.oracle.com/javase/8/docs/api/index.html) από τα σχόλια

Διαβάστε περισσότερα

If we restrict the domain of y = sin x to [ π, π ], the restrict function. y = sin x, π 2 x π 2

If we restrict the domain of y = sin x to [ π, π ], the restrict function. y = sin x, π 2 x π 2 Chapter 3. Analytic Trigonometry 3.1 The inverse sine, cosine, and tangent functions 1. Review: Inverse function (1) f 1 (f(x)) = x for every x in the domain of f and f(f 1 (x)) = x for every x in the

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 4ο Κατανομές Στατιστικών Συναρτήσεων Δείγμα από κανονική κατανομή Έστω Χ= Χ Χ Χ τ.δ. από Ν µσ τότε ( 1,,..., n) (, ) Τ Χ Χ Ν Τ Χ σ σ Χ Τ Χ n Χ S µ S µ 1( ) = (0,1), ( ) = ( n 1)

Διαβάστε περισσότερα

Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2)

Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2) ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Αλγόριθμοι και πολυπλοκότητα NP-Completeness (2) Ιωάννης Τόλλης Τμήμα Επιστήμης Υπολογιστών NP-Completeness (2) x 1 x 1 x 2 x 2 x 3 x 3 x 4 x 4 12 22 32 11 13 21

Διαβάστε περισσότερα

Math 6 SL Probability Distributions Practice Test Mark Scheme

Math 6 SL Probability Distributions Practice Test Mark Scheme Math 6 SL Probability Distributions Practice Test Mark Scheme. (a) Note: Award A for vertical line to right of mean, A for shading to right of their vertical line. AA N (b) evidence of recognizing symmetry

Διαβάστε περισσότερα

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1.

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1. Exercises 0 More exercises are available in Elementary Differential Equations. If you have a problem to solve any of them, feel free to come to office hour. Problem Find a fundamental matrix of the given

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 4: Δειγματοληψία και Κβάντιση Εικόνας

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 4: Δειγματοληψία και Κβάντιση Εικόνας ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ Ενότητα 4: Δειγματοληψία και Κβάντιση Εικόνας Ιωάννης Έλληνας Τμήμα Υπολογιστικών Συστημάτων Άδειες Χρήσης

Διαβάστε περισσότερα

Τίτλος Πακέτου Certified Computer Expert-ACTA

Τίτλος Πακέτου Certified Computer Expert-ACTA Κωδικός Πακέτου ACTA - CCE - 002 Τίτλος Πακέτου Certified Computer Expert-ACTA Εκπαιδευτικές Ενότητες Επεξεργασία Κειμένου - Word Δημιουργία Εγγράφου Προχωρημένες τεχνικές επεξεργασίας κειμένου & αρχείων

Διαβάστε περισσότερα

ω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω

ω ω ω ω ω ω+2 ω ω+2 + ω ω ω ω+2 + ω ω+1 ω ω+2 2 ω ω ω ω ω ω ω ω+1 ω ω2 ω ω2 + ω ω ω2 + ω ω ω ω2 + ω ω+1 ω ω2 + ω ω+1 + ω ω ω ω2 + ω 0 1 2 3 4 5 6 ω ω + 1 ω + 2 ω + 3 ω + 4 ω2 ω2 + 1 ω2 + 2 ω2 + 3 ω3 ω3 + 1 ω3 + 2 ω4 ω4 + 1 ω5 ω 2 ω 2 + 1 ω 2 + 2 ω 2 + ω ω 2 + ω + 1 ω 2 + ω2 ω 2 2 ω 2 2 + 1 ω 2 2 + ω ω 2 3 ω 3 ω 3 + 1 ω 3 + ω ω 3 +

Διαβάστε περισσότερα

Αντισταθμιστική ανάλυση

Αντισταθμιστική ανάλυση Αντισταθμιστική ανάλυση Θεωρήστε έναν αλγόριθμο Α που χρησιμοποιεί μια δομή δεδομένων Δ : Κατά τη διάρκεια εκτέλεσης του Α η Δ πραγματοποιεί μία ακολουθία από πράξεις. Παράδειγμα: Θυμηθείτε το πρόβλημα

Διαβάστε περισσότερα

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική

Διαβάστε περισσότερα