ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση"

Transcript

1 ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση

2 Η μορφή των εξαγομένων και η σημασία της Δεδομένα input Αλγόριθμοι Εξόρυξης Πληροφορίας Εξαγόμενα output Οι τεχνικές Μηχανικής Μάθησης παρέχουν διάφορες δομικές περιγραφές των εξαγόμενων Καθεμία από αυτές υπαγορεύει το είδος του αλγορίθμου που πρέπει να χρησιμοποιηθεί για το σχηματισμό της από τα δεδομένα Η κατανόηση του τρόπου περιγραφής συμβάλλει κατά πολύ στην κατανόηση του τρόπου παραγωγής της 2

3 Εξαγόμενα: Απεικόνιση γνώσης Πίνακες απόφασης (decision tables) Δένδρα απόφασης (decision trees) Κανόνες απόφασης (decision rules) Κανόνες συσχέτισης (association rules) Κανόνες με εξαιρέσεις (rules with exceptions) Κανόνες με συσχετίσεις (rules involving relations) Γραμμική παλινδρόμηση (linear regression) Δένδρα για αριθμητική πρόβλεψη (trees for numeric prediction) Απεικόνιση με βάση υποδείγματα (instance-based representation) Ομάδες (clusters) 3

4 Πίνακες απόφασης (decision tables) Ο απλούστερος τρόπος απεικόνισης των εξαγομένων: Χρήση όμοιας περιγραφής με τα δεδομένα! Παράδειγμα: πίνακας απόφασης για το πρόβλημα καιρού: Outlook Humidity Play Sunny High No Sunny Normal Yes Overcast High Yes Overcast Normal Yes Rainy High No Rainy Normal No Κύριο πρόβλημα: επιλογή των κατάλληλων χαρακτηριστικών 4

5 Δένδρα απόφασης (decision trees) Παράγονται με τη μέθοδο διαίρει και βασίλευε ( divide & conquer ) Οι κόμβοι υλοποιούν έλεγχο τιμής ενός χαρακτηριστικού Συνήθως, η τιμή του χαρακτηριστικού συγκρίνεται με μία σταθερά Άλλες δυνατότητες: Σύγκριση τιμών δύο χαρακτηριστικών ή χρήση συνάρτησης για ένα ή περισσότερα χαρακτηριστικά Τα φύλλα εκχωρούν ταξινόμηση, σύνολο ταξινομήσεων ή κατανομές πιθανότητας στα υποδείγματα Έναάγνωστηςτάξεωςυπόδειγμαακολουθείπορείααπότην αρχή ως κάποιο φύλλο του δένδρου για την ταξινόμησή του 5

6 Ονομαστικά & αριθμητικά χαρακτηριστικά Ονομαστικά χαρακτηριστικά: αριθμόςκλάδωνμετάαπόκόμβοσυνήθωςίσοςπροςτον αριθμό των διακριτών τιμών το χαρακτηριστικό δεν ελέγχεται περισσότερες από μία φορές εναλλακτικά: διαίρεση σε υποσύνολα, συνήθως δύο Αριθμητικά χαρακτηριστικά: σύγκριση τιμής χαρακτηριστικού με σταθερά (για ακέραιο) ήσύνολοτιμών(για πραγματικό αριθμό) το χαρακτηριστικό μπορεί να ελεγχθεί περισσότερες από μία φορές εναλλακτικά : διαίρεση σε τρία (ή καιπερισσότερα) υποσύνολα 6

7 Άγνωστες τιμές Σε περίπτωση άγνωστης τιμής (missing value) του υπό ελέγχου χαρακτηριστικού, σε ποιο κλάδο εκχωρείται το παράδειγμα; Συχνά, η άγνωστη καταχωρείται ως ξεχωριστή τιμή του χαρακτηριστικού Αν όχι, τότε απαιτείται ειδική μεταχείριση Λύση A: εκχώρηση του παραδείγματος στον κλάδο με τη μεγαλύτερη συχνότητα Λύση B: διαμελισμός του παραδείγματος εκχώρηση τμημάτων του σε κάθε κλάδο, με στάθμιση ανάλογη της συχνότητας κάθε κλάδου στα υποδείγματα εκπαίδευσης άθροιση των καταληκτικών υποδείξεων από κάθε κλάδο με ίδια στάθμιση 7

8 "Χειροποίητη" κατασκευή δένδρου απόφασης Open segment-challenge.arff Classify choose trees UserClassifier Test options: supplied test set segment-test.arff Start data visualizer X: region-centroid-row(num) & Y: intensity-mean (Num) Rectangle, επιλογή όλων των υποδειγμάτων τάξης sky, submit Tree visualizer Συνέχεια 8

9 Κανόνες ταξινόμησης (classification rules) Δημοφιλής εναλλακτική στα δένδρα απόφασης Προϋπόθεση κανόνα (antecedent): σύνολο ελέγχων (όμοιοι με τους ελέγχους στους κόμβους ενός δένδρου απόφασης) Οι έλεγχοι συνήθως συμπλέκονται με λογική σύζευξη (ΚΑΙ, ωστόσο η χρήση και άλλων λογικών πράξεων είναι εφικτή) Συμπέρασμα κανόνα (consequent): εκχώρηση ταξινόμησης, συνόλου ταξινομήσεων ή κατανομής πιθανότητας Ανεξάρτητοι κανόνες συμπλέκονται με λογική διάζευξη (Ή) Πρόβλημα: κάποιες φορές οι υποδείξεις των κανόνων είναι διαφορετικές για το ίδιο παράδειγμα 9

10 Μετατροπή δένδρου σε σύνολο κανόνων Υλοποιείται εύκολα: Ένας κανόνας για κάθε φύλλο Η προϋπόθεση περιέχει μία συνθήκη για κάθε κόμβο που συναντάται από τη ρίζα ως το φύλλο Ως συμπέρασμα ορίζεται η τάξη εκχώρησης Οι παραγόμενοι κανόνες είναι σαφείς και ορίζονται μονοσήμαντα Η σειρά εκτέλεσης δεν επηρεάζει το αποτέλεσμα Ωστόσο: οι κανόνες προκύπτουν υπερβολικά περίπλοκοι Απαιτείται κλάδεμα για την απομάκρυνση των περιττών ελέγχων και κανόνων 10

11 Μετατροπή συνόλου κανόνων σε δένδρο Συγκριτικά δυσκολότερη Το δένδρο αδυνατεί να εκφράσει εύκολα τη λογική διάζευξη μεταξύ κανόνων Παράδειγμα: κανόνες ελέγχου διαφορετικών χαρακτηριστικών If a and b then x If c and d then x Το αντίστοιχο δένδρο περιέχει πανομοιότυπα "υποδένδρα" ( "πρόβλημα επαναλαμβανόμενου υποδένδρου", replicated subtree problem ) Δένδρο απόφασης απλής λογικής διάζευξης 11

12 Το πρόβλημα XOR If x = 1 and y = 0 then class = a If x = 0 and y = 1 then class = a If x = 0 and y = 0 then class = b If x = 1 and y = 1 then class = b Στο συγκεκριμένο παράδειγμα, η δομική περιγραφή του συνόλου κανόνων δεν είναι αισθητά περισσότερο συμπαγής από εκείνη του δένδρου απόφασης. 12

13 Δένδρο με επαναλαμβανόμενο υποδένδρο If x = 1 and y = 1 then class = a If z = 1 and w = 1 then class = a Otherwise class = b Σε αυτό το παράδειγμα, τα γκρι τρίγωνα περιέχουν το σύνολο του γκρι υποδένδρου. Η ύπαρξη γενικού κανόνα ( otherwise ) δενμπορείναπεριγραφείμε συμπαγή τρόπο από ένα δένδρο. 13

14 Ανεξάρτητα τμήματα πληροφορίας Συνιστούν οι κανόνες ανεξάρτητα τμήματα πληροφορίας; Η προσθήκη ενός κανόνα σε ένα σύνολο κανόνων φαντάζει εύκολα υλοποιήσιμη Ωστόσο, μία τέτοια προσθήκη θα αγνοούσε τη διαδοχή εκτέλεσης Πιθανές διαδοχές εκτέλεσης ενός συνόλου κανόνων: Διατεταγμένο σύνολο κανόνων (λίστα απόφασης, decision list) Η διάταξη είναι σημαντική για την ερμηνεία Μη διατεταγμένο σύνολο κανόνων Οι κανόνες δύναται να επικαλύπτονται και να οδηγούν σε διαφορετικά συμπεράσματα για το ίδιο υπόδειγμα 14

15 Ερμηνεία κανόνων Πρόβλημα: Δύο ή περισσότεροι κανόνες δίδουν αντικρουόμενες υποδείξεις Λύση: Αδυναμία εκπόνησης συμπεράσματος; Χρήση κανόνα με μεγαλύτερη συχνότητα στα δεδομένα ελέγχου; Πρόβλημα: Κανένας κανόνας δεν εφαρμόζεται σε υπόδειγμα ελέγχου Λύση: Αδυναμία εκπόνησης συμπεράσματος; Εκχώρηση στην τάξη με τη μεγαλύτερη συχνότητα στα δεδομένα ελέγχου; 15

16 Ειδική περίπτωση: Δυαδική τάξη (boolean class) Παραδοχή: αν το υπόδειγμα δεν ανήκει στην τάξη yes, τότε ανήκει στην τάξη no (είδος υπόθεσης κλειστού κόσμου ) Τέχνασμα: δημιουργία κανόνων μόνο για την τάξη yes και χρήση της τάξης no ως προεπιλεγμένης σε κάθε άλλη περίπτωση If x = 1 and y = 1 then class = a If z = 1 and w = 1 then class = a Otherwise class = b Η διαδοχή των κανόνων δεν επηρεάζει τα εξαγόμενα, επίσης δεν παρατηρούνται αντικρουόμενες υποδείξεις κάθε κανόνας συνιστά νέο, ανεξάρτητο τμήμα πληροφορίας Ο κανόνας μπορεί να γραφεί σε διαζευκτική κανονικοποιημένη μορφή (disjunctive normal form, διάζευξη διαδοχικών συζεύξεων) 16

17 Κανόνες συσχέτισης (association rules) Ειδοποιός (και μόνη ουσιαστική) διαφορά τους από τους κανόνες ταξινόμησης δύνανται να προβλέψουν την τιμή κάθε χαρακτηριστικού ή συνδυασμού χαρακτηριστικών και όχι μόνο της τάξης Επίσης δεν χρησιμοποιούνται σύνολα κανόνων Πρόβλημα: αχανής αριθμός πιθανών συσχετίσεων Αναγκαία η εισαγωγή κριτηρίων επιλογής των κανόνων με μεγαλύτερη συχνότητα εφαρμογής Outlook Temp Humidity Windy Play Sunny Hot High False No Sunny Hot High True No Overcast Hot High False Yes Rainy Mild High False Yes Rainy Cool Normal False Yes Rainy Cool Normal True No Overcast Cool Normal True Yes Sunny Mild High False No Sunny Cool Normal False Yes Rainy Mild Normal False Yes Sunny Mild Normal True Yes Overcast Mild High True Yes Overcast Hot Normal False Yes Rainy Mild High True No 17

18 Υποστήριξη & εμπιστοσύνη κανόνα Υποστήριξη (support): η κάλυψη του κανόνα στο σύνολο δεδομένων, ο αριθμός των υποδειγμάτων στα οποία αυτός εφαρμόζεται Εμπιστοσύνη (confidence): η ακρίβεια του κανόνα, ο αριθμόςτων σωστών υποδείξεών ως ποσοστό της υποστήριξής του Παράδειγμα If temperature = cool then humidity = normal 4 ημέρες με temp cool & humidity normal support = 4, confidence = 100% Στις περισσότερες των περιπτώσεων τίθενται ελάχιστα όρια για την υποστήριξη και την εμπιστοσύνη των υπό αναζήτηση κανόνων Παράδειγμα: 58 κανόνες με support 2 και confidence 95% για τα δεδομένα καιρού 18

19 Ερμηνεία κανόνων συσχέτισης Η ερμηνεία των κανόνων συσχέτισης δεν είναι πάντα προφανής και μονοσήμαντη, για παράδειγμα ο κανόνας If windy = false and play = no then outlook = sunny and humidity = high δεν ταυτίζεται με τον If windy = false and play = no then outlook = sunny If windy = false and play = no then humidity = high Ωστόσο, συνεπάγεται για παράδειγμα την ισχύ του: If humidity = high and windy = false and play = no then outlook = sunny 19

20 Κανόνες με εξαιρέσεις (rules with exceptions) Μίαφυσικήπροέκτασητωνκανόνωνταξινόμησης, είναι η προσθήκη εξαιρέσεων Καθιστούν εφικτή την τροποποίηση ενός συνόλου κανόνων χωρίς να απαιτείται συνολικός εκ θεμελίων ανασχεδιασμός του Κύριο όφελος της μεθόδου απεικόνισης αποτελεί η δυνατότητα συγκριτικά εύκολης επέκτασης του συνόλου κανόνων για την συμπερίληψη νέων υποδειγμάτων Ηδομήdefault... except if... then... είναι λογικά ισοδύναμη με τη if... then... else... Ωστόσο η δομή εκχώρησης προεπιλεγμένης τιμής και ελέγχου περί εξαιρέσεων είναι περισσότερο συμβατή με τον τρόπο αντίληψης ενός ειδικού, επομένως και ευκολότερα κατανοητή 20

21 Καταχώρηση νέου υποδείγματος Sepal length Sepal width Petal length Petal width Type ? Το νέο υπόδειγμα ανήκει στην τάξη Iris Setosa Ωστόσο, οι προηγούμενα δημιουργημένοι κανόνες το καταχωρούν ως Iris Versicolor If petal length 2.45 and petal length < 4.45 then Iris versicolor If petal length 2.45 and petal length < 4.95 and petal width < 1.55 then Iris versicolor Εισαγωγή εξαίρεσης If petal length 2.45 and petal length < 4.45 then Iris versicolor EXCEPT if petal width < 1.0 then Iris setosa Είναι δυνατή η ύπαρξη εξαιρέσεων στις εξαιρέσεις και ούτω καθεξής, γεγονός που προσδίδει χαρακτήρα δένδρου στο σύνολο κανόνων 21

22 Παράδειγμα συνόλου κανόνων με εξαιρέσεις Default: Iris-setosa except if petal-length 2.45 and petal-length < and petal-width < 1.75 then Iris-versicolor except if petal-length 4.95 and petal-width < 1.55 then Iris-virginica else if sepal-length < 4.95 and sepal-width 2.45 then Iris-virginica else if petal-length 3.35 then Iris-virginica except if petal-length < 4.85 and sepal-length < 5.95 then Iris-versicolor 22

23 Κανόνες με συσχετίσεις (rules involving relations) Ως τώρα έγινε αναφορά σε προτασιακούς ( propositional ) κανόνες Υλοποιούν σύγκριση της τιμής ενός χαρακτηριστικού με μία σταθερά, για παράδειγμα temperature < 45 Η ισχύς των εκφράσεών τους είναι αντίστοιχη της προτασιακής λογικής Η ισχύς αυτή δεν είναι επαρκής για προβλήματα που περιέχουν συσχετίσεις μεταξύ των υποδειγμάτων, όπως το δένδρο οικογένειας στη διάλεξη02 Απαιτείται εναλλακτική δομική περιγραφή Εισαγωγή συσχετίσεων σε σύνολα κανόνων 23

24 Πρόβλημα θέσης σχήματος Αντίληψη - στόχος: όρθια ή μη θέση σχήματος Υποδείγματα με σκίαση: όρθια θέση υποδείγματα χωρίς σκίαση: μη όρθια θέση 24

25 Μία προτασιακή επίλυση Width Height Sides Class Standing Standing Lying Standing Lying Standing Lying Lying If width 3.5 and height < 7.0 then lying If height 3.5 then standing 25

26 Μία συσχετιστική επίλυση Σύγκριση χαρακτηριστικών μεταξύ τους If width > height then lying If height > width then standing Αρτιότερη γενίκευση σε νέα δεδομένα Τυπικές συσχετίσεις: =, <, > Μειονέκτημα: η εκμάθηση κανόνων με συσχετίσεις είναι υψηλού υπολογιστικού κόστους Απλή λύση: εισαγωγή πρόσθετων χαρακτηριστικών και εφαρμογή προτασιακής επίλυσης Για παράδειγμα, δυαδικό χαρακτηριστικό is width < height? 26

27 Δένδρα για αριθμητική πρόβλεψη Το σύνολο των δένδρων απόφασης και των κανόνων που αναφέρθηκαν ως τώρα αφορούν την πρόβλεψη ονομαστικών παρά αριθμητικών ποσοτήτων Η πρόβλεψη αριθμητικών ποσοτήτων δύναται να υλοποιηθεί από τις ίδιες δομικές περιγραφές, με μικρές τροποποιήσεις Οι κόμβοι του δένδρου περιέχουν αριθμητική ποσότητα που αποτελεί τη μέση τιμή όλων των υποδειγμάτων που καταλήγουν στα φύλλα που ακολουθούν Τα συμπεράσματα των κανόνων αναφέρουν τη μέση τιμή των υποδειγμάτων στα οποία εφαρμόζεται ο κανόνας Τα δένδρα με αριθμητικές τιμές στα καταληκτικά φύλλα καλούνται δένδρα παλινδρόμησης (regression trees) 27

28 Παράδειγμα δένδρου παλινδρόμησης Γραμμική παλινδρόμηση & δένδρο παλινδρόμησης Το δένδρο παρέχει μεγαλύτερη ακρίβεια Ωστόσο παραμένει ογκώδες και δυσνόητο 28

29 Συνδυασμός δένδρου και εξισώσεων παλινδρόμησης Είναι εφικτός ο συνδυασμός ενός δένδρου με μία εξίσωση παλινδρόμησης Model tree: δένδρο του οποίου τα φύλλα περιέχουν αντί τιμών πρόβλεψης εξισώσεις παλινδρόμησης 29

30 Απεικόνιση με βάση υποδείγματα (instance-based representation) Απλούστερη μορφή μάθησης: αποστήθιση (rote learning) Το σύνολο υποδειγμάτων εκπαίδευσης καταχωρείται στη μνήμη Πραγματοποιείται αντιστοίχιση των νέων παραδειγμάτων με όμοιά τους από το σύνολο εκπαίδευσης υποδείγματα Απομένει μονάχα ο ορισμός του μέτρου ομοιότητας Απεικόνιση γνώσης με βάση τα υποδείγματα: εντελώς διαφορετική οπτική του προβλήματος εξόρυξης γνώσης Χρήση των υποδειγμάτων ως έχουν για την απεικόνιση της γνώσης αντί για τη συναγωγή μοντέλου από αυτά Ταξινόμηση κάθε νέου παραδείγματος με εκχώρηση τάξης του περισσότερο όμοιου υποδείγματος εκπαίδευσης Η θεμελιώδης διαφορά της μεθόδου έγκειται στη στιγμή κατά την οποία λαμβάνει χώρα η εκμάθηση Η μέθοδος είναι αδρανής ( lazy ), καθώς αναβάλλει τον κύριο όγκο εργασίας μέχρι την έλευση νέων παραδειγμάτων 30

31 Ταξινόμηση πλησιέστερων γειτόνων (nearest neighbor classification) Κάθε νέο παράδειγμα συγκρίνεται με τα ήδη υπάρχοντα υποδείγματαμεχρήσηκατάλληλουμέτρουαπόστασης Το παράδειγμα εκχωρείται στην τάξη του πλησιέστερου υποδείγματος (ταξινόμηση k πλησιέστερων γειτόνων, k-nearestneighbor classification) Μέτρα απόστασης Αριθμητικά χαρακτηριστικά: ευκλείδεια απόσταση (παραδοχή: τα χαρακτηριστικά είναι κανονικοποιημένα και ίσης βαρύτητας) Ονομαστικά χαρακτηριστικά: απόσταση = 0 για ταυτόσημες τιμές, διαφορετικά απόσταση =1 Περισσότερο εξεζητημένα μέτρα απόστασης είναι ίσως επιθυμητά για παράδειγμα διαφορετικές βαρύτητες χαρακτηριστικών 31

32 Επιλογή υποσυνόλου υποδειγμάτων Αποθήκευση του συνόλου των υποδειγμάτων εκπαίδευσης; Απαιτεί υψηλό κόστος αποθήκευσης και εκτέλεσης Επιλογή ποιων υποδειγμάτων; Σταθερές (ως προς την τάξη) περιοχές: απαιτούνται λίγα υποδείγματα Εμφανές μειονέκτημα: οι εξαγόμενες δομικές περιγραφές δεν είναι ρητές Η δομική περιγραφή δεν είναι περιγραφική των προτύπων στα δεδομένα Παραβιάζει την έννοια της γνώσης, όπως αυτή ορίστηκε στη διάλεξη01 32

33 Γενίκευση στην απεικόνιση με βάση υποδείγματα Γενίκευση των υποδειγμάτων: δημιουργία ορθογώνιων περιοχών που περιέχουν υποδείγματα της ίδιας τάξης Νέα παραδείγματα που εμπίπτουν σε τέτοιες περιοχές ταξινομούνται αντίστοιχα Σε περίπτωση που δεν εμπίπτουν σε καμία από αυτές, υλοποιείται ο κλασσικός κανόνας πλησιέστερου γείτονα Περισσότερο πολύπλοκη επιλογή: ένθετα ορθογώνια (nesting, ανάλογο των εξαιρέσεων στους κανόνες) Οπτικοποίηση της τεχνικής: προβληματική για μεγάλο αριθμό διαστάσεων και ονομαστικά χαρακτηριστικά 33

34 Ομάδες (clusters) Όταν ζητούμενο είναι η ομαδοποίηση και όχι η ταξινόμηση, ως εξαγόμενο προκύπτει η απεικόνιση του τρόπου εκχώρησης των υποδειγμάτων σε ομάδες Απλούστερη περίπτωση: Συσχέτιση αριθμού ομάδας με κάθε υπόδειγμα, επίσης απεικόνιση με διαμελισμό του χώρου στις ομάδες και υπέρθεση των υποδειγμάτων Διάγραμμα Venn: Επιτρέπει σε ένα υπόδειγμα να ανήκει σε περισσότερες της μίας τάξεων, επομένως και την επικάλυψη ομάδων Πιθανοκρατική συσχέτιση υποδειγμάτων με ομάδες: Για κάθε υπόδειγμα δίδεται η πιθανότητα (degree of membership) να αποτελεί μέλος της κάθε ομάδας Δενδρόγραμμα Ιεραρχική δομή ομάδων με διαδοχικούς διαμελισμούς του χώρου των υποδειγμάτων 34

35 Παραδείγματα ομαδοποιήσεων 35

36 Αξιοπιστία & Αποτίμηση 36

37 Αξιοπιστία & αποτίμηση Ζητήματα: εκπαίδευση, έλεγχος, ρύθμιση Πρόγνωση απόδοσης: όρια εμπιστοσύνης Παρακράτηση (holdout), διασταυρωμένη επικύρωση (crossvalidation), μέθοδος bootstrap Σύγκριση σχημάτων: t-test Πρόγνωση πιθανοτήτων: συναρτήσεις απωλειών (loss functions) Κριτήρια εξαρτώμενα από κόστος (cost-sensitive measures) Αποτίμηση αριθμητικής πρόβλεψης Η αρχή ελαχίστου μήκους περιγραφής (the Minimum Description Length principle) 37

38 Αποτίμηση: το κλειδί της επιτυχίας Ποια η προβλεπτική ικανότητα του μοντέλου που προέκυψε από τον αλγόριθμο εκμάθησης; Πλήθοςμεθόδωνεξαγωγήςδομικώνπεριγραφώναπόδεδομένα Ποιες από αυτές είναι οι βέλτιστες για συγκεκριμένο πρόβλημα; Απαιτείται συστηματική προσέγγιση για την αποτίμηση και τη σύγκριση αποδοτικότητας των περιγραφών αυτών Αναφέρεται ρητά ότι το σφάλμα στα δεδομένα εκπαίδευσης δεν αποτελεί αξιόπιστο δείκτη απόδοσης σε μελλοντικά δεδομένα Λύση: διάσπαση των δεδομένων σε σύνολο εκπαίδευσης (training set) και σύνολο ελέγχου (test set) Απαιτείται μεγάλος όγκος (ταξινομημένων) δεδομένων Ωστόσο: ο όγκος των δεδομένων είναι συνήθως περιορισμένος Αναγκαία η χρήση περισσότερο εκλεπτυσμένων τεχνικών 38

39 Εκπαίδευση & έλεγχος Μέτρο απόδοσης σε προβλήματα ταξινόμησης: τιμή σφάλματος (error rate) Επιτυχία (success): σωστή πρόβλεψη της τάξης του υποδείγματος Σφάλμα (error): λανθασμένη πρόβλεψη της τάξης του υποδείγματος Τιμή σφάλματος (error rate): αναλογία σφαλμάτων στο σύνολο των υποδειγμάτων Ωστόσο, ενδιαφέρει η πιθανή μελλοντική απόδοση σε νέα παραδείγματα και όχι η απόδοση στα ήδη δεδομένα υποδείγματα εκπαίδευσης Αποτελεί η τιμή σφάλματος σε ήδη γνωστά δεδομένα αξιόπιστη ένδειξη της τιμής σφάλματος σε νέα δεδομένα; 39

40 Εκπαίδευση & έλεγχος Η απάντηση συνιστά ένα ηχηρό ΌΧΙ όχι στην περίπτωση που τα παλαιά αυτά δεδομένα έχουν χρησιμοποιηθεί στη διαμόρφωση του μοντέλου κατά τη διαδικασία εκπαίδευσης Σφάλμα επαναληπτικής αντικατάστασης (resubstitution error): η τιμή σφάλματος που λαμβάνεται από τα δεδομένα εκπαίδευσης υπολογίζεται με επανατροφοδότηση ενός μοντέλου ταξινόμησης με τα υποδείγματα που χρησιμοποιήθηκαν για την κατασκευή του Καθώς η δομική περιγραφή έχει σχεδιαστεί με τρόπο ώστε να ελαχιστοποιεί το συγκεκριμένο σφάλμα, οποιαδήποτε εκτίμηση της αποδοτικότητάς της βασισμένη στα υποδείγματα αυτά αποτελεί αισιόδοξη, αν όχι ανέλπιστα αισιόδοξη εκτίμηση 40

41 Εκπαίδευση & έλεγχος Σύνολο ελέγχου (test set): ανεξάρτητα υποδείγματα που δεν συμμετείχαν με κανένα τρόπο στη διαδικασία εκπαίδευσης Παραδοχή: αμφότερα τα δεδομένα εκπαίδευσης και ελέγχου συνιστούν αντιπροσωπευτικά δείγματα του υποκείμενου προβλήματος Ωστόσο, τα σύνολα μπορούν να διαφέρουν στη φύση τους Παράδειγμα: κατασκευή μοντέλων ταξινόμησης με χρήση δεδομένων πελατών από δύο διαφορετικές πόλεις Α & Β Για την εκτίμηση της απόδοσης του μοντέλου της πόλης Α σε νέα πόλη, έλεγχος στα δεδομένα της πόλης Β 41

42 Περί ρύθμισης των παραμέτρων Επανάληψη: ιδιαίτερα σημαντική είναι η μη συμμετοχή με οποιοδήποτε τρόπο των δεδομένων ελέγχου στη δημιουργία του μοντέλου Κάποιοι αλγόριθμοι εκμάθησης απαρτίζονται από δύο στάδια: Βήμα 1: κατασκευή της βασικής δομής Βήμα 2: βελτιστοποίηση των παραμέτρων της Τα δεδομένα ελέγχου δεν πρέπει να χρησιμοποιηθούν ούτε για τη ρύθμιση των παραμέτρων! Σε αυτή την περίπτωση τα δεδομένα διαχωρίζονται σε τρία σύνολα: Δεδομένα εκπαίδευσης (training data): για τη δημιουργία των μοντέλων ταξινόμησης Δεδομένα επικύρωσης (validation data): για τη βελτιστοποίηση των παραμέτρων κάθε μοντέλου ή και για την επιλογή του βέλτιστου από αυτά Δεδομένα ελέγχου (test data): για τον υπολογισμό της τιμή σφάλματος της τελικά επιλεγμένης και βελτιστοποιημένης μεθόδου 42

43 Βέλτιστη εκμετάλλευση των δεδομένων Καθώς η επικύρωση έχει ολοκληρωθεί, το σύνολο των δεδομένων μπορεί να χρησιμοποιηθεί για την κατασκευή ή και παραμετροποίηση του τελικού μοντέλου Γενικά, η ποιότητα του μοντέλου είναι ανάλογη του όγκου των διαθέσιμων δεδομένων Αν και συνήθως βαίνει μειούμενη όταν ό όγκος του συνόλου εκπαίδευσης υπερβεί κάποιο όριο Η αξιοπιστία της εκτίμησης του σφάλματος είναι επίσης ανάλογη του όγκου των δεδομένων ελέγχου Διαδικασία παρακράτησης (holdout): διαχωρισμός του αρχικού συνόλου δεδομένων σε σύνολο εκπαίδευσης και ελέγχου Δίλημμα: ιδανικά, αμφότερα τα σύνολα πρέπει να είναι μεγάλα! 43

44 Πρόβλεψη απόδοσης Έστω ότι το εκτιμώμενο σφάλμα ανέρχεται σε 25%. Πόσο κοντά είναι αυτή η εκτίμηση στο πραγματικό σφάλμα; Εξαρτάται από τον όγκο των δεδομένων ελέγχου Η διαδικασία μπορεί να προσομοιωθεί με τη ρίψη ενός (έντονα μεροληπτικού!) κέρματος Η κεφαλή ισοδυναμεί με επιτυχία, τα γράμματα με σφάλμα Μία διαδοχή τέτοιων ανεξάρτητων γεγονότων καλείται διαδοχή Bernoulli Η στατιστική θεωρία παρέχει τα ζητούμενα επίπεδα εμπιστοσύνης 44

45 Επίπεδο εμπιστοσύνης Ημεταβλητήp ανήκει σε ορισμένο διάστημα τιμών με συγκεκριμένο βαθμό εμπιστοσύνης Παράδειγμα: S=750 επιτυχίες σε N=1000 δοκιμές Εκτιμώμενος βαθμός επιτυχίας: 75% Πόσο κοντά είναι η εκτίμηση αυτή στην πραγματική τιμή p; απάντηση: με βαθμό εμπιστοσύνης 80%, p [73.2,76.7] Άλλο παράδειγμα: S=75 και N=100 Εκτιμώμενος βαθμός επιτυχίας: 75% με βαθμό εμπιστοσύνης 80%, p [69.1,80.1] 45

46 Μέση τιμή και τυπική απόκλιση Μέση τιμή και τυπική απόκλιση για μία δοκιμή Bernoulli: p, p (1 p) Εκτιμώμενος βαθμός επιτυχίας f=s/n Μέση τιμή και διασπορά για τον βαθμό επιτυχίας f : p, p (1 p)/n ΓιααρκετάμεγάλοN, ο f ακολουθεί κανονική κατανομή c% διάστημα εμπιστοσύνης [ z X z] γιατυχαίαμεταβλητήμε μέση τιμή 0: Για συμμετρική κατανομή: Pr[ z X z] = c Pr[ z X z] = 1 2 Pr[ X z] 46

47 Διαστήματα εμπιστοσύνης Διαστήματα εμπιστοσύνης για κανονική κατανομή με μέση τιμή 0 και τυπική απόκλιση 1: Pr[X z] 0.1% % z 2.58 Επομένως: Pr[ 1.65 X 1.65] = 90% 1% % % % % 0.25 Για να είναι δόκιμη η χρήση αυτών πρέπει να μετασχηματιστεί η τυχαία μεταβλητή f ώστε να έχει μέση τιμή 0 και τυπική απόκλιση 1 47

48 48 Μετασχηματισμός f Μετασχηματισμένη τιμή της f : (δηλαδή αφαίρεση του μέσου & διαίρεση με την τυπική απόκλιση) Προκύπτει η εξίσωση: Επίλυση ως προς p : N p p p f ) / 1 ( c z N p p p f z = ) / (1 Pr + + ± + = N z N z N f N f z N z f p

49 Παραδείγματα f = 75%, N = 1000, c = 80% (έτσι ώστε z = 1.28): p [0.732,0.767] f = 75%, N = 100, c = 80% (έτσι ώστε z = 1.28): p [0.691,0.801] Σημείωση: η παραδοχή περί κανονικής κατανομής ισχύει μονάχα για μεγάλα N (N > 100) f = 75%, N = 10, c = 80% (έτσι ώστε z = 1.28): p [0.549,0.881] 49

50 Εκτίμηση με παρακράτηση (holdout estimation) Στην περίπτωση που ο όγκος δεδομένων είναι περιορισμένος; Η μέθοδος παρακράτησης (holdout) διατηρεί ένα συγκεκριμένο ποσοστό των δεδομένων προς έλεγχο και χρησιμοποιεί τα υπόλοιπα προς εκπαίδευση Συνήθως: 1/3 για έλεγχο, 2/3 για εκπαίδευση Επίσης παρακρατεί τμήμα αυτών προς επικύρωση, αν απαιτείται Πρόβλημα: τα δείγματα ίσως δεν είναι αντιπροσωπευτικά Παράδειγμα: μία τάξη μπορεί να απουσιάζει στα δεδομένα ελέγχου Μία εξελιγμένη μέθοδος χρησιμοποιεί διαστρωμάτωση (stratification, διαστρωματοποιημένη παρακράτηση, stratified holdout) Διαφυλάσσει την ύπαρξη κάθε τάξης με περίπου ίσες αναλογίες σε όλα τα υποσύνολα Στοιχειώδης εξασφάλιση από ανομοιόμορφες κατανομές στα σύνολα εκπαίδευσης & ελέγχου 50

51 Μέθοδος επαναλαμβανόμενης παρακράτησης Η εκτίμηση με παρακράτηση μπορεί να βελτιωθεί, ως προς την αξιοπιστία της, με την επανάληψη της μεθόδου με χρήση διαφορετικών υποσυνόλων Σε κάθε επανάληψη, ένα συγκεκριμένο ποσοστό επιλέγεται τυχαία για την εκπαίδευση (ίσως και με διαστρωμάτωση) Ο μέσος όρος των τιμών σφάλματος κάθε επανάληψης υποδεικνύει περισσότερο αξιόπιστα τη ζητούμενη εκτίμηση Ημέθοδοςκαλείταιεπαναλαμβανόμενης παρακράτησης (repeated holdout) Ωστόσο, ακόμα μη βέλτιστη: τα διαφορετικά υποσύνολα πιθανά επικαλύπτονται Πώς μπορεί να αποφευχθεί η επικάλυψη; 51

52 Διασταυρωμένη επικύρωση (cross-validation, CV) ΗμέθοδοςCV αποφεύγει το πρόβλημα επικάλυψης των συνόλων εκπαίδευσης Πρώτο βήμα: διάσπαση των δεδομένων σε k ισομεγέθη υποσύνολα Δεύτερο βήμα: χρήσηκάθευποσυνόλουδιαδοχικάγιαέλεγχο, τα υπόλοιπα δεδομένα για εκπαίδευση Διασταυρωμένη επικύρωση k-πτυχών (k-fold CV) Συχνά πραγματοποιείται διαστρωμάτωση πριν την εφαρμογή της διασταυρωμένης επικύρωσης Ο μέσος όρος των k εκτιμήσεων για το σφάλμα αποτελεί μία αξιόπιστη εκτίμηση 52

53 Περισσότερα περί διασταυρωμένης επικύρωσης Τυπική μέθοδος αποτίμησης: διασταυρωμένη επικύρωση 10-πτυχών με διαστρωμάτωση (stratified ten-fold CV) & γιατί 10; Αναλυτικά πειράματα υποδεικνύουν τον αριθμό ως τη βέλτιστη επιλογή για τη λήψη αξιόπιστης εκτίμησης Επίσης υπάρχουν θεωρητικές μαρτυρίες επ αυτού Η διαστρωμάτωση μειώνει τη διακύμανση των εκτιμήσεων Ακόμη περισσότερο αξιόπιστη επιλογή: επαναλαμβανόμενη διασταυρωμένη επικύρωση με διαστρωμάτωση (repeated stratified CV) Για παράδειγμα, διασταυρωμένη επικύρωση 10-πτυχών επαναλαμβάνεται 10 φορές και υπολογίζεται ο μέσος όρος των αποτελεσμάτων Η λήψη αξιόπιστου μέτρου της απόδοσης αποτελεί εγχείρημα υψηλού υπολογιστικού κόστους 53

54 Διασταυρωμένη επικύρωση με αποκλεισμό μιας τιμής Leave-One-Out CV: μία ξεχωριστή μορφή διασταυρωμένης επικύρωσης Αριθμός πτυχών ίσος με αριθμό υποδειγμάτων εκπαίδευσης Για παράδειγμα, για n υποδείγματα εκπαίδευσης, κατασκευή μοντέλου ταξινόμησης n-φορές Πραγματοποιεί βέλτιστη αξιοποίηση των δεδομένων Χρησιμοποιεί το μέγιστο δυνατό υποσύνολο προς εκπαίδευση Δεν περιλαμβάνει τυχαία δειγματοληψία Η διαδικασία είναι ντετερμινιστική Υπερβολικά δαπανηρή σε υπολογιστικό κόστος 54

55 & διαστρωμάτωση; Μειονέκτημα της διασταυρωμένης επικύρωσης με αποκλεισμό μιας τιμής: μη εφικτή διαστρωμάτωση για την ακρίβεια, εγγύηση ανομοιόμορφου υποδείγματος (κάθε σύνολο ελέγχου περιέχει ένα και μόνο υπόδειγμα) Ακραίο παράδειγμα: τυχαίο υποσύνολο χωρίζεται ισοπίθανα σε δύο τάξεις Το βέλτιστο μοντέλο προβλέπει την πλειοψηφούσα στο σύνολο εκπαίδευσης- τάξη Ακρίβεια 50% σε νέα δεδομένα Ωστόσο η ( ) μέθοδος εκτιμά 100% σφάλμα! 55

56 Ημέθοδοςbootstrap (bootstrap = θηλιά για το τράβηγμα μπότας προς το γόνατο) Η διασταυρωμένη επικύρωση χρησιμοποιεί δειγματοληψία χωρίς επανατοποθέτηση Ένα υπόδειγμα, όταν επιλεγεί, δενμπορείναεπιλεγείξανάγια το συγκεκριμένο ζεύγος συνόλων εκπαίδευσης & ελέγχου Ημέθοδοςbootstrap χρησιμοποιεί δειγματοληψία με επανατοποθέτηση για τη δημιουργία του συνόλου εκπαίδευσης Για τη διαμόρφωση ενός συνόλου εκπαίδευσης n υποδειγμάτων, δειγματοληψία n-φορές με επανατοποθέτηση Χρήση των υποδειγμάτων από το αρχικό σύνολο τα οποία δεν συναντώνται στο σύνολο εκπαίδευσης για έλεγχο 56

57 Ημέθοδος0.632 bootstrap Ένα συγκεκριμένο υπόδειγμα έχει πιθανότητα μη επιλογής ίση με 1 1/n Επομένως, η πιθανότητανακαταλήξειστοσύνολο ελέγχου (να μην επιλεγεί σε κάποια δειγματοληψία με επανατοποθέτηση) είναι ίση προς: 1 1 n 1 = Κατά συνέπεια, τα δεδομένα εκπαίδευσης θα περιέχουν περίπου το 63.2% των υποδειγμάτων n e 57

58 Υπολογισμός σφάλματος με τη μέθοδο bootstrap Η βασισμένη στα δεδομένα ελέγχου εκτίμηση του σφάλματος είναι πεσιμιστική Η εκπαίδευση πραγματοποιήθηκε μόνο στο 63% των υποδειγμάτων (ανεξάρτητα από το μέγεθός της n) Για το λόγο αυτό, εισάγεται ο συνδυασμός του με το σφάλμα επαναληπτικής αντικατάστασης (resubstitution error): err = e e test instances training instances Το σφάλμα επαναληπτικής αντικατάστασης λαμβάνει μικρότερη βαρύτητααπότοσφάλματωνδεδομένωνελέγχου Υλοποιείται διαδοχική επανάληψη της διαδικασίας με διαφορετικά δείγματα, στη συνέχεια υπολογίζεται το μέσο των αποτελεσμάτων 58

59 Περισσότερα περί της bootstrap Ίσωςοπλέονβέλτιστοςτρόποςγιατονυπολογισμότης απόδοσης για πολύ μικρά σύνολα δεδομένων Ωστόσο, τα προβλήματα δεν είναι απόντα Έστω το τυχαίο σύνολο δεδομένων που αναφέρθηκε προηγούμενα Το καλύτερο δυνατό μοντέλο θα επιτύχει 0% σφάλμα επαναληπτικής αντικατάστασης και ~50% σφάλμα στα δεδομένα ελέγχου Η εκτίμηση της μεθόδου για αυτό το μοντέλο είναι: err = % % = 31.6% Παραμένει πεσιμιστική, το πραγματικά αναμενόμενο σφάλμα είναι ίσο με 50% 59

60 Σύγκριση διαφορετικών σχημάτων απεικόνισης γνώσης Ποιο από τα διάφορα σχήματα μάθησης εμφανίζει καλύτερη απόδοση; Σημείωση: ηαπάντησηδενείναιοικουμενικήκαιεξαρτάταιαπότο πρόβλημα Προφανής λύση: σύγκριση εκτιμήσεων διασταυρωμένης επικύρωσης 10- πτυχών ικανοποιητική στις περισσότερες των εφαρμογών Πρόβλημα: διακύμανση των εκτιμήσεων Μπορεί να μειωθεί με επαναλαμβανόμενες διασταυρωμένες επικυρώσεις Ωστόσο, η αξιοπιστία των αποτελεσμάτων παραμένει κάποιες φορές αμφιλεγόμενη Η παρατηρούμενη διαφορά μπορεί να οφείλεται σε σφάλμα κατά τη διαδικασία εκτίμησης Απαιτείται τεκμηρίωση περί του αντιθέτου 60

61 Έλεγχος σημαντικότητας Οι έλεγχοι σημαντικότητας αναδεικνύουν το βαθμό εμπιστοσύνης στις υποδείξεις περί διαφοράς απόδοσης των συγκρινόμενων σχημάτων Αν η διαφορά προκύψει σημαντική, εξασφαλίζεται ότι αυτή δεν οφείλεται σε τυχαίους παράγοντες (για παράδειγμα στο επιλεγμένο υποσύνολο του πειράματος) Επειδή η απόδοση είναι συνάρτηση του μεγέθους των δεδομένων εκπαίδευσης, όλα τα σύνολα εκπαίδευσης πρέπει να είναι ισομεγέθη Πράγματι, το πείραμα επαναλαμβάνεται με διαφορετικά μεγέθη ώστε να προκύψει μία καμπύλη μάθησης 61

62 Έλεγχος σημαντικότητας Υπόθεση Μηδενική υπόθεση: η διαφορά δεν είναι στατιστικά σημαντική Εναλλακτική υπόθεση: η διαφορά είναι στατιστικά σημαντική Ο έλεγχος σημαντικότητας καταμετρά τις μαρτυρίες περί αποδοχής ή απόρριψης της μηδενικής υπόθεσης Έστω ότι χρησιμοποιείται διασταυρωμένη επικύρωση 10-πτυχών Ερώτηση: οι μέσοι όροι των εκτιμήσεων διαφέρουν σημαντικά μεταξύ των σχημάτων μάθησης; 62

63 Ζευγαρωτό (paired) t-test Το t-test του Student ελέγχει αν οι μέσες τιμές δύο δειγμάτων διαφέρουν σημαντικά Επιλογή ανεξάρτητων δειγμάτων με χρήση διασταυρωμένης επικύρωσης Χρήση του ζευγαρωτού t-test καθώς τα ανεξάρτητα δείγματα αποτελούν ζεύγος Η ίδια διασταυρωμένη επικύρωση εφαρμόζεται δύο φορές 63

64 Κατανομή των μέσων τιμών Έστω x 1 x 2 x k και y 1 y 2 y k τα 2k δείγματα που προέκυψαν από την διασταυρωμένη επικύρωση k-πτυχών m x και m y οι μέσες τιμές Αν τα δείγματα είναι αρκετά, οι μέσες τιμές του συνόλου των ανεξάρτητων τμημάτων ακολουθούν κανονική κατανομή Εκτιμώμενες διακυμάνσεις των μέσων: σ x2 /k και σ y2 /k x x y Αν μ x και μ y οι πραγματικές μέσες τιμές, τότε 2 2 σ x / k σ y ανήκουν κατά προσέγγιση σε κανονική κατανομή με μέσο 0 και τυπική απόκλιση 1 m μ m μ y / k 64

65 Κατανομή Student Αν τα δείγματα είναι μικρά (k < 100) οι μέσες τιμές ακολουθούν κατανομή Student με k 1 βαθμούς ελευθερίας Όρια εμπιστοσύνης: 9 βαθμοί ελευθερίας κανονική κατανομή Pr[X z] z 0.1% % 1% % % % 0.88 Pr[X z] z 0.1% % 1% % % %

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ Ε Θ Ν Ι Κ Ο Μ Ε Τ Σ Ο Β Ι Ο Π Ο Λ Υ Τ Ε Χ Ν Ε Ι Ο ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ & ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ:

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΧΟΥΧΟΥΜΗΣ ΙΩΑΝΝΗΣ Το σύνολο των

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση Η πληροφορία στη σύγχρονη επιχείρηση Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Πέραν του ανθρώπινου δυναμικού, η πληροφορία αποτελεί τον πλέον πολύτιμο

Διαβάστε περισσότερα

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M. 09470015 AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Διδάσκων: Γιώργος Τζιραλής ΔΠΜΣ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Στάδιο 1 ο. Προεπισκόπηση-προεπεξεργασία δεδομένων: Δίδονται τα παρακάτω

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΠΡΟΕΠΙΣΚΟΠΗΣΗ ΚΑΙ ΕΞΕΡΕΥΝΗΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Τα προς επεξεργασία

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ : ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ ΠΙΘΑΝΟΝΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΓΑΣΙΑ 08: ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ 1 Ο ΣΤΑΔΙΟ: Πριν εφαρμόσουμε οποιοδήποτε αλγόριθμο

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά Μάιος 2008 Τα δεδομένα που έχουμε προς επεξεργασία χωρίζονται σε τρία μέρη: 1. Τα δεδομένα εκπαίδευσης (training set) που αποτελούνται από 2528

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Αναπαράσταση των δεδομένων ως διανύσματα χαρακτηριστικών (feature vectors): Επιλογή ενός

Διαβάστε περισσότερα

Ι. Preprocessing (Επεξεργασία train.arff):

Ι. Preprocessing (Επεξεργασία train.arff): Ονοματεπώνυμο: Κατερίνα Αργύρη Δ.Π.Μ.Σ: Εφαρμοσμένες Μαθηματικές Επιστήμες Ακαδ. Έτος: 2008-2009 1 Για την παρούσα εργασία διατίθενται τρία σύνολα δεδομένων: Δεδομένα Εκπαίδευσης (train set αρχείο train.arff):

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 1 M = 1 N = N prob k N k { k n ω wrongly classfed} = (1 ) N k 2 Η συνάρτηση πιθανοφάνειας L(p) μεγιστοποιείται όταν =k/n. 3 Αφού τα s είναι άγνωστα,

Διαβάστε περισσότερα

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Περιγραφική Ανάλυση ποσοτικών μεταβλητών Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο Εφαρμογές Ανάλυσης Σήματος στη Γεωδαισία Παρουσίαση η : Αρχές εκτίμησης παραμέτρων Μέρος ο Βασίλειος Δ. Ανδριτσάνος Αναπληρωτής Καθηγητής Γεώργιος Χλούπης Επίκουρος Καθηγητής Τμήμα Μηχανικών Τοπογραφίας

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Διδάσκουσα: Χάλκου Χαρά,

Διδάσκουσα: Χάλκου Χαρά, Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr Επιβλεπόμενοι Μη Επιβλεπόμενοι Ομάδα Κατηγορία Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

ΑΠΟΤΥΠΩΣΕΙΣ - ΧΑΡΑΞΕΙΣ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΣΦΑΛΜΑΤΩΝ

ΑΠΟΤΥΠΩΣΕΙΣ - ΧΑΡΑΞΕΙΣ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΣΦΑΛΜΑΤΩΝ ΑΠΟΤΥΠΩΣΕΙΣ - ΧΑΡΑΞΕΙΣ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΣΦΑΛΜΑΤΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις, Ασκήσεις,

Διαβάστε περισσότερα

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ Είναι τεχνικές που έχουν σκοπό: τον εντοπισμό χαρακτηριστικών των οποίων οι αριθμητικές τιμές επιτυγχάνουν

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ DATA MINING ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ 1 ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ Αφού δεν γνωρίζουμε κάποιο τρόπο για να επιλέξουμε εκ των προτέρων την πιο κατάλληλη και αποδοτική μέθοδο μάθησης

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

squared error, Mean absolute error, Root mean squared error) µεγάλωσαν,

squared error, Mean absolute error, Root mean squared error) µεγάλωσαν, ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΜΣ ΣΤΙΣ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΈΤΟΣ 2009 ΌΝΟΜΑ : ΚΑΤΣΑΒΡΙΑΣ ΕΥΑΓΓΕΛΟΣ Α.Μ. : 09480014 ΕΞΑΜΗΝΟ

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Μηχανική Μάθηση: γιατί;

Μηχανική Μάθηση: γιατί; Μηχανική Μάθηση Μηχανική Μάθηση: γιατί; Απαραίτητη για να μπορεί ο πράκτορας να ανταπεξέρχεται σε άγνωστα περιβάλλοντα Δεν είναι δυνατόν ο σχεδιαστής να προβλέψει όλα τα ενδεχόμενα περιβάλλοντα. Χρήσιμη

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 6: Κατηγοριοποίηση Μέρος Β Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 5: Κατηγοριοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το

Διαβάστε περισσότερα

Στάδιο Εκτέλεσης

Στάδιο Εκτέλεσης 16 ΚΕΦΑΛΑΙΟ 1Ο 1.4.2.2 Στάδιο Εκτέλεσης Το στάδιο της εκτέλεσης μίας έρευνας αποτελεί αυτό ακριβώς που υπονοεί η ονομασία του. Δηλαδή, περιλαμβάνει όλες εκείνες τις ενέργειες από τη στιγμή που η έρευνα

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Θ.Ε. ΠΛΗ31 (2004-5) ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ #3 Στόχος Στόχος αυτής της εργασίας είναι η απόκτηση δεξιοτήτων σε θέματα που αφορούν τα Τεχνητά Νευρωνικά Δίκτυα και ποιο συγκεκριμένα θέματα εκπαίδευσης και υλοποίησης.

Διαβάστε περισσότερα

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής Ενότητα 2 Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής Ένας από τους βασικούς σκοπούς της Στατιστικής είναι η εκτίμηση των χαρακτηριστικών ενός πληθυσμού βάσει της πληροφορίας από ένα δείγμα.

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

Αποθήκες εδομένων και Εξόρυξη εδομένων:

Αποθήκες εδομένων και Εξόρυξη εδομένων: Αποθήκες εδομένων και Εξόρυξη εδομένων: Κατηγοριοποίηση: Μέρος Β http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Τοπογραφικά Δίκτυα και Υπολογισμοί 5 ο εξάμηνο, Ακαδημαϊκό Έτος 2016-2017 Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Χριστόφορος Κωτσάκης Τμήμα Αγρονόμων Τοπογράφων Μηχανικών

Διαβάστε περισσότερα

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ Ιωάννα Τζουλάκη Κώστας Τσιλίδης Ιωαννίδης: κεφάλαιο 2 Guyatt: κεφάλαιο 18 ΕΠΙςΤΗΜΟΝΙΚΗ ΙΑΤΡΙΚΗ Επιστήμη (θεωρία) Πράξη (φροντίδα υγείας) Γνωστικό μέρος Αιτιό-γνωση Διά-γνωση Πρό-γνωση

Διαβάστε περισσότερα