Διάλεξη 06: Αλγόριθμοι εκμάθησης ΜέροςΒ Bayes, ΚανόνεςΣυσχέτισης, ΑδρανήςΕκμάθηση & Ομαδοποίηση

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Διάλεξη 06: Αλγόριθμοι εκμάθησης ΜέροςΒ Bayes, ΚανόνεςΣυσχέτισης, ΑδρανήςΕκμάθηση & Ομαδοποίηση"

Transcript

1 ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας Διάλεξη 06: Αλγόριθμοι εκμάθησης ΜέροςΒ Bayes, ΚανόνεςΣυσχέτισης, ΑδρανήςΕκμάθηση & Ομαδοποίηση

2 Αλγόριθμοι Δεδομένα input Αλγόριθμοι Εξόρυξης Πληροφορίας Εξαγόμενα output Η παρούσα διάλεξη αποτελεί το δεύτερο μέρος της εστίασης στον πυρήνα της διαδικασίας εξόρυξης πληροφορίας Θα μελετηθούν η στατιστική μοντελοποίηση, οι κανόνες συσχέτισης, ημάθησημεβάσηυποδείγματακαιη ομαδοποίηση 2

3 Στατιστική μοντελοποίηση Αντιδιαμετρική οπτική του 1R: χρήση όλων των χαρακτηριστικών Υποθέσεις: τα χαρακτηριστικά είναι Εξ ίσου σημαντικά Στατιστικά ανεξάρτητα (given the class value) Δεδομένης της τάξεως, η τιμή ενός χαρακτηριστικού δεν φανερώνει οποιαδήποτε πληροφορία για την τιμή ενός άλλου χαρακτηριστικού Η υπόθεση ανεξαρτησίας δεν επαληθεύεται σε καμία περίπτωση! Ωστόσο οδηγεί σε ένα απλό σχήμα εκμάθησης που και πάλι λειτουργεί πέραν των προσδοκιών ικανοποιητικά στην πράξη 3

4 Δεδομένα καιρού Πιθανότητες Outlook Temperature Humidity Windy Play Yes No Yes No Yes No Yes No Yes No Sunny 2 3 Hot 2 2 High 3 4 False Overcast 4 0 Mild 4 2 Normal 6 1 True 3 3 Rainy 3 2 Cool 3 1 Sunny 2/9 3/5 Hot 2/9 2/5 High 3/9 4/5 False 6/9 2/5 9/14 5/14 Overcast 4/9 0/5 Mild 4/9 2/5 Normal 6/9 1/5 True 3/9 3/5 Rainy 3/9 2/5 Cool 3/9 1/5 Ένα νέο παράδειγμα Πιθανότητα εμφάνισης κάθε τάξης Outlook sunny yes = 2/9 3/9 3/9 3/9 9/14 = Temp. cool no = 3/5 1/5 4/5 3/5 5/14 = Humidity high Μετατροπή σε % πιθανότητα μέσω κανονικοποίησης: Windy true P( yes ) = / ( ) = Play? P( no ) = / ( ) =

5 Ο κανόνας του Bayes (περί πιθανότητας υπό συνθήκη) Πιθανότητα του γεγονότος H δεδομένου του E : Pr[ H E] = Εκ των προτέρων /A priori πιθανότητα του H : Πιθανότητα του γεγονότος προτού γίνει γνωστό το δεδομένο Εκ των υστέρων / A posteriori πιθανότητα του H : Pr[ E H ]Pr[ H ] Pr[ E] Pr[H ] Pr[ H E] Πιθανότητα του γεγονότος αφότου γίνει γνωστό το δεδομένο 5

6 Απλοϊκός (naïve) Bayes για ταξινόμηση Μάθηση ταξινόμησης: ποια η πιθανότητα της τάξης, δεδομένου του υποδείγματος; Δεδομένο E = υπόδειγμα Γεγονός H = τιμή τάξης για το υπόδειγμα Απλοϊκή υπόθεση: το δεδομένο διαχωρίζεται σε τμήματα (βλέπε χαρακτηριστικά) τα οποία είναι ανεξάρτητα Pr[H E] = Pr[E 1 H]Pr[E 2 H] Pr[E n H]Pr[H] Pr[E] 6

7 Δεδομένα καιρού Παράδειγμα Outlook Temp. Humidity Windy Play Sunny Cool High True? Δεδομένο E Πιθανότητα του γεγονότος yes Pr[ yes E] = Pr[ Outlook = Sunny = yes] Pr[ Temperatur e = Cool Pr[ Humidity = High Pr[ Windy = True Pr[ yes] Pr[ E] Pr[ E ] yes] yes] yes] Ο παρανομαστής απαλείφεται κατά την κανονικοποίηση 7

8 Το πρόβλημα μηδενικής συχνότητας Στην περίπτωση που ένα χαρακτηριστικό δεν προκύπτει για μία τιμή της τάξης; (για παράδειγμα Humidity = high για την τάξη yes ) Η πιθανότητα μηδενίζεται Το ίδιο και η εκ των υστέρων πιθανότητα Pr[ Humidity = High yes] = Pr[ yes E] = Θεραπεία: προσθήκη μονάδας στην απαρίθμηση κάθε συνδυασμού τιμής χαρακτηριστικού-τάξης (εκτιμητής Laplace) Αποτέλεσμα: έκλειψη φαινομένου μηδενικής πιθανότητας Παράπλευρη συνέπεια: σταθεροποίηση εκτιμήσεων πιθανότητας 0 0 8

9 Τροποποιημένες εκτιμήσεις πιθανότητας Σε κάποιες περιπτώσεις, η πρόσθεση σταθεράς διαφορετικής της μονάδας εμφανίζει μεγαλύτερη καταλληλότητα Παράδειγμα: χαρακτηριστικό outlook για την τάξη yes 2 + μ / μ Sunny 2 + μp1 9 + μ 4 + μ / μ Overcast μp 9 + μ 3 + μ / μ Rainy + μp 9 + μ 3 3 Δεν είναι αναγκαία η ισότητα των βαρών ωστόσο το άθροισμά τους πρέπει να είναι ίσο της μονάδας 9

10 Άγνωστες τιμές Εκπαίδευση: το υπόδειγμα δεν περιλαμβάνεται στην καταμέτρηση συχνότητας των συνδυασμών τιμής χαρακτηριστικού-τάξης Ταξινόμηση: το χαρακτηριστικό παραλείπεται κατά τον υπολογισμό Παράδειγμα: Outlook Temp. Humidity Windy Play? Cool High True? Πιθανότητα yes = 3/9 3/9 3/9 9/14 = Πιθανότητα no = 1/5 4/5 3/5 5/14 = P( yes ) = / ( ) = 41% P( no ) = / ( ) = 59% 10

11 Αριθμητικά χαρακτηριστικά Συνήθης υπόθεση: τα χαρακτηριστικά ακολουθούν κανονική κατανομή (δεδομένης της τάξης) Η συνάρτηση πυκνότητας πιθανότητας της κανονικής κατανομής καθορίζεται από δύο παραμέτρους: Μέσο μ του δείγματος Τυπική απόκλιση σ Η συνάρτηση πυκνότητας f(x) τότε είναι 1 μ = σ = f n n i= 1 1 x i n n 1 i= 1 ( x i μ) ( x μ ) 1 2 2σ ( x) = e 2πσ

12 Στατιστικά δεδομένα καιρού Outlook Temperature Humidity Windy Play Yes No Yes No Yes No Yes No Yes No Sunny , 68, 65, 71, 65, 70, 70, 85, False Overcast , 70, 72, 80, 70, 75, 90, 91, True 3 3 Rainy , 85, 80, 95, Sunny 2/9 3/5 μ =73 μ =75 μ =79 μ =86 False 6/9 2/5 9/14 5/14 Overcast 4/9 0/5 σ =6.2 σ =7.9 σ =10.2 σ =9.7 True 3/9 3/5 Rainy 3/9 2/5 Παράδειγμα τιμής πυκνότητας: f ( temperature (66 73) = 66 yes) = 1 e 2π =

13 Ταξινόμηση νέου παραδείγματος Νέο παράδειγμα: Outlook Temp. Humidity Windy Play Sunny true? Πιθανότητα yes = 2/ /9 9/14 = Πιθανότητα no = 3/ /5 5/14 = P( yes ) = / ( ) = 20.9% P( no ) = / ( ) = 79.1% Οι άγνωστες τιμές δεν λαμβάνονται υπ όψιν κατά τη διάρκεια της εκπαίδευσης για τον υπολογισμό του μέσου και της τυπικής απόκλισης 13

14 Γενικά περί απλοϊκού Bayes Αποδίδει ικανοποιητικά, πέραν του αναμενόμενου (ακόμα και αν η υπόθεση περί ανεξαρτησίας παραβιάζεται ξεκάθαρα) Πάγια τακτική: αρχικός πειραματισμός με απλοϊκά σχήματα Αίτιο; Η ταξινόμηση δεν απαιτεί ακριβείς εκτιμήσεις πιθανότητας με την προϋπόθεση ότι η μέγιστη πιθανότητα εκχωρείται στη σωστή τάξη Ωστόσο: η προσθήκη μεγάλου αριθμού περιττών χαρακτηριστικών προκαλεί προβλήματα (για παράδειγμα πανομοιότυπα χαρακτηριστικά) Επίσης: συχνά τα αριθμητικά χαρακτηριστικά δεν ακολουθούν κανονική κατανομή ( εκτιμητές πυκνότητας πυρήνα (kernel density estimators) ή διακριτοποίηση) 14

15 @weka AODE Averaged, one-dependence estimators BayesNet Learn Bayesian nets Για περισσότερα ComplementNaiveBayes Build a Complement Naïve Bayes classifier NaiveBayes Standard probabilistic Naïve Bayes classifier NaiveBayesMultinomial Multinomial version of Naïve Bayes NaiveBayesSimple Simple implementation of Naïve Bayes NaiveBayesUpdateable Incremental Naïve Bayes classifier that learns one instance at a time 15

16 Κανόνες συσχέτισης (association rules) Οι κανόνες συσχέτισης μπορούν να προβλέψουν οποιοδήποτε χαρακτηριστικό ή συνδυασμό χαρακτηριστικών και όχι μόνο την τάξη δεν χρησιμοποιούνται υποχρεωτικά ως σύνολο Πρόβλημα: αχανής αριθμός πιθανών συσχετίσεων Απαιτείται η θέσπιση περιορισμών ώστε να αναδειχθούν μόνο οι σημαντικότερες των προβλεπτικών συσχετίσεων μόνο εκείνες με υψηλή υποστήριξη (support) και υψηλή εμπιστοσύνη (confidence) 16

17 Υποστήριξη & εμπιστοσύνη κανόνα Υποστήριξη (support): αριθμός υποδειγμάτων επιτυχούς πρόβλεψης Εμπιστοσύνη (confidence): αριθμός επιτυχών προβλέψεων, ως ποσοστό του συνόλου των υποδειγμάτων στα οποία εφαρμόζεται ο κανόνας Παράδειγμα: 4 ημέρες με temperature cool και humidity normal If temperature = cool then humidity = normal Support = 4, confidence = 100% Συνήθως προκαθορίζονται ελάχιστες τιμές υποστήριξης και εμπιστοσύνης για παράδειγμα 58 κανόνες με υποστήριξη 2 και εμπιστοσύνη 95% για τα δεδομένα καιρού 17

18 Εξόρυξη κανόνων συσχέτισης Απλοϊκή μέθοδος εύρεσης κανόνων συσχέτισης: Χρήση μεθόδου διαίρει & βασίλευε (separate-and-conquer) Χειρισμός κάθε δυνατού συνδυασμού τιμών των χαρακτηριστικών ως ξεχωριστή τάξη Προβλήματα: Υπολογιστική πολυπλοκότητα Προκύπτει ογκώδες σύνολο κανόνων (απαιτείται ο περιορισμός του με βάση τα μεγέθη της εμπιστοσύνης και της υποστήριξης) Ωστόσο: η απευθείας αναζήτηση κανόνων με υψηλή υποστήριξη είναι εφικτή! 18

19 Σύνολα στοιχείων (item sets) Υποστήριξη (support): αριθμός υποδειγμάτων που καλύπτονται επιτυχώς από τον κανόνα συσχέτισης Όμοιος του αριθμού υποδειγμάτων που καλύπτονται από το σύνολο των ελέγχων ενός κανόνα Στοιχείο (item): ένα ζεύγος ελέγχου / χαρακτηριστικούτιμής one test/attribute-value pair Σύνολο στοιχείων (item set): το σύνολο των items που προκύπτουν σε ένα κανόνα Στόχος: το σύνολο των κανόνων που υπερβαίνουν προκαθορισμένη υποστήριξη Υλοποίηση: εύρεση όλων των συνόλων στοιχείων δεδομένης ελάχιστης υποστήριξης και παραγωγή κανόνων από αυτά 19

20 Σύνολα στοιχείων γιαταδεδομένακαιρού One-item sets Two-item sets Three-item sets Four-item sets Outlook = Sunny (5) Outlook = Sunny Outlook = Sunny Outlook = Sunny Temperature = Hot (2) Temperature = Hot Temperature = Hot Humidity = High (2) Humidity = High Play = No (2) Temperature = Cool (4) Outlook = Sunny Outlook = Sunny Outlook = Rainy Humidity = High (3) Humidity = High Temperature = Mild Windy = False (2) Windy = False Play = Yes (2) Τελικά: 12 σύνολα ενός στοιχείου, 47 σύνολα δύο στοιχείων, 39 σύνολα τριών στοιχείων, 6 σύνολα τεσσάρων στοιχείων και 0 σύνολα πέντε στοιχείων (με ελάχιστη υποστήριξη ίση με δύο) 20

21 Παραγωγή κανόνων απόσύνολοστοιχείων Καθώς έχουν παραχθεί όλα τα σύνολα στοιχείων δεδομένης ελάχιστης υποστήριξης, η μετατροπή τους σε κανόνες είναι πλέον εφικτή Παράδειγμα συνόλου στοιχείων: Humidity = Normal, Windy = False, Play = Yes (4) Επτά (2 N -1) πιθανοί κανόνες: If Humidity = Normal and Windy = False then Play = Yes If Humidity = Normal and Play = Yes then Windy = False If Windy = False and Play = Yes then Humidity = Normal If Humidity = Normal then Windy = False and Play = Yes If Windy = False then Humidity = Normal and Play = Yes If Play = Yes then Humidity = Normal and Windy = False If - then Humidity = Normal and Windy = False and Play = Yes 4/4 4/6 4/6 4/7 4/8 4/9 4/12 21

22 Κανόνες για τα δεδομένα καιρού Κανόνες με υποστήριξη > 1 και εμπιστοσύνη = 100%: Association rule 1 Humidity=Normal Windy=False Sup. Conf. Play=Yes 4 100% 2 Temp=Cool Humidity=Normal 4 100% 3 Outlook=Overcast Play=Yes 4 100% 4 Temp=Cold Play=Yes Humidity=Normal 3 100% Outlook=Sunny Temp=Hot Humidity=High 2 100% Συνολικά: 3 κανόνες με υποστήριξη 4 5 με υποστήριξη 3 50 με υποστήριξη 2 22

23 Σύνολο στοιχείων: Παράδειγμα κανόνων απότοίδιοσύνολο Temperature = Cool, Humidity = Normal, Windy = False, Play = Yes (2) Κανόνες που προκύπτουν (100% εμπιστοσύνη): Temperature = Cool, Windy = False Humidity = Normal, Play = Yes Temperature = Cool, Windy = False, Humidity = Normal Play = Yes Temperature = Cool, Windy = False, Play = Yes Humidity = Normal με βάση τα ακόλουθα συχνά σύνολα στοιχείων: Temperature = Cool, Windy = False (2) Temperature = Cool, Humidity = Normal, Windy = False (2) Temperature = Cool, Windy = False, Play = Yes (2) 23

24 Αποτελεσματική δημιουργία συνόλου στοιχείων Αναζητείται αποτελεσματικός τρόπος εύρεσης όλων των συνόλων στοιχείων μεγάλης συχνότητας Η εύρεση των συνόλων ενός στοιχείου είναι εύκολη Ιδέα: χρήση συνόλων ενός στοιχείου για την παραγωγή συνόλων δύο στοιχείων, συνόλων δύο στοιχείων για την παραγωγή συνόλων τριών στοιχείων, Αν (A B) είναι σύνολο στοιχείων υψηλής συχνότητας, τότε τα (A) και (B) πρέπει να είναι επίσης συχνά σύνολα στοιχείων! Γενίκευση: αν X ένα σύνολο k-στοιχείων υψηλής συχνότητας, τότε τα υποσύνολα (k-1)-στοιχείων του X είναι επίσης υψηλής συχνότητας Υπολογισμός συνόλου k-στοιχείων με συγχώνευση των συνόλων (k-1)-στοιχείων 24

25 Παράδειγμα Δεδομένα: 5 σύνολα 3-στοιχείων (A B C), (A B D), (A C D), (A C E), (B C D) Σε αλφαβητική σειρά! Υποψήφια σύνολα 4 στοιχείων: (A B C D) OK λόγω του (B C D) (A C D E) Not OK λόγω του (C D E) Τελικός έλεγχος με καταμέτρηση υποδειγμάτων στο σύνολο δεδομένων Τα σύνολα (k 1)-στοιχείων αποθηκεύονται σε πίνακα κατακερματισμού (hash table) 25

26 Αποδοτική δημιουργία κανόνων Αναζήτηση του συνόλου των κανόνων με υψηλή εμπιστοσύνη Η υποστήριξη των προγόνων λαμβάνεται από τον πίνακα κατακερματισμού Η εξαντλητική αναζήτηση υποδεικνύει 2 N -1 κανόνες Βελτιωμένη έκδοση: κατασκευή κανόνα με (c + 1)- επακόλουθα από κανόνες με c-επακόλουθα Παρατήρηση: ο κανόνας με (c + 1)-επακόλουθα έχει ισχύ μόνο εάν το σύνολο των κανόνων με c-επακόλουθα ισχύουν επίσης Προκύπτει αλγόριθμος όμοιος εκείνου περί κατασκευής εκτενούς συνόλου στοιχείων 26

27 Παράδειγμα Κανόνες με 1-επακόλουθο: If Outlook = Sunny and Windy = False and Play = No then Humidity = High (2/2) If Humidity = High and Windy = False and Play = No then Outlook = Sunny (2/2) Αντίστοιχος κανόνας 2-επακόλουθων: If Windy = False and Play = No then Outlook = Sunny and Humidity = High (2/2) Τελικός έλεγχος συμβατότητας προγόνων με τον πίνακα κατακερματισμού 27

28 Γενικά περί κανόνων συσχέτισης Η προηγούμενη μέθοδος υλοποιεί μία σάρωση των δεδομένων για κάθε διαφορετικό μέγεθος συνόλου στοιχείων Εναλλακτικά: δημιουργία συνόλων (k+2)-στοιχείων αμέσως μετά από τη δημιουργία συνόλων (k+1)-στοιχείων Προκύπτουν περισσότερα των αναγκαίων σύνολα (k+2)- στοιχείων, αλλά λιγότερες σαρώσεις των δεδομένων Χρήσιμη μέθοδος στην περίπτωση που ο όγκος των δεδομένων είναι μεγάλος για τη διαθέσιμη μνήμη Πρακτικό ζήτημα: παραγωγή συγκεκριμένου αριθμού κανόνων (για παράδειγμα μέσω βηματικής μείωσης της ελάχιστης επιτρεπόμενης υποστήριξης) 28

29 Άλλα ζητήματα Το τυπικό format.arff είναι μη αποδοτικό για δεδομένα καλαθιού αγοράς (market basket data) Τα χαρακτηριστικά απεικονίζουν τα αντικείμενα ενός καλαθιού και συνήθως τα περισσότερα προϊόντα απουσιάζουν Απαιτείται τρόπος απεικόνισης αραιών (sparse) δεδομένων Τα υποδείγματα καλούνται επίσης συναλλαγές (transactions) Η εμπιστοσύνη δεν είναι απαραίτητα το βέλτιστο μέτρο Παράδειγμα: το προϊόν γάλα προκύπτει σε κάθε σχεδόν συναλλαγή ενός supermarket Άλλα μέτρα έχουν επινοηθεί, όπως για παράδειγμα lift 29

30 @weka Apriori Find association rules using the Apriori algorithm PredictiveApriori Find association rules sorted by predictive accuracy Tertius Confirmation-guided discovery of association or classification rules 30

31 Απεικόνιση με βάση υποδείγματα (instance-based representation) Απλούστερη μορφή μάθησης: αποστήθιση (rote learning) Τα υποδείγματα εκπαίδευσης ερευνώνται για την εύρεση του περισσότερο όμοιου προς το νέο παράδειγμα υποδείγματος Τα υποδείγματα αυτά καθαυτά αναπαριστούν τη γνώση Η μάθηση καλείται επίσης ως βασισμένη στα υποδείγματα Η συνάρτηση ομοιότητας καθορίζει το αποτέλεσμα της μαθησιακής διαδικασίας Η βασισμένη στα υποδείγματα μάθηση είναι αδρανής (lazy) Μέθοδοι: Πλησιέστερος γείτονας (nearest-neighbor, ΝΝ) k-πλησιέστεροι γείτονες (k-nearest-neighbor, k-nn) 31

32 Συνάρτηση απόστασης Απλούστερη περίπτωση: ένα αριθμητικό χαρακτηριστικό Η απόσταση ορίζεται ως η διαφορά των δύο τιμών του χαρακτηριστικού (ή μία συνάρτηση αυτών) Περισσότερα αριθμητικά χαρακτηριστικά: συνήθως χρησιμοποιείται η Ευκλείδεια απόσταση, όπου οι τιμές των χαρακτηριστικών έχουν κανονικοποιηθεί Ονομαστικά χαρακτηριστικά: απόσταση = 1 για διαφορετικές τιμές, απόσταση = 0 για ίδιες τιμές του χαρακτηριστικού Είναι όλα τα χαρακτηριστικά εξ ίσου σημαντικά; Η εκχώρηση βαρύτητας στα χαρακτηριστικά είναι ίσως αναγκαία 32

33 Μάθηση βασισμένη στα υποδείγματα Η συνάρτηση απόσταση καθορίζει το αποτέλεσμα της μάθησης Τα περισσότερα βασισμένα σε υποδείγματα σχήματα χρησιμοποιούν την Ευκλείδεια απόσταση: (1) (2) 2 (1) (2) 2 (1) (2) 2 ( a1 a1 ) + ( a2 a2 ) ( a k ak ) a (1) και a (2) : δύο υποδείγματα με k χαρακτηριστικά Η τετραγωνική ρίζα δεν είναι αναγκαία όταν υλοποιείται σύγκριση αποστάσεων Άλλο σύνηθες μέτρο: μέτρο οικοδομικού τετραγώνου (cityblock metric) Πρόσθεση απόλυτων διαφορών και όχι των τετραγώνων τους 33

34 Κανονικοποίηση και άλλα ζητήματα Τα διάφορα χαρακτηριστικά μετρώνται σε διαφορετικές κλίμακες απαιτείται κανονικοποίηση αυτών: a i = vi min vi maxv min v i i v i : η πραγματική τιμή του χαρακτηριστικού i Ονομαστικά χαρακτηριστικά: απόσταση ίση με 0 ή 1 Συνήθης πολιτική για απούσες τιμές: θεώρηση μέγιστης απόστασης (για κανονικοποιημένα χαρακτηριστικά) 34

35 Γενικά περί αλγορίθμου 1-NN Συχνά πολύ ακριβής αλγόριθμος Ωστόσο αργός Η απλοϊκή έκδοση σαρώνει όλα τα δεδομένα εκπαίδευσης για την εκπόνηση μιας πρόβλεψης Υποθέτει ισοδύναμη σημαντικότητα όλων των χαρακτηριστικών Θεραπεία: επιλογή χαρακτηριστικών είτε εκχώρηση βαρύτητας Πρόβλημα υποδειγμάτων με υψηλό θόρυβο: Εκχώρηση ψήφου πλειοψηφίας των k πλησιέστερων γειτόνων Απομάκρυνση των υποδειγμάτων αυτών από το σύνολο των δεδομένων (δύσκολη!) Η μέθοδος χρησιμοποιείται στη στατιστική ήδη από το 1950 Αν n και k/n 0, το σφάλμα προσεγγίζει την ελάχιστη τιμή του n ο αριθμός των υποδειγμάτων 35

36 Μάθηση βασισμένη στα υποδείγματα Πρακτικά προβλήματα του σχήματος 1-NN: Αργό (ωστόσο υπάρχουν διαθέσιμες ταχύτερες προσεγγίσεις βασισμένες σε δενδρική δομή) Θεραπεία: απομάκρυνση μη συσχετιζόμενων δεδομένων Θόρυβος (ωστόσοοαλγόριθμοςk -NN αντιμετωπίζει επιτυχώς το θόρυβο) Θεραπεία: απομάκρυνση υποδειγμάτων με υψηλό ποσοστό θορύβου Ηβαρύτηταόλωντωνχαρακτηριστικώνθεωρείταισταθερή Θεραπεία: εκχώρηση βαρύτητας στα χαρακτηριστικά (ή απλά επιλογή) Δεν υλοποιείται γενίκευση θεραπεία: πλησιέστεροι γείτονες βασισμένοι σε κανόνες 36

37 Εκμάθηση προτοτύπων Αναγκαία η αποθήκευση των υποδειγμάτων εκείνων που συνδιαμορφώνουν αποφάσεις και μόνο αυτών Αποκοπή υποδειγμάτων με υψηλό θόρυβο Ιδέα: χρήση των πρωτότυπων (prototypical) παραδειγμάτων και μόνο αυτών 37

38 Επιτάχυνση και αντιμετώπιση θορύβου IB2 (Instance-Based Learner version 2): μικρότερες απαιτήσεις μνήμης, επιτάχυνση ταξινόμησης Λειτουργεί βηματικά Ενσωματώνει μονάχα τα υποδείγματα που ταξινομούνται ανεπιτυχώς Πρόβλημα: σε αυτά συγκαταλέγονται δεδομένα με θόρυβο IB3: χειρισμός θορύβου Μέθοδος 1: k-πλησιέστεροι γείτονες Εκχώρηση της πλειοψηφούσας τάξης στο άγνωστο παράδειγμα Μέθοδος 2: απόρριψη υποδειγμάτων με χαμηλή απόδοση Υπολογισμός επιπέδου εμπιστοσύνης για 1. Το βαθμό επιτυχίας κάθε υποδείγματος 2. Προκαθορισμένη ακρίβεια της τάξης του Αποδοχή / απόρριψη υποδειγμάτων Αποδοχή εάν το κατώτερο όριο του 1 υπερβαίνει το ανώτερο όριο του 2 Απόρριψη εάν το ανώτερο όριο του 1 χαμηλότερο του κατωτέρου ορίου του 2 38

39 Βαρύτητα χαρακτηριστικών IB5: εκχώρηση βαρύτητας σε κάθε χαρακτηριστικό οι βαρύτητες δύναται να εξαρτώνται και από την τάξη Σταθμισμένη Ευκλείδεια απόσταση: w ( x1 y1) wn ( xn yn) Ενημέρωση βαρών με βάση τον πλησιέστερο γείτονα Πρόβλεψη τάξης αληθής: αύξηση βαρύτητας Πρόβλεψη τάξης ψευδής: μείωση βαρύτητας Το ποσό μεταβολής του i-οστού χαρακτηριστικού εξαρτάται από την απόλυτη διαφορά x i - y i 39

40 Ορθογώνια γενίκευσης Ο κανόνας ΝΝ χρησιμοποιείται εκτός των ορθογωνίων Τα ορθογώνια ουσιαστικά συνιστούν κανόνες Ωστόσο είναι περισσότερο συντηρητικά από τους συνήθεις κανόνες Τα ένθετα ορθογώνια αποτελούν κανόνες με εξαιρέσεις 40

41 Γενικευμένα υποδείγματα Γενίκευση υποδειγμάτων σε υπερορθογώνια (hyperrectangles) Online: βηματική τροποποίηση ορθογωνίων Offline version: αναζήτηση μικρού συνόλου ορθογωνίων που καλύπτουν τα υποδείγματα Σημαντικές αποφάσεις κατά το σχεδιασμό: Επιτρεπόμενη η επικάλυψη των ορθογωνίων; Απαιτεί απόφαση περί αντικρουόμενων υποδείξεων Επιτρεπόμενη η ένθεση των ορθογωνίων; Σχετικά με τα μη καλυπτόμενα υποδείγματα; 41

42 Διαχωρισμός κατά τη γενίκευση υποδειγμάτων Class 1 Class 2 Γραμμή διαχωρισμού 42

43 @weka IB1 Basic nearest-neighbor instance-based learner IBk k-nearest-neighbor classifier KStar Nearest neighbor with generalized distance function LBR Lazy Bayesian Rules classifier LWL General algorithm for locally weighted learning 43

44 Ομαδοποίηση (clustering) Μάθηση χωρίς επίβλεψη (unsupervised): δεν υπάρχει διαθέσιμη τιμήστόχος της πρόβλεψης Διαφοροποιήσεις μεταξύ μοντέλων / αλγορίθμων: Αποκλειστικά ή επικαλυπτόμενα Ντετερμινιστικά ή πιθανοκρατικά Ιεραρχικής ή επίπεδης δομής Μάθηση βηματική ή σε παρτίδες (batch) Πρόβλημα: Αποτίμηση; συνήθως με επιθεώρηση Ωστόσο: αν θεωρηθεί ως πρόβλημα εκτίμησης πυκνότητας, οι ομάδες μπορούν να αποτιμηθούν στα δεδομένα ελέγχου 44

45 Ιεραρχική ομαδοποίηση Από κάτω προς τα πάνω Εκκίνηση με ομάδες ενός υποδείγματος Σε κάθε βήμα, ένωση των δύο πλησιέστερων ομάδων Απόφαση με βάση την απόσταση μεταξύ των ομάδων Για παράδειγμα δύο πλησιέστερα υποδείγματα ή απόσταση μεταξύ μέσων ομάδων Από πάνω προς τα κάτω Εκκίνηση με μία καθολική ομάδα Εύρεση δύο υποομάδων Επανάληψη διάσπασης σε κάθε υποσύνολο Μπορεί να αποδειχθεί ιδιαίτερα γρήγορη Αμφότερες οι μέθοδοι παράγουν δενδρόγραμμα g a c i e d k b j f h 45

46 Οαλγόριθμοςk-μέσων Για την ομαδοποίηση δεδομένων σε k ομάδες: (k: προκαθορισμένο) 1. Επιλογή k κέντρων ομάδων Για παράδειγμα με τυχαίο τρόπο 2. Εκχώρηση υποδειγμάτων σε ομάδες Με βάση την απόσταση από το κέντρο των ομάδων 3. Υπολογισμός κεντροειδών (centroids) των ομάδων 4. Επανάληψη του βήματος 1 Μέχρι τη σύγκλιση 46

47 Γενικά περί ιεραρχικής ομαδοποίησης Το αποτέλεσμα μπορεί να ποικίλει σημαντικά Ανάλογα της αρχικής επιλογής των κάντρων Ο αλγόριθμος συχνά παγιδεύεται σε τοπικό ακρότατο Παράδειγμα: υπόδειγμα αρχικά κέντρα ομάδων Για την αύξηση της πιθανότητας εύρεσης ολικού βέλτιστου: επανάληψη της διαδικασίας με διαφορετικές τυχαίες αρχικές επιλογές 47

48 Βηματική ομαδοποίηση Ευρετική μέθοδος (Cobweb/Classit) Βηματική διαμόρφωση ιεραρχίας ομάδων Εκκίνηση: Το δένδρο αποτελείται από τον κενό κόμβο της ρίζας Στη συνέχεια: Προσθήκη υποδειγμάτων ένα προς ένα Ενημέρωση του δένδρου με κατάλληλο τρόπο σε κάθε βήμα Μέσω εύρεσης κατάλληλου φύλλου για κάθε υπόδειγμα Ίσως περιλαμβάνει αναδόμηση του δένδρου Οι αποφάσεις προσθήκης και ενημέρωσης βασίζονται στο μέγεθος ωφέλειας τάξης (category utility, βλέπε παρακάτω) 48

49 Ομαδοποίηση δεδομένων καιρού ID Outlook Temp. Humidity Windy A Sunny Hot High False B Sunny Hot High True 1 C D E F G H I J K L M N Overcast Hot High False Rainy Mild High False Rainy Cool Normal False Rainy Cool Normal True Overcast Cool Normal True Sunny Mild High False Sunny Cool Normal False Rainy Mild Normal False Sunny Mild Normal True Overcast Mild High True Overcast Hot Normal False Rainy Mild High True

50 Ομαδοποίηση δεδομένων καιρού ID Outlook Temp. Humidity Windy A Sunny Hot High False B Sunny Hot High True 4 C D E F G H I J K L M N Overcast Hot High False Rainy Mild High False Rainy Cool Normal False Rainy Cool Normal True Overcast Cool Normal True Sunny Mild High False Sunny Cool Normal False Rainy Mild Normal False Sunny Mild Normal True Overcast Mild High True Overcast Hot Normal False Rainy Mild High True 5 ένωση βέλτιστου και δεύτερου φύλλου 3 Διάσπαση βέλτιστου φύλλου εάν η ένωση δεν ωφελεί 50

51 Τελική ιεραρχία ID Outlook Temp. Humidity Windy A B C D Sunny Hot High False Sunny Hot High True Overcast Hot High False Rainy Mild High False Τα a & b είναι στην πράξη παρόμοια, όμως περιλήφθηκαν σε άλλη ομάδα 51

52 Παράδειγμα: δεδομένα ίρις (υποσύνολο) 52

53 Ομαδοποίηση με αποκοπή Παράμετρος αποκοπής (cutoff): ηαύξησητηςωφέλειαςτάξηςαπό την εισαγωγή νέου κλάδου πρέπει να υπερβαίνει την τιμή της παραμέτρου 53

54 Ωφέλεια τάξης (category utility) Ωφέλεια τάξης (category utility, CU): εκφράζει τη συνολική ποιότητα του διαχωρισμού των υποδειγμάτων σε ομάδες Συνάρτηση απωλειών δευτέρου βαθμού με βάση τις πιθανότητες υπό συνθήκη: 1 CU C C C C a v C a v 2 2 ( 1, 2,..., k) = Pr[ l] (Pr[ i = ij l] Pr[ i = ij] ) k l i j Η Pr[a i =v ij C l ] αποτελεί καλύτερη εκτίμηση της πιθανότητας το χαρακτηριστικό a i να έχει τιμή v ij, για ένα υπόδειγμα που ανήκει στην ομάδα C l, από ότι η Pr[a i =v ij ]. Αν αυτή η πληροφορία δεν έχει αξία, η ομαδοποίηση είναι ανεπιτυχής! Επομένως, το μέτρο εν τέλει αποτιμά το κέρδος πληροφορίας από την εισαγωγή των ομάδων 54

55 Αριθμητικά χαρακτηριστικά Υπόθεση κανονικής κατανομής: Τότε j f ( a μ ) 1 2 ( a) = e 2σ 2πσ 2 = 2 Pr[ ai vij ] f ( ai ) dai = 2 1 πσ 2 i Επομένως CU = Pr[ Cl ] k l 2 π i σ il σ i Προκαθορισμένη ελάχιστη διακύμανση Εισαγωγή παραμέτρου οξύτητας (acuity) Αντιμετωπίζει το πρόβλημα variance = 0 (CU Cobweb 55

56 Πιθανοκρατική ομαδοποίηση Προβλήματα ευρετικής προσέγγισης: Προκαθορισμένος αριθμός ομάδων k Προκαθορισμένες / ανά περίπτωση τιμές παραμέτρων αποκοπής και οξύτητας Κατάταξη υποδειγμάτων Αποδοτικότητα λειτουργιών απόδοσης δένδρου Κατάληξη σε τοπικό ακρότατο της συνάρτησης ωφέλειας τάξης Πιθανοκρατική θεώρηση αναζήτηση των πλέον πιθανών ομάδων για τα διαθέσιμα δεδομένα Επίσης, κάθε υπόδειγμα ανήκει με συγκεκριμένη πιθανότητα σε συγκεκριμένη ομάδα 56

57 Πεπερασμένες αναμείξεις (finite mixtures) Μοντελοποίηση των δεδομένων με χρήση ενός μείγματος κατανομών Μία ομάδα, μία κατανομή Καθορίζει τις πιθανότητες των τιμών των χαρακτηριστικών σε αυτή την ομάδα Πεπερασμένες αναμείξεις (finite mixtures): πεπερασμένος αριθμός ομάδων Η κατανομή κάθε ομάδας ορίζεται συνήθως ως κανονική Συνδυασμός κατανομών με βάση τη βαρύτητα κάθε ομάδας 57

58 Μοντέλο ανάμειξης δύο τάξεων δεδομένα A 51 A 43 B 62 B 64 A 45 A 42 A 46 A 45 A 45 B 62 A 47 A 52 B 64 A 51 B 65 A 48 A 49 A 46 B 64 A 51 A 52 B 62 A 49 A 48 B 62 A 43 A 40 A 48 B 64 A 51 B 63 A 43 B 65 B 66 B 65 A 46 A 39 B 62 B 64 A 52 B 63 B 64 A 48 B 64 A 48 A 51 A 48 B 64 A 42 A 48 A 41 μοντέλο μ A =50, σ A =5, p A =0.6 μ B =65, σ B =2, p B =0.4 58

59 Χρήση μοντέλου ανάμειξης Πιθανότητα το υπόδειγμα x να ανήκει στην ομάδα A: Pr[ A x] = Pr[ x A]Pr[ A] Pr[ x] = f ( x; μ A, σ A ) Pr[ x] p A με f ( x μ ) 1 2 ( x; μ, σ ) = e 2σ 2πσ 2 Πιθανότητα ενός υποδείγματος, δεδομένων των ομάδων Pr[ x the distributions] = i Pr[ x cluster ]Pr[cluster ] i i 59

60 Εκμάθηση ομάδων Υπόθεση: k ομάδες Εκμάθηση ομάδων Προσδιορισμός των παραμέτρων τους Δηλαδή μέσων τιμών και τυπικών αποκλίσεων Κριτήριο απόδοσης: Πιθανότητα των δεδομένων εκπαίδευσης με γνωστές τις ομάδες Αλγόριθμος EM Εύρεση τοπικού μεγίστου της πιθανότητας 60

61 Αλγόριθμος EM EM = Expectation-Maximization (Μεγιστοποίησης Εκτίμησης Γενίκευση των k-μέσων σε πιθανοκρατικό πλαίσιο Επαναληπτική διαδικασία: Βήμα E expectation : Υπολογισμός πιθανότητας ομάδας για κάθε υπόδειγμα Βήμα M maximization : εκτίμηση παραμέτρων κατανομών από τις πιθανότητες των ομάδων Αποθήκευση πιθανοτήτων ομάδων ως βαρύτητες υποδειγμάτων Διακοπή όταν η βελτίωση είναι αμελητέα 61

62 62 Περισσότερα περί του EM Εκτίμηση παραμέτρων από υποδείγματα με βαρύτητες Διακοπή όταν κορεστεί ο λογάριθμος της πιθανότητας Log-likelihood: n n n A w w w x w x w x w =... ) (... ) ( ) ( μ μ μ σ n n n A w w w x w x w w x = μ ]) Pr[ ] Pr[ ( log B x p A x p i B i A i +

63 Επέκταση του μοντέλου ανάμειξης Περισσότερες των δύο κατανομών: εύκολη Πολλαπλά χαρακτηριστικά: εύκολη με την υπόθεση ανεξαρτησίας Συσχετιζόμενα χαρακτηριστικά: δύσκολη Μοντέλο σύνδεσης: κανονική κατανομή δύο μεταβλητών με (συμμετρικό) πίνακα συνδιακύμανσης (covariance) n χαρακτηριστικά: απαιτείται η εκτίμηση n + n (n+1)/2 παραμέτρων 63

64 Περισσότερες επεκτάσεις Ονομαστικά χαρακτηριστικά: εύκολη αν είναι ανεξάρτητα Συσχετιζόμενα ονομαστικά χαρακτηριστικά: δύσκολη Δύο συσχετιζόμενα χαρακτηριστικά v 1 v 2 παράμετροι Άγνωστες τιμές: εύκολη Εφικτή η χρήση κατανομών διαφορετικών της κανονικής: log-normal για δεδομένο και προκαθορισμένο ελάχιστο log-odds για άνω και κάτω όρια Poisson για χαρακτηριστικά καταμέτρησης ακεραίων Χρήση διασταυρωμένης επικύρωσης για τον υπολογισμό του EM 64

65 Ομαδοποίηση κατά Bayes Πρόβλημα: πληθώρα παραμέτρων υπερπροσαρμογή EM Προσέγγιση Bayes: εκτωνπροτέρωνεκχώρησηκατανομής πιθανότηταςσεκάθεπαράμετρο Ενσωμάτωσή της στον υπολογισμό της ολικής πιθανότητας Τιμωρεί την εισαγωγή νέων παραμέτρων Παράδειγμα: Εκτιμητής Laplace για ονομαστικά χαρακτηριστικά Εφαρμογή της μεθόδου και για τον αριθμό ομάδων Υλοποίηση: AUTOCLASS (δημιουργός: NASA) 65

66 Γενικά περί Bayes Εφικτή η ερμηνεία ομάδων με χρήση εκμάθησης με επίβλεψη Βήμα μετα-επεξεργασίας Μείωση της εξάρτησης μεταξύ των χαρακτηριστικών; Βήμα προ-επεξεργασίας Για παράδειγμα, χρήση principal component analysis Μπορεί να χρησιμοποιηθεί και για την εξάλειψη των άγνωστων τιμών Κύριο πλεονέκτημα της πιθανοκρατικής ομαδοποίησης: Δύναται να υπολογίσει την πιθανότητα των δεδομένων Χρήση της μεθόδου για την αντικειμενική σύγκριση διαφορετικών μοντέλων 66

67 @weka EM Cluster using expectation maximization Cobweb Implements the Cobweb and Classit clustering algorithms FarthestFirst Cluster using the farthest first traversal algorithm MakeDensityBasedClusterer Wrap a clusterer to make it return distribution and density SimpleKMeans Cluster using the k-means method 67

68 Τέλος Επόμενη διάλεξη: Αλγόριθμοι εκμάθησης, μέρος Γ 68

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διαλέξεις 7-8 Μπεϋζιανή εκτίμηση - συνέχεια Μη παραμετρικές μέθοδοι εκτίμησης πυκνότητας Δυαδικές τ.μ. κατανομή Bernoulli : Εκτίμηση ML: Εκτίμηση Bayes για εκ των προτέρων

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Διαχωριστικές συναρτήσεις Ταξινόμηση κανονικών

Διαβάστε περισσότερα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα «Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα Σεμινάριο 8: Χρήση Μηχανικής Μάθησης στην Εξαγωγή Πληροφορίας Ευάγγελος Καρκαλέτσης, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο

Διαβάστε περισσότερα

ΕΡΓΑΣΙΑ : DATASET WEATHER ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ

ΕΡΓΑΣΙΑ : DATASET WEATHER ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ ΕΡΓΑΣΙΑ : DATASET WEATHER ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ Το dataset weather περιέχει 4 μεταβλητές (outlook, temperature, humidity, windy) και 14 καταχωρήσεις για το καθένα από αυτά. Με βάση αυτές εξετάζεται το γεγονός

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2 HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Θεωρία πιθανοτήτων Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (αντίθετα με τις ντετερμινιστικές μεταβλητές)

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διαλέξεις 7 8 Μπεϋζιανή εκτίμηση συνέχεια Μη παραμετρικές μέθοδοι εκτίμησης πυκνότητας Εκτίμηση ML για την κανονική κατανομή Μπεϋζιανή εκτίμηση για την κανονική κατανομή Γνωστή

Διαβάστε περισσότερα

Ομαδοποίηση Ι (Clustering)

Ομαδοποίηση Ι (Clustering) Ομαδοποίηση Ι (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

Αποθήκες και Εξόρυξη Δεδομένων

Αποθήκες και Εξόρυξη Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Αποθήκες και Εξόρυξη Δεδομένων 4 Ο Εργαστήριο WEKA (Association Rules) Στουγιάννου Ελευθερία estoug@unipi.gr -2- Κανόνες Συσχέτισης (Association Rules) Εύρεση

Διαβάστε περισσότερα

14Ιαν Νοε

14Ιαν Νοε Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Επανάληψη Γιάννης Θεοδωρίδης, Νίκος Πελέκης Εργαστήριο Πληροφοριακών Συστηµάτων http://infolab.cs.unipi.gr

Διαβάστε περισσότερα

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική Κατηγοριοποίηση Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης 2 ο Φροντιστήριο Σκούρα Αγγελική skoura@ceid.upatras.gr Μηχανική Μάθηση Η μηχανική μάθηση είναι μια περιοχή της τεχνητής νοημοσύνης η οποία αφορά

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Bayesian decision Minimum misclassificaxon rate decision: διαλέγουμε την κατηγορία Ck για

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Αναπαράσταση των δεδομένων ως διανύσματα χαρακτηριστικών (feature vectors): Επιλογή ενός

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Δ http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

(classification) 2 ΠΑ.ΠΕΙ. ΓιάννηςΘεοδωρίδης 4.1

(classification) 2 ΠΑ.ΠΕΙ. ΓιάννηςΘεοδωρίδης 4.1 Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Κατηγοριοποίηση (classification) Γιάννης Θεοδωρίδης, Νίκος Πελέκης Οµάδα ιαχείρισης εδοµένων

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ Ε Θ Ν Ι Κ Ο Μ Ε Τ Σ Ο Β Ι Ο Π Ο Λ Υ Τ Ε Χ Ν Ε Ι Ο ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ & ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ:

Διαβάστε περισσότερα

(training data) (test data)

(training data) (test data) Αποθήκες εδοµένων και Εξόρυξη Γνώσης Κατηγοριοποίηση Νίκος Πελέκης, Γιάννης Θεοδωρίδης http://isl.cs.unipi.gr/db/courses/dwdm 1 ΠΑ.ΠΕΙ. Περιεχόµενα Το πρόβληµα της κατηγοριοποίησης Τεχνικές κατηγοριοποίησης

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων Πολυκριτηριακή ανάλυση

Διαχείριση Υδατικών Πόρων Πολυκριτηριακή ανάλυση Εθνικό Μετσόβιο Πολυτεχνείο Τομέας Υδατικών Πόρων και Περιβάλλοντος Διαχείριση Υδατικών Πόρων Πολυκριτηριακή ανάλυση Ανδρέας Ευστρατιάδης & Δημήτρης Κουτσογιάννης Σχολή Πολιτικών Μηχανικών, Αθήνα Άδεια

Διαβάστε περισσότερα

Ομαδοποίηση ΙΙ (Clustering)

Ομαδοποίηση ΙΙ (Clustering) Ομαδοποίηση ΙΙ (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 10: Ομαδοποίηση Μέρος Δ Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Αποθήκες και Εξόρυξη Δεδομένων

Αποθήκες και Εξόρυξη Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Αποθήκες και Εξόρυξη Δεδομένων 2 Ο Εργαστήριο WEKA (CLASSIFICATION) Στουγιάννου Ελευθερία estoug@unipi.gr -2- Κατηγοριοποίηση Αποτελεί μια από τις βασικές

Διαβάστε περισσότερα

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα

Διαβάστε περισσότερα

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Μέθοδοι μονοδιάστατης ελαχιστοποίησης Βασικές αρχές μεθόδων ελαχιστοποίησης Μέθοδοι μονοδιάστατης ελαχιστοποίησης Οι μέθοδοι ελαχιστοποίησης είναι επαναληπτικές. Ξεκινώντας από μια αρχική προσέγγιση του ελαχίστου (την συμβολίζουμε ) παράγουν

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ ΕΙΣΑΓΩΓΗ Ο όρος «ποιότητα», είναι μια απλή έννοια που εκφράζεται

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή raniah@hua.gr 1 Εισαγωγή Στην πλειοψηφία των ορισμών για την ΤΝ, η δυνατότητα μάθησης / προσαρμογής

Διαβάστε περισσότερα

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σχετικές πληροφορίες: http://dlib.ionio.gr/~spver/seminars/statistics/ Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Θεματικές

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Μέθοδοι μονοδιάστατης ελαχιστοποίησης Βασικές αρχές μεθόδων ελαχιστοποίησης Μέθοδοι μονοδιάστατης ελαχιστοποίησης Οι μέθοδοι ελαχιστοποίησης είναι επαναληπτικές. Ξεκινώντας από μια αρχική προσέγγιση του ελαχίστου (την συμβολίζουμε ) παράγουν

Διαβάστε περισσότερα

Χρονοσειρές - Μάθημα 9 Aνάλυση χρονοσειρών και δυναμικά συστήματα

Χρονοσειρές - Μάθημα 9 Aνάλυση χρονοσειρών και δυναμικά συστήματα Χρονοσειρές - Μάθημα 9 Aνάλυση χρονοσειρών και δυναμικά συστήματα - Ανακατασκευή του χώρου καταστάσεων παρατήρηση της πολυπλοκότητας / στοχαστικότητας / δομής του συστήματος - Εκτίμηση χαρακτηριστικών

Διαβάστε περισσότερα

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση Η πληροφορία στη σύγχρονη επιχείρηση Η Ανάγκη Διαδικασία Ορισμός Αφετηρία Πρότυπα Πέραν του ανθρώπινου δυναμικού, η πληροφορία αποτελεί τον πλέον πολύτιμο

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΠΡΟΕΠΙΣΚΟΠΗΣΗ ΚΑΙ ΕΞΕΡΕΥΝΗΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Τα προς επεξεργασία

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 6 Κατανομές πιθανότητας και εκτίμηση παραμέτρων Κατανομές πιθανότητας και εκτίμηση παραμέτρων κανονικές τυχαίες μεταβλητές Εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις Τετάρτη 4 Οκτωβρίου 2006 0:00-3:00 ίνεται το παρακάτω

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διαλέξεις 9 10 Γραμμική παλινδρόμηση (Linear regression) Μπεϋζιανή εκτίμηση για την κανονική κατανομή Γνωστή μέση τιμή μ, άγνωστη διασπορά σ 2. Ακρίβεια λ=1/σ 2 : conjugate

Διαβάστε περισσότερα

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» 2 ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Προβλήματα ελάχιστης συνεκτικότητας δικτύου Το πρόβλημα της ελάχιστης

Διαβάστε περισσότερα

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση Η μορφή των δεδομένων και η σημασία της Δεδομένα input Αλγόριθμοι Εξόρυξης

Διαβάστε περισσότερα

Αναγνώριση Προτύπων. Μη παραμετρικές τεχνικές Αριθμητικά. (Non Parametric Techniques)

Αναγνώριση Προτύπων. Μη παραμετρικές τεχνικές Αριθμητικά. (Non Parametric Techniques) Αναγνώριση Προτύπων Μη παραμετρικές τεχνικές Αριθμητικά Παραδείγματα (Non Parametric Techniques) Καθηγητής Χριστόδουλος Χαμζάς Τα περιεχόμενο της παρουσίασης βασίζεται στο βιβλίο: Introduction to Pattern

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΕΙ Δυτικής Μακεδονίας ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ 2015-2016 Τεχνητή Νοημοσύνη Μάθηση από Παρατηρήσεις Διδάσκων: Τσίπουρας Μάρκος Εκπαιδευτικό Υλικό: Τσίπουρας Μάρκος http://ai.uom.gr/aima/ 2 Μορφές μάθησης

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Ιουνίου 24 ιάρκεια: 2 ώρες Σχεδιάστε έναν αισθητήρα

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση Η μορφή των εξαγομένων και η σημασία της Δεδομένα input Αλγόριθμοι Εξόρυξης

Διαβάστε περισσότερα

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών M.I.S. «Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» Μεταπτυχιακός Φοιτητής: Επιβλέπων Καθηγητής: Εξεταστής Καθηγητής: Τορτοπίδης Γεώργιος Μηχανικός

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

Ανάλυση κατά Συστάδες. Cluster analysis

Ανάλυση κατά Συστάδες. Cluster analysis Ανάλυση κατά Συστάδες Cluster analysis 1 H ανάλυση κατά συστάδες είναι µια µέθοδος που σκοπό έχει να κατατάξει σε οµάδες τις υπάρχουσες παρατηρήσεις χρησιµοποιώντας την πληροφορία που υπάρχει σε κάποιες

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος B http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Κεφάλαιο 4 Κανονική Κατανομή. Πέτρος Ε. Μαραβελάκης, Επίκουρος Καθηγητής, Πανεπιστήμιο Πειραιώς

Κεφάλαιο 4 Κανονική Κατανομή. Πέτρος Ε. Μαραβελάκης, Επίκουρος Καθηγητής, Πανεπιστήμιο Πειραιώς Κεφάλαιο 4 Κανονική Κατανομή Πέτρος Ε. Μαραβελάκης, Επίκουρος Καθηγητής, Πανεπιστήμιο Πειραιώς 4-4-1 Εισαγωγή Όσο το n αυξάνει, η διωνυμική κατανομή προσεγγίζει... n = 6 n = 1 n = 14 Binomial Distribution:

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 2: Δομικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM Μάθηση χωρίς επίβλεψη (unsupervised learning) Σύνολο εκπαίδευσης D={(x n )}, n=1,,n. x n =(x n1,, x nd ) T, δεν υπάρχουν τιμές-στόχοι t n. Προβλήματα μάθησης χωρίς

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διαλέξεις 5 6 Principal component analysis EM for Gaussian mixtures: μ k, Σ k, π k. Ορίζουμε το διάνυσμα z (διάσταση Κ) ώστε K p( x θ) = π ( x μ, Σ ) k = k k k Eκ των υστέρων

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Σημειακή επεξεργασία και μετασχηματισμοί Κατηγορίες μετασχηματισμού εικόνων Σημειακοί μετασχηματισμοί

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΜΑΘΗΜΑΤΙΚΗ ΔΙΑΤΥΠΩΣΗ, Διαλ. 2. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 8/4/2017

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΜΑΘΗΜΑΤΙΚΗ ΔΙΑΤΥΠΩΣΗ, Διαλ. 2. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 8/4/2017 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΜΑΘΗΜΑΤΙΚΗ ΔΙΑΤΥΠΩΣΗ, Διαλ. 2 Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 8/4/2017 Αντικειμενικοί στόχοι Η μελέτη των βασικών στοιχείων που συνθέτουν ένα πρόβλημα βελτιστοποίησης

Διαβάστε περισσότερα

Αποθήκες και Εξόρυξη Δεδομένων

Αποθήκες και Εξόρυξη Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Αποθήκες και Εξόρυξη Δεδομένων 3 Ο Εργαστήριο WEKA (CLUSTERING) Στουγιάννου Ελευθερία estoug@unipi.gr -2- Συσταδοποίηση (Clustering) Συσταδοποίηση / Ομαδοποίηση

Διαβάστε περισσότερα

Κεφάλαιο 4 Εισαγωγή στη στατιστική ανάλυση μετρήσεων

Κεφάλαιο 4 Εισαγωγή στη στατιστική ανάλυση μετρήσεων Κεφάλαιο 4 Εισαγωγή στη στατιστική ανάλυση μετρήσεων Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται οι βασικές έννοιες της στατιστικής ανάλυσης των μετρήσεων που υπόκεινται σε τυχαία σφάλματα. Παρουσιάζεται μέσω

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 B MH ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η Bayesan περίπτωση - Διαθέσιμα δεδομένα: XX X 2 X M. Κάθε X αντιστοιχεί στην κλάση

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Ι

ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Ι ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Ι κ. ΠΕΤΑΛΙΔΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕ 1 Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 7: Ομαδοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 11: Δημιουργία Βάσεων Κανόνων Από Δεδομένα- Εξαγωγή Κανόνων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων Από Δεδομένα-

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα