Θεωρία Λήψης Αποφάσεων

Σχετικά έγγραφα
ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Θεωρία Λήψης Αποφάσεων

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Θεωρία Λήψης Αποφάσεων

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 5: Διαχείριση Έργων υπό συνθήκες αβεβαιότητας

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Ενδεικτικές λύσεις ασκήσεων διαχείρισης έργου υπό συνθήκες αβεβαιότητας

Πληροφοριακά Συστήματα Διοίκησης Ενότητα 10: Διαχείριση Έργων (2ο Μέρος)

1 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Διαχείριση Έργων. Ενότητα 10: Χρονοπρογραμματισμός έργων (υπό συνθήκες αβεβαιότητας)

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 2: Εφαρμογές Δικτυωτής Ανάλυσης (1 ο Μέρος)

Διοίκηση Ολικής Ποιότητας & Επιχειρηματική Αριστεία Ενότητα 1.3.3: Μεθοδολογία εφαρμογής προγράμματος Ολικής Ποιότητας

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Επιχειρησιακή Έρευνα

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 6: Συμπίεση Έργου

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 3: Εφαρμογές Δικτυωτής Ανάλυσης (2 ο Μέρος)

Επιχειρησιακή Έρευνα

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 7: Εισαγωγή στη Θεωρία Αποφάσεων Δέντρα Αποφάσεων

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Διοίκηση Ολικής Ποιότητας & Επιχειρηματική Αριστεία Ενότητα 1.3.2: Παραδοσιακή VS νέα προσέγγιση της ΔΟΠ

Διαχείριση Έργων. Ενότητα 4: Διάγραμμα Gannt

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Επιχειρησιακή Έρευνα

Θεωρία Λήψης Αποφάσεων

Κβαντική Επεξεργασία Πληροφορίας

Κβαντική Επεξεργασία Πληροφορίας

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Επιχειρησιακή Έρευνα

Εισαγωγή στους Η/Υ. Ενότητα 2β: Αντίστροφο Πρόβλημα. Δημήτρης Σαραβάνος, Καθηγητής Πολυτεχνική Σχολή Τμήμα Μηχανολόγων & Αεροναυπηγών Μηχανικών

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Επιχειρησιακή Έρευνα

2 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Επιχειρησιακή Έρευνα

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Εισαγωγή στα Πληροφοριακά Συστήματα

Εισαγωγή στα Πληροφοριακά Συστήματα

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Εισαγωγή στα Πληροφοριακά Συστήματα

Διοίκηση Ολικής Ποιότητας & Επιχειρηματική Αριστεία Ενότητα 1.6.1: Το οργανόγραμμα της ποιότητας

Επιχειρησιακή Έρευνα

Διοίκηση Ολικής Ποιότητας & Επιχειρηματική Αριστεία Ενότητα 1.4: ISO 9004:2009

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Θεωρία Λήψης Αποφάσεων

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού σε κατάσταση Κορεσμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Φυσική ΙΙΙ. Ενότητα 4: Ηλεκτρικά Κυκλώματα. Γεώργιος Βούλγαρης Σχολή Θετικών Επιστημών Τμήμα Φυσικής

Διαφήμιση και Δημόσιες Σχέσεις Ενότητα 9: Σχέσεις διαφημιστή-διαφημιζόμενου

Διαχείριση Έργων. Ενότητα 7: Εκτέλεση, παρακολούθηση και έλεγχος έργου

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Εισαγωγή στους Αλγορίθμους

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Επιχειρησιακή Έρευνα

Μάρκετινγκ. Ενότητα 2: Αξία για τους Πελάτες

Ενδεικτικές λύσεις ασκήσεων διαγραμμάτων περίπτωσης χρήσης (1ο Μέρος)

3 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 1: Καταχώρηση δεδομένων

Εισαγωγή στους Αλγορίθμους

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 2: Περιγραφική στατιστική

Εισαγωγή στα Πληροφοριακά Συστήματα

Αερισμός. Ενότητα 1: Αερισμός και αιμάτωση. Κωνσταντίνος Σπυρόπουλος, Καθηγητής Σχολή Επιστημών Υγείας Τμήμα Ιατρικής

Έλεγχος και Διασφάλιση Ποιότητας Ενότητα 4: Μελέτη ISO Κουππάρης Μιχαήλ Τμήμα Χημείας Εργαστήριο Αναλυτικής Χημείας

Ψηφιακή Επεξεργασία Εικόνων

6 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

10 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Εισαγωγή στα Πληροφοριακά Συστήματα

Διοικητική Λογιστική

Εισαγωγή στους Υπολογιστές

Συμπεριφορά Καταναλωτή

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 3: Έλεγχοι στατιστικών υποθέσεων

Διοίκηση Ολικής Ποιότητας & Επιχειρηματική Αριστεία Ενότητα 1.3.1: Τυπικό Σύστημα Διοίκησης Ολικής Ποιότητας

Κβαντική Επεξεργασία Πληροφορίας

Διαχείριση Έργων. Ενότητα 5: Χρονοδιάγραμμα προμηθειών, προγραμματισμός πόρων

Εισαγωγή στα Πληροφοριακά Συστήματα

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Εισαγωγή στους Αλγορίθμους Φροντιστήριο 1

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

Οργάνωση και Διοίκηση Πωλήσεων Ενότητα 4η: Καθορισμός Περιοχής Πώλησης (sales territory)

Διεθνές εξαγωγικό Μάρκετινγκ Ενότητα 4η: Μέθοδοι Επιλογής Αγορών του Εξωτερικού

Μυελού των Οστών Ενότητα #1: Ερωτήσεις κατανόησης και αυτόαξιολόγησης

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Πληροφοριακά Συστήματα Διοίκησης Ενότητα 4: Μοντελοποίηση Περιπτώσεων Χρήσης (2ο Μέρος)

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Εισαγωγή στα Πληροφοριακά Συστήματα

Κβαντική Επεξεργασία Πληροφορίας

Μάρκετινγκ. Ενότητα 11: Υπηρεσίες και Μάρκετινγκ

Μηχανολογικό Σχέδιο Ι

Ενδεικτικές λύσεις ασκήσεων

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 4: Διαχείριση Έργων

Βέλτιστος Έλεγχος Συστημάτων

Transcript:

Θεωρία Λήψης Αποφάσεων Ενότητα 9: Αβεβαιότητα Στατιστική Μάθηση Μέγιστη Πιθανοφάνεια Μπεληγιάννης Γρηγόριος Σχολή Οργάνωσης και Διοίκησης Επιχειρήσεων Τμήμα Διοίκησης Επιχειρήσεων Αγροτικών Προϊόντων & Τροφίμων (Δ.Ε.Α.Π.Τ.)

Αβεβαιότητα - Στατιστική Μάθηση - Μέγιστη Πιθανοφάνεια Υποενότητα 1

Σκοποί 1 ης υποενότητας Να να γνωρίσουν και να κατανοήσουν οι φοιτητές τις βασικές έννοιες της αβεβαιότητας, της στατιστικής μάθησης και της μεθόδου απόφασης μέγιστης πιθανοφάνειας Να μπορέσουν οι φοιτητές να επιλύουν ασκήσεις σχετικές με αβεβαιότητα, στατιστική μάθηση και τη μέθοδο απόφασης μέγιστης πιθανοφάνειας 3

Περιεχόμενα 1 ης υποενότητας Δράση υπό αβεβαιότητα Χειρισμός της αβέβαιης γνώσης Ορθολογικές αποφάσεις Ατομικά συμβάντα Πλήρεις συνδυασμένες κατανομές πιθανότητας Υπολογισμός υπό συνθήκη πιθανοτήτων Ανεξαρτησία Ο Κανόνας του Bayes Στατιστική μάθηση Εκτίμηση μέγιστης πιθανοφάνειας 4

Δράση υπό αβεβαιότητα (1/2) Οι αλγόριθμοι σχεδόν ποτέ δεν έχουν πρόσβαση στην πλήρη αλήθεια σχετικά με το περιβάλλον τους Κανένα πλάνο δεν εγγυάται ότι θα πετύχει το στόχο Πλάνο Α 90 : Ξεκίνα 90 λεπτά νωρίτερα για να προλάβεις την πτήση Το πλάνο Α 90 θα μας πάει στο αεροδρόμιο εγκαίρως, εφόσον το αυτοκίνητό μου δεν πάθει βλάβη ή μείνει από βενζίνη, δεν έχουμε εμείς ατύχημα, δεν υπάρξουν άλλα ατυχήματα σε κάποια από τις σήραγγες, το αεροπλάνο δε φύγει νωρίτερα, και " 5

Δράση υπό αβεβαιότητα (2/2) Η ενδεδειγμένη δράση η ορθολογική απόφαση εξαρτάται τόσο από τη σχετική σημαντικότητα των διάφορων στόχων, όσο και από την πιθανότητα και το βαθμό κατά τον οποίο θα επιτευχθούν οι στόχοι αυτοί 6

Χειρισμός της αβέβαιης γνώσης (1/5) Η διάγνωση ανεξάρτητα από το αν αφορά την ιατρική, την επισκευή αυτοκινήτων, ή οτιδήποτε άλλο είναι μια διεργασία που περιλαμβάνει σχεδόν πάντοτε αβεβαιότητα Διαγνωστικοί κανόνες (έχουμε το σύμπτωμα, ψάχνουμε την αιτία) p Σύμπτωμα(p, Πονόδοντος) Ασθένεια(p, Κοιλότητα) Λανθασμένος κανόνας p Σύμπτωμα(p, Πονόδοντος) Ασθένεια(p, Κοιλότητα) Ασθένεια(p, Ουλίτιδα) Ασθένεια(p, Απόστημα) 7

Χειρισμός της αβέβαιης γνώσης (2/5) Αιτιολογικοί κανόνες (έχουμε την αιτία, ψάχνουμε το σύμπτωμα) p Ασθένεια(p, Κοιλότητα) Σύμπτωμα(p, Πονόδοντος) Επίσης λανθασμένος κανόνας 8

Χειρισμός της αβέβαιης γνώσης (3/5) Η λογική πρώτης τάξης αποτυγχάνει για τρεις κύριους λόγους: «Τεμπελιά» Απαιτείται υπερβολικά πολλή δουλειά για την παράθεση σε λίστα του πλήρους συνόλου προαπαιτήσεων ή συνεπειών που απαιτούνται για να εξασφαλίσουμε έναν κανόνα χωρίς εξαιρέσεις, και επίσης είναι πολύ δύσκολη η χρήση τέτοιων κανόνων 9

Χειρισμός της αβέβαιης γνώσης (4/5) Θεωρητική άγνοια Δεν υπάρχει πλήρης θεωρία για το αντίστοιχο πεδίο Πρακτική άγνοια Ακόμα και αν γνωρίζουμε όλους τους κανόνες, μπορεί να βρεθούμε σε αβεβαιότητα για κάποιο συγκεκριμένο περιστατικό, επειδή δεν έχουν εκτελεστεί ή δεν μπορούν να εκτελεστούν όλοι οι απαιτούμενοι έλεγχοι 10

Χειρισμός της αβέβαιης γνώσης (5/5) Βαθμός πεποίθησης: [0,1] Θεωρία πιθανοτήτων Η πιθανότητα μας παρέχει έναν τρόπο για να συναθροίσουμε την αβεβαιότητα που προέρχεται από την τεμπελιά ή την άγνοιά μας Εκ των προτέρων πιθανότητες Πριν τη λήψη μιας μαρτυρίας Εκ των υστέρων πιθανότητες Μετά τη λήψη μιας μαρτυρίας 11

Ορθολογικές αποφάσεις (1/2) Αποτελέσματα Πλήρως καθορισμένες καταστάσεις Υπάρχουν διάφορα δυνατά αποτελέσματα Προτιμήσεις / Πιθανότητες Θεωρία Χρησιμοτήτων Κάθε κατάσταση έχει ένα βαθμό ωφέλειας Θεωρία Αποφάσεων = Θεωρία Πιθανοτήτων + Θεωρία Χρησιμοτήτων 12

Ορθολογικές αποφάσεις (2/2) Αρχή της Μέγιστης Αναμενόμενης Χρησιμότητας Ένας πράκτορας είναι ορθολογικός αν και μόνο αν επιλέγει την ενέργεια που παρέχει την υψηλότερη αναμενόμενη χρησιμότητα, λαμβανόμενη ως το μέσο όρο για όλα τα δυνατά αποτελέσματα της ενέργειας 13

Βασική Σημειογραφία Πιθανοτήτων (1/3) Τυχαία μεταβλητή Μια μεταβλητή που αναφέρεται σε ένα «τμήμα» του κόσμου για το οποίο η «κατάσταση» είναι αρχικά άγνωστη Κοιλότητα: Ο κάτω αριστερός φρονιμίτης μου έχει κοιλότητα Θα γράφουμε πάντα τα ονόματα των τυχαίων μεταβλητών με κεφαλαίο το πρώτο γράμμα Παρόλα αυτά, θα χρησιμοποιούμε και πάλι πεζά γράμματα για τις τιμές που έχουν οι άγνωστες τυχαίες μεταβλητές: P(a)= 1 P( a) 14

Βασική Σημειογραφία Πιθανοτήτων (2/3) Πεδίο τιμών π.χ.(αληθές, ψευδές) Δυϊκές, Διακριτές, Συνεχείς 15

Βασική Σημειογραφία Πιθανοτήτων (3/3) Για τη δυϊκή τυχαία μεταβλητή Κοιλότητα με πεδίο τιμών το (αληθές, ψευδές): Η πρόταση Κοιλότητα = αληθές θα γράφεται και ως κοιλότητα Η πρόταση Κοιλότητα = ψευδές θα γράφεται και ως κοιλότητα Για την διακριτή τυχαία μεταβλητή Καιρός με πεδίο τιμών το (λιακάδα, βροχή, συννεφιά, χιόνι): Η πρόταση Καιρός = χιόνι θα γράφεται και ως χιόνι 16

Ατομικά Συμβάντα Το ατομικό συμβάν είναι ένας πλήρης καθορισμός της κατάστασης του κόσμου για τον οποίο η μέθοδος (ο πράκτορας) είναι αβέβαιος Για παράδειγμα, αν ο κόσμος αποτελείται μόνο από τις Boolean μεταβλητές Κοιλότητα και Πονόδοντος, τότε υπάρχουν μόνο τέσσερα διακριτά ατομικά συμβάντα π.χ. η πρόταση Κοιλότητα = αληθές Πονόδοντος = ψευδές 17

Ιδιότητες ατομικών συμβάντων (1/2) 1. Είναι αμοιβαία αποκλειόμενα Για παράδειγμα δεν μπορούν να ισχύουν ταυτόχρονα τα συμβάντα κοιλότητα πονόδοντος και κοιλότητα πονόδοντος 2. Το σύνολό τους είναι εξαντλητικό Η διάζευξη όλων των ατομικών συμβάντων είναι αληθής 3. Οποιοδήποτε ατομικό συμβάν καλύπτει την αλήθεια ή το ψεύδος για κάθε πρόταση, είτε αυτή είναι απλή είτε σύνθετη Για παράδειγμα, το ατομικό συμβάν κοιλότητα πονόδοντος καλύπτει την αλήθεια της πρότασης κοιλότητα και το ψεύδος της κοιλότηταπονόδοντος 18

Ιδιότητες ατομικών συμβάντων (2/2) 4. Οποιαδήποτε πρόταση είναι λογικά ισοδύναμη με τη διάζευξη όλων των ατομικών συμβάντων που συμπεραίνουν την αλήθεια αυτής της πρότασης Για παράδειγμα, το κοιλότητα είναι ισοδύναμο με τo κοιλότητα πονόδοντος κοιλότητα πονόδοντος 19

Εκ των προτέρων πιθανότητα (1/2) Ρ(Κοιλότητα = αληθές)=0.1 ή Ρ(κοιλότητα)=0.1 P(Καιρός = λιακάδα)=0.7 ή P(λιακάδα)=0.7 P(Καιρός = βροχή)=0.2 ή P(βροχή)=0.2 P(Καιρός = συννεφιά)=0.08 ή P(συννεφιά)=0.08 P(Καιρός = χιόνι)=0.02 ή P(χιόνι)=0.02 Κατανομή πιθανότητας Ρ(Καιρός) = (0.7, 0.2, 0.08, 0.02) Συνδυασμένη κατανομή πιθανότητας Ρ(Καιρός, Κοιλότητα) 20

Εκ των προτέρων πιθανότητα (2/2) Πλήρης συνδυασμένη κατανομή πιθανότητας Περιγράφει το πλήρες σύνολο των συνδυασμών των τυχαίων μεταβλητών που χρησιμοποιούνται για την περιγραφή του κόσμου 21

Πυκνότητα Πιθανότητας Έστω Χ = Αυριανή θερμοκρασία τότε π.χ. P(X = x) = U[18, 26](x) (ομοιόμορφη κατανομή) P(X=20,5) = U[18, 26](20,5)=1/(26 18) = 0,125 Υπολογίζουμε πιθανότητα για περιοχές τιμών 22

Υπό συνθήκη πιθανότητα π.χ. Ρ(κοιλότητα πονόδοντος) = 0,8 P( a b) P( a b) P( b) Κανόνας γινομένου: Ρ(α b) = Ρ(α b)ρ(b) = Ρ(b a)ρ(a) 23

Αξιώματα Kolmogorov (1/3) 1. Όλες οι πιθανότητες έχουν τιμή μεταξύ του 0 και του 1. Για οποιαδήποτε πρόταση α: 0 Ρ(α) 1 2. Οι κατανάγκην αληθείς (δηλαδή έγκυρες) προτάσεις έχουν πιθανότητα 1, ενώ οι κατανάγκην ψευδείς (δηλαδή μη ικανοποιήσιμες) προτάσεις έχουν πιθανότητα 0: Ρ(αληθές) = 1, Ρ(ψευδές) = 0 24

Αξιώματα Kolmogorov (2/3) 3. Η πιθανότητα της διάζευξης δίνεται από τον τύπο: Ρ(a b) = Ρ(a)+ Ρ(b) Ρ(a b) Από το 3 ο αξίωμα προκύπτει ότι: Η πιθανότητα μιας πρότασης είναι ίση με το άθροισμα των πιθανοτήτων των ατομικών συμβάντων στα οποία ισχύει αυτή η πρόταση: 25

Αξιώματα Kolmogorov (3/3) P( a) e i e( a) P( e όπου e(α) το σύνολο των ατομικών συμβάντων στα οποία ισχύει το α i ) Είναι παράλογο ένας αλγόριθμος να έχει μια κατάσταση πεποίθησης που παραβιάζει τα αξιώματα του Kolmogorov 26

Πλήρεις Συνδυασμένες Κατανομές Πιθανότητας (1/2) Έστω ένα πεδίο που αποτελείται μόνο από τις τρεις Boolean μεταβλητές Πονόδοντος, Κοιλότητα, και Λαβίδα: Μεταβλητές πονόδοντος πονόδοντος λαβίδα λαβίδα λαβίδα λαβίδα κοιλότητα 0,108 0,012 0,072 0,008 κοιλότητα 0,016 0,064 0,144 0,576 27

Πλήρεις Συνδυασμένες Κατανομές Πιθανότητας (2/2) Μπορούμε να υπολογίσουμε την πιθανότητα χωρίς συνθήκη οποιασδήποτε πρότασης (περιθώριος πιθανότητα) π.χ. P(κοιλότητα πονόδοντος) = 0,108+ 0,012 + 0,072+ 0,008 + 0,016 + 0,064 = 0,28 28

Θεώρημα Ολικής Πιθανότητας P ( Y) P( Y,z) z ή ισοδύναμα P ( Y) P( Y z) P( z) z 29

30 Υπολογισμός υπό συνθήκη πιθανοτήτων 0.6 0.064 0.016 0.012 0.108 0.012 0.108 ) ( πονόδοντος) (κοιλότητα πονόδοντος) (κοιλότητα πονόδοντος P P P 0.4 0.064 0.016 0.012 0.108 0.064 0.016 ) ( πονόδοντος) κοιλότητα ( πονόδοντος) κοιλότητα ( πονόδοντος P P P

Ανεξαρτησία (1/4) Έστω ότι εμπλουτίζουμε το οδοντιατρικό μας πεδίο με την τυχαία μεταβλητή Καιρός Η πλήρης κατανομή γίνεται Ρ(Πονόδοντος, Λαβίδα, Κοιλότητα, Καιρός) η οποία έχει 32 καταχωρίσεις (επειδή η μεταβλητή Καιρός έχει τέσσερις τιμές) Προφανώς δε θεωρούμε ότι ο καιρός παίζει ρόλο στα οδοντιατρικά μας προβλήματα 31

Ανεξαρτησία (2/4) Προσπαθούμε να υπολογίσουμε τις καταχωρήσεις της νέας πλήρους κατανομής: Ρ(πονόδοντος, λαβίδα, κοιλότητα, Καιρός = συννεφιά)= Ρ(Καιρός = συννεφιά πονόδοντος, λαβίδα, κοιλότητα) Ρ(πονόδοντος, λαβίδα, κοιλότητα) Θεωρούμε ότι: Ρ(Καιρός = συννεφιά πονόδοντος, λαβίδα, κοιλότητα) = Ρ(Καιρός = συννεφιά) 32

Ανεξαρτησία (3/4) οπότε: Ρ(πονόδοντος, λαβίδα, κοιλότητα, Καιρός = συννεφιά) = Ρ(Καιρός = συννεφιά) Ρ(πονόδοντος, λαβίδα, κοιλότητα) 33

Ανεξαρτησία (4/4) Ισοδύναμες δηλώσεις, για δύο ανεξάρτητες μεταβλητές Χ και Υ: P( Χ Υ ) = P( Χ ) P( Υ Χ ) = P( Υ ) P( Χ, Υ ) = P( Χ ) P( Υ ) Η πλήρης κατανομή σπάει σε πολλές μικρότερες: P(Χ 1, Χ 2,, Χ n ) = P(Χ 1 ) P(Χ 2 ) P(Χ n ) 34

35 Ο Κανόνας του Bayes Από τις σχέσεις: P(a b) = P(a b)p(b) P(a b) = P(b a)p(a) παίρνουμε: Γενικότερα: ) ( ) ( ) ( ) ( a P b P b a P a b P ) ( ) ( ) ( ) ( X Y Y X X Y P P P P ), ( ), ( ), ( ), ( e P e P e P e P X Y Y X X Y

Αιτιολογική και Διαγνωστική Γνώση Συνήθως προσπαθούμε να υπολογίσουμε «διαγνωστικές» πιθανότητες, ενώ γνωρίζουμε τις «αιτιολογικές» Παράδειγμα: Αιτία: Μηνιγγίτιδα, P(m)=1/50000 Σύμπτωμα: Δύσκαμπτος λαιμός, P(s)=1/20 P(s m)=0,5 P( s m) P( m) 0,51/ 50000 P( m s) P( s) 1/ 20 0,0002 36

Συνδυασμός μαρτυριών (1/2) P(Κοιλότητα πονόδοντος λαβίδα) = P(πονόδοντος λαβίδα Κοιλότητα) P(Κοιλότητα) Οι μεταβλητές Πονόδοντος και Λαβίδα δεν είναι ανεξάρτητες Εάν πονά το δόντι, τότε είναι περισσότερες οι πιθανότητες η λαβίδα να σκαλώσει πάνω του και αντιστρόφως 37

Συνδυασμός μαρτυριών (2/2) Οι μεταβλητές Πονόδοντος και Λαβίδα είναι όμως ανεξάρτητες με δεδομένη την τιμή της Κοιλότητα! P(πονόδοντος λαβίδα Κοιλότητα) = P(πονόδοντος Κοιλότητα) P(λαβίδα Κοιλότητα) 38

Υπό συνθήκη ανεξαρτησία Οι μεταβλητές Χ και Υ είναι υπό συνθήκη ανεξάρτητες, με δεδομένη την τιμή της Ζ: P(X, Y Z) = P(X Z) P(Y Z) P(X Y, Z) = P(X Z) και P(Y X, Z) = P(Y Z) Κατά συνέπεια: P(Πονόδοντος, Λαβίδα, Κοιλότητα) = = P(Πονόδοντος, Λαβίδα Κοιλότητα) P(Κοιλότητα) = = P(Πονόδοντος Κοιλότητα) P(Λαβίδα Κοιλότητα) P(Κοιλότητα) 39

Απλοϊκό μοντέλο Bayes Προβλήματα στα οποία υπάρχει μια μεταβλητή Αιτία και πολλές μεταβλητές Επίδρασης, οι οποίες είναι υπό συνθήκη ανεξάρτητες μεταξύ τους με δεδομένη την Αιτία Ονομάζεται απλοϊκό γιατί χρησιμοποιείται ως παραδοχή και όταν δεν πρέπει P(Αιτία, Επίδραση 1,, Επίδραση n ) = P(Αιτία) Π i (Επίδραση i Αιτία) 40

Στατιστική Μάθηση (1/2) Υποθέσεις Πιθανοτικές θεωρίες σχετικά με τον τρόπο λειτουργίας του πεδίου Δεδομένα Στιγμιότυπα τιμών για κάποιες ή και για όλες τις τυχαίες μεταβλητές που περιγράφουν το πεδίο 41

Στατιστική Μάθηση (2/2) Παράδειγμα Γλυκό Surprise, δύο γεύσεις: κεράσι και λεμόνι Πέντε πολύ μεγάλες σακούλες, ΙΔΙΕΣ! h1: 100% κεράσι h2: 75% κεράσι + 25% λεμόνι h3: 50% κεράσι + 50% λεμόνι h4: 25% κεράσι + 75% λεμόνι h5: 100% λεμόνι Τυχαία μεταβλητή Η, τιμές: h 1,, h 5 (υποθέσεις) Δεδομένα: D 1, D 2, D N 42

Μάθηση κατά Bayes Υπολογίζει την πιθανότητα κάθε υπόθεσης, με βάση τα δεδομένα: P(h i d) = P(d h i )P(h i ) εξαρτάται από την εκ των προτέρων πιθανότητα Πιθανοφάνεια δεδομένων: P(d h i ) d h P h P i d j j Ανεξάρτητα και ομοιόμορφα κατανεμημένα δεδομένα (ακολουθούν την ίδια κατανομή) i 43

Παράδειγμα Έστω ότι η τρέχουσα σακούλα είναι τύπου 3 Έστω ότι ανοίξαμε τα πρώτα 10 γλυκά (όλα λεμόνι), τότε: P(d h 3 ) είναι 0.5 10 44

Μέγιστη εκ των υστέρων (πιθανότητα) Maximum a Posteriori MAP Χρησιμοποιείται για την πρόβλεψη μόνο της πιο πιθανής υπόθεσης h MAP = max i ( P(hi d) )= max i ( P(d h i )P(h i )) Προσεγγιστικές προβλέψεις Όσο περισσότερα δεδομένα έχουμε, τόσο περισσότερο η πρόβλεψη MAP με την πρόβλεψη Bayes συγκλίνουν 45

Μέγιστη πιθανοφάνεια maximum likelihood ML Απλοποίηση της μεθόδου MAP Θεωρούμε ομοιόμορφη εκ των προτέρων κατανομή πιθανότητας h ML = max i ( P(hi d) )= max i ( P(d h i )P(h i )= = max i ( P(d h i )) όταν δεν έχουμε κανέναν (εκ των προτέρων) λόγο να προτιμήσουμε κάποια υπόθεση 46

Μάθηση μέγιστης πιθανοφάνειας Βήματα: 1.Γράφουμε μια παράσταση για την πιθανοφάνεια των δεδομένων ως συνάρτηση των παραμέτρων 2.Γράφουμε την παράγωγο της λογαριθμικής πιθανοφάνειας ως προς την κάθε παράμετρο 3.Βρίσκουμε τις τιμές των παραμέτρων έτσι ώστε οι παράγωγοι να έχουν τιμή μηδέν 47

Παράδειγμα 1 ο (1/2) Έστω ότι η πιθανότητα να τραβήξουμε γεύση κεράσι εξαρτάται μόνο από την παράμετρο θ που ουσιαστικά αποτελεί την πιθανότητα να έχουμε τραβήξει κεράσι Συμβολίζουμε την τυχαία υπόθεση ότι έχουμε τραβήξει από κάποια σακούλα με h θ Θεωρούμεότιόλεςοιυποθέσειςείναιεξίσου πιθανές εκ των προτέρων Μέθοδος εκτίμησης μέγιστης πιθανοφάνειας 48

49 Παράδειγμα 1 ο (2/2) N j l c P d j h h P 1 ) (1 d N j j l c h d P h P h L 1 1 log log log log d d N c l c c l c d h dl 0 1 ) (d

Παράδειγμα 2 ο (1/3) Έστω ότι η πιθανότητα να τραβήξουμε κεράσι και κόκκινο περιτύλιγμα εξαρτάται από τρεις παραμέτρους: θ, θ 1, θ 2 Επιπλέον δεδομένα: c γλυκά κεράσι r c με κόκκινο περιτύλιγμα g c με μη κόκκινο περιτύλιγμα l γλυκά λεμόνι r l με κόκκινο περιτύλιγμα g l με μη κόκκινο περιτύλιγμα 50

Παράδειγμα 2 ο (2/3) l r c g r g c l 1 1 l c P( d h θ,θ,θ ) 1 1 1 1 2 1 2 L=[c logθ + l log(1 θ)] + [r c log θ 1 + g c log (1 θ 1 )] + [r l logθ 2 + g l log(1 θ 2 )] 51

Παράδειγμα 2 ο (3/3) Βρείτε την εκτίμηση μέγιστης πιθανοφάνειας για τις εξής παραμέτρους θ: η πιθανότητα να τραβήξουμε γλυκό με γεύση κεράσι θ 1 : η πιθανότητα να τραβήξουμε γλυκό κεράσι με κόκκινο περιτύλιγμα θ 2 : η πιθανότητα να τραβήξουμε γλυκό λεμόνι με κόκκινο περιτύλιγμα 52

Τέλος Υποενότητας 1

Ασκήσεις εκτίμησης μέγιστης πιθανοφάνειας Υποενότητα 2

Σκοποί 2 ης υποενότητας Να μάθουν οι φοιτητές να επιλύουν ασκήσεις σχετικές με την εκτίμηση μέγιστης πιθανοφάνειας 55

Περιεχόμενα 2 ης υποενότητας 1 η Άσκηση: εκτίμηση μέγιστης πιθανοφάνειας 2 η Άσκηση: εκτίμηση μέγιστης πιθανοφάνειας 3 η Άσκηση: εκτίμηση μέγιστης πιθανοφάνειας 4 η Άσκηση: εκτίμηση μέγιστης πιθανοφάνειας 56

Άσκηση 1 η (1/2) Έστω n δείγματα x 1, x 2,, x n που επιλέγονται ανεξάρτητα με βάση την ακόλουθη συνάρτηση πυκνότητας πιθανότητας: p x i / e 0 x i x i 0 ύ 57

Άσκηση 1 η (2/2) Δείξτε ότι η εκτίμηση μέγιστης πιθανοφάνειας για την άγνωστη παράμετρο θ ισούται με: ˆ 1 MLE n όπου μ n η μέση τιμή των n δειγμάτων 58

Άσκηση 2 η (1/2) Έστω n δείγματα x 1, x 2,, x n που επιλέγονται ανεξάρτητα με βάση την ακόλουθη συνάρτηση πυκνότητας πιθανότητας: p x i / 1 0 0 x i ύ 59

Άσκηση 2 η (2/2) Δείξτε ότι η εκτίμηση μέγιστης πιθανοφάνειας για την άγνωστη παράμετρο θ ισούται με τη μέγιστη τιμή των n δειγμάτων, δηλαδή ˆ max x, x,..., x MLE 1 2 n 60

Άσκηση 3 η (1/2) Έστω n δείγματα x 1, x 2,, x n που επιλέγονται ανεξάρτητα με βάση την ακόλουθη συνάρτηση πυκνότητας πιθανότητας: p x i / 2 x i 0 e x i x i 0,1 ύ 61

Άσκηση 3 η (2/2) Δείξτε ότι η εκτίμηση μέγιστης πιθανοφάνειας για την άγνωστη παράμετρο θ ισούται με: ˆ MLE όπου μ n η μέση τιμή των n δειγμάτων 2 n 62

Άσκηση 4 η (1/2) Έστω θ η πιθανότητα ενός δίκαιου νομίσματος να έρθει γράμματα Αν το νόμισμα ριχθεί n φορές και έχουν έρθει γράμματα n g φορές να βρεθεί ότι η εκτίμηση μέγιστης πιθανοφάνειας της παραμέτρου θ ισούται με ˆMLE n g n 63

Άσκηση 4 η (2/2) Υπόδειξη: η πιθανότητα να έχουμε ng φορές γράμματα σε n ρίψεις του νομίσματος ισούται με n n! n! n! g g n g 1 nn g 64

Τέλος Υποενότητας 2

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στo πλαίσιo του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Πατρών» έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 66

Σημειώματα

Σημείωμα Ιστορικού Εκδόσεων Έργου Το παρόν έργο αποτελεί την έκδοση 1.0. Έχουν προηγηθεί οι κάτωθι εκδόσεις: 68

Σημείωμα Αναφοράς Copyright Πανεπιστήμιο Πατρών, Γρηγόριος Μπεληγιάννης. «Θεωρία Λήψης Αποφάσεων. Αβεβαιότητα Στατιστική Μάθηση Μέγιστη Πιθανοφάνεια». Έκδοση: 1.0. Πάτρα 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: https://eclass.upatras.gr/modules/document/document.php?course=deapt1 12. 69

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Μη Εμπορική Χρήση Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] http://creativecommons.org/licenses/by nc sa/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. 70