Λήψη απλών αποφάσεων

Σχετικά έγγραφα
Θεωρία Λήψης Αποφάσεων

ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ ΙΙ

Εισαγωγή στη Θεωρία Αποφάσεων. Λήψη απλών αποφάσεων για έναν πράκτορα

Θεωρία Χρησιμότητας (utility theory) Το κριτήριο της μέσης χρησιμότητας

Notes. Notes. Notes. Notes

Διάλεξη 5- Σημειώσεις


Η προσδοκώµενη χρησιµότητα του κέρδους όταν η πιθανότητα η τιµή του προϊόντος Ρ1 είναι ψ, χ το επίπεδο παραγωγής και c(x) η συνάρτηση κόστους, είναι

Κοινωνικά Δίκτυα Κοινωνική Επιλογή

Το παράδοξο του St. Petersburg Η θεωρία του καταναλωτή σε περιβάλλον αβεβαιότητας που εξετάσαμε μπόρεσε να δώσει απάντηση σε κάποια ερωτήματα που πριν

Ηθικός Κίνδυνος. Το βασικό υπόδειγμα. Παρουσιάζεται ένα στοχαστικό πρόβλημα χρηματοδότησης όταν τα αντισυμβαλλόμενα μέρη έχουν συμμετρική πληροφόρηση.

Ατομικές Προτιμήσεις και Συνάρτηση Χρησιμότητας - Έστω x=(x 1,,x n ) ένας καταναλωτικός συνδυασμός, όπου x i η ποσότητα του αγαθού i που καταναλώνει

K15 Ψηφιακή Λογική Σχεδίαση 7-8: Ανάλυση και σύνθεση συνδυαστικών λογικών κυκλωμάτων

Συνάρτηση χρησιμότητας (utility function): u(x)

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Προσφορά Εργασίας Προτιμήσεις και Συνάρτηση Χρησιμότητας ( Χ,Α συνάρτηση χρησιμότητας U(X,A)

Διαχείριση Υδατικών Πόρων Πολυκριτηριακή ανάλυση

Αναγνώριση Προτύπων Ι

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 4: Η τραγωδία των κοινών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΕΠΙΛΟΓΗ ΕΠΕΝΔΥΣΕΩΝ ΚΑΤΩ ΑΠΟ ΑΒΕΒΑΙΟΤΗΤΑ. 3.1 Eισαγωγή

Στοχαστικές Στρατηγικές

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

Πολυκριτηριακά Συστήματα Υποστήριξης Αποφάσεων

ΘΕΩΡΙΑ ΧΡΗΣΙΜΟΤΗΤΑΣ ΚΑΤΑΝΑΛΩΤΙΚΗ ΣΥΜΠΕΡΙΦΟΡΑ

Μέρος IV. Πολυδιάστατες τυχαίες μεταβλητές. Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ15 ( 1 )

Μελέτη Περίπτωσης : 2.1

II. Συναρτήσεις. math-gr

ΑΠΑΝΤΗΤΙΚΟ ΔΕΛΤΙΟ ΟΝΟΜΑΤΕΠΩΝΥΜΟ ΑΕΜ ΕΞΑΜΗΝΟ

ΑΡΧΕΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ. και το Κόστος

Ανάλυση και Λήψη Αποφάσεων Decision Analysis & Decision Making

3. Προσομοίωση ενός Συστήματος Αναμονής.

Εισαγωγή στο μάθημα Πιθανότητες - Στατιστική. Τμήμα Πολιτικών Μηχανικών Πανεπιστήμιο Θεσσαλίας

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 3, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 1

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

3.1 Ανεξάρτητες αποφάσεις - Κατανομή χρόνου μεταξύ εργασίας και σχόλης

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

Είδη Μεταβλητών. κλίµακα µέτρησης

Τυχαία μεταβλητή (τ.μ.)

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Μικροοικονοµική Θεωρία

Στατιστική Περιγραφή Φυσικού Μεγέθους - Πιθανότητες

ΠΙΘΑΝΟΤΗΤΕΣ Δειγματικός Χώρος. Ενδεχόμενα {,,..., }.

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Value at Risk (VaR) και Expected Shortfall

Προτιµήσεις-Υπενθύµιση

Προτιµήσεις-Υπενθύµιση

Με βάση τα παραπάνω ορίζουμε την αναμενόμενη χρησιμότητα (expected utility) EU(A) μιας επιλογής A ως εξής:

Αναγνώριση Προτύπων Ι

Μικροοικονομική. Θεωρία Συμπεριφοράς Καταναλωτή

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ

Condorcet winner. (1) Αν U j (x) > U j (y) τότε U i (x) > U i (y) και (2) Αν U i (y) > U i (x) τότε U j (y) > U j (x).

Αριθμητική Ανάλυση & Εφαρμογές

Δυσμενής Επιλογή. Το βασικό υπόδειγμα

Εφαρμοσμένη Βελτιστοποίηση

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

Διάλεξη 3. Προτιµήσεις. Ορθολογισµός στην οικονοµική. Σχέσεις προτιµήσεων

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Φροντιστήριο 3o. όπου x = max{m N 0 : m x} και N 0 = {0, 1, 2,...} Λύση. Ιδιότητες αθροιστικής: lim F (x) = 0 αφού F (x) = 0 για x < 1.

Μάθημα 3 ο a. Τυχαία Μεταβλητή-Έννοιες και Ορισμοί

Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Θεωρία επιλογών του καταναλωτή

ΠΟΛΥΚΡΙΤΗΡΙΑ ΥΠΟΣΤΗΡΙΞΗ ΑΠΟΦΑΣΕΩΝ. Χάρης Δούκας, Πάνος Ξυδώνας, Ιωάννης Ψαρράς

ΠΟΛΥΚΡΙΤΗΡΙΑ ΥΠΟΣΤΗΡΙΞΗ ΑΠΟΦΑΣΕΩΝ. Χάρης Δούκας, Πάνος Ξυδώνας, Ιωάννης Ψαρράς

HMY 795: Αναγνώριση Προτύπων

Notes. Notes. Notes. Notes

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Μαθηματική Εισαγωγή Συναρτήσεις

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Λύσεις των Θεμάτων του Διαγ/τος στην Τάξη και Σχόλια-Ιούνιος 2011

Τυχαίες Μεταβλητές. Ορισμός

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Θεωρία Καταναλωτή. Υποδειγματοποίηση της συμπεριφοράς του καταναλωτή. Βασική έννοια: Βελτιστοποίηση υπό περιορισμό.

Κριτήρια επιλογής μέτρων συνάφειας

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Πιθανότητες & Τυχαία Σήματα. Διγαλάκης Βασίλης

ΜΕΡΟΣ 1 ΣΥΝΑΡΤΗΣΕΙΣ. f : A R και στη συνέχεια δίνουμε τον τύπο της συνάρτησης, π.χ.

ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH

Στοχαστικές Ανελίξεις (2) Αγγελική Αλεξίου

ΕΦΑΡΜΟΣΜΕΝΗ ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ. Υπεύθυνος μαθήματος Καθηγητής Μιχαήλ Ζουμπουλάκης

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Θεωρία επιλογών του καταναλωτή

Μαθηματική Εισαγωγή Συναρτήσεις

E5 ΣΥΝΑΡΤΗΣΕΙΣ ΣΤΑ ΟΙΚΟΝΟΜΙΚΑ II

Βασικές Μικροοικονομικές Έννοιες

ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΟ ΜΑΘΗΜΑ ΜΑΘΗΜΑΤΙΚΑ Ι.Ι (τεύχος-1-)

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Απλή Γραμμική Παλινδρόμηση I

Πρώτο πακέτο ασκήσεων

1/12/2016. Πλεονεκτήματα. Μειονεκτήματα. (Roy, 1994)

Μικροοικονομία. Ενότητα 4: Θεωρία Χρησιμότητας και Καταναλωτική Συμπεριφορά. Δριτσάκη Χάιδω Τμήμα Λογιστικής και Χρηματοοικονομικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Πιθανολογική Ανάλυση Αποφάσεων. Συστήματα Αποφάσεων Εργαστήριο Συστημάτων Αποφάσεων και Διοίκησης

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

Πολυτεχνείο Κρήτης Σχολή Ηλεκτρονικών Μηχανικών Και Μηχανικών Η/Υ. ΠΛΗ 513 Αυτόνομοι Πράκτορες

Transcript:

Λήψη απλών αποφάσεων

ΧΡΗΣΙΜΟΤΗΤΑ Οι αποφάσεις / προτιμήσεις ενός agent (πράκτορα) μεταξύ των καταστάσεων του κόσμου αποτυπώνονται από μια συνάρτηση χρησιμότητας (utility function) U(S), η οποία αποδίδει μια αριθμητική τιμή για να εκφράσει πόσο επιθυμητή είναι μια κατάσταση. Οι χρησιμότητες συνδυάζονται με τις πιθανότητες αποτελεσμάτων των ενεργειών για να δώσουν την αναμενόμενη χρησιμότητα της κάθε ενέργειας.

Αρχή της Μέγιστης Αναμενόμενης Χρησιμότητας Συνάρτηση χρησιμότητας U(S) Αναμενόμενη χρησιμότητα EU(A E) = Σ i P(Αποτέλεσμα i (A) Εκτέλεση(A), E) U(Αποτέλεσμα i (A)) Μια μη αιτιοκρατική ενέργεια Α έχει Αποτέλεσμα i (A) P(Αποτέλεσμα i (A) Εκτέλεση(A), E): H πιθανότητα κάθε αποτελέσματος, εκτέλεσης της ενέργειας με δεδομένες τις μαρτυρίες Ε Η αρχή της μέγιστης αναμενόμενης χρησιμότητας (maximum expected utility, MEU) ορίζει ότι ένας ορθολογικός πράκτορας θα πρέπει να επιλέγει μια ενέργεια που μεγιστοποιεί την αναμενόμενη χρησιμότητά του. Υπολογισμός της χρησιμότητας: Για μεμονωμένες ενέργειες μόνο. 16-3

Αρχή της Μέγιστης Αναμενόμενης Χρησιμότητας Αν ένας πράκτορας μεγιστοποιεί μια συνάρτηση χρησιμότητας που αντικατοπτρίζει ορθά τη μέτρηση απόδοσης μέσω της οποίας κρίνεται η -συμπεριφορά του, τότε θα επιτύχει την υψηλότερη δυνατή απόδοση αν πάρουμε το μέσο όρο των περιβαλλόντων στα οποία θα μπορούσε να τοποθετηθεί αυτός ο πράκτορας. 16-4

Θεωρία Χρησιμοτήτων Η αρχή της Μέγιστης Αναμενόμενης Χρησιμότητας, είναι ένας ορθολογικός τρόπος λήψης αποφάσεων. 16-5

Περιορισμοί / λογικές προτιμήσεις Προτιμήσεις Προτιμήσεις και λοταρίες Α Β το Α είναι προτιμότερο από το Β Α ~ Β ο πράκτορας είναι αδιάφορος μεταξύ των Α και Β Α Β ο πράκτορας προτιμά το Α από το Β, ή είναι αδιάφορος μεταξύ αυτών Τα Α και Β είτε συγκεκριμένες καταστάσεις που προκαλούνται από αιτιοκρατικές ενέργειες είτε τυχαίες. Λοταρίες (lotteries) L = [p 1, C 1 ; p 2, C 2 ; p n, C n ] Τα δυνατά αποτελέσματα C i προκύπτουν με πιθανότητες p i 16-6

Αξιώματα της Θεωρίας Χρησιμοτήτων (1/2) Διαταξιμότητα (A Β) (Β Α) (Α ~ Β) Μεταβατικότητα (A B) KAI (B C) (A C) Συνέχεια A B C p [p, A; 1 p, C] ~ B Υπάρχει κάποια πιθανότητα p για την οποία ο λογικός πράκτορας θα είναι αδιάφορος μεταξύ του να επιλέξει τη B για σίγουρα ή να επιλέξει την ενέργεια που δίνει την A με πιθανότητα p και την C με πιθανότητα 1 p Αντικαταστασιμότητα A ~ B [p, A; 1 p, C] [p, B; 1 p, C] Εάν είναι αδιάφορος μεταξύ A και B, τότε είναι αδιάφορος και μεταξύ πιο πολύπλοκων λοταριών που είναι ίδεις με την εξαίρεση ότι το Β έχει πάρει τη θέση του Α. 16-7

Αξιώματα της Θεωρίας Χρησιμοτήτων (2/2) Μονοτονικότητα A B (p q [p, A; 1 p, B] [q, A; 1 q, B]) Ο πράκτορας που προτιμά το A από το B, πρέπει να προτιμήσει τη λοταρία που έχει υψηλότερη πιθανότητα για το A Αποσυνθεσιμότητα [p, A; 1 p, [q, B; 1 q, C]] ~ [p, A; (1 p)q, B; (1 p)(1 q), C] H σύνθετες λοταρίες γίνονται Απλούστερες με χρήση πιθανοτήτων 16-8

Αρχή της χρησιμότητας: U(A) > U(B) A B Χρησιμότητα Υπάρχει πραγματική συνάρτηση U, το Α είναι προτιμότερο του Β U(A) = U(B) A ~ B Ο πράκτορας είναι αδιάφορος μεταξύ Α και Β Αρχή της μέγιστης αναμενόμενης χρησιμότητας: Η χρησιμότητα μιας λοταρίας είναι το άθροισμα της πιθανότητας κάθε αποτελέσματος επί τη χρησιμότητα αυτού του αποτελέσματος. U ([ p, S ;...; p, S ]) p U ( S ) 1 1 n n = i i i 16-9

Συναρτήσεις χρησιμότητας Η χρησιμότητα είναι μια συνάρτηση που απεικονίζει τις καταστάσεις σε πραγματικούς αριθμούς. Η θεωρία χρησιμοτήτων έχει τις ρίζες της στα οικονομικά. Χρηματικές αξίες Αναμενόμενη χρηματική αξία: [0,5, 3.000.000 ; 0,5, 0 ], [1,0, 1.000.000 ] Αναμενόμενη χρησιμότητα: EU ( Αποδοχή) = 1 2 U ( S EU ( Απόρριψη) = U ( S k ) + 1 2 k+ 1.000.000 U ( S ) k+ 3.000.000 ), 16-10

Η χρησιμότητα δεν είναι ακριβώς ανάλογη με τη χρηματική αξία επειδή η χρησιμότητα η θετική αλλαγή στον τρόπο ζωής για το πρώτο σας εκατομμύριο είναι πολύ υψηλή, (ή τουλάχιστον έτσι λένε όλοι), ενώ η χρησιμότητα για ένα επιπλέον εκατομμύριο είναι πολύ μικρότερη. Ο Grayson (1960) ανακάλυψε ότι η χρησιμότητα των χρημάτων ήταν σχεδόν ακριβώς ανάλογη με το λογάριθμο του ποσού. U(S k + n ) = -263,31 + 22,09 log(n + 150.000) για το εύρος μεταξύ n = -$150,000 και n = $800.000. 16-11

Χρησιμότητα των χρημάτων Προσέγγιση με λογάριθμο: U(M)=α log(b+c M) Αποστροφή/Επιζήτηση/Ουδετερότητα ρίσκου Βέβαιο ισοδύναμο Ασφάλιστρο 16-12

Οι πράκτορες με καμπύλες αυτού του σχήματος αποστρέφονται το ρίσκο (risk-averse): προτιμούν κάτι σίγουρο με απολαβή μικρότερη από την αναμενόμενη χρηματική αξία του ρίσκου. Από την άλλη πλευρά, στην "απελπισμένη" περιοχή με μεγάλη αρνητική περιουσία, η συμπεριφορά είναι η επιζήτηση του ρίσκου (risk-seeking). Η αξία που θα αποδεχθεί ένας πράκτορας έναντι της λοταρίας ονομάζεται βέβαιο ισοδύναμο (certainty equivalent) της λοταρίας. Οι μελέτες έχουν δείξει ότι οι περισσότεροι άνθρωποι θα αποδεχθούν περίπου 400 στη θέση ενός ρίσκου που τους αποφέρει 1.0006 τις μισές φορές και 0 τις υπόλοιπες με άλλα λόγια, το βέβαιο ισοδύναμο της λοταρίας είναι 400. 16-13

Η διαφορά μεταξύ της αναμενόμενης χρηματικής αξίας μιας λοταρίας και του βέβαιου ισοδύναμού της ονομάζεται ασφάλιστρο (insurance premium). Η αποστροφή του κινδύνου είναι η βάση της ασφαλιστικής βιομηχανίας, επειδή σημαίνει ότι τα ασφάλιστρα είναι θετικά. Οι άνθρωποι προτιμούν να καταβάλλουν ένα μικρό ασφάλιστρο αντί να ρισκάρουν την αξία του σπιτιού τους έναντι της πιθανότητας πυρκαγιάς. Από την πλευρά της ασφαλιστικής εταιρείας, η αξία του σπιτιού είναι πολύ μικρή, σε σύγκριση με το συνολικό απόθεμα κεφαλαίου της εταιρείας. Αυτό σημαίνει ότι η καμπύλη χρησιμότητας του ασφαλιστή είναι σχεδόν ευθεία σε μια τέτοια μικρή περιοχή, και το ρίσκο δεν στοιχίζει σχεδόν τίποτα στην εταιρεία. 16-14

Κλίμακες χρησιμότητας U'(S) = k 1 + k 2 U(S), Αυτός ο γραμμικός μετασχηματισμός δεν μεταβάλλει τη συμπεριφορά του πράκτορα. Ένας πράκτορας σε αιτιοκρατικό περιβάλλον θεωρείται ότι έχει μια συνάρτηση αξίας (value function) ή διατακτική συνάρτηση χρησιμότητας (ordinal utility function), η συνάρτηση ουσιαστικά παρέχει μόνο ταξινομήσεις των καταστάσεων, αντί για αριθμητικές τιμές με κάποιο νόημα. 16-15

Κλίμακες χρησιμότητας Ισοδύναμοι μετασχηματισμοί: U (S) = k 1 + k 2 U(S) Κανονικοποιημένες χρησιμότητες Στο διάστημα [ u = 0, u = 1 ] Πρότυπη λοταρία (standard lottery) [p, u ; (1 - p), u ] Αξία ανθρώπινης ζωής micromort, πιθανότητα θανάτου μία στο εκατομμύριο QALY, quality-adjusted life year 16-16

Κλίμακες χρησιμότητας Η θεωρία αποφάσεων είναι κανονιστική (normative) θεωρία: περιγράφει τον τρόπο με τον οποίο θα πρέπει να ενεργήσει ένας ορθολογικός πράκτορας. Η εφαρμογή της οικονομικής θεωρίας θα ενισχυόταν κατά πολύ εάν ήταν επίσης και περιγραφική (descriptive) θεωρία της πραγματικής λήψης αποφάσεων από τους ανθρώπους. Παρόλα αυτά, υπάρχουν πειραματικά δεδομένα τα οποία υποδηλώνουν ότι οι άνθρωποι παραβιάζουν συστηματικά τα αξιώματα της θεωρίας χρησιμοτήτων. 16-17

Κλίμακες χρησιμότητας Στα άτομα που συμμετείχαν σε αυτό το πείραμα ζητήθηκε να κάνουν μια επιλογή μεταξύ των λοταριών Α και Β και στη συνέχεια μεταξύ των λοταριών C και D: Α: 80% πιθανότητα για $4000 C: 20% πιθανότητα για $4000 Β: 100% πιθανότητα για $3000 D: 25% πιθανότητα για $3000 Η πλειοψηφία των ατόμων προτίμησε το Β από το Α και το C από το D. Αν όμως αποδώσουμε τιμή [U($0) = 0, τότε η πρώτη από αυτές τις επιλογές υποδηλώνει ότι 0,8U($4000) < (U($3000) ενώ η δεύτερη επιλογή υποδηλώνει ακριβώς το αντίθετο. Για να το θέσουμε διαφορετικά, φαίνεται να μην υπάρχει συνάρτηση χρησιμότητας που να συμφωνεί με αυτές τις 16-18 επιλογές.

Κλίμακες χρησιμότητας Οι Kahneman και Tversky προχώρησαν στην ανάπτυξη μιας περιγραφικής θεωρίας που εξηγεί πώς οι άνθρωποι αποστρέφονται το ρίσκο σε συμβάντα υψηλής πιθανότητας, ενώ είναι πιο πρόθυμοι να ρισκάρουν περισσότερο για μη πιθανές απολαβές. 16-19

Κλίμακες χρησιμότητας Έχουν γίνει κάποιες προσπάθειες για την εύρεση της αξίας που δίνουν οι άνθρωποι στις ίδιες τις ζωές τους. Τα δύο συνηθισμένα "νομίσματα" που χρησιμοποιούνται στην ανάλυση ιατρικών θεμάτων και θεμάτων ασφαλείας είναι το: micromort (πιθανότητα θανάτου μία στο εκατομμύριο) και το QALY, ή έτος ζωής προσαρμοσμένης ποιότητας (quality-adjusted life year, ισοδύναμο με ένα έτος καλής υγείας χωρίς αναπηρίες). 16-20

Πολυκριτηριακές συναρτήσεις χρησιμότητας 16-21

Πολυκριτηριακές συναρτήσεις χρησιμότητας Κάθε κριτήριο θεωρείται γενικά ότι έχει διακριτές ή συνεχείς βαθμωτές τιμές. Το κάθε κριτήριο ορίζεται με τέτοιον τρόπο ώστε, όταν όλα τα άλλα είναι ίσα, οι υψηλότερες αξίες του κριτηρίου να αντιστοιχούν σε υψηλότερες χρησιμότητες. Σε μερικές περιπτώσεις μπορεί να είναι απαραίτητο να διαιρέσουμε σε τμήματα το εύρος των τιμών, έτσι ώστε η χρησιμότητα να ποικίλλει μονοτονικά μέσα σε κάθε εύρος τιμών. 16-22

Κυριαρχία Πολυκριτηριακές συναρτήσεις χρησιμότητας Το αεροδρόμιο S 1 κοστίζει λιγότερο, προκαλεί μικρότερη ηχορύπανση, και είναι ασφαλέστερο από το αεροδρόμιο S 2. Δεν θα δίσταζε λοιπόν να απορρίψει κανείς το S 2. Στην περίπτωση αυτή λέμε ότι υπάρχει αυστηρή κυριαρχία (strict dominance) του S 1 επί του S 2. 16-23

Πολυκριτηριακές συναρτήσεις χρησιμότητας Διάνυσμα κριτηρίων: X = X 1,, X n Αυστηρή κυριαρχία Στο α) η επιλογή Α κυριαρχείται αυστηρά από τη Β αλλά όχι από την C ή D. Στο β) το A κυριαρχείται αυστηρά από την περιοχή Β αλλά όχι από την περιοχή C 16-24

Στοχαστική κυριαρχία Υπάρχει μια ακόμα πιο χρήσιμη γενίκευση που ονομάζεται στοχαστική κυριαρχία (stochastic dominance), η οποία συμβαίνει πολύ συχνά στα πραγματικά προβλήματα. Έστω ότι το κόστος κατασκευής ενός αεροδρομίου είναι ομοιόμορφα κατανεμημένο: Θέση S 1 : U[2,8 10 6, 4,8 10 6 ] Θέση S 2 : U[3,0 10 6, 5,2 10 6 ] Στην περίπτωση αυτή, με δεδομένη μόνο την πληροφορία ότι η χρησιμότητα φθίνει με το κόστος, μπορούμε να πούμε ότι η θέση S 1 κυριαρχεί στοχαστικά της S 2 (δηλαδή, η S 2 μπορεί να απορριφθεί). Είναι σημαντικό να προσέξουμε ότι αυτό δεν απορρέει από τη σύγκριση του αναμενόμενου κόστους. 16-25

Στοχαστική κυριαρχία Η Εικόνα δείχνει αυτές τις κατανομές, με το κόστος να σχεδιάζεται ως αρνητική αξία. Κόστος κατασκευής αεροδρομίου: Θέση S 1 : U[2,8 10 6, 4,8 10 6 ](x) Θέση S 2 : U[3,0 10 6, 5,2 10 6 ](x) Σωρευτικές κατανομές: x x Η χρησιμότητα φθίνει με το κόστος x p ( ) 1 x dx p2( x ) dx 16-26

Στοχαστική κυριαρχία Η ακριβής σχέση μεταξύ των κατανομών των κριτηρίων που απαιτούνται για την επίτευξη στοχαστικής κυριαρχίας είναι πιο εμφανής εάν εξετάσουμε τις σωρευτικές (cumulative) κατανομές. Η σωρευτική κατανομή μετρά την πιθανότητα να είναι το κόστος μικρότερο ή ίσο από οποιοδήποτε δεδομένο ποσό δηλαδή, αποτελεί το ολοκλήρωμα της αρχικής κατανομής. Εάν η σωρευτική κατανομή για τη θέση S 1 βρίσκεται πάντοτε στα δεξιά της σωρευτικής κατανομής για τη θέση S 2, τότε, από στοχαστική άποψη, η θέση S 1 είναι φθηνότερη από την S 2. 16-27

Στοχαστική κυριαρχία Για να το διατυπώσουμε τυπικά, εάν δύο ενέργειες Α 1 και Α 2 οδηγούν σε κατανομές πιθανοτήτων p 1 (x) και p 2 (x) ως προς το κριτήριο Χ, τότε η Α 1 κυριαρχεί στοχαστικά έναντι της Α 2 στο Χ εάν ισχύει: x x x p1 2 ( x ) dx p ( x ) dx Εάν το Α 1 κυριαρχεί στοχαστικά έναντι του Α 2, τότε για οποιαδήποτε μονοτονικά μη φθίνουσα συνάρτηση χρησιμότητας U(x) η αναμενόμενη χρησιμότητα του Α 1 είναι τουλάχιστον εξίσου υψηλή με την αναμενόμενη χρησιμότητα του Α 2. Συνεπώς, εάν μια ενέργεια κυριαρχείται στοχαστικά από κάποια άλλη ως προς όλα τα κριτήρια, τότε μπορεί να 16-28 απορριφθεί.

Στοχαστική κυριαρχία Έστω, για παράδειγμα, ότι το κόστος κατασκευής εξαρτάται από την απόσταση από τα πληθυσμιακά κέντρα. Εάν η θέση S 1 είναι λιγότερο απομακρυσμένη από την S 2, τότε η S 1 θα κυριαρχεί της S 2 ως προς το κόστος. Αν και δεν θα τους παρουσιάσουμε εδώ, υπάρχουν αλγόριθμοι για τη διάδοση τέτοιου είδους ποιοτικών πληροφοριών μεταξύ αβέβαιων μεταβλητών σε ποιοτικά πιθανοτικά δίκτυα (qualitative probabilistic networks), οι οποίοι επιτρέπουν σε ένα σύστημα να πάρει ορθολογικές αποφάσεις με βάση την στοχαστική κυριαρχία χωρίς να χρησιμοποιήσει αριθμητικές τιμές. 16-29

Δομή προτίμησης και πολυκριτηριακή χρησιμότητα Έστω ότι έχουμε n κριτήρια, κάθε ένα από τα οποία έχει d διακριτές τιμές. Για να προσδιορίσουμε την πλήρη συνάρτηση χρησιμότητας U(x 1,...,χ n ) χρειαζόμαστε d n τιμές στη χειρότερη περίπτωση. Αυτή η χειρότερη περίπτωση αντιστοιχεί σε μια περίπτωση στην οποία οι προτιμήσεις του πράκτορα δεν έχουν καθόλου κανονικότητα. 16-30

Δομή προτίμησης και πολυκριτηριακή χρησιμότητα Η βασική προσέγγιση συνίσταται στο να εντοπίσουμε κανονικότητα στη συμπεριφορά προτιμήσεων που θα περιμέναμε να δούμε, και να χρησιμοποιήσουμε τα επονομαζόμενα θεωρήματα αναπαράστασης (representation theorems) ώστε να δείξουμε ότι ένας πράκτορας με ένα συγκεκριμένο είδος δομής προτίμησης έχει συνάρτηση χρησιμότητας : U(x 1...,x n )=f [f 1 (x 1 ),...,f n (x n )] 16-31

Προτιμήσεις χωρίς αβεβαιότητα Η βασική κανονικότητα που προκύπτει στις αιτιοκρατικές δομές προτίμησης ονομάζεται ανεξαρτησία προτιμήσεων. Δύο κριτήρια Χ 1 και Χ 2 είναι ανεξάρτητα ως προς την προτίμηση από ένα τρίτο κριτήριο X 3 εάν η προτίμηση μεταξύ των αποτελεσμάτων (x 1, x 2, x 3 ) και (x 1,x 2, x 3 ) δεν εξαρτάται από τη συγκεκριμένη τιμή x 3 του κριτηρίου Χ 3. 16-32

Προτιμήσεις χωρίς αβεβαιότητα Για παράδειγμα, εάν προτιμάμε μια πόλη 20.000 κατοίκων εντός του αεροδιαδρόμου και κόστος κατασκευής 4 δισεκατομμύρια από μια πόλη 70.000 κατοίκων εντός του αεροδιαδρόμου και κόστος κατασκευής 3,7 δισεκατομμύρια, με το επίπεδο ασφάλειας είναι να 0,06 θάνατοι ανά ένα εκατομμύριο μίλια μεταφοράς επιβατών και στις δύο περιπτώσεις, τότε θα έχουμε την ίδια προτίμηση και όταν το επίπεδο θανάτων είναι 0,13 ή 0,01. Η ίδια ανεξαρτησία θα ίσχυε για προτιμήσεις μεταξύ οποιουδήποτε άλλου ζεύγους τιμών για τα κριτήρια Θόρυβος και Κόστος. 16-33

Προτιμήσεις χωρίς αβεβαιότητα Είναι επίσης εμφανές ότι τα κριτήρια Κόστος και Θάνατοι είναι ανεξάρτητα ως προς την προτίμηση από το κριτήριο Θόρυβος, καθώς και ότι τα κριτήρια Θόρυβος και Θάνατοι είναι ανεξάρτητα ως προς την προτίμηση από το κριτήριο Κόστος. Λέμε ότι το σύνολο κριτηρίων {Θόρυβος, Κόστος, Θάνατοι} παρουσιάζει αμοιβαία ανεξαρτησία προτιμήσεων (mutual preference independence, ΜΡΙ). Εάν τα κριτήρια Χ 1, Χ 2,..., Χ n παρουσιάζουν αμοιβαία ανεξαρτησία προτιμήσεων, τότε η συμπεριφορά προτίμησης του πράκτορα μπορεί να περιγραφεί ως μεγιστοποίηση της συνάρτησης: V = i ( x..., x ) V ( x ) 1, n όπου κάθε V i είναι μια συνάρτηση αξίας που αναφέρεται μόνο στο κριτήριο Χ i. i i 16-34

Προτιμήσεις χωρίς αβεβαιότητα Για παράδειγμα, ενδεχομένως να μπορεί να ληφθεί η απόφαση για τη θέση του αεροδρομίου με χρήση της συνάρτησης αξίας V(θόρυβος, κόστος, θάνατοι) =-θόρυβος x 10 4 - κόστος - θάνατοι χ 10 12 Μια συνάρτηση αξίας αυτού του τύπου ονομάζεται προσθετική συνάρτηση αξίας (additive value function). Οι προσθετικές συναρτήσεις είναι ένας εξαιρετικά φυσικός τρόπος περιγραφής της συνάρτησης αξίας. 16-35

Δομή προτιμήσεων Κανονικότητα στη δομή των προτιμήσεων: U(x 1,, x n ) = f [ f 1 (x 1 ),, f n (x n ) ] όπου η f είναι συνήθως η πρόσθεση. Ανεξαρτησία προτιμήσεων (Χ 1,Χ 2 ) ως προς το Χ 3 : (x 1, x 2, x 3 ) και (x' 1, x' 2, x 3 ): Η προτίμηση δεν εξαρτάται από το x 3. Αμοιβαία ανεξαρτησία προτιμήσεων: V = i ( x..., x ) V ( x ) 1, n i i 16-36

Προτιμήσεις με αβεβαιότητα Ένα σύνολο κριτηρίων παρουσιάζει αμοιβαία ανεξαρτησία χρησιμότητας (mutually utilityindependence, MUI) εάν όλα τα υποσύνολά του είναι ανεξάρτητα ως προς τη χρησιμότητα από τα υπόλοιπα κριτήρια. Και πάλι, είναι λογικό να προτείνουμε ότι τα κριτήρια του αεροδρομίου παρουσιάζουν σχέση MUI. 16-37

Προτιμήσεις με αβεβαιότητα Ανεξαρτησία χρησιμότητας: Ένα σύνολο κριτηρίων Χ είναι ανεξάρτητο ως προς την χρησιμότητα από ένα σύνολο κριτηρίων Υ εάν οι προτιμήσεις μεταξύ των λοταριών επί των κριτηρίων του Χ είναι ανεξάρτητες από τις συγκεκριμένες τιμές των κριτηρίων στο Υ. Αμοιβαία ανεξαρτησία χρησιμότητας Πολλαπλασιαστική συνάρτηση χρησιμότητας U = k U + k U 1 1 1 2 3 2 + k k k U U 1 2 2 + k U U 3 3 3 + k k U U 1 2 1 2 + k k U 2 3 2 U 3 + k 3 k U U 1 3 1 16-38