Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Σχετικά έγγραφα
Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Μοντέλα των Cournotκαι Bertrand

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Κεφ. 9 Ανάλυση αποφάσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής


Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Ασκήσεις μελέτης της 6 ης διάλεξης

Δεύτερο πακέτο ασκήσεων

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0


ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Κατανομή συνάρτησης τυχαίας μεταβλητής Y=g(X) Πιθανότητες & Στατιστική 2017 Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Δ13 ( 1 )

Περιεχόμενα. 1. Ανάλυση ευαισθησίας. (1) Ανάλυση ευαισθησίας (2) Δυϊκό πρόβλημα (κανονική μορφή) (3) Δυαδικός προγραμματισμός (4) Ανάλυση αποφάσεων

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Μέση τιμή, διασπορά, τυπική απόκλιση. 1) Για την τυχαία διακριτή μεταβλητή Χ ισχύει Ρ(Χ=x i)=

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων και Αποφάσεων

Στατικά Παίγνια Ελλιπούς Πληροφόρησης

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

Extensive Games with Imperfect Information

Θεωρία Χρησιμότητας (utility theory) Το κριτήριο της μέσης χρησιμότητας

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 4: Η τραγωδία των κοινών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Ασκήσεις μελέτης της 16 ης διάλεξης

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ

δημιουργία: επεξεργασία: Ν.Τσάντας

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Evolutionary Equilibrium

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

Κεφάλαιο 29 Θεωρία παιγνίων

ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ Ι

Condorcet winner. (1) Αν U j (x) > U j (y) τότε U i (x) > U i (y) και (2) Αν U i (y) > U i (x) τότε U j (y) > U j (x).

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά].

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΕΛΙΚΕΣ ΕΞΕΤΑΣΕΙΣ (Ημερομηνία, ώρα)

1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη;

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

Βασικές Έννοιες Θεωρίας Παιγνίων

Κίνηση ΚΕΦΑΛΑΙΟ 2 Β ΓΥΜΝΑΣΙΟΥ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Εκτεταμένα Παίγνια (Extensive Games)

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Οµάδες ψηφοφόρων Αρ. Μελών Οµάδων Προτιµήσεις Α 1 x > y > z Β 1 y > z >x Γ 1 z > x > y

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

B A B A A 1 A 2 A N = A i, i=1. i=1

Άσκηση 2: Λαβύρινθοι και ρομπότ Α. (Σχεδιασμός χώρου καταστάσεων) Ενδεικτική επίλυση

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Το Υπόδειγμα της Οριακής Τιμολόγησης

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Στοχαστικές Στρατηγικές

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Βασικές Αρχές της Θεωρίας Παιγνίων

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ ΙΙ

( ) ΘΕΜΑ 1 κανονική κατανομή

Περιεχόμενα. Ι Παίγνια με τέλεια πληροφόρηση Πρόλογος 11

1ο μέρος 1. Φτιάχνουμε την πίστα. Μια ενδεικτική πίστα φαίνεται παρακάτω:

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών. HY-317: Εφαρµοσµένες Στοχαστικές ιαδικασίες - Εαρινό Εξάµηνο ιδάσκων : Π.

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

pdf: X = 0, 1 - p = q E(X) = 1 p + 0 (1 p) = p V ar(x) = E[(X µ) 2 ] = (1 p) 2 p + (0 p) 2 (1 p) = p (1 p) [1 p + p] = p (1 p) = p q

Θεωρία Πιθανοτήτων, εαρινό εξάμηνο Λύσεις του έβδομου φυλλαδίου ασκήσεων. f X (t) dt για κάθε x. F Y (y) = P (Y y) = P X y b ) a.

pdf: X = 0, 1 - p = q E(X) = 1 p + 0 (1 p) = p V ar(x) = E[(X µ) 2 ] = (1 p) 2 p + (0 p) 2 (1 p) = p (1 p) [1 p + p] = p (1 p) = p q

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Αλγεβρικό Παράδειγμα Σχετικά με τηνεπιλογή Μέτρων Πολιτικής για τη Μείωση της Ρύπανσης: Φορολογία Ρύπων Ή Ανώτατα Όρια

Αλγόριθμοι και Πολυπλοκότητα

Ομόλογα (bonds) Μετοχές (stocks) Αμοιβαία κεφάλαια (mutual funds)

Transcript:

Ασκήσεις Ιωάννα Καντζάβελου Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

1. Επιλογή Διαδρομής 2. Παραλλαγή του Matching Pennies 3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις 4. Επίλυση BoS με Βέλτιστες Αποκρίσεις Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 2

1. Επιλογή Διαδρομής (1/6) Τέσσερις άνθρωποι πρέπει να οδηγήσουν από το Α στο Β ταυτόχρονα. Κάθε ένας από αυτούς πρέπει να επιλέξει ποια διαδρομή να ακολουθήσει. 20 21 22 23 A 6,9,12,15 X Y 6,9,12,15 Original network. B 20 20.9 21.8 22.7 20 21 22 23 A 6,9,12,15 7 8 9 10 X 20 20.9 21.8 22.7 Y B 6,9,12,15 Network with new road from X to Y. Δύο διαδρομές είναι διαθέσιμες, μία μέσω Χ και μία μέσω Υ. Οι δρόμοι από το Α στο Χ και από το Υ στο Β είναι σύντομοι και στενοί. Σε κάθε περίπτωση, ένα αυτοκίνητο χρειάζεται 6 λεπτά και κάθε πρόσθετο αυτοκίνητο αυξάνει το χρόνο ταξιδιού ανά αυτοκίνητο κατά 3 λεπτά. (Εάν δύο αυτοκίνητα οδηγούν από το Α στο Χ, για παράδειγμα, κάθε αυτοκίνητο θα χρειαστεί 9 λεπτά.) Οι δρόμοι από το Α έως το Υ και από το Χ στο Β είναι μακρύτεροι και ευρείς. Από το Α έως το Y ένα αυτοκίνητο χρειάζεται 20 λεπτά και κάθε πρόσθετο αυτοκίνητο αυξάνει το χρόνο ταξιδιού ανά αυτοκίνητο κατά 1 λεπτό. Στο δρόμο από το X στο B ένα αυτοκίνητο χρειάζεται 20 λεπτά και κάθε πρόσθετο αυτοκίνητο αυξάνει τον χρόνο ταξιδιού ανά αυτοκίνητο κατά 0,9 λεπτά. Διατυπώστε αυτή την κατάσταση ως ένα στρατηγικό παιχνίδι και βρείτε την ισορροπία Nash. (Εάν και οι τέσσερις άνθρωποι ακολουθήσουν μία από τις διαδρομές, μπορεί κάποιος από αυτούς να πάει καλύτερα παίρνοντας την άλλη διαδρομή; Τι γίνεται αν οι τρεις παίρνουν μια διαδρομή και κάποιος ακολουθεί την άλλη διαδρομή; Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 3

1. Επιλογή Διαδρομής (2/6) Ένα στρατηγικό παιχνίδι που διαμορφώνει αυτή την κατάσταση είναι: Οι παίκτες: Οι τέσσερις άνθρωποι. Ενέργειες: Το σύνολο των ενεργειών κάθε ατόμου είναι {X, Y} (η διαδρομή μέσω X και η διαδρομή μέσω Y). Προτιμήσεις: Η πληρωμή κάθε παίκτη είναι το αρνητικό του χρόνου ταξιδιού. Σε κάθε ισορροπία Nash, δύο άτομα λαμβάνουν κάθε διαδρομή. (Σε οποιαδήποτε άλλη περίπτωση, ένα άτομο που παίρνει τη δημοφιλέστερη διαδρομή είναι προτιμότερο να αλλάξει και να μεταβεί στην άλλη διαδρομή.) Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 4

1. Επιλογή Διαδρομής (3/6) Για οποιοδήποτε τέτοιο προφίλ ενεργειών, ο χρόνος ταξιδιού κάθε ατόμου είναι είτε 29,9 ή 30 λεπτά (ανάλογα με τη διαδρομή που ακολουθεί). Εάν ένα άτομο που παίρνει τη διαδρομή μέσω Χ αλλάζει στη διαδρομή μέσω Y ο χρόνος ταξιδιού του γίνεται 22 + 12 = 34 λεπτά. Εάν ένα άτομο που παίρνει τη διαδρομή μέσω Y αλλάζει στη διαδρομή μέσω Χ ο χρόνος ταξιδιού του γίνεται 12 + 21,8 = 33,8 λεπτά. Για οποιαδήποτε άλλη κατανομή ατόμων σε δρομολόγια, τουλάχιστον ένα άτομο μπορεί να μειώσει το χρόνο ταξιδιού του αλλάζοντας διαδρομές. Έτσι, το σύνολο σημείων ισορροπίας Nash είναι το σύνολο των προφίλ ενεργειών στα οποία δύο άτομα παίρνουν τη διαδρομή μέσω Χ και δύο άτομα ακολουθούν τη διαδρομή μέσω του Y. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 5

1. Επιλογή Διαδρομής (4/6) Τώρα εξετάστε την κατάσταση μετά την κατασκευή του δρόμου από το Χ στο Υ. Δεν υπάρχει ισορροπία στην οποία ο νέος δρόμος δεν χρησιμοποιείται, με το ακόλουθο επιχείρημα. Επειδή η μόνη ισορροπία πριν από την κατασκευή του νέου δρόμου έχει δύο άτομα που παίρνουν κάθε διαδρομή, η μόνη δυνατότητα για μια ισορροπία στην οποία κανείς δεν χρησιμοποιεί το νέο δρόμο είναι για δύο άτομα να πάρουν τη διαδρομή Α-Χ-Β και δύο για να πάρουν A-Y-B, με αποτέλεσμα το συνολικό χρόνο ταξιδιού για κάθε άτομο να είναι 29,9 ή 30 λεπτά. Ωστόσο, εάν ένα άτομο που παίρνει το A-X-B αλλάζει στο νέο δρόμο στο Χ και στη συνέχεια παίρνει το Y-B ο συνολικός χρόνος ταξιδιού του γίνεται 9 + 7 + 12 = 28 λεπτά. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 6

1. Επιλογή Διαδρομής (5/6) Υποστηρίζω ότι σε κάθε ισορροπία Nash, ένα άτομο παίρνει A-X-B, δύο άνθρωποι παίρνουν A-X-Y-B, και ένα άτομο παίρνει A-Y-B. Για αυτήν την αποστολή, ο χρόνος ταξιδιού κάθε ατόμου είναι 32 λεπτά. Κανένα άτομο δεν μπορεί να αλλάξει τη διαδρομή του και να μειώσει το χρόνο ταξιδιού του, με το ακόλουθο επιχείρημα. - Αν το άτομο που επιλέγει το A-X-B αλλάξει στο A-X-Y-B, ο χρόνος ταξιδιού του αυξάνεται σε 12 + 9 + 15 = 36 λεπτά. Αν αλλάξει σε A-Y-B ο χρόνος ταξιδιού της αυξάνεται σε 21 + 15 = 36 λεπτά. - Εάν ένας από τους ανθρώπους που παίρνουν το A-X-Y-B αλλάξει σε A-X-B, ο χρόνος ταξιδιού του αυξάνεται σε 12 + 20,9 = 32,9 λεπτά. Αν αλλάξει σε A-Y-B ο χρόνος ταξιδιού της αυξάνεται σε 21 + 12 = 33 λεπτά. - Αν το άτομο που επιλέγει το A-Y-B αλλάξει στο A-X-B, ο χρόνος ταξιδιού του αυξάνεται σε 15 + 20,9 = 35,9 λεπτά. Αν αλλάξει σε A-X-Y-B, ο χρόνος ταξιδιού της αυξάνεται σε 15 + 9 + 12 = 36 λεπτά. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 7

1. Επιλογή Διαδρομής (6/6) Για κάθε άλλη κατανομή ατόμων σε διαδρομές, τουλάχιστον ένα άτομο μπορεί να αλλάξει διαδρομές και να μειώσει τον χρόνο ταξιδιού. Για παράδειγμα, εάν ένα άτομο πάρει τον A-X-B, ένα άλλο άτομο πάρει το A-X-Y-B και δύο άτομα πάρουν το A-Y-B, τότε ο χρόνος ταξιδιού των A-Y-B είναι 21 + = 33 λεπτά. - Αν ένας από αυτούς αλλάξει σε A-X-B τότε ο χρόνος ταξιδιού του πέφτει στο 12 + 20,9 = 32,9 λεπτά. Ή εάν ένα άτομο πάρει το A-Y-B, ένα άλλο άτομο πάρει το A-X-Y-B και δύο άτομα πάρουν το A-X-B, τότε ο χρόνος ταξιδιού των A-X-B είναι 12 + 20.9 = λεπτά. - Αν ένας από αυτούς αλλάξει στο A-X-Y-B τότε ο χρόνος ταξιδιού του πέφτει στο 12 + 8 + 12 = 32 λεπτά. Έτσι, στην ισορροπία με το νέο δρόμο αυξάνεται ο χρόνος ταξιδιού κάθε ατόμου, από 29,9 ή 30 λεπτά σε 32 λεπτά. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 8

2. Παραλλαγή του Matching Pennies (1/8) Βρείτε τη σταθερή κατάσταση (ή τις σταθερές καταστάσεις) για το παίγνιο που διαφέρει από το Matching Pennies μόνο στο ότι τα αποτελέσματα των προφίλ ενεργειών {Head, Head} και {Tail, Tail} είναι ότι ο παίκτης 1 κερδίζει $2 και ο παίκτης 2 χάνει $1. I II Head Tail Head $2,-$1 -$1,$1 Tail -$1,$1 $2,-$1 Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 9

2. Παραλλαγή του Matching Pennies (2/8) Η ανάλυση είναι η ίδια όπως και για το Matching Pennies. Ισχυρίζομαι δηλαδή ότι υπάρχει μια μοναδική στοχαστική σταθερή κατάσταση, στην οποία κάθε παίκτης επιλέγει κάθε δράση με πιθανότητα 1/2. Για να δείξουμε αυτό το αποτέλεσμα, πρέπει να δείξουμε ότι αν ο παίκτης 2 επιλέγει την καθεμιά από τις ενέργειές του με πιθανότητα 1/2, τότε το βέλτιστο για τον παίκτη 1 είναι να επιλέγει τις ενέργειές του με πιθανότητα 1/2, και το αντίστροφο. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 10

2. Παραλλαγή του Matching Pennies (3/8) Υποθέστε ότι ο παίκτης 2 επιλέγει κάθε μία από τις ενέργειές του με πιθανότητα 1/2. Εάν ο παίκτης 1 επιλέγει Head με πιθανότητα p και Tail με πιθανότητα 1-p, τότε το κάθε αποτέλεσμα (Head, Head) και (Head, Tail) εμφανίζεται με πιθανότητα 1/2 p, και κάθε αποτέλεσμα (Tail, Head) και (Tail, Tail) εμφανίζεται με πιθανότητα 1/2 (1 - p). Έτσι ο παίκτης 1 κερδίζει $2 με πιθανότητα 1/2 p + 1/2 (1 - p), η οποία ισούται με 1/2 [(Head, Head) και (Tail, Tail)], και χάνει $1 με πιθανότητα 1/2 [(Head, Tail) και (Tail, Head)]. Ειδικότερα, η κατανομή πιθανότητας πέραν των αποτελεσμάτων είναι ανεξάρτητη 2 του p! Έτσι, κάθε τιμή του p είναι βέλτιστη. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 11

2. Παραλλαγή του Matching Pennies (4/8) Ο παίκτης 1 δε μπορεί να κάνει τίποτα καλύτερο από το να επιλέξει το Head με πιθανότητα 1/2 και Tail με πιθανότητα 1/2. Μια παρόμοια ανάλυση δείχνει ότι είναι βέλτιστο για τον παίκτη 2 να επιλέγει κάθε ενέργεια με πιθανότητα 1/2 όταν ο παίκτης 1 κάνει το ίδιο. Καταλήγουμε στο συμπέρασμα ότι το παίγνιο έχει μια στοχαστική σταθερή κατάσταση στην οποία κάθε παίκτης επιλέγει κάθε ενέργειά του με πιθανότητα 1/2. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 12

2. Παραλλαγή του Matching Pennies (5/8) Υποστηρίζω επίσης ότι, υπό μια εύλογη παραδοχή σχετικά με τις προτιμήσεις των παικτών, το παιχνίδι δεν έχει άλλη σταθερή κατάσταση. Αυτή η παραδοχή είναι ότι κάθε παίκτης θέλει να είναι όσο το δυνατόν μεγαλύτερη η πιθανότητα να κερδίσει. - Για τον παίκτη 1 να κερδίσει $2 και για τον παίκτη 2 να κερδίσει $1. Πιο συγκεκριμένα, αν p> q τότε ο κάθε παίκτης προτιμά να κερδίσει με πιθανότητα p και να χάσει $1 με πιθανότητα 1 - p από να κερδίσει με πιθανότητα q και να χάσει $1 με πιθανότητα 1 - q. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 13

2. Παραλλαγή του Matching Pennies (6/8) Για να δείξουμε ότι κάτω από αυτή την παραδοχή δεν υπάρχει σταθερή κατάσταση στην οποία η πιθανότητα να επιλέξει ο κάθε παίκτης Head είναι διαφορετική από 1/2, συμβολίζουμε με q την πιθανότητα 2 να επιλέξει ο παίκτης 2 Head (έτσι ώστε να επιλέγει Tail με πιθανότητα 1 - q). Εάν ο παίκτης 1 επιλέξει το Head με πιθανότητα p τότε κερδίζει $2 με πιθανότητα pq + (1 - p) (1 - q) (η πιθανότητα ότι το αποτέλεσμα είναι είτε (Head, Head) είτε (Tail, Tail) και θα χάνει $1 με πιθανότητα (1 - p) q + p (1 - q). Η πρώτη πιθανότητα είναι ίση με 1-q + p(2q-1) και η δεύτερη πιθανότητα είναι ίση με q + p (1-2q). Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 14

2. Παραλλαγή του Matching Pennies (7/8) Επομένως, αν q <1/2 (ο παίκτης 2 επιλέγει Head με πιθανότητα μικρότερη από 1/2), η πρώτη πιθανότητα είναι φθίνουσα ως προς το p και η δεύτερη είναι αύξουσα ως προς το p, άρα όσο μικρότερο είναι το p, τόσο το καλύτερο είναι το αποτέλεσμα για τον παίκτη 1. Η τιμή του p που προκαλεί τη βέλτιστη πιθανοτική κατανομή ως προς το αποτέλεσμα για τον παίκτη 1 είναι 0. Δηλαδή, αν ο παίκτης 2 επιλέξει το Head με πιθανότητα μικρότερη από 1/2, τότε η μοναδική βέλτιστη πολιτική για τον παίκτη 1 είναι να επιλέγει με βεβαιότητα Tail. Ένα παρόμοιο επιχείρημα δείχνει ότι αν ο παίκτης 2 επιλέγει Head με πιθανότητα μεγαλύτερη από 1/2, τότε η μοναδική βέλτιστη πολιτική για τον παίκτη 1 είναι να επιλέγει Head με βεβαιότητα. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 15

2. Παραλλαγή του Matching Pennies (8/8) Τώρα, αν ο παίκτης 1 επιλέξει μία από τις ενέργειές του με βεβαιότητα, μια παρόμοια ανάλυση οδηγεί στο συμπέρασμα ότι η βέλτιστη πολιτική του παίκτη 2 είναι να επιλέξει μία από ενέργεια με βεβαιότητα (Head αν ο παίκτης 1 επιλέγει Tail και Tail εάν ο παίκτης 1 επιλέξει Head). Καταλήγουμε στο συμπέρασμα ότι δεν υπάρχει καμία σταθερή κατάσταση στην οποία η πιθανότητα ο παίκτης 2 να επιλέγει Head να είναι διαφορετική από το 1/2. Ένα συμμετρικό επιχείρημα οδηγεί στο συμπέρασμα ότι δεν υπάρχει σταθερή κατάσταση κατά την οποία η πιθανότητα ο παίκτης 1 να επιλέγει το Head είναι διαφορετική από 1/2. Έτσι, η μόνη στοχαστική σταθερή κατάσταση είναι αυτή στην οποία κάθε παίκτης επιλέγει κάθε μία από τις ενέργειές της με πιθανότητα 1/2. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 16

3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις (1/7) Βρείτε τη μοναδική ισορροπία Nash μικτών στρατηγικών για το παίγνιο Matching Pennies με ρητή κατασκευή των συναρτήσεων βέλτιστης απόκρισης των παικτών I II Head Tail Head $1,-$1 -$1,$1 Tail -$1,$1 $1,-$1 Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 17

3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις (2/7) Αναπαριστάνουμε τις προτιμήσεις κάθε παίκτη με την αναμενόμενη τιμή μιας συνάρτησης απόδοσης που αντιστοιχεί την απόδοση 1 στο κέρδος $1 και την απόδοση -1 σε απώλεια $1. Το στρατηγικό παίγνιο που προκύπτει με vnm προτιμήσεις παρουσιάζεται στο διπλανό Σχήμα. I II Head Tail Head $1,-$1 -$1,$1 Tail -$1,$1 $1,-$1 Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 18

3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις (3/7) Συμβολίζουμε με p την πιθανότητα που αντιστοιχίζει η μικτή στρατηγική του παίκτη 1 στην ενέργεια Head και με q την πιθανότητα που αντιστοιχίζει η μικτή στρατηγική του παίκτη 2 στην ενέργεια Head. Στη συνέχεια, δεδομένης της μικτής στρατηγικής του παίκτη 2, η αναμενόμενη απόδοση του παίκτη 1 στην καθαρή στρατηγική Head είναι: q 1 + (1 q) ( 1) = 2q 1 και η αναμενόμενη απόδοση του παίκτη 1 στην καθαρή στρατηγική Tail είναι: q (-1) + (1 q) 1 = 1-2q Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 19

3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις (4/7) Επομένως, εάν q < 1/2 τότε η αναμενόμενη απόδοση του παίκτη 1 για την καθαρή στρατηγική Tail υπερβαίνει την αναμενόμενη απόδοσή του για την καθαρή στρατηγική Head, και ως εκ τούτου υπερβαίνει επίσης την αναμενόμενη απόδοσή του για κάθε μικτή στρατηγική που αντιστοιχίζει θετική πιθανότητα στην ενέργεια Head. Ομοίως, εάν q > 1/2 τότε η αναμενόμενη απόδοση για την καθαρή στρατηγική Head υπερβαίνει την αναμενόμενη απόδοση του για την καθαρή στρατηγική Tail, και ως εκ τούτου υπερβαίνει την αναμενόμενη απόδοση του για κάθε μικτή στρατηγική που αντιστοιχίζει θετική πιθανότητα στην ενέργεια Tail. Εάν q = 1/2 τότε και η καθαρή στρατηγική Head και η καθαρή στρατηγική Tail, και συνεπώς όλες οι μικτές στρατηγικές, δίνουν την ίδια αναμενόμενη απόδοση. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 20

3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις (5/7) Καταλήγουμε στο συμπέρασμα ότι οι βέλτιστες αποκρίσεις του παίκτη 1 στη στρατηγική του παίκτη 2 είναι η μικτή στρατηγική που αντιστοιχίζει την πιθανότητα 0 στην ενέργεια Head εάν q < 1/2, η μικτή στρατηγική που αντιστοιχίζει την πιθανότητα 1 στην ενέργεια Head εάν q > 1/2, και όλες τις μικτές στρατηγικές της αν q = 1/2. Δηλαδή, αν συμβολίσουμε με B1 (q) το σύνολο των πιθανοτήτων που αντιστοιχίζει ο παίκτης 1 στην ενέργεια Head στις βέλτιστες αποκρίσεις ως προς το q, έχουμε B 1 (q) = {0} if q < 1 2 {p :0 p 1} if q = 1 2 {1} if q > 1 2. nction of player 2 is similar: B (p )={ Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 21

3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις (6/7) Η συνάρτηση βέλτιστης απόκρισης του παίκτη 2 είναι παρόμοια: q 1 B2(p) = {1} αν p <1/2, B2(p) = {q: 0 q 1} αν p = 1/2, και B2(p) = {0} αν p > 1/2. Οι συναρτήσεις βέλτιστης απόκρισης και για τους δύο παίκτες απεικονίζεται στο διπλανό σχήμα. Οι συναρτήσεις βέλτιστης απόκρισης των παικτών για το Matching Pennies όταν επιτρέπεται η τυχαιοποίηση. Οι πιθανότητες που αντιστοιχίζονται από τους παίκτες 1 και 2 στην ενέργεια Head είναι p και q αντίστοιχα. Η συνάρτηση βέλτιστης απόκρισης του παίκτη 1 σχεδιάζεται με μαύρη γραμμή και αυτή του παίκτη 2 με γκρι. Η κουκίδα υποδεικνύει τη μοναδική ισορροπία Nash. 1 2 B 1 B 2 0 1 2 1 p Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 22

3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις (7/7) Το σύνολο των ισορροπιών Nash μικτών στρατηγικών για το παίγνιο αυτό αντιστοιχεί (όπως πριν) στο σύνολο των τομών των συναρτήσεων βέλτιστης απόκρισης σε αυτό το σχήμα. Βλέπουμε αυτό υπάρχει μια τομή, που αντιστοιχεί στην ισορροπία που βρήκαμε προηγουμένως, όπου ο κάθε παίκτης αντιστοιχίζει την πιθανότητα 1/2 στην ενέργεια Head. q 1 1 2 B 1 B 2 Το Matching Pennies δεν έχει ισορροπία Nash εάν στους παίκτες δεν επιτρέπεται η τυχαιότητα. Εάν ένα παίγνιο έχει ισορροπία Nash όταν δεν επιτρέπεται η τυχαιότητα, είναι πιθανό να έχει πρόσθετες ισορροπίες όταν επιτρέπεται η τυχαιότητα; Το παρακάτω παράδειγμα δείχνει ότι η απάντηση είναι καταφατική. 0 1 2 1 p Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 23

4. Επίλυση BoS με Βέλτιστες Αποκρίσεις (1/5) Θεωρείστε το παίγνιο δύο παικτών με προτιμήσεις vnm στις οποίες οι προτιμήσεις των παικτών σε σχέση με τα αιτιοκρατικά προφίλ ενεργειών είναι ίδιες με αυτές του BoS, και οι προτιμήσεις των παικτών σε σχέση με τις λοταρίες αναπαριστάνονται από την αναμενόμενη τιμή της συνάρτησης απόδοσης που καθορίζονται στο διπλανό σχήμα. Ποιες είναι οι ισορροπίες μικτών στρατηγικών για το παίγνιο αυτό; I II B S B 2,1 0,0 S 0,0 1,2 Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 24

4. Επίλυση BoS με Βέλτιστες Αποκρίσεις (2/5) Κατασκευάζουμε πρώτα τη συνάρτηση βέλτιστης απόκρισης για τον παίκτη 1. Υποθέστε ότι ο παίκτης 2 αντιστοιχίζει πιθανότητα q στην ενέργεια Β. Στην περίπτωση αυτή, η αναμενόμενη απόδοση του παίκτη 1 για την ενέργεια Β είναι: 2 q + 0 (1-q) = 2q και η αναμενόμενη απόδοση του για την ενέργεια S είναι: 0 q + 1 (1-q) = 1-q Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 25

4. Επίλυση BoS με Βέλτιστες Αποκρίσεις (3/5) Έτσι, αν 2q > 1-q, δηλαδή q > 1/3, τότε η μοναδική βέλτιστη απόκριση του είναι το B, ενώ αν q <1/3 τότε η μοναδική του βέλτιστη απόκριση είναι το S. Αν q = 1/3 τότε και το B και το S, και επομένως και όλες οι μικτές στρατηγικές του παίκτη 1, αποφέρουν τα ίδια αναμενόμενα κέρδη, έτσι ώστε οποιαδήποτε μικτή στρατηγική να είναι η βέλτιστη απόκριση. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 26

4. Επίλυση BoS με Βέλτιστες Αποκρίσεις (4/5) Συνοπτικά, η συνάρτηση βέλτιστης απόκρισης για το παίκτη 1 είναι: q 1 B 1 (q) = {0} if q < 1 3 {p :0 p 1} if q = 1 3 {1} if q > 1 3. B 2 d player 2 s best response function. Th Παρομοίως, μπορούμε να βρούμε τη συνάρτηση βέλτιστης απόκρισης για τον παίκτη 2. Οι συναρτήσεις βέλτιστης απόκρισης και των δύο παικτών φαίνονται στο σχήμα δίπλα. 1 3 B 1 0 2 3 1 p Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 27

4. Επίλυση BoS με Βέλτιστες Αποκρίσεις (5/5) Βλέπουμε ότι το παίγνιο έχει τρεις ισορροπίες Nash στις μικτές στρατηγικές, στις οποίες (p, q) = (0, 0), (2/3, 1/3) και (1, 1). Η πρώτη και η τρίτη ισορροπία αντιστοιχούν στις ισορροπίες Nash της κανονικής έκδοσης του παιχνιδιού με διατακτικές προτιμήσεις, όταν στους παίκτες δεν επιτρέπεται η τυχαιότητα. Η δεύτερη ισορροπία είναι καινούργια. Σε αυτή την ισορροπία ο κάθε παίκτης επιλέγει τόσο Β όσο και S με θετική πιθανότητα (έτσι ώστε κάθε μία από τις τέσσερις εκβάσεις (Β, Β), (Β, S), (S, B) και (S, S) να προκύπτουν με θετική πιθανότητα. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 28

Παράρτημα Οι πιθανότητες για τα τέσσερα αποτελέσματα σε ένα παίγνιο δύο παικτών με δύο ενέργειες, όταν η μικτή στρατηγική του παίκτη 1 είναι η (p,1-p) και η μικτή στρατηγική του παίκτη 2 είναι η (q,1-q). L(q) R(1-q) T(p) pq p(1-q) B(1-p) (1-p)q (1-p)(1-q) Η αναμενόμενη απολαβή του παίκτη 1 για το ζευγάρι μικτών στρατηγικών (α1, α2) είναι: pq u1 (T, L) + p(1-q) u1 (T, R) + (1-p)q u1 (B, L) + (1-p)(1-q) u1 (B, R) => p[q u1 (T, L) + (1-q) u1 (T, R)] + (1-p)[q u1 (B, L) + (1-q) u1 (B, R)] Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 29