Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Θεωρία παιγνίων: Κώστας Ρουμανιάς Ο.Π.Α. Τμήμα Δ. Ε. Ο. Σ. 3 Δεκεμβρίου 2012 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 1 / 21 -best responses Κυνήγι ελαφιού: Δυο κυνηγοί ταυτόχρονα αποφασίζουν αν θα κυνηγήσουν ελάφι ή λαγό. Για να πιάσουν ελάφι χρειάζεται συντονισμός: πρέπει και οι δύο να κυνηγήσουν μαζί στην ίδια περιοχή. Το ελάφι δίνει πολύ κρέας. Λαγό μπορεί να κυνηγήσει ο καθένας μόνος αλλά θα έχει λιγότερο κρέας, ιδιαίτερα αν κυνηγήσουν και οι δύο λαγό. Παίκτες: Οι δύο κυνηγοί N = {1, 2}. Στρατηγικές: Τα σύνολα στρατηγικών είναι S i = {Ε, Λ} για κάθε παίκτη i {1, 2}. Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 2 / 21 Πληρωμές. Ας δούμε τις πληρωμές τους σε πίνακα στρατηγικής μορφής: Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 3 / 21 -best responses Θυμηθείτε: Στρατηγική είναι ένα πλάνο δράσης που λέει πώς θα παίξει ο κάθε παίκτης (ενδεχομένως το πλάνο έχει προετοιμάσει κάποιος τρίτος και συνιστά ΛΕΠΤΟΜΕΡΕΙΣ οδηγίες). Προφίλ στρατηγικών: Μια στρατηγική για κάθε παίκτη. Κάθε κελί του πίνακα αποτελεί ένα προφίλ στρατηγικών. Πληρωμές: Οι πληρωμές (κάτω αριστερά για τον γραμμή και πάνω δεξιά για τον στήλη) είναι η συνάρτηση χρησιμότητας του καθενός: u : S R. Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 4 / 21

-best responses Σε αυτό το παίγνιο δεν υπάρχουν κυρίαρχες ούτε κυριαρχούμενες στρατηγικές. Ας δούμε όμως τις άριστες αποκρίσεις των παικτών. Πληρωμές: Οι πληρωμές (κάτω αριστερά για τον γραμμή και πάνω δεξιά για τον στήλη) είναι η συνάρτηση χρησιμότητας του καθενός: u : S R. Ε Λ Ε 10 10 0 3 Λ 3 0 2 2 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 5 / 21 Ας συμβολίσουμε τις άριστες αποκρίσεις του γραμμή με πράσινο. και τις άριστες αποκρίσεις του στήλη με κόκκινο. Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 6 / 21 Ορισμός (Άριστη απόκριση) Η άριστη απόκριση για τον παίκτη i N είναι μια συνάρτηση B i (όχι πραγματική, αλλά ορίζεται από και προς σύνολα), τέτοια ώστε: B i (s i ) = {s i S i : u i (s i, s i ) u i (s i, s i), s i S i } Με λόγια: Η άριστη συνάρτηση δίνει τη άριστη στρατηγική s i του παίκτη i όταν οι άλλοι παίκτες παίζουν s i. Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 7 / 21 Ας δούμε άριστες αποκρίσεις (συμβολίζοντας τις άριστες στρατηγικές τουγραμμή με πράσινο και του στήλη με κόκκινο) για ένα παίγνιο στο οποίο ο γραμμή έχει 2 στρατηγικές και ο στήλη 3. Α Κ Δ Π 4,0 3,10 2,0 Κ 2,12 5,9 6,4 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 8 / 21

Ας δούμε άριστες αποκρίσεις για το παιχνίδι Πέτρα, Ψαλίδι, Χαρτί. Π Ψ Χ Π 0,0 1,-1-1,1 Ψ -1,1 0,0 1,-1 Χ 1,-1-1,1 0,0 Πίνακας: Το παιχνίδι πέτρα, ψαλίδι, χαρτί σε κανονική μορφή. Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 9 / 21 Ορισμός (-σε αμιγείς στρατηγικές) Μια ισορροπία Nash ενός παιγνίου είναι ένα προφίλ στρατηγικών s S τέτοιο ώστε για κάθε παίκτη i N: u i (s i, s i ) u i(s i, s i ) Η ισορροπία Nash είναι ένα προφίλ στρατηγικών (μια για κάθε παίκτη), τέτοιο ώστε η στρατηγική του κάθε παίκτη είναι άριστη απόκριση στις υπόλοιπες στρατηγικές του προφίλ. Αν δηλαδή οι υπόλοιποι παίκτες παίζουν το προφίλ ισορροπίας, τότε και ο παίκτης i θέλει να παίξει τη στρατηγική του προφίλ. Αλλιώς: αν όλοι παίζουν το προφίλ, κανένας δεν θέλει να φύγει από το προφίλ ΜΟΝΟΜΕΡΩΣ. Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 10 / 21 Παραδείγματα Ισορροπιών Nash Ας δούμε την/τις ισορροπίες Nash σε μία σειρά παιγνίων. Θυμηθείτε το δίλημμα του κρατουμένου Α Δ Π -1,-1-9,0 Κ 0,-9-6,-6 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 11 / 21 Παραδείγματα Ισορροπιών Nash. Το κυνήγι του Ελαφιού Στο κυνήγι του ελαφιού υπάρχουν δύο ισορροπίες Nash Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 12 / 21

Παραδείγματα Ισορροπιών Nash. Η μάχη των φύλων Η Τασία και ο Θανάσης θέλουν να συναντηθούν μετά το μάθημα για να συζητήσουν για την ισορροπία Nash. Μπορούν να πάνε είτε στο καφέ «Τριαντάφυλλο»(που προτιμάει η Τασία), είτε στο μπαρ «ο Μηχανόβιος» (που προτιμά ο Θανάσης). Παίκτες: Τασία (γραμμή) και Θανάσης (στήλη). N = {1, 2}. Στρατηγικές: κάθε παίκτης επιλέγει Καφέ ή Μπαρ: S i = {Καφέ, Μπαρ} για i = 1, 2. Πληρωμές: δίνονται από τον παρακάτω πίνακα μαζί με τις άριστες αποκρίσεις (και τις ισορροπίες Nash για όσους κατάλαβαν τα προηγούμενα). Καφέ Μπαρ Καφέ 4,3 1,1 Μπαρ 1,1 3,4 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 13 / 21 Παραδείγματα Ισορροπιών Nash. Η υιοθέτηση της τεχνολογίας Δύο ερευνητές αποφασίζουν αν θα επιλέξουν Microsoft Windows ή Apple Mac OS X λειτουργικό σύστημα. Υπάρχουν συνέργειες που ευνοούν τους ερευνητές όταν υιοθετούν το ίδιο πρόγραμμα. Και οι δύο ερευνητές θα είναι καλύτερα αν υιοθετήσουν το Mac (που ως γνωστόν είναι ανώτερο), αλλά θα το κάνουν μόνον αν είναι σίγουροι ότι ο συνάδελφός τους θα συντονιστεί σε Mac. Αλλιώς προτιμούν Windows που έχουν καλύτερη επικοινωνία με την υπόλοιπη ακαδημαϊκή κοινότητα. Παίκτες: Ερευνητής 1 και 2. N = {1, 2}. Στρατηγικές: κάθε παίκτης επιλέγει λειτουργικό: S i = {Windows, Mac} για i = 1, 2. Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 14 / 21 Παραδείγματα Ισορροπιών Nash. Η υιοθέτηση της τεχνολογίας Πληρωμές: δίνονται από τον παρακάτω πίνακα μαζί με τις άριστες αποκρίσεις (και τις ισορροπίες Nash). Windows Mac Windows 5,5 3,2 Mac 2,3 9,9 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 15 / 21 Παραδείγματα Ισορροπιών Nash. Chicken ή το γεράκι και το περιστέρι Δύο μέλη μιας συμμορίας διεκδικούν την αρχηγία (και την αγάπη της πρωταγωνίστριας). Μπαίνουν σε ένα αυτοκίνητο έκαστος απέναντι ο ένας από τον άλλον και αναπτύσσουν ταχύτητα κατευθυνόμενοι ο ένας προς τον άλλον. Κάθε μαχητής μπορεί είτε να συνεχίσει επιθετικά ως το τέλος (να παίξει το «γεράκι»), είτε να υποταχθεί (να παίξει «περιστέρι»). Αν και οι δύο παίξουν περιστέρι μοιράζονται το βραβείο (ο ένας παίρνει την αρχηγία και ο άλλος την κοπέλα). Το γεράκι νικάει το περιστέρι και τα παίρνει όλα. Αν και οι δύο παίξουν Γεράκι, διαλύουν τα αυτοκίνητά τους, καταλήγουν στο νοσοκομείο (πληρώνοντας c σε νοσήλεια) και χάνουν την αρχηγία (προς όφελος κάποιου τρίτου), καθώς και την πρωταγωνίστρια. Παίκτες: Οι δύο μαχητές. N = {1, 2}. Στρατηγικές: κάθε παίκτης επιλέγει Γεράκι ή Περιστέρι: S i = {Γεράκι, Περιστέρι} για i = 1, 2. Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 16 / 21

Παραδείγματα Ισορροπιών Nash. Chicken ή «το γεράκι και το περιστέρι» Πληρωμές: δίνονται από τον παρακάτω πίνακα μαζί με τις άριστες αποκρίσεις (και τις ισορροπίες Nash). Γεράκι Περιστέρι Γεράκι c, c v,0 v Περιστέρι 0,v 2, v 2 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 17 / 21 Παραδείγματα Ισορροπιών Nash. Ο ενοχλητικός καθηγητής Ο καθηγητής αν σας πετύχει έξω από την τάξη θα θελήσει να σας στριμώξει για να σας μιλήσει για θεωρία παιγνίων. Ο φοιτητής (αν και τρελλαίνεται για θεωρία παιγνίων) προτιμάει εκτός τάξης να χαλαρώσει (και άρα θα προτιμούσε να αποφύγει τον καθηγητή). Ο καθένας εκ των δύο μπορεί να επιλέξει μετά το μάθημα είτε το καφέ της γωνίας, είτε το εστιατόριο του Πανεπιστημίου. Παίκτες: Καθηγητής (γραμμή) και φοιτητής (στήλη). N = {1, 2}. Στρατηγικές: κάθε παίκτης επιλέγει Καφέ ή Εστιατόριο: S i = {Καφέ, Εστιατόριο} για i = 1, 2. Καφέ Εστιατόριο Καφέ 1,0 0,1 Εστιατόριο 0,1 1,0 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 18 / 21 Πότε δεν υπάρχει ισορροπία σε αμιγείς στρατηγικές; Από το παραπάνω παράδειγμα πρέπει να είναι προφανές ότι δεν υπάρχει πάντοτε ισορροπία σε αμιγείς στρατηγικές. Σε τι διαφέρει ο ενοχλητικός καθηγητής από τα προηγούμενα παραδείγματα; Ισως παρατηρήσατε ότι σε κανένα προφίλ στρατηγικών (κελί του πίνακα) δεν συνέπιπταν άριστες αποκρίσεις και για τους δύο παίκτες. Κάτι ανάλογο αν θυμάστε συνέβαινε και στο πέτρα ψαλίδι χαρτί. Π Ψ Χ Π 0,0 1,-1-1,1 Ψ -1,1 0,0 1,-1 Χ 1,-1-1,1 0,0 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 19 / 21 Παρατηρήσεις για την ισορροπία Nash Μια ισορροπία Nash είναι ένα προφίλ στρατηγικών στο οποίο όλοι οι παίκτες υιοθετούν από κοινού άριστες αποκρίσεις. Οι ισορροπίες Nash συνδυάζουν τη βέλτιστη συμπεριφορά με τις ορθολογικές προσδοκίες: Ολοι οι παίκτες μεγιστοποιούν τις αποδόσεις τους δεδομένων των προσδοκιών τους (για του πού παίζουν οι άλλοι). Οι προσδοκίες είναι από κοινού συνεπείς: όλοι προσδοκούν ότι θα βρεθούν στο προφίλ ισορροπίας. Αν υπάρχει λύση με κυρίαρχες στρατηγικές τότε είναι ισορροπία Nash. Αν υπάρχει λύσει που προκύπτει από συνεχόμενη διαγραφή κυριαρχούμενων στρατηγικών, τότε αυτή η λύση είναι και ισορροπία Nash Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 20 / 21

Παρατηρήσεις για την ισορροπία Nash Από την ισορροπία κανένας παίκτης δε θέλει να αποκλίνει μονομερώς. Σε πολλά παίγνια μπορεί να υπάρχουν πολλαπλές ισορροίες. Ενδέχεται σε κάποια παίγνια να μην υπάρχει ισορροπία Nash (σε αμιγείς στρατηγικές). Σε παίγνια που δε βρίσκουμε ισορροπία σε αμιγείς στρατηγικές, καταφεύγουμε σε μεικτές στρατηγικές, που είναι το θέμα των επόμενων σημειώσεων. Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 21 / 21