Θεωρία Παιγνίων. Εισαγωγικές έννοιες και Τεχνικές



Σχετικά έγγραφα
Θεωρία Παιγνίων και Αποφάσεων

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Βασικές Αρχές της Θεωρίας Παιγνίων

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Πανεπιστήμιο Πειραιώς. Τμήμα Οργάνωση και Διοίκηση Επιχειρήσεων

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

Κεφάλαιο 29 Θεωρία παιγνίων

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

δημιουργία: επεξεργασία: Ν.Τσάντας

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

ΕΜΠΕΙΡΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΗΣ NASH ΙΣΟΡΡΟΠΙΑΣ

Κεφ. 9 Ανάλυση αποφάσεων

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Το πρόβλημα της ισορροπίας Nash σε κοινοβουλευτικές συμμαχίες

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Αλγοριθμική Θεωρία Παιγνίων

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 1: Εισαγωγή. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Βασικές Έννοιες Θεωρίας Παιγνίων

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Notes. Notes. Notes. Notes

Εκτεταμένα Παίγνια (Extensive Games)

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Παραδείγματα Παιγνίων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Δεύτερο πακέτο ασκήσεων

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 11: Σχεδίαση μηχανισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Κεφάλαιο 28 Ολιγοπώλιο

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

Μεταξύ του µονοπωλίου και του τέλειου ανταγωνισµού

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

Βασικές Έννοιες Θεωρίας Παιγνίων

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

Ολιγοπώλιο. Εισαγωγή στην Οικονομική Επιστήμη Ι. Αρ. Διάλεξης: 11

Evolutionary Equilibrium

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

Ασκήσεις μελέτης της 6 ης διάλεξης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Στατικά Παίγνια Ελλιπούς Πληροφόρησης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

* τη µήτρα. Κεφάλαιο 1o

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

16 Η θεωρία παιγνίων

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 4: Η τραγωδία των κοινών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Το παράδοξο του St. Petersburg Η θεωρία του καταναλωτή σε περιβάλλον αβεβαιότητας που εξετάσαμε μπόρεσε να δώσει απάντηση σε κάποια ερωτήματα που πριν

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Εισαγωγή στην Οικονομική Ανάλυση

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Το Υπόδειγμα της Οριακής Τιμολόγησης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 6: Εκτατική μορφή παίγνιων. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΜΕΣΑΠΣΤΦΙΑΚΗ ΔΙΑΣΡΙΒΗ

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

B 1 A 1 B 2 A 2. t 1. t 3 w. t 2 A 3 B 3. t 4. t 5

ΤΖΟΝ ΦΟΡΜΠΣ ΝΑΣ. A beautiful mind Εργασία α λυκείου

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Master in Business Administration (M.B.A.


Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής

Κεφάλαιο 5 R (2, 3) R (3, 0)

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Βασικές Έννοιες Θεωρίας Παιγνίων

(γ) Τις μορφές στρατηγικής αλληλεπίδρασης που αναπτύσσονται

Transcript:

Θεωρία Παιγνίων Εισαγωγικές έννοιες και Τεχνικές

Η επιβίωση μας εξαρτάται από την αλληλεπίδραση με άλλα άτομα

Η επιβίωση μας εξαρτάται από την αλληλεπίδραση με άλλα άτομα

Η επιβίωση μας εξαρτάται από την αλληλεπίδραση με άλλα άτομα

Η επιβίωση μας εξαρτάται από την αλληλεπίδραση με άλλα άτομα

Αλληλεπίδραση Συνεργασία = Αρμονία Σύγκρουση = Καταστροφή

Αλληλεπίδραση Συνεργασία = Αρμονία Σύγκρουση = Καταστροφή

Αλληλεπίδραση Συνεργασία = Αρμονία Σύγκρουση = Καταστροφή

Αλληλεπίδραση Συνεργασία = Αρμονία Σύγκρουση = Καταστροφή

Αλληλεπίδραση Συνεργασία = Αρμονία Σύγκρουση = Καταστροφή

Αλληλεπίδραση Συνεργασία = Αρμονία Σύγκρουση = Καταστροφή

Πώς ρυθμίζονται οι αλληλεπιδράσεις μεταξύ ατόμων, ομάδων, οργανισμών, κρατών ; Τεχνολογία Το Διαδίκτυο διευκολύνει σημαντικά τις συναλλαγές μεταξύ πωλητών και αγοραστών αλλά περιπλέκει τα πράγματα αφού δημιουργεί ευκαιρίες για τέλεση απάτης Θεσμοί Νόμοι Εργοδότες και εργαζόμενοι έχουν συνήθως συγκρουόμενα συμφέροντα ως προς τις αμοιβές και τις εργασιακές συνθήκες και τα σωματεία εργαζομένων καθώς και το εργατικό δίκαιο παρέχουν διεξόδους και κανόνες διευθέτησης συγκρούσεων Πολιτισμός Ήθη Έθιμα Αρκετές πολιτισμικές και θρησκευτικές νόρμες, όπως αλτρουισμός ή αμοιβαιότητα, επιφέρουν κάποια τάξη σε ενδεχομένως επικίνδυνες αλληλεπιδράσεις μεταξύ ατόμων Οινόρμεςκαιοιθεσμοίσυνεχώςμεταλλάσσονταιακολουθώνταςτησυνεχώς μεταβαλλόμενη φύση των αντίστοιχων αλληλεπιδράσεων η κατανόηση της ανθρώπινης συμπεριφοράς σε κοινωνικό και θεσμικό πλαίσιο απαιτεί κατάλληλη κατανόηση της ανθρώπινης αλληλεπίδρασης

Πώς μελετώνται οι αλληλεπιδράσεις μεταξύ ατόμων; Οικονομικά, κοινωνιολογία, ψυχολογία, πολιτική επιστήμη: μελετούν τις ανθρώπινες αλληλεπιδράσεις από διαφορετική κοινωνική σκοπιά Κοινό χαρακτηριστικό: μελετούν το άτομο σε απομόνωση υποθέτοντας ότι η συμπεριφορά του δεν επηρεάζει σημαντικά τα άλλα άτομα Η τιμή που πουλά σιτάρι ένας μικροπαραγωγός στην Αμφιλοχία μάλλον δεν επηρεάζει την παγκόσμια τιμή του σιταριού Η πιθανότητα η δική μου ατομική ψήφος να αλλάξει το αποτέλεσμα των βουλευτικών εκλογών είναι εξαιρετικά μικρή Υπό συνθήκες, έχει νόημα να θεωρήσουμε αμελητέα την επίδραση των ατομικών μας ενεργειών όπως π.χ. για την παγκόσμια τιμή σιταριού ή για το αποτέλεσμα των εθνικών εκλογών

Πώς μελετώνται οι αλληλεπιδράσεις μεταξύ ατόμων; Υπάρχουν όμως και περιπτώσεις που ατομικές ενέργειες ΔΕΝ έχουν αμελητέα επίδραση στην έκβαση καταστάσεων Η τιμή που πουλά σιτάρι ένας μικροπαραγωγός στην Αμφιλοχία σε σύγκριση με άλλους μικροπαραγωγούς στην ίδια περιοχή σίγουρα επηρεάζει το κέρδος που αποκομίζει καθένας από αυτούς Αν κάποιος παραγωγός πουλάει σιτάρι πολύ φθηνότερα από τους άλλους παραγωγούς μιας τοπικής αγοράς τότε αυτός πουλάει περισσότερο από τους άλλους (και αντίστροφα) Δεν έχει νόημα να υποθέτουμε ότι οι παραγωγοί καθορίζουν τις τιμές τους ΧΩΡΙΣ να λαμβάνουν υπόψη το πώς οι αποφάσεις τους επηρεάζουν τους συναδέλφους τους προκειμένου να κατανοήσουμε τη συμπεριφορά τους Κατ αναλογία, η ατομική ψήφος σίγουρα επηρεάζει την έκβαση εκλογών στο πλαίσιο π.χ., ολιγομελών επιτροπών Δεν έχει νόημα να υποθέτουμε ότι τα μέλη επιτροπών ψηφίζουν αγνοώντας την επίδραση της ψήφου τους στο τελικό αποτέλεσμα

Κι εδώ υπεισέρχεται η Θεωρία Παιγνίων Η Θεωρία Παιγίων μελετά στρατηγικές αλληλεπιδράσεις σε ομάδες ατόμων «Αλληλεπιδράσεις»: μελετά τις αληλεπιδράσεις σε μια ομάδα ατόμων (ήκυβερνήσεις, εταιρείες, κτλ) όπου οι ενέργειες κάθε ατόμου επηρεάζουν το συνολικό αποτέλεσμα για το οποίο ενδιαφέρονται όλα τα μέλη της ομάδας «Στρατηγικές»: τα άτομα που αλληλεπιδρούν ενεργούν με στρατηγική δηλ., γνωρίζοντας ότι οι ατομικές τους ενέργειες επηρεάζουν και τα άλλα άτομα της ομάδας αν το άτομο δε γνωρίζει ότι οι ατομικές του ενέργειες επηρεάζουν το σύνολο δεν υπονοείται κατ ανάγκη στρατηγική συμπεριφορά

Πώς χρησιμοποιείται η «θεωρία» στην «πράξη»; Θεωρία: οργάνωση γνώσης και αύξηση κατανόησης ΠΩΣ; Εντοπισμός ουσιωδών χαρακτηριστικών μιας κατάστασης Ανάλυση μέσω συγκεκριμένων υποθέσεων και διαδικασιών Εξαγωγή γενικών αρχών και προβλέψεων που μπορούν να εφαρμοστούν σε συγκεκριμένα στιγμιότυπα

Πώς χρησιμοποιείται η «Θεωρία» Παιγνίων στην «πράξη»; Αρχικά, καθορίζονται κανόνες με βάση τους οποίους ενεργούν τα άτομα (rules of the game) Αν δε γνωρίζουμε πώς συμπεριφέρονται τα άτομα, ποιοι είναι οι στόχοι τους και πώς προσπαθούν να τους επιτύχουν δε μπορούμε να προβλέψουμε καμία έκβαση σε οποιαδήποτε κατάσταση Ζητούμενο: πρόβλεψη για την τιμή πώλησης σιταριού σε μια τοπική αγορά Υπόθεση 1: οι παραγωγοί ρίχνουν ένα νόμισμα για να αποφασίσουν αν θα πουλάνε με 1 ΕΥΡΩ ή 2 ΕΥΡΩ το κιλό Πρόβλεψη 1 Υπόθεση 2: προσπαθούν να κερδίσουν όσα περισσότερα χρήματα μπορούν Πρόβλεψη 2 Πρόβλεψη 1 Πρόβλεψη 2

Πώς χρησιμοποιείται η «Θεωρία» Παιγνίων στην «πράξη»; Υποθέτουμε ότι τα άτομα που συμμετέχουν στο παίγνιο είναι ορθολογικά (rational players) Ένα ορθολογικό άτομο έχει καλά ορισμένους στόχους (ή προτιμήσεις preferences) σε σχέση με το σύνολο των πιθανώνεκβάσεωνκαιυλοποιείτηνκαλύτερηστρατηγική γιανατουςεπιδιώξει Τα άτομα γνωρίζουν τις διαθέσιμες στρατηγικές Τα άτομα έχουν πλήρεις και συνεπείς προτιμήσεις για τις πιθανές εκβάσεις και γνωρίζουν αυτές τις προτιμήσεις Τα άτομα μπορούν να καθορίσουν την ατομικά βέλτιστη στρατηγική και να την υλοποιήσουν

Πώς χρησιμοποιείται η «Θεωρία» Παιγνίων στην «πράξη»; Υποθέτουμε ότι τα άτομα που συμμετέχουν στο παίγνιο είναι ορθολογικά (rational players) Η υπόθεση είναι μη ρεαλιστική σε ορισμένες περιπτώσεις οδηγεί σε μη ρεαλιστικά αποτελέσματα Η Περιορισμένη Ορθολογικότητα (Bounded Rationality) μελετά τα αποτελέσματα λιγότερο απαιτητικών μορφών ορθολογισμού Σε γενικές γραμμές: η υπόθεση ορθολογισμού λειτουργεί περιοριστικά

Πώς χρησιμοποιείται η «Θεωρία» Παιγνίων στην «πράξη»; Υποθέτουμε ότι υπάρχει κοινή γνώση (Common knowledge) ως προς το παιχνίδι και την ορθολογική συμπεριφορά Ένα γεγονός X είναι κοινή γνώση αν όλοι το γνωρίζουν, αν όλοι γνωρίζουν ότι όλοι το γνωρίζουν, ανόλοιγνωρίζουνότιόλοιγνωρίζουνότιόλοιτο γνωρίζουν κοκ Υπάρχει σχετικά έντονη φιλοσοφική συζήτηση και αμφισβήτηση για το τι θα πει «κοινή γνώση» Δεν αρκεί να γνωρίζει το άτομο ότι οι ενέργειές του και οι ενέργειες των άλλων ατόμων επηρεάζουν τη συνολική έκβαση πρέπει επιπλέον κάθε άτομοναγνωρίζειότικαιταάλλαάτοματογνωρίζουν αυτό Δύο παραγωγοί A και B γνωρίζουν ότι η τιμή που θα επιλέξουν να πουλάνε επηρεάζει το ημερήσιο κέρδος τους Υποθέστε ότι ο Α δε γνωρίζει ότι ο Β γνωρίζει την παραπάνω πρόταση ΟΑ πιστεύει ότι ο Β δεν έχει ιδέα για την κατάσταση στην αγορά και μπορεί να πουλά σε αυθαίρετη τιμή Η τελική απόφαση του Α για την τιμή που θα επιλέξει δεν έχει κανένα ενδιαφέρον Για μια πιο ρεαλιστική μοντελοποίηση της κατάστασης, υποθέτουμε ότι και οι δύο παραγωγοί γνωρίζουν ότι οι τιμές πώλησης που θα επιλέξουν θα επηρεάσουν το κέρδος τους Επιπλέον, υποθέτουμε ότι κοινή γνώση αποτελούν και οι κανόνες του παιχνιδιού και το πώς οι ατομικές ενέργειες επηρεάζουν τους συμμετέχοντες και τον ατομικό ορθολογισμό

Άρα, τι είναι η Θεωρία Παιγνίων; Συστηματική μελέτη στρατηγικών αλληλεπιδράσεων μεταξύ ορθολογικών ατόμων

Παράδειγμα 1 Πρόβλημα απόφασης με ένα άτομο που δεν εμπεριέχει στρατηγική αλληλεπίδραση Δεδομένα: Επενδυτής Α μπορεί να επενδύσει $100 είτε ασφαλώς σε κρατικά ομόλογα με ετήσιο κέρδος 10% είτε ρισκάροντας σε εταιρικές μετοχές με ετήσιο κέρδος 20% αν η εταιρεία πάει καλά ή 0 διαφορετικά Η πιο συμφέρουσα επένδυση για τον Α εξαρτάται από τις προτιμήσεις του και από τη σχετική πιθανότητα να συμβεί μια καλή ή κακή παγκόσμια οικονομική κατάσταση p: πιθανότητα καλής κατάστασης 1 p πιθανότητα κακής κατάστασης Στόχος Α: μεγιστοποίηση κεφαλαίου στο τέλος του έτους Επένδυση $100 σε ομόλογα: κεφάλαιο στο τέλος του έτους $110 ανεξάρτητα από την κατάσταση (δηλ., με σιγουριά) Επένδυση $100 σε μετοχές: κεφάλαιο στο τέλος του έτους = $120 με πιθανότητα p $100 με πιθανότητα 1 p κατά μέσο όρο p 120+(1 p) 100 = 100+20 p Αν p=1/2, κεφάλαιοστοτέλοςτουέτουςκατάμέσοόρο= $110 Αν p> 1/2, τον συμφέρει να επενδύσει σε μετοχές, αλλιώς αν p < 1/2 τον συμφέρει να επενδύσει σε ομόλογα.

Παράδειγμα 1 Πρόβλημα ατομικής απόφασης που μπορεί να αναλυθεί σε απομόνωση ως προς τη συμπεριφορά άλλων ατόμων Πιθανή αβεβαιότητα είναι εξωγενής: δεν καθορίζεται ούτε επηρεάζεται από τη συμπεριφορά του εμπλεκόμενου ατόμου Η αβεβαιότητα προκύπτει από την απόδοση της μετοχής και είναι ανεξάρτητη από την επιλογή του επενδυτή Α

Παράδειγμα 2 Ένα παιχνίδι επένδυσης Ο επενδυτής Α έχει δύο επιλογές για τα $100 1. Να τα επενδύσει σε ομόλογα με σίγουρο κέρδος 10% 2. Να τα επενδύσει ρισκάροντας σε μια επιχείρηση: 1. Απαιτούνται $200 για να είναι επιτυχής η επιχείρηση οπότε έχει κέρδος 20%, δηλ., με επένδυση $100 θα έχει $120 στο τέλος του έτους 2. Με λιγότερα από $200, η επιχείρηση αποτυγχάνει και έχει μηδενικό κέρδος, δηλ., με επένδυση $100 θα έχει $100 στο τέλος του έτους Ο Α γνωρίζει το άτομο Β που βρίσκεται στην ίδια κατάσταση και δεν υπάρχει κανείς άλλος πιθανός επενδυτής Οι Α και Β δε γνωρίζονται και δε μπορούν να επικοινωνήσουν Οι Α και Β πρέπει να αποφασίσουν σε ποια επένδυση θα καταλήξουν χωρίς να γνωρίζουν ο ένας την απόφαση του άλλου Οι Α και Β γνωρίζουν τους κανόνες του παιχνιδιού

Παράδειγμα 2 Ένα παιχνίδι επένδυσης Πλέον, υπάρχει στρατηγική αλληλεπίδραση: το κέρδος από την απόφαση του Α εξαρτάται από το τι θα κάνει ο Β Ο Α ρισκάροντας έχει ένα αβέβαιο αποτέλεσμα αλλά τώρα η αβεβαιότητα οφείλεται στον Β: Αν ο Α πιστεύει ότι ο Β θα επενδύσει στην επιχείρηση, τον συμφέρει να επενδύσει κι αυτός στην επιχείρηση (το ίδιο ισχύει και για τον Β) Αν ο Α πιστεύει ότι ο Β θα επενδύσει σε ομόλογα, τον συμφέρει να επενδύσει κι αυτός σε ομόλογα (το ίδιο ισχύει και για τον Β) Τι πρέπει να κάνει ο Α; χρειαζόμαστε συμπληρωματική πληροφορία για να απαντήσουμε Ποιοι είναι οι στόχοι των Α και Β, δηλ., ποιες είναι οι προτιμήσεις των Α και Β στο σύνολο των πιθανών αποτελεσμάτων; Μεγιστοποίηση της ανταμοιβής τους (payoff/utility) = το κεφάλαιό τους στο τέλος του έτους Πώς αποφασίζουν οι Α και Β; Ο Α πιστεύει ότι με πιθανότητα p ο Β θα επενδύσει σε ομόλογα Ίδιο με Παράδειγμα 1 ΔΕΝ απαιτείται Θεωρία Παιγνίων για απάντηση ΥποθέτουμεότιοιΑκαιοιΒείναιορθολογιστέςκαιότιδιαθέτουνκοινήγνώσηαυτού του γεγονότος

Παράδειγμα 3 Δίλημμα του Κρατουμένου Δύο ύποπτοι Α και Β συλλαμβάνονται και κρατούνται σε διαφορετικά κελιά πριν δικαστούν Ο εισαγγελέας που είναι σχεδόν σίγουρος ότι και οι δύο είναι ένοχοι δεν έχει αρκετά στοιχεία οπότε τους προτείνει την εξής συμφωνία: Αν και οι δύο ομολογήσουν και εμπλέξουν τον άλλον (Ο) καταδικάζονται σε 5 έτη φυλάκισης ο καθένας Αν μόνο ο ένας ομολογήσει και εμπλέξει τον άλλον (Μ), τότε το «καρφί» αθωώνεται γιατί συνεργάστηκε με τις αρχές ενώ ο άλλος καταδικάζεται σε 6 έτη φυλάκισης Αν κανένας δε συνεργαστεί, καταδικάζονται και οι δύο σε 1 έτος φυλάκισης Π.χ., το καλύτερο αποτέλεσμα για τον Α επιτυγχάνεται όταν προδώσει τον Β και ο Β δε συνεργαστεί, το επόμενο καλύτερο αποτέλεσμα για τον Α είναι το (Μ,Μ), μετά το (Ο,Ο) και τέλος το (M,Ο) (τα ίδια ισχύουν και για το Β)

Παράδειγμα 3 Δίλημμα του Κρατουμένου Πώς θα παίζατε αν ήσασταν ο Α; Χρήσιμη παρατήρηση: ανεξάρτητα από τοτισκοπεύει να κάνει ο Β, η επιλογή «Ομολογία» δίνει καλύτερο αποτέλεσμα για τον Α Το πιο ορθολογικό για τον Α είναι να παίξει «Ομολογία» καιτοίδιοισχύεικαι για τον Β Μια εύλογη πρόβλεψη είναι ότι η τελική έκβαση του παιχνιδιού θα είναι (Ο,Ο) δηλ., και οι δύο ύποπτοι θα ομολογήσουν Και το Δίλημμα είναι: δεν θα ήταν καλύτερο και για τους δύο να παίξουν «Μη ομολογία» αφού έτσι και αλλιώς και οι δύο προτιμούν το αποτέλεσμα (M,M) από το (Ο,Ο); Δυστυχώς, η ορθολογική, ατομικιστική συμπεριφορά οδηγεί σε χειρότερο αποτέλεσμα από την οπτική και των δύο παικτών

Παράδειγμα 3 Δίλημμα του Κρατουμένου ΜήπωςτοΔίλημμαοφείλεταιστοότιοιΚρατούμενοιείναισε διαφορετικά κελιά και δε μπορούν να συνεννοηθούν; Προφανώς, αν επικοινωνούσαν θα αντιλαμβάνονταν ότι η επιλογή (Μ,Μ) είναι καλύτερη και για τους δύο σε σχέση με την (Ο,Ο) και θα συμφωνούσαν να παίξουν Μ αντί για Ο Όμως, ποιος διαβεβαιώνει τον Α ότι ο Β θα τηρήσει τη συμφωνία; Επιπλέον, ανοβείναισίγουροςότιοαθαπαίξειμ, έχεισυμφέρονναπαίξειο Επομένως, ακόμα κι αν υπήρχε δυνατότητα προ συμφωνίας, και οι δύο Κρατούμενοι φοβούμενοι πιθανή προδοσία, θα επέλεγαν να προδώσουν πριν προδοθούν και θα έπαιζαν Ο

Παράδειγμα 3 Δίλημμα του Κρατουμένου Ίσως είναι πλέον σαφές το Δίλημμα αλλά και πάλι: γιατί τόση ενασχόληση με το πρόβλημα αυτό; Το Δίλημμα ανακύπτει σε πολλά ρεαλιστικά σενάρια Αλληλεξάρτηση μεταξύ ατόμων που ορθολογικά ακολουθούν το ατομικό τους συμφέρον οδηγεί σε κοινωνικά ανεπιθύμητα αποτελέσματα??? Νεοκλασσική Οικονομική Θεωρία: η εγωιστική επιδίωξη ατομικής ευημερίας οδηγεί σε αποδοτικά αποτελέσματα Το Δίλημμα του Κρατουμένου αποτελεί ισχυρό στοιχείο αμφισβήτησης του κλασσικού ισχυρισμού «η αποκεντρωμένη συμπεριφορά συνεπάγεται αποδοτικότητα» ιδιαίτερα σε περιβάλλοντα που ευνοούν τη στρατηγική αλληλεπίδραση Φαίνεται να μην ισχύει: τονακάνεικανείςό,τι είναι καλύτερο για τον ίδιον, οδηγεί στο να γίνεται τελικά ό,τι είναι καλύτερο για το σύνολο

Παράδειγμα 3 Δίλημμα του Κρατουμένου Παρόμοια Διλήμματα ανακύπτουν σε ενδιαφέρονται σενάρια όπως εξοπλιστικά προγράμματα, ανταγωνισμός τιμών, επίλυση διαμαχών με ή χωρίς δικηγόρους, κτλ Το κοινό στοιχείο σε όλα αυτά τα σενάρια είναι το ότι αν όλοι ενεργήσουν συνεργατικά προκύπτει καλό αποτέλεσμα αλλά κανείς δεν το βρίσκει προς το ατομικό του συμφέρον να ενεργήσει συνεργατικά οπότε προκύπτει τελικά χειρότερο αποτέλεσμα Παιχνίδι τιμών σε μια τοπική αγορά σιταριού: οι δύο παραγωγοί μπορούν να θέσουν χαμηλή (L) ή υψηλή (H) τιμή ο παραγωγός με τη χαμηλότερη τιμή κερδίζει ολόκληρη την αγορά ενώ αν είχαν ίσες τιμές θα μοιράζονταν εξίσου την αγορά

Παράδειγμα 3 Δίλημμα του Κρατουμένου Παρά τη ζοφερή εικόνα που μπορεί να εμφανίσει η ανθρώπινη αλληλεπίδραση, πολλές φορές υπάρχει συνεργασία Ανάλογη ανάλυση για περιβάλλοντα, θεσμούς και νόρμες δείχνει ότι προτιμάται τελικά η συνεργασία Φανταστείτε επαναληπτικές εκτελέσεις του Διλήμματος του Κρατουμένου Κάθε συμμετέχων λαμβάνει υπόψη όχι μόνο την ανταμοιβή από κάθε αλληλεπίδραση αλλά και πώς κάθε αλληλεπίδραση επηρεάζει τις μελλοντικές Π.χ., κάθε παίκτης θα μπορούσε να «εμπνεύσει» συνεργασία με κάποιον άλλον υιοθετώντας μια στρατηγική που τιμωρεί την κακή συμπεριφορά και αμείβει την καλή συμπεριφορά.

Παράδειγμα 4 Επαναστάτης χωρίς αιτία (ή Τοπαιχνίδιτης«κότας») (Στην κλασσική ταινία του 1955) ο Jim και ο Buzz ανταγωνίζονται για την Judy Καταλήγουν να πρέπει να μπουν σε ένα αυτοκίνητο και να επιταχύνουν προς ένα βράχο που οδηγεί στον Ειρηνικό Ωκεανό Ο πρώτος που θα εγκαταλείψει το αυτοκίνητο χαρακτηρίζεται «κότα» ενώ ο τελευταίος χαρακτηρίζεται «ήρωας» καικλέβειτηνκαρδιάτηςjudy Κάθε συμμετέχων έχει δύο στρατηγικές: Να εγκαταλείψει το αυτοκίνητο πρώτος (B) Να εγκαταλείψει το αυτοκίνητο δεύτερος (A) Ανκαιοιδύοεγκαταλείψουντοαυτοκίνητοπρώτοιταυτόχρονα(B,B), επιζούν αλλά χάνουν τη Judy Αν ο ένας εγκαταλείψει το αυτοκίνητο πριν τον άλλον, επιζούν και οι δύο αλλά ο τελευταίος κερδίζει τη Judy Αν και οι δύο εγκαταλείψουν το αυτοκίνητο δεύτεροι ταυτόχρονα (Α,Α) σκοτώνονται και γίνονται «ήρωες»

Παράδειγμα 4 Επαναστάτης χωρίς αιτία (ή Τοπαιχνίδιτης«κότας») Η πιθανή έκβαση δεν είναι σαφής Αν ο Jim πιστεύει ότι ο Buzz θα εγκαταλείψει πρώτος, τον συμφέρει να περιμένει και να εγκαταλείψει δεύτερος Αν ο Jim πιστεύει ότι ο Buzz θα τον περιμένει, τον συμφέρει να εγκαταλείψει πρώτος: νέος είναι θα ερωτευτεί άλλες κοπέλες Υπάρχει φυσικά και η «άτυχη» εκδοχή της ταινίας Το παιχνίδι της «κότας» χρησιμοποιείται για να μοντελοποιήσει πιο ενδιαφέρουσες καταστάσεις Δυναμικές εκδόσεις του παιγνίου καλούνται «Πόλεμος Φθοράς» Δύο άτομα εκτελούν μια ενέργεια και η επιλογή αφορά στο χρόνο εκτέλεσης της ενέργειας αυτής Και οι δύο συμμετέχοντες επιθυμούν να είναι οι τελευταίοι που θα εκτελέσουν την ενέργεια Στο παιχνίδι της «κότας» ηενέργειαείναιηεγκατάλειψητουαυτοκινήτου και οι δύο παίκτες περιμένουν ο ένας τον άλλον και χάνει αυτός που ενεργεί πρώτος

Τύποι παιγνίων Στρατηγικά παίγνια ή παίγνια σε Κανονική Μορφή (Strategic games Normal Form Games): οι συμμετέχοντες επιλέγουν τη στρατηγική τους ταυτόχρονα χωρίς να γνωρίζουν ο ένας την επιλογή του άλλου Τα παραδείγματα που είδαμε έως τώρα Αναπαράσταση μέσω πίνακα Παίγνια σε Εκτεταμένη Μορφή (Extensive Form Games): οι συμμετέχοντες επιλέγουν τη στρατηγική τους με ακολουθιακές κινήσεις και μπορούν να παρατηρούν τουλάχιστον κάποιες από τις κινήσεις των άλλων παικτών Επόμενα παραδείγματα Αναπαράσταση μέσω δέντρου

Παράδειγμα 5 Παιχνίδι Εισόδου Η Pepsi (P) αποφασίζει αν θα εισέλθει σε μια αγορά την οποία μονοπωλεί η Coke (C) Αφού παρατηρεί την επιλογή της Pepsi η Coke αποφασίζει αν θα πολεμήσει την είσοδο (F) π.χ., μέσω μείωσης τιμών ή μέσω διαφήμισης, αν θα συναινέσει (A) Υποθέτουμε ότι η Pepsi εισέρχεται μόνον αν συναινεί η Coke και η Coke προτιμά να διατηρήσει το μονοπώλιο αλλά σε περίπτωση εισόδου συναινεί Οι ανταμοιβές εμφανίζονται στα φύλλα του δέντρου Τι πρέπει να κάνει η Pepsi; Υπάρχει τρόπος η Coke να αποφύγει την είσοδο της Pepsi;

Παράδειγμα 6 Ψηφοφορία Υπάρχουν 2 ανταγωνιστικά νομοσχέδια, Α και Β και 3 νομοθέτες, οι ψηφοφόροι 1, 2 και 3 που πρόκειται να ψηφίσουν για αυτά τα νομοσχέδια Η ψηφοφορία γίνεται σε 2 γύρους Γύρος 1: οι νομοθέτες ψηφίζουν μεταξύ των Α και Β Γύρος 2: οι νομοθέτες ψηφίζουν μεταξύ του νικητή του πρώτου γύρου και του status quo (S) Οι προτιμήσεις των 3 ψηφοφόρων φαίνονται στον πίνακα

Παράδειγμα 6 Ψηφοφορία Αν κάθε ψηφοφόρος ψηφίζει ειλικρινά Γύρος 1: επικρατεί το Α (λόγω των 1 και 3) Γύρος 2: επικρατεί το Α (λόγω των 1 και 2) ΟΜΩΣ ο 3 δεν είναι χαρούμενος με το αποτέλεσμα (προτιμά S), οπότε κάνει κάτι άλλο: υποθέτοντας ότι οι 1 και 2 συνεχίζουν να ψηφίζουν με ειλικρίνεια, ψηφίζει το B αντί για το A στον Γύρο 1 επικρατεί το Β Γύρος 2: επικρατεί το S και ο 3 είναι πιο χαρούμενος ΟΜΩΣ ο 2 που προτιμά το Α μπορεί να αλλάξει την ψήφο του ώστε να επικρατήσει το Α στον Γύρο 1 και να επικρατήσει τελικά και στο Γύρο 2

Παράδειγμα 6 Ψηφοφορία Για να αναλύσουμε συστηματικά την κατάσταση ξεκινάμε από το Γύρο 2 Γύρος 2: κάθε ψηφοφόρος έχει συμφέρον να ψηφίσει με ειλικρίνεια αφού διαφορετικά σίγουρα δεν κερδίζει και πιθανώς χάνει ψηφίζοντας κάποια χαμηλότερης προτίμησης επιλογή Αν Α επικρατεί στο Γύρο 1, θα επικρατήσει και στο Γύρο 2 Αν Β επικρατεί στο Γύρο 1, θα επικρατήσει τελικά το S Ψηφίζοντας μεταξύ A και B στο Γύρο 1, ουσιαστικά ψηφίζουν μεταξύ A και S Οι ψηφοφόροι 1 και 2 θαψηφίσουνακαιτελικάθαεπικρατήσειτοα

Παίγνια με Ατελή Πληροφόρηση Games with Ιncomplete (Private) Information Έως τώρα υποθέταμε ότι κάθε συμμετέχων έχει πλήρη γνώση του παιγνίου, συμπεριλαμβανομένων και των προτιμήσεων των άλλων συμμετεχόντων Σε πολλές καταστάσεις δεν διαθέτουμε πληροφόρηση για πολλά συστατικά μιας στρατηγικής κατάστασης Ταυτότητα και προτιμήσεις των άλλων παικτών Διαθέσιμες στρατηγικές

Παράδειγμα 7 Επενδυτικό Παιχνίδι με Ατελή Πληροφόρηση Ο επενδυτής Α έχει δύο επιλογές για τα $100 1. Να τα επενδύσει σε ομόλογα με σίγουρο κέρδος 10% 2. Να τα επενδύσει ρισκάροντας σε μια επιχείρηση: 1. Απαιτούνται $200 για να είναι επιτυχής η επιχείρηση οπότε έχει κέρδος 20%, δηλ., με επένδυση $100 θα έχει $120 στο τέλος του έτους 2. Με λιγότερα από $200, η επιχείρηση αποτυγχάνει και έχει μηδενικό κέρδος, δηλ., με επένδυση $100 θα έχει $100 στο τέλος του έτους Ο Α δεν γνωρίζει πώς ακριβώς συμπεριφέρεται ο Β και πιστεύει με πιθανότητα p ότι ο Β φέρεται φυσιολογικά και έχει τις προτιμήσεις αριστερά με πιθανότητα 1 p ότι ο Β είναι επιρρεπής στο ρίσκο και έχει τις προτιμήσεις δεξιά

Παράδειγμα 7 Επενδυτικό Παιχνίδι με Ατελή Πληροφόρηση Τι να κάνει ο Α; Αν ο Α είναι σίγουρος ότι ο Β είναι επιρρεπής στο ρίσκο, η επιλογή είναι σαφής: πρέπει να επενδύσει στην επιχείρηση Πόσο μικρό πρέπει να είναι το p ώστε και οι δύο επενδυτές ανεξάρτητα από τις προτιμήσεις τους, ναεπενδύσουνστηνεπιχείρηση; Υποθέτουμε ότι ο κανονικός επενδυτής Β επιλέγει ομόλογα και αυτό φαντάζεται και ο Α Ηεπένδυσησεομόλογααποφέρει$110 στον Α ανεξάρτητα από την επιλογή του Β Η επένδυση σε επιχείρηση αποφέρει το ακόλουθο μέσο κέρδος στον Α: p 100+(1 p) 120 = 120 20p > $110 αν p<1/2 και οι δύο θα επενδύσουν στην επιχείρηση μόνο αν ο Α πιστεύει έντονα ότι ο Β είναι επιρρεπής στο ρίσκο

Παράδειγμα 7 Επενδυτικό Παιχνίδι με Ατελή Πληροφόρηση Παρατήρηση: ο Α έχει ατελή πληροφόρηση για το πώς συμπεριφέρεται ο Β αλλά ΔΕΝ ΕΧΕΙ ΤΗ ΔΥΝΑΤΟΤΗΤΑ να παρατηρεί τις επιλογές του Β και ενδεχομένως να μαθαίνει από αυτές Σε συγκεκριμένες στρατηγικές αλληλεπιδράσεις δεν είναι έτσι τα πράγματα

Παράδειγμα 8 Σηματοδότηση: μετάδοση πληροφορίας με χειρονομίες, πράξεις, ήχους Όταν κάνουμε αίτηση για δουλειά, ο εργοδότης δεν είναι σίγουρος για τις ικανότητές μας Προσπαθούμε να εντυπωσιάσουμε με το βιογραφικό, την εκπαίδευση, το ντύσιμο, τους τρόπους, κτλ προσπαθούμε να σηματοδοτήσουμε τις αρετές μας και να κρύψουμε τις αδυναμίες μας Οεργόδοτηςπρέπεινακαταλάβειποια«σήματα» να υπολογίσει και ποια να αγνοήσει (προσπαθεί να «κόψει» τους καλούς υποψήφιους) Όταν βγαίνουμε πρώτο ραντεβού με κάποιο άτομο Καθένας προσπαθεί να προβάλει τις καλές πλευρές και να κρύψει τις κακές (εκτός κι αν η κατάσταση ναυαγήσει από την αρχή ) Υπάρχει μια συνεχής πολύπλοκη αλληλεπίδραση σηματοδότησης και μαντεψιάς

Παράδειγμα 8 Το παιχνίδι του πρώτου ραντεβού ΟΑλέξανδρος(Α) και η Βένια (Β) βγαίνουν για πρώτη φορά Η Βένια θα αποφασίσει αν θα σχετιστεί σοβαρά με τον Αλέξανδρο (γάμος) ή όχι Η Βένια θέλει να σχετιστεί σοβαρά με έναν έξυπνο άντρα και δε γνωρίζει αν ο Αλέξανδρος είναι έξυπνος ή όχι: δίνει την ίδια πιθανότητα και στα δύο ενδεχόμενα Ο Αλέξανδρος θέλει να σχετιστεί σοβαρά μαζί της και προσπαθεί να δείξει ότι είναι έξυπνος λέγοντας αστεία και κάνοντας χιούμορ Το να κάνει κανείς χιούμορ δεν είναι πολύ εύκολο και προκαλεί πίεση ιδιαίτερα αν δεν είναι έξυπνος

Το παιχνίδι του πρώτου ραντεβού Παράδειγμα 8

Κατηγορίες παιγνίων Διδιάστατη προσέγγιση

Το παιχνίδι των χρηστών του πρωτοκόλλου TCP Φανταστείτε ότι υπάρχουν μόνο 2 χρήστες στο Internet, ο Α και ο Β ΗκίνησηστοInternet ρυθμίζεταιαπότοπρωτόκολλοtcp (Transmission Control Protocol) To TCP διαθέτει μηχανισμό υποχώρησης (backoff mechanism): αν οι ρυθμοί με τους οποίους στέλνουν πακέτα οι Α και Β προκαλούν συμφόρηση, υποχωρούν και οι δύο μειώνοντας τους ρυθμούς αποστολής τους για λίγο ώστε να εξαλειφθεί η συμφόρηση Υπάρχουν 2 σχετικές στρατηγικές: Στρατηγική C: χρήση του μηχανισμού υποχώρησης με μέση καθυστέρηση 1 ms για κάθε χρήστη Στρατηγική D: μη χρήση του μηχανισμού υποχώρησης με μέση καθυστέρηση 3 ms για κάθε χρήστη λόγω συμπληρωματικής επιβάρυνσης του δρομολογητή Αν ένας από τους Α και Β επιλέξει τη στρατηγική D και ο άλλος τη στρατηγική C όποιος επέλεξε τη D δεν έχει καμία καθυστέρηση ενώ αυτός που επέλεξε τη C έχει καθυστέρηση 4 ms Κάθε ορθολογικός χρήστης επιλέγει τη στρατηγική D ανεξάρτητα από τη στρατηγική που θα επιλέξει ο άλλος χρήστης ακόμα κι αν επιτρέψουμε στους χρήστες να συνεννοηθούν πριν αποφασίσουν ποια στρατηγική να επιλέξουν A B C D C 1, 1 4,0 D 0, 4 3, 3

Παίγνια κοινής ανταμοιβής: παιχνίδι συντονισμού Παίγνια στα οποία όλοι οι παίκτες έχουν την ίδια ανταμοιβή για κάθε πιθανή ενέργεια (Common payoff games) Παίγνια αμιγούς συντονισμού (pure coordination games) ή ομαδικά παίγνια (team games) Οι συμμετέχοντες δεν έχουν αντικρουόμενα συμφέροντα Στόχος τους είναι να συντονιστούν ώστε να επιλέξουν μια ενέργεια που μεγιστοποιεί το όφελος όλων Φανταστείτε 2 οδηγούς που οδηγούν σε αντίθετες κατευθύνσεις στην εξοχή χωρίς κανόνες κυκλοφορίας Πρέπει ανεξάρτητα να αποφασίσουν αν θα οδηγήσουν στην αριστερή ή στη δεξιά πλευρά του δρόμου Αν επιλέξουν την ίδια πλευρά έχουν μεγάλη ανταμοιβή, αν επιλέξουν διαφορετικές πλευρές έχουν μικρή ανταμοιβή B A Αριστερά Δεξιά Αριστερά 1,1 0,0 Δεξιά 0,0 1,1

Παίγνια σταθερού αθροίσματος: παιχνίδι ταιριάσματος κερμάτων Τοάθροισματωνανταμοιβώντωνπαικτώνείναισταθερόγιακάθε στρατηγική που επιλέγουν (constant sum games) Αν το άθροισμα είναι 0: παίγνια μηδενικού αθροίσματος (zero sum games) Είναι παίγνια αμιγούς ανταγωνισμού (pure competition games) Το κέρδος ενός παίκτη προκύπτει εις βάρος του άλλου παίκτη Περισσότεροι από 2 παίκτες δεν αλλάζουν το χαρακτήρα του παιγνίου: πάντα μπορείένααπότουςπαίκτεςναενεργείχωρίςναεπηρεάζειτιςανταμοιβές των υπολοίπων με ανταμοιβές που μηδενίζουν το συνολικό άθροισμα Παράδειγμα: Παίγνιο ταιριάσματος κερμάτων (Matching Pennies) Ένα κέρμα και δύο παίκτες Α και Β που επιλέγουν κορώνα ή γράμματα Αν επιλέξουν και οι δύο το ίδιο, ο Α παίρνει το κέρμα Αν επιλέξουν διαφορετικά, ο Β παίρνει το κέρμα B A Κορώνα Γράμματα Κορώνα 1, 1 1,1 Γράμματα 1,1 1, 1

Παίγνια σταθερού αθροίσματος: παιχνίδι «πέτρα, ψαλίδι, χαρτί» Τοάθροισματωνανταμοιβώντωνπαικτώνείναισταθερόγιακάθε στρατηγική που επιλέγουν (constant sum games) Αν το άθροισμα είναι 0: παίγνια μηδενικού αθροίσματος (zero sum games) Είναι παίγνια αμιγούς ανταγωνισμού (pure competition games) Το κέρδος ενός παίκτη προκύπτει εις βάρος του άλλου παίκτη Περισσότεροι από 2 παίκτες δεν αλλάζουν το χαρακτήρα του παιγνίου: πάντα μπορείένααπότουςπαίκτεςναενεργείχωρίςναεπηρεάζειτιςανταμοιβές των υπολοίπων με ανταμοιβές που μηδενίζουν το συνολικό άθροισμα Παράδειγμα: «Πέτρα, Ψαλίδι, Χαρτί»(Rock, Paper, Scissors Game) Γενίκευση του παιγνίου ταιριάσματος κερμάτων με 3 στρατηγικές Καθένας από δύο παίκτες Α και Β επιλέγει πέτρα ή ψαλίδι ή χαρτί Αν επιλέξουν και οι δύο το ίδιο, δεν υπάρχει νικητής και οι ανταμοιβές και των δύο παικτών είναι μηδενικές Διαφορετικά, κάθε ενέργεια κερδίζει μια άλλη και χάνει από μια άλλη Α Β Πέτρα Χαρτί Ψαλίδι Πέτρα 0,0 1,1 1, 1 Χαρτί 1, 1 0,0 1,1 Ψαλίδι 1,1 1, 1 0,0

Παίγνια συντονισμού και ανταγωνισμού: το παιχνίδι της μάχης των φύλων Παίγνιο συντονισμού και ανταγωνισμού Ένα ζευγάρι θέλει να αποφασίσει για το ποια ταινία θα δει στον κινηματογράφο: «Φονικό όπλο» ή «Θαυμαστή αγάπη» Προτιμούν να πάνε μαζί αντί χωριστά Ο άντρας προτιμά το «Φονικό όπλο» ενώ η γυναίκα τη «Θαυμαστή Αγάπη» Ο πίνακας ανταμοιβών είναι ο εξής: Φονικό όπλο Θαυμαστή αγάπη Φονικό όπλο 2,1 0,0 Θαυμαστή αγάπη 0,0 1,2

Αμιγείς και μικτές στρατηγικές Σε κάθε παίγνιο κάθε παίκτης διαθέτει ένα σύνολο ενεργειών Αμιγής στρατηγική: κάθε παίκτης επιλέγει μία ενέργεια Προφίλ αμιγούς στρατηγικής: οιενέργειεςπουεπέλεξανόλοιοιπαίκτες Οι ανταμοιβές (payoffs) ορίζονται μέσω του πίνακα ανταμοιβών (payoff matrix) Μικτή στρατηγική: κάθε παίκτης ρίχνει ένα ζάρι με το πολύ τόσες όψεις όσες και οι διαθέσιμες ενέργειες για να επιλέξει ενέργεια Σε παίγνια με πολλούς παίκτες ο ρόλος των μικτών στρατηγικών είναι ουσιώδης Υποστήριξη παίκτη: το σύνολο των αμιγών στρατηγικών κάθε παίκτη Πλήρως μικτή στρατηγική: κάθε πιθανή ενέργεια μπορεί να επιλεχθεί (με πιθανότητα >0) Η μέση ανταμοιβή κάθε παίκτη προκύπτει ως μέσος όρος των ανταμοιβών από τις διαθέσιμες ενέργειες Αμιγής στρατηγική = ειδική περίπτωση μικτής στρατηγικής όταν η υποστήριξη κάθε παίκτη είναι μία μόνο ενέργεια

Στρατηγικά παίγνια Ν: σύνολο παικτών Αi: σύνολο διαθέσιμων ενεργειών/στρατηγικών για κάθε παίκτη i ui: Α R: συνάρτηση ανταμοιβής για κάθε παίκτη I που δείχνει τις προτιμήσεις του για τις διαθέσιμες ενέργειες Ν={1,2} (Α1, Α2, u1, u2) Το παίγνιο (Α1, Α2, u1, u2) αναπαρίσταται με πίνακα 2 διαστάσεων (μία για κάθε παίκτη) Χρησιμοποιούνται για τη μελέτη καταστάσεων μεταξύ παικτών που επιλέγουν ενέργειες ταυτόχρονα ή χωρίς να γνωρίζουν τις ενέργειες που επιλέγουν οι άλλοι παίκτες Δεν είναι κατάλληλα για καταστάσεις όπου οι παίκτες επιλέγουν ενέργειες ακολουθιακά γνωρίζοντας τις ενέργειες που επέλεξαν οι άλλοι παικτες

Παράδειγμα: συμμετρικό στρατηγικό παίγνιο Ν={Α, Β} AΑ=AΒ={Ο,Μ} A = {(Ο,Ο),(Ο,Μ),(Μ,Ο),(Μ,Μ)} u1(o,o)= 5 u1(o,m)=0 u1(m,o)= 6 u1(m,m)= 1 u1(m,o)<u1(o,o)<u1(m,m)<u1(o,m) u2(o,o)= 5 u2(o,m)= 6 u2(m,o)=0 u2(m,m)= 1 u2(o,m)<u2(o,o)<u2(m,m)<u2(m,o) Συμμετρικό παίγνιο: αν εναλλάξουμε τις ενέργειες των παικτών εναλλάσσονται και οι ανταμοιβές τους Ίδια ανταμοιβή για την επιλογή της ίδια ενέργειας Δίλημμα του Κρατουμένου

Παράδειγμα: μη συμμετρικό στρατηγικό παίγνιο Ν={Α, Β} AΑ=AΒ={Κ,Γ} A = {(Κ,Κ),(Κ,Γ),(Γ,Κ),(Γ,Γ)} u1(κ,κ)= 5 u1(κ,γ)=0 u1(γ,κ)= 6 u1(γ,γ)= 1 u1(γ,κ)<u1(κ,κ)<u1(γ,γ)<u1(κ,γ) u2(κ,κ)= 5 u2(κ,γ)= 6 u2(γ,κ)=0 u2(γ,γ)= 1 u2(κ,γ)<u2(κ,κ)<u2(γ,γ)<u2(γ,κ) Μη Συμμετρικό παίγνιο: αν εναλλάξουμε τις ενέργειες των παικτών δεν εναλλάσσονται και οι ανταμοιβές τους Ταίριασμα Κερμάτων

Πώς παίζεται ένα στρατηγικό παίγνιο; Στόχος κάθε παίκτη: να αποφασίσει πώς θα κινηθεί χωρίς να γνωρίζει τις κινήσεις των αντιπάλων του Τρόπος: κάθε παίκτης εικάζει τις κινήσεις των άλλων συνήθως ΔΥΣΚΟΛΟ Σε ορισμένες περιπτώσεις δεν υπάρχει αυτή η δυσκολία γιατί υπάρχει τρόπος να αποφασίσει ο παίκτης βέλτιστα πώς θα κινηθεί ανεξάρτητα από το πώς θα κινηθούν οι άλλοι παίκτες Η βέλτιστη κίνηση/στρατηγική για τον παίκτη Α είναι η C ανεξάρτητα από την κίνηση που θα επιλέξει ο παίκτης Β Δίλημμα του Κρατουμένου

Πώς εντοπίζουμε βέλτιστες στρατηγικές; Όχι κοιτάζοντας μόνο τη συνάρτηση ανταμοιβής Δεν είναι πάντα προφανές μιας και αυτό που αξιολογεί βέλτιστο ένας παίκτης μπορεί να μην αξιολογείται ως βέλτιστο από τον άλλον Εντοπίζονταςκαταστάσειςστιςοποίεςμπορούμεμε βεβαιότητα να πούμε ότι το αποτέλεσμα είναι καλύτερο από κάποιο άλλο Οι παίκτες Α και Β λαμβάνουν χρηματική ανταμοιβή σε διαφορετικό νόμισμα και δε γνωρίζουμε ισοτιμίες Το αποτέλεσμα «10 χρηματικές μονάδες για τον Α και 3 χρηματικές μονάδες για τον Β» είναι σαφώς καλύτερο από το αποτέλεσμα «9 χρηματικές μονάδες για τον Α και 3 χρηματικές μονάδες για τον Β»

Επικρατής και βέλτιστη λύση κατά Pareto Σε ένα επικρατές κατά Pareto προφίλ στρατηγικών, κάθε παίκτης λαμβάνει ό,τι καλύτερο μπορεί χωρίς να ζημιώνει άλλους παίκτες Δε μπορούμε να εντοπίσουμε ΤΗ ΒΕΛΤΙΣΤΗ λύση μπορούμε όμως να καταλήξουμε σε ένα ΣΥΝΟΛΟ μη συγκρίσιμων ΚΑΛΩΝ ΛΥΣΕΩΝ Έχουμε μια μερική διάταξη των προφίλ στρατηγικών για τους παίκτες Βέλτιστη λύση κατά Pareto είναι η καλύτερη λύση (ήοι καλύτερες λύσεις) στη μερική διάταξη Υπάρχει τουλάχιστον μία βέλτιστη λύση κατά Pareto σεκάθεπαιχνίδι Κάποια παιχνίδια έχουν πολλές βέλτιστες λύσεις κατά Pareto

Επικρατής στρατηγική (dominant strategy) κυρίαρχη (dominant) στρατηγική: για όλους τους συνδυασμούς στρατηγικών των άλλων παικτών έχει το μεγαλύτερο όφελος σε σχέση με τις υπόλοιπες πάντα καλύτερη ό,τικαιανκάνειοάλλοςπαίκτηςαφούέχειτομεγαλύτερο κέρδος σε σχέση με τις άλλες εναλλακτικές επιλογές κυριαρχούμενη (dominated) στρατηγική: υπάρχει κάποια άλλη στρατηγική που είναι πάντα καλύτερη ό,τι και να κάνει ο άλλος παίκτης

Παράδειγμα: κυρίαρχη στρατηγική Για τον Β παίκτη η στρατηγική β1 κυριαρχεί της στρατηγικής β2, αφού 5>4 και 1>0 ΑνοΑπαίκτηςδιαλέξειτηνστρατηγικήα1, ο Β θα επιλέξει την β1 ΑνοΑπαίκτηςδιαλέξειτηνστρατηγικήα2, ο Β θα επιλέξει την β1 Άρα η καλύτερη κίνηση του παίκτη Β είναι να επιλέξει την β1 στρατηγική. Τι ισχύει για τον παίκτη Α; Αν ο Α ξέρει πως ο Β θα επιλέξει τη στρατηγική β1, τον συμφέρει να διαλέξει την α1, αφού (5>0) Αν όμως ο Β διαλέξει την β2, ο Α δεν θα επιλέξει πάλι την α1 αλλά την α2 αφού ( 100<0) Άρα για τον Α παίκτη καμιά στρατηγική δεν κυριαρχεί της άλλης Αν κάποιος παίκτης έχει κυρίαρχη στρατηγική την ακολουθεί και τότε το παιχνίδι έχει λύση κυρίαρχης στρατηγικής είναιπολύπιθανόναμηνυπάρχουνπάντακυρίαρχεςστρατηγικέςαλλάνα υπάρχουν ασθενείς κυριαρχίες

Ασθενής κυριαρχία Μια στρατηγική κυριαρχεί ασθενώς (weakly dominates) εάν για κάθε μία από τις εναλλακτικές στρατηγικές του παίκτη έχει τουλάχιστον ίση απολαβή για όλους τους συνδυασμούς στρατηγικών των υπολοίπων παικτών και καλύτερη απολαβή για τουλάχιστον έναν συνδυασμό στρατηγικών των άλλων παικτών όλες οι άλλες εναλλακτικές στρατηγικές ονομάζονται ασθενώς κυριαρχούμενες (weakly dominated strategy) ηστρατηγικήα1 κυριαρχεί ασθενώς της α2 αφού (5> 100) και (0=0)

Ισορροπία ισορροπία (equilibrium) στο παίγνιο: προέρχεται από τις καλύτερες στρατηγικές μία για κάθε παίκτη στο παιχνίδι η ισορροπία βρίσκεται στο κελί (α1, β1) δηλαδή στη λύση (5, 5) αφού η καλύτερη επιλογή για τον Α παίκτη είναι η α1, για τον Β παίκτη η β1 και η τομή τους είναι το κελί (α1, β1) Για να βρούμε αυτήν την ισορροπία: Αν υπάρχει κυρίαρχη στρατηγική για κάποιον παίκτη τότε επιλέγεται Αν δεν υπάρχει κυρίαρχη στρατηγική: εκτελούμε απαλοιφή κυριαρχούμενων στρατηγικών (Iterated Elimination of Dominated Strategies, IEDS) περιορίζοντας τις κυριαρχούμενες στρατηγικές μέχρι να βρεθεί μόνο μία στρατηγική για κάθε παίκτη Ισορροπία Nash: σημαντικότερη ισορροπία ενός παιγνίου

Πώς βλέπει κάθε παίκτης τη βέλτιστη λύση σε ένα παιχνίδι; Αν γνώριζε πώς θα κινηθούν οι άλλοι παίκτες, θα επέλεγε εκείνη την κίνηση (ήκινήσεις) που του δίνει (δίνουν) τη μεγαλύτερη ανταμοιβή ΑΛΛΑ ΔΕ ΓΝΩΡΙΖΕΙ Ισορροπία Nash (Nash equilibrium): κατάσταση κατά την οποία κανένας παίκτης δε θα άλλαζε (μονομερώς) τη στρατηγική του αν γνώριζε τις στρατηγικές των άλλων παικτών (που δε θα άλλαζαν) 2 ισορροπίες Nash καμία ισορροπία Nash με αμιγείς στρατηγικές υπάρχει ισορροπία Nash με μικτές στρατηγικές Φονικό όπλο Θαυμαστή αγάπη Φονικό όπλο 2,1 0,0 Θαυμαστή αγάπη 0,0 1,2

John Nash [1951] Ο Nash στα 21 χρόνια του απέδειξε ότι Σε κάθε παιχνίδι με πεπερασμένο αριθμό παικτών και ενεργειών υπάρχει τουλάχιστον μία ισορροπία Nash (Nash equilibrium) Αρχικά δημοσίευσε το 1950 μια δισέλιδη αναφορά με τίτλο Equilibrium Points in n Person Games στα Πρακτικά της National Academy of Sciences όπου ανέφερε περιληπτικά την ύπαρξη λύσεων για παίγνια με N παίκτες To 1951 δημοσίευσε εμπλουτισμένη έκδοση με τίτλο Non Cooperative Games στο Annals of Mathematics Αν και δεν έτυχε ευρείας υποδοχής στην αρχή, η προσέγγιση του Nash για την θεωρία παιγνίων, του απέφερε βραβείο Νόμπελ στα οικονομικά το 1994

Ισορροπία Νash: παράδειγμα Ποια στρατηγική θα επιλέξει ο παίκτης Α σε συγκεκριμένη στρατηγική του αντιπάλου;

Ισορροπία Νash: παράδειγμα Ποια στρατηγική θα επιλέξει ο παίκτης Α σε συγκεκριμένη στρατηγική του αντιπάλου; Έστω ότι ο Α πιστεύει πώς ο Β θα επιλέξει τη στρατηγική β1 Ο Α επιλέγει εκείνη από τις δύο δικές του στρατηγικές που θα του δώσει τη μεγαλύτερη ανταμοιβή, η α1 θα του δώσει ανταμοιβή 5, ενώ η α2 θα του δώσει 0 Ο παίκτης Α επιλέγει την στρατηγική α1 με κέρδος 5

Ισορροπία Νash: παράδειγμα Ποια στρατηγική θα επιλέξει ο παίκτης Α σε συγκεκριμένη στρατηγική του αντιπάλου; Έστω ότι ο Α πιστεύει πώς ο Β θα επιλέξει τη στρατηγική β1 Ο Α επιλέγει εκείνη από τις δύο δικές του στρατηγικές που θα του δώσει τη μεγαλύτερη ανταμοιβή, η α1 θα του δώσει ανταμοιβή 5, ενώ η α2 θα του δώσει 0 Ο παίκτης Α επιλέγει την στρατηγική α1 με κέρδος 5 ΑνοΑπιστεύειπωςοΒθαδιαλέξειτηστρατηγικήβ2 Ο Α επιλέγει τη στρατηγική α2 αφού το κέρδος του θα είναι μεγαλύτερο ( 100<0) ακόμα κι αν είναι 0 μονάδες

Ισορροπία Νash: παράδειγμα Ποια στρατηγική θα επιλέξει ο παίκτης Β σε συγκεκριμένη στρατηγική του αντιπάλου; ΑνοΒπιστεύειπωςοΑθαεπιλέξειτηστρατηγικήα1 ΟΒπροτιμάτη στρατηγική β1 που θα του δώσει κέρδος 5 μονάδες και όχι 4 μονάδες Αν ο Β πιστεύει πως ο Α θα ακολουθήσει τη στρατηγική α2 ΟΒπροτιμά καιπάλιτηστρατηγικήβ1 αφούέτσιθαέχεικέρδος1 μονάδα αντί για 0 μονάδες

Ισορροπία Νash: παράδειγμα Ισορροπία Nash υπάρχει όταν η καλύτερη απόκριση του παίκτη Α είναι ίδια με την καλύτερη απόκριση του παίκτη Β, όταν δηλαδή σε ένα κελί υπάρχουν οι επιλογές και των δύο παικτών, δηλ., σημείο ισορροπίας ισορροπία έχουμε στο κελί (α1, β1)=(5, 5) Υπάρχουν παιχνίδια αμιγών στρατηγικών με παραπάνω από μία ισορροπίες Nash και παιχνίδια αμιγών στρατηγικών χωρίς κανένα σημείο ισορροπίας Nash

Ισορροπία Νash: παράδειγμα Υπάρχουν αμιγείς και μικτές στρατηγικές Η επιλογή μικτής στρατηγικής ισοδυναμεί με το να επιλέξει ο παίκτης τυχαία μεταξύ συγκεκριμένων αμιγών στρατηγικών Π.χ., ο παίκτης Α επιλέγει τη στρατηγική α1 με πιθανότητα p ή την α2 με πιθανότητα p 1 επιλέγει τις πιθανότητες καθεμιάς από τις καθαρές στρατηγικές που εμπεριέχονται στην συγκεκριμένη μικτή στρατηγική Όσο και αν φαίνεται παράξενο υπάρχουν πολλές περιπτώσεις στην καθημερινή ζωή όπου οι παίκτες προτιμούν να χρησιμοποιήσουν μικτές στρατηγικές

Ισορροπία Νash: παράδειγμα ΟΝash απέδειξε ότι όλα τα πεπερασμένα παίγνια εμπεριέχουν τουλάχιστον ένα σύνολο μικτών στρατηγικών (μία ανά παίκτη) που συνιστά ισορροπία Νash Όταν υπάρχουν πολλές ισορροπίες Νash (σε καθαρές στρατηγικές), τη λύση δίνει η ισορροπία Νash με μικτές στρατηγικές Ακόμη και αν δεν υπάρχει ισορροπία σε καθαρές στρατηγικές, υπάρχει μία μοναδική ισορροπία με μικτές στρατηγικές

Ισορροπία Νash: παράδειγμα Η ισορροπία σε αμιγείς στρατηγικές φαίνεται πιο ελκυστική πρόταση από την ισορροπία στις μικτές, αφού δεν χρειάζεται οι παίκτες να επιλέγουν στην τύχη Όμως επειδή δεν υπάρχει ισορροπία σε κάθε παιχνίδι, η ισορροπία σε μικτές στρατηγικές αποκτάει μεγαλύτερη αξία αφού πλέον για κάθε παιχνίδι υπάρχει σίγουρα μία ισορροπία

Ισορροπία Νash: παράδοξο Σε κάποια παίγνια οι παίκτες έχουν μεγαλύτερο όφελος αν δεν διαλέξουν την ισορροπία Nash και διαλέξουν άλλη στρατηγική ΕνώηισορροπίαNash δίνει την ελκυστικότερη λύση για όλους τους παίκτες, οδηγώντας στο σημείο ισορροπίας, εντούτοις υπάρχουν κάποια διάσημα παίγνια που αποτελούν εξαίρεση στον κανόνα Π.χ., Το Δίλημμα του Κρατουμένου (Prisoner s dilemma)

Ισορροπία Νash και το Δίλημμα του Κρατουμένου Δύο εγκληματίες ύποπτοι για τη συμμετοχή σε μια ληστεία συλλαμβάνονται και ανακρίνονται χωριστά Ο ανακριτής λέει και στους δύο: «Γνωρίζουμε ότι είστε ένοχοι. Αν εσύ ομολογήσεις και ο συνεργός σου δεν ομολογήσει, θα είσαι ελεύθερος και ο φίλος σου θα εκτίσει ποινή δεκαετούς φυλάκισης. Αν όμως ομολογήσετε και οι δύο, θα μοιραστείτε την ποινή: 5 χρόνια έκαστος. Σε περίπτωση που δεν ομολογήσει κανείς σας, θαπάρετετοελάχιστο, 1 χρόνο έκαστος. Σε πληροφορώ ότι ο συνεργάτης μου κάνει την ίδια κουβέντα με το συνεργό σου. Τι αποφάσισες να κάνεις;» Οι δύο παίκτες έχουν όλες τις πληροφορίες (το παιχνίδι είναι «πλήρους πληροφόρησης»), αλλά βρίσκονται χωριστά και δεν μπορούν να επικοινωνήσουν (το παιχνίδι είναι «μη συνεργατικό») ΓιαταπαιχνίδιααυτούτουείδουςοNash απέδειξε το 1950 την ύπαρξη μιας ισορροπίας, δηλαδή ενός συνδυασμού «βέλτιστων» στρατηγικών Στο Δίλημμα του Κρατουμένου, η ισορροπία του Nash προβλέπει ότι θα ομολογήσουν και οι δύο: πράγματι, ο κίνδυνος δεκαετούς φυλάκισης ξεπερνά το δυνητικό όφελος από τη φυλάκιση ενός μόνου χρόνου

Ισορροπίες Nash με μικτές στρατηγικές Μάχη των δύο φύλων Ο άντρας επιλέγει με πιθανότητα p «Φονικό όπλο» και με 1 p «Θαυμαστή Αγάπη» Η γυναίκα πρέπει να λαμβάνει την ίδια μέση ανταμοιβή σε κάθε περίπτωση 2*p+0*(1 p)=0*p+1*(1 p) 2p=1 p 3p=1 p=1/3 Ταίριασμα κερμάτων Ο B επιλέγει με πιθανότητα p «Κορώνα» και με 1 p «Γράμματα» Ο Α πρέπει να λαμβάνει την ίδια μέση ανταμοιβή σε κάθε περίπτωση 1*p+( 1)*(1 p)=( 1)*p+1*(1 p) p 1+p= p+1 p 2p 1=1 2p 4p=2 p=1/2 Ανάλογα το παιχνίδι σκόρερ και τερματοφύλακα σε πέναλτυ Φονικό όπλο Θαυμαστή αγάπη Φονικό όπλο 2,1 0,0 Θαυμαστή αγάπη 0,0 1,2

Με χρήση Θεωρίας Παιγνίων μπορούμε να αναλύσουμε κάθε είδος αναμέτρησης, από την ντάμα και το σκάκι μέχρι τον τζόγο ή έναν πυρηνικό πόλεμο και να προβλέψουμε τον νικητή Ευρύ φάσμα εφαρμογών Οικονομία Επιχειρήσεις Πληροφορική Τηλεπικοινωνίες Πολιτική Κοινωνιολογία Βιολογία Καθημερινότητα

Ιστορικά στοιχεία 1838 Γάλλος οικονομολόγος Augustin Cournot: ανέλυσε ολιγοπωλιακές καταστάσεις με παρόμοιο τρόπο με τις σύγχρονες μεθόδους της θεωρίας παιγνίων 1928 Ούγγρος φυσικός και μαθηματικός John von Neumann: απέδειξε ότι τα παιχνίδια μηδενικού αθροίσματος έχουν πάντα λύση και ότι η απώλεια ενός παίκτη είναι ίση με το κέρδος του δεύτερου Καθοριστικό στην μετέπειτα ανάπτυξη της θεωρίας παιγνίων ήταν το βιβλίο Theory of Games & Economic Behavior των John von Neumann και Oskar Norgenstern το 1944 Αρχές δεκαετίας 1950 Αμερικανός μαθηματικός και οικονομολόγος John Nash: εισήγαγε μια ισορροπία για παιχνίδια μη μηδενικού αθροίσματος, γνωστή σαν ισορροπία Nash Ισορροπία Nash = κατάσταση κατά την οποία κανένας παίκτης δεν έχει συμφέρον να αλλάξει μονομερώς τις επιλογές του δεδομένων των επιλογών των αντιπάλων τους ΗζωήτουJohn Nash έγινε θέμα της ταινίας A beautiful mind με τον Russel Crow όχι μόνο για όλα όσα προσέφερε στη θεωρία παιγνίων αλλά και επειδή έπασχε από σύνδρομο καταδίωξης και σχιζοφρένειας από την ηλικία των 29 ετών

Ιστορικά στοιχεία Μετέπειτα η θεωρία παιγνίων γνώρισε αλματώδη ανάπτυξη και άρχισε να εφαρμόζεται σε όλους τους τομείς και τις πολιτικές επιστήμες πληθώρα ερευνητικών πειραμάτων ξεκίνησαν προσπαθώντας να βρουν λύση σε όλο και περισσότερα προβλήματα 1965 Reinhard Selten: μελέτησε δυναμικά παίγνια (που εξελίσσονται στο χρόνο), εισήγαγε την έννοια της ισορροπίας στα υποπαίγνια (subgame perfect equilibrium) και της ισορροπίας τρεμάμενου χεριού (trembling hand perfect equilibrium) 1975 John Harsanyi: γενίκευσε τις ιδέες του John Nash και μελέτησε παίγνια μη πλήρους πληροφόρησης 1994 Nash, Selten, Harsanyi: βραβείο Νόμπελ της Σουηδικής Ακαδημίας Επιστημών Δεκαετία 1970 John Naynard Smith: εφαρμογή θεωρίας παιγνίων στη βιολογία με χρήση εξελικτικά σταθερής στρατηγικής (evolutionary stable strategy)

Ιστορικά στοιχεία Τέλη δεκαετίας 1990: η θεωρία παιγνίων εφαρμόζεται στο σχεδιασμό δημοπρασιών κατανομή δικαιωμάτων χρήσης του ηλεκτρομαγνητικού φάσματος στη βιομηχανία των κινητών τηλεπικοινωνιών 2005 ο Αμερικανός Tomas Schelling και ο Γερμανός Robert Aumann: βραβείο Νόμπελ για Οικονομικές Επιστήμες επειδή εμπλούτισαν την αντίληψη μας σχετικά με τις έννοιες του ανταγωνισμού και της συνεργασίας μέσω της παιγνιοθεωρητικής ανάλυσης 2007 Roger Myerson, Leonid Hurwicz και Eric Maskin βραβείο Νόμπελ για τη θεμελίωση της θεωρίας σχεδιασμού μηχανισμών (mechanism design)

Θεωρία Παιγνίων και άλλες επιστήμες Οικονομικές επιστήμες: για βιομηχανική οργάνωση, σχεδιασμός μηχανισμών (mechanism design) με υποκλάδο τις δημοπρασίες, τις συμφωνίες, τα ολιγοπώλια, τα μονοπώλια, συστήματα ψηφοφοριών Έμφαση στην ισορροπία που υπάρχει στα παίγνια Παγκόσμια διπλωματία και πολεμικές στρατηγικές Πολιτική Οικονομία και ειδικότερα στη θεωρία της συλλογικής δράσης (Collective action): ανάλυση και ερμηνεία σεναρίων συνεργασίας μεταξύ των παικτών άμεση συσχέτιση με τον ρόλο του κράτους και των θεσμών σε θέματα συνεργασίας: χαρακτηριστικό παράδειγμα είναι η παροχή δημόσιων αγαθών και η φορολογία Βιολογία: αρχικά για ερμηνεία της εξέλιξης (και της σταθερότητας) της αναλογίας 1 προς 1 στα φύλα 1930 Ronald Fisher: αυτή η αναλογία είναι αποτέλεσμα εξελικτικών δυνάμεων που δρουν μεμονωμένα, προσπαθώντας να μεγιστοποιήσουν τον αριθμό των εγγονιών Βιολογία: για ερμηνεία της εμφάνισης επικοινωνίας στα ζώα και για ανάλυση της επιθετικής συμπεριφοράς τους

Κατηγορίες παιγνίων Με βάση τον αριθμό των παικτών παίγνια δύο παικτών: υπάρχουν δύο παίκτες μόνο ένας παίκτης έχοντας σαν αντίπαλό του τη φύση, όπως για παράδειγμα ισχύει στην πασιέντζα: θεωρούνται παίγνια δύο παικτών παίγνια N παικτών: υπάρχουν περισσότεροι από δύο παίκτες δεν έχουν μελετηθεί τόσο πολύ όσο τα πρώτα Με βάση τη δυνατότητα συνεργασίας συνεργατικά παίγνια (cooperative games): οι παίκτες (δύο ή περισσότεροι) πρινπαίξουντοπαίγνιοέχουντηδυνατότητανασυνεργαστούνκαινα κάνουν συμφωνίες μεταξύ τους για τις στρατηγικές που θα ακολουθήσουν μη συνεργατικά παίγνια (non cooperative games): ο παίκτης παίρνει τις αποφάσεις χωρίς να συνεννοηθεί με τους άλλους

Κατηγορίες παιγνίων Με βάση τα χαρακτηριστικά των αποδοχών τους παίγνια μηδενικού αθροίσματος (zero sum games): το κέρδος ενός παίκτη είναι ίσο με την απώλεια του αντιπάλου του το άθροισμα των αμοιβών είναι ίσο με μηδέν με αποτέλεσμα η συνεργασία για τους παίκτες να είναι ανέφικτη παίγνια μη μηδενικού αθροίσματος (non zero sum games): το άθροισμα των αμοιβών είναι διάφορο του μηδενός το κέρδος κάποιου δεν σημαίνει απαραίτητα τη ζημιά κάποιου ανταγωνιστή και οι δύο μπορεί να κερδίσουν ή και να χάσουν αντίστοιχα Με βάση τη σειρά λήψης αποφάσεων στατικά ή στρατηγικά ή παίγνια σε κανονική μορφή: οι αντίπαλοι κινούνται ταυτόχρονα επιλέγοντας μια στρατηγική στην αρχή του παιχνιδιού, χωρίς ο ένας να γνωρίζει τι θα πράξει ο άλλος η αναπαράσταση γίνεται με χρήση πίνακα δυναμικά παίγνια ή παίγνια σε εκτεταμένη μορφή: οι παίκτες έχουν κάποια γνώση για τις προηγούμενες ενέργειες και έτσι η σειρά με την οποία λαμβάνονται οι αποφάσεις έχει σημασία ηαναπαράστασηγίνεταιμεχρήσηδέντρου

Κατηγορίες παιγνίων Με βάση τον αριθμό των στρατηγικών πεπερασμένα παίγνια: τελειώνουν σε μετρήσιμο αριθμό κινήσεων μη πεπερασμένα παίγνια: διαρκούν για άπειρες κινήσεις και ο νικητής γίνεται γνωστός αφού όλες αυτές οι κινήσεις τελειώσουν Με βάση την πληροφόρηση που παρέχουν παίγνια πλήρους πληροφόρησης: οιπαίκτεςείναιπλήρωςενημερωμένοιγια τις κινήσεις των αντιπάλων μόνο τα δυναμικά παίγνια μπορεί να είναι παίγνια πλήρους πληροφόρησης, αφού στα στατικά οι παίκτες δεν είναι ενημερωμένοι παίγνια ατελούς πληροφόρησης: οι παίκτες είναι μερικώς ενημερωμένοι