Βασικές Έννοιες Θεωρίας Παιγνίων

Σχετικά έγγραφα
Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Βασικές Αρχές της Θεωρίας Παιγνίων

Μοντέλα των Cournotκαι Bertrand

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Ορισμένες Κατηγορίες Αλγορίθμων

Θεωρία Παιγνίων και Αποφάσεων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

Παραδείγματα Παιγνίων

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Evolutionary Equilibrium

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Εκτεταμένα Παίγνια (Extensive Games)

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Κεφάλαιο 29 Θεωρία παιγνίων

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Αλγοριθμική Θεωρία Παιγνίων

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Notes. Notes. Notes Σ -1,-1-9,0 Π 0,-9-6,-6. Notes Σ Π

Extensive Games with Imperfect Information

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

John Nash. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

δημιουργία: επεξεργασία: Ν.Τσάντας

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Αλληλεπιδράσεις πρακτόρων. Πώς σχεδιάζουμε κοινωνίες πρακτόρων;

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Κεφάλαιο 5 R (2, 3) R (3, 0)

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Δεύτερο πακέτο ασκήσεων

Αλγοριθµική Θεωρία Παιγνίων

παίγνια και δίκτυα Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Αλγοριθμικές Τεχνικές. Brute Force. Διαίρει και Βασίλευε. Παράδειγμα MergeSort. Παράδειγμα. Τεχνικές Σχεδιασμού Αλγορίθμων

Ανάλυση Ισορροπιών Σε Μηχανισμούς με Μερική Επαλήθευση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ (Master in Business Administration - M.B.A.)

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 1: Εισαγωγή. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεμελιώδη Θέματα Επιστήμης Υπολογιστών

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.


Δομές Δεδομένων & Αλγόριθμοι

Δυναμικές Δομές Δεδομένων Λίστες Δένδρα - Γράφοι

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

Αλγοριθμικές Τεχνικές

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις

Στατικά Παίγνια Ελλιπούς Πληροφόρησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Notes. Notes. Notes. Notes

Θέματα Υπολογισμού στον Πολιτισμό


Πληροφοριακά Συστήματα Διοίκησης. Επισκόπηση μοντέλων λήψης αποφάσεων Τεχνικές Μαθηματικού Προγραμματισμού

Παίγνια Συμφόρησης και Ανταγωνιστική Ανάθεση Πόρων

Κεφάλαιο 13ο Eπαναλαµβανόµενα παίγνια (Repeated Games)

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Transcript:

Παύλος Σ. Εφραιμίδης Έκδοση 05/11/2013

Περιεχόμενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός μαθηματικού μοντέλου Το δίλημμα του φυλακισμένου Σημείο ισορροπίας Nash

Θεωρία Παιγνίων Η θεωρία παιγνίων (game theory) μας βοηθάει στην κατανόηση καταστάσεων στις οποίες αλληλεπιδρούν decision-makers Παίγνιο: Ένα σύνολο παικτών που ανταγωνίζονται με βάση ένα προκαθορισμένο σύνολο κανόνων Οι παίκτες πρέπει να πάρουν αποφάσεις σε συνθήκες συναγωνισμού/ανταγωνισμού λαμβάνοντας υπόψη τις πιθανές κινήσεις των αντιπάλων

Εφαρμογές Η θεωρία παιγνίων μπορεί να εφαρμοστεί σε πολλές καταστάσεις: Εταιρείες που ανταγωνίζονται Πολιτικοί που διεκδικούν ψήφους Ένορκοι που αποφασίζουν για μια ετυμηγορία Ζώα που μάχονται για λεία Παίκτες που συμμετέχουν σε έναν πλειστηριασμό Η εξέλιξη της συμπεριφοράς μεταξύ διδύμων...

Πεδία Εφαρμογής Η θεωρία παιγνίων σχετίζεται ιδιαίτερα με κοινωνικά, πολιτικά και οικονομικά αντικείμενα. Τα τελευταία χρόνια στο χώρο της πληροφορικής ερευνάται η ακόλουθη εφαρμογή της θεωρίας παιγνίων: Έλλειψη συντονισμού κεντρικού ελέγχου

Μοντέλα Η θεωρία παιγνίων περιλαμβάνει ένα σύνολο μοντέλων Το μοντέλο είναι μια αφαίρεση που χρησιμοποιούμε για να κατανοήσουμε πραγματικές καταστάσεις Ένα μοντέλο είναι σημαντικό να είναι απλό, να επικεντρώνεται σε ουσιώδη στοιχεία δεν πρέπει να βασίζεται σε υποθέσεις που απέχουν υπερβολικά πολύ από την πραγματικότητα

Ορθότητα ενός μοντέλου Ένα μοντέλο δεν μπορεί να κριθεί με απόλυτα κριτήρια ως σωστό ή λανθασμένο Η χρησιμότητα ενός μοντέλου καθορίζεται από το σκοπό για τον οποίο χρησιμοποιείται Παράδειγμα: Βέλτιστη διαδρομή Για την απόσταση μεταξύ Ξάνθης και Καβάλας μπορούμε να υποθέσουμε ότι η γη είναι επίπεδη Για την απόσταση Ξάνθης και Μελβούρνης όμως ίσως θα πρέπει να λάβουμε υπόψη τη σφαιρικότητα της γης

Διαδικασία Μοντελοποίησης Τα βασικά βήματα: Μια αρχική ιδέα που σχετίζεται με την αλληλεπίδραση ιθυνόντων Διατύπωση της ιδέας με τη μορφή ενός μοντέλου, συμπεριλαμβάνοντας στο μοντέλο χαρακτηριστικά που φαίνονται σχετικά Το βήμα αυτό είναι και λιγάκι τέχνη: Επιθυμούμε αρκετά γνωρίσματα ώστε το μοντέλο να έχει ουσιαστική σημασία Επιθυμούμε μια όσο γίνεται απλή δομή Ανάλυση του μοντέλου. Κατά την ανάλυση μπορεί να προκύψει πρέπει να γίνουν προσαρμογές στο μοντέλο

Ορθολογική Επιλογή Η θεωρία ορθολογικής επιλογής (rational choice) ουσιαστικά λέει ότι ένας ιθύνοντας (decisionmaker) επιλέγει τον καλύτερη - σύμφωνα με τις προτιμήσεις του ενέργεια που έχει στη διάθεσή του. Ορθολογική επιλογή σε αυτή την περίπτωση σημαίνει ότι ο παίκτης απλά προσπαθεί να βελτιστοποιήσει την επιλογή του με βάση μόνο τις προτιμήσεις του

Παίγνια σε στρατηγική μορφή Ένα παίγνιο σε στρατηγική μορφή αποτελείται από Ένα σύνολο παικτών Για κάθε παίκτη, ένα σύνολο κινήσεων Για κάθε παίκτη, ένα σύνολο προτιμήσεων για κάθε πιθανό προφίλ στρατηγικών Ας ξεκινήσουμε με ένα από τα πιο διάσημα παραδείγματα, ένα παίγνιο σε στρατηγική μορφή: Το δίλημμα του φυλακισμένου

Το δίλημμα του φυλακισμένου (The prisoner s dilemma)

Το δίλημμα του φυλακισμένου Δύο κρατούμενοι κατηγορούνται για κάποια εγκλήματα Οι δύο κατηγορούμενοι είναι συνένοχοι ΟΜΩΣ, οι δικαστικές αρχές έχουν ελλιπή αποδεικτικά στοιχεία χωρίς άλλες αποδείξεις κάθε κρατούμενος θα τιμωρηθεί με 1 χρόνο φυλάκισης εάν αποδειχθούν όλες οι κατηγορίες τότε κάθε κρατούμενος θα φυλακιστεί για 4 χρόνια

Το δίλημμα Οι δικαστικές αρχές προ-φυλακίζουν χωριστά τους δύο κρατούμενους, και καλούν τον καθένα να συνεργαστεί, βεβαιώνοντάς τον ότι εάν συνεργαστεί θα τιμωρηθεί με επιείκεια (δηλαδή -1 χρόνο) Τώρα οι πιθανές εκβάσεις είναι: Κανείς δε συνεργάζεται, και τιμωρείται ο καθένας με ένα χρόνο φυλάκιση Και οι δύο συνεργάζονται, και τιμωρούνται και οι δύο με 3 χρόνια Ένας συνεργάζεται και ένας δε συνεργάζεται: Αυτός που συνεργάζεται παίρνει 0 χρόνια, δηλαδή απαλλάσσεται Αυτός που δε συνεργάζεται τιμωρείται με το μέγιστο της ποινής, δηλαδή 4 χρόνια

Οι δυνατές στρατηγικές (Strategies) για κάθε φυλακισμένο Ο κρατούμενος μπορεί είτε να συνεργαστεί με τις αρχές (να προδώσει δηλαδή) και να καταθέσει εναντίον του συνεργάτη/συνενόχου του να μη συνεργαστεί με τις αρχές

Το δίλημμα του φυλακισμένου Δύο κρατούμενοι Είναι συνένοχοι Οι δικαστικές αρχές έχουν ελλιπή αποδεικτικά στοιχεία Θα μιλήσεις!! Να μιλήσω ; Να μη μιλήσω ; Προλαβαίνω να διαβάσω θεωρία παιγνίων ;

Το δίλημμα ως παίγνιο Πολυπλοκότητα: Οι πιθανές στρατηγικές είναι 2 για κάθε παίκτη και επομένως η υπολογιστική πολυπλοκότητα του προβλήματος είναι τετριμμένη: 4 συνολικά σενάρια Πρόβλημα: Το πρόβλημα είναι πως να επιλέξει την καλύτερη δυνατή στρατηγική; Συνεργασία; Είναι σαφές ότι μία ικανοποιητική λύση και για τους δύο κρατούμενους είναι το (1,1), δηλαδή να μη συνεργαστεί κανείς ΌΜΩΣ, κάθε παίκτης αποφασίζει μόνος του!

Το δίλημμα του φυλακισμένου ως παίγνιο σε στρατηγική μορφή B Συνεργάζεται με τις αρχές (Προδίδει) B Δεν συνεργάζεται A Συνεργάζεται με τις αρχές (Προδίδει) 3, 3 0, 4 A Δεν συνεργάζεται 4, 0 1, 1 Τα έτη φυλάκισης για κάθε παίκτη για κάθε πιθανή εκδοχή του παιγνίου.

Συνάρτηση Απόδοσης για το δίλημμα του φυλακισμένου Για τον κρατούμενο-παίκτη Α: 1η Περίπτωση: Έστω ότι ο Β δε συνεργάζεται με τις αρχές Εάν δε συνεργαστώ και εγώ, παίρνω 1 χρόνο Εάν εγώ συνεργαστώ, παίρνω 0 (0 < 1) χρόνια 2η Περίπτωση: Έστω ότι ο Β συνεργάζεται με τις αρχές Εάν δε συνεργαστώ, παίρνω 4 χρόνια Εάν εγώ συνεργαστώ και εγώ, παίρνω 3 (3 < 4) χρόνια Στο παραπάνω παράδειγμα η συνάρτηση απόδοσης (utility function) δίνει το «κόστος» που θα πρέπει να πληρώσει ο παίκτης και επομένως ο «ορθολογικός στόχος» του παίκτη είναι να την ελαχιστοποιήσει

Ορθολογική Συμπεριφορά (Rational Behaviour) Θεωρούμε ότι οι παίκτες έχουν «ορθολογική συμπεριφορά»: Κάθε παίκτης επιλέγει μία βέλτιστη κίνησή του με βάση τις προτιμήσεις (preferences) που έχει. Ανεξάρτητα από τη φύση των προτιμήσεων του παίκτη σε ένα παίγνιο, συμπεριφέρεται ορθολογικά με την έννοια ότι προσπαθεί να ικανοποιήσει τις προτιμήσεις αυτές. Συνήθως οι προτιμήσεις των παικτών δίνονται με τη μορφή συναρτήσεων απόδοσης (utility functions ή payoff functions) ή ενός πίνακα (matrix game)

Το δίλημμα του φυλακισμένου Α 1η Περίπτωση: Έστω ότι ο Β δε συνεργάζεται με τις αρχές Εάν δε συνεργαστώ και εγώ, παίρνω 1 χρόνο Εάν εγώ συνεργαστώ, παίρνω 0 (0 < 1) χρόνια 2η Περίπτωση: Έστω ότι ο Β συνεργάζεται με τις αρχές Εάν δε συνεργαστώ, παίρνω 4 χρόνια Εάν εγώ συνεργαστώ και εγώ, παίρνω 3 (3 < 4) χρόνια? Δηλαδή, με συμφέρει ούτως ή άλλως να συνεργαστώ!!;;

Κυριαρχούμενη στρατηγική Κυριαρχούμενη στρατηγική Αυστηρά Κυριαρχούμενη στρατηγική Δίδαγμα 1: Δεν έχει νόημα ο παίκτης να επιλέξει μια αυστηρά κυριαρχούμενη στρατηγική

Λύση του παιγνίου

Λύση του παιγνίου Ο φυλακισμένος, σκεπτόμενος ορθολογικά, θα πρέπει να συνεργαστεί με τις αρχές και να προδώσει τον άλλο φυλακισμένο! Ο άλλος φυλακισμένος θα σκεφτεί με τον ίδιο ακριβώς ορθολογικό τρόπο και θα προδώσει και αυτός. Αποτέλεσμα: Οι δύο φυλακισμένοι θα πάρουν από 3 χρόνια φυλακής ο καθένας! Μια πολύ κακή λύση (από την μεριά των φυλακισμένων). Δίδαγμα 2: Οι ορθολογικές επιλογές μπορεί να οδηγήσουν σε κακές εκβάσεις.

Να προδίδουμε πάντοτε; Το γεγονός ότι σύμφωνα με τη λύση πρέπει να συνεργαστεί ο φυλακισμένο την επιστημονική κοινότητα Ίσως, εάν υπάρχει η έννοια της μνήμης, της συνέχειας κτλ. να μπορεί να φερθεί πιο αλτρουϊστικά Τι θα συμβεί λοιπόν εάν παίξουμε το παιχνίδι αρκετές στη σειρά;

Τουρνουά του Axelrod Στο τέλος της δεκαετίας του 1970, ο Axelrod (Πολιτικές Επιστήμες στο Πανεπιστήμιο του Michigan), κάλεσε οικονομολόγους, ψυχολόγους, μαθηματικούς και κοινωνιολόγους να υποβάλλουν λύση (με τη μορφή κώδικα) για το Δίλημμα του Φυλακισμένου

Τουρνουά του Axelrod 14 συμμετοχές Έπαιξαν όλοι εναντίον όλων Νικητής: tit-for-tat (Anatol Rapoport) Στο πρώτο γύρω: δεν μιλάω Σε κάθε επόμενο γύρω: ανταποδίδω Ανακοινώνονται τα αποτελέσματα και προκηρύσσεται νέος διαγωνισμός: 62 συμμετοχές Νικητής: Και πάλι το tit-for-tat που υπέβαλλε πάλι ο Rapoport

Τουρνουά του Axelrod (2) Ο Axelrod χρησιμοποίησε τις στρατηγικές του δεύτερου διαγωνισμού για ένα evolutionary τουρνουά Στρατηγικές που αποδίδουν καλά αναπαράγονται ταχύτερα Πιθανόν έτσι στρατηγικές που αρχικά τα καταφέρνουν καλά, να μην αποδίδουν στη συνέχεια διότι θα έχουν εξαλειφθεί οι στρατηγικές έναντι των οποίων υπερίσχυαν Μετά από ένα μεγάλο πλήθος γενεών, νικητής (πολυπληθέστερη ομάδα) ήταν η στρατηγική: Και πάλι το tit-for-tat!!

Ισορροπία Nash (Nash Equilibrium)

Ενέργειες των Παικτών Ποιες ενέργειες/κινήσεις επιλέγουν οι παίκτες σε ένα παίγνιο; Υποθέσαμε ότι οι παίκτες είναι ορθολογικοί και επιλέγει ο καθένας το καλύτερο σύμφωνα με τις προτιμήσεις του Όμως η έκβαση του παιγνίου για κάθε παίκτη εξαρτάται από τις επιλογές όλων των παικτών Επομένως ο ορθολογικός παίκτης πρέπει να λάβει υπόψη του και τι θα επιλέξουν οι υπόλοιποι παίκτες

«Λύση» ενός παιγνίου Ποιες κινήσεις επιλέγουν οι παίκτες ενός παιγνίου; Μπορούμε να υποθέσουμε ότι οι παίκτες, ως ορθολογικές οντότητες, επιλέγουν την καλύτερη δυνατή κίνηση ο καθένας Σε ένα παίγνιο όμως, η καλύτερη κίνηση για οποιοδήποτε παίκτη εξαρτάται από τις κινήσεις των υπολοίπων παικτών Επομένως ο παίκτης θα πρέπει να έχει μία εκτίμηση (belief) για τις κινήσεις των άλλων παικτών

Ισορροπία Nash (Nash Equilibrium) Μια ισορροπία Nash είναι μια κατάσταση του παιγνίου στην οποία κανένας παίκτης δεν μπορεί να βελτιώσει τη θέση του επιλέγοντας μια άλλη κίνηση, με την προϋπόθεση ότι όλοι οι υπόλοιποι παίκτες δεν θα αλλάξουν την κίνησή τους. Η ισορροπία Nash και οι παραλλαγές της είναι η δημοφιλέστερη έννοια λύσης παιγνίων.

Συμβολισμοί - Ορολογία στρατηγική αγνή στρατηγική (pure strategy): Ορίζει ντετερμινιστικά τη συμπεριφορά του παίκτη για κάθε ενέργεια που θα πρέπει να κάνει Πχ: Το δίλημμα του κρατούμενου μικτή στρατηγική (mixed strategy): Μια κατανομή πιθανότητας πάνω στις κινήσεις του παίκτη. Πχ. Πέτρα-ψαλίδι-χαρτί προφίλ ή περίγραμμα στρατηγικών α (profile): ένα διάνυσμα που καθορίζει μια στρατηγική για κάθε παίκτη προφίλ ή περίγραμμα μικτών στρατηγικών: ένα διάνυσμα που καθορίζει μια μικτή στρατηγική για κάθε παίκτη α -i :δεδομένου ενός προφίλ α συμβολίζουμε α -i το προφίλ με τις κινήσεις όλων των παικτών εκτός του παίκτη i όπως στο προφίλ a

Ισορροπία Nash (Nash Equilibrium) Χρησιμοποιώντας την έννοια του προφίλ ενεργειών ο ορισμός της ισορροπίας Nash είναι: Μια ισορροπία Nash είναι ένα προφίλ ενεργειών α* με την ιδιότητα ότι κανένας παίκτης δεν βελτιώνει τη θέση του επιλέγοντας μια ενέργεια διαφορετική από αυτή στο προφίλ α*, με δεδομένο ότι οι υπόλοιποι παίκτες δεν θα αλλάξουν την κίνησή τους, δηλαδή το a -i παραμένει σταθερό.

Εύρεση ισορροπίας Nash Εάν το πλήθος των παικτών και των κινήσεων είναι πολύ περιορισμένο τότε είναι δυνατό να εξετάσουμε όλα τα πιθανά προφίλ (brute force search) από την οπτική γωνία κάθε παίκτη για να βρούμε τις pure ισορροπίες Nash. Πολλές φορές είναι πιο αποτελεσματικό να χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης αντίδρασης.

Συνάρτηση Βέλτιστης Απόκρισης (Best Response Function)

Συναρτήσεις βέλτιστης απόκρισης Δεδομένου ενός προφίλ α -i η συνάρτηση βέλτιστης απόκρισης του παίκτη i δίνει το σύνολο των κινήσεων του παίκτη που επιτυγχάνουν το καλύτερο δυνατό αποτέλεσμα για αυτόν

Ισορροπία Nash και βέλτιστη απόκριση Χρησιμοποιώντας την έννοια του προφίλ ενεργειών μπορούμε να επαναδιατυπώσουμε τον ορισμό της ισορροπίας Nash: Ένα προφίλ κινήσεων α* είναι μια ισορροπία Nash εάν η ενέργεια κάθε παίκτη i στο προφίλ είναι η βέλτιστη απόκριση στο προφίλ α -i των υπολοίπων παικτών Heuristic: Μπορούμε να χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης απόκρισης για να αναζητήσουμε ισορροπίες Nash (ο αλγόριθμος αυτός δεν είναι απαραίτητα πολυωνυμικού χρόνου)

Παράδειγμα 39.1: Μια σχέση συνεργασίας Osborne, Ενότητα 2.8, Παράδειγμα 39.1 Δύο άτομα έχουν μια σχέση συνεργασίας, πχ. ένα κοινό project Συγκεκριμένα κάθε παίκτης προσφέρει έργο α i Η απόδοση του παίκτη i είναι α i (c+α j -α i ), όπου c > 0 είναι μια σταθερά

παράδειγμα 39.1 κάθε παίκτης έχει ένα άπειρο πλήθος κινήσεων. Επομένως δεν μπορούμε να χρησιμοποιήσουμε την αναπαράσταση με πίνακα θα χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης απόκρισης Δεδομένου του α j η βέλτιστη απόκριση του α i ποια είναι;

παράδειγμα 39.1 Το παίγνιο Δύο παίκτες i=1, 2 Κινήσεις κάθε παίκτη: Η προσπάθεια που θα καταβάλει για την κοινή εργασία Προτιμήσεις κάθε παίκτη i: u i =a i (c+a j -a i ) Μελέτη του παιγνίου: Επιλογή της έννοιας λύσης: Nash equilibrum Υπάρχουν ένα ή περισσότερα; Ποιο ή ποια είναι; Υπάρχουν λύσεις με μεγαλύτερη απόδοση από το NE (σε αυτό το παίγνιο);

παράδειγμα 39.1: οι συναρτήσεις βέλτιστης απόκρισης

παράδειγμα: συνεισφορά σε δημόσιο αγαθό (public good) δύο παίκτες i = 1, 2 αποφασίζουν εάν και πόσο θα συνεισφέρουν σε ένα δημόσιο αγαθό παίκτης i: έχει περιουσία (wealth) w i συνεισφέρει c i : 0 c i w i συνάρτηση απόδοσης: v i (c 1 + c 2 ) + w i c i και δεδομένου ότι w i είναι σταθερό, μπορούμε να θεωρήσουμε ως συνάρτηση απόδοσης: u i (c 1, c 2 ) = v i (c 1 + c 2 ) c i (παράδειγμα ενότητας 2.8.4, βιβλίο Osborne)

συνάρτηση βέλτιστης απόκρισης

συναρτήσεις βέλτιστης απόκρισης

Κυριαρχούμενες Ενέργειες Αυστηρή Κυριαρχία (Strict Domination) Σε στρατηγικό παίγνιο μια στρατηγική α2 i κυριαρχεί επί της στρατηγικής α1 i, εάν για κάθε προφίλ α -i, u i (α2 i,α -i ) > u i (α1 i,α -i ) Ασθενής Κυριαρχία (Weak Domination) Σε στρατηγικό παίγνιο μια στρατηγική α2 i κυριαρχεί επί της στρατηγικής α1 i, εάν για κάθε προφίλ α -i, u i (α2 i,α -i ) u i (α1 i,α -i ) και υπάρχει ένα τουλάχιστον προφίλ α -i για το οποίο: u i (α2 i,α -i ) > u i (α1 i,α -i )

Κυρίαρχη Στρατηγική Κυρίαρχη στρατηγική (dominant strategy) Μια στρατηγική ενός παίκτη είναι κυρίαρχη στρατηγική εάν επιτυγχάνει το καλύτερο δυνατό (για κάθε περίπτωση) payoff ανεξαρτήτως από τις κινήσεις των υπολοίπων παικτών. Βέλτιστη Απόκριση vs. Κυρίαρχη Στρατηγική: Η Βέλτιστη απόκριση αφορά συγκεκριμένο προφίλ

Συμμετρικό Παίγνιο (Symmetric Game) Συμμετρικό Παίγνιο μεταξύ δύο παικτών: Οι παίκτες έχουν τις ίδιες κινήσεις και για τις αποδόσεις των παικτών ισχύει: u 1 (a 1,a 2 ) = u 2 (a 2,a 1 ) για κάθε πιθανό προφίλ α=(a 1,a 2 ) Συμμετρική Ισορροπία Nash: σε στρατηγικό παίγνιο όλοι οι παίκτες έχουν τις ίδιες κινήσεις, ένα προφίλ α* είναι μία συμμετρική ισορροπία Nash εάν είναι σημείο ισορροπίας Nash και επιπλέον το α i * να είναι ίδιο για κάθε παίκτη i (όλοι οι παίκτες επιλέγουν την ίδια κίνηση).

Τι είναι λοιπόν η θεωρία παιγνίων

Τι είναι λοιπόν η θεωρία παιγνίων Η θεωρία παιγνίων μελετά την αλληλεπίδραση (ανταγωνισμό, συνεργασία κτλ.) μεταξύ ανεξάρτητων ορθολογικών (rational) οντοτήτων χρησιμοποιεί μαθηματικά μοντέλα για την μοντελοποίηση των προβλημάτων υπάρχει και το εμπειρικό/πρακτικό μέρος: experimental game theory βρίσκει εφαρμογή εδώ και αρκετά χρόνια στην Οικονομική Θεωρία τα τελευταία χρόνια αναπτύσσεται ένας ενδιαφέρον συνδυασμός θεωρίας παιγνίων και επιστήμης υπολογιστών αφορμή: η ανάπτυξη δικτυωμένων/κατανεμημένων συστημάτων με κύριο παράδειγμα το διαδίκτυο

Εφαρμογές της Θεωρίας Παιγνίων εταιρείες που ανταγωνίζονται υποψήφιοι πολιτικοί που ανταγωνίζονται για ψήφους υποψήφιοι αγοραστές ανταγωνίζονται σε έναν πλειστηριασμό Βιολογία/ διαδικασίες φυσικής επιλογής Εφαρμογές στην Επιστήμη Υπολογιστών

Θεωρία Παιγνίων και Επιστήμη Υπολογιστών Αλγόριθμοι για Επίλυση Παιγνίων Υπάρχει λύση για ένα παίγνιο; Μπορούμε να την υπολογίσουμε; Τι Πολυπλοκότητα έχει; Είναι πολλές οι λύσεις; Μπορούμε να βρούμε την καλύτερη ή μια αρκετά καλή; Μοντελοποίηση προβλημάτων της Επιστήμης Υπολογιστών ως παίγνια: Παγκόσμιος Ιστός Διαδίκτυο και γενικότερα κάθε Δίκτυο Agents, Κατανεμημένα συστήματα Κρυπτογραφία Επίσης ασφάλεια, εξοικονόμηση ενέργειας,

Πηγές/Αναφορές Κεφάλαια 1 και 2: An introduction to Game Theory, M. Osborne, Oxford University Press, 2004 Σημειώσεις του μαθήματος «Οικονομική Θεωρία και Αλγόριθμοι» του τμ. Μηχ. ΗΥ και Πληροφορικής, Παν/μιο Πατρών http://www.ceid.upatras.gr/courses/game_theory/ Game Theory, Video Course, Benjamin Polak, Yale http://academicearth.org/courses/game-theory