Βασικές Έννοιες Θεωρίας Παιγνίων

Σχετικά έγγραφα
Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Μοντέλα των Cournotκαι Bertrand

Βασικές Αρχές της Θεωρίας Παιγνίων

Παραδείγματα Παιγνίων

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Εκτεταμένα Παίγνια (Extensive Games)

Ορισμένες Κατηγορίες Αλγορίθμων

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Το μοντέλο DeGroot και το Παίγνιο Επιρροής

Evolutionary Equilibrium

Αλγοριθμική Θεωρία Παιγνίων

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

The DeGroot model for Social Influence and Opinions

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Κεφάλαιο 29 Θεωρία παιγνίων

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Extensive Games with Imperfect Information

John Nash. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

Αλληλεπιδράσεις πρακτόρων. Πώς σχεδιάζουμε κοινωνίες πρακτόρων;

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

δημιουργία: επεξεργασία: Ν.Τσάντας

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

παίγνια και δίκτυα Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Notes. Notes. Notes Σ -1,-1-9,0 Π 0,-9-6,-6. Notes Σ Π

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

POSITIVE AND NEGATIVE RELATIONSHIPS

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Ανάλυση Ισορροπιών Σε Μηχανισμούς με Μερική Επαλήθευση

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

Παίγνια Συμφόρησης και Ανταγωνιστική Ανάθεση Πόρων

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Rubinstein. (x 2, 1 x 2 ) = (0, 1).

Αλγοριθμικές Τεχνικές. Brute Force. Διαίρει και Βασίλευε. Παράδειγμα MergeSort. Παράδειγμα. Τεχνικές Σχεδιασμού Αλγορίθμων

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.


Κεφάλαιο 5 R (2, 3) R (3, 0)

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

Στατικά Παίγνια Ελλιπούς Πληροφόρησης

Δομές Δεδομένων & Αλγόριθμοι

Αλγοριθμικές Τεχνικές

Θεμελιώδη Θέματα Επιστήμης Υπολογιστών

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.


Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις

Θέματα Υπολογισμού στον Πολιτισμό

Δεύτερο πακέτο ασκήσεων

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Δημοπρασίες (Auctions)

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 1: Εισαγωγή. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Πληροφοριακά Συστήματα Διοίκησης. Επισκόπηση μοντέλων λήψης αποφάσεων Τεχνικές Μαθηματικού Προγραμματισμού

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Πανεπιστήμιο Πειραιώς. Τμήμα Οργάνωση και Διοίκηση Επιχειρήσεων

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ

Transcript:

Βασικές Έννοιες Θεωρίας v. 01/06/2014 Παύλος Σ. Εφραιμίδης Βασικές Έννοιες Θεωρίας

Περιεχόμενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός μαθηματικού μοντέλου Το δίλημμα του φυλακισμένου Σημείο ισορροπίας Nash Βασικές Έννοιες Θεωρίας

Θεωρία Η θεωρία παιγνίων (game theory) μας βοηθάει στην κατανόηση καταστάσεων στις οποίες αλληλεπιδρούν decision-makers Παίγνιο: Ένα σύνολο παικτών που ανταγωνίζονται με βάση ένα προκαθορισμένο σύνολο κανόνων Οι παίκτες πρέπει να πάρουν αποφάσεις σε συνθήκες συναγωνισμού/ανταγωνισμού λαμβάνοντας υπόψη τις πιθανές κινήσεις των αντιπάλων Βασικές Έννοιες Θεωρίας

Εφαρμογές Η θεωρία παιγνίων μπορεί να εφαρμοστεί σε πολλές καταστάσεις: Εταιρείες που ανταγωνίζονται Πολιτικοί που διεκδικούν ψήφους Ένορκοι που αποφασίζουν για μια ετυμηγορία Ζώα που μάχονται για λεία Παίκτες που συμμετέχουν σε έναν πλειστηριασμό Η εξέλιξη της συμπεριφοράς μεταξύ διδύμων... Βασικές Έννοιες Θεωρίας

Πεδία Εφαρμογής Η θεωρία παιγνίων σχετίζεται ιδιαίτερα με κοινωνικά, πολιτικά και οικονομικά αντικείμενα. Τα τελευταία χρόνια στο χώρο της πληροφορικής ερευνάται η ακόλουθη εφαρμογή της θεωρίας παιγνίων: Έλλειψη συντονισμού κεντρικού ελέγχου Βασικές Έννοιες Θεωρίας

Μοντέλα Η θεωρία παιγνίων περιλαμβάνει ένα σύνολο μοντέλων Το μοντέλο είναι μια αφαίρεση που χρησιμοποιούμε για να κατανοήσουμε πραγματικές καταστάσεις Ένα μοντέλο είναι σημαντικό να είναι απλό, να επικεντρώνεται σε ουσιώδη στοιχεία δεν πρέπει να βασίζεται σε υποθέσεις που απέχουν υπερβολικά πολύ από την πραγματικότητα Βασικές Έννοιες Θεωρίας

Ορθότητα ενός μοντέλου Ένα μοντέλο δεν μπορεί να κριθεί με απόλυτα κριτήρια ως σωστό ή λανθασμένο Η χρησιμότητα ενός μοντέλου καθορίζεται από το σκοπό για τον οποίο χρησιμοποιείται Παράδειγμα: Βέλτιστη διαδρομή Για την απόσταση μεταξύ Ξάνθης και Καβάλας μπορούμε να υποθέσουμε ότι η γη είναι επίπεδη Για την απόσταση Ξάνθης και Μελβούρνης όμως ίσως θα πρέπει να λάβουμε υπόψη τη σφαιρικότητα της γης Βασικές Έννοιες Θεωρίας

Διαδικασία Μοντελοποίησης Τα βασικά βήματα: Μια αρχική ιδέα που σχετίζεται με την αλληλεπίδραση ιθυνόντων Διατύπωση της ιδέας με τη μορφή ενός μοντέλου, συμπεριλαμβάνοντας στο μοντέλο χαρακτηριστικά που φαίνονται σχετικά Το βήμα αυτό είναι και λιγάκι τέχνη: Επιθυμούμε αρκετά γνωρίσματα ώστε το μοντέλο να έχει ουσιαστική σημασία Επιθυμούμε μια όσο γίνεται απλή δομή Ανάλυση του μοντέλου. Κατά την ανάλυση μπορεί να προκύψει πρέπει να γίνουν προσαρμογές στο μοντέλο Βασικές Έννοιες Θεωρίας

Ορθολογική Επιλογή Η θεωρία ορθολογικής επιλογής (rational choice) ουσιαστικά λέει ότι ένας ιθύνοντας (decision-maker) επιλέγει τον καλύτερη - σύμφωνα με τις προτιμήσεις του ενέργεια που έχει στη διάθεσή του. Ορθολογική επιλογή σε αυτή την περίπτωση σημαίνει ότι ο παίκτης απλά προσπαθεί να βελτιστοποιήσει την επιλογή του με βάση μόνο τις προτιμήσεις του Βασικές Έννοιες Θεωρίας

Παίγνια σε στρατηγική μορφή Ένα παίγνιο σε στρατηγική μορφή αποτελείται από Ένα σύνολο παικτών Για κάθε παίκτη, ένα σύνολο κινήσεων Για κάθε παίκτη, ένα σύνολο προτιμήσεων για κάθε πιθανό προφίλ στρατηγικών Ας ξεκινήσουμε με ένα από τα πιο διάσημα παραδείγματα, ένα παίγνιο σε στρατηγική μορφή: Το δίλημμα του φυλακισμένου Βασικές Έννοιες Θεωρίας

ΤΟ ΔΊΛΗΜΜΑ ΤΟΥ ΦΥΛΑΚΙΣΜΈΝΟΥ (THE PRISONER S DILEMMA) Βασικές Έννοιες Θεωρίας

Το δίλημμα του φυλακισμένου Δύο κρατούμενοι κατηγορούνται για κάποια εγκλήματα Οι δύο κατηγορούμενοι είναι συνένοχοι ΟΜΩΣ, οι δικαστικές αρχές έχουν ελλιπή αποδεικτικά στοιχεία χωρίς άλλες αποδείξεις κάθε κρατούμενος θα τιμωρηθεί με 1 χρόνο φυλάκισης εάν αποδειχθούν όλες οι κατηγορίες τότε κάθε κρατούμενος θα φυλακιστεί για 4 χρόνια

Το δίλημμα Οι δικαστικές αρχές προ-φυλακίζουν χωριστά τους δύο κρατούμενους, και καλούν τον καθένα να συνεργαστεί, βεβαιώνοντάς τον ότι εάν συνεργαστεί θα τιμωρηθεί με επιείκεια (δηλαδή -1 χρόνο) Τώρα οι πιθανές εκβάσεις είναι: Κανείς δε συνεργάζεται, και τιμωρείται ο καθένας με ένα χρόνο φυλάκιση Και οι δύο συνεργάζονται, και τιμωρούνται και οι δύο με 3 χρόνια Ένας συνεργάζεται και ένας δε συνεργάζεται: Αυτός που συνεργάζεται παίρνει 0 χρόνια, δηλαδή απαλλάσσεται Αυτός που δε συνεργάζεται τιμωρείται με το μέγιστο της ποινής, δηλαδή 4 χρόνια

Οι δυνατές στρατηγικές (Strategies) για κάθε κρατούμενο Ο κρατούμενος μπορεί είτε να συνεργαστεί με τις αρχές (να προδώσει δηλαδή) και να καταθέσει εναντίον του συνεργάτη/συνενόχου του να μη συνεργαστεί με τις αρχές

Το δίλημμα του κρατούμενου Δύο κρατούμενοι Είναι συνένοχοι Οι δικαστικές αρχές έχουν ελλιπή αποδεικτικά στοιχεία Θα μιλήσεις!! Να μιλήσω ; Να μη μιλήσω ; Προλαβαίνω να διαβάσω θεωρία παιγνίων ;

Το δίλημμα ως παίγνιο Πολυπλοκότητα: Οι πιθανές στρατηγικές είναι 2 για κάθε παίκτη και επομένως η υπολογιστική πολυπλοκότητα του προβλήματος είναι τετριμμένη: 4 συνολικά σενάρια Πρόβλημα: Το πρόβλημα είναι πως να επιλέξει την καλύτερη δυνατή στρατηγική; Συνεργασία; Είναι σαφές ότι μία ικανοποιητική λύση και για τους δύο κρατούμενους είναι το (1,1), δηλαδή να μη συνεργαστεί κανείς ΌΜΩΣ, κάθε παίκτης αποφασίζει μόνος του!

Το δίλημμα του φυλακισμένου ως παίγνιο σε στρατηγική μορφή B Συνεργάζεται με τις αρχές (Προδίδει) B Δεν συνεργάζεται A Συνεργάζεται με τις αρχές (Προδίδει) 3, 3 0, 4 A Δεν συνεργάζεται 4, 0 1, 1 Τα έτη φυλάκισης για κάθε παίκτη για κάθε πιθανή εκδοχή του παιγνίου.

Συνάρτηση Απόδοσης για το δίλημμα του φυλακισμένου Για τον κρατούμενο-παίκτη Α: 1η Περίπτωση: Έστω ότι ο Β δε συνεργάζεται με τις αρχές Εάν δε συνεργαστώ και εγώ, παίρνω 1 χρόνο Εάν εγώ συνεργαστώ, παίρνω 0 (0 < 1) χρόνια 2η Περίπτωση: Έστω ότι ο Β συνεργάζεται με τις αρχές Εάν δε συνεργαστώ, παίρνω 4 χρόνια Εάν εγώ συνεργαστώ και εγώ, παίρνω 3 (3 < 4) χρόνια Στο παραπάνω παράδειγμα η συνάρτηση απόδοσης (utility function) δίνει το «κόστος» που θα πρέπει να πληρώσει ο παίκτης και επομένως ο «ορθολογικός στόχος» του παίκτη είναι να την ελαχιστοποιήσει Βασικές Έννοιες Θεωρίας

Ορθολογική Συμπεριφορά (Rational Behaviour) Θεωρούμε ότι οι παίκτες έχουν «ορθολογική συμπεριφορά»: Κάθε παίκτης επιλέγει μία βέλτιστη κίνησή του με βάση τις προτιμήσεις (preferences) που έχει. Ανεξάρτητα από τη φύση των προτιμήσεων του παίκτη σε ένα παίγνιο, συμπεριφέρεται ορθολογικά με την έννοια ότι προσπαθεί να ικανοποιήσει τις προτιμήσεις αυτές. Συνήθως οι προτιμήσεις των παικτών δίνονται με τη μορφή συναρτήσεων απόδοσης (utility functions ή payoff functions) ή ενός πίνακα (matrix game) Βασικές Έννοιες Θεωρίας

Το δίλημμα του κρατούμενου Α 1η Περίπτωση: Έστω ότι ο Β δε συνεργάζεται με τις αρχές Εάν δε συνεργαστώ και εγώ, παίρνω 1 χρόνο Εάν εγώ συνεργαστώ, παίρνω 0 (0 < 1) χρόνια 2η Περίπτωση: Έστω ότι ο Β συνεργάζεται με τις αρχές Εάν δε συνεργαστώ, παίρνω 4 χρόνια Εάν εγώ συνεργαστώ και εγώ, παίρνω 3 (3 < 4) χρόνια? Δηλαδή, με συμφέρει ούτως ή άλλως να συνεργαστώ!!;;

Κυριαρχούμενη στρατηγική Κυριαρχούμενη στρατηγική Αυστηρά Κυριαρχούμενη στρατηγική Δίδαγμα 1: Δεν έχει νόημα ο παίκτης να επιλέξει μια αυστηρά κυριαρχούμενη στρατηγική Βασικές Έννοιες Θεωρίας

ΛΎΣΗ ΤΟΥ ΠΑΙΓΝΊΟΥ Βασικές Έννοιες Θεωρίας

Λύση του παιγνίου Ο φυλακισμένος, σκεπτόμενος ορθολογικά, θα πρέπει να συνεργαστεί με τις αρχές και να προδώσει τον άλλο φυλακισμένο! Ο άλλος φυλακισμένος θα σκεφτεί με τον ίδιο ακριβώς ορθολογικό τρόπο και θα προδώσει και αυτός. Αποτέλεσμα: Οι δύο φυλακισμένοι θα πάρουν από 3 χρόνια φυλακής ο καθένας! Μια πολύ κακή λύση (από την μεριά των φυλακισμένων). Δίδαγμα 2: Οι ορθολογικές επιλογές μπορεί να οδηγήσουν σε κακές εκβάσεις. Βασικές Έννοιες Θεωρίας

Να προδίδουμε πάντοτε; Το γεγονός ότι σύμφωνα με τη λύση πρέπει να συνεργαστεί ο φυλακισμένο την επιστημονική κοινότητα Ίσως, εάν υπάρχει η έννοια της μνήμης, της συνέχειας κτλ. να μπορεί να φερθεί πιο αλτρουιστικά Τι θα συμβεί λοιπόν εάν παίξουμε το παιχνίδι αρκετές στη σειρά;

Τουρνουά του Axelrod Στο τέλος της δεκαετίας του 1970, ο Axelrod (Πολιτικές Επιστήμες στο Πανεπιστήμιο του Michigan), κάλεσε οικονομολόγους, ψυχολόγους, μαθηματικούς και κοινωνιολόγους να υποβάλλουν λύση (με τη μορφή κώδικα) για το Δίλημμα του Φυλακισμένου

Τουρνουά του Axelrod 14 συμμετοχές Έπαιξαν όλοι εναντίον όλων Νικητής: tit-for-tat (Anatol Rapoport) Στο πρώτο γύρω: δεν μιλάω Σε κάθε επόμενο γύρω: ανταποδίδω Ανακοινώνονται τα αποτελέσματα και προκηρύσσεται νέος διαγωνισμός: 62 συμμετοχές Νικητής: Και πάλι το tit-for-tat που υπέβαλλε πάλι ο Rapoport

Τουρνουά του Axelrod (2) Ο Axelrod χρησιμοποίησε τις στρατηγικές του δεύτερου διαγωνισμού για ένα evolutionary τουρνουά Στρατηγικές που αποδίδουν καλά αναπαράγονται ταχύτερα Πιθανόν έτσι στρατηγικές που αρχικά τα καταφέρνουν καλά, να μην αποδίδουν στη συνέχεια διότι θα έχουν εξαλειφθεί οι στρατηγικές έναντι των οποίων υπερίσχυαν Μετά από ένα μεγάλο πλήθος γενεών, νικητής (πολυπληθέστερη ομάδα) ήταν η στρατηγική: Και πάλι το tit-for-tat!!

ΙΣΟΡΡΟΠΊΑ NASH (NASH EQUILIBRIUM) Βασικές Έννοιες Θεωρίας

Ενέργειες των Παικτών Ποιες ενέργειες/κινήσεις επιλέγουν οι παίκτες σε ένα παίγνιο; Υποθέσαμε ότι οι παίκτες είναι ορθολογικοί και επιλέγει ο καθένας το καλύτερο σύμφωνα με τις προτιμήσεις του Όμως η έκβαση του παιγνίου για κάθε παίκτη εξαρτάται από τις επιλογές όλων των παικτών Επομένως ο ορθολογικός παίκτης πρέπει να λάβει υπόψη του και τι θα επιλέξουν οι υπόλοιποι παίκτες Βασικές Έννοιες Θεωρίας

«Λύση» ενός παιγνίου Ποιες κινήσεις επιλέγουν οι παίκτες ενός παιγνίου; Μπορούμε να υποθέσουμε ότι οι παίκτες, ως ορθολογικές οντότητες, επιλέγουν την καλύτερη δυνατή κίνηση ο καθένας Σε ένα παίγνιο όμως, η καλύτερη κίνηση για οποιοδήποτε παίκτη εξαρτάται από τις κινήσεις των υπολοίπων παικτών Επομένως ο παίκτης θα πρέπει να έχει μία εκτίμηση (belief) για τις κινήσεις των άλλων παικτών Βασικές Έννοιες Θεωρίας

Ισορροπία Nash (Nash Equilibrium) Μια ισορροπία Nash είναι μια κατάσταση του παιγνίου στην οποία κανένας παίκτης δεν μπορεί να βελτιώσει τη θέση του επιλέγοντας μια άλλη κίνηση, με την προϋπόθεση ότι όλοι οι υπόλοιποι παίκτες δεν θα αλλάξουν την κίνησή τους. Η ισορροπία Nash και οι παραλλαγές της είναι η δημοφιλέστερη έννοια λύσης παιγνίων. Βασικές Έννοιες Θεωρίας

Συμβολισμοί - Ορολογία στρατηγική αγνή στρατηγική (pure strategy): Ορίζει ντετερμινιστικά τη συμπεριφορά του παίκτη για κάθε ενέργεια που θα πρέπει να κάνει Πχ: Το δίλημμα του κρατούμενου μικτή στρατηγική (mixed strategy): Μια κατανομή πιθανότητας πάνω στις κινήσεις του παίκτη. Πχ. Πέτρα-ψαλίδι-χαρτί προφίλ ή περίγραμμα στρατηγικών α (profile): ένα διάνυσμα που καθορίζει μια στρατηγική για κάθε παίκτη προφίλ ή περίγραμμα μικτών στρατηγικών: ένα διάνυσμα που καθορίζει μια μικτή στρατηγική για κάθε παίκτη α -i :δεδομένου ενός προφίλ α συμβολίζουμε α -i το προφίλ με τις κινήσεις όλων των παικτών εκτός του παίκτη i όπως στο προφίλ a Βασικές Έννοιες Θεωρίας

Ισορροπία Nash (Nash Equilibrium) Χρησιμοποιώντας την έννοια του προφίλ ενεργειών ο ορισμός της ισορροπίας Nash είναι: Μια ισορροπία Nash είναι ένα προφίλ ενεργειών α* με την ιδιότητα ότι κανένας παίκτης δεν βελτιώνει τη θέση του επιλέγοντας μια ενέργεια διαφορετική από αυτή στο προφίλ α*, με δεδομένο ότι οι υπόλοιποι παίκτες δεν θα αλλάξουν την κίνησή τους (δηλαδή το α -i θα παραμείνει σταθερό). Βασικές Έννοιες Θεωρίας

Εύρεση ισορροπίας Nash Εάν το πλήθος των παικτών και των κινήσεων είναι πολύ περιορισμένο τότε είναι δυνατό να εξετάσουμε όλα τα πιθανά προφίλ (brute force search) από την οπτική γωνία κάθε παίκτη για να βρούμε τις pure ισορροπίες Nash. Πολλές φορές είναι πιο αποτελεσματικό να χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης απόκρισης. Βασικές Έννοιες Θεωρίας

Πολυπλοκότητα εύρεσης NE Πρόσφατα αποτελέσματα έδειξαν ότι είναι μάλλον μη αναμενόμενο να υπάρχει αποτελεσματικός (πολυωνυμικός) αλγόριθμος για την εύρεση ισορροπίας Nash Βασικές Έννοιες Θεωρίας

Συναρτήσεις βέλτιστης απόκρισης Δεδομένου ενός προφίλ α -i η συνάρτηση βέλτιστης απόκρισης ή συνάρτηση βέλτιστης αντίδρασης (best response function) του παίκτη i δίνει το σύνολο των κινήσεων του παίκτη που επιτυγχάνουν το καλύτερο δυνατό αποτέλεσμα για αυτόν Βασικές Έννοιες Θεωρίας

Ισορροπία Nash και βέλτιστη απόκριση Χρησιμοποιώντας την έννοια του προφίλ ενεργειών μπορούμε να επαναδιατυπώσουμε τον ορισμό της ισορροπίας Nash: Ένα προφίλ κινήσεων α* είναι μια ισορροπία Nash εάν η ενέργεια κάθε παίκτη i στο προφίλ είναι η βέλτιστη απόκριση στο προφίλ α -i των υπολοίπων παικτών Heuristic: Μπορούμε να χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης απόκρισης για να αναζητήσουμε ισορροπίες Nash (ο αλγόριθμος αυτός δεν είναι απαραίτητα πολυωνυμικού χρόνου) Βασικές Έννοιες Θεωρίας

Παράδειγμα 39.1: Μια σχέση συνεργασίας Osborne, Ενότητα 2.8, Παράδειγμα 39.1 Δύο άτομα έχουν μια σχέση συνεργασίας, πχ. ένα κοινό project Συγκεκριμένα κάθε παίκτης προσφέρει έργο α i Η απόδοση του παίκτη i είναι α i (c+α j -α i ), όπου c > 0 είναι μια σταθερά Βασικές Έννοιες Θεωρίας

παράδειγμα 39.1 κάθε παίκτης έχει ένα άπειρο πλήθος κινήσεων. Επομένως δεν μπορούμε να χρησιμοποιήσουμε την αναπαράσταση με πίνακα θα χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης απόκρισης Δεδομένου του α j η βέλτιστη απόκριση του α i ποια είναι; Βασικές Έννοιες Θεωρίας

παράδειγμα 39.1: οι συναρτήσεις βέλτιστης απόκρισης Βασικές Έννοιες Θεωρίας

παράδειγμα: συνεισφορά σε δημόσιο αγαθό (public good) δύο παίκτες i = 1, 2 αποφασίζουν εάν και πόσο θα συνεισφέρουν σε ένα δημόσιο αγαθό παίκτης i: έχει περιουσία (wealth) w i συνεισφέρει c i : 0 c i w i συνάρτηση απόδοσης: v i (c 1 + c 2 ) + w i c i και δεδομένου ότι w i είναι σταθερό, μπορούμε να θεωρήσουμε ως συνάρτηση απόδοσης: u i (c 1, c 2 ) = v i (c 1 + c 2 ) c i (παράδειγμα ενότητας 2.8.4, βιβλίο Osborne) Βασικές Έννοιες Θεωρίας

συνάρτηση βέλτιστης απόκρισης Βασικές Έννοιες Θεωρίας

συναρτήσεις βέλτιστης απόκρισης Βασικές Έννοιες Θεωρίας

Κυριαρχούμενες Ενέργειες Αυστηρή Κυριαρχία (Strict Domination) Σε στρατηγικό παίγνιο μια στρατηγική α2 i κυριαρχεί επί της στρατηγικής α1 i, εάν για κάθε προφίλ α -i, u i (α2 i,α -i ) > u i (α1 i,α -i ) Ασθενής Κυριαρχία (Weak Domination) Σε στρατηγικό παίγνιο μια στρατηγική α2 i κυριαρχεί επί της στρατηγικής α1 i, εάν για κάθε προφίλ α -i, u i (α2 i,α -i ) u i (α1 i,α -i ) και υπάρχει ένα τουλάχιστον προφίλ α -i για το οποίο: u i (α2 i,α -i ) > u i (α1 i,α -i ) Βασικές Έννοιες Θεωρίας

Συμμετρικό Παίγνιο (Symmetric Game) Συμμετρικό Παίγνιο μεταξύ δύο παικτών: Οι παίκτες έχουν τις ίδιες κινήσεις και για τις αποδόσεις των παικτών ισχύει: u 1 (a 1,a 2 ) = u 2 (a 2,a 1 ) για κάθε πιθανό προφίλ α=(a 1,a 2 ) Συμμετρική Ισορροπία Nash: σε στρατηγικό παίγνιο όλοι οι παίκτες έχουν τις ίδιες κινήσεις, ένα προφίλ α* είναι μία συμμετρική ισορροπία Nash εάν είναι σημείο ισορροπίας Nash και επιπλέον το α i * να είναι ίδιο για κάθε παίκτη i (όλοι οι παίκτες επιλέγουν την ίδια κίνηση). Βασικές Έννοιες Θεωρίας

ΤΙ ΕΊΝΑΙ ΛΟΙΠΌΝ Η ΘΕΩΡΊΑ ΠΑΙΓΝΊΩΝ Βασικές Έννοιες Θεωρίας

Τι είναι λοιπόν η θεωρία παιγνίων Η θεωρία παιγνίων μελετά την αλληλεπίδραση (ανταγωνισμό, συνεργασία κτλ.) μεταξύ ανεξάρτητων ορθολογικών (rational) οντοτήτων χρησιμοποιεί μαθηματικά μοντέλα για την μοντελοποίηση των προβλημάτων υπάρχει και το εμπειρικό/πρακτικό μέρος: experimental game theory Βρίσκει εφαρμογή εδώ και αρκετά χρόνια στην Οικονομική Θεωρία Τα τελευταία χρόνια αναπτύσσεται ένας ενδιαφέρον συνδυασμός θεωρίας παιγνίων και επιστήμης υπολογιστών Αφορμή: Η ανάπτυξη δικτυωμένων/κατανεμημένων συστημάτων με κύριο παράδειγμα το διαδίκτυο Βασικές Έννοιες Θεωρίας

Ορισμένες περιοχές της Θεωρίας Παίγνια με Πλήρη Γνώση Strategic Form / Extensive Form Non-cooperative Coalitional Games Παίγνια με Ελλιπή Πληροφορία Επαναλαμβανόμενα Παίγνια Auctions (Πλειστηριασμοί) Algorithmic Mechanism Design Βασικές Έννοιες Θεωρίας

Εφαρμογές της Θεωρίας εταιρείες που ανταγωνίζονται υποψήφιοι πολιτικοί που ανταγωνίζονται για ψήφους υποψήφιοι αγοραστές ανταγωνίζονται σε έναν πλειστηριασμό Βιολογία/ διαδικασίες φυσικής επιλογής Εφαρμογές στην Επιστήμη Υπολογιστών Βασικές Έννοιες Θεωρίας

Θεωρία και Επιστήμη Υπολογιστών Αλγόριθμοι για Επίλυση Υπάρχει λύση για ένα παίγνιο; Μπορούμε να την υπολογίσουμε; Τι Πολυπλοκότητα έχει; Είναι πολλές οι λύσεις; Μπορούμε να βρούμε την καλύτερη ή μια αρκετά καλή; Μοντελοποίηση προβλημάτων της Επιστήμης Υπολογιστών ως παίγνια: Παγκόσμιος Ιστός Διαδίκτυο και γενικότερα κάθε Δίκτυο Agents, Κατανεμημένα συστήματα Κρυπτογραφία Επίσης ασφάλεια, εξοικονόμηση ενέργειας, Βασικές Έννοιες Θεωρίας

Πηγές/Αναφορές Κεφάλαια 1 και 2: An introduction to Game Theory, M. Osborne, Oxford University Press, 2004 Networks, Crowds, and Markets: Reasoning About a Highly Connected World, David Easley and Jon Kleinberg, Cambridge University Press, 2010. Social and Economic Networks, Matthew Jackson, Princeton University Press, 2010. Σημειώσεις του μαθήματος «Οικονομική Θεωρία και Αλγόριθμοι» του τμ. Μηχ. ΗΥ και Πληροφορικής, Παν/μιο Πατρών http://www.ceid.upatras.gr/courses/game_theory/ Game Theory, Video Course, Benjamin Polak, Yale http://academicearth.org/courses/game-theory Βασικές Έννοιες Θεωρίας