Βασικές Έννοιες Θεωρίας Παιγνίων



Σχετικά έγγραφα
Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Μοντέλα των Cournotκαι Bertrand

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Βασικές Αρχές της Θεωρίας Παιγνίων

Ορισμένες Κατηγορίες Αλγορίθμων

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Θεωρία Παιγνίων και Αποφάσεων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Evolutionary Equilibrium

Παραδείγματα Παιγνίων

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Κεφάλαιο 5 R (2, 3) R (3, 0)

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Εκτεταμένα Παίγνια (Extensive Games)

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

John Nash. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Αλγοριθμική Θεωρία Παιγνίων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Κεφάλαιο 8 ο Τ 3, 1-1, -1 Χ -1, -1 1, 3

Κεφάλαιο 29 Θεωρία παιγνίων

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Extensive Games with Imperfect Information

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά].

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Εισαγωγή στους Αλγόριθµους. Αλγόριθµοι. Ιστορικά Στοιχεία. Ο πρώτος Αλγόριθµος. Παραδείγµατα Αλγορίθµων. Τι είναι Αλγόριθµος

* τη µήτρα. Κεφάλαιο 1o

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

παίγνια και δίκτυα Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

Αλληλεπιδράσεις πρακτόρων. Πώς σχεδιάζουμε κοινωνίες πρακτόρων;

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

Kεφάλαιο 10. Πόσα υποπαίγνια υπάρχουν εδώ πέρα; 2 υποπαίγνια.

Κεφάλαιο 13ο Eπαναλαµβανόµενα παίγνια (Repeated Games)

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

δημιουργία: επεξεργασία: Ν.Τσάντας

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

Notes. Notes. Notes Σ -1,-1-9,0 Π 0,-9-6,-6. Notes Σ Π

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Κεφάλαιο 9 ο Κ 5, 4 4, 5 0, 0 0,0 5, 4 4, 5. Όπως βλέπουµε το παίγνιο δεν έχει καµιά ισορροπία κατά Nash σε αµιγείς στρατηγικές διότι: (ΙΙ) Α Κ

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

Αλγόριθµοι και Πολυπλοκότητα

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

3 ΙΣΟΡΡΟΠΙΕΣ 3 ΙΣΟΡΡΟΠΙΕΣ

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

Δυσεπίλυτα Προβλήματα σε Γραφήματα και Παίγνια

Θεωρία Παιγνίων-Ολιγοπώλιο σε ποσότητες

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.


Δεύτερο πακέτο ασκήσεων

Αλγοριθµική Θεωρία Παιγνίων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

ΜΑΘΗΜΑΤΙΚΗ ΠΡΟΤΥΠΟΠΟΙΗΣΗ ΣΤΙΣ ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

Στατικά Παίγνια Ελλιπούς Πληροφόρησης

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2016

Παίγνια Συμφόρησης και Ανταγωνιστική Ανάθεση Πόρων

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεμελιώδη Θέματα Επιστήμης Υπολογιστών

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Transcript:

Παύλος Σ. Εφραιμίδης

Περιεχόµενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός µαθηµατικού µοντέλου Το δίληµµα του φυλακισµένου Σηµείο ισορροπίας Nash

Θεωρία Παιγνίων Η θεωρία παιγνίων (game theory) µας βοηθάει στην κατανόηση καταστάσεων στις οποίες αλληλεπιδρούν decision-makers Παίγνιο: Ένα σύνολο παικτών που ανταγωνίζονται µε βάση ένα προκαθορισµένο σύνολο κανόνων Οι παίκτες πρέπει να πάρουν αποφάσεις σε συνθήκες συναγωνισµού/ανταγωνισµού λαµβάνοντας υπόψη τις πιθανές κινήσεις των αντιπάλων

Εφαρµογές Η θεωρία παιγνίων μπορεί να εφαρμοστεί σε πολλές καταστάσεις: Εταιρείες που ανταγωνίζονται Πολιτικοί που διεκδικούν ψήφους Ένορκοι που αποφασίζουν για μια ετυμηγορία Ζώα που μάχονται για λεία Παίκτες που συμμετέχουν σε έναν πλειστηριασμό Η εξέλιξη της συμπεριφοράς μεταξύ διδύμων...

Πεδία Εφαρµογής Η θεωρία παιγνίων σχετίζεται ιδιαίτερα με κοινωνικά, πολιτικά και οικονομικά αντικείμενα. Τα τελευταία χρόνια στο χώρο της πληροφορικής ερευνάται η ακόλουθη εφαρμογή της θεωρίας παιγνίων: Έλλειψη συντονισμού κεντρικού ελέγχου

Μοντέλα Η θεωρία παιγνίων περιλαμβάνει ένα σύνολο μοντέλων Το μοντέλοείναι μια αφαίρεσηπου χρησιμοποιούμε για να κατανοήσουμε πραγματικές καταστάσεις Ένα μοντέλο είναι σημαντικό να είναι απλό, να επικεντρώνεται σε ουσιώδη στοιχεία δεν πρέπει να βασίζεται σε υποθέσεις που απέχουν υπερβολικά πολύ από την πραγματικότητα

Ορθότητα ενός µοντέλου Ένα μοντέλο δεν μπορεί να κριθεί με απόλυτα κριτήρια ως σωστό ή λανθασμένο Η χρησιμότητα ενός μοντέλου καθορίζεται από το σκοπό για τον οποίο χρησιμοποιείται Παράδειγμα: Βέλτιστη διαδρομή Για την απόσταση μεταξύ Ξάνθης και Καβάλας μπορούμε να υποθέσουμε ότι η γη είναι επίπεδη Για την απόσταση Ξάνθης και Μελβούρνης όμως ίσως θα πρέπει να λάβουμε υπόψη τη σφαιρικότητα της γης

ιαδικασία Μοντελοποίησης Τα βασικά βήματα: Μια αρχική ιδέα που σχετίζεται με την αλληλεπίδραση ιθυνόντων Διατύπωση της ιδέας με τη μορφή ενός μοντέλου, συμπεριλαμβάνοντας στο μοντέλο χαρακτηριστικά που φαίνονται σχετικά Το βήμα αυτό είναι και λιγάκι τέχνη: Επιθυμούμε αρκετά γνωρίσματα ώστε το μοντέλο να έχει ουσιαστική σημασία Επιθυμούμε μια όσο γίνεται απλή δομή Ανάλυση του μοντέλου. Κατά την ανάλυση μπορεί να προκύψει πρέπει να γίνουν προσαρμογές στο μοντέλο

Ορθολογική Επιλογή Η θεωρία ορθολογικής επιλογής (rational choice) ουσιαστικά λέει ότι ένας ιθύνοντας (decisionmaker) επιλέγει τον καλύτερη -σύµφωνα µε τις προτιµήσεις του ενέργεια που έχει στη διάθεσή του. Ορθολογική επιλογή σε αυτή την περίπτωση σηµαίνει ότι ο παίκτης απλά προσπαθεί να βελτιστοποιήσει την επιλογή του µε βάση µόνο τις προτιµήσεις του

Παίγνια σε στρατηγική µορφή Ένα παίγνιο σε στρατηγική µορφή αποτελείται από Ένα σύνολο παικτών Για κάθε παίκτη, ένα σύνολο κινήσεων Για κάθε παίκτη, ένα σύνολο προτιµήσεων για κάθε πιθανό προφίλ στρατηγικών Ας ξεκινήσουµε µε ένα από τα πιο διάσηµα παραδείγµατα, ένα παίγνιο σε στρατηγική µορφή: Το δίληµµα του φυλακισµένου

Το δίληµµα του φυλακισµένου (The prisoner s dilemma)

Το δίληµµα του φυλακισµένου Δύο κρατούμενοι κατηγορούνται για κάποια εγκλήματα Οι δύο κατηγορούμενοι είναι συνένοχοι ΟΜΩΣ, οι δικαστικές αρχές έχουν ελλιπή αποδεικτικά στοιχεία χωρίς άλλες αποδείξεις κάθε κρατούμενος θα τιμωρηθεί με 1 χρόνο φυλάκισης εάν αποδειχθούν όλες οι κατηγορίες τότε κάθε κρατούμενος θα φυλακιστεί για 4 χρόνια

Το δίληµµα Οι δικαστικές αρχές προ-φυλακίζουν χωριστά τους δύο κρατούμενους, και καλούν τον καθένα να συνεργαστεί, βεβαιώνοντάς τον ότι εάν συνεργαστεί θα τιμωρηθεί με επιείκεια (δηλαδή -1 χρόνο) Τώρα οι πιθανές εκβάσεις είναι: Κανείς δε συνεργάζεται, και τιμωρείται ο καθένας με ένα χρόνο φυλάκιση Και οι δύο συνεργάζονται, και τιμωρούνται και οι δύο με 3 χρόνια Ένας συνεργάζεται και ένας δε συνεργάζεται: Αυτός που συνεργάζεται παίρνει 0 χρόνια, δηλαδή απαλλάσσεται Αυτός που δε συνεργάζεται τιμωρείται με το μέγιστο της ποινής, δηλαδή 4 χρόνια

Οι δυνατές στρατηγικές (Strategies) για κάθε κρατούµενο Ο κρατούμενος μπορεί είτε να συνεργαστεί με τις αρχές (να προδώσει δηλαδή) και να καταθέσει εναντίον του συνεργάτη/συνενόχου του να μη συνεργαστεί με τις αρχές

Το δίληµµα του κρατούµενου Δύο κρατούμενοι Είναι συνένοχοι Οι δικαστικές αρχές έχουν ελλιπή αποδεικτικά στοιχεία στοιχεία Θα µιλήσεις!! Να µιλήσω ; Να µη µιλήσω ; Προλαβαίνω να διαβάσω θεωρία παιγνίων ;

Το δίληµµα ως παίγνιο Πολυπλοκότητα:Οι πιθανές στρατηγικές είναι 2 για κάθε παίκτη και επομένως η υπολογιστική πολυπλοκότητα του προβλήματος είναι τετριμμένη: 4 συνολικά σενάρια Πρόβλημα: Το πρόβλημα είναι πως να επιλέξει την καλύτερη δυνατή στρατηγική; Συνεργασία;Είναι σαφές ότι μία ικανοποιητική λύση και για τους δύο κρατούμενους είναι το (1,1), δηλαδή να μη συνεργαστεί κανείς ΌΜΩΣ, κάθε παίκτης αποφασίζει μόνος του!

Το δίληµµα του φυλακισµένου ως παίγνιο σε στρατηγική µορφή B Συνεργάζεται µε τις αρχές (Προδίδει) B εν συνεργάζεται A Συνεργάζεται µε τις 3, 3 0, 4 αρχές (Προδίδει) A εν συνεργάζεται 4, 0 1, 1 Τα έτη φυλάκισης για κάθε παίκτη για κάθε πιθανή εκδοχή του παιγνίου.

Συνάρτηση Απόδοσης για το δίληµµα του φυλακισµένου Για τον κρατούµενο-παίκτη Α: 1η Περίπτωση: Έστω ότι ο Β δε συνεργάζεται µε τις αρχές Εάν δε συνεργαστώ και εγώ, παίρνω 1 χρόνο Εάν εγώ συνεργαστώ, παίρνω 0 (0 < 1) χρόνια 2η Περίπτωση: Έστω ότι ο Β συνεργάζεται µε τις αρχές Εάν δε συνεργαστώ, παίρνω 4 χρόνια Εάν εγώ συνεργαστώ και εγώ, παίρνω 3 (3 < 4) χρόνια Στο παραπάνω παράδειγµα η συνάρτηση απόδοσης (utility function) δίνει το «κόστος» που θα πρέπει να πληρώσει ο παίκτης και εποµένως ο «ορθολογικός στόχος» του παίκτη είναι να την ελαχιστοποιήσει

Ορθολογική Συµπεριφορά (Rational Behaviour) Θεωρούµε ότι οι παίκτες έχουν «ορθολογικήσυµπεριφορά»: Κάθε παίκτης επιλέγει µία βέλτιστη κίνησή του µε βάση τις προτιµήσεις (preferences) που έχει. Ανεξάρτητα από τη φύση των προτιµήσεων του παίκτη σε ένα παίγνιο, συµπεριφέρεται ορθολογικά µε την έννοια ότι προσπαθεί να ικανοποιήσει τις προτιµήσεις αυτές. Συνήθως οι προτιµήσεις των παικτών δίνονται µε τη µορφή συναρτήσεων απόδοσης (utility functions ή payoff functions) ή ενός πίνακα (matrix game)

Το δίληµµα του κρατούµενου Α 1η Περίπτωση:Έστω ότι ο Β δε συνεργάζεται με τις αρχές Εάν δε συνεργαστώ και εγώ, παίρνω 1 χρόνο Εάν εγώ συνεργαστώ, παίρνω 0 (0 < 1) χρόνια 2η Περίπτωση:Έστω ότι ο Β συνεργάζεται με τις αρχές Εάν δε συνεργαστώ, παίρνω 4 χρόνια Εάν εγώ συνεργαστώ και εγώ, παίρνω 3 (3 < 4) χρόνια? ηλαδή, µε συµφέρει ούτως ή άλλωςνασυνεργαστώ!!;;

Κυριαρχούµενη στρατηγική Κυριαρχούµενη στρατηγική Αυστηρά Κυριαρχούµενη στρατηγική ίδαγµα 1: εν έχει νόηµα ο παίκτης να επιλέξει µια αυστηρά κυριαρχούµενη στρατηγική

Λύση του παιγνίου

Λύση του παιγνίου Ο φυλακισμένος, σκεπτόμενος ορθολογικά, θα πρέπει να συνεργαστεί με τις αρχές και να προδώσει τον άλλο φυλακισμένο! Ο άλλος φυλακισμένος θα σκεφτεί με τον ίδιο ακριβώς ορθολογικό τρόπο και θα προδώσει και αυτός. Αποτέλεσμα: Οι δύο φυλακισμένοι θα πάρουν από 3 χρόνια φυλακής ο καθένας! Μια πολύ κακή λύση (από την μεριά των φυλακισμένων). Δίδαγμα 2: Οι ορθολογικές επιλογές μπορεί να οδηγήσουν σε κακές εκβάσεις.

Να προδίδουµε πάντοτε; Το γεγονός ότι σύμφωνα με τη λύση πρέπει να συνεργαστεί ο φυλακισμένο την επιστημονική κοινότητα Ίσως, εάν υπάρχει η έννοια της μνήμης, της συνέχειας κτλ. να μπορεί να φερθεί πιο αλτρουϊστικά Τι θα συμβεί λοιπόν εάν παίξουμε το παιχνίδι αρκετές στη σειρά;

Τουρνουά του Axelrod Στο τέλος της δεκαετίας του 1970, ο Axelrod (Πολιτικές Επιστήμες στο Πανεπιστήμιο του Michigan), κάλεσε οικονομολόγους, ψυχολόγους, μαθηματικούς και κοινωνιολόγους να υποβάλλουν λύση (με τη μορφή κώδικα) για το Δίλημμα του Φυλακισμένου

Τουρνουά του Axelrod 14 συμμετοχές Έπαιξαν όλοι εναντίον όλων Νικητής: tit-for-tat (Anatol Rapoport) Στο πρώτο γύρω: δεν µιλάω Σε κάθε επόµενο γύρω: ανταποδίδω Ανακοινώνονται τα αποτελέσµατα και προκηρύσσεται νέος διαγωνισµός: 62 συµµετοχές Νικητής: Και πάλι το tit-for-tatπου υπέβαλλε πάλι ο Rapoport

Τουρνουά του Axelrod (2) Ο Axelrodχρησιμοποίησε τις στρατηγικές του δεύτερου διαγωνισμού για ένα evolutionary τουρνουά Στρατηγικές που αποδίδουν καλά αναπαράγονται ταχύτερα Πιθανόν έτσι στρατηγικές που αρχικά τα καταφέρνουν καλά, να μην αποδίδουν στη συνέχεια διότι θα έχουν εξαλειφθεί οι στρατηγικές έναντι των οποίων υπερίσχυαν Μετά από ένα μεγάλο πλήθος γενεών, νικητής (πολυπληθέστερη ομάδα) ήταν η στρατηγική: Καιπάλιτο tit-for-tat!!

Ισορροπία Nash (Nash Equilibrium)

Ενέργειες των Παικτών Ποιες ενέργειες/κινήσεις επιλέγουν οι παίκτες σε ένα παίγνιο; Υποθέσαµε ότι οι παίκτες είναι ορθολογικοί και επιλέγει ο καθένας το καλύτερο σύµφωνα µε τις προτιµήσεις του Όµως η έκβαση του παιγνίου για κάθε παίκτη εξαρτάται από τις επιλογές όλων των παικτών Εποµένως ο ορθολογικός παίκτης πρέπει να λάβει υπόψη του και τι θα επιλέξουν οι υπόλοιποι παίκτες

«Λύση» ενός παιγνίου Ποιες κινήσεις επιλέγουν οι παίκτες ενός παιγνίου; Μπορούµε να υποθέσουµε ότι οι παίκτες, ως ορθολογικές οντότητες, επιλέγουν την καλύτερη δυνατή κίνηση ο καθένας Σε ένα παίγνιο όµως, η καλύτερη κίνηση για οποιοδήποτε παίκτη εξαρτάταιαπό τις κινήσεις των υπολοίπων παικτών Εποµένως ο παίκτης θα πρέπει να έχει µία εκτίµηση (belief) για τις κινήσεις των άλλων παικτών

Ισορροπία Nash (Nash Equilibrium) Μια ισορροπία Nash είναι µια κατάσταση του παιγνίου στην οποία κανένας παίκτης δεν µπορεί να βελτιώσει τη θέση του επιλέγοντας µια άλλη κίνηση, µε την προϋπόθεση ότι όλοι οι υπόλοιποι παίκτες δεν θα αλλάξουν την κίνησή τους. Η ισορροπία Nash και οι παραλλαγές της είναι η δηµοφιλέστερη έννοια λύσης παιγνίων.

Συµβολισµοί - Ορολογία στρατηγική αγνή στρατηγική (pure strategy):ορίζει ντετερµινιστικά τη συµπεριφορά του παίκτη για κάθε ενέργεια που θα πρέπει να κάνει Πχ: Το δίληµµα του κρατούµενου µικτή στρατηγική (mixed strategy):μια κατανοµή πιθανότητας πάνω στις κινήσεις του παίκτη. Πχ. Πέτρα-ψαλίδι-χαρτί προφίλ ή περίγραµµα στρατηγικών α (profile): ένα διάνυσµα που καθορίζει µια στρατηγική για κάθε παίκτη προφίλ ή περίγραµµα µικτών στρατηγικών: ένα διάνυσµα που καθορίζει µια µικτή στρατηγική για κάθε παίκτη α -i :δεδοµένου ενός προφίλ α συµβολίζουµεα -i τοπροφίλ µε τις κινήσεις όλων των παικτών εκτός του παίκτη i όπως στο προφίλ a

Ισορροπία Nash (Nash Equilibrium) Χρησιµοποιώντας την έννοια του προφίλ ενεργειών ο ορισµός της ισορροπίας Nash είναι: Μια ισορροπία Nashείναι ένα προφίλ ενεργειών α* µε την ιδιότητα ότι κανένας παίκτης δεν βελτιώνει τη θέση του επιλέγοντας µια ενέργεια διαφορετική από αυτή στο προφίλ α*, µε δεδοµένο ότι οι υπόλοιποι παίκτες δεν θα αλλάξουν την κίνησή τους.

Εύρεση ισορροπίας Nash Εάν το πλήθος των παικτών και των κινήσεων είναι πολύ περιορισµένο τότε είναι δυνατό να εξετάσουµε όλα τα πιθανά προφίλ (brute force search) από την οπτική γωνία κάθε παίκτη για να βρούµε τις pure ισορροπίες Nash. Πολλές φορές είναι πιο αποτελεσµατικό να χρησιµοποιήσουµε τις συναρτήσεις βέλτιστης αντίδρασης.

Πολυπλοκότητα εύρεσης NE Πρόσφατα αποτελέσµατα έδειξαν ότι είναι µάλλον µη αναµενόµενο να υπάρχει αποτελεσµατικός (πολυωνυµικός) αλγόριθµος για την εύρεση ισορροπίας Nash C. Daskalakis, P. W. Goldberg and C. H. Papadimitriou. The Complexity of Computing a Nash Equilibrium," Proceedings of STOC, 2006. X. Chen and X. Deng. Settling the Complexity of 2-Player Nash-Equilibrium," Proceedings of FOCS, 2006.

Συνάρτηση Βέλτιστης Απόκρισης (Best Response Function)

Συναρτήσεις βέλτιστης απόκρισης εδοµένου ενός προφίλ α -i η συνάρτηση βέλτιστης απόκρισηςτου παίκτη iδίνει το σύνολο των κινήσεων του παίκτη που επιτυγχάνουν το καλύτερο δυνατό αποτέλεσµα για αυτόν

Ισορροπία Nash και βέλτιστη απόκριση Χρησιµοποιώντας την έννοια του προφίλ ενεργειών µπορούµε να επαναδιατυπώσουµε τον ορισµό της ισορροπίας Nash: Ένα προφίλ κινήσεων α* είναι µια ισορροπία Nash εάν η ενέργεια κάθε παίκτη iστο προφίλ είναι η βέλτιστη απόκριση στο προφίλ α -i των υπολοίπων παικτών Heuristic:Μπορούµε να χρησιµοποιήσουµε τις συναρτήσεις βέλτιστης απόκρισης για να αναζητήσουµε ισορροπίες Nash (ο αλγόριθµος αυτός δεν είναι απαραίτητα πολυωνυµικού χρόνου)

Παράδειγµα 39.1: Μια σχέση συνεργασίας Osborne, Ενότητα 2.8, Παράδειγµα 39.1 ύο άτοµα έχουν µια σχέση συνεργασίας, πχ. ένα κοινό project Συγκεκριµένα κάθε παίκτης προσφέρει έργο α i Η απόδοση του παίκτη iείναια i (c+α j -α i ), όπου c > 0 είναι µια σταθερά

παράδειγµα 39.1 κάθε παίκτης έχει ένα άπειρο πλήθος κινήσεων. Επομένως δεν μπορούμε να χρησιμοποιήσουμε την αναπαράσταση με πίνακα θα χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης απόκρισης Δεδομένου του α j η βέλτιστη απόκριση του α i ποια είναι;

παράδειγµα 39.1: οι συναρτήσεις βέλτιστης απόκρισης

παράδειγµα: συνεισφορά σε δηµόσιο αγαθό (public good) δύο παίκτες i = 1, 2 αποφασίζουν εάν και πόσο θα συνεισφέρουν σε ένα δηµόσιο αγαθό παίκτης i: έχει περιουσία (wealth) w i συνεισφέρει c i: 0 c i w i συνάρτηση απόδοσης: v i (c 1 + c 2 ) + w i c i και δεδοµένου ότι w i είναι σταθερό, µπορούµε να θεωρήσουµε ως συνάρτηση απόδοσης: u i (c 1, c 2 ) = v i (c 1 + c 2 ) c i (παράδειγµα ενότητας 2.8.4, βιβλίο Osborne)

συνάρτηση βέλτιστης απόκρισης

συναρτήσεις βέλτιστης απόκρισης

Κυριαρχούµενες Ενέργειες Αυστηρή Κυριαρχία (Strict Domination) Σε στρατηγικό παίγνιο µια στρατηγική α2 i κυριαρχεί επί της στρατηγικής α1 i, εάν για κάθε προφίλ α -i, u i (α2 i,α -i ) > u i (α1 i,α -i ) Ασθενής Κυριαρχία (Weak Domination) Σε στρατηγικό παίγνιο µια στρατηγική α2 i κυριαρχεί επί της στρατηγικής α1 i, εάν για κάθε προφίλ α -i, u i (α2 i,α -i ) u i (α1 i,α -i ) και υπάρχει ένα τουλάχιστον προφίλ α -i για το οποίο: u i (α2 i,α -i ) > u i (α1 i,α -i )

Συµµετρικό Παίγνιο (Symmetric Game) Συµµετρικό Παίγνιο µεταξύ δύο παικτών:οι παίκτες έχουν τις ίδιες κινήσεις και για τις αποδόσεις των παικτών ισχύει: u 1 (a 1,a 2 ) = u 2 (a 2,a 1 ) για κάθε πιθανό προφίλ α=(a 1,a 2 ) Συµµετρική Ισορροπία Nash:σε στρατηγικό παίγνιο όλοι οι παίκτες έχουν τις ίδιες κινήσεις, ένα προφίλ α* είναι µία συµµετρική ισορροπία Nash εάν είναι σηµείο ισορροπίας Nash και επιπλέον το α i * να είναι ίδιο για κάθε παίκτη i (όλοι οι παίκτες επιλέγουν την ίδια κίνηση).

Τι είναι λοιπόν η θεωρία παιγνίων

Τι είναι λοιπόν η θεωρία παιγνίων Η θεωρία παιγνίων μελετά την αλληλεπίδραση (ανταγωνισμό, συνεργασία κτλ.) μεταξύ ανεξάρτητων ορθολογικών (rational) οντοτήτων χρησιμοποιεί μαθηματικά μοντέλα για την μοντελοποίηση των προβλημάτων υπάρχει και το εμπειρικό/πρακτικό μέρος:experimental game theory βρίσκει εφαρμογή εδώ και αρκετά χρόνια στην Οικονομική Θεωρία τα τελευταία χρόνια αναπτύσσεται ένας ενδιαφέρον συνδυασμός θεωρίας παιγνίων και επιστήμης υπολογιστών αφορμή: η ανάπτυξη δικτυωμένων/κατανεμημένων συστημάτων με κύριο παράδειγμα το διαδίκτυο

Εφαρµογές της Θεωρίας Παιγνίων εταιρείες που ανταγωνίζονται υποψήφιοι πολιτικοί που ανταγωνίζονται για ψήφους υποψήφιοι αγοραστές ανταγωνίζονται σε έναν πλειστηριασμό Βιολογία/ διαδικασίες φυσικής επιλογής Εφαρμογές στην Επιστήμη Υπολογιστών

Θεωρία Παιγνίων και Επιστήµη Υπολογιστών Αλγόριθμοι για Επίλυση Παιγνίων Υπάρχει λύση για ένα παίγνιο; Μπορούμε να την υπολογίσουμε; Τι Πολυπλοκότητα έχει; Είναι πολλές οι λύσεις; Μπορούμε να βρούμε την καλύτερη ή μια αρκετά καλή; Μοντελοποίηση προβλημάτων της Επιστήμης Υπολογιστών ως παίγνια: Παγκόσμιος Ιστός Διαδίκτυο και γενικότερα κάθε Δίκτυο Agents, Κατανεμημένα συστήματα Κρυπτογραφία Επίσης ασφάλεια, εξοικονόμηση ενέργειας,

Πηγές/Αναφορές Κεφάλαια 1 και 2: An introduction to Game Theory, M. Osborne, Oxford University Press, 2004 Σηµειώσεις του µαθήµατος «Οικονοµική Θεωρία και Αλγόριθµοι» του τµ. Μηχ. ΗΥ και Πληροφορικής, Παν/µιο Πατρών http://www.ceid.upatras.gr/courses/game_theory/ Game Theory, Video Course, Benjamin Polak, Yale http://academicearth.org/courses/game-theory