Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Σχετικά έγγραφα
Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Κεφ. 9 Ανάλυση αποφάσεων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Κεφάλαιο 29 Θεωρία παιγνίων

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Ασκήσεις μελέτης της 6 ης διάλεξης

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

* τη µήτρα. Κεφάλαιο 1o

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2


δημιουργία: επεξεργασία: Ν.Τσάντας

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Στοχαστικές Στρατηγικές

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Δεύτερο πακέτο ασκήσεων

Κεφάλαιο 28 Ολιγοπώλιο

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεωρία Παιγνίων και Αποφάσεων

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Εκτεταμένα Παίγνια (Extensive Games)

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 6: Εκτατική μορφή παίγνιων. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 7: Εισαγωγή στη Θεωρία Αποφάσεων Δέντρα Αποφάσεων

Κεφάλαιο 9 ο Κ 5, 4 4, 5 0, 0 0,0 5, 4 4, 5. Όπως βλέπουµε το παίγνιο δεν έχει καµιά ισορροπία κατά Nash σε αµιγείς στρατηγικές διότι: (ΙΙ) Α Κ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΑΣΚΗΣΗ 10. Λύση. π/ P1 =0 => P1+P2+4=0 => 4P1=1004+P2 => P1= 1004+P2 = R1(P2) 4 P2= 1004+P1 = R2(P1) 4

Κατασκευάσει 0, , 0 Όχι 20, 10 30, 0

ΑΝΑΛΥΣΗ 1 ΕΝΑΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

Chess Academy Free Lessons Ακαδημία Σκάκι Δωρεάν Μαθήματα. Οι κινήσεις των κομματιών Σκοπός της παρτίδας, το Ματ Πατ Επιμέλεια: Γιάννης Κατσίρης

Θεωρία Λήψης Αποφάσεων

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Κύλινδρος κοιμώμενος εντός κώνου

Τσάπελη Φανή ΑΜ: Ενισχυτική Μάθηση για το παιχνίδι dots. Τελική Αναφορά

Notes. Notes. Notes. Notes

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Να επιλύουμε και να διερευνούμε γραμμικά συστήματα. Να ορίζουμε την έννοια του συμβιβαστού και ομογενούς συστήματος.

3. Παίγνια Αλληλουχίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

B 1 A 1 B 2 A 2. t 1. t 3 w. t 2 A 3 B 3. t 4. t 5

Κεφάλαιο 8 ο Τ 3, 1-1, -1 Χ -1, -1 1, 3

32 κάρτες-πόλης 9 κάρτες-χαρακτήρων 5 κάρτες-αστυνομίας

Kεφάλαιο 10. Πόσα υποπαίγνια υπάρχουν εδώ πέρα; 2 υποπαίγνια.

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Η έννοια της γραμμικής εξίσωσης

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015


Σηματοδότηση σηματοδοτήσουν

Κεφάλαιο 5 R (2, 3) R (3, 0)

lnx ln x ln l x 1. = (0,1) (1,7].

12. ΑΝΙΣΩΣΕΙΣ Α ΒΑΘΜΟΥ. είναι δύο παραστάσεις μιας μεταβλητής x πού παίρνει τιμές στο

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

0x2 = 2. = = δηλαδή η f δεν. = 2. Άρα η συνάρτηση f δεν είναι συνεχής στο [0,3]. Συνεπώς δεν. x 2. lim f (x) = lim (2x 1) = 3 και x 2 x 2

ΚΥΠΡΙΑΚΗ ΜΑΘΗΜΑΤΙΚΗ ΕΤΑΙΡΕΙΑ. Ημερομηνία: 29/04/2017 Ώρα εξέτασης: 10:00-14:30

ΑΣΚΗΣΕΙΣ Β ΛΥΚΕΙΟΥ -- ΑΛΓΕΒΡΑ ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ

Θέματα Υπολογισμού στον Πολιτισμό

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

Διάλεξη 6 η :Δένδρα Αποφάσεων. Β. Βασιλειάδης Τµ. Διοικ. Επιχειρήσεων, ΤΕΙ ΔΥΤ. ΕΛΛΑΔΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΣΗΜΕΙΩΣΕΙΣ ΓΡΑΜΜΙΚΗΣ ΑΛΓΕΒΡΑΣ. ρ Χρήστου Νικολαϊδη

Βασικές Αρχές της Θεωρίας Παιγνίων

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

m + s + q r + n + q p + s + n, P Q R P Q P R Q R F G

ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ Ι

Στατικά Παίγνια Ελλιπούς Πληροφόρησης

Εισαγωγικά Παραδείγματα: Παρατηρήσεις:

Σήματα και Συστήματα. Διάλεξη 6: Ανάλυση Σημάτων σε Ανάπτυγμα Σειράς Fourier. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

2ο video (επίλυση ανίσωσης 1 ου βαθμού)

Γραφική επίλυση γραμμικού συστήματος με δύο αγνώστους.

2. Ανάλυση και Σύνθεση κυματομορφών με την μέθοδο Fourier

Θέματα Υπολογισμού στον Πολιτισμό

α n z n = 1 + 2z 2 + 5z 3 n=0

ΣΥΣΤΗΜΑΤΑ. 6.1 ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ (Επαναλήψεις-Συμπληρώσεις)

Θέματα Υπολογισμού στον Πολιτισμό

Transcript:

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

2 η Διάλεξη Παίγνια ελλιπούς πληροφόρησης Πληροφοριακά σύνολα Κανονική μορφή παιγνίου Ισοδύναμες στρατηγικές Παίγνια συνεργασίας και μη συνεργασίας Πεπερασμένα και άπειρα παίγνια Συνεχή και διακριτά παίγνια Κυρίαρχες στρατηγικές Λύση ακολουθιακής κυριαρχίας

Παίγνια ελλιπούς πληροφόρησης (1/2) Σε αυτά είτε δεν έχουμε γνώση για τις δικές μας κινήσεις ή του αντιπάλου στο παρελθόν (μερική ή ολική) ή δεν γνωρίζουμε την κίνηση του αντιπάλου ή δεν γνωρίζουμε την εξέλιξη του παιγνίου. Ουσιαστικά, θα μπορούσαμε με βάση την κίνηση του αντιπάλου, να βρισκόμαστε σε έναν οποιοδήποτε κόμβο μέσα από ένα σύνολο κόμβων, αλλά δεν γνωρίζουμε τον ακριβή κόμβο, αφού αυτός εξαρτάται από την κίνηση του αντιπάλου που μας είναι άγνωστη.

Παίγνια ελλιπούς πληροφόρησης (2/2) Οι μη διακεκριμένοι κόμβοι στους οποίους θα μπορούσαμε να βρεθούμε αποτελούν το «πληροφοριακό σύνολο». Προφανώς, κατά την πλήρη πληροφόρηση, κάθε πληροφοριακό σύνολο είναι μονοσύνολο, αφού αποτελείται από έναν κόμβο.

1 ο παράδειγμα παιγνίου ελλιπούς πληροφόρησης Αν ο παίκτης Ι παίξει Δ (Δεξιά), τότε αυτό είναι αντιληπτό από τον ΙΙ και το παίγνιο ολοκληρώνεται με κέρδος 2 και για τους δύο παίκτες. Αν ο παίκτης Ι παίξει Α (Αριστερά) ή Ε (Ευθεία), τότε ο παίκτης ΙΙ αντιλαμβάνεται ότι δεν έχει παιχτεί Δ αλλά δεν μπορεί να διακρίνει μεταξύ Α και Ε. Βάζουμε τους 2 αυτούς κόμβους σε μια έλλειψη (πληροφοριακό σύνολο -Π.Σ.). Είναι βασικό ότι ο ΙΙ πρέπει να αποφασίσει την κίνησή του μη έχοντας γνώση σε ποιόν από τους 2 κόμβους του Π.Σ. βρίσκεται. Έτσι, η κίνησή του θα πρέπει να είναι η ίδια, (α ή δ) είτε βρίσκεται στον κόμβο Α είτε βρίσκεται στον κόμβο Ε. Με άλλα λόγια, όλες οι κινήσεις που βρίσκονται κάτω από τους κόμβους του ίδιου Π.Σ. είναι ίδιες.

2 ο παράδειγμα παιγνίου ελλιπούς πληροφόρησης (1/3) Δύο παίκτες (Ι και ΙΙ) επιλέγουν ταυτόχρονα είτε Κόκκινο είτε Μαύρο. Αν και οι δύο παίκτες επιλέξουν Κόκκινο τότε ο παίκτης Ι εισπράττει από τον ΙΙ 1 Αν και οι δύο παίκτες επιλέξουν Μαύρο τότε ο παίκτης Ι εισπράττει από τον ΙΙ 2 Αν οι δύο παίκτες κάνουν διαφορετικές επιλογές τότε ο παίκτης Ι πληρώνει στον ΙΙ 1 Να περιγραφεί διαγραμματικά το παραπάνω παίγνιο.

2 ο παράδειγμα παιγνίου ελλιπούς πληροφόρησης (2/3) Με μια πρώτη προσέγγιση, αναπαριστούμε το παίγνιο με δένδρο. Η θέση του παίκτη Ι σημειώνεται με τετράγωνο και του παίκτη ΙΙ με τρίγωνο. Η προσέγγιση αυτή είναι λάθος, αφού υποδηλώνει έμμεσα ότι ο ΙΙ παίζει μετά τον Ι και άρα γνωρίζει την κίνησή του. Όμως, και οι δύο παίκτες παίζουν ταυτόχρονα και άρα κανείς δεν γνωρίζει την κίνηση του άλλου. Στην συνέχεια, παραθέτουμε τα πληροφοριακά σύνολα των παικτών.

2 ο παράδειγμα παιγνίου ελλιπούς πληροφόρησης (3/3) Ο παίκτης Ι έχει ένα Π.Σ. το Ι.1, το οποίο περιλαμβάνει έναν κόμβο. Επίσης, ο παίκτης ΙΙ έχει και αυτός ένα Π.Σ. το ΙΙ.1, το οποίο αποτελείται από 2 κόμβους, οι οποίοι φυσικά δεν μπορούν να διακριθούν μεταξύ τους. Στρατηγική ονομάζεται η επιλογή μιας κίνησης από κάθε Π.Σ. ενός παίκτη. Οι στρατηγικές του Ι ανήκουν στο σύνολο {Κ, Μ} και οι στρατηγικές του παίκτη ΙΙ ανήκουν επίσης στο σύνολο {Κ, Μ}. Γενικά, οι στρατηγικές είναι διαφορετικές για κάθε παίκτη.

Κανονική μορφή παιγνίου Τα προβλήματα παιγνίων ελλιπούς πληροφόρησης τα παριστάνουμε καλύτερα με την κανονική μορφή (σε αντίθεση με της πλήρους πληροφόρησης, όπου μπορούμε να χρησιμοποιήσουμε και την εκτεταμένη μορφή, δηλ. το δένδρο). Στην πράξη, ξεκινάμε την αναπαράσταση με την εκτεταμένη μορφή, δηλ. δένδρο, και όταν διαπιστωθεί το πρόβλημα της ελλιπούς πληροφόρησης χρησιμοποιούμε την κανονική μορφή. Η κανονική μορφή (για παίγνιο 2 παικτών) αποτελείται από έναν πίνακα διπλής εισόδου, όπου παρατίθενται όλοι οι συνδυασμοί στρατηγικών καθώς και τα αντίστοιχα κέρδη (συνήθως του Ι, αν πρόκειται για παίγνιο μηδενικού αθροίσματος)

Κανονική μορφή παιγνίου 2 ου παραδείγματος Η κανονική μορφή (normal form) του παιγνίου του 2 ου παραδείγματος ελλιπούς πληροφόρησης, όπου αναγράφονται τα κέρδη και των δύο παικτών. Ο παρών πίνακας είναι ισοδύναμος με τον πίνακα στα δεξιά. Η κανονική μορφή (normal form) του παιγνίου του 2 ου παραδείγματος ελλιπούς πληροφόρησης, όπου αναγράφονται τα κέρδη μόνο του πρώτου παίκτη, αφού πρόκειται για παίγνιο μηδενικού αθροίσματος.

3 ο παράδειγμα παιγνίου ελλιπούς πληροφόρησης(1/4) Σε ένα παίγνιο δύο παικτών Ι και ΙΙ, ο Ι παίζει πρώτος και έχει τις κινήσεις {κ1, κ2, κ3, κ4}. Ο ΙΙ που παίζει στην συνέχεια, μπορεί να διαπιστώσει αν ο Ι έχει παίξει είτε κ1, κ2, είτε κ3, κ4, αλλά δεν μπορεί να διακρίνει μεταξύ κ1 και κ2, ή μεταξύ κ3 και κ4. Επίσης, ο ΙΙ διαθέτει δύο κινήσεις, τις {λ1, λ2}. Το κέρδος του κάθε παίκτη, ανάλογα με τις κινήσεις του, δίνεται στον παρακάτω πίνακα. Να σχηματίσετε την εκτεταμένη μορφή (δένδρο) και την κανονική μορφή (πίνακα) του παιγνίου.

3 ο παράδειγμα παιγνίου ελλιπούς πληροφόρησης(2/4) Εκτεταμένη μορφή (δένδρο) του παιγνίου ελλιπούς πληροφόρησης 3 ου παραδείγματος. Ο παίκτης Ι διαθέτει ένα Π.Σ., το Ι.1 (μονοσύνολο). Ο παίκτης ΙΙ διαθέτει 2 Π.Σ., τα ΙΙ.1 και ΙΙ.2. Ο παίκτης ΙΙ δεν μπορεί να διακρίνει μεταξύ των κόμβων του Ι.1, ούτε μεταξύ των κόμβων του ΙΙ.2. Οι στρατηγικές του Ι αντιστοιχούν στις κινήσεις του δηλ. {Κ1, Κ2, Κ3, Κ4}. Αντίθετα, οι στρατηγικές του ΙΙ δεν αντιστοιχούν στις κινήσεις {λ1, λ2} που διαθέτει (βλέπε επόμενη διαφάνεια).

3 ο παράδειγμα παιγνίου ελλιπούς πληροφόρησης(3/4) Διαθέσιμες στρατηγικές παίκτη ΙΙ. Σε κάθε κόμβο του ίδιου Π.Σ. οι κινήσεις πρέπει να είναι ίδιες. Αφού υπάρχουν 2 Π.Σ. και 2 δυνατές κινήσεις {λ1, λ2}, το σύνολο των συνδυασμών, δηλαδή των στρατηγικών, είναι 2 x 2 = 4. Για παράδειγμα, μια στρατηγική του ΙΙ είναι η Σ2, κατά την οποία ο ΙΙ επιλέγει να παίξει λ1 αν ο Ι έχει παίξει κ1 ή κ2 (βρίσκεται δηλαδή στο Π.Σ. ΙΙ.1) και λ2 αν ο Ι έχει παίξει κ3 ή κ4 (βρίσκεται δηλαδή στο Π.Σ. ΙΙ.2). Όπως είναι προφανές, η απόφαση του ΙΙ λαμβάνεται ως προς τις κινήσεις του με βάση το Π.Σ που βρίσκεται και όχι με βάση τον κόμβο που βρίσκεται.

3 ο παράδειγμα παιγνίου ελλιπούς πληροφόρησης(4/4) Κανονική μορφή του παιγνίου ελλιπούς πληροφόρησης-παράδειγμα 3 ο Αν, για παράδειγμα, ο παίκτης Ι παίξει την κίνηση Κ2 τότε ο παίκτης ΙΙ αντιλαμβάνεται ότι βρίσκεται στο Π.Σ. ΙΙ.1. Αν τώρα ο παίκτης ΙΙ αποφασίσει να χρησιμοποιήσει την στρατηγική Σ3, τότε αυτός θα κερδίσει 0 ενώ ο παίκτης Ι θα κερδίσει 4. Αυτό προκύπτει ως εξής: από τον πίνακα διαθέσιμων στρατηγικών (3/4), χρήση της Σ3 στο Π.Σ. ΙΙ.1 σημαίνει κίνηση λ2. Τώρα, από το δένδρο (2/4) προκύπτει ότι για κ2, λ2 τα κέρδη είναι (0, 4). Παρατηρείστε ότι τα ίδια κέρδη θα υπήρχαν αν στην κίνηση Κ2 του παίκτη Ι, ο παίκτης ΙΙ αποφάσιζε να χρησιμοποιήσει την στρατηγική Σ4 αντί της Σ3.

Ισοδύναμες στρατηγικές Δύο στρατηγικές σ1 και σ2 ενός παίκτη είναι ισοδύναμες αν και μόνο αν για οποιαδήποτε στρατηγική τ των υπολοίπων παικτών ισχύει: Ki(σ1, τ) = Ki(σ2, τ) για κάθε i, όπου Κi(σ, τ) τα κέρδη των παικτών με τις στρατηγικές σ και τ. Η παραπάνω ισοδυναμία αποτελεί σχέση ισοδυναμίας και με την μαθηματική έννοια. Αυτή δε η σχέση ισοδυναμίας ορίζει, ως γνωστό, τις κλάσεις ισοδυναμίας των στρατηγικών. Είναι δυνατόν να ορίσουμε την κανονική μορφή ενός παιγνίου ελλιπούς πληροφόρησης χρησιμοποιώντας τις κλάσεις ισοδυναμίας των στρατηγικών αντί για τις αρχικές στρατηγικές. Με αυτόν τον τρόπο περιορίζουμε την διάσταση και άρα την πολυπλοκότητα του παιγνίου.

Ισοδύναμες στρατηγικές- Παράδειγμα (1/4) Σε ένα παίγνιο δύο παικτών ο Ι παίζει πρώτος α ή β. Ο ΙΙ δεν γνωρίζει την ακριβή κίνηση του Ι και παίζει γ ή δ. Στη συνέχεια, ο Ι ξαναπαίζει πάλι α ή β, χωρίς όμως να γνωρίζει την κίνηση του ΙΙ. Στην συνέχεια δίνονται οι εκβάσεις του παιγνίου με χρήση της εκτεταμένης μορφής. Να παραστήσετε το παίγνιο χρησιμοποιώντας την κανονική μορφή. Ακολούθως, να απλοποιήσετε την κανονική μορφή με την χρήση των κλάσεων ισοδυναμίας στρατηγικών.

Ισοδύναμες στρατηγικές Παράδειγμα (2/4) Εκτεταμένη μορφή παιγνίου. Ο παίκτης Ι διαθέτει 3 Π.Σ. και οι κινήσεις του είναι 2 (α, β). Άρα, το πλήθος των στρατηγικών του είναι 2x2x2 = 8. Ο παίκτης ΙΙ έχει 1 Π.Σ. και τελικά 2 στρατηγικές. Οι στρατηγικές του παίκτη Ι παρατίθενται στην επόμενη διαφάνεια.

Ισοδύναμες στρατηγικές Παράδειγμα (3/4) Αφού σύμφωνα με την Σ1, στο Ι.1, επιλέγεται α, δεν μας ενδιαφέρει η επιλογή στο Ι.3 διότι δεν μπορεί το παίγνιο να οδηγηθεί στο Ι.3. Συνεπώς, απαλείφοντας την επιλογή στο Ι.3 προκύπτει ότι οι στρατηγικές Σ1 και Σ2 δίνουν την ίδια πληροφορία και άρα είναι ισοδύναμες. Με το ίδιο σκεπτικό οι Σ3, Σ4 είναι ισοδύναμες. Ακόμη, σύμφωνα με την Σ5, στο Ι.1 επιλέγεται β και συνεπώς οι επιλογές στο Ι.2 δεν μας ενδιαφέρουν, αφού το παίγνιο δεν μπορεί να βρεθεί στο Ι.2. Συνεπώς, απαλείφοντας το Ι.2, οι στρατηγικές Σ5, Σ7 δίνουν την ίδια πληροφορία και άρα είναι ισοδύναμες. Ομοίως και οι Σ6, Σ8. Τελικά, κάνοντας χρήση των ισοδύναμων στρατηγικών, αντί για πίνακα 8 x 2 της αρχικής κανονικής μορφής καταλήγουμε σε πίνακα 4 x 2. (βλέπε επόμενη διαφάνεια)

Ισοδύναμες στρατηγικές Παράδειγμα (4/4) Οι κλάσεις ισοδυναμίας των στρατηγικών του παίκτη Ι. Η κανονική μορφή του παιγνίου προκύπτει από τον πίνακα στα αριστερά και από την εκτεταμένη μορφή του παιγνίου (δένδρο - διαφάνεια 2/4)

Παίγνια συνεργασίας και μη συνεργασίας Παίγνια Συνεργασίας: Οι παίκτες μπορούν να διαπραγματευθούν μεταξύ τους, να συμφωνήσουν από κοινού σε ορισμένες αποφάσεις και στη συνέχεια να είναι δεσμευμένοι να ακολουθήσουν τις συμφωνημένες αυτές αποφάσεις. Παίγνια Μη Συνεργασίας: Χωρίς δεσμεύσεις.

Πεπερασμένα και άπειρα παίγνιασυνεχή και διακριτά παίγνια Πεπερασμένα παίγνια: το πλήθος των στρατηγικών των παικτών είναι πεπερασμένο. Άπειρα παίγνια: τα σύνολα των στρατηγικών είναι άπειρα. Συνεχή παίγνια: οι στρατηγικές ανήκουν σε ένα συνεχές σύνολο π.χ. [0, 1]. Διακριτά παίγνια: τα μη συνεχή, δηλαδή εκείνα στα οποία οι στρατηγικές είναι διακριτές.

Κυρίαρχες στρατηγικές (1/2) Μια στρατηγική σ του Ι κυριαρχείται αυστηρά από μία άλλη στρατηγική σ του Ι αν για κάθε στρατηγική τ του ΙΙ ισχύει η ανισότητα: Κi(σ, τ) < Κi(σ, τ) Μια στρατηγική σ του Ι κυριαρχείται (όχι αυστηρά) από μία άλλη στρατηγική σ του Ι αν για κάθε στρατηγική τ του ΙΙ ισχύει η ανισότητα: Κi(σ, τ) Κi(σ, τ) Είναι προφανές ότι ένας παίκτης δεν θα ακολουθήσει μια αυστηρά κυριαρχούμενη στρατηγική αφού υπάρχει άλλη που δίνει μεγαλύτερο κέρδος ανεξάρτητα από την κίνηση του αντιπάλου.

Κυρίαρχες στρατηγικές (2/2) Είναι λογικό να υποθέσουμε ότι αφού μια κυριαρχούμενη στρατηγική δεν πρόκειται να ακολουθηθεί, τότε θα μπορούσε να απαλειφτεί από την κανονική μορφή του παιγνίου. Θεωρούμε την περίπτωση όπου είναι δυνατή η διαδοχική απαλοιφή κυριαρχούμενων στρατηγικών, με αποτέλεσμα να απομείνει μια στρατηγική Σ1 για τον παίκτη Ι και μια Τ1 για τον ΙΙ, οι οποίες προφανώς ενυπήρχαν εξαρχής στην κανονική μορφή του παιγνίου. Σε αυτήν την περίπτωση λέμε ότι έχουμε μια λύση αυστηρής ακολουθιακής κυριαρχίας. Η χρησιμότητα της ακολουθιακής κυριαρχίας είναι προφανής, καθώς περιορίζει την πολυπλοκότητα του παιγνίου.

Λύση κυριαρχίας και λύση ακολουθιακής κυριαρχίας Λύση Κυριαρχίας Η περίπτωση όπου όλες οι στρατηγικές των παικτών κυριαρχούνται από μία στρατηγική (για κάθε παίκτη) Λύση (αυστηρά) ακολουθιακής κυριαρχίας Προέρχεται από διαδοχική απαλοιφή (αυστηρά) κυριαρχούμενων στρατηγικών

1 ο Παράδειγμα κυριαρχούμενων στρατηγικών (1/3) Θεωρούμε δύο παραγωγούς του ίδιου αγαθού, ο καθένας των οποίων μπορεί να παραγάγει είτε 1 είτε 5 μονάδες του αγαθού, χωρίς κόστος. Η συνάρτηση ζήτησης του αγαθού, που προσδιορίζει την τιμή που θα ισχύσει σαν συνάρτηση της συνολικής παραγωγής, έστω ότι είναι η εξής:

1 ο Παράδειγμα κυριαρχούμενων στρατηγικών (2/3) Ο Ι έχει δύο στρατηγικές (όσες και επιλογές), έστω σ1, σ2 που αντιστοιχούν σε παραγωγή 1 και 5 μονάδων. Συμμετρικά ο ΙΙ έχει τις στρατηγικές τ1, τ2. Αν για παράδειγμα ο Ι ακολουθήσει την σ1 (παραγωγή μιας μονάδας) και ο ΙΙ την τ2 (παραγωγή 5 μονάδων) τότε η τιμή για τις 6 μονάδες είναι 2. Άρα ο Ι κερδίζει 1 x 2 = 2 και ο ΙΙ κερδίζει 5 x 2 = 10.

1 ο Παράδειγμα κυριαρχούμενων στρατηγικών (3/3) Μετά τις 2 διαδοχικές απαλοιφές των κυριαρχούμενων στρατηγικών σ1 και τ1 προέκυψε η παραπάνω (απλοποιημένη) λύση ακολουθιακής κυριαρχίας.

2 ο Παράδειγμα κυριαρχούμενων στρατηγικών (1/5) Στο Β Παγκόσμιο Πόλεμο ο Ιαπωνικός στόλος βρισκόταν δυτικά της Ν. Γουινέας με πορεία προς τα ανατολικά. Μπορούσε να περάσει είτε από βόρεια είτε από νότια του νησιού. Το βόρειο ταξίδι διαρκούσε 2 ημέρες ενώ το νότιο 3.

2 ο Παράδειγμα κυριαρχούμενων στρατηγικών (2/5) Στην Ν. Γουινέα υπήρχαν βάσεις Αμερικανικών βομβαρδιστικών που ήξεραν ότι ο Ιαπωνικός στόλος θα παράπλεε το νησί. Αν τα βομβαρδιστικά συγκέντρωναν τις προσπάθειες εντοπισμού προς τα βόρεια (νότια) και ο στόλος είχε πάει προς τα νότια (βόρεια), θα χανόταν μία ημέρα στην άκαρπη προσπάθεια εντοπισμού του στόλου, διαφορετικά ο στόλος θα εντοπιζόταν αυθημερόν.

2 ο Παράδειγμα κυριαρχούμενων στρατηγικών (3/5) Οι επιλογές του Ιάπωνα Ναυάρχου είναι Βόρεια ή Νότια και του Αμερικανού διοικητή επίσης Βόρεια ή Νότια. Οι ημέρες βομβαρδισμού του στόλου δίνονται στον επόμενο πίνακα. Όσο περισσότερες είναι τόσο μεγαλύτερα τα κέρδη των ΗΠΑ και άρα η ζημία της Ιαπωνίας. Αναλύστε το παίγνιο με έννοιες ακολουθιακής κυριαρχίας

2 ο Παράδειγμα κυριαρχούμενων στρατηγικών (4/5) Πρόκειται για παίγνιο μηδενικού αθροίσματος. Δεν υπάρχει κυριαρχία στις στρατηγικές των ΗΠΑ. Στις στρατηγικές της Ιαπωνίας, η στρατηγική «βόρεια» κυριαρχεί της «Νότια», αν και όχι αυστηρά. Έτσι το παίγνιο γίνεται:

2 ο Παράδειγμα κυριαρχούμενων στρατηγικών (5/5) Στο νέο παίγνιο όμως, η στρατηγική «βόρεια» των ΗΠΑ κυριαρχεί της στρατηγικής «Νότια», οπότε οδηγούμεθα στο τελικό παίγνιο: Τελικά, το ζεύγος στρατηγικών (Βόρεια, Βόρεια) αποτελεί την ακολουθιακή λύση του παιγνίου. Αυτή ήταν και η εξέλιξη της πραγματικής μάχης κατά τον Β. Παγκόσμιο πόλεμο.

Απαλοιφή αυστηρώς και μη αυστηρώς κυριαρχούμενων στρατηγικών Με βάση την απαλοιφή αυστηρώς κυριαρχούμενων στρατηγικών, είναι δυνατόν να οδηγηθούμε σε λύση αυστηρά ακολουθιακής κυριαρχίας, η οποία αν υπάρχει είναι μοναδική. Αντίθετα, κατά την απαλοιφή ασθενώς κυριαρχούμενων στρατηγικών, όχι μόνο δεν είναι εξασφαλισμένη η λύση ακολουθιακής κυριαρχίας, αλλά αν αυτή υπάρχει ενδέχεται να μην είναι μοναδική. Η λύση εξαρτάται από την σειρά της απαλοιφής των ασθενώς κυριαρχούμενων στρατηγικών.