Extensive Games with Imperfect Information



Σχετικά έγγραφα
Εκτεταμένα Παίγνια (Extensive Games)

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Παραδείγματα Παιγνίων

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

Τεχνητή Νοημοσύνη ΙΙ. Εργαστηριακή Άσκηση 4. Μουστάκας Κωνσταντίνος. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστων

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Κεφάλαιο 29 Θεωρία παιγνίων

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Ορισμένες Κατηγορίες Αλγορίθμων

Evolutionary Equilibrium

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Θεωρία Παιγνίων και Αποφάσεων

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Μοντέλα των Cournotκαι Bertrand

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ 1. Κοινά χαρακτηριστικά

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Ε ανάληψη. Προβλήµατα ικανο οίησης εριορισµών. ορισµός και χαρακτηριστικά Ε ίλυση ροβληµάτων ικανο οίησης εριορισµών

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

* τη µήτρα. Κεφάλαιο 1o

Ε ανάληψη. Παιχνίδια παιχνίδια ως αναζήτηση. Βέλτιστες στρατηγικές στρατηγική minimax. Βελτιώσεις κλάδεµα α-β

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Βασικές Έννοιες Θεωρίας Παιγνίων

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Αυτόνομοι Πράκτορες. Εργασία εξαμήνου. Μάθηση του παιχνιδιού British square με χρήση Temporal Difference(TD) Κωνσταντάκης Γιώργος

Βασικές Έννοιες Θεωρίας Παιγνίων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

John Nash. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Notes. Notes. Notes. Notes

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Βασικές Αρχές της Θεωρίας Παιγνίων

Αλγόριθμοι Αναζήτησης σε Παίγνια Δύο Αντιπάλων

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Κεφάλαιο 5. Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων. Τεχνητή Νοηµοσύνη - Β' Έκδοση

Δημοπρασίες (Auctions)

NOVA PRODUCTIONS. by GDTronics

Επίλυση Προβλημάτων 1

Οδηγίες. Θα το παίξεις... και θα πεις κι ένα τραγούδι!

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Βασικές Έννοιες Θεωρίας Παιγνίων

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης Αλγόριθµοι τυφλής αναζήτησης Αλγόριθµοι ευρετικής αναζήτησης

B 1 A 1 B 2 A 2. t 1. t 3 w. t 2 A 3 B 3. t 4. t 5

Παύλος Εφραιμίδης. Κρυπτογραφικά Πρωτόκολλα. Ασφ Υπολ Συστ

Ασκήσεις μελέτης της 6 ης διάλεξης

3. Παίγνια Αλληλουχίας

Κρυπτογραφικά Πρωτόκολλα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Blackjack: Στρατηγική, συμβουλές και τρόπος παιχνιδιού - ΚΑΛΑΜΠΑΚΑ CITY KALAMPAKA METEOR

3 ΙΣΟΡΡΟΠΙΕΣ 3 ΙΣΟΡΡΟΠΙΕΣ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Τσάπελη Φανή ΑΜ: Ενισχυτική Μάθηση για το παιχνίδι dots. Τελική Αναφορά

Διαδρομών Μέρμηγκα Μερμηγκιών Τζίτζικα Τζίτζικα Επιλογής Επιλογής Φθινόπωρο Φθινόπωρο Προμηθειών Χειμώνα Δύναμης Χειμώνα Φθινόπωρο Χειμώ- νας

Κεφάλαιο 9 ο Κ 5, 4 4, 5 0, 0 0,0 5, 4 4, 5. Όπως βλέπουµε το παίγνιο δεν έχει καµιά ισορροπία κατά Nash σε αµιγείς στρατηγικές διότι: (ΙΙ) Α Κ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ. Βασικά Εργαλεία και Μέθοδοι για τον Έλεγχο της Ποιότητας [ΔΙΠ 50]

Κεφάλαιο 2 Πιθανότητες. Πέτρος Ε. Μαραβελάκης, Επίκουρος Καθηγητής, Πανεπιστήμιο Πειραιώς

Η ΠΟΚΕΡΚΑΡΤΑ ΤΟΥ BIG TONY. User s Manual / Εγχειρίδιο Χρήσης. GDTronics

ΠΙΘΑΝΟΤΗΤΕΣ Α ΛΥΚΕΙΟΥ Ανδρεσάκης Δ. ΑΛΓΕΒΡΑ Α ΛΥΚΕΙΟΥ ΠΙΘΑΝΟΤΗΤΕΣ

ιακριτά Μαθηµατικά Ασκήσεις Φροντιστηρίου

(1) 98! 25! = 4 100! 23! = 4

ΠΕΡΙΕΧΟΜΕΝΑ: 88 στόχοι 48 λεγεώνες 23 δείκτες ενεργοποίησης. Επτά λεγεώνες και. κατακτηθεί. Απόθεμα λεγεώνων. Στοίβα στόχων

1 ο Κεφάλαιο : Πιθανότητες. 1. Δειγματικοί χώροι 2. Διαγράμματα Venn. Φυσική γλώσσα και ΚΑΤΗΓΟΡΙΕΣ ΑΣΚΗΣΕΩΝ. 3. Κλασικός ορισμός. 4.

Μέση τιμή, διασπορά, τυπική απόκλιση. 1) Για την τυχαία διακριτή μεταβλητή Χ ισχύει Ρ(Χ=x i)=

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

ΑΣΚΗΣΕΙΣ ΣΤΙΣ ΠΙΘΑΝΟΤΗΤΕΣ

Το Υπόδειγμα της Οριακής Τιμολόγησης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Π

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Ε ανάληψη. πεπερασµένα χρονικά περιθώρια ανά κίνηση. απευθείας αξιολόγηση σε ενδιάµεσους κόµβους

Περιεχόμενα του Παιχνιδιού

ΕΠΙΣΗΜΟΙ ΚΑΝΟΝΕΣ ΤΟΥ ΟΙ ΚΑΡΤΕΣ

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

P (A 1 A 2... A n ) = P (A 1 )P (A 2 A 1 )P (A 3 A 1 A 2 ) P (A n A 1 A 2 A n 1 ).

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 6: Εκτατική μορφή παίγνιων. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Solution Concepts. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

P( n, k) P(5,5) 5! 5! 10 q! q!... q! = 3! 2! = 0! 3! 2! = 3! 2!

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών. HY-217: Πιθανότητες - Χειµερινό Εξάµηνο 2015 ιδάσκων : Π. Τσακαλίδης

Οι παίκτες παίρνουν το ρόλο των χειρότερων πειρατών στο πλήρωμα ενός πλοίου. Ο καπετάνιος σας έχει στη μπούκα, επειδή είστε πολύ τεμπέληδες και


Ηθικός Κίνδυνος. Το βασικό υπόδειγμα. Παρουσιάζεται ένα στοχαστικό πρόβλημα χρηματοδότησης όταν τα αντισυμβαλλόμενα μέρη έχουν συμμετρική πληροφόρηση.

Αλγοριθμική Θεωρία Παιγνίων

BRIDGE ÑÉÓÔÉÍÁ ÓÕÑÁÊÏÐÏÕËÏÕ

Kεφάλαιο 10. Πόσα υποπαίγνια υπάρχουν εδώ πέρα; 2 υποπαίγνια.

Transcript:

Extensive Games with Imperfect Information Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Εκτεταµένα παίγνια µε ατελή πληροφόρηση Στα εκτεταµένα παίγνια (µε τέλεια πληροφόρηση) κάθε παίκτης όποτε επιλέγει µια ενέργεια είναι πληροφορηµένος σχετικά µε τις ενέργειες που έχουν επιλεγεί προηγουµένως από όλους τους παίκτες Τα εκτεταµένα παίγνια µε ατελή πληροφόρηση γενικεύουν το αρχικό µοντέλο για περιστάσεις όπου οι παίκτες µπορεί να µην έχουν τέλεια πληροφόρηση για τις προηγούµενες ενέργειες των άλλων παικτών. 2

Ορισµός Extensive game with perfect information Παίκτες (players): Τερµατικά ιστορικά (terminal histories): Συνάρτηση παίκτη (player function) Προτιµήσεις (preferences) Extensive game with imperfect information Παίκτες (players): Τερµατικά ιστορικά (terminal histories): Συνάρτηση παίκτη (player function) Μια συνάρτηση για κινήσεις που αποδίδονται στην τύχη Για κάθε παίκτη, µια διαµέριση πληροφοριών (information partition) των ιστορικών που αντιστοιχίζονται σε αυτόν Προτιµήσεις (preferences) 3

Ορισµός Η συνάρτηση για κινήσεις που αποδίδονται στην τύχη αντιστοιχεί σε κάθε ιστορικό µία κατανοµή πιθανοτήτων στις ενέργειες που είναι εφικτές µετά από εκείνο το ιστορικό. Κάθε τέτοια κατανοµή είναι ανεξάρτητη από κάθε άλλη κατανοµή. Η διαµέριση πληροφοριών καθορίζει την πληροφορία που έχει στη διάθεσή του ο παίκτης κάθε φορά που πρέπει να επιλέξει µια ενέργεια. Συγκεκριµένα πριν από κάθε ενέργειά του, ο παίκτης γνωρίζει το σύνολο πληροφόρησης (information set) στο οποίο ανήκει το τρέχον ιστορικό. 4

Bach or Stravinsky Παίκτες (players): Παίκτες Α και Β Τερµατικά ιστορικά (terminal histories): (B, B), (B, S), (S, B) και (S,S) Συνάρτηση παίκτη (player function): P( ) = A, P(B) = P(S) = Β Κινήσεις της τύχης : Καµία. Για κάθε παίκτη, µια διαµέριση πληροφοριών: Παίκτης Α: (ο παίκτης Α παίζει πρώτος) Παίκτης Β: {B,S} (ο παίκτης Β βλέπει το ίδιο σύνολο πληροφόρησης, είτε ο Α επέλεξε B είτε επέλεξε S.) Προτιµήσεις (preferences): Όπως τις έχουµε πει για το κλασικό παιχνίδι Bach or Stravinsky ή Βαµβακάρης ή Τσιτσάνης κτλ. 5

Bach or Stravinsky 6 Η διακεκοµµένη γραµµή µεταξύ των δύο κόµβων δηλώνει ότι ο παίκτης 2 δεν γνωρίζει σε ποιον από τους δύο κόµβους βρίσκεται το παίγνιο. Οι δύο κόµβοι µε ετικέτα 2:1 αποτελούν ένα σύνολο πληροφόρησης.

A simple poker game H Alice τραβάει ένα τυχαίο χαρτί από την τράπουλα. Έστω ότι υπάρχουν high και low χαρτιά. Η πιθανότητα επιλογής κάθε κατηγορίας είναι η ίδια. Μπορεί πχ. τα κόκκινα (κούπες, καρό) να θεωρούνται high και τα µαύρα (µπαστούνι, σπαθί) low. Η Alice µπορεί στη συνέχεια να επιλέξει raise ή fold Εάν επιλέξει fold τελειώνει το παιχνίδι. Εάν επιλέξει raise τότε είναι η σειρά του Bob, οποίος µπορεί να επιλέξει meet ή pass, και µετά τελειώνει το παιχνίδι. 7

A simple poker game 8

A simple poker game 9

στρατηγική Μια (αγνή) στρατηγική ενός παίκτη i σε ένα εκτεταµένο παίγνιο είναι µια συνάρτηση I i που αντιστοιχεί σε κάθε σύνολο πληροφόρησης (information set) του παίκτη i µία ενέργεια A(i). Μια µεικτή στρατηγική είναι µια κατανοµή πιθανοτήτων πάνω στις αγνές στρατηγικές του παίκτη. 10

Belief systems, Behavioral strategy Ένα belief system σε ένα εκτεταµένο παίγνιο είναι µια συνάρτηση που αντιστοιχεί σε κάθε σύνολο πληροφόρησης µία κατανοµή πιθανοτήτων για τα ιστορικά που ανήκουν στο σύνολο πληροφόρησης αυτό. Μια behavioral strategy ενός παίκτη i σε ένα εκτεταµένο παίγνιο είναι µια συνάρτηση που αντιστοιχεί σε κάθε σύνολο πληροφόρησης του i µια κατανοµή πιθανοτήτων για τις ενέργειες A(i), µε την ιδιότητα ότι κάθε κατανοµή πιθανοτήτων είναι ανεξάρτητη από κάθε άλλη κατανοµή. Behavioral strategy vs mixed strategy 11

Behavioral strategies vs. mixed strategies Σε πολλές περιπτώσεις mixed strategies και behavioral strategies είναι ισοδύναµες BoS: Κάθε παίκτης έχει ένα information set και εποµένως µια behavioral strategy είναι µια µοναδική κατανοµή πιθανοτήτων και ταυτίζεται µε την αντίστοιχη mixed strategy 12

Simple card game (από το βιβλίο) Δύο παίκτες, Alice και Bob που ποντάρουν από 1 ο καθένας Η Alice τραβάει ένα τυχαίο χαρτί από την τράπουλα. Έστω ότι υπάρχουν high και low χαρτιά. Η Alice µπορεί στη συνέχεια να επιλέξει see ή raise Εάν επιλέξει see αποκαλύπτει το χαρτί της εάν έχει high παίρνει τα χρήµατα, εάν έχει low παίρνει ο Bob τα χρήµατα, και τελειώνει το παιχνίδι. Εάν επιλέξει raise τότε ποντάρει ακόµα 1 και είναι η σειρά του Bob, οποίος µπορεί να επιλέξει meet (ποντάρει 1, ανοίγουν το χαρτί της Αlice, και µε high κερδίζει η Αλίκη, µε low ο Bob) ή pass (η Αλίκη παίρνει κατευθείαν τα χρήµατα), και µετά τελειώνει το παιχνίδι. 13

Simple Card Game 14

15

Πηγές - Αναφορές An Introduction to Game Theory, Κεφάλαιο 10 Gambit Tutorial: A simple poker game 16