Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Σχετικά έγγραφα
Αλγοριθμική Θεωρία Παιγνίων

Αλγοριθµική Θεωρία Παιγνίων

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Παίγνια Συμφόρησης και Ανταγωνιστική Ανάθεση Πόρων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Παίγνια Συμφόρησης. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων

Βασικές Αρχές της Θεωρίας Παιγνίων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

Βασικές Έννοιες Θεωρίας Παιγνίων

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά].

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

δημιουργία: επεξεργασία: Ν.Τσάντας

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

παίγνια και δίκτυα Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Κεφάλαιο 28 Ολιγοπώλιο

Βασικές Έννοιες Θεωρίας Παιγνίων

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

John Nash. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Βασικές Έννοιες Θεωρίας Παιγνίων

Το Διαδίκτυο ως ερευνητικό αντικείμενο

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 8: Δημοπρασίες. Ε. Μαρκάκης. Επικ. Καθηγητής

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Μοντέλα των Cournotκαι Bertrand

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Κεφ. 9 Ανάλυση αποφάσεων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Ορισμένες Κατηγορίες Αλγορίθμων

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Κεφάλαιο 29 Θεωρία παιγνίων

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Προσεγγιστικοί Αλγόριθμοι βασισμένοι σε Γραμμικό Προγραμματισμό

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

ιακριτές Μέθοδοι για την Επιστήμη των Υπολογιστών

Θεωρία Παιγνίων. Εισαγωγικές έννοιες και Τεχνικές

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Γραμμικός Προγραμματισμός

Ανάλυση Ισορροπιών Σε Μηχανισμούς με Μερική Επαλήθευση

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Παραδείγματα Παιγνίων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΠΕΡΙΕΧΟΜΕΝΑ. ΜΕΡΟΣ Α Θεωρία Ζήτησης Ενός Αγαθού - Ανάλυση Συμπεριφοράς Καταναλωτή

Επιχειρησιακή Έρευνα Θεωρητική Θεμελίωση της Μεθόδου Simplex

Συνεργατική Θεωρία Παιγνίων και Εφαρμογές:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2016

Εκτεταμένα Παίγνια (Extensive Games)

Διπλωµατική Εργασία µε τίτλο: Ακαδηµαϊκό έτος

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Ολιγοπωλιακή Ισορροπία

Προσεγγιστικοί Αλγόριθμοι βασισμένοι σε Γραμμικό Προγραμματισμό

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ακριβώς συμπεράσματα. Ο φυγάς ίσως να σκεφτεί ότι η γέφυρα Α συνεχίζει να είναι η καλύτερη επιλογή του επειδή είναι σε καλή κατάσταση και επιτρέπει

Γραμμικός Προγραμματισμός

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Περιεχόμενα. 1. Ανάλυση ευαισθησίας. (1) Ανάλυση ευαισθησίας (2) Δυϊκό πρόβλημα (κανονική μορφή) (3) Δυαδικός προγραμματισμός (4) Ανάλυση αποφάσεων

ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΙΚΟΤΗΤΑ

Αποτροπή Εισόδου: Το Υπόδειγμα των Spence-Dixit

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Προσεγγιστικοί Αλγόριθμοι βασισμένοι σε Γραμμικό Προγραμματισμό

Το πρόβλημα μονοδρόμησης (The One-Way Street Problem)

Σχεδιασμός συγκοινωνιακών έργωνοικονομικά

Condorcet winner. (1) Αν U j (x) > U j (y) τότε U i (x) > U i (y) και (2) Αν U i (y) > U i (x) τότε U j (y) > U j (x).

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Εισαγωγικές Έννοιες. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Transcript:

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο

Πολύπλοκα Συστήματα αποτελούνται από πολλές (ετερογενείς) συνιστώσες που αλληλεπιδρούν. Συμπεριφορά συστήματος δεν συνάγεται από χαρακτηριστικά συνιστωσών. Συμπεριφορά εξαρτάται κυρίως από αλληλεπίδραση συνιστωσών και είναι δύσκολο να προβλεφθεί. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 2

Παραδείγματα Φυσική (phase transitions, symmetry breaking, self organization, ). Βιολογία και Εξελικτική Βιολογία (εξέλιξη ειδών). Οικονομικά Παγκόσμια Οικονομία: ανεξάρτητες οντότητες αλληλεπιδρούν με στόχο μεγιστοποίηση κέρδους. Κοινωνιολογία Τι μικρός που είναι ο κόσμος! Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 3

Αναγκαιότητα για EECS Μεγάλα, πολύπλοκα, και δυναμικά μεταβαλλόμενα συστήματα αποτελούν τμήμα τεχνολογικής υποδομής. υσχερής η ιδέα μιας κεντρικής διαχειριστικής αρχής που εξασφαλίζει βέλτιστη λειτουργία. Συνιστώσες ενεργούν αυτόνομα και ιδιοτελώς με κριτήριο τη βελτιστοποίηση ατομικών αντικειμενικών στόχων. Κλασσικά παραδείγματα: Κυκλοφορία στις μεγάλες πόλεις. ρομολόγηση κυκλοφορίας στο Internet. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 4

Μονόδρομος Ύποπτου Συλλαμβάνεται ύποπτος για μεγάλη ληστεία. ενυπάρχουνεπαρκήστοιχεία! Ομολογεί: 5 χρόνια φυλακή. εν ομολογεί: 1 χρόνο φυλακή. Ο ύποπτος δεν ομολογεί. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 5

ίλημμα Υπόπτων Συλλαμβάνονται δύο συνεργάτες για μεγάλη ληστεία. Κρατούνται σε χωριστά κελιά χωρίς επικοινωνία. Ομολογεί Α εν ομολογεί Α Ομολογεί Β 5, 5 15, 0 εν ομολογεί Β 0, 15 1, 1 Αμφότεροι οι ύποπτοι ομολογούν! Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 6

Θεωρία Παιγνίων Προβλέπει συμπεριφορά αυτόνομων οντοτήτων που δρουν ιδιοτελώς με σκοπό βελτιστοποίηση ατομικών στόχων. Εφαρμογή: όταν υπάρχουν αντικρουόμενα συμφέροντα. Υπόθεση: ορθολογική και στρατηγική συμπεριφορά. Πρόβλεψη: σημεία ισορροπίας (γεν. solution concepts). Εργαλείο για μελέτη «πολύπλοκων» συστημάτων. Σημεία ισορροπίας και ιδιότητες τους. Ορθολογική συμπεριφορά οδηγεί σε σημείο ισορροπίας. Περιοχή εφαρμογής: Αποδοτικός (κατανεμημένος;) υπολογισμός σημείου ισορροπίας. Αποδοτικότητα (σε σχέση με βέλτιστη διαμόρφωση). Σχεδιασμός Μηχανισμών: Κανόνες ώστε να επιτύχουμε επιθυμητή συμπεριφορά / απόδοση. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 7

Ανταγωνιστικό Παίγνιο Σύνολο παικτών που ανταγωνίζονται (π.χ. για πόρους). Κάθε παίκτης αποφασίζει μόνο τη δική του στρατηγική. Μοναδικός στόχος: μεγιστοποίηση ατομικού κέρδους. Ατομικό όφελος / κόστος εξαρτάται από στρατηγικές όλων. Ισορροπία Nash: Κανένας δεν μπορεί να βελτιώσει ατομικό κέρδος αλλάζοντας μόνο τη δική του στρατηγική. Nash (1952) απέδειξε ότι πάντα υπάρχει τέτοια ισορροπία (αλλά μπορεί να είναι πεπλεγμένη mixed). Ισορροπία Nash αποτελεί «λύση» του συστήματος: Aν οι παίκτες συμπεριφερθούν στρατηγικά και ορθολογικά και έχουν στη διάθεσή τους πλήρη γνώση και επαρκή χρόνο, τότε καταλήγουν σε μία ισορροπία Nash. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 8

Ισορροπία Nash Ομολογεί Α εν ομολογεί Α Ομολογεί Β 5, 5 15, 0 εν ομολογεί Β 0, 15 1, 1 Ισορροπία Nash δεν βελτιστοποιεί συνολικό αποτέλεσμα. Συμβιβασμός με δεδομένη την έλλειψη συντονισμού. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 9

Μάχη των Φύλλων ΟΚ, σινεμά Μπάσκετ Σινεμά 1, 5 0, 0 ΟΚ, μπάσκετ 0, 0 5, 1 Μοντέλο για συντονισμό με αντικρουόμενες προτιμήσεις. Ισορροπία Nash: καθένας επιλέγει best response στη στρατηγική του αντιπάλου. Αμιγής (ντετερμινιστική επιλογή στρατηγικών): (Σ, Σ), (Μ, Μ) Πεπλεγμένη (mixed): ((1/6, 5/6), (5/6, 1/6)) Αποδεικνύεται ότι #ισορροπιών Nash είναι περιττός. Σινεμά στο Rocky: ((2, -1), (0, 0)). Τι συμβαίνει; Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 10

Πέτρα Ψαλίδι Χαρτί Πέτρα Ψαλίδι Χαρτί Πέτρα 0, 0 1, -1-1, 1 Ψαλίδι -1, 1 0, 0 1, -1 Χαρτί 1, -1-1, 1 0, 0 Μοναδική ισορροπία: ((1/3, 1/3, 1/3), (1/3, 1/3, 1/3)). Παίγνιο μηδενικού αθροίσματος με 2 παίκτες. von Neumann (1928): υπάρχει πάντα πεπλεγμένη ισορροπία. Εύκολη απόδειξη μέσω LP duality. Nash (1952) γενίκευσε για παίγνια με μη-μηδενικό άθροισμα και πεπερασμένο πλήθος παικτών. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 11

Ενδιαφέροντα Παραδείγματα Το ίλημμα του (Απελπισμένου) Ταξιδιώτη 2 παίκτες, καθένας δηλώνει έναν αριθμό μεταξύ 2 και 100 (αξία χαμένης βαλίτσας). Αν δηλώσουν το ίδιο x, εισπράττουν x ευρώ ο καθένας. ιαφορετικά, έστω x< yοι δύο δηλώσεις. Αυτός που δήλωσε y, εισπράττει x, ο άλλος εισπράττει x+2. Μαντεύουμε τα 2/3 του μέσου όρου. n παίκτες, καθένας δηλώνει έναν αριθμό μεταξύ 0 και 100. Κερδίζει 1000 ευρώ (μόνον) αυτός με αριθμό πλησιέστερα στο 2(x 1 + + x n )/(3n). Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 12

Ισορροπία στην Πράξη Χρηματιστήριο: Τιμές αγαθών και μετοχών (market equilibrium) Internet, δρόμοι: ρομολόγηση πακέτων, αυτοκινήτων. Κοινωνικά δίκτυα, WWW: ομή του δικτύου. Πως οι συμμετέχοντες υπολογίζουν ισορροπίες; Απόδειξη Nash χρησιμοποιεί Θ. Σταθερού Σημείου Brower: μη αλγοριθμική. Μπορεί να υπάρχει αποδοτικός αλγόριθμος; Αν όχι, πως / γιατί / κατά πόσο συστήματα λειτουργούν σε συνθήκες ισορροπίας; Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 13

Υπολογισμός Ισορροπιών Παίγνια με 2 παίκτες και μηδενικό άθροισμα: Αποδοτικός υπολογισμός ισορροπίας Nash μέσω LP duality. Παίγνια με 2 παίκτες γενικής μορφής: εν είναι γνωστός αλγόριθμος πολυωνυμικού χρόνου, παρά το σημαντικό ενδιαφέρον και μεγάλη προσπάθεια. Lemke-Howson (simplex-like) αλγ. δεν είναι αποδοτικός. Ισορροπία Nash δεν είναι NP-complete (εξ ορισμού)! Είναι όμως PPAD-complete, δηλ. τόσο δύσκολη όσο ο υπολογισμός του σταθερού σημείου του Brower (ή οποιουδήποτε αντίστοιχου προβλήματος). Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 14

Τίμημα Αναρχίας Παράδοξο Braess Συνολική καθυστέρηση 1.5 Nash ισορροπία αποτελεί βέλτιστη λύση. Νέα πολύ γρήγορη σύνδεση. Συνολική καθυστέρηση αυξάνεται σε 2 γιατί όλοι χρησιμοποιούν νέα σύνδεση. Τίμημα Αναρχίας: 4/3 Παραδοσιακός σχεδιασμός δεν επαρκεί. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 15

Ανταγωνιστική Ανάθεση Πόρων Μοντελοποίηση με (μη ατομική και ατομική) παίγνια συμφόρησης. Ανάλυση απόδοσης. Τίμημα Αναρχίας: Υποβάθμιση λόγω αυτόνομης και ανταγωνιστικής συμπεριφοράς σε σχέση με βέλτιστη κεντρικοποιημένη διαχείριση. Κίνητρα για βελτίωση απόδοσης. Τεχνικές για βέλτιστο σχεδιασμό. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 16

ημοπρασίες και Μηχανισμοί Ένααντικείμενοσεδημοπρασίαμεn παίκτες. Το αντικείμενο αξίζει v j για παίκτη j. Όλοι υποβάλλουν (σφραγισμένες) προσφορές b 1,, b n. Αντικείμενο κατοχυρώνεται σε παίκτη k με μέγιστη προσφορά b k αντί τιμής t. Ωφέλεια κερδισμένου = v k t. Ωφέλεια μη κερδισμένου = 0. Επιλογή τιμής ώστε να είναι πάντα best response b j = v j (truthfulness); Τιμή ίση με μέγιστη προσφορά. Όχι, π.χ. 100, 5! Τιμή ίση με δεύτερη μεγαλύτερη προσφορά. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 17

Αντικείμενο - Ατζέντα Ισορροπία Nash σε 2-person 0-sum παίγνια: Εφαρμογή LP duality. Υπολογισμός ισορροπίας Nash σε γενικά παίγνια: Brower s fixed point theorem και Sperner s lemma. Αναφορά σε PPAD και Nash ισορροπία είναι PPAD-complete. Ένας αλγόριθμος προσέγγισης για ισορροπία Nash. Σχεδιασμός Μηχανισμών: Impossibility results, truthfulness, revelation principle Single-parameter agents: Myerson s characterization, VCG, revenue maximization Combinatorial auctions Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 18

Αντικείμενο - Ατζέντα Ανταγωνιστική ανάθεση πόρων και παίγνια συμφόρησης: Μη ατομικά παίγνια και ατομικά παίγνια. Ύπαρξη και πολυπλοκότητα (αμιγούς) ισορροπίας Nash. Συνάρτηση δυναμικού και σύγκλιση σε ισορροπία Nash. Τίμημα της αναρχίας και τεχνικές βελτίωσής του. Προηγμένα Θέματα Αλγορίθμων (Άνοιξη 2017) Εισαγωγή 19