Αλγοριθμική Θεωρία Παιγνίων



Σχετικά έγγραφα
Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Αλγοριθµική Θεωρία Παιγνίων

Παίγνια Συμφόρησης και Ανταγωνιστική Ανάθεση Πόρων

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Παίγνια Συμφόρησης. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

παίγνια και δίκτυα Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Αλγόριθμοι και Πολυπλοκότητα

Αλγόριθμοι και Πολυπλοκότητα

Αλγόριθμοι και Πολυπλοκότητα

Αλγόριθμοι και Πολυπλοκότητα

Αλγόριθμοι και Πολυπλοκότητα

Ορισμένες Κατηγορίες Αλγορίθμων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Αλγόριθµοι και Πολυπλοκότητα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Το Διαδίκτυο ως ερευνητικό αντικείμενο

Αλγόριθμοι και Πολυπλοκότητα

ιακριτές Μέθοδοι για την Επιστήμη των Υπολογιστών

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Αρχές της Θεωρίας Παιγνίων

Άπληστοι Αλγόριθμοι. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Άπληστοι Αλγόριθμοι. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Κεφάλαιο 29 Θεωρία παιγνίων

Ανάλυση Ισορροπιών Σε Μηχανισμούς με Μερική Επαλήθευση

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

Μοντέλα των Cournotκαι Bertrand

Evolutionary Equilibrium

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 8: Δημοπρασίες. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Κεφάλαιο 28 Ολιγοπώλιο

Θεωρία Παιγνίων και Αποφάσεων

Εκτεταμένα Παίγνια (Extensive Games)

Βασικές Έννοιες Θεωρίας Παιγνίων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

δημιουργία: επεξεργασία: Ν.Τσάντας

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

Άπληστοι Αλγόριθμοι. Επιμέλεια διαφανειών: Δ. Φωτάκης Τροποποιήσεις: Α. Παγουρτζής. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά].

Κεφάλαιο 1. Πέντε Αντιπροσωπευτικά Προβλήματα. Έκδοση 1.4, 30/10/2014. Χρησιμοποιήθηκε υλικό από τις αγγλικές διαφάνειες του Kevin Wayne.

Ασυμπτωτικός Συμβολισμός

Υπολογιστική Πολυπλοκότητα

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

Εφαρμογές Υπολογιστικής Νοημοσύνης στις Ασύρματες Επικοινωνίες

υναμικός Προγραμματισμός

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Ακαδημαϊκό έτος B εξάμηνο (εαρινό)

Μοντελοποίηση προβληµάτων

28 Πολυπρακτορικά Συστήµατα

Προσεγγιστικοί Αλγόριθμοι για NP- ύσκολα Προβλήματα

Ασυμπτωτικός Συμβολισμός

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Ασυμπτωτικός Συμβολισμός

ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΚΕΦΑΛΑΙΟ 1

Αλγόριθμοι Προσέγγισης για NP-Δύσκολα Προβλήματα

ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ «ΕΚΠΑΙΔΕΥΣΗ ΚΑΙ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗ» ΕΘΝΙΚΟ ΣΤΡΑΤΗΓΙΚΟ ΠΛΑΙΣΙΟ ΑΝΑΦΟΡΑΣ ΕΣΠΑ ΔΡΑΣΗ «ΑΡΙΣΤΕΙΑ»

Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

υναμικός Προγραμματισμός

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

Αναζήτηση Κατά Πλάτος

Δυναμικός Προγραμματισμός

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Οικονομικά Υποδείγματα: Εισαγωγικές Έννοιες - Τα οικονομικά υποδείγματα περιγράφουν τη συμπεριφορά επιχειρήσεων-καταναλωτών και την αλληλεπίδρασή

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

Σκοπός του μαθήματος. Αρχές Φυσικής Μοντελοποίησης

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Εισαγωγή. Παίγνια Αποφάσεων 9 ο Εξάμηνο

Θέματα Υπολογισμού στον Πολιτισμό

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Δυναμικός Προγραμματισμός

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ Ακαδηµαϊκό έτος B εξάµηνο (εαρινό)

Transcript:

Αλγοριθμική Θεωρία Παιγνίων ιδάσκοντες: E. Ζάχος, Α. Παγουρτζής,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο

Πολύπλοκα Συστήματα αποτελούνται από πολλές (ετερογενείς) συνιστώσες που αλληλεπιδρούν. Συμπεριφορά συστήματος δεν συνάγεται από χαρακτηριστικά συνιστωσών. Συμπεριφορά εξαρτάται κυρίως από αλληλεπίδραση συνιστωσών και είναι δύσκολο να προβλεφθεί. Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 2

Παραδείγματα Φυσική (phase transitions, symmetry breaking, self organization, ). Βιολογία και Εξελικτική Βιολογία (εξέλιξη ειδών). Οικονομικά Παγκόσμια Οικονομία: ανεξάρτητες οντότητες αλληλεπιδρούν με στόχο μεγιστοποίηση κέρδους. Κοινωνιολογία Τι μικρός που είναι ο κόσμος! Μη-γραμμικά δυναμικά συστήματα (χαοτική συμπεριφορά). Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 3

στην Πληροφορική Internet Web (όχι ιεραρχικός σχεδιασμός αλλά «άναρχη» ανάπτυξη από αυτόνομες οντότητες). E-commerce, sponsored search auctions, Κατανεμημένα συστήματα. Agents, P2P systems, sensor networks, ιάδοση και αντιμετώπιση ιών. Ευρετικές τεχνικές Γενετικοί αλγόριθμοι, simulated annealing, Αυτο-οργάνωση, εξέλιξη, προσαρμογή, Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 4

Αναγκαιότητα Μεγάλα, πολύπλοκα, και δυναμικά μεταβαλλόμενα συστήματα αποτελούν τμήμα τεχνολογικής υποδομής. Αδύνατο να υπάρξει κεντρική διαχειριστική αρχή που εξασφαλίζει βέλτιστη λειτουργία. Συνιστώσες ενεργούν αυτόνομα και «εγωιστικά» με κριτήριο τη βελτιστοποίηση «ατομικών» αντικειμενικών στόχων. Κλασσικά παραδείγματα: Κυκλοφορία στις μεγάλες πόλεις. ρομολόγηση κυκλοφορίας στο Internet. Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 5

Μονόδρομος Ύποπτου Συλλαμβάνεται ύποπτος για μεγάλη ληστεία. ενυπάρχουνεπαρκήστοιχεία! Ομολογεί: 5 χρόνια φυλακή. εν ομολογεί: 1 χρόνο φυλακή. Ο ύποπτος δεν ομολογεί. Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 6

ίλημμα Υπόπτων Συλλαμβάνονται δύο συνεργάτες για μεγάλη ληστεία. Κρατούνται σε χωριστά κελιά χωρίς επικοινωνία. Ομολογεί Α εν ομολογεί Α Ομολογεί Β 5, 5 15, 0 εν ομολογεί Β 0, 15 1, 1 Αμφότεροι οι ύποπτοι ομολογούν! Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 7

Θεωρία Παιγνίων Μελετά συμπεριφορά αυτόνομων οντοτήτων που δρουν με στόχο βελτιστοποίηση ατομικών στόχων. Λογική συμπεριφορά. Στρατηγική συμπεριφορά. Εργαλείο για μελέτη πολύπλοκων συστημάτων. Σημεία ισορροπίας και ιδιότητες τους. Πρόβλεψη του τι θα συμβεί σε ένα πολύπλοκο σύστημα. Περιοχή εφαρμογής: Πολυπλοκότητα υπολογισμού σημείων ισορροπίας, υπολογιστικά αποδοτικοί μηχανισμοί. Αποδοτικός υπολογισμός πρόβλεψης. Είναι η πρόβλεψη ρεαλιστική; Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 8

Ανταγωνιστικό Παίγνιο Σύνολο παικτών που ανταγωνίζονται (π.χ. για πόρους). Κάθε παίκτης αποφασίζει μόνο τη δική του στρατηγική. Μοναδικός στόχος: μεγιστοποίηση ατομικής ωφέλειας. Ατομική ωφέλεια εξαρτάται από στρατηγικές όλων. Ισορροπία Nash: Κανένας δεν βελτιώνει ατομική ωφέλεια αλλάζοντας μόνο τη δική του στρατηγική. Nash (1952) απέδειξε ότι πάντα υπάρχει τέτοια ισορροπία (αλλά μπορεί να είναι πεπλεγμένη mixed). Ισορροπία Nash αποτελεί «λύση» του συστήματος: Aν οι παίκτες συμπεριφερθούν στρατηγικά και λογικά και έχουν στη διάθεσή τους πλήρη γνώση και επαρκή χρόνο, τότε καταλήγουν σε μία ισορροπία Nash. Ισορροπία Nash υπολογίζεται αποδοτικά; Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 9

Πλαίσιο Μελέτης Η πολυπλοκότητα είναι πηγή πολλών δυνατοτήτων! Aυτο-οργάνωση, εξέλιξη, προσαρμογή, Χαοτική συμπεριφορά, αστάθεια, μη-ισορροπία, Πρόκληση: κατανόηση και εξαγωγή επιθυμητής συμπεριφοράς. Ανάλυση ιδιοτήτων και κανόνες σχεδιασμού συστημάτων που θα χρησιμοποιούνται από ανταγωνιστικούς χρήστες. Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 10

Ισορροπία Nash Ομολογεί Α εν ομολογεί Α Ομολογεί Β 5, 5 15, 0 εν ομολογεί Β 0, 15 1, 1 Ισορροπία Nash δεν βελτιστοποιεί συνολικό αποτέλεσμα. Συμβιβασμός με δεδομένη την έλλειψη συντονισμού. Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 11

Παράδοξο Braess Συνολική καθυστέρηση 1.5 Nash ισορροπία αποτελεί βέλτιστη λύση. Νέα εξαιρετικά γρήγορη σύνδεση. Συνολική καθυστέρηση αυξάνεται σε 2 γιατί όλοι χρησιμοποιούν την γρήγορη σύνδεση. Παραδοσιακός σχεδιασμός δεν επαρκεί για πολύπλοκα συστήματα. Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 12

Ανταγωνιστική Ανάθεση Πόρων Μοντελοποίηση με παίγνια συμφόρησης. Ανάλυση απόδοσης. Κόστος αναρχίας: Υποβάθμιση λόγω αυτόνομης και ανταγωνιστικής συμπεριφοράς σε σχέση με βέλτιστη κεντρικοποιημένη διαχείριση. Κίνητρα για βελτίωση απόδοσης. Τεχνικές για βέλτιστο σχεδιασμό. Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 13

ημοπρασίες και Μηχανισμοί Ένααντικείμενοσεδημοπρασίαμεn συμμετέχοντες. Το αντικείμενο αξίζει u j για συμμετέχοντα j. Όλοι υποβάλλουν (σφραγισμένες) προσφορές b 1,, b n. Αντικείμενο κατοχυρώνεται σε k με μέγιστη προσφορά b k αντί τιμής t. Ωφέλεια κερδισμένου = u k t. Ωφέλεια μη κερδισμένου = 0. Πώς καθορίζουμε την τιμή, ώστε οι προσφορές να ανταποκρίνονται στην πραγματική αξία του αντικειμένου; Τιμή ίση με μέγιστη προσφορά. Όχι, π.χ. 100, 5! Τιμή ίση με δεύτερη μεγαλύτερη προσφορά. Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 14

Αντικείμενο - Ατζέντα (Πολύ) σύντομη στον Γραμμικό Προγραμματισμό και (κυρίως) στην υϊκότητα του Γραμμικού Προγραμματισμού. Εφαρμογή: απόδειξη ύπαρξης και αποδοτικού υπολογισμού ισορροπίας Nash σε 2-person zero-sum games. Ανταγωνιστική ανάθεση πόρων και παίγνια συμφόρησης: Μη ατομικά και ατομικά. Ύπαρξη και πολυπλοκότητα υπολογισμού (αμιγούς) ισορροπίας Nash. Τίμημα της αναρχίας και τεχνικές βελτίωσής του. Πολυπλοκότητα υπολογισμού (πεπλεγμένης) ισορροπίας Nash σε παίγνια με 2 παίκτες (bimatrix games). Η κλάση PPAD και γιατί είναι PPAD-complete. Αποδοτικός υπολογισμός προσεγγιστικών ισορροπιών Nash. Σχεδιασμός (υπολογιστικά αποδοτικών) μηχανισμών. Με χρηματικά ανταλλάγματα (VCG μηχανισμοί). Χωρίς χρηματικά ανταλλάγματα (social choice). Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 15

Βιβλιογραφία - Πληροφορίες Nisan, Roughgarden, Tardos, Vazirani. Algorithmic Game Theory, 2007 (διαθέσιμο ηλεκτρονικά). Karloff. Linear Programming, 1991. Roughgarden. An Algorithmic Game Theory Primer. Σε πολλές περιπτώσεις θα ανατρέξουμε σε εξειδικευμένα surveys και ερευνητικές εργασίες. Πέμπτη: 16:00-19:00, 1.1.29, Παλ. Κτήριο ΣΗΜΜΥ. http://www.corelab.ece.ntua.gr/courses/agt/ Αλγοριθμική Θεωρία Παιγνίων Εισαγωγή 16