Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Σχετικά έγγραφα
Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Παίγνια Συμφόρησης και Ανταγωνιστική Ανάθεση Πόρων

Παίγνια Συμφόρησης. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Αλγοριθμική Θεωρία Παιγνίων

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Αλγοριθµική Θεωρία Παιγνίων

παίγνια και δίκτυα Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Εισαγωγικές Έννοιες. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Προσεγγιστικοί Αλγόριθμοι βασισμένοι σε Γραμμικό Προγραμματισμό

Βασικές Αρχές της Θεωρίας Παιγνίων

Προσεγγιστικοί Αλγόριθμοι για NP- ύσκολα Προβλήματα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Το Διαδίκτυο ως ερευνητικό αντικείμενο

Ασυμπτωτικός Συμβολισμός

Βασικές Έννοιες Θεωρίας Παιγνίων

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Βασικές Έννοιες Θεωρίας Παιγνίων

Προσεγγιστικοί Αλγόριθμοι για NP- ύσκολα Προβλήματα

για NP-Δύσκολα Προβλήματα

Approximation Algorithms for the k-median problem

Άπληστοι Αλγόριθμοι. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Άπληστοι Αλγόριθμοι. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Κεφάλαιο 28 Ολιγοπώλιο

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Βασικές Έννοιες Θεωρίας Παιγνίων

Υπολογιστική Πολυπλοκότητα

Κεφάλαιο 29 Θεωρία παιγνίων

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Προσεγγιστικοί Αλγόριθμοι βασισμένοι σε Γραμμικό Προγραμματισμό

Ασκήσεις μελέτης της 8 ης διάλεξης

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Προσεγγιστικοί Αλγόριθμοι βασισμένοι σε Γραμμικό Προγραμματισμό

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 8: Δημοπρασίες. Ε. Μαρκάκης. Επικ. Καθηγητής

Μοντέλα των Cournotκαι Bertrand

Προσεγγιστικοί Αλγόριθμοι βασισμένοι σε Γραμμικό Προγραμματισμό

Μέθοδοι πολυδιάστατης ελαχιστοποίησης

Ανάλυση Ισορροπιών Σε Μηχανισμούς με Μερική Επαλήθευση

Ασυμπτωτικός Συμβολισμός

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Ορισμένες Κατηγορίες Αλγορίθμων

Υπολογιστικό Πρόβληµα

Αλγόριθµοι και Πολυπλοκότητα

Θεωρία Παιγνίων-Ολιγοπώλιο σε ποσότητες

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου;

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Δυναμικός Προγραμματισμός

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Πρόλογος. 1 Εισαγωγή Θεωρία Παιγνίων υό Λόγια για το Αντικείµενο Μερικά Ιστορικά Στοιχεία Ενα Παράδοξο Παιχνίδι...

δημιουργία: επεξεργασία: Ν.Τσάντας

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Αλγόριθμοι Προσέγγισης για NP-Δύσκολα Προβλήματα

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Προσεγγιστικοί Αλγόριθμοι

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά].

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

Υπολογιστική Πολυπλοκότητα

Ασυμπτωτικός Συμβολισμός

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

Άπληστοι Αλγόριθμοι. Επιμέλεια διαφανειών: Δ. Φωτάκης Τροποποιήσεις: Α. Παγουρτζής. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

υναμικός Προγραμματισμός

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Λεξικό, Union Find. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Δυναμικός Προγραμματισμός

Δεύτερο πακέτο ασκήσεων

υναμικός Προγραμματισμός

Λεξικό, Union Find. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Ασυμπτωτικός Συμβολισμός

ιακριτές Μέθοδοι για την Επιστήμη των Υπολογιστών

Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής

Λεξικό, Union Find. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

υναμικός Προγραμματισμός

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΕΡΓΑΛΕΙΑ ΙΟΙΚΗΣΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΜΑΘΗΜΑ: ΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Για τις λύσεις των προβλημάτων υπάρχει τρόπος εκτίμησης της επίδοσης (performance) και της αποδοτικότητας (efficiency). Ερωτήματα για την επίδοση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Υπολογιστική Πολυπλοκότητα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Πανεπιστήμιο Πατρών Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών. Διάλεξη 11

EΦΑΡΜΟΓΕΣ ΤΗΣ ΨΗΦΙΑΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΩΝ. Γραµµική Εκτίµηση Τυχαίων Σηµάτων

ΜΕΓΙΣΤΙΚΟΣ ΤΕΛΕΣΤΗΣ 18 Σεπτεμβρίου 2014

Transcript:

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο

Συστήματα με Ιδιοτελείς (και Ανταγωνιστικούς) Χρήστες Συνιστώσες ενεργούν αυτόνομα και ιδιοτελώς με κριτήριο τη βελτιστοποίηση «ατομικών» αντικειμενικών στόχων. Κλασσικά παραδείγματα: ρομολόγηση κυκλοφορίας σε δίκτυα: congestion games. Cost sharing. Social choice. Combinatorial auctions & sponsored search auctions. Συμπεριφορά συστήματος δεν συνάγεται τόσο από χαρακτηριστικά συνιστωσών, αλλά κυρίως από αλληλεπίδραση συνιστωσών. Για αυτό δεν είναι εύκολο να προβλεφθεί. Πρόκληση: κατανόηση και εξαγωγή επιθυμητής συμπεριφοράς. Εστιάζουμε σε παίγνια συμφόρησης (congestion games). Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 2

Μονόδρομος Ύποπτου Συλλαμβάνεται ύποπτος για μεγάλη ληστεία. ενυπάρχουνεπαρκήστοιχεία! Ομολογεί: 5 χρόνια φυλακή. εν ομολογεί: 1 χρόνο φυλακή. Ο ύποπτος δεν ομολογεί. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 3

ίλημμα Υπόπτων Συλλαμβάνονται δύο συνεργάτες για μεγάλη ληστεία. Κρατούνται σε χωριστά κελιά χωρίς επικοινωνία. Ομολογεί Α εν ομολογεί Α Ομολογεί Β 5, 5 15, 0 εν ομολογεί Β 0, 15 1, 1 Αμφότεροι οι ύποπτοι ομολογούν! Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 4

Θεωρία Παιγνίων Μελετά συμπεριφορά αυτόνομων οντοτήτων που δρουν ιδιοτελώς με στόχο βελτιστοποίηση ατομικών στόχων. Λελογισμένη συμπεριφορά. Στρατηγική συμπεριφορά. Εργαλείο για μελέτη συστημάτων με ιδιοτελείς χρήστες. Παίγνια συμφόρησης: ανταγωνιστική ανάθεση πόρων. Περιοχή εφαρμογής (πολυπλοκότητα υπολογισμού σημείων ισορροπίας). Αν υπερ-υπολογιστής δεν υπολογίζει σημείο ισορροπίας, πως μπορούν οι παίκτες; Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 5

Ανταγωνιστικό Παίγνιο Σύνολο παικτών που ανταγωνίζονται για πόρους. Κάθε παίκτης αποφασίζει μόνο τη δική του στρατηγική. Μοναδικός στόχος: ελαχιστοποίηση ατομικού κόστους. Ατομικό κόστος εξαρτάται από στρατηγικές όλων. Ισορροπία Nash: Κανένας δεν βελτιώνει ατομικό κόστος αλλάζοντας μόνο τη δική του στρατηγική. Nash (1952) απέδειξε ότι πάντα υπάρχει τέτοια ισορροπία (αλλά μπορεί να είναι πεπλεγμένη mixed). Ισορροπία Nash αποτελεί «λύση» του συστήματος: Aν οι παίκτες συμπεριφερθούν στρατηγικά και λελογισμένα και έχουν στη διάθεσή τους πλήρη γνώση και επαρκή χρόνο, τότε καταλήγουν σε μία ισορροπία Nash. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 6

Ισορροπία Nash Ομολογεί Α εν ομολογεί Α Ομολογεί Β 5, 5 15, 0 εν ομολογεί Β 0, 15 1, 1 Ισορροπία Nash δεν βελτιστοποιεί συνολικό αποτέλεσμα. Συμβιβασμός με δεδομένη την έλλειψη συντονισμού. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 7

Μοντέλο Ανάθεσης Πόρων Σύνολο πόρων Ε = { e 1,, e m }. Πόροι: συνδέσεις δικτύου, υπηρεσίες σε υπολογιστικό ή πληροφοριακό σύστημα, αρχεία (ή τμήματα αρχείων) P2P, n χρήστες με απαιτήσεις πρόσβασης σε πόρους. Απαιτήσεις εισάγουν ίδιο (μοναδιαίο) φορτίο. Σ i 2 E σύνολο επιλογών (αμιγών στρατηγικών) παίκτη i. Παίκτης i κάνει επιλογή σ i Σ i. ιάνυσμα επιλογών σ = (σ 1,, σ n ) διαμόρφωση συστήματος. Π.χ. E = {s 1, s 2, s 3, p 1, p 2, p 3 }, n = 3. Σ 1 = { {s 1, p 1 }, {s 2, s 3, p 1 } } Σ 2 = { {s 2, p 2 }, {s 3, s 1, p 2 } } Σ 3 = { {s 3, p 3 }, {s 1, s 2, p 3 }} Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 8

Μοντέλο Ανάθεσης Πόρων «Ποιότητα» πόρου υποβαθμίζεται όσο αυξάνεται φορτίο. Φορτίο (ή συμφόρηση) σ e πόρου e σε διαμόρφωση σ. σ e = #χρηστών που χρησιμοποιούν e στη σ. Αύξουσα συνάρτηση καθυστέρησης (ή κόστους) πόρου e με συμφόρηση x: Καθυστέρηση σε κάθε πόρο αυξάνεται με συμφόρηση! Καθυστέρηση παίκτη i σε διαμορφ. σ: Π.χ. E = {s 1, s 2, s 3, p 1, p 2, p 3 }, n = 3. Σ 1 = { {s 1, p 1 }, {s 2, s 3, p 2 } } Σ 2 = { {s 2, p 2 }, {s 3, s 1, p 3 } } Σ 3 = { {s 3, p 3 }, {s 1, s 2, p 1 }} e E, κόστος e : d e (x) = x Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 9

Παίγνια Συμφόρησης Παίγνιο συμφόρησης Ν : σύνολο n χρηστών (ανταγωνιστικών οντοτήτων) Ε : σύνολο m πόρων διαμοιραζόμενων από χρήστες. Σ i 2 E σύνολο αμιγών στρατηγικών χρήστη i. Σ i = Σ j, i, j: συμμετρικό παίγνιο. Σύνολο στρατηγικών (διαμορφώσεων) σ i συμβολίζει στρατηγική χρήστη i σε διαμόρφωση σ Σ. ιαμόρφωση σ Σ προκαλεί συμφόρηση σ e σε πόρο e Σ. σ e = #χρηστών που χρησιμοποιούν e στη σ: Αύξουσα συνάρτηση καθυστέρησης (ή κόστους) σε πόρο e : Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 10

Ανταγωνιστική Ανάθεση Πόρων Σύγχρονα συστήματα μεγάλης κλίμακας χωρίς κεντρική διαχείριση (π.χ. δίκτυα οδικά, δίκτυα τηλεπικοινωνιακά). Χρήστες δρουν αυτόνομα και ενδιαφέρονται κυρίως για «ατομικό» και όχι «κοινωνικό» κόστος! Χρήστης i επιλέγει αυτόνομα στρατηγική σ i που εξασφαλίζει ελάχιστη ατομική καθυστέρηση (με βάση επιλογές άλλων χρηστών). Που καταλήγει τέτοιο σύστημα; (Αμιγής) ισορροπία Nash [Nash, 52]. ιαμόρφωση σ όπου κανένας χρήστης δεν μπορεί να μειώσει ατομική καθυστέρηση αλλάζοντας στρατηγική. Όχι κατ ανάγκη μοναδική, όχι κατ ανάγκη βέλτιστη. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 11

Παίγνια Συμφόρησης Χρήστες ενδιαφέρονται για καθυστέρηση στρατηγικής τους δεδομένων στρατηγικών υπολοίπων χρηστών. σ i : διαμόρφωση από στρατηγικές χρηστών εκτός του i. Κόστος χρήστη i σε διαμόρφωση σ: Κόστος στρατηγικής p Σ i (χρήστη i) σε διαμόρφωση σ i : Βέλτιστη απόκριση χρήστη i σε διαμόρφωση σ i : στρατηγική p * (σ i ) Σ i με ελάχιστο κόστος. ιαμόρφωση σ είναι αμιγής ισορροπία Nash αν χρήστη i, σ i αποτελεί βέλτιστη απόκριση σε σ i. Κανένας χρήστης δεν μπορεί να μειώσει την ατομική του καθυστέρηση αλλάζοντας τη στρατηγική του. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 12

Παραδείγματα Εφαρμογές Παίγνια συμφόρησης: γενικό μοντέλο πλήθος εφαρμογών! Πόροι: συνδέσεις δικτύου, αρχεία (ή τμήματα αρχείων) P2P, Στρατηγικές: Σύνολα πόρων για ικανοποίηση στόχου. Παραδείγματα: n = 2, δύο «παράλληλοι» πόροι με d 1 (x) = x /2, d 2 (x) = 1+ε. ύο «παράλληλοι» πόροι με d 1 (x) = (x/n) k, d 2 (x) = 1+ε. E = {s 1, s 2, s 3, p 1, p 2, p 3 }, n = 3. Σ 1 = { {s 1, p 1 }, {s 2, s 3, p 2 } } Σ 2 = { {s 2, p 2 }, {s 3, s 1, p 3 } } Σ 3 = { {s 3, p 3 }, {s 1, s 2, p 1 }} e E, κόστος e : d e (x) = x Ισορροπίες: ({s 1, p 1 }, {s 2, p 2 }, {s 3, p 3 }) ({s 2, s 3, p 2 }, {s 3, s 1, p 3 }, {s 1, s 2, p 1 }) Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 13

Βασικά Ερωτήματα Ύπαρξη και δομή αμιγών ισορροπιών Nash για παίγνια συμφόρησης και γενικεύσεις τους. Ταχύτητα σύγκλισης σε αμιγείς ισορροπίες Nash. Υπό ποιες προϋποθέσεις (π.χ. συντονισμός, γνώση, υπολογιστικοί πόροι) χρήστες συγκλίνουν γρήγορα σε ισορροπία Nash; Ποιότητα ισορροπιών Nash σε σχέση με βέλτιστη λύση. Τίμημα αναρχίας, κόστος σταθερότητας. Μέθοδοι βελτίωσης κόστους αναρχίας: διόδια, πολιτικές Stackelberg, Αντίστοιχα ερωτήματα για μη-ατομικά παίγνια συμφόρησης, Μη-ατομικά: άπειρο πλήθος παικτών, κάθε παίκτης ελέγχει απειροελάχιστη κυκλοφορία. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 14

Συνάρτηση υναμικού «Κοινωνικό» κόστος χρηστών: «Εγωιστική» συμπεριφορά μειώνει συνάρτηση δυναμικού: Όταν χρήστης i αλλάζει στρατηγική από p σε p, τότε: δηλ. μεταβολή κόστους χρήστη i = μεταβολή δυναμικού. Ονομάζονται (ακριβείς) συναρτήσεις δυναμικού. σ (αμιγής) ισορροπία Nash ανν σ αποτελεί τοπικό ελάχιστο Φ [Rosenthal, 73]. Πολιτική καλύτερων / βέλτιστων αποκρίσεων οδηγεί σε αμιγή ισορροπία Nash. Υπολογισμός ισορροπίας Nash ελαχιστοποιώντας δυναμικό. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 15

Συνάρτηση υναμικού Ανταγωνιστικό παίγνιο με ακριβή συνάρτηση δυναμικού είναι ισομορφικό με κάποιο παίγνιο συμφόρησης [Monderer and Shapley, 96]. Τι συμβαίνει όταν οι χρήστες έχουν διαφορετικά βάρη; Χρήστες επιβαρύνουν διαφορετικά πόρους (αλλά όλους με ίδιο τρόπο / βάρος). Βάρη χρηστών: Φορτίο πόρου e σε διαμόρφωση σ: Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 16

Παίγνια Συμφόρησης με Βάρη Για γραμμικές συναρτήσεις καθυστέρησης, υπάρχει συνάρτηση δυναμικού που λαμβάνει υπόψη τα βάρη [Fotakis, Kontogiannis, Spirakis, 04]. Όταν χρήστης i αλλάζει στρατηγική από p σε p, τότε: (βάρος i) x(μεταβολή κόστους i) = μεταβολή δυναμικού. Συνάρτηση δυναμικού με βάρη: γενικεύει Rosenthal. Για μη-γραμμικές συναρτήσεις, δεν υπάρχει συνάρτηση δυναμικού και μπορεί ούτε αμιγής ισορροπία Nash [Fotakis, Kontogiannis, Spirakis, 04]. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 17

Ταχύτητα Σύγκλισης Γενικά, μείωση δυναμικού και σύγκλιση σε ισορροπία μπορεί να είναι πολύ αργή: PLS-complete. Γρήγορη συντονισμένη σύγκλιση σε προσεγγιστική ισορροπία για συμμετρικά παίγνια με α-bounded jump, [Chien and Sinclair, 07]. ιαμόρφωση σ είναι ε-ισορροπία αν δεν υπάρχει χρήστης με δυνατότητα σημαντικής βελτίωσης. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 18

Ταχύτητα Σύγκλισης. όπου k οχρήστηςμε μεγαλύτερο ατομικό κόστος στην σ. Ενόσω σόχιε-ισορροπία, κινείται «ανικανοποίητος» χρήστης με μεγαλύτερο ατομικό κόστος στην σ. Αν k «ανικανοποίητος», μείωση δυναμικού κατά: Σύγκλιση σε #βημάτων Αν k «ικανοποιημένος» καικινείταιχρήστηςj, τότε λόγω συμμετρίας και α-bounded jump: Σύγκλιση σε #βημάτων Παρόμοια αποτελέσματα και για άλλα κριτήρια συντονισμού. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 19

Ποιότητα Ισορροπιών Nash Μέτρο αποδοτικότητας διαμόρφωσης σ αποτελεί η συνολική καθυστέρηση των χρηστών: Βέλτιστη διαμόρφωση σ * ελαχιστοποιεί συνολική καθυστέρηση. Συστήματα μικρής κλίμακας με κεντρική διαχείριση (υπολογιστικά συστήματα με λίγους χρήστες), ηβέλτιστηδιαμόρφωσησ * επιβάλλεται στους χρήστες. Συνολική καθυστέρηση: έννοια «κοινωνικού» κόστους. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 20

Τίμημα Αναρχίας [KoutsPapa99] ιαμόρφωση σ * ελάχιστου συνολικού κόστους και διαμόρφωση σ ισορροπία Nash: Υπάρχουν πολλές ισορροπίες, θεωρούμε τη «χειρότερη». Τίμημα Αναρχίας = max{c(σ)/c(σ * )}, με σ ισορροπία Nash. Μέτρο υποβάθμισης απόδοσης λόγω «ανταγωνιστικής» και «εγωιστικής» συμπεριφοράς. Αν Τίμημα Αναρχίας μικρό, τότε ισορροπίες Nash ικανοποιούν και χρήστες και διαχειριστή συστήματος. Θεωρούμε την «καλύτερη» ισορροπία Nash. Τίμημα Σταθερότητας = min{c(σ)/c(σ * )}, με σ ισορροπία Nash. ιαχειριστής προτείνει διαμόρφωση. Αν άλλοι ακολουθήσουν, μεμονωμένος χρήστης δεν έχει καλύτερη επιλογή. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 21

Γραμμικές Συναρτήσεις Θεωρούμε ταυτοτικές συναρτήσεις κόστους d e (x) = x Εύκολη γενίκευση σε γραμμικές συναρτήσεις d e (x) = α e x + b e Π.χ. E = {s 1, s 2, s 3, p 1, p 2, p 3 }, n = 3. Σ 1 = { {s 1, p 1 }, {s 2, s 3, p 2 } } Σ 2 = { {s 2, p 2 }, {s 3, s 1, p 3 } } Σ 3 = { {s 3, p 3 }, {s 1, s 2, p 1 }} Τίμημα αναρχίας 2.5 Κάθε παίγνιο συμφόρησης με γραμμικές συναρτήσεις κόστους, τίμημα αναρχίας 2.5 [Christodoulou, Koutsoupias, 05], [Awerbuch, Azar, Epstein, 05] Αντίστοιχα άνω φράγματα για παίγνια με βάρη, πολυωνυμικές συναρτήσεις κόστους, πεπλεγμένες στρατηγικές. Σημαντικά ισχυρότερο άνω φράγμα για παράλληλους πόρους και extension-parallel nets [Fotakis, 07]. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 22

Γραμμικές Συναρτήσεις Έστω σ ισορροπία Nash και σ * βέλτιστη λύση. Από ορισμούς ισορροπίας Nash και κόστους παικτών: Αθροίζουμε για όλους τους παίκτες και έχουμε το ζητούμενο: Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 23

Μείωση Αναρχίας: Παράδοξο Braess & Network Design Συνολική καθυστέρηση 1.5 Nash ισορροπία αποτελεί βέλτιστη λύση. Νέα εξαιρετικά γρήγορη σύνδεση. Συνολική καθυστέρηση αυξάνεται σε 2 γιατί όλοι χρησιμοποιούν την γρήγορη σύνδεση. Παραδοσιακός σχεδιασμός δεν επαρκεί για πολύπλοκα συστήματα. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 24

Μείωση Αναρχίας: «ιόδια» Μεταβολή συναρτήσεων κόστους προσθέτοντας σταθερό όρο - διόδια: Ισορροπίες με «διόδια», αλλά κοινωνικό κόστος χωρίς! Σημαντική μείωση κόστους αναρχίας. Παράδειγμα με νέες συναρτήσεις κόστους (διόδια ε στους πόρους s 1, s 2, s 3 ): Μείωση κόστους αναρχίας στο 1, αλλά «ιόδια» πρέπει να αναδιανέμονται στους χρήστες (πώς;). Επιβάρυνση παικτών (δεν υπολογίζεται στο κόστος!). Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 25

«ιόδια» σε Παράλληλους Πόρους Στρατηγικές μονοσύνολα (παράλληλοι πόροι) και συναρτήσεις γνήσια αύξουσες: «διόδια» μειώνουν Τίμημα αναρχίας στο 1 [Caragiannis, Kanelopoulos, Kaklamanis, 06]. Έστω «παράλληλοι» πόροι, και σ * βέλτιστη διαμόρφωση. Θεωρούμε ότι για κάθε πόρο e (εύκολη γενίκευση). σ ισορροπία Nash (με «διόδια»): Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 26

Μείωση Αναρχίας: «ιόδια» «ιόδια» γιατίμημααναρχίας2 σε γραμμικά παίγνια συμφόρησης [Caragiannis, Kanelopoulos, Kaklamanis, 06]. Κάτω φράγματα στο Τίμημα αναρχίας με «διόδια» για μη-συμμετρικά παίγνια. Βέλτιστα «διόδια» για συμμετρικά παίγνια σε series-parallel graphs με γνήσια αύξουσες συναρτήσεις κόστους [Fotakis, Spirakis, 07]. Υπάρχουν βέλτιστα «διόδια» για συμμετρικά παίγνια με αύξουσες συναρτήσεις; Τισυμβαίνειότανοιχρήστεςαποτιμούν «χρόνο» και «χρήμα» με διαφορετικό τρόπο. Υπάρχουν βέλτιστα διόδια για μη-ατομικά παίγνια [Fleischer, Jain, Mahdian, 04], [Karakostas, Kolliopoulos, 04]. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 27

Πολιτικές Stackelberg αn χρήστες ακολουθούν οδηγίες «διαχειριστή». Αλτρουιστές, υπάκουοι, πληρώνουν φθηνότερα, Μόνο (1 α)n εγωιστές χρήστες φθάνουν σε ισορροπία Nash. [Korilis, Lazar, Orda, 97], [Roughgarden, 01]. Πως «διαχειριστής» κατευθύνει αλτρουιστές ώστε να ελαχιστοποιηθεί το κόστος της αναρχίας; Τίμημα αναρχίας είναι φθίνουσα συνάρτηση α. ιαφορετικές πολιτικές δίνουν διαφορετικές συναρτήσεις. Σημαντική μείωση κόστους αναρχίας με απλό μοντέλο (π.χ. όχι αλλαγή κόστους, όχι «κρυφές» επιβαρύνσεις). Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 28

Πολιτικές Stackelberg Σημαντική δουλειά για μη-ατομικά παίγνια: [Roughgarden, 01] NP-complete, LLF και Scale για παράλληλους πόρους, ανάλυση LLF. [Swamy, 07] ενισχύει και επεκτείνει [Roughgarden, 01]. [Karakostas, Kolliopoulos, 06] φράγματα για LLF και Scale σε γραμμικά μη-ατομικά παίγνια συμφόρησης. [Kaporis, Spirakis, 06] προσδιορίζουν ελάχιστο α που «επιβάλλει» βέλτιστη λύση. [Sharma, Williamson, 07] προσδιορίζουν ελάχιστο α που εξασφαλίζει βελτίωση. Πολιτικές Stackelberg για ατομικά παίγνια [Fotakis, 07]: Άνω και κάτω φράγματα στο Τιμ. Αναρχ. για γραμμικά παίγνια. Άνω φράγματα για παράλληλους πόρους και γενικές συναρτήσεις κόστους. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 29

Συμπεράσματα Ενεργή ερευνητική κατεύθυνση: Θεωρητική Πληροφορική Αλγόριθμοι και Πολυπλοκότητα. Τεχνητή Νοημοσύνη Agents, P2P, ομή και πολυπλοκότητα ισορροπιών Nash. Ταχύτητα σύγκλισης παικτών σε ισορροπίες Nash. Ανάλυση ιδιοτήτων ισορροπιών Nash (π.χ. Τίμημα Αναρχίας, δικαιοσύνη, ). Μηχανισμοί «προώθησης» ισορροπιών με επιθυμητές ιδιότητες. Βέλτιστος σχεδιασμός δικτύων για ιδιοτελείς ανταγωνιστικές οντότητες. Θεωρία Υπολογισμού (Άνοιξη 2012) Παίγνια Συμφόρησης 30