Παύλος Σ. Εφραιμίδης Έκδοση 05/11/2013
Περιεχόμενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός μαθηματικού μοντέλου Το δίλημμα του φυλακισμένου Σημείο ισορροπίας Nash
Θεωρία Παιγνίων Η θεωρία παιγνίων (game theory) μας βοηθάει στην κατανόηση καταστάσεων στις οποίες αλληλεπιδρούν decision-makers Παίγνιο: Ένα σύνολο παικτών που ανταγωνίζονται με βάση ένα προκαθορισμένο σύνολο κανόνων Οι παίκτες πρέπει να πάρουν αποφάσεις σε συνθήκες συναγωνισμού/ανταγωνισμού λαμβάνοντας υπόψη τις πιθανές κινήσεις των αντιπάλων
Εφαρμογές Η θεωρία παιγνίων μπορεί να εφαρμοστεί σε πολλές καταστάσεις: Εταιρείες που ανταγωνίζονται Πολιτικοί που διεκδικούν ψήφους Ένορκοι που αποφασίζουν για μια ετυμηγορία Ζώα που μάχονται για λεία Παίκτες που συμμετέχουν σε έναν πλειστηριασμό Η εξέλιξη της συμπεριφοράς μεταξύ διδύμων...
Πεδία Εφαρμογής Η θεωρία παιγνίων σχετίζεται ιδιαίτερα με κοινωνικά, πολιτικά και οικονομικά αντικείμενα. Τα τελευταία χρόνια στο χώρο της πληροφορικής ερευνάται η ακόλουθη εφαρμογή της θεωρίας παιγνίων: Έλλειψη συντονισμού κεντρικού ελέγχου
Μοντέλα Η θεωρία παιγνίων περιλαμβάνει ένα σύνολο μοντέλων Το μοντέλο είναι μια αφαίρεση που χρησιμοποιούμε για να κατανοήσουμε πραγματικές καταστάσεις Ένα μοντέλο είναι σημαντικό να είναι απλό, να επικεντρώνεται σε ουσιώδη στοιχεία δεν πρέπει να βασίζεται σε υποθέσεις που απέχουν υπερβολικά πολύ από την πραγματικότητα
Ορθότητα ενός μοντέλου Ένα μοντέλο δεν μπορεί να κριθεί με απόλυτα κριτήρια ως σωστό ή λανθασμένο Η χρησιμότητα ενός μοντέλου καθορίζεται από το σκοπό για τον οποίο χρησιμοποιείται Παράδειγμα: Βέλτιστη διαδρομή Για την απόσταση μεταξύ Ξάνθης και Καβάλας μπορούμε να υποθέσουμε ότι η γη είναι επίπεδη Για την απόσταση Ξάνθης και Μελβούρνης όμως ίσως θα πρέπει να λάβουμε υπόψη τη σφαιρικότητα της γης
Διαδικασία Μοντελοποίησης Τα βασικά βήματα: Μια αρχική ιδέα που σχετίζεται με την αλληλεπίδραση ιθυνόντων Διατύπωση της ιδέας με τη μορφή ενός μοντέλου, συμπεριλαμβάνοντας στο μοντέλο χαρακτηριστικά που φαίνονται σχετικά Το βήμα αυτό είναι και λιγάκι τέχνη: Επιθυμούμε αρκετά γνωρίσματα ώστε το μοντέλο να έχει ουσιαστική σημασία Επιθυμούμε μια όσο γίνεται απλή δομή Ανάλυση του μοντέλου. Κατά την ανάλυση μπορεί να προκύψει πρέπει να γίνουν προσαρμογές στο μοντέλο
Ορθολογική Επιλογή Η θεωρία ορθολογικής επιλογής (rational choice) ουσιαστικά λέει ότι ένας ιθύνοντας (decisionmaker) επιλέγει τον καλύτερη - σύμφωνα με τις προτιμήσεις του ενέργεια που έχει στη διάθεσή του. Ορθολογική επιλογή σε αυτή την περίπτωση σημαίνει ότι ο παίκτης απλά προσπαθεί να βελτιστοποιήσει την επιλογή του με βάση μόνο τις προτιμήσεις του
Παίγνια σε στρατηγική μορφή Ένα παίγνιο σε στρατηγική μορφή αποτελείται από Ένα σύνολο παικτών Για κάθε παίκτη, ένα σύνολο κινήσεων Για κάθε παίκτη, ένα σύνολο προτιμήσεων για κάθε πιθανό προφίλ στρατηγικών Ας ξεκινήσουμε με ένα από τα πιο διάσημα παραδείγματα, ένα παίγνιο σε στρατηγική μορφή: Το δίλημμα του φυλακισμένου
Το δίλημμα του φυλακισμένου (The prisoner s dilemma)
Το δίλημμα του φυλακισμένου Δύο κρατούμενοι κατηγορούνται για κάποια εγκλήματα Οι δύο κατηγορούμενοι είναι συνένοχοι ΟΜΩΣ, οι δικαστικές αρχές έχουν ελλιπή αποδεικτικά στοιχεία χωρίς άλλες αποδείξεις κάθε κρατούμενος θα τιμωρηθεί με 1 χρόνο φυλάκισης εάν αποδειχθούν όλες οι κατηγορίες τότε κάθε κρατούμενος θα φυλακιστεί για 4 χρόνια
Το δίλημμα Οι δικαστικές αρχές προ-φυλακίζουν χωριστά τους δύο κρατούμενους, και καλούν τον καθένα να συνεργαστεί, βεβαιώνοντάς τον ότι εάν συνεργαστεί θα τιμωρηθεί με επιείκεια (δηλαδή -1 χρόνο) Τώρα οι πιθανές εκβάσεις είναι: Κανείς δε συνεργάζεται, και τιμωρείται ο καθένας με ένα χρόνο φυλάκιση Και οι δύο συνεργάζονται, και τιμωρούνται και οι δύο με 3 χρόνια Ένας συνεργάζεται και ένας δε συνεργάζεται: Αυτός που συνεργάζεται παίρνει 0 χρόνια, δηλαδή απαλλάσσεται Αυτός που δε συνεργάζεται τιμωρείται με το μέγιστο της ποινής, δηλαδή 4 χρόνια
Οι δυνατές στρατηγικές (Strategies) για κάθε φυλακισμένο Ο κρατούμενος μπορεί είτε να συνεργαστεί με τις αρχές (να προδώσει δηλαδή) και να καταθέσει εναντίον του συνεργάτη/συνενόχου του να μη συνεργαστεί με τις αρχές
Το δίλημμα του φυλακισμένου Δύο κρατούμενοι Είναι συνένοχοι Οι δικαστικές αρχές έχουν ελλιπή αποδεικτικά στοιχεία Θα μιλήσεις!! Να μιλήσω ; Να μη μιλήσω ; Προλαβαίνω να διαβάσω θεωρία παιγνίων ;
Το δίλημμα ως παίγνιο Πολυπλοκότητα: Οι πιθανές στρατηγικές είναι 2 για κάθε παίκτη και επομένως η υπολογιστική πολυπλοκότητα του προβλήματος είναι τετριμμένη: 4 συνολικά σενάρια Πρόβλημα: Το πρόβλημα είναι πως να επιλέξει την καλύτερη δυνατή στρατηγική; Συνεργασία; Είναι σαφές ότι μία ικανοποιητική λύση και για τους δύο κρατούμενους είναι το (1,1), δηλαδή να μη συνεργαστεί κανείς ΌΜΩΣ, κάθε παίκτης αποφασίζει μόνος του!
Το δίλημμα του φυλακισμένου ως παίγνιο σε στρατηγική μορφή B Συνεργάζεται με τις αρχές (Προδίδει) B Δεν συνεργάζεται A Συνεργάζεται με τις αρχές (Προδίδει) 3, 3 0, 4 A Δεν συνεργάζεται 4, 0 1, 1 Τα έτη φυλάκισης για κάθε παίκτη για κάθε πιθανή εκδοχή του παιγνίου.
Συνάρτηση Απόδοσης για το δίλημμα του φυλακισμένου Για τον κρατούμενο-παίκτη Α: 1η Περίπτωση: Έστω ότι ο Β δε συνεργάζεται με τις αρχές Εάν δε συνεργαστώ και εγώ, παίρνω 1 χρόνο Εάν εγώ συνεργαστώ, παίρνω 0 (0 < 1) χρόνια 2η Περίπτωση: Έστω ότι ο Β συνεργάζεται με τις αρχές Εάν δε συνεργαστώ, παίρνω 4 χρόνια Εάν εγώ συνεργαστώ και εγώ, παίρνω 3 (3 < 4) χρόνια Στο παραπάνω παράδειγμα η συνάρτηση απόδοσης (utility function) δίνει το «κόστος» που θα πρέπει να πληρώσει ο παίκτης και επομένως ο «ορθολογικός στόχος» του παίκτη είναι να την ελαχιστοποιήσει
Ορθολογική Συμπεριφορά (Rational Behaviour) Θεωρούμε ότι οι παίκτες έχουν «ορθολογική συμπεριφορά»: Κάθε παίκτης επιλέγει μία βέλτιστη κίνησή του με βάση τις προτιμήσεις (preferences) που έχει. Ανεξάρτητα από τη φύση των προτιμήσεων του παίκτη σε ένα παίγνιο, συμπεριφέρεται ορθολογικά με την έννοια ότι προσπαθεί να ικανοποιήσει τις προτιμήσεις αυτές. Συνήθως οι προτιμήσεις των παικτών δίνονται με τη μορφή συναρτήσεων απόδοσης (utility functions ή payoff functions) ή ενός πίνακα (matrix game)
Το δίλημμα του φυλακισμένου Α 1η Περίπτωση: Έστω ότι ο Β δε συνεργάζεται με τις αρχές Εάν δε συνεργαστώ και εγώ, παίρνω 1 χρόνο Εάν εγώ συνεργαστώ, παίρνω 0 (0 < 1) χρόνια 2η Περίπτωση: Έστω ότι ο Β συνεργάζεται με τις αρχές Εάν δε συνεργαστώ, παίρνω 4 χρόνια Εάν εγώ συνεργαστώ και εγώ, παίρνω 3 (3 < 4) χρόνια? Δηλαδή, με συμφέρει ούτως ή άλλως να συνεργαστώ!!;;
Κυριαρχούμενη στρατηγική Κυριαρχούμενη στρατηγική Αυστηρά Κυριαρχούμενη στρατηγική Δίδαγμα 1: Δεν έχει νόημα ο παίκτης να επιλέξει μια αυστηρά κυριαρχούμενη στρατηγική
Λύση του παιγνίου
Λύση του παιγνίου Ο φυλακισμένος, σκεπτόμενος ορθολογικά, θα πρέπει να συνεργαστεί με τις αρχές και να προδώσει τον άλλο φυλακισμένο! Ο άλλος φυλακισμένος θα σκεφτεί με τον ίδιο ακριβώς ορθολογικό τρόπο και θα προδώσει και αυτός. Αποτέλεσμα: Οι δύο φυλακισμένοι θα πάρουν από 3 χρόνια φυλακής ο καθένας! Μια πολύ κακή λύση (από την μεριά των φυλακισμένων). Δίδαγμα 2: Οι ορθολογικές επιλογές μπορεί να οδηγήσουν σε κακές εκβάσεις.
Να προδίδουμε πάντοτε; Το γεγονός ότι σύμφωνα με τη λύση πρέπει να συνεργαστεί ο φυλακισμένο την επιστημονική κοινότητα Ίσως, εάν υπάρχει η έννοια της μνήμης, της συνέχειας κτλ. να μπορεί να φερθεί πιο αλτρουϊστικά Τι θα συμβεί λοιπόν εάν παίξουμε το παιχνίδι αρκετές στη σειρά;
Τουρνουά του Axelrod Στο τέλος της δεκαετίας του 1970, ο Axelrod (Πολιτικές Επιστήμες στο Πανεπιστήμιο του Michigan), κάλεσε οικονομολόγους, ψυχολόγους, μαθηματικούς και κοινωνιολόγους να υποβάλλουν λύση (με τη μορφή κώδικα) για το Δίλημμα του Φυλακισμένου
Τουρνουά του Axelrod 14 συμμετοχές Έπαιξαν όλοι εναντίον όλων Νικητής: tit-for-tat (Anatol Rapoport) Στο πρώτο γύρω: δεν μιλάω Σε κάθε επόμενο γύρω: ανταποδίδω Ανακοινώνονται τα αποτελέσματα και προκηρύσσεται νέος διαγωνισμός: 62 συμμετοχές Νικητής: Και πάλι το tit-for-tat που υπέβαλλε πάλι ο Rapoport
Τουρνουά του Axelrod (2) Ο Axelrod χρησιμοποίησε τις στρατηγικές του δεύτερου διαγωνισμού για ένα evolutionary τουρνουά Στρατηγικές που αποδίδουν καλά αναπαράγονται ταχύτερα Πιθανόν έτσι στρατηγικές που αρχικά τα καταφέρνουν καλά, να μην αποδίδουν στη συνέχεια διότι θα έχουν εξαλειφθεί οι στρατηγικές έναντι των οποίων υπερίσχυαν Μετά από ένα μεγάλο πλήθος γενεών, νικητής (πολυπληθέστερη ομάδα) ήταν η στρατηγική: Και πάλι το tit-for-tat!!
Ισορροπία Nash (Nash Equilibrium)
Ενέργειες των Παικτών Ποιες ενέργειες/κινήσεις επιλέγουν οι παίκτες σε ένα παίγνιο; Υποθέσαμε ότι οι παίκτες είναι ορθολογικοί και επιλέγει ο καθένας το καλύτερο σύμφωνα με τις προτιμήσεις του Όμως η έκβαση του παιγνίου για κάθε παίκτη εξαρτάται από τις επιλογές όλων των παικτών Επομένως ο ορθολογικός παίκτης πρέπει να λάβει υπόψη του και τι θα επιλέξουν οι υπόλοιποι παίκτες
«Λύση» ενός παιγνίου Ποιες κινήσεις επιλέγουν οι παίκτες ενός παιγνίου; Μπορούμε να υποθέσουμε ότι οι παίκτες, ως ορθολογικές οντότητες, επιλέγουν την καλύτερη δυνατή κίνηση ο καθένας Σε ένα παίγνιο όμως, η καλύτερη κίνηση για οποιοδήποτε παίκτη εξαρτάται από τις κινήσεις των υπολοίπων παικτών Επομένως ο παίκτης θα πρέπει να έχει μία εκτίμηση (belief) για τις κινήσεις των άλλων παικτών
Ισορροπία Nash (Nash Equilibrium) Μια ισορροπία Nash είναι μια κατάσταση του παιγνίου στην οποία κανένας παίκτης δεν μπορεί να βελτιώσει τη θέση του επιλέγοντας μια άλλη κίνηση, με την προϋπόθεση ότι όλοι οι υπόλοιποι παίκτες δεν θα αλλάξουν την κίνησή τους. Η ισορροπία Nash και οι παραλλαγές της είναι η δημοφιλέστερη έννοια λύσης παιγνίων.
Συμβολισμοί - Ορολογία στρατηγική αγνή στρατηγική (pure strategy): Ορίζει ντετερμινιστικά τη συμπεριφορά του παίκτη για κάθε ενέργεια που θα πρέπει να κάνει Πχ: Το δίλημμα του κρατούμενου μικτή στρατηγική (mixed strategy): Μια κατανομή πιθανότητας πάνω στις κινήσεις του παίκτη. Πχ. Πέτρα-ψαλίδι-χαρτί προφίλ ή περίγραμμα στρατηγικών α (profile): ένα διάνυσμα που καθορίζει μια στρατηγική για κάθε παίκτη προφίλ ή περίγραμμα μικτών στρατηγικών: ένα διάνυσμα που καθορίζει μια μικτή στρατηγική για κάθε παίκτη α -i :δεδομένου ενός προφίλ α συμβολίζουμε α -i το προφίλ με τις κινήσεις όλων των παικτών εκτός του παίκτη i όπως στο προφίλ a
Ισορροπία Nash (Nash Equilibrium) Χρησιμοποιώντας την έννοια του προφίλ ενεργειών ο ορισμός της ισορροπίας Nash είναι: Μια ισορροπία Nash είναι ένα προφίλ ενεργειών α* με την ιδιότητα ότι κανένας παίκτης δεν βελτιώνει τη θέση του επιλέγοντας μια ενέργεια διαφορετική από αυτή στο προφίλ α*, με δεδομένο ότι οι υπόλοιποι παίκτες δεν θα αλλάξουν την κίνησή τους, δηλαδή το a -i παραμένει σταθερό.
Εύρεση ισορροπίας Nash Εάν το πλήθος των παικτών και των κινήσεων είναι πολύ περιορισμένο τότε είναι δυνατό να εξετάσουμε όλα τα πιθανά προφίλ (brute force search) από την οπτική γωνία κάθε παίκτη για να βρούμε τις pure ισορροπίες Nash. Πολλές φορές είναι πιο αποτελεσματικό να χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης αντίδρασης.
Συνάρτηση Βέλτιστης Απόκρισης (Best Response Function)
Συναρτήσεις βέλτιστης απόκρισης Δεδομένου ενός προφίλ α -i η συνάρτηση βέλτιστης απόκρισης του παίκτη i δίνει το σύνολο των κινήσεων του παίκτη που επιτυγχάνουν το καλύτερο δυνατό αποτέλεσμα για αυτόν
Ισορροπία Nash και βέλτιστη απόκριση Χρησιμοποιώντας την έννοια του προφίλ ενεργειών μπορούμε να επαναδιατυπώσουμε τον ορισμό της ισορροπίας Nash: Ένα προφίλ κινήσεων α* είναι μια ισορροπία Nash εάν η ενέργεια κάθε παίκτη i στο προφίλ είναι η βέλτιστη απόκριση στο προφίλ α -i των υπολοίπων παικτών Heuristic: Μπορούμε να χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης απόκρισης για να αναζητήσουμε ισορροπίες Nash (ο αλγόριθμος αυτός δεν είναι απαραίτητα πολυωνυμικού χρόνου)
Παράδειγμα 39.1: Μια σχέση συνεργασίας Osborne, Ενότητα 2.8, Παράδειγμα 39.1 Δύο άτομα έχουν μια σχέση συνεργασίας, πχ. ένα κοινό project Συγκεκριμένα κάθε παίκτης προσφέρει έργο α i Η απόδοση του παίκτη i είναι α i (c+α j -α i ), όπου c > 0 είναι μια σταθερά
παράδειγμα 39.1 κάθε παίκτης έχει ένα άπειρο πλήθος κινήσεων. Επομένως δεν μπορούμε να χρησιμοποιήσουμε την αναπαράσταση με πίνακα θα χρησιμοποιήσουμε τις συναρτήσεις βέλτιστης απόκρισης Δεδομένου του α j η βέλτιστη απόκριση του α i ποια είναι;
παράδειγμα 39.1 Το παίγνιο Δύο παίκτες i=1, 2 Κινήσεις κάθε παίκτη: Η προσπάθεια που θα καταβάλει για την κοινή εργασία Προτιμήσεις κάθε παίκτη i: u i =a i (c+a j -a i ) Μελέτη του παιγνίου: Επιλογή της έννοιας λύσης: Nash equilibrum Υπάρχουν ένα ή περισσότερα; Ποιο ή ποια είναι; Υπάρχουν λύσεις με μεγαλύτερη απόδοση από το NE (σε αυτό το παίγνιο);
παράδειγμα 39.1: οι συναρτήσεις βέλτιστης απόκρισης
παράδειγμα: συνεισφορά σε δημόσιο αγαθό (public good) δύο παίκτες i = 1, 2 αποφασίζουν εάν και πόσο θα συνεισφέρουν σε ένα δημόσιο αγαθό παίκτης i: έχει περιουσία (wealth) w i συνεισφέρει c i : 0 c i w i συνάρτηση απόδοσης: v i (c 1 + c 2 ) + w i c i και δεδομένου ότι w i είναι σταθερό, μπορούμε να θεωρήσουμε ως συνάρτηση απόδοσης: u i (c 1, c 2 ) = v i (c 1 + c 2 ) c i (παράδειγμα ενότητας 2.8.4, βιβλίο Osborne)
συνάρτηση βέλτιστης απόκρισης
συναρτήσεις βέλτιστης απόκρισης
Κυριαρχούμενες Ενέργειες Αυστηρή Κυριαρχία (Strict Domination) Σε στρατηγικό παίγνιο μια στρατηγική α2 i κυριαρχεί επί της στρατηγικής α1 i, εάν για κάθε προφίλ α -i, u i (α2 i,α -i ) > u i (α1 i,α -i ) Ασθενής Κυριαρχία (Weak Domination) Σε στρατηγικό παίγνιο μια στρατηγική α2 i κυριαρχεί επί της στρατηγικής α1 i, εάν για κάθε προφίλ α -i, u i (α2 i,α -i ) u i (α1 i,α -i ) και υπάρχει ένα τουλάχιστον προφίλ α -i για το οποίο: u i (α2 i,α -i ) > u i (α1 i,α -i )
Κυρίαρχη Στρατηγική Κυρίαρχη στρατηγική (dominant strategy) Μια στρατηγική ενός παίκτη είναι κυρίαρχη στρατηγική εάν επιτυγχάνει το καλύτερο δυνατό (για κάθε περίπτωση) payoff ανεξαρτήτως από τις κινήσεις των υπολοίπων παικτών. Βέλτιστη Απόκριση vs. Κυρίαρχη Στρατηγική: Η Βέλτιστη απόκριση αφορά συγκεκριμένο προφίλ
Συμμετρικό Παίγνιο (Symmetric Game) Συμμετρικό Παίγνιο μεταξύ δύο παικτών: Οι παίκτες έχουν τις ίδιες κινήσεις και για τις αποδόσεις των παικτών ισχύει: u 1 (a 1,a 2 ) = u 2 (a 2,a 1 ) για κάθε πιθανό προφίλ α=(a 1,a 2 ) Συμμετρική Ισορροπία Nash: σε στρατηγικό παίγνιο όλοι οι παίκτες έχουν τις ίδιες κινήσεις, ένα προφίλ α* είναι μία συμμετρική ισορροπία Nash εάν είναι σημείο ισορροπίας Nash και επιπλέον το α i * να είναι ίδιο για κάθε παίκτη i (όλοι οι παίκτες επιλέγουν την ίδια κίνηση).
Τι είναι λοιπόν η θεωρία παιγνίων
Τι είναι λοιπόν η θεωρία παιγνίων Η θεωρία παιγνίων μελετά την αλληλεπίδραση (ανταγωνισμό, συνεργασία κτλ.) μεταξύ ανεξάρτητων ορθολογικών (rational) οντοτήτων χρησιμοποιεί μαθηματικά μοντέλα για την μοντελοποίηση των προβλημάτων υπάρχει και το εμπειρικό/πρακτικό μέρος: experimental game theory βρίσκει εφαρμογή εδώ και αρκετά χρόνια στην Οικονομική Θεωρία τα τελευταία χρόνια αναπτύσσεται ένας ενδιαφέρον συνδυασμός θεωρίας παιγνίων και επιστήμης υπολογιστών αφορμή: η ανάπτυξη δικτυωμένων/κατανεμημένων συστημάτων με κύριο παράδειγμα το διαδίκτυο
Εφαρμογές της Θεωρίας Παιγνίων εταιρείες που ανταγωνίζονται υποψήφιοι πολιτικοί που ανταγωνίζονται για ψήφους υποψήφιοι αγοραστές ανταγωνίζονται σε έναν πλειστηριασμό Βιολογία/ διαδικασίες φυσικής επιλογής Εφαρμογές στην Επιστήμη Υπολογιστών
Θεωρία Παιγνίων και Επιστήμη Υπολογιστών Αλγόριθμοι για Επίλυση Παιγνίων Υπάρχει λύση για ένα παίγνιο; Μπορούμε να την υπολογίσουμε; Τι Πολυπλοκότητα έχει; Είναι πολλές οι λύσεις; Μπορούμε να βρούμε την καλύτερη ή μια αρκετά καλή; Μοντελοποίηση προβλημάτων της Επιστήμης Υπολογιστών ως παίγνια: Παγκόσμιος Ιστός Διαδίκτυο και γενικότερα κάθε Δίκτυο Agents, Κατανεμημένα συστήματα Κρυπτογραφία Επίσης ασφάλεια, εξοικονόμηση ενέργειας,
Πηγές/Αναφορές Κεφάλαια 1 και 2: An introduction to Game Theory, M. Osborne, Oxford University Press, 2004 Σημειώσεις του μαθήματος «Οικονομική Θεωρία και Αλγόριθμοι» του τμ. Μηχ. ΗΥ και Πληροφορικής, Παν/μιο Πατρών http://www.ceid.upatras.gr/courses/game_theory/ Game Theory, Video Course, Benjamin Polak, Yale http://academicearth.org/courses/game-theory