Αλληλεπιδράσεις πρακτόρων. Πώς σχεδιάζουμε κοινωνίες πρακτόρων;

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Αλληλεπιδράσεις πρακτόρων. Πώς σχεδιάζουμε κοινωνίες πρακτόρων;"

Transcript

1 Αλληλεπιδράσεις πρακτόρων Πώς σχεδιάζουμε κοινωνίες πρακτόρων;

2 Δεν υπάρχει σύστημα ενός πράκτορα! πράκτορας οργανωσιακή σχέση πρακτόρων αλληλεπίδραση πρακτόρων σφαίρα επιρροής πράκτορα περιβάλλον 2

3 Δεν υπάρχει σύστημα ενός πράκτορα! Κάθε σύστημα περιέχει ένα πλήθος πρακτόρων που αλληλεπιδρούν είτε άμεσα επικοινωνώντας, είτε έμμεσα με τις ενέργειές τους στο περιβάλλον. Κάθε πράκτορας αλληλεπιδρά με το περιβάλλον, δηλαδή μπορεί με τις ενέργειές του να το αλλάζει. Άρα κάθε πράκτορας έχει μια σφαίρα επιρροής στο περιβάλλον, δηλαδή το τμήμα εκείνο του περιβάλλοντος το οποίο μπορεί να αλλάζει. Όπου δύο ή περισσότεροι πράκτορες έχουν κοινή σφαίρα επιρροής, τότε έχουν και κάποια σχέση αλληλοεξάρτησης (π.χ. Δύο πράκτορες ελέγχουν αν μια πόρτα είναι κλειστή/ανοιχτή, αλλά επειδή η πόρτα μπορεί να είναι μόνο σε μια κατάσταση κάθε φορά, πρέπει να ρυθμιστεί η συμπεριφορά τους έτσι ώστε να μην έρχονται σε σύγκρουση, ή όποτε έρχονται σε σύγκρουση αυτή να επιλύεται με κάποιο τρόπο). Οι πράκτορες μπορεί να είναι οργανωμένοι με διάφορους τρόπους οπότε υπάρχουν μεταξύ τους διάφορες οργανωσιακές σχέσεις, π.χ. Ανήκουν στην ίδια ομάδα, κάποιος είναι αρχηγός ομάδας κλπ. 3

4 Το ζητούμενο σε MAS Αυτό που μας ενδιαφέρει να χαρακτηρίσουμε, όταν έχουμε συστήματα πολλών πρακτόρων, είναι η συμπεριφορά κάθε πράκτορα λαμβάνοντας υπόψη την συνύπαρξή του με άλλους, δηλαδή... Όταν ένας πράκτορας πρέπει να επιλέξει ποια ενέργεια να εκτελέσει στο περιβάλλον του έτσι ώστε να πετύχει το στόχο του, καιότανοιστόχοιτων άλλων πρακτόρων που συνυπάρχουν είναι διαφορετικοί (και πολύ πιθανό αντικρουόμενοι), πώς επιλέγει τελικά ο πράκτορας τι να κάνει; Μια απάντηση είναι μέσω συναρτήσεων χρησιμότητας. Αλλά επειδή το περιβάλλον είναι ανοιχτό, η χρησιμότητα κάθε κατάστασης μπορεί να μην είναι εκ των προτέρων γνωστή. Πρέπει λοιπόν ο πράκτορας να υπολογίζει δυναμικά τι «συμφέρει» να κάνει σε κάθε χρονική στιγμή που καλείται να αποφασίσει ποια ενέργεια να εκτελέσει. 4

5 Οι προτιμήσεις ενός πράκτορα Κάθε πράκτορας έχει τις προτιμήσεις του για το πώς θέλει να είναι το περιβάλλον του (αυτές μπορεί να προέρχονται από τον χρήστη του). Ω={ω 1, ω 2,...} είναι καταστάσεις ή αποτελέσματα ενός παιχνιδιού, πάνω στις οποίες ο πράκτορας έχει προτιμήσεις. u i : Ω R μια συνάρτηση χρησιμότητας που εκφράζει τις προτιμήσεις του πράκτορα i. Έτσι, u i (ω 1 ) u i (ω 2 ) σημαίνει ότι ο πράκτορας i προτιμά την κατάσταση (ή το αποτέλεσμα) ω 1 τουλάχιστον όσο το ω 2. Ή μπορούμε να γράφουμε ω1 f i ω2. Παρομοίως η έκφραση ω1 f i ω2 σημαίνει ότι ο πράκτορας i αυστηρά προτιμά το αποτέλεσμα ω 1 από το ω 2. Η σχέση f i ορίζει μια μερική διάταξη στο Ω που είναι o Ανακλαστική ω Ω ωf iω o Μεταβατική ωf iω and ω fiω ωfiω o Συγκρίσιμη ω, ω Ω ( ωf iω or ω fiω ) Η αυστηρή προτίμηση είναι μη ανακλαστική, μεταβατική και συγκρίσιμη και ορίζει μια ολική διάταξη στο Ω. 5

6 Προτιμήσεις και χρησιμότητα Υπάρχει μία τάση να αντιλαμβανόμαστε τη χρησιμότητα με οικονομικούς όρους, δηλαδή όσο περισσότερα «χρήματα» αξίζει μία κατάσταση τόσο πιο χρήσιμη είναι. Αλλά αυτό δεν ισχύει πάντα. Παράδειγμα: ο πράκτορας Α έχει $500 εκατομμύρια και ο πράκτορας Β δεν έχει τίποτα. Ένας γενναιόδωρος πράκτορας Γ έχει $1 εκατομμύριο να δωρίσει. Αν το δωρίσει στον Α θα προκύψει μία κατάσταση στην οποία ο Α έχει $501 εκατομμύρια και ο Β τίποτα. Υπάρχει μια μικρή αύξηση στη χρησιμότητα για τον Α (αλλά είναι μικρή γιατί ό,τι μπορείς να κάνεις με $501 εκατομμύρια μπορείς να το κάνεις λίγο-πολύ και με $500 εκατομμύρια). Αν το δωρίσει στον Β θα προκύψει μια κατάσταση στην οποία ο Α έχει $500 εκατομμύρια και ο Β $1 εκατομμύριο. Αυτή η κατάσταση παρουσιάζει πολύ μεγάλη αύξηση της χρησιμότητας από τη σκοπιά του Β. Οι συναρτήσεις χρησιμότητας είναι απλά ένας τρόπος για να αναπαρίστανται οι προτιμήσεις ενός πράκτορα. Δεν μεταφράζονται κατ ανάγκη σε οικονομικούς όρους. 6

7 Πολυπρακτορικές συναναστροφές (1) Υποθέτουμε ότι έχουμε δύο πράκτορες i και j που συνυπάρχουν σε ένα περιβάλλον. Οι πράκτορες θα εκτελούν ταυτόχρονα από μια ενέργεια στο περιβάλλον και θα προκύπτει ένα νέο αποτέλεσμα (ή μια νέα κατάσταση) μέλος του Ω. Το πραγματικό αποτέλεσμα που θα προκύπτει θα εξαρτάται από το συνδυασμό των ενεργειών, δηλαδή και οι δύο πράκτορες έχουν επιρροή στο αποτέλεσμα. Υποθέτουμε ότι οι πράκτορες δεν έχουν την επιλογή να παραμείνουν αδρανείς, δηλαδή να μην εκτελέσουν καμία ενέργεια, και ότι ο καθένας δεν γνωρίζει τι ενέργεια εκτελεί ο άλλος. Υποθέτουμε ότι οι μόνες ενέργειες που μπορεί να εκτελέσει κάθε πράκτορας είναι C (cooperate, συνεργασία) και D (defect, μη-συνεργασία). Οπότε Ac={C, D} είναι το κοινό ρεπερτόριο ενεργειών για τους δύο πράκτορες. Η κατάσταση του περιβάλλοντος καθορίζεται από μία συνάρτηση μετατροπής τ : { Ac { Ac Ω agent i agent j 7

8 8 Πολυπρακτορικές συναναστροφές (2) Παράδειγμα ορισμού συνάρτησης μετατροπής περιβάλλοντος: o τ(d,d)=ω 1, τ(d,c)=ω 2, τ(c,d)=ω 3, τ(c,c)=ω 4 δηλαδή κάθε συνδυασμός ενεργειών των πρακτόρων οδηγεί σε διαφορετικό αποτέλεσμα. Αυτό είναι ένα περιβάλλον ευαίσθητο στις ενέργειες κάθε πράκτορα. o τ(d,d)=ω 1, τ(d,c)=ω 1, τ(c,d)=ω 1, τ(c,c)=ω 1 για περιβάλλον στο οποίο κανένας πράκτορας δεν έχει καμία επιρροή, το αποτέλεσμα είναι το ίδιο ό,τι κι αν κάνουν οι πράκτορες. o τ(d,d)=ω 1, τ(d,c)=ω 2, τ(c,d)=ω 1, τ(c,c)=ω 2 για περιβάλλον που είναι ευαίσθητο στις ενέργειες μόνο ενός πράκτορα, εδώ του j. Ας υποθέσουμε ότι έχουμε το περιβάλλον που είναι ευαίσθητο και στους δύο πράκτορες και προτιμήσεις των πρακτόρων που ορίζονται από τις ακόλουθες συναρτήσεις χρησιμότητας: = ω = ω = ω = ω = ω = ω = ω = ω ) ( u ) ( u ) ( u ) ( u ) ( u ) ( u ) ( u ) ( u j j j j i i i i

9 Πολυπρακτορικές συναναστροφές (3) Τότε οι προτιμήσεις του πράκτορα i για τα πιθανά αποτελέσματα είναι C,Cf ic,d fi D,CfiD,D Αν ήσασταν ο πράκτορας i τι θα διαλέγατε να πράξετε, να συνεργαστείτε ή όχι; Στο σενάριο του παραδείγματος ο πράκτορας i προτιμά πάντα όλα τα αποτελέσματα στα οποία συνεργάζεται παρά εκείνα στα οποία δεν συνεργάζεται. Το ίδιο ισχύει και για τον άλλο πράκτορα. Αν και οι δύο πράκτορες ενεργούν ορθολογικά τότε πρέπει το τελικό αποτέλεσμα να είναι C,C. Αν για το ίδιο περιβάλλον οι συναρτήσεις χρησιμότητας των πρακτόρων ορίζονταν ως εξής: u ( ω ) 1 u ( ω3) = u u u i i j j ( ω ) = u 1 ( ω ) = u 2 = u ( ω ) = i i 2 4 ( ω ) = 1 j 4 ( ω ) = j 3 4 ( ω ) = 1 τότε ο πράκτορας i προτιμά όλα τα αποτελέσματα στα οποία δεν συνεργάζεται. Το ίδιο ισχύει και για τον πράκτορα j. Και στα δύο σενάρια που είδαμε οι πράκτορες δεν χρειάζεται να σκεφτούν στρατηγικά: δεν τους ενδιαφέρει τι θα κάνει ο άλλος πράκτορας, η καλύτερη ενέργεια για τον καθένα από αυτούς είναι απόλυτα καλύτερη, δηλαδή δεν εξαρτάται από το τι θα κάνει ο άλλος. Αυτό δεν ισχύει στα περισσότερα ρεαλιστικά περιβάλλοντα. 4 9

10 Κυριαρχία Έστω Ω 1 και Ω 2 υποσύνολα του Ω. Το Ω 1 κυριαρχεί επί του Ω 2 για τον πράκτορα i αν o i προτιμά κάθε αποτέλεσμα του Ω 1 από κάθε αποτέλεσμα του Ω 2, δηλαδή ω1 Ω1, ω2 Ω2 ω1 f i ω2 Με όρους θεωρίας παιγνίων οι ενέργειες, μέλη του συνόλου Ac, λέγονται στρατηγικές. Συμβολίζουμε με s* το σύνολο των αποτελεσμάτων που μπορεί να προκύψουν αν ο πράκτορας i παίξει τη στρατηγική s. Μία στρατηγική s 1 κυριαρχεί (ισχυρά) επί μίας στρατηγικής s 2 αν το σύνολο αποτελεσμάτων s 1 * κυριαρχεί επί του συνόλου αποτελεσμάτων s 2 *. Κυρίαρχη στρατηγική είναι εκείνη η οποία δεν κυριαρχείται από καμία άλλη. Η παρουσία κυρίαρχης στρατηγικής κάνει την λήψη απόφασης για το τι να κάνει ένας πράκτορας ιδιαίτερα εύκολη: ο πράκτορας έχει το καλύτερο δυνατό αποτέλεσμα παίζοντας την κυρίαρχη στρατηγική. Γενικότερα στη λήψη απόφασης για το τι να κάνουμε μπορούμε για κάθε στρατηγική να τη διαγράφουμε αν κυριαρχείται από άλλες στρατηγικές ώστε να απλοποιείται το σύνολο των ενεργειών από τις οποίες έχουμε να επιλέξουμε. Αν μείνουμε με μία μόνο στρατηγική τότε αυτή είναι η κυρίαρχη και μας εγγυάται το καλύτερο δυνατό αποτέλεσμα. Τι γίνεται όμως αν μείνουμε με περισσότερες από μία στρατηγικές; Μπορούμε να συνεχίσουμε διαγράφοντας τις ασθενώς κυριαρχούμενες στρατηγικές. Μια στρατηγική s 1 κυριαρχεί ασθενώς επί μίας στρατηγικής s 2 αν κάθε μέλος του σύνολου αποτελεσμάτων s 1 * προτιμάται τουλάχιστον το ίδιο ή και περισσότερο από κάθε μέλος του συνόλου αποτελεσμάτων s 2 *. Όταν διαγράφουμε ασθενώς κυριαρχούμενες στρατηγικές μπορεί να χάνουμε πιθανά χρήσιμες στρατηγικές (δεν υπάρχει εγγύηση ότι μία ασθενώς κυριαρχούμενη στρατηγική είναι μη-ορθολογική). 10

11 Ισορροπίες Νash Δύο στρατηγικές s 1 και s 2 βρίσκονται σε ισορροπία Nash αν: o Υποθέτοντας ότι ο πράκτορας i παίζει s 1, o πράκτορας j δεν μπορεί να παίξει κάτι καλύτερο από s 2, και o Υποθέτοντας ότι ο πράκτορας j παίζει s 2, ο πράκτορας i δεν μπορεί να παίξει τίποτα καλύτερο από s 1. Η αμοιβαιότητα της ισορροπίας Nash είναι σημαντική γιατι «κλειδώνει» τους πράκτορες σε ένα ζεύγος στρατηγικών: κανείς τους δεν έχει κίνητρο (κάτι να κερδίσει) παρεκκλίνοντας. Η παρουσία ισορροπίας Nash βοηθάει τη λήψη αποφάσεων ενός πράκτορα. Δυστυχώς όμως, όπως αποδεικνύεται στη θεωρία παιγνίων: o Δεν έχουν όλα τα σενάρια αλληλεπίδρασης ισορροπία Nash o Μερικά σενάρια αλληλεπίδρασης έχουν περισσότερες από μια ισορροπίες Nash. 11

12 Ανταγωνιστικές και μηδενικού αθροίσματος αλληλεπιδράσεις Ένα σενάριο αλληλεπίδρασης λέγεται αυστηρά ανταγωνιστικό όταν ένα αποτέλεσμα ω Ω προτιμάται από τον πράκτορα i από οποιοδήποτε άλλο αποτέλεσμα ω, αν και μόνο αν το ω προτιμάται από τον πράκτορα j από το ω, δηλαδή: ω f i ω ω f j ω Στα αυστηρά ανταγωνιστικά σενάρια οι προτιμήσεις των πρακτόρων είναι διαμετρικά αντίθετες: ο καθένας μπορεί να βελτιώσει την κατάστασή του μόνο εις βάρος του άλλου. Οι αλληλεπιδράσεις πρακτόρων όπου για οποιοδήποτε αποτέλεσμα το άθροισμα των χρησιμοτήτων των πρακτόρων είναι μηδέν λέγονται αλληλεπιδράσεις μηδενικού αθροίσματος, δηλαδή: ω Ω ui ( ω ) + u j( ω ) = 0 Κάθε αλληλεπίδραση μηδενικού αθροίσματος είναι αυστηρά ανταγωνιστική. Οι αλληλεπιδράσεις μηδενικού αθροίσματος αντιστοιχούν σε σενάρια όπου δεν είναι δυνατό να υπάρξει συνεργάσιμη συμπεριφορά. Τα κλασικότερα παραδείγματα είναι παιχνίδια όπως το σκάκι ή η ντάμα ή σε οποιαδήποτε κατάσταση που έχει αποτέλεσμα έναν νικητή κι ένα χαμένο. Στον πραγματικό κόσμο είναι δύσκολο να βρεί κανείς αλληλεπιδράσεις μηδενικού αθροίσματος. Αλλά συχνά οι άνθρωποι έχουμε την τάση να αντιμετωπίζουμε κάποιες αλληλεπιδράσεις σαν να ήταν μηδενικού αθροίσματος ενώ υπάρχουν περιθώρια για αμοιβαία ωφέλιμη συνεργασία. 12

13 Το δίλημμα του φυλακισμένου (1) (Prisoner s Dilemma) Δύο άνθρωποι κατηγορούνται μαζί για ένα έγκλημα και κρατούνται σε διαφορετικά κελιά. Δεν έχουν τρόπο να επικοινωνήσουν μεταξύ τους ούτε να συνάψουν οποιαδήποτε συμφωνία. Οι φύλακές λένε και στους δύο την ίδια πληροφορία, ότι Αν ένας από αυτούς ομολογήσει το έγκλημα και ο άλλος όχι τότε αυτός που ομολόγησε θα ελευθερωθεί ενώ ο άλλος θα μείνει φυλακισμένος για 3 χρόνια, και Αν και οι δύο ομολογήσουν το έγκλημα, τότε ο καθένας θα φυλακιστεί για 2 χρόνια. Αν κανένας δεν ομολογήσει το έγκλημα τότε ο καθένας θα φυλακιστεί για 1 χρόνο. Έστω ότι η ομολογία είναι η ενέργεια D και η μη-ομολογία ότι είναι η ενέργεια C. Υπάρχουν τέσσερα διαφορετικά αποτελέσματα, ανάλογα με το αν οι πράκτορες ομολογούν ή όχι. Συνοψίζουμε τα διαφορετικά αποτελέσματα και τη χρησιμότητά τους για κάθε πράκτορα στον πίνακα κέρδους που ακολουθεί: i defects i cooperates j defects j cooperates Η χρησιμότητα ενός αποτελέσματος καθορίζεται με βάση το κριτήριο «όσο λιγότερα χρόνια ποινής τόσο καλύτερα». Οι προτιμήσεις των πρακτόρων είναι: D,C fi C,C fi D,D fi C,D C,D f j C,C f j D,D f j D,C 13

14 Το δίλημμα του φυλακισμένου (2) Ο συλλογισμός ενός πράκτορα, ας πούμε του i προχωρά ως εξής: Ας υποθέσουμε ότι κάνω C. Τότε, αν ο j κάνει επίσης C θα έχουμε και οι δύο κέρδος 3. Αλλά άν ο j κάνει D τότε θα έχω κέρδος 0. Οπότε το μεγαλύτερο κέρδος που εγγυημένα έχω αν κάνω C είναι 0. Ας υποθέσουμε ότι κάνω D. Τότε, αν ο j κάνει C θα έχω κέρδος 5. Αλλά άν ο j κάνει D τότε θα έχω κέρδος 2. Οπότε το μεγαλύτερο κέρδος που εγγυημένα έχω αν κάνω D είναι 2. Οπότε στη χειρότερη περίπτωση αν κάνω C έχω κέρδος 0 και αν κάνω D έχω κέρδος 2. Συνεπώς η ορθολογική επιλογή είναι να κάνω D. Το σενάριο είναι συμμετρικό, δηλαδή και οι δύο πράκτορες μπορεί να κάνουν τον ίδιο συλλογισμό, και τότε, αν και οι δύο είναι ορθολογικοί, θα επιλέξουν και οι δύο να κάνουν D. Η ισορροπία Nash για αυτή την περίπτωση είναι όντως D, D. Όμως είναι αυτό το καλύτερο που μπορούν να κάνουν οι πράκτορες; Αν και οι δύο έκαναν C θα λάμβαναν κέρδος 3! Το πρόβλημα είναι (και γι αυτό λέγεται και δίλημμα) ότι η συνεργασία (να κάνει κανείς C) φαίνεται να είναι αποτέλεσμα ανορθόλογης συμπεριφοράς! 14

15 Δεν είμαστε όλοι Machiavelli Μια προσπάθεια απάντησης στο δίλημμα του φυλακισμένου. Δεν είμαστε όλοι εγωιστές, δεν μας ενδιαφέρει μόνο η μεγιστοποίηση του κέρδους μας, υπάρχουν παραδείγματα πραγματικής αλτρουιστικής συμπεριφοράς στον κόσμο και παραδείγματα αυθόρμητης συνεργασίας. Αλλά... Πολλές φορές στα πραγματικά παραδείγματα υπάρχει μηχανισμός που καθιστά προτιμότερο να συνεργαστούμε παρά όχι (π.χ. Άμεσηήέμμεσητιμωρίαανδεν συνεργαστώ). Πραγματικά παραδείγματα συνεργατικής συμπεριφοράς είναι ευάλωτα σε καταχρήσεις από εκείνους που επιλέγουν D και μεγιστοποιούν το κέρδος τους. Π.χ. Ένα σύστημα μαζικής μεταφοράς στο οποίο καθένας πληρώνει αυθόρμητα το κόμιστρο που πρέπει. 15

16 Ο άλλος φυλακισμένος είναι ο δίδυμος αδελφός μου Μιαακόμαπροσπάθειααπάντησηςστοδίλημματουφυλακισμένου. Οι δύο φυλακισμένοι θα σκεφτούν με τον ίδιο τρόπο και έτσι και οι δύο θα καταλήξουν στο συμπέρασμα ότι η συνεργασία συμφέρει. Αλλά... Τότε δεν έχω το σενάριο του διλήμματος του φυλακισμένου, δεν έχω δύο παίκτες με διαφορετικά συμφέροντα. 16

17 Οι άνθρωποι δεν συμπεριφέρονται λογικά Οι άνθρωποι επιλέγουμε συνεργατική συμπεριφορά όταν δεν πειράζει πολύ το κόστος, π.χ. το να πληρώνουμε το εισιτήριο του λεωφορείου έντιμα, ακόμα κι αν άλλοι καταχρώνται το σύστημα. Αλλά τότε παραδεχόμαστε ότι επιλέγουμε ορθολογικά, δηλαδή δεν συνεργαζόμαστε, όταν το κόστος είναι υψηλό. 17

18 Η απειλή του μέλλοντος Τι θα άλλαζε στο αποτέλεσμα του διλήμματος του φυλακισμένου αν: παιζόταν το παιχνίδι όχι μια φορά, αλλά επαναλαμβανόμενα για έναν αριθμό γύρων; Και κάθε πράκτορας μπορεί να δει τι έκανε ο άλλος στον προηγούμενο γύρο; Τι είναι ορθολογικό να πράξει κάθε πράκτορας υπό αυτές τις συνθήκες; Αν γνωρίζει ένας πράκτορας ότι θα «ξανασυναντήσει» τον αντίπαλο πράκτορα στο μέλλον, τότε το κίνητρό του να κάνει D μειώνεται γιατί: Αν κάνει D στον τρέχοντα γύρο, τότε ο αντίπαλος θα τον τιμωρήσει στον επόμενο γύρο κάνοντας D κι αυτός. Αν κάνει C στον τρέχοντα γύρο, κι ο αντίπαλος δεν ανταποκριθεί το ίδιο, τότε στον επόμενο γύρο θα τιμωρήσει τον αντίπαλο (καιθαανακάμψειτηνόποιααπώλειακέρδους του τρέχοντος γύρου). Υπό αυτές τις συνθήκες, δηλαδή με την υπόθεση ότι η αλληλεπίδραση των πρακτόρων έχει διάρκεια στο χρόνο, η συνεργασία(να κάνει κανείς C) είναι πλέον προτιμότερη (ορθολογική) επιλογή. 18

19 ...αλλά υπάρχει ένα «αλλά»... Έστω ότι οι πράκτορες συμφώνησαν να παίξουν το επαναληπτικό δίλημμα του φυλακισμένου για έναν προκαθορισμένο πεπερασμένο αριθμό γύρων, π.χ Πρέπει καθένας να αποφασίσει από την αρχή τι στρατηγική θα ακολουθήσει. Στον τελευταίο γύρο (τον 100ό) και οι δύο γνωρίζουν ότι δεν θα αλληλεπιδράσουν ξανά στο μέλλον. Με άλλα λόγια, ο τελευταίος γύρος είναι σαν να παίζουν οι πράκτορες μίαφοράμόνοτοδίλημματουφυλακισμένου(όπου είδαμε νωρίτερα ότι η ορθολογική επιλογή είναι D). Έτσι, στον 100ό γύρο και οι δύο πράκτορες (ορθολογικά) θα κάνουν D. Οπότε ο πραγματικός τελικός γύρος του επαναληπτικού παιχνιδιού είναι ο 99ός. Με την ίδια λογική, κι αυτός μπορεί να θεωρηθεί σαν μοναδικός γύρος. Το ίδιο και ο 98ος γύρος, ο 97ος, κλπ. Επαγωγικά συμπεραίνουμε ότι η επαναληπτική εκδοχή του παιχνιδιού, όταν ο αριθμός των γύρων είναι προκαθορισμένος και γνωστός στους δύο πράκτορες, οδηγεί σε κυρίαρχη στρατηγική D, όπως και στην εκδοχή του ενός γύρου. Συμπέρασμα: για να είναι η συνεργασία ορθολογική επιλογή, απαιτείται άπειρος αριθμός γύρων ή πεπερασμένος αριθμός με το ενδεχόμενο οι πράκτορες να ξανασυναντηθούν στο μέλλον (απειλή του μέλλοντος). Ακόμα κι αν ένας συνεργάσιμος πράκτορας, που υποφέρει παίζοντας με έναν μη συνεργάσιμο αντίπαλο, συνολικά θα κερδίσει αν έχει τη δυνατότητα να αλληλεπιδράσει με άλλους συνεργάσιμους πράκτορες: Το δίλημμα του φυλακισμένου σε τουρνουά (Axelrod). 19

20 Το τουρνουά του Axelrod Ο Axelrod είναι πολιτικός επιστήμονας που τον ενδιαφέρει να μελετήσει πώς προκύπτει συνεργασία σε κοινωνίες εγωιστικών πρακτόρων. Το 1980 οργάνωσε τουρνουά στο οποίο πολιτικοί επιστήμονες, ψυχολόγοι, οικονομολόγοι και θεωρητικοί παιγνίωνυπέβαλανέναπρόγραμμαπου έπαιζε το επαναληπτικό δίλημμα του φυλακισμένου. Τα προγράμματα που υποβλήθηκαν κυμαίνονταν από 5 έως 152 γραμμές κώδικα. Κάθε πρόγραμμα γνώριζε την προηγούμενη επιλογή (C ή D) του αντιπάλου του και αποφάσιζε τι να κάνει βασισμένο σε αυτή την πληροφορία. Κάθε πρόγραμμα έπαιζε ενάντια σε κάθε άλλο για 5 παιχνίδια, με 200 γύρους το κάθε παιχνίδι. Νικητής ήταν το πρόγραμμα που κέρδιζε στο σύνολο των παιχνιδιών με όλα τα άλλα προγράμματα. Κάθε πρόγραμμα είχε τη δική του στρατηγική. 20

21 Παραδείγματα στρατηγικής στο τουρνουά του Axelrod ALL-D: η στρατηγικήτου«γερακιού», πάντα κάνε D ό,τι κι αν κάνει ο αντίπαλος (αυτή είναι η ορθολογική επιλογή στο επαναληπτικό παιχνίδι με σταθερό, προκαθορισμένο αριθμό γύρων). RANDOM: αγνόησε ό,τι κι αν έκανε ο αντίπαλος στον προηγούμενο γύρο, επέλεξε C ή D τυχαία, με ίση πιθανότητα. TIT-for-TAT: στον πρώτο γύρο κάνε C. Στον γύρο t > 1 κάνε ό,τι έκανε ο αντίπαλος στο γύρο t-1 (αυτή ήταν και η απλούστερη απαιτώντας 5 γραμμές FORTRAN). TESTER: στον πρώτο γύρο δοκίμασε τον αντίπαλο κάνοντας D. Αν ο αντίπαλος σε τιμωρήσει κάνοντας επίσης D, συνέχισε παίζοντας τη στρατηγική TIT-for-TAT. Αν ο αντίπαλος δεν σε τιμωρήσει, τότε να παίζεις C για δύο γύρους και μετά D, επαναληπτικά. JOSS: όπως η TESTER, αυτή η στρατηγική είναι σχεδιασμένη για να εκμεταλλεύεται «ασθενείς» αντιπάλους. Ουσιαστικά είναι ίδια με την TIT-for-TAT, αλλά 10% του χρόνου αντί να κάνει C, κάνει D. Ποια στρατηγική πιστεύετε ότι απέδωσε καλύτερα; Ποια θα επιλέγατε, με βάση όσα γνωρίζετε μέχρι τώρα από τη θεωρία παιγνίων; 21

22 Αποτελέσματα του τουρνουά του Axelrod Ο νικητής ήταν ο πράκτορας που έπαιζε τη στρατηγική TIT-for-TAT. Αλλά προσοχή πώς ερμηνεύουμε το αποτέλεσμα! Η TIT-for-TAT κέρδισε γιατί λάβαμε υπόψη όλες τις άλλες στρατηγικές που συμμετείχαν. Αν η TIT-for-TAT παιζόταν εναντίον μόνο της ALL-D, τότε θα κέρδιζε η ALL-D. Η TIT-for-TAT κέρδισε γιατί είχε την ευκαιρία να παίξει εναντίον αντιπάλων που είχαν επίσης την τάση να συνεργαστούν. Γι αυτό και το συμπέρασμα ότι η συνεργασία είναι καλή στρατηγική για έναν πράκτορα όταν συνυπάρχει με άλλους που κι εκείνοι έχουν την τάση να συνεργαστούν. Προσπαθώντας να εξηγήσει τους λόγους της επιτυχίας της TIT-for-TAT ο Axelrod κατέληξε σε τέσσερις κανόνες για επιτυχία στο επαναληπτικό δίλημμα του φυλακισμένου. 22

23 Οι κανόνες του Axelrod για το επαναληπτικό παιχνίδι Μη ζηλεύεις: δεν είναι απαραίτητο να «νικήσεις» τον αντίπαλο για να επιτύχεις. Μην είσαι ο πρώτος που δεν συνεργάζεται: στον πρώτο γύρο ξεκίνα με συνεργασία. Όση χρησιμότητα κι αν χάσεις στιγμιαία από αυτή την επιλογή, θα την ανακτήσεις σε επόμενους γύρους μέσω της συνεργασίας με άλλες «καλές» (=συνεργάσιμες) στρατηγικές. Να ανταποδίδεις τη συνεργασία και τη μη-συνεργασία: η TIT-for-TAT αντιπροσωπεύει καλή ισορροπία μεταξύ ανταμοιβής και τιμωρίας. Ακόμα κι αν οι πράκτορες ξεκινήσουν άσχημα υπάρχει περιθώριο να εδραιωθεί συνεργασία μεταξύ τους. Μην είσαι εξυπνάκιας: η TIT-for-TAT ήταν η απλούστερη στρατηγική από όλες όσες υποβλήθηκαν, μερικές από τις οποίες έκαναν χρήση προηγμένων τεχνικών για να αποφασίσουν τι να κάνουν. Οι τελευταίες είτε προσπαθούσαν να φτιάξουν μοντέλο της συμπεριφοράς του αντιπάλου αγνοώντας ότι κι εκείνος το ίδιο κάνει, είτε ήταν τόσο πολύπλοκες, που στον αντίπαλο εμφανίζονταν ως RANDOM. 23

24 Άλλες συμμετρικές 2x2 αλληλεπιδράσεις Προτιμήσεις Σχόλια 1 C,C f i C,D fi D,C fi D, D Κυρίαρχη η συνεργασία 2 C,C f i C,D fi D,D fi D, C Κυρίαρχη η συνεργασία 3 C,C f i D,C fi C,D fi D, D 4 C,C f D,C f D,D f C, D Stag hunt i i D,C f i C,C fi C,D fi D, D Game of chicken 14 D,C f C,C f D,D f C, D Prisoner s dilemma i i i i 24

25 The stag hunt Ένα ακόμα παράδειγμα κοινωνικού διλήμματος. Προέκυψε από τον Rousseau (1775 Discourse on Inequality). Η σύγχρονη εκδοχή του οφείλεται στον Poundstone (1992): Εσύ κι ένας φίλος σου αποφασίζετε ότι θα ήταν καλό αστείο να εμφανιζόσασταν την τελευταία μέρα της σχολικής χρονιάς με ένα γελοίο κούρεμα. Οι συμμαθητές σας σας προτρέπουν και τελικά ορκίζεστε ότι θα κάνετε το γελοίο κούρεμα. Μια νύχτα αναποφασιστικότητας ακολουθεί. Καθώς σκέφτεσαι τις αντιδράσεις των γονιών και των δασκάλων σου αρχίζεις να αναρωτιέσαι αν ο φίλος σου πραγματικά θα τηρήσει τη συμφωνία. Φυσικά και θέλεις να πετύχει η συμφωνία σας: το καλύτερο αποτέλεσμα θα ήταν και οι δύο να κάνετε το γελοίο κούρεμα. Αλλά...θα ήταν απαίσιαναεμφανιστείςμόνο εσύ με το γελοίο κούρεμα, αυτό θα ήταν ό,τι χειρότερο. Τώρα, δεν θα σε πείραζε να φέρεις το φίλο σου σε δύσκολη θέση. Αν εσύ δεν έκανες το κούρεμα, αλλά ο φίλος σου το έκανε, τότε αυτός θα φαινόταν πραγματικά γελοίος και αυτό θα ήταν σχεδόν τόσο καλό όσο αν κάνατε και οι δύο το γελοίο κούρεμα. 25

26 Πίνακας κέρδους για το stag hunt i defects i cooperates j defects j cooperates Υπάρχουν δύο ισορροπίες Nash: αμοιβαία συνεργασία ή αμοιβαία μησυνεργασία. Αν εμπιστεύεσαι τον αντίπαλο και πιστεύεις ότι θα συνεργαστεί τότε το καλύτερο είναι να συνεργαστείς (και αντιστρόφως, αυτό ισχύει και για τον αντίπαλο). Αντίθετα, αν πιστεύεις ότι ο αντίπαλος δε θα συνεργαστεί τότε το καλύτερο είναι να μη συνεργαστείς (και αντιστρόφως, αυτό ισχύει και για τον αντίπαλο). Ο Poundstone πιστεύει ότι τα σενάρια ανταρσίας είναι παραδείγματα του stag hunt («θα ήταν καλύτερα αν απαλλασσόμασταν από τον καπετάνιο, αλλά θα μας κρεμάσουν αν δεν το επιχειρήσουμε αρκετοί») 26

27 The game of chicken Χαρακτηρίζεται από τις ακόλουθες προτιμήσεις για τον πράκτορα i: D,C f i C,C fi C,D fi D,D Το παιχνίδι ήταν δημοφιλές ανάμεσα στους νεαρούς κακοποιούς της δεκαετίας του 50 στην Αμερική και έχει μείνει στην ιστορία από την ταινία «Επαναστάτης χωρίς» αιτία με τον James Dean. Σκοπός του παιχνιδιού είναι να φανεί ποιός από δύο παλικαράδες είναι ο γενναιότερος. Οι δύο παίχτες οδηγούν με μεγάλη ταχύτητα τα αυτοκίνητά τους προς ένα βράχο. Ο λιγότερο γενναίος από τους δύο (το «κοτόπουλο») θα είναι ο πρώτος που θα εγκαταλείψει το παιχνίδι, αλλάζοντας την πορεία του αυτοκινήτου του. Νικητής είναι αυτός που θα αντέξει για περισσότερο χρόνο μέσα στο αυτοκίνητό του και οδηγώντας προς το βράχο. Αν κανένας παίχτης δεν αλλάξει πορεία τότε και τα δύο αυτοκίνητα θα πέσουν από το βράχο και οι δύο παλικαράδες πεθαίνουν. C: αλλάζω πορεία, D: δεν αλλάζω πορεία 27

28 Πίνακας κέρδους για το game of chicken i defects j defects 0 0 j cooperates i cooperates 1 2 Πώς πρέπει να παίξει ο i; Εξαρτάται από το πόσο ανόητος (ή γενναίος) πιστεύει ότι είναι ο j. Αν πιστεύει ότι ο j είναι πιο γενναίος από τον ίδιο, τότε καλύτερα να αλλάξει πορεία (C). Αντίθετα αν πιστεύει ότι εκείνος είναι πιο γενναίος τότε καλύτερα να συνεχίσει την πορεία του (D) γιατί θα αλλάξει πορεία ο j. Το πρόβλημα προκύπτει όταν και οι δύο πράκτορες εσφαλμένα πιστεύουν ότι ο άλλος είναι λιγότερο γενναίος, γιατί τότε το χειρότερο συμβαίνει: πεθαίνουν και οι δύο. Υπάρχουν δύο ισορροπίες Nash, πάνω δεξιά και κάτω αριστερά. Αν πιστεύεις ότι ο αντίπαλος θα συνεχίσει να οδηγεί προς το βράχο (D), τότε το καλύτερο είναι να αλλάξεις πορεία (και αντιστρόφως το ίδιο ισχύει για τον αντίπαλο). Αντίθετα αν πιστεύεις ότι ο αντίπαλος θα αλλάξει πορεία, τότε το 28 καλύτερο είναι να συνεχίσεις να οδηγείς ευθεία προς το βράχο.

29 Βιβλιογραφία Κεφάλαιο 6 ο απότοβιβλίοτουwooldridge. Οργανωσιακές σχέσεις πρακτόρων Horling, B. and Lesser, V A survey of multi-agent organizational paradigms. Knowledge Engineering Review, 19(4), Θεωρία παιγνίων K. Binmore, Fun and Games: A Text on Game Theory, Heath and Company, K. Leyton-Brown and Y. Shoham, Essentials of Game Theory: A Concise Multi- Disciplinary Introduction, Morgan Claypool Publishers, Y. Shoham and K. Leyton-Brown, MultiAgent Systems: Algorithmic, Game- Theoretic and Logical Foundations, Cambridge University Press, Τουρνουά Axelrod R. Axelrod, The Evolution of Cooperation, Basic Books, Δίλημμα του φυλακισμένου Y. Mor and J. Rosenchain, Time and the Prisoner s Dilemma, Proceedings of ICMAS, ,

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων Λήψη απόφασης σε πολυπρακτορικό περιβάλλον Θεωρία Παιγνίων Αβεβαιότητα παρουσία άλλου πράκτορα Μια άλλη πηγή αβεβαιότητας είναι η παρουσία άλλου πράκτορα στο περιβάλλον, ακόμα κι όταν ένας πράκτορας είναι

Διαβάστε περισσότερα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ. Θεωρία Παιγνίων και Αποφάσεων Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων Ε. Μαρκάκης Επικ. Καθηγητής Παίγνια πολλών παικτών 2 Παίγνια με > 2 παίκτες Όλοι οι ορισμοί που

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Λύσεις 2η σειράς ασκήσεων Προθεσμία παράδοσης: 18 Μαίου 2015 Πρόβλημα 1. (14

Διαβάστε περισσότερα

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια; HA. VAIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση Κεφάλαιο 29 Θεωρία παιγνίων Θεωρία παιγνίων Η θεωρία παιγνίων βοηθά στην ανάλυση της στρατηγικής συμπεριφοράς από φορείς που κατανοούν ότι οι

Διαβάστε περισσότερα

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση HAL R. VARIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση Κεφάλαιο 29 Θεωρία παιγνίων Θεωρία παιγνίων Η θεωρία παιγνίων βοηθά στην ανάλυση της στρατηγικής συμπεριφοράς από φορείς που κατανοούν ότι

Διαβάστε περισσότερα

Κεφάλαιο 29 Θεωρία παιγνίων

Κεφάλαιο 29 Θεωρία παιγνίων HA. VAIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση Εκδόσεις Κριτική Κεφάλαιο 29 Θεωρία παιγνίων Ύλη για τη Μίκρο ΙΙ: κεφάλαιο 29.1, 29.2, 29.4, 29.7, 29.8 Κεφάλαιο 29 Θεωρία παιγνίων Ταυτόχρονα

Διαβάστε περισσότερα

Βασικές Αρχές της Θεωρίας Παιγνίων

Βασικές Αρχές της Θεωρίας Παιγνίων Βασικές Αρχές της Θεωρίας Παιγνίων - Ορισμός. Αν οι επιλογές μιας επιχείρησης εξαρτώνται από την αναμενόμενη αντίδραση των υπόλοιπων επιχειρήσεων που συμμετέχουν στην αγορά, τότε υπάρχει στρατηγική αλληλεπίδραση

Διαβάστε περισσότερα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής Θεωρία Παιγνίων και Αποφάσεων Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής Ε. Μαρκάκης Επικ. Καθηγητής Λύσεις παιγνίων 2 Επιλέγοντας στρατηγική... Δεδομένου ενός παιγνίου, τι στρατηγική πρέπει

Διαβάστε περισσότερα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής Θεωρία Παιγνίων και Αποφάσεων Ενότητα 4: Μεικτές Στρατηγικές Ε. Μαρκάκης Επικ. Καθηγητής Μεικτές στρατηγικές σε παίγνια 2 Σημεία ισορροπίας: Ύπαρξη Δεν έχουν όλα τα παίγνια σημείο ισορροπίας Π.χ. Το Matching

Διαβάστε περισσότερα

Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων Παύλος Σ. Εφραιμίδης Έκδοση 05/11/2013 Περιεχόμενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός μαθηματικού μοντέλου Το δίλημμα του φυλακισμένου Σημείο ισορροπίας Nash Θεωρία Παιγνίων Η θεωρία παιγνίων (game

Διαβάστε περισσότερα

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1 Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1 Σημεία ισορροπίας Nash: Yπάρχουν πάντα; Έχουν όλα τα παίγνια σημείο ισορροπίας; - Ναι, στην εξιδανικευμένη

Διαβάστε περισσότερα

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29 Διάλεξη 7 Θεωρία παιγνίων VA 28, 29 Θεωρία παιγνίων Στη θεωρία παιγνίων χρησιμοποιούμε υποδείγματα για τη στρατηγική συμπεριφορά των οικονομικών μονάδων που καταλαβαίνουν ότι οι ενέργειές τους επηρεάζουν

Διαβάστε περισσότερα

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης 2 η Διάλεξη Παίγνια ελλιπούς πληροφόρησης Πληροφοριακά σύνολα Κανονική μορφή παιγνίου Ισοδύναμες στρατηγικές Παίγνια συνεργασίας και μη συνεργασίας Πεπερασμένα και

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων Βασικές Έννοιες Θεωρίας v. 01/06/2014 Παύλος Σ. Εφραιμίδης Βασικές Έννοιες Θεωρίας Περιεχόμενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός μαθηματικού μοντέλου Το δίλημμα του φυλακισμένου Σημείο ισορροπίας

Διαβάστε περισσότερα

δημιουργία: http://macedonia.uom.gr/~acg επεξεργασία: Ν.Τσάντας

δημιουργία: http://macedonia.uom.gr/~acg επεξεργασία: Ν.Τσάντας Θεωρία Παιγνίων Μελέτη στοιχείων που χαρακτηρίζουν καταστάσεις ανταγωνιστικής άλληλεξάρτησης με έμφαση στη διαδικασία λήψης αποφάσεων περισσοτέρων από ένα ληπτών απόφασης (αντιπάλων). Παίγνια δύο παικτών

Διαβάστε περισσότερα

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης 1 η Διάλεξη Ορισμός Θεωρίας Παιγνίων και Παιγνίου Κατηγοριοποίηση παιγνίων Επίλυση παιγνίου Αξία (τιμή) παιγνίου Δίκαιο παίγνιο Αναπαράσταση Παιγνίου Με πίνακα Με

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

Δεύτερο πακέτο ασκήσεων

Δεύτερο πακέτο ασκήσεων ΕΚΠΑ Τμήμα Οικονομικών Επιστημών Μικροοικονομική Θεωρία ΙΙ Εαρινό εξάμηνο Ακαδ. έτους 08-09 Αν. Παπανδρέου, Φ. Κουραντή, Ηρ. Κόλλιας Δεύτερο πακέτο ασκήσεων Προθεσμία παράδοσης Παρασκευή 0 Μαϊου. Θα υπάρξει

Διαβάστε περισσότερα

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016 Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών Ιωάννης Παραβάντης Επίκουρος Καθηγητής Απρίλιος 2016 Το κλασσικό μοντέλο του διλήμματος των φυλακισμένων (prisoner s dilemma) προβλέπει τις ακόλουθες ανταμοιβές ( )

Διαβάστε περισσότερα

Κεφ. 9 Ανάλυση αποφάσεων

Κεφ. 9 Ανάλυση αποφάσεων Κεφ. 9 Ανάλυση αποφάσεων Η θεωρία αποφάσεων έχει ως αντικείμενο την επιλογή της καλύτερης στρατηγικής. Τα αποτελέσματα κάθε στρατηγικής εξαρτώνται από παράγοντες, οι οποίοι μπορεί να είναι καταστάσεις

Διαβάστε περισσότερα

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης 3 η Διάλεξη-Περιεχόμενα (1/2) Σημείο ή ζεύγος ισορροπίας κατά Nash Λύση ακολουθιακής κυριαρχίας και σημεία ισορροπίας Nash Αλγοριθμική εύρεση σημείων ισορροπίας

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 2: Ισορροπία Nash Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας

Διαβάστε περισσότερα

Θεωρία Παιγνίων και Αποφάσεων

Θεωρία Παιγνίων και Αποφάσεων Θεωρία Παιγνίων και Αποφάσεων Ε. Μαρκάκης Επικ. Καθηγητής Τι είναι η Θεωρία Παιγνίων? Quote από το βιβλίο του Osborne: Game Theory aims to help us understand situawons in which decision makers interact

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Παρασκευή 16 Οκτωβρίου 2007 ιάρκεια εξέτασης: 3 ώρες (15:00-18:00) ΘΕΜΑ 1

Διαβάστε περισσότερα

Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων Παύλος Σ. Εφραιμίδης Περιεχόµενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός µαθηµατικού µοντέλου Το δίληµµα του φυλακισµένου Σηµείο ισορροπίας Nash Θεωρία Παιγνίων Η θεωρία παιγνίων (game theory) µας βοηθάει

Διαβάστε περισσότερα

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8 Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8 Ένα από τα παράδοξα της ισορροπίας Nash που μπορεί να θεωρηθεί και σαν αδυναμία της είναι ότι σε κάποια παίγνια οι παίκτες έχουν μεγαλύτερο όφελος αν δεν διαλέξουν

Διαβάστε περισσότερα

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Πολύπλοκα Συστήματα αποτελούνται από πολλές

Διαβάστε περισσότερα

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης 3 η Διάλεξη-Περιεχόμενα (1/2) Σημείο ή ζεύγος ισορροπίας κατά Nash Λύση ακολουθιακής κυριαρχίας και σημεία ισορροπίας Nash Αλγοριθμική εύρεση σημείων ισορροπίας

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0 ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Παίγνιο: Συμμετέχουν τουλάχιστον δύο παίκτες με τουλάχιστον δύο στρατηγικές ο καθένας και αντίθετα συμφέροντα. Το αποτέλεσμα για κάθε παίκτη καθορίζεται από τις συνδυασμένες επιλογές όλων

Διαβάστε περισσότερα

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας Επίκουρος Καθηγητής Ιωάννης Παραβάντης Τµήµα ιεθνών και Ευρωπαϊκών Σπουδών ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ Μάρτιος 2010 Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας 1. Εισαγωγή Στο παρόν φυλλάδιο παριστάνουµε περιπτώσεις

Διαβάστε περισσότερα

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2 Θεωρία παιγνίων: Κώστας Ρουμανιάς Ο.Π.Α. Τμήμα Δ. Ε. Ο. Σ. 3 Δεκεμβρίου 2012 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 1 / 21 -best responses Κυνήγι ελαφιού: Δυο κυνηγοί ταυτόχρονα

Διαβάστε περισσότερα

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων Β. Βασιλειάδης Αν. Καθηγητής Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων Περιεχόμενα Θεωρία Αποφάσεων o Αποφάσεις χωρίς πιθανότητα o Αποφάσεις με πιθανότητα Θεωρία Παιγνίων o Παίγνια Μηδενικού

Διαβάστε περισσότερα

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Κοινωνικά Δίκτυα Θεωρία Παιγνίων Κοινωνικά Δίκτυα Θεωρία Παιγνίων Ν. Μ. Σγούρος Τμήμα Ψηφιακών Συστημάτων, Παν. Πειραιώς sgouros@unipi.gr Ορισμοί Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά: Υπάρχει

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 ΚΟΙΝΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Players-Παίκτες Rules- Κανόνες. Τιµωρείσαι εάν τους παραβιάσεις.

Διαβάστε περισσότερα

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη Θεωρία παιγνίων: Μεικτές στρατηγικές και Ισορροπία Nash Κώστας Ρουμανιάς Ο.Π.Α. Τμήμα Δ. Ε. Ο. Σ. 18 Μαρτίου 2012 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Μεικτές στρατηγικές 18 Μαρτίου 2012 1 / 9 Κυριαρχία και μεικτές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΠΝΕΠΙΣΤΗΜΙΟ ΜΚΕ ΟΝΙΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜ ΕΦΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙ ΠΙΓΝΙΩΝ Εξετάσεις 13 Φεβρουαρίου 2004 ιάρκεια εξέτασης: 2 ώρες (13:00-15:00) ΘΕΜ 1 ο (2.5) α) Για δύο στρατηγικές

Διαβάστε περισσότερα

Κεφάλαιο 13ο Eπαναλαµβανόµενα παίγνια (Repeated Games)

Κεφάλαιο 13ο Eπαναλαµβανόµενα παίγνια (Repeated Games) Κεφάλαιο 13ο Eπαναλαµβανόµενα παίγνια (Repeated Gaes) Το δίληµµα των φυλακισµένων, όπως ξέρουµε έχει µια και µοναδική ισορροπία η οποία είναι σε αυστηρά κυρίαρχες στρατηγικές. C N C -8, -8 0, -10 N -10,

Διαβάστε περισσότερα

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1 Ασκήσεις Ιωάννα Καντζάβελου Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1 1. Επιλογή Διαδρομής 2. Παραλλαγή του Matching Pennies 3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις 4. Επίλυση BoS με Βέλτιστες

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Τρίτη 15 Ιανουαρίου 2008 ιάρκεια εξέτασης: 3 ώρες (13:00-16:00) ΘΕΜΑ 1 ο (2,5

Διαβάστε περισσότερα

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά: Γενικοί Ορισμοί Η Θεωρία Παιγνίων (game theory) εξετάζει δραστηριότητες στις οποίες το αποτέλεσμα της απόφασης ενός ατόμου εξαρτάται όχι μόνο από τον τρόπο με τον οποίο επιλέγει ανάμεσα από διάφορες εναλλακτικές

Διαβάστε περισσότερα

Ολιγοπώλιο. Εισαγωγή στην Οικονομική Επιστήμη Ι. Αρ. Διάλεξης: 11

Ολιγοπώλιο. Εισαγωγή στην Οικονομική Επιστήμη Ι. Αρ. Διάλεξης: 11 Ολιγοπώλιο Εισαγωγή στην Οικονομική Επιστήμη Ι Αρ. Διάλεξης: 11 Μορφές Αγορών μεταξύ Μονοπωλίου και Τέλειου Ανταγωνισμού Ο Ατελής Ανταγωνισμός αναφέρεται στην διάρθρωση της αγοράς εκείνης η οποία βρίσκεται

Διαβάστε περισσότερα

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Κεφάλαιο 7 Ε. Σαρτζετάκης Μονοπωλιακός ανταγωνισμός Η μορφή αγοράς του μονοπωλιακού ανταγωνισμού περιέχει στοιχεία πλήρους ανταγωνισμού (ελεύθερη

Διαβάστε περισσότερα

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Μερική Παρατηρησιµότητα Θεωρία Παιγνίων Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Reinforcement Learning (RL)

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΘΕΜΑ 1 ο (2.5) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Δευτέρα 3 Σεπτεμβρίου 2012 Διάρκεια εξέτασης: 3 ώρες (16:30-19:30)

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I. ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I. Γενικά Σε μαθήματα όπως η επιχειρησιακή έρευνα και ή λήψη αποφάσεων αναφέραμε τις αποφάσεις κάτω από συνθήκες βεβαιότητας, στις οποίες και εφαρμόζονται κυρίως οι τεχνικές της επιχειρησιακής

Διαβάστε περισσότερα

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2 Κεφάλαιο 2 Στατικά παίγνια με πλήρη πληροφόρηση 2.1 Εισαγωγή Η πιο απλή, αλλά και θεμελιώδης, κατηγορία παιγνίων είναι αυτή των στατικών παιγνίων με πλήρη πληροφόρηση. Στα παίγνια αυτά οι συμμετέχοντες

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3 ΑΣΚΗΣΗ 1 Δύο επιχειρήσεις Α και Β, μοιράζονται το μεγαλύτερο μερίδιο της αγοράς για ένα συγκεκριμένο προϊόν. Καθεμία σχεδιάζει τη νέα της στρατηγική για τον επόμενο χρόνο, προκειμένου να αποσπάσει πωλήσεις

Διαβάστε περισσότερα

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0 ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ιδάσκων: Ε. Πετράκης. Επαναληπτική Εξέταση: 15/09/99 Απαντήστε στα τρία από τα τέσσερα θέµατα. Όλα τα υποερωτήµατα βαθµολογούνται το ίδιο. 1. Θεωρήσατε ένα ολιγοπωλιακό κλάδο όπου τρεις

Διαβάστε περισσότερα

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Θεωρία Παιγνίων Μαρκωβιανά Παιχνίδια Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Μερική αρατηρησιµότητα POMDPs

Διαβάστε περισσότερα

16 Η θεωρία παιγνίων

16 Η θεωρία παιγνίων 16 Η θεωρία παιγνίων Σκοπός Το παρόν κεφάλαιο είναι μια σύντομη εισαγωγή στη θεωρία των παιγνίων. Υπάρχουν οικονομικά προβλήματα, όπως αυτό του ολιγοπωλίου, στα οποία η θεωρία παιγνίων έχει ενδιαφέρουσες

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις 1 Φεβρουαρίου 26 ιάρκεια εξέτασης: 3 ώρες (15:-18:) ΘΕΜΑ 1 ο (2.5) Κάθε ένας

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Εξεταστική περίοδος Ιουνίου 2015 16 Ιουνίου 2015 Διάρκεια εξέτασης: 2,5 ώρες

Διαβάστε περισσότερα

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να - Παράδειγμα. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να αποκρούσει ένας τερματοφύλακας. - Αν οι δύο παίκτες επιλέξουν

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017 2η σειρά ασκήσεων Προθεσμία παράδοσης: 16 Ιουνίου 2017 Πρόβλημα 1. (18 μονάδες)

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης Μπεληγιάννης Γρηγόριος Σχολή Οργάνωσης και Διοίκησης Επιχειρήσεων Τμήμα Διοίκησης Επιχειρήσεων Αγροτικών Προϊόντων

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες,

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές. ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές. Α 1 Α 2 Α 3 Β 1 Β 2 Β 3 1, -1 0, 0-1, 0 0, 0 0, 6 10, -1 2, 0 10, -1-1, -1 Α 1 Α 2 Α 3 Β 1 Β

Διαβάστε περισσότερα

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής. Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής. Ιστορική αναδρομή 1713 Ο Francis Waldegrave, σε ένα γράμμα του, παρουσίασε την πρώτη μικτή στρατηγική μεγίστου

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 6η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται στα βιβλία Τεχνητή Νοημοσύνη των Βλαχάβα κ.ά., 3η έκδοση, Β. Γκιούρδας

Διαβάστε περισσότερα

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου Θεωρία παιγνίων 1 1. Παρακίνηση: Honda και Toyota 2. Ισορροπία κατά Nash 3. Το δίλημμα του φυλακισμένου 4. Ισορροπία με κυρίαρχη στρατηγική 5. Μειονεκτήματα της ισορροπίας κατά Nash 6. Παίγνια αλληλοδιαδοχικών

Διαβάστε περισσότερα

Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις

Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις Γιώργος Τσουρβάκας, Αναπληρωτής Καθηγητής Τμήμα Δημοσιογραφίας και ΜΜΕ Σχολή Οικονομικών

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 6 ης διάλεξης

Ασκήσεις μελέτης της 6 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 6 ης διάλεξης 6.1. (α) Το mini-score-3 παίζεται όπως το score-4,

Διαβάστε περισσότερα

Μεταξύ του µονοπωλίου και του τέλειου ανταγωνισµού

Μεταξύ του µονοπωλίου και του τέλειου ανταγωνισµού Ολιγοπώλιο Μεταξύ του µονοπωλίου και του τέλειου ανταγωνισµού Ο ατελής ανταγωνισµός αναφέρεται σε εκείνες τις δοµές µ της αγοράς που κυµαίνονται µεταξύ του τέλειου ανταγωνισµού και του µονοπωλίου. Μεταξύ

Διαβάστε περισσότερα

B A B A A 1 A 2 A N = A i, i=1. i=1

B A B A A 1 A 2 A N = A i, i=1. i=1 Κεφάλαιο 2 Χώρος πιθανότητας και ενδεχόμενα 2.1 Προκαταρκτικά Εστω ότι κάποιος μας προτείνει να του δώσουμε δυόμισι ευρώ για να παίξουμε το εξής παιχνίδι: Θα στρίβουμε ένα νόμισμα μέχρι την πρώτη φορά

Διαβάστε περισσότερα

Στοχαστικές Στρατηγικές

Στοχαστικές Στρατηγικές Στοχαστικές Στρατηγικές 3 η ενότητα: Εισαγωγή στα στοχαστικά προβλήματα διαδρομής Τμήμα Μαθηματικών, ΑΠΘ Ακαδημαϊκό έτος 2018-2019 Χειμερινό Εξάμηνο Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & Πανεπιστήμιο

Διαβάστε περισσότερα

Κεφάλαιο 5 R (2, 3) R (3, 0)

Κεφάλαιο 5 R (2, 3) R (3, 0) Κεφάλαιο 5 Θα ξεκινήσουµε το κεφάλαιο αυτό βλέποντας ένα ακόµη παράδειγµα αναφορικά µε την ισορροπία που προκύπτει από την οπισθογενή επαγωγή (backwards induction) και την ισορροπία κατά Nash στην στρατηγική

Διαβάστε περισσότερα

Αλγοριθμική Θεωρία Παιγνίων

Αλγοριθμική Θεωρία Παιγνίων Αλγοριθμική Θεωρία Παιγνίων ιδάσκοντες: E. Ζάχος, Α. Παγουρτζής,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Πολύπλοκα Συστήματα

Διαβάστε περισσότερα

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία Κεφάλαιο 4 Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία κατά Nash είναι: (α) ένα διάνυσµα από στρατηγικές, έτσι ώστε δεδοµένων των υπολοίπων στρατηγικών, ο παίκτης

Διαβάστε περισσότερα

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ Επιβλέπων Δρ. ΓΕΡΟΝΤΙΔΗΣ ΙΩΑΝΝΗΣ Αναπληρωτής Καθηγητής ΚΑΒΑΛΑ 2006 0 ΠΕΡΙΕΧΟΜΕΝA Σελίδα ΕIΣΑΓΩΓΗ 3 ΚΕΦΑΛΑΙΟ

Διαβάστε περισσότερα

* τη µήτρα. Κεφάλαιο 1o

* τη µήτρα. Κεφάλαιο 1o Κεφάλαιο 1o Θεωρία Παιγνίων Η θεωρία παιγνίων εξετάζει καταστάσεις στις οποίες υπάρχει αλληλεπίδραση µεταξύ ενός µικρού αριθµού ατόµων. Άρα σε οποιαδήποτε περίπτωση, αν ο αριθµός των ατόµων που συµµετέχουν

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής Θεωρία Παιγνίων και Αποφάσεων Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος Ε. Μαρκάκης Επικ. Καθηγητής Περίληψη Παίγνια μηδενικού αθροίσματος PessimisIc play Αμιγείς max-min και

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 11: Σχεδίαση μηχανισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 11: Σχεδίαση μηχανισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 11: Σχεδίαση μηχανισμών Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου

Διαβάστε περισσότερα

Condorcet winner. (1) Αν U j (x) > U j (y) τότε U i (x) > U i (y) και (2) Αν U i (y) > U i (x) τότε U j (y) > U j (x).

Condorcet winner. (1) Αν U j (x) > U j (y) τότε U i (x) > U i (y) και (2) Αν U i (y) > U i (x) τότε U j (y) > U j (x). Οικονοµικό Πανεπιστήµιο Αθηνών Άνοιξη 2012 Τµήµα Οικονοµικής Επιστήµης ηµόσια Οικονοµική ΙI Η διαδικασία της ψηφοφορίας Ως µεθόδου παροχής των δηµοσίων αγαθών (για τα ιδιωτικά αγαθά, ο µηχανισµός των τιµών).

Διαβάστε περισσότερα

«Γκρρρ,» αναφωνεί η Ζέτα «δεν το πιστεύω ότι οι άνθρωποι μπορούν να συμπεριφέρονται έτσι μεταξύ τους!»

«Γκρρρ,» αναφωνεί η Ζέτα «δεν το πιστεύω ότι οι άνθρωποι μπορούν να συμπεριφέρονται έτσι μεταξύ τους!» 26 σχεδιασε μια ΦωτογρΑΦιΑ τήσ προσκλήσήσ που ελαβεσ Απο τον ΔΑσκΑλο σου. παρουσιασε το λογοτυπο και το σλογκαν που χρήσιμοποιει το σχολειο σου για τήν εβδομαδα κατα τήσ παρενοχλήσήσ. ΗΛΕΚΤΡΟΝΙΚΗ ΠΑΡΕΝΟΧΛΗΣΗ

Διαβάστε περισσότερα

Θεωρία παιγνίων Δημήτρης Χριστοφίδης Εκδοση 1η: Παρασκευή 3 Απριλίου 2015. Παραδείγματα Παράδειγμα 1. Δυο άτομα παίζουν μια παραλλαγή του σκακιού όπου σε κάθε βήμα ο κάθε παίκτης κάνει δύο κανονικές κινήσεις.

Διαβάστε περισσότερα

Ισορροπία (balance) Οι ιδιότητες που δημιουργεί η μέθοδος του ακεραίου τοπ.

Ισορροπία (balance) Οι ιδιότητες που δημιουργεί η μέθοδος του ακεραίου τοπ. Ισορροπία (balance) Ένας όρος που χρησιμοποιείται συχνά σε θέματα κινήσεων είναι η ισορροπία (balance). Για να προχωρήσουμε παρακάτω πρέπει να ξέρουμε πως να βγάζουμε αποτελέσματα σε ένα τουρνουά ζευγών

Διαβάστε περισσότερα

ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ. ΑΝΑΦΟΡΑ ΕΡΓΑΣΙΑΣ Othello-TD Learning. Βόλτσης Βαγγέλης Α.Μ

ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ. ΑΝΑΦΟΡΑ ΕΡΓΑΣΙΑΣ Othello-TD Learning. Βόλτσης Βαγγέλης Α.Μ ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ ΑΝΑΦΟΡΑ ΕΡΓΑΣΙΑΣ Othello-TD Learning Βόλτσης Βαγγέλης Α.Μ. 2011030017 Η παρούσα εργασία πραγματοποιήθηκε στα πλαίσια του μαθήματος Αυτόνομοι Πράκτορες και σχετίζεται με λήψη αποφάσεων

Διαβάστε περισσότερα

Εισαγωγή στη Θεωρία Αποφάσεων. Λήψη απλών αποφάσεων για έναν πράκτορα

Εισαγωγή στη Θεωρία Αποφάσεων. Λήψη απλών αποφάσεων για έναν πράκτορα Εισαγωγή στη Θεωρία Αποφάσεων Λήψη απλών αποφάσεων για έναν πράκτορα Oρθολογικές αποφάσεις Ένας πράκτορας βασισμένος στη λογική Έχει ένα στόχο (μια κατάσταση περιβάλλοντος που θέλει να πετύχει) Καταστρώνει

Διαβάστε περισσότερα

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά].

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά]. 2.2. ΥΟΠΩΛΙΟ ΙΑΦΟΡΕΤΙΚΩΝ ΠΡΟΪΟΝΤΩΝ ΜΕ ΕΤΕΡΟΓΕΝΕΙΣ ΚΑΤΑΝΑΛΩΤΕΣ Έστω ότι έχουµε 2 µάρκες υπολογιστών: (pricot), (anana) [ ιαρκή Αγαθά]. Υποθέτουµε µηδενικό κόστος παραγωγής και P, P, οι τιµές για το Α, αντίστοιχα.

Διαβάστε περισσότερα

(γ) Τις μορφές στρατηγικής αλληλεπίδρασης που αναπτύσσονται

(γ) Τις μορφές στρατηγικής αλληλεπίδρασης που αναπτύσσονται Βασικές Έννοιες Οικονομικών των Επιχειρήσεων - Τα οικονομικά των επιχειρήσεων μελετούν: (α) Τον τρόπο με τον οποίο λαμβάνουν τις αποφάσεις τους οι επιχειρήσεις. (β) Τις μορφές στρατηγικής αλληλεπίδρασης

Διαβάστε περισσότερα

Οι παίκτες παίρνουν το ρόλο των χειρότερων πειρατών στο πλήρωμα ενός πλοίου. Ο καπετάνιος σας έχει στη μπούκα, επειδή είστε πολύ τεμπέληδες και

Οι παίκτες παίρνουν το ρόλο των χειρότερων πειρατών στο πλήρωμα ενός πλοίου. Ο καπετάνιος σας έχει στη μπούκα, επειδή είστε πολύ τεμπέληδες και Οι παίκτες παίρνουν το ρόλο των χειρότερων πειρατών στο πλήρωμα ενός πλοίου. Ο καπετάνιος σας έχει στη μπούκα, επειδή είστε πολύ τεμπέληδες και βλάκες για να αξίζετε μερίδιο στο ρούμι και τα λάφυρα. Επειδή

Διαβάστε περισσότερα

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 ) Κεφάλαιο 7ο Μιλήσαµε στο προηγούµενο κεφάλαιο για το τι θα συµβεί αν οι επιχειρήσεις ανταγωνίζονται σε τιµές. Επιπλέον µιλήσαµε για το πως αποδεικνύεται το παράδοξο του Bertrand και καθώς επίσης και για

Διαβάστε περισσότερα

Ολιγοπώλιο Με ιαφοροποιηµένο Προϊόν 1

Ολιγοπώλιο Με ιαφοροποιηµένο Προϊόν 1 Ολιγοπώλιο Με ιαφοροποιηµένο Προϊόν 1 Βασική ιάκριση: Προϊόντα κάθετα διαφοροποιηµένα (κοινός δείκτης ποιότητας) Προϊόντα οριζόντια διαφοροποιηµένα (δεν υπάρχει κοινός δείκτης ποιότητας) Προϊόντα Χώρος

Διαβάστε περισσότερα

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων - Στο υπόδειγμα ertrand, οι επιχειρήσεις, παράγουν ένα ομοιογενές αγαθό, οπότε η τιμή είναι η μοναδική μεταβλητή που ενδιαφέρει τους καταναλωτές και οι καταναλωτές

Διαβάστε περισσότερα

Επίλυση Προβλημάτων 1

Επίλυση Προβλημάτων 1 Επίλυση Προβλημάτων 1 Επίλυση Προβλημάτων Περιγραφή Προβλημάτων Αλγόριθμοι αναζήτησης Αλγόριθμοι τυφλής αναζήτησης Αναζήτηση πρώτα σε βάθος Αναζήτηση πρώτα σε πλάτος (ΒFS) Αλγόριθμοι ευρετικής αναζήτησης

Διαβάστε περισσότερα

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών Μικροοικονομική Ι Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2016

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2016 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2016 Λύσεις 2ης σειράς ασκήσεων Προθεσμία παράδοσης: 25 Ιουνίου 2016 Πρόβλημα 1.

Διαβάστε περισσότερα

ΑΝΑΖΗΤΩΝΤΑΣ ΤΙΣ ΧΑΜΕΝΕΣ ΜΑΣ ΣΥΝΕΡΓΑΣΙΕΣ!!

ΑΝΑΖΗΤΩΝΤΑΣ ΤΙΣ ΧΑΜΕΝΕΣ ΜΑΣ ΣΥΝΕΡΓΑΣΙΕΣ!! ΑΝΑΖΗΤΩΝΤΑΣ ΤΙΣ ΧΑΜΕΝΕΣ ΜΑΣ ΣΥΝΕΡΓΑΣΙΕΣ!! Μάτα Χαροκόπου Ανδρέας Καλλιβωκάς ΤΟ ΟΛΟΝ ΕΙΝΑΙ ΜΕΓΑΛΥΤΕΡΟ ΑΠΟ ΤΟ ΑΘΡΟΙΣΜΑ ΤΩΝ ΜΕΡΩΝ ΤΟΥ Οι συνεργασίες αποτελούν την πεμπτουσία της ανάπτυξης, του διαχρονικού

Διαβάστε περισσότερα

3. Πώς θα ήθελα να είναι / συμπεριφέρονται τα παιδιά για να είμαι ευχαριστημένος/η; Παράρτημα ΙΙ

3. Πώς θα ήθελα να είναι / συμπεριφέρονται τα παιδιά για να είμαι ευχαριστημένος/η; Παράρτημα ΙΙ Παράρτημα Ι Εργαλείο 1: Γνωριμία - Διερεύνηση προσωπικών θεωριών 1. Τα πιο σημαντικά πράγματα που θέλω να πετύχω στην τάξη μου είναι: Α. Β. Γ. Δ. 2. Είμαι ευχαριστημένος/η από τη δουλειά μου όταν: Α. Β.

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Α Κ Α Η Μ Α Ι Κ Ο Ε Τ Ο Σ 2 0 1 1-2 0 1 2 ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT Ο συγκεκριµένος οδηγός για το πρόγραµµα

Διαβάστε περισσότερα

Co-funded by the European Union Quest

Co-funded by the European Union Quest 1 Καλωσορίσατε στο παιχνίδι "Δώσε το στον επόμενο". Co-funded by the European Union Ένα εργαλείο για να σας βοηθήσει να γνωρίσετε μια δικαιοσύνη φιλική προς το παιδί Παίκτες Ηλικία 14-18 4-6 2 Βάλτε αυτή

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή raniah@hua.gr 1 Παίγνια Δύο Αντιπάλων Τα προβλήματα όπου η εξέλιξη των καταστάσεων εξαρτάται

Διαβάστε περισσότερα

Evolutionary Equilibrium

Evolutionary Equilibrium Evolutionary Equilibrium Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών v. 22.05.2012 Algorithmic Game Theory Evolutionary Equilibium 1 τι θα πούμε εξελικτικά

Διαβάστε περισσότερα

Πλειστηριασμός Για να πλειοδοτήσει κάποιος άξονας θα πρέπει να αναλάβει την υποχρέωση

Πλειστηριασμός Για να πλειοδοτήσει κάποιος άξονας θα πρέπει να αναλάβει την υποχρέωση Πλειστηριασμός Προκειμένου να περιγράψουμε το χέρι μας στο συμπαίκτη, χρησιμοποιούμε μια ειδική διεθνή γλώσσα τα Μπριτζικά ή Μπριτζιακά. Τα καλά νέα είναι ότι αυτή η γλώσσα έχει μόνο λίγες λεξούλες. Πλειστηριασμός

Διαβάστε περισσότερα

EMOJITO! 7 Δίσκοι Ψηφοφορίας. 100 Κάρτες Συναισθημάτων. 1 Ταμπλό. 7 Πιόνια παικτών. 2-7 Παίκτες

EMOJITO! 7 Δίσκοι Ψηφοφορίας. 100 Κάρτες Συναισθημάτων. 1 Ταμπλό. 7 Πιόνια παικτών. 2-7 Παίκτες o Emojito! είναι ένα παιχνίδι παρέας, για 2 έως 14 άτομα, όπου οι παίκτες προσπαθούν να εκφράσουν συναισθήματα που απεικονίζονται σε κάρτες, είτε χρησιμοποιώντας το πρόσωπό τους, είτε ήχους ή και τα 2.

Διαβάστε περισσότερα

, για κάθε n N. και P είναι αριθμήσιμα.

, για κάθε n N. και P είναι αριθμήσιμα. ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΑΚΡΙΤA ΜΑΘΗΜΑΤΙΚΑ Διδάσκοντες: Δ.Φωτάκης Θ. Σούλιου η Γραπτή Εργασία Ημ/νια παράδοσης 5/4/8 Θέμα (Διαδικασίες Απαρίθμησης.

Διαβάστε περισσότερα

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε: Κεφάλαιο 2 ο Μέχρι τώρα δώσαµε τα στοιχεία ενός παιγνίου σε µορφή δέντρου και σε µορφή µήτρας. Τώρα θα ορίσουµε τη στρατηγική στην αναλυτική µορφή του παιγνίου (η στρατηγική ορίζεται από κάθε στήλη ή γραµµή

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 Προηγούµενο Μάθηµα: Κυρίαρχη Στρατηγική- Κυριαρχούµενη στρατηγική-nash equilibrium Μια στρατηγική

Διαβάστε περισσότερα