ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Save this PDF as:
 WORD  PNG  TXT  JPG

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες"

Transcript

1 ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Μερική Παρατηρησιµότητα Θεωρία Παιγνίων Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης

2 Ε ανάληψη Reinforcement Learning (RL) problems and approaches Prediction temporal difference learning least-squares temporal difference (LSTD) learning Control Q-learning least-squares policy iteration (LSPI) Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 2

3 Σήµερα Μερική αρατηρησιµότητα POMDPs βέλτιστες πολιτικές µετατροπή σε MDP Θεωρία αιγνίων στρατηγικές ισορροπίες Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 3

4 Μερική Παρατηρησιµότητα Partial Observability

5 Μερικώς Παρατηρήσιµα Περιβάλλοντα Partial Observability ο πράκτορας δεν γνωρίζει ακριβώς σε ποια κατάσταση βρίσκεται το τι θα κάνει εξαρτάται από το τι ιστεύει για το που βρίσκεται Παράδειγµα Αρχική κατανοµή πιθανότητας Μετά από 5 κινήσεις αριστερά Μετά από 5 κινήσεις επάνω Μετά από 5 κινήσεις δεξιά Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 5

6 Partially Observable MDP POMDP (S, B, A, O, P, R, γ, D) S: state space of the process B: observation space of the process A: action space of the process O: observation model, O(o s) P: transition model, P(s a, s) R: reward function, R(s) γ: discount factor, 0 < γ 1 D: initial state distribution Markov property next state, observation, reward are independent of history Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 6

7 Κατάσταση Πε οίθησης Belief State b πιθανοτική κατανοµή πάνω στο χώρο καταστάσεων b(s): πιθανότητα που αποδίδεται στην κατάσταση s από την b αρχική κατάσταση πεποίθησης b 0 Ενηµέρωση υπολογισµός καταστάσεων πεποίθησης = φιλτράρισµα ( s ) = ao( s', o) T( s, a s) b( s) b, s Παράδειγµα b =,,,,,,,,, 0, Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 7

8 Πράκτορας POMDP Βέλτιστη ολιτική η βέλτιστη ενέργεια εξαρτάται από την τρέχουσα κατάσταση πεποίθησης βέλτιστη πολιτική *(b) [ όχι *(s) όπως στην περίπτωση MDP ] απεικόνιση από το (συνεχή) χώρο πεποιθήσεων στο χώρο ενεργειών Κύκλος λειτουργίας εκτέλεσε την ενέργεια α = *(b) διάβασε την παρατήρηση ο ενηµέρωσε την πεποίθηση b σύµφωνα µε την παρατήρηση o επανάλαβε Παρατήρηση µε δεδοµένη την a, γίνεται µετάβαση σε νέα b, ανάλογα µε την o Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 8

9 Μετατρο ή POMDP σε MDP Μετατρο ή συνάρτηση µετάβασης µεταξύ καταστάσεων πεποίθησης = P( b ' o, a, b) O( s ', o) o s ' s ( ) ( ) τ ( b, a, b ') T s, a, s b s συνάρτηση ανταµοιβής ως προς τις καταστάσεις πεποίθησης ρ ( b) b( s) R( s) = s MDP (b(s),a,τ,ρ,γ,d) στο χώρο των καταστάσεων πεποίθησης! Ε ίλυση η ε ίλυση ενός POMDP στο χώρο καταστάσεων ανάγεται σε ε ίλυση ενός MDP στο χώρο των καταστάσεων ε οίθησης πρόβληµα: συνεχής χώρος καταστάσεων πεποίθησης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 9

10 Παράδειγµα Αρχική ε οίθηση οµοιόµορφη στις 9 καταστάσεις Βέλτιστη ολιτική απλή ακολουθία, λόγω έλλειψης παρατηρήσεων [Αριστερά, Ε άνω, Ε άνω, εξιά, Ε άνω, Ε άνω, εξιά, Ε άνω, Ε άνω, εξιά, Ε άνω, εξιά, Ε άνω, εξιά, Ε άνω, ] πιθανότητα επιτυχίας 86,6%, αναµενόµενη χρησιµότητα 0,38 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 10

11 Θεωρία Παιγνίων Game Theory

12 Παίγνιο Two Finger Morra απλοποίηση του inspection game Παίκτες δύο παίκτες Ε (even), Ο (odd) Ενέργειες κάθε παίκτης µπορεί να παίξει ένα ή δύο οι παίκτες παίζουν ταυτόχρονα Πίνακας α ολαβών (payoff matrix) Ε\Ο ένα δύο ένα E= +2, O= 2 E= 3, O= +3 δύο E= 3, O= +3 E= +4, O= 4 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 12

13 Ορολογία Παιγνίων Αµιγής στρατηγική (pure strategy) αιτιοκρατική πολιτική, µία ενέργεια σε κάθε κατάσταση Μικτή στρατηγική (mixed strategy) τυχαιοποιηµένη πολιτική, πιθανοτική κατανοµή στις ενέργειες Προφίλ στρατηγικών (strategy profile) µία ανάθεση µίας στρατηγικής σε κάθε παίκτη Α οτέλεσµα (outcome) η αριθµητική τιµή του παιχνιδιού για κάθε παίκτη Λύση αιγνίου (game solution) προφίλ στρατηγικών όπου κάθε παίκτης υιοθετεί ορθολογική στρατηγική ερώτηµα: πώς προσδιορίζεται η έννοια «ορθολογική»; Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 13

14 Το ίληµµα των Φυλακισµένων (Prisoner s Dilemma) Βασίλης: οµολογία Βασίλης: άρνηση Αλίκη: οµολογία A= 5, B= 5 A= 0, B= 10 Αλίκη: άρνηση A= 10, B= 0 A= 1, B= 1 Συλλογισµός εάν ο Βασίλης οµολογήσει... εάν ο Βασίλης αρνηθεί... στρατηγική: «οµολογία» αποτέλεσµα: (-5, -5)! Παράδοξο η στρατηγική «άρνηση» έχει αποτέλεσµα (-1,-1) είναι επιτρεπτή, αλλά απίθανη επιλογή! Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 14

15 Στρατηγικές και Α οτελέσµατα Κυρίαρχη στρατηγική (dominant strategy) ισχυρή κυριαρχία (strong domination) η στρατηγική s για το παίκτη p κυριαρχεί ισχυρά επί της s, εάν η s έχει καλύτερο αποτέλεσµα από την s για κάθε στρατηγική των άλλων παικτών ασθενής κυριαρχία (weak domination) η στρατηγική s για το παίκτη p κυριαρχεί ασθενώς επί της s, εάν η s έχει καλύτερο αποτέλεσµα από την s σε ένα τουλάχιστον προφίλ στρατηγικών και δεν είναι χειρότερη σε κανένα άλλο προφίλ Σχέσεις µεταξύ α οτελεσµάτων κυριαρχία κατά Pareto (Pareto domination) ένα αποτέλεσµα a κυριαρχεί κατά Pareto έναντι κάποιου άλλου a όταν όλοι οι παίκτες προτιµούν το a από το a Pareto βέλτιστο (Pareto optimality) εάν δεν υπάρχει άλλο αποτέλεσµα που προτιµούν οι παίκτες Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 15

16 Ισορρο ίες Ισορρο ία (equilibrium) όταν κανένας παίκτης δεν µπορεί να επωφεληθεί από την αλλαγή στρατηγικών, εφόσον οι άλλοι διατηρούν τη στρατηγική τους τοπικό βέλτιστο στο χώρο των πολιτικών Ισορρο ία κυρίαρχων στρατηγικών όταν κάθε παίκτης υιοθετεί µια κυρίαρχη στρατηγική δεν υπάρχει τέτοια ισορροπία σε όλα τα παιχνίδια Nash equilibrium σε κάθε παιχνίδι υπάρχει τουλάχιστον ένα σηµείο ισορροπίας Nash περιλαµβάνει και την περίπτωση µικτών στρατηγικών υπάρχουν ισορροπίες, ακόµα και χωρίς κυρίαρχες στρατηγικές αποδείχθηκε από τον John Forbes Nash, Jr ( ) Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 16

17 Παράδειγµα Best: dvd Best: cd Acme: dvd A= 9, B= 9 A= 3, B= 1 Acme: cd A= 4, B= 1 A= 5, B= 5 Ισορρο ίες Nash (dvd, dvd) και (cd, cd) ερώτηµα: ποια από τις δύο θα επιλέξουν; «απάντηση»: επιλογή της βέλτιστης λύσης κατά Pareto (dvd, dvd) Λύση ανάγκη για συντονισµό/διαπραγµάτευση ενέργειες επικοινωνίας µεταξύ πρακτόρων παιχνίδια συντονισµού (coordination games) Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 17

18 Μελέτη Σύγγραµµα Ενότητες 17.4 και 17.6 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 18

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Θεωρία Παιγνίων Μαρκωβιανά Παιχνίδια Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Μερική αρατηρησιµότητα POMDPs

Διαβάστε περισσότερα

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Λήψη Α οφάσεων υ ό Αβεβαιότητα Decision Making under Uncertainty Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Εντο

Διαβάστε περισσότερα

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων Λήψη απόφασης σε πολυπρακτορικό περιβάλλον Θεωρία Παιγνίων Αβεβαιότητα παρουσία άλλου πράκτορα Μια άλλη πηγή αβεβαιότητας είναι η παρουσία άλλου πράκτορα στο περιβάλλον, ακόμα κι όταν ένας πράκτορας είναι

Διαβάστε περισσότερα

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29 Διάλεξη 7 Θεωρία παιγνίων VA 28, 29 Θεωρία παιγνίων Στη θεωρία παιγνίων χρησιμοποιούμε υποδείγματα για τη στρατηγική συμπεριφορά των οικονομικών μονάδων που καταλαβαίνουν ότι οι ενέργειές τους επηρεάζουν

Διαβάστε περισσότερα

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας Επίκουρος Καθηγητής Ιωάννης Παραβάντης Τµήµα ιεθνών και Ευρωπαϊκών Σπουδών ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ Μάρτιος 2010 Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας 1. Εισαγωγή Στο παρόν φυλλάδιο παριστάνουµε περιπτώσεις

Διαβάστε περισσότερα

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να - Παράδειγμα. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να αποκρούσει ένας τερματοφύλακας. - Αν οι δύο παίκτες επιλέξουν

Διαβάστε περισσότερα

Βασικές Αρχές της Θεωρίας Παιγνίων

Βασικές Αρχές της Θεωρίας Παιγνίων Βασικές Αρχές της Θεωρίας Παιγνίων - Ορισμός. Αν οι επιλογές μιας επιχείρησης εξαρτώνται από την αναμενόμενη αντίδραση των υπόλοιπων επιχειρήσεων που συμμετέχουν στην αγορά, τότε υπάρχει στρατηγική αλληλεπίδραση

Διαβάστε περισσότερα

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια; HA. VAIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση Κεφάλαιο 29 Θεωρία παιγνίων Θεωρία παιγνίων Η θεωρία παιγνίων βοηθά στην ανάλυση της στρατηγικής συμπεριφοράς από φορείς που κατανοούν ότι οι

Διαβάστε περισσότερα

Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων Παύλος Σ. Εφραιμίδης Έκδοση 05/11/2013 Περιεχόμενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός μαθηματικού μοντέλου Το δίλημμα του φυλακισμένου Σημείο ισορροπίας Nash Θεωρία Παιγνίων Η θεωρία παιγνίων (game

Διαβάστε περισσότερα

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση HAL R. VARIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση Κεφάλαιο 29 Θεωρία παιγνίων Θεωρία παιγνίων Η θεωρία παιγνίων βοηθά στην ανάλυση της στρατηγικής συμπεριφοράς από φορείς που κατανοούν ότι

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 ΚΟΙΝΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Players-Παίκτες Rules- Κανόνες. Τιµωρείσαι εάν τους παραβιάσεις.

Διαβάστε περισσότερα

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει Επίκουρος Καθηγητής (μόνιμος) 19 Δεκεμβρίου 2015 2 out of 45 3 out of 45 4 out of 45 5 out of 45 6 out of 45 7 out of 45 8 out of 45 Ένας λήπτης απόφασης (decision maker):

Διαβάστε περισσότερα

Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων Βασικές Έννοιες Θεωρίας v. 01/06/2014 Παύλος Σ. Εφραιμίδης Βασικές Έννοιες Θεωρίας Περιεχόμενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός μαθηματικού μοντέλου Το δίλημμα του φυλακισμένου Σημείο ισορροπίας

Διαβάστε περισσότερα

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Ενισχυτική Μάθηση Reinforcement Learning Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Λήψη α οφάσεων ακολουθιακά

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0 ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Παίγνιο: Συμμετέχουν τουλάχιστον δύο παίκτες με τουλάχιστον δύο στρατηγικές ο καθένας και αντίθετα συμφέροντα. Το αποτέλεσμα για κάθε παίκτη καθορίζεται από τις συνδυασμένες επιλογές όλων

Διαβάστε περισσότερα

Βασικές Έννοιες Θεωρίας Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων Παύλος Σ. Εφραιμίδης Περιεχόµενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός µαθηµατικού µοντέλου Το δίληµµα του φυλακισµένου Σηµείο ισορροπίας Nash Θεωρία Παιγνίων Η θεωρία παιγνίων (game theory) µας βοηθάει

Διαβάστε περισσότερα

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη Θεωρία παιγνίων: Μεικτές στρατηγικές και Ισορροπία Nash Κώστας Ρουμανιάς Ο.Π.Α. Τμήμα Δ. Ε. Ο. Σ. 18 Μαρτίου 2012 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Μεικτές στρατηγικές 18 Μαρτίου 2012 1 / 9 Κυριαρχία και μεικτές

Διαβάστε περισσότερα

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2 Θεωρία παιγνίων: Κώστας Ρουμανιάς Ο.Π.Α. Τμήμα Δ. Ε. Ο. Σ. 3 Δεκεμβρίου 2012 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 1 / 21 -best responses Κυνήγι ελαφιού: Δυο κυνηγοί ταυτόχρονα

Διαβάστε περισσότερα

Evolutionary Equilibrium

Evolutionary Equilibrium Evolutionary Equilibrium Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών v. 22.05.2012 Algorithmic Game Theory Evolutionary Equilibium 1 τι θα πούμε εξελικτικά

Διαβάστε περισσότερα

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Κοινωνικά Δίκτυα Θεωρία Παιγνίων Κοινωνικά Δίκτυα Θεωρία Παιγνίων Ν. Μ. Σγούρος Τμήμα Ψηφιακών Συστημάτων, Παν. Πειραιώς sgouros@unipi.gr Ορισμοί Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά: Υπάρχει

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 Προηγούµενο Μάθηµα: Κυρίαρχη Στρατηγική- Κυριαρχούµενη στρατηγική-nash equilibrium Μια στρατηγική

Διαβάστε περισσότερα

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά: Γενικοί Ορισμοί Η Θεωρία Παιγνίων (game theory) εξετάζει δραστηριότητες στις οποίες το αποτέλεσμα της απόφασης ενός ατόμου εξαρτάται όχι μόνο από τον τρόπο με τον οποίο επιλέγει ανάμεσα από διάφορες εναλλακτικές

Διαβάστε περισσότερα

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016 Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών Ιωάννης Παραβάντης Επίκουρος Καθηγητής Απρίλιος 2016 Το κλασσικό μοντέλο του διλήμματος των φυλακισμένων (prisoner s dilemma) προβλέπει τις ακόλουθες ανταμοιβές ( )

Διαβάστε περισσότερα

Extensive Games with Imperfect Information

Extensive Games with Imperfect Information Extensive Games with Imperfect Information Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εκτεταµένα παίγνια µε ατελή πληροφόρηση

Διαβάστε περισσότερα

Εκτεταμένα Παίγνια (Extensive Games)

Εκτεταμένα Παίγνια (Extensive Games) Εκτεταμένα Παίγνια (Extensive Games) Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εκτεταμένα Παίγνια Τα στρατηγικά παίγνια δεν

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες ΕΚΠ 43 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Πιθανοτική Συλλογιστική στο Χρόνο Temporal robabilisic Reasoning Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης ΕΚΠ 43/606 Αυτόνοµοι

Διαβάστε περισσότερα

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι Ροµ οτικοί Πράκτορες Αβεβαιότητα Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Πράκτορες χαρακτηριστικά στοιχεία είδη πρακτόρων αυτόνοµοι

Διαβάστε περισσότερα

John Nash. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

John Nash. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ορισµένα αποτελέσµατα του τα σηµεία ισορροπίας Nash (NE Nash Equilibrium) ύπαρξη σηµείου

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 2: Ισορροπία Nash Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Α Κ Α Η Μ Α Ι Κ Ο Ε Τ Ο Σ 2 0 1 1-2 0 1 2 ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT Ο συγκεκριµένος οδηγός για το πρόγραµµα

Διαβάστε περισσότερα

δημιουργία: http://macedonia.uom.gr/~acg επεξεργασία: Ν.Τσάντας

δημιουργία: http://macedonia.uom.gr/~acg επεξεργασία: Ν.Τσάντας Θεωρία Παιγνίων Μελέτη στοιχείων που χαρακτηρίζουν καταστάσεις ανταγωνιστικής άλληλεξάρτησης με έμφαση στη διαδικασία λήψης αποφάσεων περισσοτέρων από ένα ληπτών απόφασης (αντιπάλων). Παίγνια δύο παικτών

Διαβάστε περισσότερα

Μοντέλα των Cournotκαι Bertrand

Μοντέλα των Cournotκαι Bertrand Μοντέλα των Cournotκαι Bertrand Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Τι θα πούμε Θα εξετάσουμε αναλυτικά το μοντέλο Cournot

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Παρασκευή 16 Οκτωβρίου 2007 ιάρκεια εξέτασης: 3 ώρες (15:00-18:00) ΘΕΜΑ 1

Διαβάστε περισσότερα

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Πολύπλοκα Συστήματα αποτελούνται από πολλές

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Λύσεις 2η σειράς ασκήσεων Προθεσμία παράδοσης: 18 Μαίου 2015 Πρόβλημα 1. (14

Διαβάστε περισσότερα

Ε ανάληψη. Ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) Καταβολές. Ιστορική αναδροµή. Πράκτορες. Περιβάλλοντα. κριτήρια νοηµοσύνης

Ε ανάληψη. Ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) Καταβολές. Ιστορική αναδροµή. Πράκτορες. Περιβάλλοντα. κριτήρια νοηµοσύνης ΠΛΗ 405 Τεχνητή Νοηµοσύνη Αναζήτηση Search Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) κριτήρια νοηµοσύνης Καταβολές συνεισφορά

Διαβάστε περισσότερα

Αυτόνομοι Πράκτορες. Εργασία εξαμήνου. Value Iteration και Q- Learning για Peg Solitaire

Αυτόνομοι Πράκτορες. Εργασία εξαμήνου. Value Iteration και Q- Learning για Peg Solitaire Αυτόνομοι Πράκτορες Εργασία εξαμήνου Value Iteration και Q- Learning για Peg Solitaire Μαρίνα Μαυρίκου 2007030102 1.Εισαγωγικά για το παιχνίδι Το Peg Solitaire είναι ένα παιχνίδι το οποίο παίζεται με ένα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΠΝΕΠΙΣΤΗΜΙΟ ΜΚΕ ΟΝΙΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜ ΕΦΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙ ΠΙΓΝΙΩΝ Εξετάσεις 13 Φεβρουαρίου 2004 ιάρκεια εξέτασης: 2 ώρες (13:00-15:00) ΘΕΜ 1 ο (2.5) α) Για δύο στρατηγικές

Διαβάστε περισσότερα

Παίγνιο φυλακισµένων

Παίγνιο φυλακισµένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ Τµήµα ιεθνών και Ευρωπαϊκών Σπουδών Παίγνιο φυλακισµένων Ιωάννης Παραβάντης Επίκουρος Καθηγητής Νοέµβριος 2009 1 2 Το παραπάνω cartoon δεν έχει σχέση µε το δίληµµα των φυλακισµένων,

Διαβάστε περισσότερα

Αλγοριθμική Θεωρία Παιγνίων

Αλγοριθμική Θεωρία Παιγνίων Αλγοριθμική Θεωρία Παιγνίων ιδάσκοντες: E. Ζάχος, Α. Παγουρτζής,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Πολύπλοκα Συστήματα

Διαβάστε περισσότερα

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε: Κεφάλαιο 2 ο Μέχρι τώρα δώσαµε τα στοιχεία ενός παιγνίου σε µορφή δέντρου και σε µορφή µήτρας. Τώρα θα ορίσουµε τη στρατηγική στην αναλυτική µορφή του παιγνίου (η στρατηγική ορίζεται από κάθε στήλη ή γραµµή

Διαβάστε περισσότερα

Ε ανάληψη. Παιχνίδια παιχνίδια ως αναζήτηση. Βέλτιστες στρατηγικές στρατηγική minimax. Βελτιώσεις κλάδεµα α-β

Ε ανάληψη. Παιχνίδια παιχνίδια ως αναζήτηση. Βέλτιστες στρατηγικές στρατηγική minimax. Βελτιώσεις κλάδεµα α-β ΠΛΗ 405 Τεχνητή Νοηµοσύνη Παιχνίδια Τύχης Παιχνίδια Ατελούς Πληροφόρησης Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Παιχνίδια παιχνίδια ως αναζήτηση Βέλτιστες στρατηγικές

Διαβάστε περισσότερα

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών Μικροοικονομική Ι Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ 1. Κοινά χαρακτηριστικά

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ 1. Κοινά χαρακτηριστικά ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ 1 Εφαρµόζονται σε αγορές που δεν είναι Walrasian. ηλαδή σε αγορές που οι πρωταγωνιστές δεν είναι λήπτες τιµών π.χ. ολιγοπώλιο. Τέτοιες αγορές τις µελετούµε µε παίγνια. Κοινά χαρακτηριστικά

Διαβάστε περισσότερα

www.onlineclassroom.gr

www.onlineclassroom.gr ΑΣΚΗΣΗ 3 (ΜΟΝΑΔΕΣ 25) Σε ένα αγώνα ποδοσφαίρου οι προπονητές των δύο αντίπαλων ομάδων αποφάσισαν ότι έχουν 4 και 3 επιλογές συστήματος, αντίστοιχα. Η αναμενόμενη διαφορά τερμάτων δίνεται από τον παρακάτω

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή raniah@hua.gr 1 Παίγνια Δύο Αντιπάλων Τα προβλήματα όπου η εξέλιξη των καταστάσεων εξαρτάται

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 Συνέχεια από πριν.. Στο προηγούμενο μάθημα είδαμε ότι μπορούμε να επιλύσουμε παίγνια με την μέθοδο της απαλοιφής

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I. ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I. Γενικά Σε μαθήματα όπως η επιχειρησιακή έρευνα και ή λήψη αποφάσεων αναφέραμε τις αποφάσεις κάτω από συνθήκες βεβαιότητας, στις οποίες και εφαρμόζονται κυρίως οι τεχνικές της επιχειρησιακής

Διαβάστε περισσότερα

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία Κεφάλαιο 4 Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία κατά Nash είναι: (α) ένα διάνυσµα από στρατηγικές, έτσι ώστε δεδοµένων των υπολοίπων στρατηγικών, ο παίκτης

Διαβάστε περισσότερα

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ Επιβλέπων Δρ. ΓΕΡΟΝΤΙΔΗΣ ΙΩΑΝΝΗΣ Αναπληρωτής Καθηγητής ΚΑΒΑΛΑ 2006 0 ΠΕΡΙΕΧΟΜΕΝA Σελίδα ΕIΣΑΓΩΓΗ 3 ΚΕΦΑΛΑΙΟ

Διαβάστε περισσότερα

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΠΛΗ 405 Τεχνητή Νοηµοσύνη ΠΛΗ 405 Τεχνητή Νοηµοσύνη Πληροφορηµένη Αναζήτηση Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Πράκτορας ε ίλυσης ροβληµάτων πράκτορας µε στόχο Αναζήτηση διατύπωση

Διαβάστε περισσότερα

ΠΛΗ 513-Αυτόνομοι Πράκτορες Χειμερινό εξάμηνο 2012 Εφαρμογή αλγορίθμων ενισχυτικής μάθησης στο παιχνίδι Βlackjack. Χλης Νικόλαος-Κοσμάς

ΠΛΗ 513-Αυτόνομοι Πράκτορες Χειμερινό εξάμηνο 2012 Εφαρμογή αλγορίθμων ενισχυτικής μάθησης στο παιχνίδι Βlackjack. Χλης Νικόλαος-Κοσμάς ΠΛΗ 513-Αυτόνομοι Πράκτορες Χειμερινό εξάμηνο 2012 Εφαρμογή αλγορίθμων ενισχυτικής μάθησης στο παιχνίδι Βlackjack Χλης Νικόλαος-Κοσμάς Περιγραφή παιχνιδιού Βlackjack: Σκοπός του παιχνιδιού είναι ο παίκτης

Διαβάστε περισσότερα

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία - Ορισμός. Ένα παίγνιο ονομάζεται παίγνιο πλήρους πληροφόρησης (game of complete information) όταν κάθε παίκτης διαθέτει πλήρη πληροφόρηση για τις συναρτήσεις

Διαβάστε περισσότερα

2). V (s) = R(s) + γ max T (s, a, s )V (s ) (3)

2). V (s) = R(s) + γ max T (s, a, s )V (s ) (3) ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Παράδοση: 5 Απριλίου 2012 Μιχελιουδάκης Ευάγγελος 2007030014 ΠΛΗ513: Αυτόνομοι Πράκτορες ΑΝΑΦΟΡΑ ΕΡΓΑΣΙΑΣ Εισαγωγή Η εργασία με

Διαβάστε περισσότερα

Μικροοικονομική Ανάλυση ΙΙ

Μικροοικονομική Ανάλυση ΙΙ Κατ επιλογήν υποχρεωτικό, 3 ώρες εβδομαδιαίως, Θεωρία, Διδάσκον: Περιλαμβάνει: 1. Θεωρία Βιομηχανικής Οργάνωσης 2. Θεωρία Γενικής Ισορροπίας 1 Ορισμοί και βασικές έννοιες Βιομηχανικής Οργάνωσης Ασχολείται

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Εξεταστική περίοδος Ιουνίου 2015 16 Ιουνίου 2015 Διάρκεια εξέτασης: 2,5 ώρες

Διαβάστε περισσότερα

Πιθανοτικός Συμπερασμός: Πού βρίσκομαι στο πλέγμα; [ΠΛΗ 513] Αυτόνομοι πράκτορες - Project Εξαμήνου ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ

Πιθανοτικός Συμπερασμός: Πού βρίσκομαι στο πλέγμα; [ΠΛΗ 513] Αυτόνομοι πράκτορες - Project Εξαμήνου ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ Πιθανοτικός Συμπερασμός: Πού βρίσκομαι στο πλέγμα; [ΠΛΗ 513] Αυτόνομοι πράκτορες - Project Εξαμήνου Γεωργαρά Αθηνά (A.M. 2011030065) ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

Διαβάστε περισσότερα

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Πιθανοτική Συλλογιστική II Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης ίκτυα Bayes σηµασιολογία Πλεονεκτήµατα συµπαγής αναπαράσταση

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΗ ΠΡΟΤΥΠΟΠΟΙΗΣΗ ΣΤΙΣ ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

ΜΑΘΗΜΑΤΙΚΗ ΠΡΟΤΥΠΟΠΟΙΗΣΗ ΣΤΙΣ ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ ΙΑΤΜΗΜΑΤΙΚΟ Μ.Π.Σ. ΜΑΘΗΜΑΤΙΚΗ ΠΡΟΤΥΠΟΠΟΙΗΣΗ ΣΤΙΣ ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: ΠΑΡΑΔΕΙΓΜΑΤΑ ΣΤΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Ι. ΠΟΛΥΡΑΚΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΓΚΡΑΒΑΣ Αριθµός

Διαβάστε περισσότερα

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Πράκτορες και Περιβάλλοντα Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Σήµερα Πράκτορες χαρακτηριστικά στοιχεία είδη πρακτόρων

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Πρόγραµµα Μεταπτυχιακών Σπουδών «Πληροφορική» Μεταπτυχιακή ιατριβή Τίτλος ιατριβής ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΠΟΛΙΤΙΚΩΝ ΑΠΟΦΑΣΕΩΝ ΟΙΚΟΝΟΜΙΚΗ ΚΡΙΣΗ ΣΤΗΝ ΕΛΛΗΝΙΚΗ ΟΙΚΟΝΟΜΙΑ

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 4: Η τραγωδία των κοινών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 4: Η τραγωδία των κοινών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής Ενότητα 4: Η τραγωδία των κοινών Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου

Διαβάστε περισσότερα

Εισαγωγή στην Οικονομική Ανάλυση

Εισαγωγή στην Οικονομική Ανάλυση Εθνικό & Καποδιστριακό Πανεπιστήμιο Αθηνών Εισαγωγή στην Οικονομική Ανάλυση Νίκος Θεοχαράκης Διάλεξη 9 Ιανουάριος 2014 Μορφές αγοράς 1. Τέλειος ανταγωνισμός [Perfect competition] 2. Μονοπωλιακός ανταγωνισμός

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΗ Q-LEARNING ΣΕ GRID WORLD ΚΑΙ ΕΞΥΠΝΟΣ ΧΕΙΡΙΣΜΟΣ ΤΟΥ LEARNING RATE ΛΑΘΙΩΤΑΚΗΣ ΑΡΗΣ ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ 2011-12

ΕΦΑΡΜΟΓΗ Q-LEARNING ΣΕ GRID WORLD ΚΑΙ ΕΞΥΠΝΟΣ ΧΕΙΡΙΣΜΟΣ ΤΟΥ LEARNING RATE ΛΑΘΙΩΤΑΚΗΣ ΑΡΗΣ ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ 2011-12 ΕΦΑΡΜΟΓΗ Q-LEARNING ΣΕ GRID WORLD ΚΑΙ ΕΞΥΠΝΟΣ ΧΕΙΡΙΣΜΟΣ ΤΟΥ LEARNING RATE ΛΑΘΙΩΤΑΚΗΣ ΑΡΗΣ ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ 2011-12 ΣΚΟΠΟΣ ΕΡΓΑΣΙΑΣ Στα πλαίσια του μαθήματος Αυτόνομοι Πράκτορες μας ζητήθηκε να αναπτύξουμε

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017 2η σειρά ασκήσεων Προθεσμία παράδοσης: 16 Ιουνίου 2017 Πρόβλημα 1. (18 μονάδες)

Διαβάστε περισσότερα

Κεφάλαιο 8 ο Τ 3, 1-1, -1 Χ -1, -1 1, 3

Κεφάλαιο 8 ο Τ 3, 1-1, -1 Χ -1, -1 1, 3 Κεφάλαιο 8 ο Συνεχίζουµε µε τις µεικτές στρατηγικές. Θα δούµε τώρα ένα παράδειγµα στο οποίο υπάρχουνε ισορροπίες κατά Nash σε αµιγείς στρατηγικές αλλά πέρα από αυτό υπάρχει και µια ισορροπία κατά Nash

Διαβάστε περισσότερα

ΠΛΗ513 - Αυτόνομοι Πράκτορες Αναφορά Εργασίας

ΠΛΗ513 - Αυτόνομοι Πράκτορες Αναφορά Εργασίας ΠΛΗ513 - Αυτόνομοι Πράκτορες Αναφορά Εργασίας Ομάδα εργασίας: LAB51315282 Φοιτητής: Μάινας Νίκος ΑΦΜ: 2007030088 ΠΕΡΙΓΡΑΦΗ ΙΔΕΑΣ Η ιδέα της εργασίας βασίζεται στην εύρεση της καλύτερης πολιτικής για ένα

Διαβάστε περισσότερα

ΕΜΠΕΙΡΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΗΣ NASH ΙΣΟΡΡΟΠΙΑΣ

ΕΜΠΕΙΡΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΗΣ NASH ΙΣΟΡΡΟΠΙΑΣ ΕΜΠΕΙΡΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΗΣ NASH ΙΣΟΡΡΟΠΙΑΣ ΒΛΑΧΟΠΟΥΛΟΥ ΑΘΑΝΑΣΙΑ (Α.Μ. 11/08) ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Επιβλέπων καθηγητής: Παπαναστασίου Ιωάννης Εξεταστές : Νούλας Αθανάσιος Ζαπράνης Αχιλλέας ιατµηµατικό Πρόγραµµα

Διαβάστε περισσότερα

Παίγνια Συμφόρησης. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Παίγνια Συμφόρησης. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο Παίγνια Συμφόρησης ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Μοντέλο Ανάθεσης Πόρων Σύνολο πόρων Ε = { e 1,, e m }. Πόροι: ακμές δικτύου, υπηρεσίες

Διαβάστε περισσότερα

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης - Οι επιχειρήσεις δεν ανταγωνίζονται μόνο ως προς τις τιμές στις οποίες επιλέγουν να πουλήσουν τα προϊόντα τους. - Ο μη-τιμολογιακός ανταγωνισμός

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΘΕΜΑ 1 ο (2.5) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Δευτέρα 3 Σεπτεμβρίου 2012 Διάρκεια εξέτασης: 3 ώρες (16:30-19:30)

Διαβάστε περισσότερα

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης Δημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Μοντέλο Ανάθεσης Πόρων Σύνολο πόρων Ε = { e 1,, e

Διαβάστε περισσότερα

Παραδείγματα Παιγνίων

Παραδείγματα Παιγνίων Παραδείγματα Παιγνίων Παύλος Σ. Εφραιμίδης v1.3, 01/06/2014 Τι περιλαμβάνει ένα παίγνιο: Παίγνιο Παίκτες Πιθανές κινήσεις για κάθε παίκτη Απόδοση ή όφελος για κάθε παίκτη σε κάθε πιθανή έκβαση του παιγνίου

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 9η: Basics of Game Theory Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 9η: Basics of Game Theory Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Ψηφιακή Οικονομία Διάλεξη 9η: Basics of Game Theory Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών Course Outline Part II: Mathematical Tools Firms - Basics of Industrial

Διαβάστε περισσότερα

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0 ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ιδάσκων: Ε. Πετράκης. Επαναληπτική Εξέταση: 15/09/99 Απαντήστε στα τρία από τα τέσσερα θέµατα. Όλα τα υποερωτήµατα βαθµολογούνται το ίδιο. 1. Θεωρήσατε ένα ολιγοπωλιακό κλάδο όπου τρεις

Διαβάστε περισσότερα

Εισαγωγή στη Θεωρία Αποφάσεων. Λήψη απλών αποφάσεων για έναν πράκτορα

Εισαγωγή στη Θεωρία Αποφάσεων. Λήψη απλών αποφάσεων για έναν πράκτορα Εισαγωγή στη Θεωρία Αποφάσεων Λήψη απλών αποφάσεων για έναν πράκτορα Oρθολογικές αποφάσεις Ένας πράκτορας βασισμένος στη λογική Έχει ένα στόχο (μια κατάσταση περιβάλλοντος που θέλει να πετύχει) Καταστρώνει

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 007 ιδάσκων : Ηλίας Κουτσουπιάς Μάθηµα : Overview Of The Algorithmic Game Theory Ηµεροµηνία : 007/04/19 Σηµειώσεις : Ελενα Χατζηγιωργάκη,

Διαβάστε περισσότερα

Ορισμένες Κατηγορίες Αλγορίθμων

Ορισμένες Κατηγορίες Αλγορίθμων Ορισμένες Κατηγορίες Αλγορίθμων Παύλος Εφραιμίδης pefraimi ee.duth.gr Οριασμένες κατηγορίες αλγορίθμων 1 Αλγόριθμοι Προσέγγισης Υπολογιστικά προβλήματα τα οποία είναι NPhard δεν μπορούμε να τα λύσουμε

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Ψηφιακή Οικονομία Άσκηση αυτοαξιολόγησης 4 Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών CS-593 Game Theory 1. For the game depicted below, find the mixed strategy

Διαβάστε περισσότερα

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος Συνδυαστικά Παίγνια 1. Σε ένα παιγνίδι 2 παικτών µηδενικού αθροίσµατος οι παίκτες αναγγέλουν εναλλάξ ένα αριθµό µεταξύ {2,3,4}. Ο παίκτης που κάνει το άθροισµα των αριθµών που έχουν αναγγελθεί να φθάσει

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 6η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται στα βιβλία Τεχνητή Νοημοσύνη των Βλαχάβα κ.ά., 3η έκδοση, Β. Γκιούρδας

Διαβάστε περισσότερα

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής. Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής. Ιστορική αναδρομή 1713 Ο Francis Waldegrave, σε ένα γράμμα του, παρουσίασε την πρώτη μικτή στρατηγική μεγίστου

Διαβάστε περισσότερα

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2 Κεφάλαιο 2 Στατικά παίγνια με πλήρη πληροφόρηση 2.1 Εισαγωγή Η πιο απλή, αλλά και θεμελιώδης, κατηγορία παιγνίων είναι αυτή των στατικών παιγνίων με πλήρη πληροφόρηση. Στα παίγνια αυτά οι συμμετέχοντες

Διαβάστε περισσότερα

Θεωρία Παιγνίων. Εισαγωγικές έννοιες και Τεχνικές

Θεωρία Παιγνίων. Εισαγωγικές έννοιες και Τεχνικές Θεωρία Παιγνίων Εισαγωγικές έννοιες και Τεχνικές Η επιβίωση μας εξαρτάται από την αλληλεπίδραση με άλλα άτομα Η επιβίωση μας εξαρτάται από την αλληλεπίδραση με άλλα άτομα Η επιβίωση μας εξαρτάται από την

Διαβάστε περισσότερα

Ε ανάληψη. Προβλήµατα ικανο οίησης εριορισµών. ορισµός και χαρακτηριστικά Ε ίλυση ροβληµάτων ικανο οίησης εριορισµών

Ε ανάληψη. Προβλήµατα ικανο οίησης εριορισµών. ορισµός και χαρακτηριστικά Ε ίλυση ροβληµάτων ικανο οίησης εριορισµών ΠΛΗ 405 Τεχνητή Νοηµοσύνη Αναζήτηση µε Αντι αλότητα Adversarial Search Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Προβλήµατα ικανο οίησης εριορισµών ορισµός και

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 3 (θεωρία παιγνίων) Οι δύο μεγαλύτερες τράπεζες μιας χώρας, Α και Β, εκτιμούν ότι μια άλλη τράπεζα, η Γ, θα κλείσει στο προσεχές διάστημα και πρόκειται να προχωρήσουν σε διαφημιστικές εκστρατείες

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Τρίτη 15 Ιανουαρίου 2008 ιάρκεια εξέτασης: 3 ώρες (13:00-16:00) ΘΕΜΑ 1 ο (2,5

Διαβάστε περισσότερα

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 ) Κεφάλαιο 7ο Μιλήσαµε στο προηγούµενο κεφάλαιο για το τι θα συµβεί αν οι επιχειρήσεις ανταγωνίζονται σε τιµές. Επιπλέον µιλήσαµε για το πως αποδεικνύεται το παράδοξο του Bertrand και καθώς επίσης και για

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς. Τμήμα Οργάνωση και Διοίκηση Επιχειρήσεων

Πανεπιστήμιο Πειραιώς. Τμήμα Οργάνωση και Διοίκηση Επιχειρήσεων Πανεπιστήμιο Πειραιώς Τμήμα Οργάνωση και Διοίκηση Επιχειρήσεων Πρόγραμμα Μεταπτυχιακών Σπουδών «Διοίκηση Επιχειρήσεων Ολική Ποιότητα με Διεθνή Προσανατολισμό» Μεταπτυχιακή Διατριβή Τίτλος Διατριβής «Θεωρία

Διαβάστε περισσότερα

Αλληλεπιδράσεις πρακτόρων. Πώς σχεδιάζουμε κοινωνίες πρακτόρων;

Αλληλεπιδράσεις πρακτόρων. Πώς σχεδιάζουμε κοινωνίες πρακτόρων; Αλληλεπιδράσεις πρακτόρων Πώς σχεδιάζουμε κοινωνίες πρακτόρων; Δεν υπάρχει σύστημα ενός πράκτορα! πράκτορας οργανωσιακή σχέση πρακτόρων αλληλεπίδραση πρακτόρων σφαίρα επιρροής πράκτορα περιβάλλον 2 Δεν

Διαβάστε περισσότερα

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Συστήματα με Ιδιοτελείς (και Ανταγωνιστικούς) Χρήστες

Διαβάστε περισσότερα

ΜΕΣΑΠΣΤΦΙΑΚΗ ΔΙΑΣΡΙΒΗ

ΜΕΣΑΠΣΤΦΙΑΚΗ ΔΙΑΣΡΙΒΗ Ε Λ Λ Η Ν Ι Κ Η Δ Η Μ Ο Κ Ρ Α Σ Ι Α ΔΙΙΔΡΤΜΑΣΙΚΟ ΔΙΑΣΜΗΜΑΣΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΣΑΠΣΤΦΙΑΚΩΝ ΠΟΤΔΩΝ ΑΚΑΔΗΜΑΪΚΟΤ ΕΣΟΤ 2016-17 ΣΡΑΣΙΩΣΙΚΗ ΦΟΛΗ ΕΤΕΛΠΙΔΩΝ Σμήμα τρατιωτικών Επιστημών ΕΥΑΡΜΟΜΕΝΗ ΕΠΙΦΕΙΡΗΙΑΚΗ ΕΡΕΤΝΑ

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ Θεωρία Παιγνίων: Θεωρητική προσέγγιση και μια εφαρμογή. Εμμανουήλ Αν. Βασιλάκης ΕΡΓΑΣΙΑ Που υποβλήθηκε στο Τμήμα Στατιστικής του Οικονομικού Πανεπιστημίου

Διαβάστε περισσότερα

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΠΛΗ 405 Τεχνητή Νοηµοσύνη ΠΛΗ 405 Τεχνητή Νοηµοσύνη Πράκτορες και Περιβάλλοντα Αναζήτηση Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Ορισµοί της Τεχνητής Νοηµοσύνης κριτήρια νοηµοσύνης Καταβολές

Διαβάστε περισσότερα

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης 3 η Διάλεξη-Περιεχόμενα (1/2) Σημείο ή ζεύγος ισορροπίας κατά Nash Λύση ακολουθιακής κυριαρχίας και σημεία ισορροπίας Nash Αλγοριθμική εύρεση σημείων ισορροπίας

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 10η: Basics of Game Theory part 2 Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 10η: Basics of Game Theory part 2 Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Ψηφιακή Οικονομία Διάλεξη 0η: Basics of Game Theory part 2 Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών Best Response Curves Used to solve for equilibria in games

Διαβάστε περισσότερα

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8 Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8 Ένα από τα παράδοξα της ισορροπίας Nash που μπορεί να θεωρηθεί και σαν αδυναμία της είναι ότι σε κάποια παίγνια οι παίκτες έχουν μεγαλύτερο όφελος αν δεν διαλέξουν

Διαβάστε περισσότερα

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης 1 η Διάλεξη Ορισμός Θεωρίας Παιγνίων και Παιγνίου Κατηγοριοποίηση παιγνίων Επίλυση παιγνίου Αξία (τιμή) παιγνίου Δίκαιο παίγνιο Αναπαράσταση Παιγνίου Με πίνακα Με

Διαβάστε περισσότερα