ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες
|
|
- Βηθεσδά Κουβέλης
- 7 χρόνια πριν
- Προβολές:
Transcript
1 ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Μερική Παρατηρησιµότητα Θεωρία Παιγνίων Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης
2 Ε ανάληψη Reinforcement Learning (RL) problems and approaches Prediction temporal difference learning least-squares temporal difference (LSTD) learning Control Q-learning least-squares policy iteration (LSPI) Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 2
3 Σήµερα Μερική αρατηρησιµότητα POMDPs βέλτιστες πολιτικές µετατροπή σε MDP Θεωρία αιγνίων στρατηγικές ισορροπίες Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 3
4 Μερική Παρατηρησιµότητα Partial Observability
5 Μερικώς Παρατηρήσιµα Περιβάλλοντα Partial Observability ο πράκτορας δεν γνωρίζει ακριβώς σε ποια κατάσταση βρίσκεται το τι θα κάνει εξαρτάται από το τι ιστεύει για το που βρίσκεται Παράδειγµα Αρχική κατανοµή πιθανότητας Μετά από 5 κινήσεις αριστερά Μετά από 5 κινήσεις επάνω Μετά από 5 κινήσεις δεξιά Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 5
6 Partially Observable MDP POMDP (S, B, A, O, P, R, γ, D) S: state space of the process B: observation space of the process A: action space of the process O: observation model, O(o s) P: transition model, P(s a, s) R: reward function, R(s) γ: discount factor, 0 < γ 1 D: initial state distribution Markov property next state, observation, reward are independent of history Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 6
7 Κατάσταση Πε οίθησης Belief State b πιθανοτική κατανοµή πάνω στο χώρο καταστάσεων b(s): πιθανότητα που αποδίδεται στην κατάσταση s από την b αρχική κατάσταση πεποίθησης b 0 Ενηµέρωση υπολογισµός καταστάσεων πεποίθησης = φιλτράρισµα ( s ) = ao( s', o) T( s, a s) b( s) b, s Παράδειγµα b =,,,,,,,,, 0, Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 7
8 Πράκτορας POMDP Βέλτιστη ολιτική η βέλτιστη ενέργεια εξαρτάται από την τρέχουσα κατάσταση πεποίθησης βέλτιστη πολιτική *(b) [ όχι *(s) όπως στην περίπτωση MDP ] απεικόνιση από το (συνεχή) χώρο πεποιθήσεων στο χώρο ενεργειών Κύκλος λειτουργίας εκτέλεσε την ενέργεια α = *(b) διάβασε την παρατήρηση ο ενηµέρωσε την πεποίθηση b σύµφωνα µε την παρατήρηση o επανάλαβε Παρατήρηση µε δεδοµένη την a, γίνεται µετάβαση σε νέα b, ανάλογα µε την o Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 8
9 Μετατρο ή POMDP σε MDP Μετατρο ή συνάρτηση µετάβασης µεταξύ καταστάσεων πεποίθησης = P( b ' o, a, b) O( s ', o) o s ' s ( ) ( ) τ ( b, a, b ') T s, a, s b s συνάρτηση ανταµοιβής ως προς τις καταστάσεις πεποίθησης ρ ( b) b( s) R( s) = s MDP (b(s),a,τ,ρ,γ,d) στο χώρο των καταστάσεων πεποίθησης! Ε ίλυση η ε ίλυση ενός POMDP στο χώρο καταστάσεων ανάγεται σε ε ίλυση ενός MDP στο χώρο των καταστάσεων ε οίθησης πρόβληµα: συνεχής χώρος καταστάσεων πεποίθησης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 9
10 Παράδειγµα Αρχική ε οίθηση οµοιόµορφη στις 9 καταστάσεις Βέλτιστη ολιτική απλή ακολουθία, λόγω έλλειψης παρατηρήσεων [Αριστερά, Ε άνω, Ε άνω, εξιά, Ε άνω, Ε άνω, εξιά, Ε άνω, Ε άνω, εξιά, Ε άνω, εξιά, Ε άνω, εξιά, Ε άνω, ] πιθανότητα επιτυχίας 86,6%, αναµενόµενη χρησιµότητα 0,38 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 10
11 Θεωρία Παιγνίων Game Theory
12 Παίγνιο Two Finger Morra απλοποίηση του inspection game Παίκτες δύο παίκτες Ε (even), Ο (odd) Ενέργειες κάθε παίκτης µπορεί να παίξει ένα ή δύο οι παίκτες παίζουν ταυτόχρονα Πίνακας α ολαβών (payoff matrix) Ε\Ο ένα δύο ένα E= +2, O= 2 E= 3, O= +3 δύο E= 3, O= +3 E= +4, O= 4 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 12
13 Ορολογία Παιγνίων Αµιγής στρατηγική (pure strategy) αιτιοκρατική πολιτική, µία ενέργεια σε κάθε κατάσταση Μικτή στρατηγική (mixed strategy) τυχαιοποιηµένη πολιτική, πιθανοτική κατανοµή στις ενέργειες Προφίλ στρατηγικών (strategy profile) µία ανάθεση µίας στρατηγικής σε κάθε παίκτη Α οτέλεσµα (outcome) η αριθµητική τιµή του παιχνιδιού για κάθε παίκτη Λύση αιγνίου (game solution) προφίλ στρατηγικών όπου κάθε παίκτης υιοθετεί ορθολογική στρατηγική ερώτηµα: πώς προσδιορίζεται η έννοια «ορθολογική»; Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 13
14 Το ίληµµα των Φυλακισµένων (Prisoner s Dilemma) Βασίλης: οµολογία Βασίλης: άρνηση Αλίκη: οµολογία A= 5, B= 5 A= 0, B= 10 Αλίκη: άρνηση A= 10, B= 0 A= 1, B= 1 Συλλογισµός εάν ο Βασίλης οµολογήσει... εάν ο Βασίλης αρνηθεί... στρατηγική: «οµολογία» αποτέλεσµα: (-5, -5)! Παράδοξο η στρατηγική «άρνηση» έχει αποτέλεσµα (-1,-1) είναι επιτρεπτή, αλλά απίθανη επιλογή! Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 14
15 Στρατηγικές και Α οτελέσµατα Κυρίαρχη στρατηγική (dominant strategy) ισχυρή κυριαρχία (strong domination) η στρατηγική s για το παίκτη p κυριαρχεί ισχυρά επί της s, εάν η s έχει καλύτερο αποτέλεσµα από την s για κάθε στρατηγική των άλλων παικτών ασθενής κυριαρχία (weak domination) η στρατηγική s για το παίκτη p κυριαρχεί ασθενώς επί της s, εάν η s έχει καλύτερο αποτέλεσµα από την s σε ένα τουλάχιστον προφίλ στρατηγικών και δεν είναι χειρότερη σε κανένα άλλο προφίλ Σχέσεις µεταξύ α οτελεσµάτων κυριαρχία κατά Pareto (Pareto domination) ένα αποτέλεσµα a κυριαρχεί κατά Pareto έναντι κάποιου άλλου a όταν όλοι οι παίκτες προτιµούν το a από το a Pareto βέλτιστο (Pareto optimality) εάν δεν υπάρχει άλλο αποτέλεσµα που προτιµούν οι παίκτες Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 15
16 Ισορρο ίες Ισορρο ία (equilibrium) όταν κανένας παίκτης δεν µπορεί να επωφεληθεί από την αλλαγή στρατηγικών, εφόσον οι άλλοι διατηρούν τη στρατηγική τους τοπικό βέλτιστο στο χώρο των πολιτικών Ισορρο ία κυρίαρχων στρατηγικών όταν κάθε παίκτης υιοθετεί µια κυρίαρχη στρατηγική δεν υπάρχει τέτοια ισορροπία σε όλα τα παιχνίδια Nash equilibrium σε κάθε παιχνίδι υπάρχει τουλάχιστον ένα σηµείο ισορροπίας Nash περιλαµβάνει και την περίπτωση µικτών στρατηγικών υπάρχουν ισορροπίες, ακόµα και χωρίς κυρίαρχες στρατηγικές αποδείχθηκε από τον John Forbes Nash, Jr ( ) Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 16
17 Παράδειγµα Best: dvd Best: cd Acme: dvd A= 9, B= 9 A= 3, B= 1 Acme: cd A= 4, B= 1 A= 5, B= 5 Ισορρο ίες Nash (dvd, dvd) και (cd, cd) ερώτηµα: ποια από τις δύο θα επιλέξουν; «απάντηση»: επιλογή της βέλτιστης λύσης κατά Pareto (dvd, dvd) Λύση ανάγκη για συντονισµό/διαπραγµάτευση ενέργειες επικοινωνίας µεταξύ πρακτόρων παιχνίδια συντονισµού (coordination games) Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 17
18 Μελέτη Σύγγραµµα Ενότητες 17.4 και 17.6 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 18
ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες
ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Θεωρία Παιγνίων Μαρκωβιανά Παιχνίδια Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Μερική αρατηρησιµότητα POMDPs
Διαβάστε περισσότεραΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες
ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Λήψη Α οφάσεων υ ό Αβεβαιότητα Decision Making under Uncertainty Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Εντο
Διαβάστε περισσότεραΛήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων
Λήψη απόφασης σε πολυπρακτορικό περιβάλλον Θεωρία Παιγνίων Αβεβαιότητα παρουσία άλλου πράκτορα Μια άλλη πηγή αβεβαιότητας είναι η παρουσία άλλου πράκτορα στο περιβάλλον, ακόμα κι όταν ένας πράκτορας είναι
Διαβάστε περισσότεραΘεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής
Θεωρία Παιγνίων και Αποφάσεων Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής Ε. Μαρκάκης Επικ. Καθηγητής Λύσεις παιγνίων 2 Επιλέγοντας στρατηγική... Δεδομένου ενός παιγνίου, τι στρατηγική πρέπει
Διαβάστε περισσότεραΔιάλεξη 7. Θεωρία παιγνίων VA 28, 29
Διάλεξη 7 Θεωρία παιγνίων VA 28, 29 Θεωρία παιγνίων Στη θεωρία παιγνίων χρησιμοποιούμε υποδείγματα για τη στρατηγική συμπεριφορά των οικονομικών μονάδων που καταλαβαίνουν ότι οι ενέργειές τους επηρεάζουν
Διαβάστε περισσότεραΠαιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας
Επίκουρος Καθηγητής Ιωάννης Παραβάντης Τµήµα ιεθνών και Ευρωπαϊκών Σπουδών ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ Μάρτιος 2010 Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας 1. Εισαγωγή Στο παρόν φυλλάδιο παριστάνουµε περιπτώσεις
Διαβάστε περισσότεραΘεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.
Θεωρία Παιγνίων και Αποφάσεων Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων Ε. Μαρκάκης Επικ. Καθηγητής Παίγνια πολλών παικτών 2 Παίγνια με > 2 παίκτες Όλοι οι ορισμοί που
Διαβάστε περισσότερα- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να
- Παράδειγμα. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να αποκρούσει ένας τερματοφύλακας. - Αν οι δύο παίκτες επιλέξουν
Διαβάστε περισσότεραΒασικές Αρχές της Θεωρίας Παιγνίων
Βασικές Αρχές της Θεωρίας Παιγνίων - Ορισμός. Αν οι επιλογές μιας επιχείρησης εξαρτώνται από την αναμενόμενη αντίδραση των υπόλοιπων επιχειρήσεων που συμμετέχουν στην αγορά, τότε υπάρχει στρατηγική αλληλεπίδραση
Διαβάστε περισσότερα10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;
HA. VAIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση Κεφάλαιο 29 Θεωρία παιγνίων Θεωρία παιγνίων Η θεωρία παιγνίων βοηθά στην ανάλυση της στρατηγικής συμπεριφοράς από φορείς που κατανοούν ότι οι
Διαβάστε περισσότεραΒασικές Έννοιες Θεωρίας Παιγνίων
Παύλος Σ. Εφραιμίδης Έκδοση 05/11/2013 Περιεχόμενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός μαθηματικού μοντέλου Το δίλημμα του φυλακισμένου Σημείο ισορροπίας Nash Θεωρία Παιγνίων Η θεωρία παιγνίων (game
Διαβάστε περισσότεραΜικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1
Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1 Σημεία ισορροπίας Nash: Yπάρχουν πάντα; Έχουν όλα τα παίγνια σημείο ισορροπίας; - Ναι, στην εξιδανικευμένη
Διαβάστε περισσότεραHAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση
HAL R. VARIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση Κεφάλαιο 29 Θεωρία παιγνίων Θεωρία παιγνίων Η θεωρία παιγνίων βοηθά στην ανάλυση της στρατηγικής συμπεριφοράς από φορείς που κατανοούν ότι
Διαβάστε περισσότεραΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012
ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 ΚΟΙΝΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Players-Παίκτες Rules- Κανόνες. Τιµωρείσαι εάν τους παραβιάσεις.
Διαβάστε περισσότεραΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει
ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει Επίκουρος Καθηγητής (μόνιμος) 19 Δεκεμβρίου 2015 2 out of 45 3 out of 45 4 out of 45 5 out of 45 6 out of 45 7 out of 45 8 out of 45 Ένας λήπτης απόφασης (decision maker):
Διαβάστε περισσότεραΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες
ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Ενισχυτική Μάθηση Reinforcement Learning Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Λήψη α οφάσεων ακολουθιακά
Διαβάστε περισσότεραΒασικές Έννοιες Θεωρίας Παιγνίων
Βασικές Έννοιες Θεωρίας v. 01/06/2014 Παύλος Σ. Εφραιμίδης Βασικές Έννοιες Θεωρίας Περιεχόμενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός μαθηματικού μοντέλου Το δίλημμα του φυλακισμένου Σημείο ισορροπίας
Διαβάστε περισσότεραΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0
ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Παίγνιο: Συμμετέχουν τουλάχιστον δύο παίκτες με τουλάχιστον δύο στρατηγικές ο καθένας και αντίθετα συμφέροντα. Το αποτέλεσμα για κάθε παίκτη καθορίζεται από τις συνδυασμένες επιλογές όλων
Διαβάστε περισσότεραNotes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2
Θεωρία παιγνίων: Κώστας Ρουμανιάς Ο.Π.Α. Τμήμα Δ. Ε. Ο. Σ. 3 Δεκεμβρίου 2012 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Θεωρία παιγνίων: 3 Δεκεμβρίου 2012 1 / 21 -best responses Κυνήγι ελαφιού: Δυο κυνηγοί ταυτόχρονα
Διαβάστε περισσότεραΒασικές Έννοιες Θεωρίας Παιγνίων
Παύλος Σ. Εφραιμίδης Περιεχόµενα Τι είναι η θεωρία παιγνίων Ο ρόλος ενός µαθηµατικού µοντέλου Το δίληµµα του φυλακισµένου Σηµείο ισορροπίας Nash Θεωρία Παιγνίων Η θεωρία παιγνίων (game theory) µας βοηθάει
Διαβάστε περισσότεραΚυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη
Θεωρία παιγνίων: Μεικτές στρατηγικές και Ισορροπία Nash Κώστας Ρουμανιάς Ο.Π.Α. Τμήμα Δ. Ε. Ο. Σ. 18 Μαρτίου 2012 Κώστας Ρουμανιάς (Δ.Ε.Ο.Σ.) Μεικτές στρατηγικές 18 Μαρτίου 2012 1 / 9 Κυριαρχία και μεικτές
Διαβάστε περισσότεραEvolutionary Equilibrium
Evolutionary Equilibrium Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών v. 22.05.2012 Algorithmic Game Theory Evolutionary Equilibium 1 τι θα πούμε εξελικτικά
Διαβάστε περισσότεραΘεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής
Θεωρία Παιγνίων και Αποφάσεων Ενότητα 4: Μεικτές Στρατηγικές Ε. Μαρκάκης Επικ. Καθηγητής Μεικτές στρατηγικές σε παίγνια 2 Σημεία ισορροπίας: Ύπαρξη Δεν έχουν όλα τα παίγνια σημείο ισορροπίας Π.χ. Το Matching
Διαβάστε περισσότεραΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012
ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 Προηγούµενο Μάθηµα: Κυρίαρχη Στρατηγική- Κυριαρχούµενη στρατηγική-nash equilibrium Μια στρατηγική
Διαβάστε περισσότεραΚεφάλαιο 29 Θεωρία παιγνίων
HA. VAIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση Εκδόσεις Κριτική Κεφάλαιο 29 Θεωρία παιγνίων Ύλη για τη Μίκρο ΙΙ: κεφάλαιο 29.1, 29.2, 29.4, 29.7, 29.8 Κεφάλαιο 29 Θεωρία παιγνίων Ταυτόχρονα
Διαβάστε περισσότεραΚοινωνικά Δίκτυα Θεωρία Παιγνίων
Κοινωνικά Δίκτυα Θεωρία Παιγνίων Ν. Μ. Σγούρος Τμήμα Ψηφιακών Συστημάτων, Παν. Πειραιώς sgouros@unipi.gr Ορισμοί Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά: Υπάρχει
Διαβάστε περισσότεραΈνα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:
Γενικοί Ορισμοί Η Θεωρία Παιγνίων (game theory) εξετάζει δραστηριότητες στις οποίες το αποτέλεσμα της απόφασης ενός ατόμου εξαρτάται όχι μόνο από τον τρόπο με τον οποίο επιλέγει ανάμεσα από διάφορες εναλλακτικές
Διαβάστε περισσότεραΤμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016
Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών Ιωάννης Παραβάντης Επίκουρος Καθηγητής Απρίλιος 2016 Το κλασσικό μοντέλο του διλήμματος των φυλακισμένων (prisoner s dilemma) προβλέπει τις ακόλουθες ανταμοιβές ( )
Διαβάστε περισσότεραExtensive Games with Imperfect Information
Extensive Games with Imperfect Information Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εκτεταµένα παίγνια µε ατελή πληροφόρηση
Διαβάστε περισσότεραΕκτεταμένα Παίγνια (Extensive Games)
Εκτεταμένα Παίγνια (Extensive Games) Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εκτεταμένα Παίγνια Τα στρατηγικά παίγνια δεν
Διαβάστε περισσότεραΑσκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1
Ασκήσεις Ιωάννα Καντζάβελου Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1 1. Επιλογή Διαδρομής 2. Παραλλαγή του Matching Pennies 3. Επίλυση Matching Pennies με Βέλτιστες Αποκρίσεις 4. Επίλυση BoS με Βέλτιστες
Διαβάστε περισσότεραΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής
Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται
Διαβάστε περισσότεραJohn Nash. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ορισµένα αποτελέσµατα του τα σηµεία ισορροπίας Nash (NE Nash Equilibrium) ύπαρξη σηµείου
Διαβάστε περισσότεραΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες
ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι Ροµ οτικοί Πράκτορες Αβεβαιότητα Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Πράκτορες χαρακτηριστικά στοιχεία είδη πρακτόρων αυτόνοµοι
Διαβάστε περισσότεραΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες
ΕΚΠ 43 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Πιθανοτική Συλλογιστική στο Χρόνο Temporal robabilisic Reasoning Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης ΕΚΠ 43/606 Αυτόνοµοι
Διαβάστε περισσότεραΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT
ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Α Κ Α Η Μ Α Ι Κ Ο Ε Τ Ο Σ 2 0 1 1-2 0 1 2 ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT Ο συγκεκριµένος οδηγός για το πρόγραµµα
Διαβάστε περισσότεραΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής
Ενότητα 2: Ισορροπία Nash Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας
Διαβάστε περισσότεραΜοντέλα των Cournotκαι Bertrand
Μοντέλα των Cournotκαι Bertrand Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Τι θα πούμε Θα εξετάσουμε αναλυτικά το μοντέλο Cournot
Διαβάστε περισσότεραΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Παρασκευή 16 Οκτωβρίου 2007 ιάρκεια εξέτασης: 3 ώρες (15:00-18:00) ΘΕΜΑ 1
Διαβάστε περισσότεραΑλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες
Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Πολύπλοκα Συστήματα αποτελούνται από πολλές
Διαβάστε περισσότεραΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Λύσεις 2η σειράς ασκήσεων Προθεσμία παράδοσης: 18 Μαίου 2015 Πρόβλημα 1. (14
Διαβάστε περισσότεραΕ ανάληψη. Ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) Καταβολές. Ιστορική αναδροµή. Πράκτορες. Περιβάλλοντα. κριτήρια νοηµοσύνης
ΠΛΗ 405 Τεχνητή Νοηµοσύνη Αναζήτηση Search Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) κριτήρια νοηµοσύνης Καταβολές συνεισφορά
Διαβάστε περισσότεραδημιουργία: http://macedonia.uom.gr/~acg επεξεργασία: Ν.Τσάντας
Θεωρία Παιγνίων Μελέτη στοιχείων που χαρακτηρίζουν καταστάσεις ανταγωνιστικής άλληλεξάρτησης με έμφαση στη διαδικασία λήψης αποφάσεων περισσοτέρων από ένα ληπτών απόφασης (αντιπάλων). Παίγνια δύο παικτών
Διαβάστε περισσότεραΑυτόνομοι Πράκτορες. Εργασία εξαμήνου. Value Iteration και Q- Learning για Peg Solitaire
Αυτόνομοι Πράκτορες Εργασία εξαμήνου Value Iteration και Q- Learning για Peg Solitaire Μαρίνα Μαυρίκου 2007030102 1.Εισαγωγικά για το παιχνίδι Το Peg Solitaire είναι ένα παιχνίδι το οποίο παίζεται με ένα
Διαβάστε περισσότεραΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ
ΠΝΕΠΙΣΤΗΜΙΟ ΜΚΕ ΟΝΙΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜ ΕΦΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙ ΠΙΓΝΙΩΝ Εξετάσεις 13 Φεβρουαρίου 2004 ιάρκεια εξέτασης: 2 ώρες (13:00-15:00) ΘΕΜ 1 ο (2.5) α) Για δύο στρατηγικές
Διαβάστε περισσότεραΠαίγνιο φυλακισµένων
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ Τµήµα ιεθνών και Ευρωπαϊκών Σπουδών Παίγνιο φυλακισµένων Ιωάννης Παραβάντης Επίκουρος Καθηγητής Νοέµβριος 2009 1 2 Το παραπάνω cartoon δεν έχει σχέση µε το δίληµµα των φυλακισµένων,
Διαβάστε περισσότεραΑλγοριθμική Θεωρία Παιγνίων
Αλγοριθμική Θεωρία Παιγνίων ιδάσκοντες: E. Ζάχος, Α. Παγουρτζής,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Πολύπλοκα Συστήματα
Διαβάστε περισσότεραΕ ανάληψη. Παιχνίδια παιχνίδια ως αναζήτηση. Βέλτιστες στρατηγικές στρατηγική minimax. Βελτιώσεις κλάδεµα α-β
ΠΛΗ 405 Τεχνητή Νοηµοσύνη Παιχνίδια Τύχης Παιχνίδια Ατελούς Πληροφόρησης Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Παιχνίδια παιχνίδια ως αναζήτηση Βέλτιστες στρατηγικές
Διαβάστε περισσότεραΚεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:
Κεφάλαιο 2 ο Μέχρι τώρα δώσαµε τα στοιχεία ενός παιγνίου σε µορφή δέντρου και σε µορφή µήτρας. Τώρα θα ορίσουµε τη στρατηγική στην αναλυτική µορφή του παιγνίου (η στρατηγική ορίζεται από κάθε στήλη ή γραµµή
Διαβάστε περισσότεραΜικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών
Μικροοικονομική Ι Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού
Διαβάστε περισσότεραwww.onlineclassroom.gr
ΑΣΚΗΣΗ 3 (ΜΟΝΑΔΕΣ 25) Σε ένα αγώνα ποδοσφαίρου οι προπονητές των δύο αντίπαλων ομάδων αποφάσισαν ότι έχουν 4 και 3 επιλογές συστήματος, αντίστοιχα. Η αναμενόμενη διαφορά τερμάτων δίνεται από τον παρακάτω
Διαβάστε περισσότεραΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ
ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ 2011-2012 Συνέχεια από πριν.. Στο προηγούμενο μάθημα είδαμε ότι μπορούμε να επιλύσουμε παίγνια με την μέθοδο της απαλοιφής
Διαβάστε περισσότερα6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου
Θεωρία παιγνίων 1 1. Παρακίνηση: Honda και Toyota 2. Ισορροπία κατά Nash 3. Το δίλημμα του φυλακισμένου 4. Ισορροπία με κυρίαρχη στρατηγική 5. Μειονεκτήματα της ισορροπίας κατά Nash 6. Παίγνια αλληλοδιαδοχικών
Διαβάστε περισσότεραΤεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή
Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή raniah@hua.gr 1 Παίγνια Δύο Αντιπάλων Τα προβλήματα όπου η εξέλιξη των καταστάσεων εξαρτάται
Διαβάστε περισσότεραΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.
ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I. Γενικά Σε μαθήματα όπως η επιχειρησιακή έρευνα και ή λήψη αποφάσεων αναφέραμε τις αποφάσεις κάτω από συνθήκες βεβαιότητας, στις οποίες και εφαρμόζονται κυρίως οι τεχνικές της επιχειρησιακής
Διαβάστε περισσότεραΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες
ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Πιθανοτική Συλλογιστική II Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης ίκτυα Bayes σηµασιολογία Πλεονεκτήµατα συµπαγής αναπαράσταση
Διαβάστε περισσότεραΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ 1. Κοινά χαρακτηριστικά
ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ 1 Εφαρµόζονται σε αγορές που δεν είναι Walrasian. ηλαδή σε αγορές που οι πρωταγωνιστές δεν είναι λήπτες τιµών π.χ. ολιγοπώλιο. Τέτοιες αγορές τις µελετούµε µε παίγνια. Κοινά χαρακτηριστικά
Διαβάστε περισσότεραΠΛΗ 405 Τεχνητή Νοηµοσύνη
ΠΛΗ 405 Τεχνητή Νοηµοσύνη Πληροφορηµένη Αναζήτηση Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Πράκτορας ε ίλυσης ροβληµάτων πράκτορας µε στόχο Αναζήτηση διατύπωση
Διαβάστε περισσότεραΚεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία
Κεφάλαιο 4 Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία κατά Nash είναι: (α) ένα διάνυσµα από στρατηγικές, έτσι ώστε δεδοµένων των υπολοίπων στρατηγικών, ο παίκτης
Διαβάστε περισσότεραΔεύτερο πακέτο ασκήσεων
ΕΚΠΑ Τμήμα Οικονομικών Επιστημών Μικροοικονομική Θεωρία ΙΙ Εαρινό εξάμηνο Ακαδ. έτους 08-09 Αν. Παπανδρέου, Φ. Κουραντή, Ηρ. Κόλλιας Δεύτερο πακέτο ασκήσεων Προθεσμία παράδοσης Παρασκευή 0 Μαϊου. Θα υπάρξει
Διαβάστε περισσότεραΣηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία
Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία - Ορισμός. Ένα παίγνιο ονομάζεται παίγνιο πλήρους πληροφόρησης (game of complete information) όταν κάθε παίκτης διαθέτει πλήρη πληροφόρηση για τις συναρτήσεις
Διαβάστε περισσότεραΠΛΗ 513-Αυτόνομοι Πράκτορες Χειμερινό εξάμηνο 2012 Εφαρμογή αλγορίθμων ενισχυτικής μάθησης στο παιχνίδι Βlackjack. Χλης Νικόλαος-Κοσμάς
ΠΛΗ 513-Αυτόνομοι Πράκτορες Χειμερινό εξάμηνο 2012 Εφαρμογή αλγορίθμων ενισχυτικής μάθησης στο παιχνίδι Βlackjack Χλης Νικόλαος-Κοσμάς Περιγραφή παιχνιδιού Βlackjack: Σκοπός του παιχνιδιού είναι ο παίκτης
Διαβάστε περισσότεραΜικροοικονομική Ανάλυση ΙΙ
Κατ επιλογήν υποχρεωτικό, 3 ώρες εβδομαδιαίως, Θεωρία, Διδάσκον: Περιλαμβάνει: 1. Θεωρία Βιομηχανικής Οργάνωσης 2. Θεωρία Γενικής Ισορροπίας 1 Ορισμοί και βασικές έννοιες Βιομηχανικής Οργάνωσης Ασχολείται
Διαβάστε περισσότερα2). V (s) = R(s) + γ max T (s, a, s )V (s ) (3)
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Παράδοση: 5 Απριλίου 2012 Μιχελιουδάκης Ευάγγελος 2007030014 ΠΛΗ513: Αυτόνομοι Πράκτορες ΑΝΑΦΟΡΑ ΕΡΓΑΣΙΑΣ Εισαγωγή Η εργασία με
Διαβάστε περισσότεραΘεωρία Παιγνίων και Αποφάσεων
Θεωρία Παιγνίων και Αποφάσεων Ε. Μαρκάκης Επικ. Καθηγητής Τι είναι η Θεωρία Παιγνίων? Quote από το βιβλίο του Osborne: Game Theory aims to help us understand situawons in which decision makers interact
Διαβάστε περισσότεραΠιθανοτικός Συμπερασμός: Πού βρίσκομαι στο πλέγμα; [ΠΛΗ 513] Αυτόνομοι πράκτορες - Project Εξαμήνου ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Πιθανοτικός Συμπερασμός: Πού βρίσκομαι στο πλέγμα; [ΠΛΗ 513] Αυτόνομοι πράκτορες - Project Εξαμήνου Γεωργαρά Αθηνά (A.M. 2011030065) ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
Διαβάστε περισσότεραΠανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής
Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Πρόγραµµα Μεταπτυχιακών Σπουδών «Πληροφορική» Μεταπτυχιακή ιατριβή Τίτλος ιατριβής ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΠΟΛΙΤΙΚΩΝ ΑΠΟΦΑΣΕΩΝ ΟΙΚΟΝΟΜΙΚΗ ΚΡΙΣΗ ΣΤΗΝ ΕΛΛΗΝΙΚΗ ΟΙΚΟΝΟΜΙΑ
Διαβάστε περισσότεραΜΑΘΗΜΑΤΙΚΗ ΠΡΟΤΥΠΟΠΟΙΗΣΗ ΣΤΙΣ ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ
ΙΑΤΜΗΜΑΤΙΚΟ Μ.Π.Σ. ΜΑΘΗΜΑΤΙΚΗ ΠΡΟΤΥΠΟΠΟΙΗΣΗ ΣΤΙΣ ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: ΠΑΡΑΔΕΙΓΜΑΤΑ ΣΤΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Ι. ΠΟΛΥΡΑΚΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΓΚΡΑΒΑΣ Αριθµός
Διαβάστε περισσότεραΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Εξεταστική περίοδος Ιουνίου 2015 16 Ιουνίου 2015 Διάρκεια εξέτασης: 2,5 ώρες
Διαβάστε περισσότεραΤ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ
Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ Επιβλέπων Δρ. ΓΕΡΟΝΤΙΔΗΣ ΙΩΑΝΝΗΣ Αναπληρωτής Καθηγητής ΚΑΒΑΛΑ 2006 0 ΠΕΡΙΕΧΟΜΕΝA Σελίδα ΕIΣΑΓΩΓΗ 3 ΚΕΦΑΛΑΙΟ
Διαβάστε περισσότεραΔυσεπίλυτα Προβλήματα σε Γραφήματα και Παίγνια
Δυσεπίλυτα Προβλήματα σε Γραφήματα και Παίγνια Σ Π Υ Ρ Ι Δ Ω Ν Τ Ζ Ι Μ Α Σ Δ Τ Ο Μ Ε Α Σ Τ Μ Η Μ Α Μ Α Θ Η Μ Α Τ Ι Κ Ω Ν Σ Χ Ο Λ Η Θ Ε Τ Ι Κ Ω Ν Ε Π Ι Σ Τ Η Μ Ω Ν Π Α Ν Ε Π Ι Σ Τ Η Μ Ι Ο Ι Ω Α Ν Ν Ι Ν
Διαβάστε περισσότεραΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες
ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες Πράκτορες και Περιβάλλοντα Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Σήµερα Πράκτορες χαρακτηριστικά στοιχεία είδη πρακτόρων
Διαβάστε περισσότεραΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής
Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται
Διαβάστε περισσότεραΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 4: Η τραγωδία των κοινών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής
Ενότητα 4: Η τραγωδία των κοινών Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου
Διαβάστε περισσότεραΚεφάλαιο 8 ο Τ 3, 1-1, -1 Χ -1, -1 1, 3
Κεφάλαιο 8 ο Συνεχίζουµε µε τις µεικτές στρατηγικές. Θα δούµε τώρα ένα παράδειγµα στο οποίο υπάρχουνε ισορροπίες κατά Nash σε αµιγείς στρατηγικές αλλά πέρα από αυτό υπάρχει και µια ισορροπία κατά Nash
Διαβάστε περισσότεραA 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2
Κεφάλαιο 2 Στατικά παίγνια με πλήρη πληροφόρηση 2.1 Εισαγωγή Η πιο απλή, αλλά και θεμελιώδης, κατηγορία παιγνίων είναι αυτή των στατικών παιγνίων με πλήρη πληροφόρηση. Στα παίγνια αυτά οι συμμετέχοντες
Διαβάστε περισσότεραΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017 2η σειρά ασκήσεων Προθεσμία παράδοσης: 16 Ιουνίου 2017 Πρόβλημα 1. (18 μονάδες)
Διαβάστε περισσότεραΕισαγωγή στην Οικονομική Ανάλυση
Εθνικό & Καποδιστριακό Πανεπιστήμιο Αθηνών Εισαγωγή στην Οικονομική Ανάλυση Νίκος Θεοχαράκης Διάλεξη 9 Ιανουάριος 2014 Μορφές αγοράς 1. Τέλειος ανταγωνισμός [Perfect competition] 2. Μονοπωλιακός ανταγωνισμός
Διαβάστε περισσότεραΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ
ΘΕΜΑ 1 ο (2.5) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Δευτέρα 3 Σεπτεμβρίου 2012 Διάρκεια εξέτασης: 3 ώρες (16:30-19:30)
Διαβάστε περισσότεραΕΜΠΕΙΡΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΗΣ NASH ΙΣΟΡΡΟΠΙΑΣ
ΕΜΠΕΙΡΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΗΣ NASH ΙΣΟΡΡΟΠΙΑΣ ΒΛΑΧΟΠΟΥΛΟΥ ΑΘΑΝΑΣΙΑ (Α.Μ. 11/08) ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Επιβλέπων καθηγητής: Παπαναστασίου Ιωάννης Εξεταστές : Νούλας Αθανάσιος Ζαπράνης Αχιλλέας ιατµηµατικό Πρόγραµµα
Διαβάστε περισσότεραΕΦΑΡΜΟΓΗ Q-LEARNING ΣΕ GRID WORLD ΚΑΙ ΕΞΥΠΝΟΣ ΧΕΙΡΙΣΜΟΣ ΤΟΥ LEARNING RATE ΛΑΘΙΩΤΑΚΗΣ ΑΡΗΣ ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ 2011-12
ΕΦΑΡΜΟΓΗ Q-LEARNING ΣΕ GRID WORLD ΚΑΙ ΕΞΥΠΝΟΣ ΧΕΙΡΙΣΜΟΣ ΤΟΥ LEARNING RATE ΛΑΘΙΩΤΑΚΗΣ ΑΡΗΣ ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ 2011-12 ΣΚΟΠΟΣ ΕΡΓΑΣΙΑΣ Στα πλαίσια του μαθήματος Αυτόνομοι Πράκτορες μας ζητήθηκε να αναπτύξουμε
Διαβάστε περισσότεραΕνημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης
Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης - Οι επιχειρήσεις δεν ανταγωνίζονται μόνο ως προς τις τιμές στις οποίες επιλέγουν να πουλήσουν τα προϊόντα τους. - Ο μη-τιμολογιακός ανταγωνισμός
Διαβάστε περισσότεραΠαίγνια Συμφόρησης. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο
Παίγνια Συμφόρησης ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Μοντέλο Ανάθεσης Πόρων Σύνολο πόρων Ε = { e 1,, e m }. Πόροι: ακμές δικτύου, υπηρεσίες
Διαβάστε περισσότεραΠαραδείγματα Παιγνίων
Παραδείγματα Παιγνίων Παύλος Σ. Εφραιμίδης v1.3, 01/06/2014 Τι περιλαμβάνει ένα παίγνιο: Παίγνιο Παίκτες Πιθανές κινήσεις για κάθε παίκτη Απόδοση ή όφελος για κάθε παίκτη σε κάθε πιθανή έκβαση του παιγνίου
Διαβάστε περισσότεραΑνταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης
Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης Δημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Μοντέλο Ανάθεσης Πόρων Σύνολο πόρων Ε = { e 1,, e
Διαβάστε περισσότεραΘεωρία Παιγνίων. Εισαγωγικές έννοιες και Τεχνικές
Θεωρία Παιγνίων Εισαγωγικές έννοιες και Τεχνικές Η επιβίωση μας εξαρτάται από την αλληλεπίδραση με άλλα άτομα Η επιβίωση μας εξαρτάται από την αλληλεπίδραση με άλλα άτομα Η επιβίωση μας εξαρτάται από την
Διαβάστε περισσότεραΠΛΗ513 - Αυτόνομοι Πράκτορες Αναφορά Εργασίας
ΠΛΗ513 - Αυτόνομοι Πράκτορες Αναφορά Εργασίας Ομάδα εργασίας: LAB51315282 Φοιτητής: Μάινας Νίκος ΑΦΜ: 2007030088 ΠΕΡΙΓΡΑΦΗ ΙΔΕΑΣ Η ιδέα της εργασίας βασίζεται στην εύρεση της καλύτερης πολιτικής για ένα
Διαβάστε περισσότεραΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 9η: Basics of Game Theory Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Ψηφιακή Οικονομία Διάλεξη 9η: Basics of Game Theory Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών Course Outline Part II: Mathematical Tools Firms - Basics of Industrial
Διαβάστε περισσότεραΑ2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0
ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ ιδάσκων: Ε. Πετράκης. Επαναληπτική Εξέταση: 15/09/99 Απαντήστε στα τρία από τα τέσσερα θέµατα. Όλα τα υποερωτήµατα βαθµολογούνται το ίδιο. 1. Θεωρήσατε ένα ολιγοπωλιακό κλάδο όπου τρεις
Διαβάστε περισσότεραΕισαγωγή στη Θεωρία Αποφάσεων. Λήψη απλών αποφάσεων για έναν πράκτορα
Εισαγωγή στη Θεωρία Αποφάσεων Λήψη απλών αποφάσεων για έναν πράκτορα Oρθολογικές αποφάσεις Ένας πράκτορας βασισμένος στη λογική Έχει ένα στόχο (μια κατάσταση περιβάλλοντος που θέλει να πετύχει) Καταστρώνει
Διαβάστε περισσότεραΟρισμένες Κατηγορίες Αλγορίθμων
Ορισμένες Κατηγορίες Αλγορίθμων Παύλος Εφραιμίδης pefraimi ee.duth.gr Οριασμένες κατηγορίες αλγορίθμων 1 Αλγόριθμοι Προσέγγισης Υπολογιστικά προβλήματα τα οποία είναι NPhard δεν μπορούμε να τα λύσουμε
Διαβάστε περισσότεραΣυνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος
Συνδυαστικά Παίγνια 1. Σε ένα παιγνίδι 2 παικτών µηδενικού αθροίσµατος οι παίκτες αναγγέλουν εναλλάξ ένα αριθµό µεταξύ {2,3,4}. Ο παίκτης που κάνει το άθροισµα των αριθµών που έχουν αναγγελθεί να φθάσει
Διαβάστε περισσότεραΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Ψηφιακή Οικονομία Άσκηση αυτοαξιολόγησης 4 Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών CS-593 Game Theory 1. For the game depicted below, find the mixed strategy
Διαβάστε περισσότεραΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς
ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 007 ιδάσκων : Ηλίας Κουτσουπιάς Μάθηµα : Overview Of The Algorithmic Game Theory Ηµεροµηνία : 007/04/19 Σηµειώσεις : Ελενα Χατζηγιωργάκη,
Διαβάστε περισσότεραΜελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.
Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής. Ιστορική αναδρομή 1713 Ο Francis Waldegrave, σε ένα γράμμα του, παρουσίασε την πρώτη μικτή στρατηγική μεγίστου
Διαβάστε περισσότεραΤεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.
Τεχνητή Νοημοσύνη 6η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται στα βιβλία Τεχνητή Νοημοσύνη των Βλαχάβα κ.ά., 3η έκδοση, Β. Γκιούρδας
Διαβάστε περισσότεραΑΣΚΗΣΗ 3 (θεωρία παιγνίων) Οι δύο μεγαλύτερες τράπεζες μιας χώρας, Α και Β, εκτιμούν ότι μια άλλη τράπεζα, η Γ, θα κλείσει στο προσεχές διάστημα και πρόκειται να προχωρήσουν σε διαφημιστικές εκστρατείες
Διαβάστε περισσότεραΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Τρίτη 15 Ιανουαρίου 2008 ιάρκεια εξέτασης: 3 ώρες (13:00-16:00) ΘΕΜΑ 1 ο (2,5
Διαβάστε περισσότεραΑνταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης
Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης ημήτρης Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο Συστήματα με Ιδιοτελείς (και Ανταγωνιστικούς) Χρήστες
Διαβάστε περισσότεραΑλληλεπιδράσεις πρακτόρων. Πώς σχεδιάζουμε κοινωνίες πρακτόρων;
Αλληλεπιδράσεις πρακτόρων Πώς σχεδιάζουμε κοινωνίες πρακτόρων; Δεν υπάρχει σύστημα ενός πράκτορα! πράκτορας οργανωσιακή σχέση πρακτόρων αλληλεπίδραση πρακτόρων σφαίρα επιρροής πράκτορα περιβάλλον 2 Δεν
Διαβάστε περισσότερα