Увод у теориjу игара и игра инспекциjе

Σχετικά έγγραφα
Tестирање хипотеза. 5.час. 30. март Боjана Тодић Статистички софтвер март / 10

налазе се у диелектрику, релативне диелектричне константе ε r = 2, на међусобном растојању 2 a ( a =1cm

1 Неодрђеност и информациjа

Решења задатака са првог колоквиjума из Математике 1Б II група задатака

Први корак у дефинисању случајне променљиве је. дефинисање и исписивање свих могућих eлементарних догађаја.

7. ЈЕДНОСТАВНИЈЕ КВАДРАТНЕ ДИОФАНТОВE ЈЕДНАЧИНЕ

1.2. Сличност троуглова

Конструкциjе Адамарових матрица

Теорија електричних кола

Теорија игара - Игре тражења и игре сусретања

Анализа Петријевих мрежа

b) Израз за угиб дате плоче, ако се користи само први члан реда усвојеног решења, је:

СИСТЕМ ЛИНЕАРНИХ ЈЕДНАЧИНА С ДВЕ НЕПОЗНАТЕ

г) страница aa и пречник 2RR описаног круга правилног шестоугла јесте рац. бр. јесу самерљиве

Упутство за избор домаћих задатака

2.3. Решавање линеарних једначина с једном непознатом

ПРИРОДА ВРЕМЕНА. информациjа материjе термодинамика теориjа релативности квантна механика. принцип вероватноће у физици

ЗАШТИТА ПОДАТАКА Шифровање јавним кључем и хеш функције. Diffie-Hellman размена кључева

ИНФОРМАЦИJА ПЕРЦЕПЦИJЕ слобода, демократиjа и физика

ГЕОМЕТРИJСКА СВОJСТВА АНАЛИТИЧКИХ ФУНКЦИJА

ЛИНЕАРНА ФУНКЦИЈА. k, k 0), осна и централна симетрија и сл. 2, x 0. У претходном примеру неке функције су линеарне а неке то нису.

Положај сваке тачке кружне плоче је одређен са поларним координатама r и ϕ.

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА МАТЕМАТИКА ТЕСТ

Теорија друштвеног избора

предмет МЕХАНИКА 1 Студијски програми ИНДУСТРИЈСКО ИНЖЕЊЕРСТВО ДРУМСКИ САОБРАЋАЈ II ПРЕДАВАЊЕ УСЛОВИ РАВНОТЕЖЕ СИСТЕМА СУЧЕЉНИХ СИЛА

Монте Карло Интеграциjа

КРУГ. У свом делу Мерење круга, Архимед је први у историји математике одрeдио приближну вред ност броја π а тиме и дужину кружнице.

Логистичка регресиjа

ТЕОРИЈА ИГАРА-ЈАМБ Матурски рад из математике

Количина топлоте и топлотна равнотежа

Аксиоме припадања. Никола Томовић 152/2011

Екстремне статистике поретка и примjене у неживотном осигурању

1 ПРОСТОР МИНКОВСКОГ

2. EЛЕМЕНТАРНЕ ДИОФАНТОВЕ ЈЕДНАЧИНЕ

2. Наставни колоквијум Задаци за вежбање ОЈЛЕРОВА МЕТОДА

Прост случаjан узорак (Simple Random Sampling)

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Параметарски и непараметарски тестови

ТРАПЕЗ РЕГИОНАЛНИ ЦЕНТАР ИЗ ПРИРОДНИХ И ТЕХНИЧКИХ НАУКА У ВРАЊУ. Аутор :Петар Спасић, ученик 8. разреда ОШ 8. Октобар, Власотинце

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Нестандардна анализа као почетна настава анализе

ОБЛАСТИ: 1) Тачка 2) Права 3) Криве другог реда

Скупови (наставак) Релације. Професор : Рака Јовановић Асиситент : Јелена Јовановић

1. 2. МЕТОД РАЗЛИКОВАЊА СЛУЧАЈЕВА 1

Теорија електричних кола

ЗАВРШНИ РАД КЛИНИЧКА МЕДИЦИНА 5. школска 2016/2017. ШЕСТА ГОДИНА СТУДИЈА

3.1. Однос тачке и праве, тачке и равни. Одређеност праве и равни

ЗАШТИТА ПОДАТАКА. Шифровање јавним кључем и хеш функције. Diffie-Hellman размена кључева

4.4. Паралелне праве, сечица. Углови које оне одређују. Углови са паралелним крацима

8. ПИТАГОРИНА ЈЕДНАЧИНА х 2 + у 2 = z 2

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

4. ЗАКОН ВЕЛИКИХ БРОЈЕВА

6.1. Осна симетрија у равни. Симетричност двеју фигура у односу на праву. Осна симетрија фигуре

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

АНАЛИТИЧКА ГЕОМЕТРИJА. Владица Андреjић ( ) УНИВЕРЗИТЕТ У БЕОГРАДУ МАТЕМАТИЧКИ ФАКУЛТЕТ БЕОГРАД 2015.

6. ЛИНЕАРНА ДИОФАНТОВА ЈЕДНАЧИНА ах + by = c

6.2. Симетрала дужи. Примена

ИСПИТИВАЊЕ СВОJСТАВА КОМПЛЕКСНИХ МРЕЖА СА ДИСКРЕТНОМ ДИНАМИКОМ

Писмени испит из Теорије површинских носача. 1. За континуалну плочу приказану на слици одредити угиб и моменте савијања у означеним тачкама.

4. Троугао. (II део) 4.1. Појам подударности. Основна правила подударности троуглова

Cook-Levin: SAT је NP-комплетан. Теодор Најдан Трифунов 305M/12

5.2. Имплицитни облик линеарне функције

Мастер рад. Гребнерове базе. Аутор: Јелена Јовичић Број индекса: 1033/2008. Ментор: Доцент др Зоран Петровић. Математички факултет Београд 2010.

Хомогена диференцијална једначина је она која може да се напише у облику: = t( x)

Дух полемике у филозофији Јован Бабић

Универзитет у Београду Математички факулет. Фибоначиjев хип и примене

УНАПРЕЂИВАЊЕ SMT РЕШАВАЧА КОРИШЋЕЊЕМ CSP ТЕХНИКА И ТЕХНИКА ПАРАЛЕЛИЗАЦИJЕ

МАСТЕР РАД УНИВЕРЗИТЕТ У БЕОГРАДУ МАТЕМАТИЧКИ ФАКУЛТЕТ. Тема: ГОРЊА И ДОЊА ГРАНИЧНА ВРЕДНОСТ НИЗА И НИЗА СКУПОВА И ЊИХОВЕ ПРИМЕНЕ У РЕЛНОЈ АНАЛИЗИ

РЕШЕЊА ЗАДАТАКА - IV РАЗЕД 1. Мањи број: : x,

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

МАТРИЧНА АНАЛИЗА КОНСТРУКЦИЈА

Имплементациjа монада у програмском jезику Swift 1.1

Универзитет у Београду. Математички факултет. Мастер рад. Тема: Геометријски случајни процеси

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

(од 4. до 155. стране) (од 4. до 73. стране) ДРУГИ, ТРЕЋИ И ЧЕТВРТИ РАЗРЕД - Европа и свет у другој половини 19. и почетком 20.

Предмет: Задатак 4: Слика 1.0

Слика 1. Слика 1.2 Слика 1.1

АКТУАРСТВО. Предавања 2. мр Наташа Папић-Благојевић

ТРЕЋЕ ОТВОРЕНО ПРВЕНСТВО СРБИЈЕ У РЕШАВАЊУ ОПТИМИЗАТОРА 29. НОВЕМБАР ДЕЦЕМБАР ГОДИНЕ

Математика Тест 3 Кључ за оцењивање

7.3. Површина правилне пирамиде. Површина правилне четворостране пирамиде

Теорија одлучивања. Циљеви предавања

L кплп (Калем у кплу прпстпперипдичне струје)

Вектори vs. скалари. Векторске величине се описују интензитетом и правцем. Примери: Померај, брзина, убрзање, сила.

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

ВОЈИСЛАВ АНДРИЋ МАЛА ЗБИРКА ДИОФАНТОВИХ ЈЕДНАЧИНА

I Наставни план - ЗЛАТАР

ТЕСТ МАТЕМАТИКА УПУТСТВО ЗА ПРЕГЛЕДАЊЕ

I Линеарне једначине. II Линеарне неједначине. III Квадратна једначина и неједначина АЛГЕБАРСКЕ ЈЕДНАЧИНЕ И НЕЈЕДНАЧИНЕ

Данка Вујанац. Бојење графова. мастер рад

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

ЗБИРКА РЕШЕНИХ ЗАДАТАКА ЗА ПРИЈЕМНИ ИСПИТ ИЗ МАТЕМАТИКЕ

РЈЕШЕЊА ЗАДАТАКА СА ТАКМИЧЕЊА ИЗ ЕЛЕКТРИЧНИХ МАШИНА Електријада 2004

Факултет организационих наука Центар за пословно одлучивање. PROMETHEE (Preference Ranking Organization Method for Enrichment Evaluation)

Од површине троугла до одређеног интеграла

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Семинарски рад из линеарне алгебре

У н и в е р з и т е т у Б е о г р а д у Математички факултет. Семинарски рад. Методологија стручног и научног рада. Тема: НП-тешки проблеми паковања

2.1. Права, дуж, полуправа, раван, полураван

Transcript:

proba Математички институт у Београду Увод у теориjу игара и игра инспекциjе Лука Павловић Београд, 12. маj 2017.

proba

Увод у Теориjу Игара 1 Увод у Теориjу Игара Теориjа игара jе грана математике коjа се служи моделима за проучавање међусобног утицаjа и деjства формалних импулсивних структура ( игара). Игру карактерише група задатих правила коjа имаjу одређену формалну структуру, и коjа управљаjу понашањем одређених индивидуа или група - играча. У игру су укључена наjмање два играча и њихови интереси се сукобе. Шах jе на пример jедна од игара у оваквом смислу, и користићемо га даље у илустративне сврхе. Уопштено, правила се стараjу да ће се игра састоjати из низа потеза у специфичном редоследу, и природа сваког потеза jе унапред задата. Постоjе две врсте потеза - лични и шансе. Лични потез играча jе избор потеза из, могуће бесконачног, скупа алтернатива; на пример сваки потез у шаховскоj партиjи jе лични потез; први потез jе избор Белог и он бира jедан од двадесет могућих алтернатива. Конкретну одлуку донешену у одређеноj позициjи називамо избором тог потеза. Потез шансе такође резултуjе у избору jедног од могућих исхода из скупа алтернатива. С тиме што овде алтернатива ниjе изабрана од стране играча, већ од стране неког механизма шансе, са вероватноћом коjом механизам бира различите алтернативе одређене правилима игре. На пример бацање новчића. Избор направљен у конкретноj ситуациjи при потезу шансе називамо исход тог потеза. Концепт стратегиjе Скуп инструкциjа коjи обухвата сваку могућу позициjу коjа може настати као последица поштовања тих инструкциjа чини стратегиjу. Стратегиjа за Белог мора специфицирати први потез, као и одговор на сваки могућ потез Црног. Уопште, за сваки могућ низ избора m 1,..., m 2k, k >= 0 избор c(m 1,..., m 2k ), а његов (k + 1)-ви потез, то jест (2k + 1)-ви потез у партиjи, међу алтернативама могућим као резултат ситуациjе m 1,..., m 2k. Овакве стратегиjе користe шаховски програми за доношење избора. Представљање овакве стратегиjе би било веома захтевно, па због тога концепт стратегиjе поприлично упрошћавамо. Важна jе природа човека да наjрадиjе проjектуjе и планира своjу добит кроз губитак другог играча ( стварни случаjеви се своде на некооперативне игре). Теоретичари игара дефинишу саме игре, проучаваjу и предвиђаjу понашање 1

Увод у Теориjу Игара играча, учесника у игри, као и адекватне стратегиjе. Према изучавању, игре можемо поделити на: Стратешке игре - статички модел коjи описуjе интерактивне ситуациjе међу неколико играча. Сви играчи доносе своjе одлуке истовремено и независно jедни од других; Екстензивне - не статичке интерактивне ситуациjе, у коjима свака може да се представи преко стратешке игре, при чему долази до губитка неких информациjа коjе би могле бити од значаjа у неким околностима; Непотпуне информациjе - када су играчима доступне само неке од информациjа; Кооперативне игре - када играчи сарађуjу у заjедничком интересу; За нас су од посебног интереса стратешке игре између два играча, тако да добитак jедног играча зависи од губитка другог. Можемо замислити као да су играчи на клацкалици. Такве игре називамо нула-сумом играма. Даље нас занимаjу начини на коjе можемо пронаћи праве потезе. Неки од њих су: Елиминациjа слабо доминантних стратегиjа. Максимин стратегиjе - смањење губитка у нула-сума играма. Нешов еквилибриjум - профил стратегиjе такав да ни jедан од играча не може да користи уколико унилатерално промени стратегиjу. Погледаjмо следећи проблем - "Дилема затвореника"двоjица осумњичених за тежак злочин и крађу су смештени у две одвоjене ћелиjе. Познато jе да су криви за пљачку, али полициjа нема доказа за злочин. Обоjици jе понуђено да признаjу ко jе то урадио. Уколико обоjица одаjу jедан другог, свако од њих ће добити по 5 година затвора. Ако само jедан призна да jе онаj други крив, онда ће он бити сведок против оног другог, коjи ће провести 20 година затвора, али сведок неће бити кажњен. Уколико ни jедан не призна ко jе крив, обоjица ће добити по годину дана затвора. Б ћути Б издаjе А ћути Обоjица служе 1 годину А: 20 година, Б: слободан А издаjе А: слободан, Б: 20 година Обоjица 5 година Многи стварни догађаjи се могу посматрати као "Дилема затвореника". На пример, за време нуклеарне трке између САД и СССР у Хладном Рату, обе државе могу да одлуче да ли да производе нуклеарно оружjе; у овоj ситуациjи би исходи имали структуру као они у Табели. Резултат "Дилеме затвореника"зависи од тога да ли jе игра кооперативна или не. Уколико осумњичени не сарађуjу Нешов еквилибриjум би био за обоjицу да окриве оног другог. 2

Игра Инспекциjе 2 Игра Инспекциjе Игра инспекциjе jе некооперативна игра коjа се игра између инспектора и инспектованог. Она представља ситуациjу у коjоj jе неко обавезан да поштуjе прописе, међутим има мотива да их не поштуjе. Инспректор покушава да примора инспектованог да их поштуjе, тако што ће га проверавати. Има примене у контроли оружjа, ревизиjи рачуна, такси, заштити животне средине, контроли квалитета намирница... Област jе обимно истраживана током претходних 60 година, али и даље привлачи пажњу. У периоду од 1960-тих до 1990-тих jе разлог за развоj игре био Хладни Рат између САД и СССР, ради провере договора око контроле оружjа. Под таквим околностима развиjана jе теориjа са 2 особе и нула сумом. Од почетка 1990-тих jе, стицаjем нових околности, пажња посвећена развиjању игре са не-нула сумом и са n - инспектованих. У свом наjпростиjем облику, игра инспекциjе jе игра са два играча, између инспектованог и инспектора. Инспектовани бира да ли ће да поштуjе прописе, док инспектор бира да ли да врши проверу. Играчи не знаjу ни одлуку ни стратегиjу оног другог. Овакву поставку проблема можемо илустровати табелом у коjоj jе инспектовани представљен редовима, а инспектор колонама. У сваком пољу су поени коjе таj играч добиjа у тоj ситуациjи. Проверава Не проверава Не поштуjе -1, 1 2, -2 Поштуjе 0, -1 0, 0 Главна одлика игре jе да се интерес инспектованог противи интересу инспектора. Инспектор би желео да инспектовани поштуjе прописе, али радиjе не би да проверава. Међутим, уколико никад не би проверавао, инспектовани никад не би поштовао прописе. Као резултат овог конфликта не постоjи Нешов еквилибриjум. Какав год резултат игре био, увек ће jедан од њих желети да промени стратегиjу. Међутим ако дозволимо да играчи играjу своjе потезе са неком вероватноћом ствар се мења, што ћемо видети у наставку. Да бисмо детаљниjе приказали оваj проблем, увешћемо следеће ознаке: r = легални приходи коjе инспектовани прима, r > 0 l = профит уколико не поштуjе прописе и прође некажњено, l > 0 f = казна коjу плаћа уколико буде ухваћен, f > 0 3

Игра Инспекциjе c = трошкови инспекциjе, c > 0 λ = вероватноћа с коjом jе инспектовани ухваћен уколико инспектор проверава, λ [0, 1] Користећи ове ознаке добиjамо: Уколико инспектовани поштуjе закон, онда прима легалне приходе r, док исплативост инспектованог када не поштуjе прописе зависи од стратегиjе инспектора. Уколико инспектор ниjе проверавао, инспектовани добиjа легалан r и криминални профит l. Међутим, уколико jе инспектор проверио, онда jе инспектовани или кажњен са вероватноћом λ и мора да плати казну f, или jе избегао казну са вероватноћом (1 λ) и са криминалним профитом l. Параметар λ се може тумачити као ефикасност инспекциjе. Инспектор плаћа трошкове инспекциjе c сваки пут када провери. Ако jе све по пропису, инспектор остаjе са губитком c. Међутим, уколико инспектовани ниjе поштовао прописе, онда инспектор наплаћуjе казну f са вероватноћом λ, или инспектовани избегне казну са вероватноћом 1 λ и оставља инспектора са додатним губитком l. Уколико инспектор одлучи да не проверава, губи износ l уколико инспектовани ниjе поштовао прописе, или остаjе на 0 када инспектовани поштуjе прописе. Ова игра jе представљена у следећоj табели: Проверава Не проверава Не поштуjе r+ (1-λ)l λf, c + λf (1 λ)l r+l, -l Поштуjе r, -c r, 0 Да би игра била поштениjа уводимо следећа два услова: λ(l + f) > c и λ f > (1 λ) l Први услов осигурава да уколико инспектовани не поштуjе прописе, инспектор жели да га провери, jер добиjа више новчаних прихода од могуће казне, него што троши да би га проверио. Други услов гарантуjе да уколико инспектор проверава, инспектовани би радиjе да поштуjе прописе, jер казна превазилази криминални профит. Следећа теорема даjе jединствени Нешов еквилибриjум. Теорема 2.1. Нека jе p [0, 1] вероватноћа коjом инспектовани крши правила и q [0, 1] вероватноћа коjом инспектор проверава. Jединствен Нешов еквилибриjум за оба играча настаjе уколико су: p = c/λ(l + f) и q = l/λ(l + f) Доказ 2.1. Нека jе B зарада инспектора, и зарада инспектованог. Претпоставимо да постоjи Нешов еквилибриjум за вероватноће p и q. Нека jе p фиксирано. Даље имамо: E(B) = q(p( c + λf (1 λ)l) + (1 p)( c)) + (1 q)( pl) = = pqc + pqλf pql + pqλl + pqc qc pl + pql = 4

Игра Инспекциjе = q(pλf + pλl c) + (pc c pl) Нека jе S = pλf + pλl c, Ако jе S > 0, инспектору jе очигледно наjбоље да увек проверава. Ако jе S < 0, да никад не проверава. Међутим оба та случаjа не даjу Нешов еквилибриjум, jер ако инспектор стално проверава, онда инспектовани никада не краде, па инспектор не треба никад да проверава. Слично ако инспектор никад не проверава, инспектовани треба увек да краде, па инспектор треба увек да га проверава. Приметимо да ово важи само ако константе задовољаваjу задата ограничења. Ако jе S = 0, онда jе све jедно коjом вероватноћом инспектор проверава. S = 0 p = c. Аналогно jе за λ(f+l) q = l/λ(l + f) неважно коjом вероватноћом инспектовани не поштуjе правила, док се за остале q добиjе p = 0 p = 1, што не може чинити еквилибриjум. Из претходног рачуна уочавамо да p и q заиста даjу Нешов еквилибриjум, коjи мора бити jединствен. 5

Литература 3 Литература 1. Vassili Kolokoltsov, Hemant Passi, Wei Yang, Inspection and crime prevention: an evolutionary perspective 2. David Blackwell, M. A. Girshick, Theory of games and statistical decisions 3. Julio Gonzalez-Diaz, Ignacio Garcia-Jurado, M. Gloria Fiestras-Janeiro, An Introductory Course on Mathematical Game Theory 4. Elliott Mendelson, Introducing Game Theory and Its Applications 6