proba Математички институт у Београду Увод у теориjу игара и игра инспекциjе Лука Павловић Београд, 12. маj 2017.
proba
Увод у Теориjу Игара 1 Увод у Теориjу Игара Теориjа игара jе грана математике коjа се служи моделима за проучавање међусобног утицаjа и деjства формалних импулсивних структура ( игара). Игру карактерише група задатих правила коjа имаjу одређену формалну структуру, и коjа управљаjу понашањем одређених индивидуа или група - играча. У игру су укључена наjмање два играча и њихови интереси се сукобе. Шах jе на пример jедна од игара у оваквом смислу, и користићемо га даље у илустративне сврхе. Уопштено, правила се стараjу да ће се игра састоjати из низа потеза у специфичном редоследу, и природа сваког потеза jе унапред задата. Постоjе две врсте потеза - лични и шансе. Лични потез играча jе избор потеза из, могуће бесконачног, скупа алтернатива; на пример сваки потез у шаховскоj партиjи jе лични потез; први потез jе избор Белог и он бира jедан од двадесет могућих алтернатива. Конкретну одлуку донешену у одређеноj позициjи називамо избором тог потеза. Потез шансе такође резултуjе у избору jедног од могућих исхода из скупа алтернатива. С тиме што овде алтернатива ниjе изабрана од стране играча, већ од стране неког механизма шансе, са вероватноћом коjом механизам бира различите алтернативе одређене правилима игре. На пример бацање новчића. Избор направљен у конкретноj ситуациjи при потезу шансе називамо исход тог потеза. Концепт стратегиjе Скуп инструкциjа коjи обухвата сваку могућу позициjу коjа може настати као последица поштовања тих инструкциjа чини стратегиjу. Стратегиjа за Белог мора специфицирати први потез, као и одговор на сваки могућ потез Црног. Уопште, за сваки могућ низ избора m 1,..., m 2k, k >= 0 избор c(m 1,..., m 2k ), а његов (k + 1)-ви потез, то jест (2k + 1)-ви потез у партиjи, међу алтернативама могућим као резултат ситуациjе m 1,..., m 2k. Овакве стратегиjе користe шаховски програми за доношење избора. Представљање овакве стратегиjе би било веома захтевно, па због тога концепт стратегиjе поприлично упрошћавамо. Важна jе природа човека да наjрадиjе проjектуjе и планира своjу добит кроз губитак другог играча ( стварни случаjеви се своде на некооперативне игре). Теоретичари игара дефинишу саме игре, проучаваjу и предвиђаjу понашање 1
Увод у Теориjу Игара играча, учесника у игри, као и адекватне стратегиjе. Према изучавању, игре можемо поделити на: Стратешке игре - статички модел коjи описуjе интерактивне ситуациjе међу неколико играча. Сви играчи доносе своjе одлуке истовремено и независно jедни од других; Екстензивне - не статичке интерактивне ситуациjе, у коjима свака може да се представи преко стратешке игре, при чему долази до губитка неких информациjа коjе би могле бити од значаjа у неким околностима; Непотпуне информациjе - када су играчима доступне само неке од информациjа; Кооперативне игре - када играчи сарађуjу у заjедничком интересу; За нас су од посебног интереса стратешке игре између два играча, тако да добитак jедног играча зависи од губитка другог. Можемо замислити као да су играчи на клацкалици. Такве игре називамо нула-сумом играма. Даље нас занимаjу начини на коjе можемо пронаћи праве потезе. Неки од њих су: Елиминациjа слабо доминантних стратегиjа. Максимин стратегиjе - смањење губитка у нула-сума играма. Нешов еквилибриjум - профил стратегиjе такав да ни jедан од играча не може да користи уколико унилатерално промени стратегиjу. Погледаjмо следећи проблем - "Дилема затвореника"двоjица осумњичених за тежак злочин и крађу су смештени у две одвоjене ћелиjе. Познато jе да су криви за пљачку, али полициjа нема доказа за злочин. Обоjици jе понуђено да признаjу ко jе то урадио. Уколико обоjица одаjу jедан другог, свако од њих ће добити по 5 година затвора. Ако само jедан призна да jе онаj други крив, онда ће он бити сведок против оног другог, коjи ће провести 20 година затвора, али сведок неће бити кажњен. Уколико ни jедан не призна ко jе крив, обоjица ће добити по годину дана затвора. Б ћути Б издаjе А ћути Обоjица служе 1 годину А: 20 година, Б: слободан А издаjе А: слободан, Б: 20 година Обоjица 5 година Многи стварни догађаjи се могу посматрати као "Дилема затвореника". На пример, за време нуклеарне трке између САД и СССР у Хладном Рату, обе државе могу да одлуче да ли да производе нуклеарно оружjе; у овоj ситуациjи би исходи имали структуру као они у Табели. Резултат "Дилеме затвореника"зависи од тога да ли jе игра кооперативна или не. Уколико осумњичени не сарађуjу Нешов еквилибриjум би био за обоjицу да окриве оног другог. 2
Игра Инспекциjе 2 Игра Инспекциjе Игра инспекциjе jе некооперативна игра коjа се игра између инспектора и инспектованог. Она представља ситуациjу у коjоj jе неко обавезан да поштуjе прописе, међутим има мотива да их не поштуjе. Инспректор покушава да примора инспектованог да их поштуjе, тако што ће га проверавати. Има примене у контроли оружjа, ревизиjи рачуна, такси, заштити животне средине, контроли квалитета намирница... Област jе обимно истраживана током претходних 60 година, али и даље привлачи пажњу. У периоду од 1960-тих до 1990-тих jе разлог за развоj игре био Хладни Рат између САД и СССР, ради провере договора око контроле оружjа. Под таквим околностима развиjана jе теориjа са 2 особе и нула сумом. Од почетка 1990-тих jе, стицаjем нових околности, пажња посвећена развиjању игре са не-нула сумом и са n - инспектованих. У свом наjпростиjем облику, игра инспекциjе jе игра са два играча, између инспектованог и инспектора. Инспектовани бира да ли ће да поштуjе прописе, док инспектор бира да ли да врши проверу. Играчи не знаjу ни одлуку ни стратегиjу оног другог. Овакву поставку проблема можемо илустровати табелом у коjоj jе инспектовани представљен редовима, а инспектор колонама. У сваком пољу су поени коjе таj играч добиjа у тоj ситуациjи. Проверава Не проверава Не поштуjе -1, 1 2, -2 Поштуjе 0, -1 0, 0 Главна одлика игре jе да се интерес инспектованог противи интересу инспектора. Инспектор би желео да инспектовани поштуjе прописе, али радиjе не би да проверава. Међутим, уколико никад не би проверавао, инспектовани никад не би поштовао прописе. Као резултат овог конфликта не постоjи Нешов еквилибриjум. Какав год резултат игре био, увек ће jедан од њих желети да промени стратегиjу. Међутим ако дозволимо да играчи играjу своjе потезе са неком вероватноћом ствар се мења, што ћемо видети у наставку. Да бисмо детаљниjе приказали оваj проблем, увешћемо следеће ознаке: r = легални приходи коjе инспектовани прима, r > 0 l = профит уколико не поштуjе прописе и прође некажњено, l > 0 f = казна коjу плаћа уколико буде ухваћен, f > 0 3
Игра Инспекциjе c = трошкови инспекциjе, c > 0 λ = вероватноћа с коjом jе инспектовани ухваћен уколико инспектор проверава, λ [0, 1] Користећи ове ознаке добиjамо: Уколико инспектовани поштуjе закон, онда прима легалне приходе r, док исплативост инспектованог када не поштуjе прописе зависи од стратегиjе инспектора. Уколико инспектор ниjе проверавао, инспектовани добиjа легалан r и криминални профит l. Међутим, уколико jе инспектор проверио, онда jе инспектовани или кажњен са вероватноћом λ и мора да плати казну f, или jе избегао казну са вероватноћом (1 λ) и са криминалним профитом l. Параметар λ се може тумачити као ефикасност инспекциjе. Инспектор плаћа трошкове инспекциjе c сваки пут када провери. Ако jе све по пропису, инспектор остаjе са губитком c. Међутим, уколико инспектовани ниjе поштовао прописе, онда инспектор наплаћуjе казну f са вероватноћом λ, или инспектовани избегне казну са вероватноћом 1 λ и оставља инспектора са додатним губитком l. Уколико инспектор одлучи да не проверава, губи износ l уколико инспектовани ниjе поштовао прописе, или остаjе на 0 када инспектовани поштуjе прописе. Ова игра jе представљена у следећоj табели: Проверава Не проверава Не поштуjе r+ (1-λ)l λf, c + λf (1 λ)l r+l, -l Поштуjе r, -c r, 0 Да би игра била поштениjа уводимо следећа два услова: λ(l + f) > c и λ f > (1 λ) l Први услов осигурава да уколико инспектовани не поштуjе прописе, инспектор жели да га провери, jер добиjа више новчаних прихода од могуће казне, него што троши да би га проверио. Други услов гарантуjе да уколико инспектор проверава, инспектовани би радиjе да поштуjе прописе, jер казна превазилази криминални профит. Следећа теорема даjе jединствени Нешов еквилибриjум. Теорема 2.1. Нека jе p [0, 1] вероватноћа коjом инспектовани крши правила и q [0, 1] вероватноћа коjом инспектор проверава. Jединствен Нешов еквилибриjум за оба играча настаjе уколико су: p = c/λ(l + f) и q = l/λ(l + f) Доказ 2.1. Нека jе B зарада инспектора, и зарада инспектованог. Претпоставимо да постоjи Нешов еквилибриjум за вероватноће p и q. Нека jе p фиксирано. Даље имамо: E(B) = q(p( c + λf (1 λ)l) + (1 p)( c)) + (1 q)( pl) = = pqc + pqλf pql + pqλl + pqc qc pl + pql = 4
Игра Инспекциjе = q(pλf + pλl c) + (pc c pl) Нека jе S = pλf + pλl c, Ако jе S > 0, инспектору jе очигледно наjбоље да увек проверава. Ако jе S < 0, да никад не проверава. Међутим оба та случаjа не даjу Нешов еквилибриjум, jер ако инспектор стално проверава, онда инспектовани никада не краде, па инспектор не треба никад да проверава. Слично ако инспектор никад не проверава, инспектовани треба увек да краде, па инспектор треба увек да га проверава. Приметимо да ово важи само ако константе задовољаваjу задата ограничења. Ако jе S = 0, онда jе све jедно коjом вероватноћом инспектор проверава. S = 0 p = c. Аналогно jе за λ(f+l) q = l/λ(l + f) неважно коjом вероватноћом инспектовани не поштуjе правила, док се за остале q добиjе p = 0 p = 1, што не може чинити еквилибриjум. Из претходног рачуна уочавамо да p и q заиста даjу Нешов еквилибриjум, коjи мора бити jединствен. 5
Литература 3 Литература 1. Vassili Kolokoltsov, Hemant Passi, Wei Yang, Inspection and crime prevention: an evolutionary perspective 2. David Blackwell, M. A. Girshick, Theory of games and statistical decisions 3. Julio Gonzalez-Diaz, Ignacio Garcia-Jurado, M. Gloria Fiestras-Janeiro, An Introductory Course on Mathematical Game Theory 4. Elliott Mendelson, Introducing Game Theory and Its Applications 6