Segmenteerimine peidetud Markovi mudelite segude korral

Tartu Ülkool Loodus- ja täppsteaduste valdkond Matemaatka ja statstka nsttuut Matemaatlse statstka erala Segmenteermne pedetud Markov mudelte segude korral Magstrtöö 30 EAP) Autor katsmsjärgsete parandustega Autor: Jaak Sõnajalg Juhendaja: Jür Lember Tartu, 2016

Segmenteermne pedetud Markov mudelte segude korral Magstrtöö Jaak Sõnajalg Lühkokkuvõte. Pedetud Markov mudelte HMM) seguga puutume kokku, ku vaatleme HMM- parameetrte komplekt fkseermse asemel jaotust parameetrte ruuml. Klasskalne moodus pedetud sesundte vektor hndamseks on nn suurma tõepära meetod, ms sesneb vaatluste alusel ühe mudel fkseermses nng välja valtud mudelle hübrdtõepära maksmseerva Vterb algortm rakendamses. Sn töös tutvume alternatvse meetodga nn hübrd-em algortm), mlle puhul on eesmärk pedetud sesundte vektort hnnata otse, HMM- parameetred hndamata. Hübrd-EM algortm väljund sõltub algjoondusest, tutvustame üht vs algjoonduse valmseks. Töö praktlses osas uurme kahe HMM- segu korral, kudas mõjutab algjoonduse valk hübrd-em algortm väljundt. Lsaks võrdleme suurma tõepära meetodl ja hübrd-em algortm kasutades letud väljundjoonduste omadus. CERCS teaduserala: P160 Statstka, operatsoonanalüüs, programmeermne, fnantsja kndlustusmatemaatka. Märksõnad: pedetud Markov mudelte segud, HMM, segmenteermne, hübrd-em algortm, Vterb algortm. Segmentaton n Case of Mxtures of Hdden Markov Models Master s thess Jaak Sõnajalg Abstract. The need to deal wth mxtures of Hdden Markov Models HMMs) arses when we fx a dstrbuton on parameter space nstead fxng just one set of parameters for HMM. The common way to estmate the hdden state vector s the so-called expectaton maxmsaton method, usng whch we fx just one HMM and apply the Vterb algorthm. In ths paper an alternatve method s descrbed so-called segmentaton-em algorthm), whch ams to estmate the state vector drectly, wthout estmatng the parameters of the HMM. The output of ths algorthm depends on the choce of ntal path. We descrbe a method for pckng ntal paths. In the practcal part of the thess we wll apply the algorthm on a mxture of two HMMs and see how the choce of the ntal path affects the output. We wll then compare the propertes of the outputs obtaned usng the expectaton maxmsaton method and segmentaton-em algorthm. CERCS research specalsaton: P160 Statstcs, operaton research, programmng, actuaral mathematcs. Keywords: mxture of Hdden Markov Models, HMM, segmentaton, segmentaton EM algorthm, Vterb algorthm. 1

Ssukord Sssejuhatus 4 1 Pedetud Markov mudel 6 1.1 Defntsoon................................... 6 1.2 Rskd ja segmenteermne........................... 7 1.3 Forward-backward valemd........................... 10 1.4 Tnglkud ülemnekutõenäosused........................ 12 1.5 k-plok teoreem................................. 14 2 Pedetud Markov mudelte segu 15 2.1 Defntsoon................................... 15 2.2 Omadused.................................... 16 2.2.1 Kahe HMM- segu pole HMM..................... 16 2.2.2 Optmaalsusprntsp HMM-de segu korral e keht......... 17 2.2.3 Optmaalsusprntsp e keht HMM-de segude korral ka ss, ku ülemnekutõenäosused on ga HMM- korral samad......... 19 2.2.4 k-plok teoreem e keht......................... 20 2.3 PMAP-joondus segude korral......................... 20 3 Algortm hübrtõepära maksmseerva joonduse hndamseks HMM-de segu puhul 22 3.1 Vterb-EM................................... 22 3.2 Algortm PMAP-joonduse hndamseks.................... 25 3.3 Hübrd-EM algortm.............................. 26 3.3.1 Üks meetod optmaalse väljundjoonduse ledmseks......... 28 4 Smulatsoond 30 4.1 Hübrd-EM ernevate parameetrte korral.................. 30 4.2 Kahe meetod võrdlus.............................. 39 Krjandus 45 2

LISAD 46 Smulatsoondes kasutatud parameetrd...................... 46 Smulatsoondes kasutatud mudelte Vterb joondused.............. 47 Lhtltsents...................................... 48 3

Sssejuhatus Sagel on mõstlk mõne ajas juhuslkult edas areneva nähtuse korral rääkda selle nähtuse sesundtest nng nest sesundtest sõltuvatest vaatlustest. Veel võb olla mõstlk eeldada, et ühelt sesundlt tesele ülemnekul on mng kndel tõenäosus ja ga sesund emteerb teatud vaatluse mng kndla tõenäosusega, ent realseerunud sesundd pole mele teada. Näteks võb sellne raamstk med adata automaatse kõnetuvastuse juures. Ss on sesundteks nmese poolt väljastatavad häälkud, vaatlusteks mkrofon poolt püütud helsgnaal. Antud näte juures on vaatlused kõnetuvastusprogrammle teada, sesundd aga mtte. Pakub huv, kudas teada olevate vaatluste põhjal hnnata, mllsed sesundd vaatluste taga on. Pedetud Markov mudels on sesundte ja vaatluste vektor omavahel seotud just sellsel vsl. Lsaks eeldatakse, et sesundte vektor rahuldab Markov omadust. Tänu sellele lsaeeldusele saame kasutada mtmed võtted, ms hõlbustavad uurmsaluse nähtuse krjeldamst nng vaatluste alusel sesundte hndamst. Kõgst võmalkest sesundte vektortest ehk joondustest parma välja valmseks on mtmed lähenemsvse. See, mllst lähenemsvs kasutada, sõltub sellest, kudas me joonduse headuse defneerme. Olulsemate headuse krteerumtega puutume käesolevas töös ka kokku. Pedetud Markov mudel ülemnekutõenäosused ja tõenäosused, et mng sesund emteerb mng vaatluse, e pruug mele aga teada olla. Realstlkum on ned pedetud Markov mudel parameetred krjeldada jaotusega. Käesolevas töös vaatleme juhtu, kus võmalkke parameetrte komplekte on lõplk arv. Vaatleme sellel lhtsustatud juhul, mllsed on pedetud Markov mudelte kaalutud keskmse omadused nng tutvume algortmga, mlle abl hnnata ernevatele headuskrteerumtele vastavad joondus. Töö esmeses kolmes peatüks estletavad meetodd paneme proovle töö neljandas peatüks. Uurme smulatsoonde abl, kudas kätub tutvustatud algortm ernevate parameetrte korral nng võrdleme selle soortust ühe tehsõppe-alases krjanduses enam levnud meetod soortusega. Autor panuseks on lsaks käesoleva töö koostamsele kõg töös estatud tulemuste sesesev tõestamne nng smulatsoonde läb vmseks kasutatud algortmde programmeermne. Smuleermsel kasutatud programmd on krjutatud programmeermskeeles Python nng tulemuste graaflseks estamseks on kasutatud tarkvara Gnuplot. Käesolevas töö versoons on parandatud vead, mllele dr Krst Kuljus retsensendna 4

tähelepanu juhts. Ebakorrektsused on eemaldatud valemtest 1.15), 1.32), 4.9), 4.16), võrdusteahelast 3.9) ja töö lsast. 5

Peatükk 1 Pedetud Markov mudel 1.1 Defntsoon Olgu X vaatluste ruum ja Y = {1,..., K} lõplk sesundte hulk. Olgu Y juhuslk vektor pkkusega T, ms rahuldab Markov omadust ja mlle elemendd võtavad väärtus sesundte hulgal Y. Olgu X juhuslk vektor pkkusega T, ms võtab väärtus hulgal X. Tähstame juhuslke vektorte Y ja X realsatsoone vastavalt y ja x. Juhuslke vektorte Y ja X ajahetkele t vastavad elemente tähstame vastavalt Y t ja X t ; realsatsoonde ajahetkele t vastavad elemente vastavalt y t ja x t, t = 1,..., T. Juhuslke vektorte paar Y, X) on pedetud Markov mudel edaspd HMM, nglskeelsest nmetusest Hdden Markov Model), ku kehtvad järgmsed tngmused: 1. juhuslke suuruste X t tnglk sõltumatus tngmusel Y ; 2. juhuslku suuruse X t jaotus sõltub Y kaudu anult Y t jaotusest. Vektor Y algtõenäosused tähstame p 0,, ülemnekutõenäosused tähstame p,j, kus, j Y. Vaatluste vektor elemend X 1 jaotust tngmusel, et sellele vastava sesund korral kehtb Y 1 = j, j Y, nmetame emssoonjaotuseks. Eeldame üldstust ktsendamata, et emssoonjaotustel leduvad thedused mng ühse mõõdu λ suhtes. Ned thedus nmetame emssoonthedusteks, tähstame ned f j x t ). Realsatsoonde y ja x ühstõepära avaldub: T py, x) := p yt 1,y t f yt x t ). 1.1) Tähstame veel tnglkud tõenäosused t=1 py x) := PY = y X = x), 1.2) px y) := PX = x Y = y), 1.3) 6

p t y t x) := PY t = y t X = x). 1.4) Ku soovme vdata juhuslke vektorte Y ja X esmesest t elemendst koosnevatele alamvektortele Y 1,..., Y t ) ja X 1,..., X t ), kasutame vastavalt tähstus Y t ja X t ; vastavad realsatsoone tähstame y t ja x t. Alamvektortele Y t1,..., Y t2 ) ja X t1,..., X t2 ), t 1 < t 2, vdates kasutame tähstus Y t 2 t 1 ja X t 2 t 1 ; vastavad realsatsoone tähstame analoogselt vastavalt y t 2 t1 ja x t 2 t1. 1.2 Rskd ja segmenteermne Segmenteermseks nmetatakse vaatluste x 1,..., x T põhjalt joonduse y 1,..., y T hndamst. Kõg võmalke joonduste seast ühe välja valmseks kasutatakse headuse krteerumna rsk. Fkseertud vaatluste x korral joonduse hndamne sesneb ss sellse joonduse ledmses, mlle korral on rsk mnmaalne. Defneerme rskd, mllega käesolevas töös kokku puutume: R y x) := 1 py x), nng nele vastavad logartmlsed rskd T R 1 y x) := T p t y t x) 1.5) t=1 R y x) = ln py x), T R1 y x) = ln p t y t x) 1.6) t=1 Paneme tähele, et rsk R x) mnmseermne on ekvvalentne rsk R x) mnmseermsega. Samut on rsk R 1 x) mnmseermne samaväärne R 1 x) mnmseermsega. Joondust, ms mnmseerb R x), nmetatakse Vterb joonduseks. Joondust, ms mnmseerb R 1 x), nmetatakse PMAP-joonduseks ngl pontwse maxmum a posteror algnment). Rsk R x) mnmseerdes otsme joondust, mlle korral on tõepära py x) maksmaalne. Rsk R 1 x) mnmseermsel on eesmärgks klassftseermsvgade arvu mnmseermne. See tähendab, et me otsme fkseertud vaatluste vektor x korral joondust ŷ Y T, mlle korral kehtb ŷ = arg mn y Y T kus l, j) on punktvslne kaofunktsoon: T ) ly t, s t ) ps x), 1.7) s Y T t=1 0, ku = j l, j) := 1, ku j, j Y. 1.8) 7

Sama vaatluste vektor korral letud Vterb ja PMAP-joondused võvad olla väga ernevad. Näteks e võeta PMAP-joonduse ledmsel arvesse ülemnekutõenäosused, mstõttu võb PMAP-joonduse ŷ tnglk tõepära pŷ x) olla võrdne nullga, st ŷ pole kndlast Vterb joondus. Vterb joonduse korral aga võb keskmne klassftseermsvgade arv olla väga suur. Kahe lähenemse postvsete omaduste kombneermseks defneertakse hübrdrsk Paneme tähele, et kuna R α y x) = α R y x) + 1 α) R 1 y x), α [0, 1]. 1.9) ss kehtb ) T R α y x) = α ln py x) + 1 α) ln p t y t x), 1.10) t=1 arg mn y Rα y x) = arg max y ) T α ln py x) + 1 α) ln p t y t x), 1.11) t=1 st hübrdrsk mnmseermne on samaväärne nn hübrdtõepära maksmseermsega. Kuna ln py x) = ln py, x) ln px), ln p t y t x) = ln p t y t, x) ln px) ja kuna tõepära ln px) e sõltu joondusest y, ss võme võrduses 1.11) tnglkud tõepärad soov korral asendada ühstõepäradega: arg mn y Rα y x) = arg max y ) T α ln py, x) + 1 α) ln p t y t, x). 1.12) t=1 Nagu eespool öeldud, on üks parma joonduse välja valmse meetod sellse joonduse y ledmne, mlle korral on tõenäosus py x), võ samaväärselt tõenäosus py, x), maksmaalne. Selle mudu eksponentsaalse keerukusega ülesande lahendamseks saame kasutada Vterb algortm. See algortm põhneb Bellman optmaalsusprntsbl vt [2], lk 450). Järgnevas veendume, et tõepära py, x) maksmseervat joondust y on võmalk leda dünaamlst planeermst kasutades. Lause 1.2.1. Pedetud Markov ahelate korral kehtb ga sesund y t+1 optmaalsusprntsp: korral järgnev arg max y t :y t= pyt+1, x t+1 ) = arg max y t :y t= pyt, x t ) 1.13) Tõestus. Kasutades HMM- omadus ja Markov omadust: py t+1, x t+1 ) = px t+1 y t+1 ) py t+1 ) 8

= px t y t+1 ) px t+1 y t+1 ) py t+1 ) = px t y t ) px t+1 y t+1 ) py t+1 ) = px t y t ) px t+1 y t+1 ) py t ) py t+1 y t ) = px t, y t ) px t+1 y t+1 ) py t+1 y t ) = px t, y t ) p yt,yt+1 f yt+1 x t+1 ). Olgu s t = arg max y t :y t= py t, x t ) ja olgu y t+1 = j. Ss Sellest järeldubk soovtud tulemus: max y t :y pyt+1, x t+1 ) = p,j f j x t+1 ) max t= y t :y pxt, y t ). t= s t = arg max y t :y t= pyt+1, x t+1 ). 1.14) Eelnevalt oleme fkseernud pedetud Markov mudel ülemnekutõenäosustega p,j ja emssoontõenäosustega f j x t ). Ssend : Vaatlused x 1, x 2,..., x T. Arvuta ga j Y korral δ 1 j) = ln p 0,j + ln f j x 1 ). Iga t = 2,..., T korral: 1. Arvuta ga j Y korral δ t j) = max δ t 1 ) + ln p,j ) + ln f j x t ). 2. Jäta meelde sesund t 1 j) = arg max δ t 1 ) + ln p,j ). Lea tagant ettepoole tulles: v T = arg max δ T j), j v t = t v t+1 ), t = T 1, T 2,..., 1. Väljund: Vterb joondus v. Algortm 1: Vterb algortm Vaatleme joondus pkkusega t, ms lõppevad sesunds j. Olgu v t nende joonduste seas sellne, mlle korral tõepära ln pv t, x t ) on maksmaalne ja olgu δ t j) tõepära arvulne väärtus selle joonduse korral, st v t = arg max y t :y t=j ln pyt, x t ), δ t j) = max y t :y t=j ln pyt, x t ). 9

Lause 1.2.1) kohaselt saame suurus δ t j) leda rekursvselt. Teades ga sesund Y korral δ t 1 ) väärtust, valme välja sellse, mlle korral suurus δ t 1 )p j f j x t ) on maksmaalne: δ t j) = max y t :y pyt, x t ) t=j = max y t 1 :y t 1 = ) ln py t 1, x t 1 ) + ln p j + ln fj x t ) = max δ t 1 ) + ln p j ) + ln f j x t ). Ku jätame ga teratsoonsammu korral meelde, mllne on sesund, mda eelvmasel ajahetkel läbv joondus suuruse δ t j) maksmseerb, ja leppdes kokku, et mtme sellse sesund korral valme nest suvalse, saame Vterb joonduse ledmseks soblku algortm vt algortm 1). Seda algortm nmetame Vterb algortmks. Lause 1.2.2. Võttes algortms 1 δ 1 j) = α ln p 0,j + α ln f j x 1 ) + 1 α)p 1 j x), δ t j) = maxδ t 1 ) + α ln p,j ) + α ln f j x t ) + 1 α)p t j x), 1.15) saame algortm hübrdrsk R α x) mnmseerva joonduse ledmseks. Tõestus. Olgu D ajahetk, mlle korral kehtb 2 D < T. Iga sesund y D+1 korral kehtb max y D :y D = α ln py D+1, x D+1 ) + 1 α) = max y D :y D = D+1 α ln py D, x D ) + 1 α) t=1 D p t y t x) t=1 ) p t y t x) + α ln p,yd+1 + α ln f yd+1 x D+1 ) + 1 α)p D+1 y D+1 x). Seega saab hübrdrsk Rα x) mnmseervat joondust leda rekursvselt. Algortms 1 suuruste δ t j) asendamsel suurustega 1.15) leame just vajamnevad tõepärad ja algortm väljundks on ss hübrdrsk mõttes optmaalne joondus. ) 1.3 Forward-backward valemd Mtmete mes edasses huvtavate tõepärade ledmse hõlbustamseks defneerme ga x t X t, t T ja sesund j Y korral forward-backward muutujad: αj, x t ) := p t j x t )px t ), 1.16) 10

1, ku t = T βx T t+1 j) := px T t+1 Y t = j), ku t < T. 1.17) Forward-backward muutujad saab arvutada rekursvselt [5]: αj, x t+1 ) = k βx T t j) = k αk, x t )p kj f j x t+1 ), 1.18) p jk f k x t )βx T t+1 k) 1.19) Joonduse hübrdrsk arvutamseks, samut PMAP-joonduse ledmseks vajalk tõepära p t k x) avaldub forward-bacwkard muutujate kaudu järgnevalt [5]: p t k x) = αk, x) βxt t+1 k). 1.20) px) Mda suurem on T, seda väksemaks muutuvad tõenäosused px t ) ja seda väksemad väärtus võtavad forward-backward-muutujad. Psavalt suure T korral võvad arvud muutuda n väkeseks, et arvut ümardab need nullks. Eelpool defneertud forward-backward muutujate asemel saab defneerda skaleertud forward-backward-muutujad, mlle arvutamsel pole tõenäosus px t ) leda vaja. Sobva vs skaleertud forward-muutuja αj, x t ) ja skaleertud backward-muutuja βx T t+1 j) defneermseks saame võrduses 1.20) lkmed ümber grupeerdes: Tõenäosus p t k x) avaldub ss αj, x t ) := pj x t ), 1.21) 1, ku t = T ; βx T t+1 j) := px T t+1 Yt=j), ku t < T. 1.22) px T t+1 xt ) p t k x) = αk, xt ) βx T t+1 k) px) = p tk x t )px t )px T t+1 Y t = k) px t, x T t+1) = αk, x t ) βx T t+1 k). 1.23) Ledmaks eeskrja skaleertud forward-backward muutujate rekursvseks arvutamseks, kasutame rekursoone 1.18) ja 1.19). Rekursoon skaleertud forward-muutujate ledmseks: 11

αj, x 1 ) = p 0,jf j x 1 ), px 1 ) αj, x t ) = α tj) px t ) k αk, x t 1 )p kj f j x t ) = px t 1 )px t x t 1 ) k αk, x t 1 )p kj f j x t ) =. px t x t 1 ) Rekursvne arvutuseeskr skaleertud bacwkard-muutujate ledmseks on järgmne: 1.24) βx T t j) = = βxt t j) px T t x t 1 ) k p jk f k x t )βx T t+1 k) px T t x t 1 ) = pxt 1 ) k p jk f k x t )βx T t+1 k) px T t, x t 1 ) = pxt 1 ) k p jk f k x t )βx T t+1 k) px T t+1 x t ) px t ) = pxt 1 ) k p jk f k x t ) βx T t+1 k) px t, x t 1 ) = k p jk f k x t ) βx T t+1 k) px t x t 1 ). 1.25) Kummag rekursvse valem nmetajas olevad suurused leame paralleelselt skaleertud forward-muutujate arvutamsega: px 1 ) = j p 0,j f j x 1 ) px t x t 1 ) = s f s x t ) j p t 1 j x t 1 )p js 1.26) = s f s x t ) j αj, x t 1 )p js. Ned suurus kasutades saame leda vaatluste jada tõenäosuse. Et see tõenäosus võb psavalt suure T korral olla väga väke, tasub mel leda hoops selle tõenäosuse logartm: ln px) = ln px 1 ) + ln px 2 x 1 ) + ln px 3 x 2 ) + + ln px T x T 1 ). 1.27) 1.4 Tnglkud ülemnekutõenäosused Käesoleva töö praktlses osas soovme fkseertud vaatluste vektor x korral genereerda joondus tnglkust jaotusest py x). Sn alapeatüks uurme, kudas seda teha. 12

HMM-de puhul saab nädata [4], et vaatluste vektorga tnglkustatud sesundte vektor ülemnekutõenäosuste puhul kehtb PY t+1 = y t+1 Y t = y t, X = x) = PY t+1 = y t+1 Y t = y t, X T t+1 = x T t+1). 1.28) Seda tulemust kasutades saame tuletada arvutuseeskrja tnglke ülemnekutõenäosuste ledmseks: py t+1 y t, x T t+1) = py t+1, y t, x T t+1) py t, x T t+1) yt+2 = T YT t 1) pyt t, x T t+1) py t, x T t+1) = py t)py t+1 y t )f yt+1 x t+1 ) yt+2 T YT t 1) pyt t+2, x T t+2 y t+1 ) py t )px T t+1 y t ) = p y t,y t+1 f yt+1 x t+1 )px T t+2 y t+1 ) px T t+1 y t ) = p y t,y t+1 f yt+1 x t+1 )βx T t+2 y t+1 ). βx T t+1 y t ) Ku soovme kasutada skaleertud backward-muutujad, saab arvutuseeskr tnglke ülemnekutõenäosuste ledmseks järgmse kuju: py t+1 y t, x T t+1) = p y t,y t+1 f yt+1 x t+1 )βx T t+2 y t+1 ) βx T t+1 y t ) = p y t,y t+1 f yt+1 x t+1 ) βx T t+2 y t+1 )px T t+2 x t+1 ) βx T t+1 y t )px T t+1 x t ) = p y t,y t+1 f yt+1 x t+1 ) βx T t+2 y t+1 )px t ) βx T t+1 y t )px t+1 ) = p y t,y t+1 f yt+1 x t+1 ) βx T t+2 y t+1 ). βx T t+1 y t )px t+1 x t ) Vmaks tuletame arvutuseeskrja ka tnglke algtõenäosuste jaoks: 1.29) py 1 x T ) = py 1, x) px) y2 = T YT 1) py, x) px) = p 0,y 1 f y1 x 1 ) y T 2 YT 1) pyt 2, x T 2 y 1 ) px) = p 0,y 1 f y1 x 1 )βx T 2 y 1 ) px) = p 0,y 1 f y1 x 1 ) βx T 2 y 1 ). px 1 ) 1.30) 13

1.5 k-plok teoreem Tutvume põgusalt artkls [5] välja pakutud deega ledmaks joondus, mlle korral on ühendatud Vterb ja PMAP-joonduse postvsed omadused. Ideeks on leda joondus y, ms maksmseerb summa py k x) + py k+1 2 x) + py k+2 3 x) + + py T T k+1 x). 1.31) Valdes k = 1 saame PMAP joonduse ja valdes k = T Vterb joonduse. Vahepealsete k väärtuste korral loodame leda joondus, ms on omadustelt Vterb ja PMAP-joonduse vahepeal. Selle dee edasarendatud versoon korral defneertakse järgnevad suurused: Ū k y x) := Kehtb järgmne teoreem. T 1 j=1 k py mnj+k,t ) maxj+1,1) x), Rk y x) := ln Ūky x). 1.32) Teoreem 1.5.1. Iga x X T, y Y T ja k = 2,..., T korral kehtb R k y x) = k 1) R y x) + R 1 y x) 1.33) Tõestus. vt [3]. 14

Peatükk 2 Pedetud Markov mudelte segu 2.1 Defntsoon Olgu mel m pedetud Markov mudelt, mlle vaatluste vektor ja sesundte vektor pkkus on T. Mudelte erstamseks tähstame -nda mudel sesundte vektort Y, vaatluste vektort X, ülemnekutõenäosus p k,j ) ja emssoonthedus f j x t ). Kasutame -nda mudel suhtes letud tõepärale vtamseks tähst p ). Igale mudelle vastab kaal π, n et π = 1. Nende mudelte seguks Y, X) nmetame mudelt, mlle korral m py, x) := py, x )π. 2.1) =1 Olgu t 1,..., t e, t 1,..., t f vabalt valtud ajahetked, mlle korral kehtb 1 t 1 < < t e T ja 1 t 1 < < t f T. Järgnevas estame ja tõestame arvutuseeskrja sesundte vektor elementde Y t1,..., Y te ja vaatluste vektor elementde X t 1,..., X t f realsatsoonde y t1,..., y te ja x t 1,..., x t f ühse tõepära ledmseks. Arvutuseeskr kehtb ka juhul, ku e = 0 võ f = 0. Ku e = 0, leame vad vaatluste vektorst valtud elementdele vastavate realsatsoonde tõepära; ku f = 0 leame sesundte vektorst valtud elementdele vastavate realsatsoonde tõepära. Lause 2.1.1. Suvalste U, V {1; 2;... ; T }, ga sesundte komplekt {y u Y, u U} ja ga mõõtuvate hulkade komplekt {H v X, v V } korral PY u = y u, X v H v, u U, v V ) = m =1 PY u = y u, X v H v, u U, v V ) π. 2.2) Tõestus. Olgu λ mõõt, mlle suhtes on defneertud thedused f j hulgal X. Olgu µ sellele mõõdule vastav korrutsmõõt hulgal X T. PY u = y u,x v H v, u U, v V ) = 15

s Y T :s u=y u,u U) = = = s Y T :s u=y u,u U) m x X T :x v H v,v V ) =1 s Y T :s u=y u,u U) m =1 x X T :x v H v,v V ) ps, x) dµ m ) ps, x ) π dµ =1 ) ps, x ) π dµ x X T :x v H v,v V ) PY u = y u, X v H v, u U, v V ) π. Summeermse ja ntegreermse järjekorra muutmseks kasutasme ntegraal lneaarsuse omadust. 2.2 Omadused Sn alapeatüks uurme, kas HMM-de segul on samasugused omadused, ku ükskul HMM-l. 2.2.1 Kahe HMM- segu pole HMM Vaatleme kahesesundls Markov mudeled Y 1 ja Y 2 pkkusega T. Nende mudelte seguks nmetame mudelt Y, mlle korral kehtb: 2 PY = y) = PY = y )π, 2.3) =1 kus π on mudelte Y 1 ja Y 2 kaalud nng π = 1. Olgu vektorte Y 1 ja Y 2 ülemnekumaatrksd vastavalt 0,1 0,9 0,5 0,5 ja. 2.4) 0,1 0,9 0,5 0,5 Sesundte 1 ja 2 algsesundks olemse tõenäosus on Y 1 ja Y 2 puhul vastavalt 0,2, 0,8) ja 0,5, 0,5). Uurme, kas nende vektorte segu Y, kus Y 1 ja Y 2 kaaludeks on π 1 = π 2 = 1, 2 rahuldab Markov omadust. Meeldetuletuseks märgme, et Markov omadus on vektor Y korral rahuldatud, ku suvalse 2 < t T korral kehtb PY t = y t Y t 1 = y t 1,..., Y 1 = y 1 ) = P Y t = y t Y t 1 = y t 1 ). 2.5) Leame vastavad tõenäosused t = 3, y 3 = 2, y 2 = 2 ja y 1 = 2 korral: PY 3 = 2 Y 2 = 2) = PY 2 = 2, Y 3 = 2) PY 2 = 2) 16

1 2 = PY 2 1 = 2, Y3 1 = 2) + 1 PY 2 2 2 = 2, Y3 2 = 2) 1 PY 1 2 2 = 2) + 1 PY 2 2 2 = 2) = 0,2 0,9 + 0,8 0,9) 0,9 + 0,5 0,5 + 0,5 0,5) 0,5 0,2 0,9 + 0,8 0,9) + 0,5 0,5 + 0,5 0,5) = 53 70, PY 3 = 2 Y 2 = 2, Y 1 = 2) = PY 1 = 2, Y 2 = 2, Y 3 = 2) PY 1 = 2, Y 2 = 2) 1 2 = PY 1 1 = 2, Y2 1 = 2, Y3 1 = 2) + 1 PY 2 2 1 = 2, Y2 2 = 2, Y3 2 = 2) 1 PY 1 2 1 = 2, Y2 1 = 2) + 1 PY 2 2 1 = 2, Y2 2 = 2) = 0,8 0,9 0,9 + 0,5 0,5 0,5 0,8 0,9 + 0,5 0,5 = 773 970 Letud tõenäosused e ole võrdsed, seega e rahulda segu Y Markov omadust. Kuna Y e rahulda Markov omadust, e ole Y, X) üheg juhuslku vektor X korral HMM. 2.2.2 Optmaalsusprntsp HMM-de segu korral e keht Tahame teada, kas HMM-de segu 2.1) korral saab suurma tõepäraga joonduse ledmseks kasutada Vterb algortm. Selleks uurme, kas segu korral kehtb optmaalsusprntsp 1.13). Olgu v t joondus, mlle korral kehtb pv t, x t ) = max y t py t, x t ). Vaatleme kõk joondus pkkusega t + 1, ms on ajahetkel t sesunds v t. Ku optmaalsusprntsp kehtks, peaks nest suurma tõepäraga joondus olema ajahetken t dentne joondusega v t, st peaks kehtma v t = arg max y t :y t=v t py t+1, x t+1 ). Olgu t = 5, Y = {1, 2} ja X = {A, B}. Olgu mel kaks mudelt kaaludega π 1 = 0,25 ja π 2 = 0,75. Olgu mudelte algtõenäosused ja ülemnekumaatrksd vastavalt P1 0 = 0,3 0,4 0,6, P 1 = ja P2 0 = 0,8 0,3 0,7, P 2 = 0,7 0,8 0,2 0,2 0,6 0,4 nng olgu emssoontõenäosused 1 1 Emssoontõenäosused on sn ja edaspd estatud maatrkskujul. Maatrks -ndale reale vastab sesundte ruum Y = {ỹ 1 ; ỹ 2 ;... ; ỹ a } element ỹ, j-ndale veerule vaatluste ruum X = { x 1 ; x 2 ;... ; x b } element x j ja -ndas reas nng j-ndas veerus asuvale elemendle emssoontõenäosus fỹ x j ). 17

0,2 0,8 0,7 0,3 f 1 = ja f 2 = 0,9 0,1 0,2 0,8 Olgu realseerunud vaatlusteks x 6 = A, B, B, A, A, B). Ss tee pkkusega 5, ms maksmseerb py 5, x 5 ), on v 5 = 1, 2, 2, 1, 2). Samas joondus w 6, ms maksmseerb py 6, x 6 ) sellste joonduste y 6 seas, ms läbvad ajahetkel 5 sesundt 2, on 2, 1, 1, 2, 2, 1). Näeme, et joonduse v 5 sesundd ernevad joonduse w 6 esmesele vele ajahetkele vastavatest sesunddest moodustatud vektorst. Seega e keht segude 2.1) korral optmaalsusprntsp 1.13). y 5 py 5 x 5 ) 1, 2, 2, 1, 2) 0,124 2, 1, 1, 2, 2) 0,088 Tabel 2.1: Mõn joondus pkkusega 5 ja nele vastavad tõepärad. Tabels 2.1 on estatud joondusele v 5 vastav tõepära koos joonduse w 6 algusosale vastava tõepäraga. Tabels 2.2 on estatud joondusele w 6 vastav tõepära koos joonduse v 5 ühe sesund võrra pkendamse teel saadud joonduste tõepäradega. Joonduse v 5 jätkamsel saadavate joonduste tõepärad on mõlemad väksemad, ku joondusele w 6 vastav tõepära. Joondused v 5 ja v 6 on kujutatud joonsel 2.1. y 6 py 6 x 6 ) 2, 1, 1, 2, 2, 1) 0,096 1, 2, 2, 1, 2, 1) 0,038 1, 2, 2, 1, 2, 2) 0,068 Tabel 2.2: Mõn joondus pkkusega 6 ja nele vastavad tõepärad. 2 v 5 w 6 sesund 1 1 2 3 4 5 6 ajahetk t Joons 2.1: Optmaalsusprntsp e keht. Joondus v 5 e üht joonduse w 6 algusosaga. 18

2.2.3 Optmaalsusprntsp e keht HMM-de segude korral ka ss, ku ülemnekutõenäosused on ga HMM- korral samad Olgu Y = {1, 2} ja X = {A, B}. Olgu mel kaks mudelt kaaludega π 1 π 2 = 0,75. Olgu mõlema mudel puhul algtõenäosused ja ülemnekumaatrksd = 0,25 ja P 0 = 0,8 0,3 0,7, P = 0,2 0,6 0,4 nng olgu emssoontõenäosused 0,2 0,8 0,07 0,93 f 1 = ja f 2 =. 0,9 0,1 0,02 0,98 Olgu realseerunud vaatlusteks x 3 = A, B, B). Ss joondus pkkusega 2, ms maksmeerb py 2, x 2 ), on v 2 = 2, 1). Joondus w 3, mlle korral pw 3, x 3 ) = max y 3 :y 2 =1 py 3, x 3 ), on 1, 1, 2). Joondus v 2 e üht joonduse w 3 algusosaga, seega e keht segude 2.1) korral optmaalsusprntsp 1.13) seg ss, ku ülemnekutõenäosused on ga mudel korral samad. y 2 py 2 x 2 ) 2, 1) 0,294 1, 1) 0,269 Tabel 2.3: Mõn joondus pkkusega 2 ja nele vastavad tõepärad. y 3 py 2 x 3 ) 1, 1, 2) 0,163 2, 1, 1) 0,106 2, 1, 2) 0,050 Tabel 2.4: Mõn joondus pkkusega 3 ja nele vastavad tõepärad. Tabels 2.3 on estatud joondusele v 2 vastav tõepära koos joonduse w 3 algusosale vastava tõepäraga. Tabels 2.4 on estatud joondusele w 3 vastav tõepära koos joonduse v 2 ühe sesund võrra pkendamse teel saadud joonduste tõepäradega. Joonduse v 2 jätkamsel saadavate joonduste tõepärad on mõlemad väksemad, ku joondusele w 3 vastav tõepära. Joondused v 2 ja w 3 on kujutatud joonsel 2.1. 19

2 sesund 1 v 2 w 3 1 2 3 ajahetk t Joons 2.2: Optmaalsusprntsp e keht. Joondus v 2 e üht joonduse w 3 algusosaga. 2.2.4 k-plok teoreem e keht. Nätame kontranäte abl, et Teoreem 1.5.1) segude korral e keht. Olgu kahe pedetud Markov mudel segu samasugune nagu ala-alapeatüks 2.2.2). Olgu joondus y = 1, 2, 1, 1, 2, 1) ja olgu realseerunud vaatlusteks x = A, B, B, A, B, A). Valme plok suuruseks k = 3. Ss k 1) R y x) + R 1 y x) 5,950, R k y x) 6,758. 2.3 PMAP-joondus segude korral PMAP-joondus on joondus, ms mnmseerb R 1 x) ja R 1 x). Tessõnu, tegu on joondusega u, ms rahuldab ga ajahetke t korral võrdust u t = arg max p t k, x T ). k HMM-de segu 2.1) korral tähendab see, et PMAP-joondus u rahuldab järgmst võrdust. u t = arg max k m p t k, x )π. 2.6) =1 Skaleertud forward-backward valemte abl oskame me ga mudel, ajahetke t ja klass k korral arvutada tõenäosus p t k x, ) vt 1.23)). Ku T pole lga suur, saame ga mudel korral arvutada ka tõenäosus px ). N saame arvutada PMAP-joonduse ledmseks vajalkud tõenäosused: p t k, x ) = p t k x, ) px ). 20

Ku T on suur ja eelstame vaatluste jada tõenäosuse asemel kasutada selle logartm ln px ), saame võrduses 3.2) maksmseertava tõenäosuse logartm leda kasutades järgnevat võtet, mllele vtame edaspd nmetusega logartmvõte. Olgu a 1,..., a m postvsed arvud. Ss ln ) a = ln a 1 + ln 1 + a 2 + + a ) m a 1 a 1 = ln a 1 + ln 1 + exp [ln a 2 ln a 1 ] + + exp [ln a m a 1 ]). 2.7) Asendades tehtes 2.7) suurused a suurustega p t k x, )px )π, saame eeskrja tõenäosuste p t k, x) ledmseks. Nmelt ss ln a = ln p t k x, ) + ln px ) + ln π, mda oskame leda: tõenäosused ln p t k x, ) saame võrdusest 1.23) ja suurused ln px ) võrdusest 1.27). 21

Peatükk 3 Algortm hübrtõepära maksmseerva joonduse hndamseks HMM-de segu puhul Eelmses peatüks nägme, et HMM-de segu korral optmaalsusprntsp 1.13) e keht. Seega e saa HMM-de segu korral tõepära maksmseerva joonduse ledmseks kasutada Vterb algortm. Käesolevas peatüks jõuame samm-sammult teratvse algortmn, mlle abl saame HMM-de segu korral hübrdtõepära maksmseervat joondust hnnata. Joonduse hndamse all peame slmas võmalkult kõrge hübrdtõepäraga joonduse ledmst. Muuhulgas saab seda algortm kasutada ka Vterb joonduse hndamseks. Esmalt tutvustame teratvsed algortme, mda saab kasutada hübrdtõepära maksmseermseks α = 0 ja α = 1 korral. Nende algortmde juures kasutatavad ded kombneerdes jõuame algortmn, mlle abl saab hübrdtõepära maksmseerda suvalse α väärtuse korral. Iteratvne algortm, mllen jõuame, kasutab hübrdrsk mnmseerva joonduse hndamseks algjoondust. Käesoleva peatük lõpus tutvume ühe deega, mlle alusel algjoondust valda. 3.1 Vterb-EM Tähstame p y, x) := py, x )π = py, x )π. 3.1) py, x )π py, x) Vterb-EM on algortm, ms ga algjoonduse y 0) korral leab teratvselt joondus y 1), y 2),..., kusjuures 22

y l+1) = arg max y ln py, x )) p y l), x). 3.2) Vterb-EM algortm eesmärk on maksmseerda hübrdtõepära α = 1 korral. Näeme järgnevas, et selle algortm ga teratsoonsamm kasvatab sellele α väärtusele vastavat hübrdtõepära. Lause 3.1.1. Iga Vterb-EM algortm teratsoonsamm kasvatab tõepära, st Tõestus. Tähstame ln py l+1) x) ln py l) x). 3.3) Ss kehtb: py, x) := py, x ) π. 3.4) px) py, x) = py, x, ) px) = p y, x) px, y) px) = p x, y) py x), 3.5) kus py, x, ) on -nda mudel ja realsatsoonde y ja x ühstõepära. Eelnevast võrdustereast järeldub, et ga mudel korral kehtb ln py x) = ln py, x) ln p y, x). N saame üle kõg mudelte summeerdes anda med huvtava tõepära logartmle järgneva kuju. ln py x) = ln py, x)) p y l), x) ln p y, x)) p y l), x). Nätame nüüd, et ln pyl+1) x) py l) x) 0 ehk kehtb py l+1) x) py l) x): ln py l+1) x) ln py l) x) = ln py l+1), x) ) p y l), x) ln p y l+1), x) ) p y l), x) ln py l), x) ) p y l), x) ln p y l), x) ) ) p y l), x) = ln py l+1), x) ) p y l), x) ln py l), x) ) p y l), x) ln p y l+1), x) ) p y l), x) + ln p y l), x) ) p y l), x) 23

ln ln = ln p y l+1) ), x) p y l), x) p y l), x) p y l+1), x) p y l), x) p yl), x) p y l+1), x) = 0. Sn tuleneb esmene võrratus võrdusest 3.2). Nmelt kehtb ln py, x ) = ln py, x)+ ln px) ln π. Võrduse parema poole ldetavatest sõltub y-st anult ln py, x), mstõttu on 3.2) ekvvalentne järgmse võrdusega: y l+1) = arg max y ln py, x)) p y l), x). Tene võrratus tuleneb Jensen võrratusest. Nmelt on ln ) kumer funktsoon. Järeldus 3.1.1. Vterb-EM algortm puhul kehtb py l+1) x) py l) x). 3.6) Tõestus. Tuleneb logartm omadustest. Nätame järgnevalt, et ku asendada Vterb algortms algortm 1) ülemnekutõenäosused ja emssoonthedused teste, sobvalt defneertud suurustega, saame algortm joonduste 3.2) ledmseks. Teoreem 3.1.1. Joonduse 3.2) võb leda Vterb algortm abl, kus ülemnekutõenäosuste ka algtõenäosuste) ja emssoontõenäosuste võ emssoontheduste) asemel kasutatakse vastavalt suurus [ ] u r,s := exp ln p r,s )) p y l), x), r = 0,..., K, s = 1,..., K. 3.7) ja [ ] h k x t ) := exp ln f k x t )) p y l), x), k = 1,..., K. 3.8) Tõestus. Võrduses 3.2) maksmseertav suurus avaldub suuruste u r,s ja h k x t ) kaudu järgnevalt: ln py, x )) p y l), x) = T 1 ln p t,t+1 )p y l), x) + t=0 T ln f yt x t )p y l), x) t=1 24

[ ] [ ] T 1 T = ln exp ln p t,t+1 )p y l), x) + ln exp ln f yt x t )p y l), x) t=0 t=1 T 1 T = ln u yt,yt+1 + ln h yt x t ). t=0 t=1 Olgu s joondus pkkusega T ja olgu D mng ajahetk, mlle korral kehtb 1 D < T. Nätame nüüd, et ga sesund y D+1 korral kehtb arg max y D :y D =k Olgu y D+1 = j. Ss max y D :y D =k ln py D+1, x ) ) p s, x) = arg max y D :y D =k ln py D+1, x ) ) p s, x) [ D = max ln u yt,y y D t+1 + :y D =k t=0 D+1 t=1 = ln u kj + ln h j x D+1 ) + max y D :y D =k ln h yt x t ) [ D 1 ] ln py D, x ) ) p s, x). ] D ln u yt,yt+1 + ln h yt x t ). t=0 t=1 Seega saab joondust 3.2) leda Vterb algortm abl, kus ga sesund j Y korral 3.9) δ 1 j) = ln u 0,y1 + ln h j x 1 ), δ t j) = max r Y δ t 1r) + ln u r,j ) + ln h j x t ). Paneme tähele, et fkseertud sesund r Y korral e pruug summad s Y u r,s ja x X h k x) võrduda ühega. See med aga e sega. Kuna suurused u r,s ja h k x t ) on alat mttenegatvsed, on tuletatud algortm kasutamne õgustatud. 3.2 Algortm PMAP-joonduse hndamseks Eelmses peatüks nägme, et PMAP-joondust saab HMM-de segude korral leda. Seetõttu pole PMAP-joondust hndavat algortm mele vaja. Ssk atab sellse algortm uurmne mel hljem leda algortm, mda kasutades saame hnnata hübrdrsk mnmseervat joondust. Tähstame esmalt p Y t = k, x) := p tk, x )π = p tk, x )π. 3.10) p t k, x )π p t k, x) 25

Olgu y 0), y 1), y 2),... joonduste jada, kusjuures y l+1) = arg max y Lause 3.2.1. Tngmuse 3.11) järg letud joonduste korral t ln p t y t x, )) p Y t = y l) t, x). 3.11) Tõestus. Olgu p t y l+1) t x) p t y l) t x). 3.12) Analoogselt Lause 3.1.1 tõestusega saame, et p t k, x) := p tk, x ) π. 3.13) px) ln p t y l+1) t x) ln p t y l) t x) = ln p t y l+1) t ln p t y l+1) t, x) p t y l) t, x) ln ln p t y l+1) t, x) ) p y l) t, x), x) ) p y l) t, x) + p y l) t, x) p t y l+1) t, x) p t y l) t, x) p yl) t, x) = 0. ln p t y l) t, x) ) p y l) t, x) ln p t y l) t, x) ) p y l) t, x) 3.3 Hübrd-EM algortm Kasutame eelmstes alapeatükkdes estatud ded mele huv pakkuva algortm ledmseks. Vdates mee eesmärgle hnnata hübrdrsk mnmseervat joondust, vtame tuletatavale algortmle nmetusega hübrd-em algortm. Olgu α [0, 1], olgu y 0), y 1), y 2),... joonduste jada, kusjuures y l+1) = arg max y [ α ln py, x )) p y l), x) + 1 α) t ] ln p t y t x, )) p Y t = y l) t, x) 3.14) Lause 3.3.1. Iga hübrdalgortm teratsoonsamm kasvatab tõepära, st 3.14) järg letud joonduste korral kehtb α ln py l+1) x) + 1 α) t ln p t y l+1) t x) α ln py l) x) + 1 α) t ln p t y l) t x). 3.15) 26

Tõestus. Võrratuse tõestamseks kasutame eelmses kahes alapeatüks kasutatud võtted. α lnpy l+1) x) + 1 α) t [ ln p t y l+1) t x) α ln py l) x) + 1 α) t ] ln p t y l) t x) =α ln py l+1), x) ) p y l), x) α [ ln p y l+1), x) ) p y l), x) α ln py l), x) ) p y l), x) α ln p y l), x) ) p y l), x) + 1 α) ln p t y l+1) t, x) ) p y l) t, x) 1 α) ln p t y l+1) t, x) ) p y l) t, x) t t [ 1 α) ln p t y l) t, x) ) p y l) t, x) 1 α) ln p t y l) t, x) ) ] p y l) t, x) t t =α ln py l+1), x) ) p y l), x) + 1 α) ln p t y l+1) t, x) ) p y l) t, x) t [ α ln py l), x) ) p y l), x) + 1 α) ln p t y l) t, x) ) ] p y l) t, x) t + α p y l+1) ), x) ln p y l), x) + 1 α) pt y l+1) ), x) ln p p y l), x) t p t y l) t y l), x), x) α ln p y l+1) ), x) p y l), x) 1 α) ln pt y l+1) ), x) p p y l), x) t p t y l) t y l), x), x) = α ln = 0. p y l+1), x) 1 α) t ln p t y l+1), x) Võrratus tuleneb joonduste ledmse eeskrjast 3.14) ja Jensen võrratusest. Järelduse 3.1.1) ekvvalent sn tõestada e saa, st järjestkused joondused e pruug kasvatada tõepära ] αpy l) x) + 1 α) t p t y l) t x). Järgnevalt estame algortm hübrdrsk mnmseerva joonduse hndamseks nng tõestame, et selle kasutamne on õgustatud. Teoreem 3.3.1. Joondus 3.14) saab leda Vterb tüüp algortmga. Tõestus. Avaldame eeskrjas 3.14) maksmseertava suuruse Teoreems 3.1.1 defneertud suuruste u r,s nng h k x t ) ja suuruste q t k) := ln p t k x, )) p Y t = y l) t, x) 3.16) kaudu: 27

α T ln py, x )) p y l), x) + 1 α) ln p t y t x, )) p Y t = y l) t, x) t=1 T 1 T T = α ln u yt,yt+1 + α ln h yt x t ) + 1 α) q t y t ). t=0 t=1 t=1 Olgu s mng joondus pkkusega T nng olgu D mng ajahetk, mlle korral kehtb 1 D < T. Nätame nüüd, et ga sesund y D+1 korral kehtb [ arg max α ln py D+1), x ) ) ] D+1 p s, x) + 1 α) ln p t y t x, )) p Y t = s t, x) = y D :Y D =k t=1 [ arg max α ln py D, x ) ) ] D p s, x) + 1 α) ln p t y t x, )) p Y t = s t, x). y D :Y D =k t=1 Olgu y D+1 = j. Ss max y D :Y D =k [ α = max y D :Y D =k ln py D+1), x ) ) ] D+1 p s, x) + 1 α) ln p t y t x, )) p Y t = s t, x) t=1 [ ] D D+1 D+1 α ln u yt,yt+1 + α ln h yt x t ) + 1 α) q t y t ) t=0 t=1 t=1 = α ln u kj + α ln h j x D+1 ) + 1 α)q D+1 j) [ ] D 1 D D + max α ln u yt,y y D t+1 + α ln h yt x t ) + 1 α) q t y t ). :Y D =k t=0 t=1 t=1 Seega saab joondus 3.14) leda Vterb algortmga, kus δ t+1 k) = max δ t j) + α ln u jk ) + α ln h k x t+1 ) + 1 α)q t+1 k). 3.17) j 3.3.1 Üks meetod optmaalse väljundjoonduse ledmseks Nagu käesoleva töö praktlses osas näeme, võb hübrd-em algortm väljundjoonduste hübrdtõepära ernevate algjoonduste korral olla väga ernev. Loomulkult on mee eesmärgks alat sellse algjoonduse kasutamne, mlle korral on väljundjoonduse hübrdtõepära võmalkult suur. Tutvustame sn üht deed hübrd-em algortmle sobva algjoonduse ledmseks. Jagame lõgu [0, 1] r-ks võrdseks osaks pkkusega. Olgu α 0,..., α r arvud lõgul [0, 1] sellsed, et α 0 = 0, α r = 1 ja kehtgu ga 0,..., r 1 korral α +1 = α +. Alapeatüks 2.3) nägme, kudas leda α = α 0 korral hübrdrsk mnmseervat joondust ehk PMAP-joondust y α0. Kasutame joondust y α0 algjoondusena parameetr α väärtuse α 1 korral. Ku on psavalt väke ja ku kehtb py α0, x) 0, on y α0 lmselt ka α 1 28

korral hübrdtõepära poolest optmaalne joondus. Ku ta seda pole, loodame joondust y α0 algjoondusena kasutades leda α 1 korral hübrdtõepära poolest optmaalse joonduse y α1. Joondust y α1 parameetr α väärtuse α 2 korral algjoondusena kasutades loodame leda optmaalset joondust y α2 ja n edas. Sellste väkeste sammude kaupa parameetr α väärtust kasvatades loodame hübrdtõepära maksmseervat joondust leda ka α = α r korral. 29

Peatükk 4 Smulatsoond Käesoleva töö praktlne osa koosneb kahest poolest. Esmalt uurme fkseertud vaatluste vektor x korral, kudas sõltub väljundjoondus parameetr α ja algjoonduse y 0) valkust. Teeme seda kahe segu korral. Sagel hnnatakse HMM-de segu segmenteermsülesande lahendamseks esmalt kõge tõenäolsem mudel nng seejärel kasutatakse seda mudelt huvpakkuvate joonduste ledmseks vt nt [1]). Praktlse osa teses pooles võrdleme seda meetodt kasutades letud joonduste omadus hübrd-em algortm väljundjoonduste omadustega. 4.1 Hübrd-EM ernevate parameetrte korral Eelmses peatüks jõudsme algortmn, mlle abl loodame leda hübrdrsk Rα x) mnmseervat ehk hübrdtõepära T α ln ps x) + 1 α) ln p t s t x) 4.1) t=1 maksmseervat joondust. Selle algortm pseudokood on algortm 2. Uurme kahe lhtsa näte korral, kudas algortm kätub ernevate parameetr α väärtuste ja ernevate algjoonduste y 0) korral. Vaatleme ükstese järel kaht kahe HMM- segu. Esmese segu segu A) korral on kõk ülemnekutõenäosused nullst ernevad, tese segu segu B) korral mtte. Edasses kasutame mng α väärtuse korral ja algjoondust y 0) kasutades letud algortm 2 väljundjoondusele vtamseks tähst v α y 0) ). Olgu sesundte ruum ja vaatluste ruum vastavalt Y = {1, 2, 3, 4, 5}, X = { A, B, C, D, E, F, G }. 30

Eelnevalt oleme fkseernud m pedetud Markov mudelt ülemnekutõenäosustega p k,l ) ja emssoontõenäosustega f l nng mudelte kaalud π. Ssend : Vaatlused x 1, x 2,..., x T, algjoondus y 0), parameeter α ja peatumskrteerum määrav ε. Iga t = 1,..., T korral: 1. Arvuta valem 1.26) järg px t x t 1 ). 2. Arvuta ga j Y korral valemt 1.24) kasutades αj, x t ). Iga t = 1,..., T korral: Arvuta ga j Y korral valemt 1.25) kasutades βx T t+1 j). Lea suuruste px t x t 1 ) abl ln px) vt valem 1.27)) ja suuruste αj, x t ) ja βx T t+1 j) abl suurused p t j x) vt valem 1.23)). Olgu l = 0 ja R α y 1) x) =. Kun R α y l 1) x) R α y l) x) > ε : 1. Lea ga mudel = 1,..., m korral nn logartmvõtet kasutades ln p y l), x) = ln py l), x )π ) ln mj=1 py l), x j)π j ) 2. Lea ga ajahetke t, ga mudel = 1,..., m ja j Y korral nn logartmvõtet kasutades ln p t y l) t, x) = ln p t y l) ) mj=1 t, x )π ln p t y l) ) t, x j)π j. 3. Arvuta ga r = 0,..., K, ga s = 1,..., K korral nn ülemnekutõenäosused u r,s vt 3.7)). 4. Arvuta ga k Y ja ga üksku vaatluse x t korral nn emssoontõenäosused h k x t ) vt 3.8)), 5. Arvuta ga ajahetke t ja ga k Y korral suurused q t k) vt 3.16)) 6. Arvuta ga j Y korral δ 1 j) = α ln u 0,j + ln h j x 1 )) + 1 α)q 1 j). Iga t = 2,..., T korral: 1. Arvuta ga j Y korral δ t j) = max δ t 1 ) + α ln u j ) + α ln h j x t ) + 1 α)q t j). 2. Jäta meelde sesund t 1 j) = arg max δ t 1 ) + α ln u j ). Lea tagant ettepoole tulles: y l+1) T y l+1) t = arg max δ T j), j = t y l+1) t+1 ), t = T 1, T 2,..., 1. Väljund: Joondus y l+1). Algortm 2: Hübrd-EM algortm 31

Fkseerme T = 25. Vaatleme kahe HMM- segu, kus mudelte kaaludeks on π 1 = 0,25 ja π 2 = 0,75. Mudelte ülemnekumaatrksd olgu vastavalt P1 A ja P2 A, algjaotused vastavalt P1 0 ja P2 0 nng emssoontõenäosuste maatrksd vastavalt f 1 ja f 2. Ülemnekumaatrksd, algjaotused ja emssoontõenäosuste maatrksd on estatud käesoleva töö lsas. Edaspd vtame sellele segule nmega segu A. Smuleerme segust A vaatluste vektor realsatsoon x. Selleks valme juhuslkult ühe mudel kahest, kusjuures esmese mudel valmse tõenäosus on π 1 ja tese mudel valmse tõenäosus π 2. Seejärel genereerme valtuks osutunud mudel algjaotust P 0 ja ülemnekumaatrkst P A kasutades sesundte vektor y. See tähendab, et sesund y 1 genereerme juhuslkult algjaotuse P 0 kohaselt. Iga edasse sesund y t realsatsoon k genereerme eelmsele sesundle y t 1 ülemnekumaatrkss P A vastavate ülemnekutõenäosuste p yt 1,k kohaselt. Vaatluste vektor x genereermseks kasutame nüüd emssoontõenäosuste maatrkst f. Vaatluse x t genereermseks valme juhuslkult ühe vaatluse hulgast X, kusjuures mng hulga X elemend valtuks osutumse tõenäosusena kasutame tõenäosus emssoontõenäosuste maatrks f sellelt realt, ms vastab eespool genereertud sesundle y t. Krjeldatud vsl tomdes osutus mel valtuks mudel 2. Realseerunud sesundte vektor ja vaatluste vektor on estatud käesoleva töö lsas. peret: Parameetr α väärtusena kasutame kõk arve hulgast {0,000; 0,001; 0,002,..., 1,000}. Kasutame edasses algjoonduse y 0) rolls üheksat ernevat joondust ja üht joonduste vastavalt anult ühtedest, kahtedest, kolmedest, neljadest ja vtest koosnevad joondused y 0) 1, y 0) 2, y 0) 3, y 0) 4 ja y 0) 5 ; joondus y 0) 6 = 3, 2, 1,..., 1); joondus y 0) 7 = 3, 3, 1,..., 1); kummaleg mudelle vastavad Vterb joondused y 0) v1,a ja y 0) v2,a; joonduste pere {y α 0) }, kus y α 0) on hübrd-em algortm väljund algjoonduse y α 0) 1 korral ja kus y α 0) 1 ledmseks on algjoondusena kasutatud PMAP-joondust loe lähemalt ala-alapeatüks 3.3.1)). Algjoonduse y 0) 6 valmse motvks on mee kavatsus segu B esmese mudel korral seada ülemnekutõenäosus p 3,2 võrdseks nullga. Segu B tese mudel ülemnekumaatrkss võrdsustame nullga tõenäosuse p 3,3, seetõttu on huvtav vaadelda, kudas kätub algortm algjoonduse y 0) 7 korral. Vterb joondused saab leda rakendades algortm 2 anult ühest mudelst koosnevale segule ja võttes α = 1. Kummaleg mudelle vastavad Vterb joondused on estatud käesoleva töö lsas. 32

Joonsel 4.1 on kujutatud joondus v α y 0) 1 ) ve erneva α väärtuse korral. Samasugused joondused saame ka algjoondus y 0) 4, y 0) 5, y 0) 6, y 0) 7, y 0) v2,a ja algjoonduste peret {y α 0) } kasutades. Näeme, et väljundjoondused ernevad ükstesest õge vähe. Näeme kaht dentsete joonduste paar: v 0,5 y 0) 1 ) ja v 0,75 y 0) 1 ) nng v 0 y 0) 1 ) ja v 0,01 y 0) 1 ). Joonsel 4.2 on kujutatud joondus v α y 0) 2 ) nende samade ve α väärtuse korral. Samasugused väljundjoondused saame ka algjoondus y 0) 3 ja y 0) v1,a kasutades. Ka sn on parameetr α väärtustele 0 ja 0,01 vastavad väljundjoonduse dentsed. Parameetr α väärtustele 0,5 ja 0,75 vastavad joondused on sn aga ükstesest ernevad. 5 α=1,00 α=0,75 α=0,50 α=0,01 α=0,00 4 sesund 3 2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 ajahetk t Joons 4.1: Hübrd-EM algortm väljundd segu A korral, ku kasutada algjoondusena joondust y 0) 1, y 0) 4, y 0) 5, y 0) 6, y 0) 7, y 0) v2,a võ algjoonduste peret {y α 0) }. Väljundjoonduste paremaks erstamseks on joonduste graafkud sn ja edaspd psut y-telje suunal nhutatud. Joonsed 4.1 ja 4.2 omavahel võrreldes näeme, et joondused v α y 0) 1 ) ja v α y 0) 2 ) on parameetr α väärtuste 1,00 ja 0,75 korral ernevad. Kuna mee eesmärk on maksmseerda tõepära 4.1), pakub mele huv, mllst algjoondust võ algjoonduste peret kasutades saadud väljundjoondus on mng α väärtuse korral suurma hübrdtõepäraga. Joonsel 4.3 on kujutatud algortm väljundjoonduste hübrdtõepärad ernevate α väärtuste korral. Võrdselt head väljundjoondused saame ga α korral kasutades algjoondus y 0) 1, y 0) 4, y 0) 5, y 0) 6, y 0) 7, y 0) v2,a ja algjoonduste peret {y α 0) }. Kehvema tulemuse annavad algjoondused y 0) 2, y 0) 3 ja y v1,a. 0) Nende kolme algjoonduse puhul langeb hübrdtõepära graafk kusagl α = 0,7 läheduses märgatavalt madalamale. Parameetr α väärtused, mlle korral hübrdtõepära graafk madalamale nvoole kukub, on algjoonduset psut ernevad. Uurme nüüd algjoonduste pere {y 0) α } ja algjoonduse y 0) v1,a nätel, kudas kätuvad väl- 33

5 α=1,00 α=0,75 α=0,50 α=0,01 α=0,00 4 sesund 3 2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 ajahetk t Joons 4.2: Hübrd-EM algortm väljundd segu A korral, ku kasutada algjoondusena joondust y 0) 2, y 0) 3 võ y v1,a. 0) -5-10 -15-20 hübrdtõepära -25-30 -35-40 -45-50 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 α v α y 1 0) ), v α y 4 0) ), v α y 5 0) ), v α y 6 0) ), v α y 7 0) ), v α y v2,a 0) ), v α y α 0) ), v α 2 v α y 2 0) ) v α y 3 0) ) v α y v1,a 0) ) v α 1 Joons 4.3: Ernevate algjoonduste korral letud väljundjoonduste hübrdtõepära. Mtmele väljundjoondusele vastab üks joon, ku need on võrdsed ga arvutamsel kasutatud α korral. 34

jundjoonduse hübrdtõepära komponendd ernevate α väärtuste korral. Tessõnu, uurme hübrdtõepära nn Vterb komponend ja nn PMAP komponend ln pv x) 4.2) ln p t v x) 4.3) t ) muutumst, ku muutub α. Tulemused on estatud joonsel 4.4. Väljundjoonduste v α y 0) α hübrdtõepära komponendd kätuvad ootuspäraselt: mda suurem on α, seda suurem on Vterb komponend väärtus; 1 α) kasvades kasvab ka PMAP-komponent. Väljundjoonduse v α y 0) v1,a) hübrdtõepära komponentde väärtused langevad alates α väärtusest 0,716 märgatavalt. 0 0-5 -5-10 -10-15 -15 tõepära -20-25 -30 tõepära -20-25 -30-35 -35-40 -40-45 -45-50 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1-50 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 a) Väljundjoondused v α α y α 0) Vterb komponent PMAP-komponent ). b) Väljundjoondused v α y 0) v1,a α Vterb komponent PMAP-komponent ). Joons 4.4: Kahe erneva algjoonduse põhjal letud väljundjoonduste hübrdtõepära komponendd. Leame nende samade algjoonduste puhul, mllne on väljundjoonduste tõepära kummag mudel suhtes, st leame ernevate α väärtuste korral tõepära -40-45 -50-55 -60-65 -70-75 -80-85 -90-95 -100-105 -110-115 -120 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 tõepära -40-45 -50-55 -60-65 -70-75 -80-85 -90-95 -100-105 -110-115 -120 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 a) Väljundjoondused v α α y α 0) ). mudel 1 mudel 2 b) Väljundjoondused v α y 0) v1,a α mudel 1 mudel 2 ). Joons 4.5: Kahe erneva algjoonduse põhjal letud väljundjoonduste tõepärad kummag mudel suhtes. 35

5 α=1,00 α=0,75 α=0,50 α=0,01 α=0,00 5 α=1,00 α=0,75 α=0,50 α=0,01 α=0,00 4 4 sesund 3 sesund 3 2 2 1 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 a) Joondused v α ajahetk t y 0) 1 ), v α y 0) 4 ) ja v α y 0) 5 ). 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 ajahetk t b) Joondused v α y 0) ) 2 ja v α y 0) ) v1,b. 5 α=1,00 α=0,75 α=0,50 α=0,01 α=0,00 5 α=1,00 α=0,75 α=0,50 α=0,01 α=0,00 4 4 sesund 3 sesund 3 2 2 1 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 ajahetk t c) Joondused v α y 0) ) 3 ja v α y 0) ) 7. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 ajahetk t d) Joondused v α y 0) 6 ), v α y 0) ) v2,b ja v α y 0) α ). Joons 4.6: Hübrd-EM algortm väljundjoondused ernevate algjoonduste ja α väärtuste korral segu B). ln pv, x ), = 1, 2. 4.4) ) Tulemus on kujutatud joonsel 4.5. Joonsel 4.5a kajastub, et joonduste v α y 0) α ledmsel on algortm 2 arvestanud rohkem mudelga 2 - väljundjoonduste tõepära on mudel 2 suhtes märgatavalt suurem, ku mudel 1 suhtes. See on mudelte kaalusd slmas pdades gat looglne. Joonselt 4.5b näeme, et ku α ületab teatud pr, pääseb algjoonduse y 0) v1,a puhul enam mõjule mudel 1. Väljundjoonduse tõepära on väksema kaaluga mudel suhtes suurem, ms seletab ka, mks joonduste v α y 0) v1,a) hübrdtõepära suuremate α väärtuste korral mtmete teste algjoonduste põhjal letud väljundjoonduste omast madalam on. Märgme, et algortm 2 koondub juba mõne teratsoonsammu järel. Keskmne ja maksmaalne teratsoonsammude arv ernevate algjoonduste korral on estatud tabels 4.1. Maksmaalne teratsoonsammude arv on 5. See tähendab, et ga algjoonduse ja α väärtuse korral on vendal teratsoonsammul letud joondus samasugune, ku neljandal sammul letud joondus. Kuna koondumne on n kre, on mel algortm 2 peatumskrteerum määrava muutuja ε väärtuseks 0. Kahest madalam keskmne teratsoonsammude arv nätab, et ledub α väärtus, mlle korral algortm koondub vad ühe sammuga ehk algortm väljastab algjoonduse võ sellega võrdse hübrdtõepäraga joonduse. Algjoonduste pere {y α 0) } korral koondub algortm pea alat ühe sammuga. Muudame nüüd mudelte ülemnekutõenäosus. Ku varem ol esmese mudel puhul ülemnekutõenäosus p 3,2 võrdne 0,01-ga, ss võrdsustame selle nüüd nullga. Sarnaselt 36

Algjoondus y 0) 1 y 0) 2 y 0) 3 y 0) 4 y 0) 5 y 0) 6 y 0) 7 y 0) v1,a y 0) v2,a y α 0) Keskmne 2,96 2,73 2,80 2,00 2,00 2,02 2,96 2,73 1,86 1,00 Maksmum 3 4 5 2 2 3 3 5 2 2 Tabel 4.1: Algortm 2 teratsoonsammude arv ernevate algjoonduste korral segu A). P B 2 kätume tese mudel ülemnekutõenäosusega p 3,3. N saame ülemnekumaatrksd P1 B ja vt lsa). Võtame need ülemnekumaatrksd kasutusele varem kasutatud ülemnekumaatrkste P A 1 ja P A 2 asemel ja jätame ülejäänud segu A juures kasutatud parameetrd samaks. N saadud segule vtame edaspd nmetusega segu B. Kasutame sama vaatlustevektort x, ms segu A korral, et näha, mllst efekt omab kahe ülemnekutõenäosuse nullga võrdsustamne. Realsatsoon x tõepära ln px) on segu B korral pea dentne selle tõepäraga segu A korral. Ka selle segu korral soovme algjoondustena kasutada mudelte Vterb joondus. Tähstame ned vastavalt y 0) v1,b ja y v2,b. 0) Osutub, et need on dentsed segu A mudelte Vterb joondustega y 0) v1,a ja y v2,a. 0) Joonsel 4.6 on kujutatud ernevate algjoonduste ja α väärtuste korral letud hübrd- EM algortm väljundjoondus. Mee poolt välja valtud üheksat ernevat algjoondust, üht algjoonduste peret ja vt ernevat α väärtust kasutades saame nel väljundjoonduste komplekt. Algjoondused y 0) 6, y 0) v2,b ja algjoonduste pere {y α 0) } annavad nende α väärtuste korral täpselt samasugused väljundjoondused ku hübrdtõepära suhtes kõge paremad tulemus andnud algjoondused segu A korral, st joonsed 4.6d ja 4.1 on dentsed. Joonsel ) 0) 4.6a kujutatud joondused v α y 1 on ga α väärtuse korral ernevad. Ka joonstel 4.6b ja 4.6c e ledu kaht ühesugust joondust. Nägme, et joondused võvad ernevate algjoonduste korral olla väga ernevad. Taas huvtab med, mllsed algjoondused annavad mng α väärtuse korral suurma hübrdtõepäraga väljundjoondus. Ernevate algjoonduste põhjal letud väljundjoonduste hübrdtõepärade võrdlus on joons 4.7. Ku α = 0, on kõk väljundjoondused optmaalse hübrdtõepäraga. Nmelt on kõkdele algjoondustele vastavad väljundjoondused α = 0 korral võrdse hübrdtõepäraga ja teame, et üks nest - v 0 y 0) 0 ) - on kndlast PMAPjoondus. Juba järgmse α väärtuse α = 0,001 korral jagunevad väljundjoondused kaheks. Kõrgem hübrdtõepära on ss algjoonduste y 0) 6 ja y 0) v2,b nng algjoonduste pere {y α 0) } põhjal letud väljundjoondustel; kõg teste väljundjoonduste hübrdtõepära on madalam. Parameetr α kasvades esneb neljale algjoondusele vastavatel väljundjoondusel veel ) 0) 0) üks kord sellst madalamale nvoole langemst. Väljundjoondused v α y 6, vα y v2,b) ja v α y α 0) ) annavad ga α väärtuse korral parma tulemuse. Väljundjoonduste hübrdtõepära Vterb komponend 4.2) nng PMAP komponend 4.3) väärtus ja tõepära kummag mudel suhtes ernevate α väärtuste korral on kujutatud ) joonsel 4.8. Algjoonduste {y α 0) } puhul kehtb ga α korral ln pv α y 0) α, x = 1) =. 37