Логистичка регресиjа

Σχετικά έγγραφα
Tестирање хипотеза. 5.час. 30. март Боjана Тодић Статистички софтвер март / 10

Нелинеарни регресиони модели и линеаризациjа

Параметарски и непараметарски тестови

Први корак у дефинисању случајне променљиве је. дефинисање и исписивање свих могућих eлементарних догађаја.

Монте Карло Интеграциjа

2. Наставни колоквијум Задаци за вежбање ОЈЛЕРОВА МЕТОДА

Прост случаjан узорак (Simple Random Sampling)

1 Неодрђеност и информациjа

налазе се у диелектрику, релативне диелектричне константе ε r = 2, на међусобном растојању 2 a ( a =1cm

СИСТЕМ ЛИНЕАРНИХ ЈЕДНАЧИНА С ДВЕ НЕПОЗНАТЕ

1.2. Сличност троуглова


Λογιστική Παλινδρόµηση

Решења задатака са првог колоквиjума из Математике 1Б II група задатака

Висока техничка школа струковних студија Београд Математика 2 Интервали поверења и линеарна регресија предавач: др Мићо Милетић

Положај сваке тачке кружне плоче је одређен са поларним координатама r и ϕ.

7. ЈЕДНОСТАВНИЈЕ КВАДРАТНЕ ДИОФАНТОВE ЈЕДНАЧИНЕ

ОБЛАСТИ: 1) Тачка 2) Права 3) Криве другог реда

Теорија електричних кола

Теорија електричних кола

2.3. Решавање линеарних једначина с једном непознатом

ЛИНЕАРНА ФУНКЦИЈА. k, k 0), осна и централна симетрија и сл. 2, x 0. У претходном примеру неке функције су линеарне а неке то нису.

Wan Nor Arifin under the Creative Commons Attribution-ShareAlike 4.0 International License. 1 Introduction 1

предмет МЕХАНИКА 1 Студијски програми ИНДУСТРИЈСКО ИНЖЕЊЕРСТВО ДРУМСКИ САОБРАЋАЈ II ПРЕДАВАЊЕ УСЛОВИ РАВНОТЕЖЕ СИСТЕМА СУЧЕЉНИХ СИЛА

5.2. Имплицитни облик линеарне функције

ГЕОМЕТРИJСКА СВОJСТВА АНАЛИТИЧКИХ ФУНКЦИJА

L кплп (Калем у кплу прпстпперипдичне струје)

b) Израз за угиб дате плоче, ако се користи само први члан реда усвојеног решења, је:

АКАДЕМСКЕ ДОКТОРСКЕ СТУДИЈЕ - МЕДИЦИНСКЕ НАУКЕ

6.2. Симетрала дужи. Примена

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

7. Модели расподела случајних променљивих ПРОМЕНЉИВИХ

Предмет: Задатак 4: Слика 1.0

Анализа Петријевих мрежа

8.2 ЛАБОРАТОРИЈСКА ВЕЖБА 2 Задатак вежбе: Израчунавање фактора појачања мотора напонским управљањем у отвореној повратној спрези

ИСПИТИВАЊЕ СВОJСТАВА КОМПЛЕКСНИХ МРЕЖА СА ДИСКРЕТНОМ ДИНАМИКОМ

Конструкциjе Адамарових матрица

Wan Nor Arifin under the Creative Commons Attribution-ShareAlike 4.0 International License. 1 Introduction 1

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

TAЧКАСТА НАЕЛЕКТРИСАЊА

НЕПАРАМЕТАРСКИ ТЕСТОВИ. Илија Иванов Невена Маркус

Семинарски рад из линеарне алгебре

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Скупови (наставак) Релације. Професор : Рака Јовановић Асиситент : Јелена Јовановић

1. Функција интензитета отказа и век трајања система

Екстремне статистике поретка и примjене у неживотном осигурању

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА МАТЕМАТИКА ТЕСТ

ПОГЛАВЉЕ 3: РАСПОДЕЛА РЕЗУЛТАТА МЕРЕЊА

1 ПРОСТОР МИНКОВСКОГ

Хомогена диференцијална једначина је она која може да се напише у облику: = t( x)

5.1 logistic regresssion Chris Parrish July 3, 2016

Нумеричко решавање парцијалних диференцијалних једначина и интегралних једначина

6.1. Осна симетрија у равни. Симетричност двеју фигура у односу на праву. Осна симетрија фигуре

Основе теорије вероватноће

2. EЛЕМЕНТАРНЕ ДИОФАНТОВЕ ЈЕДНАЧИНЕ

Вектори vs. скалари. Векторске величине се описују интензитетом и правцем. Примери: Померај, брзина, убрзање, сила.

г) страница aa и пречник 2RR описаног круга правилног шестоугла јесте рац. бр. јесу самерљиве

ИНТЕГРИСАНЕ АКАДЕМСКЕ СТУДИЈЕ ФАРМАЦИЈЕ

Факултет организационих наука Центар за пословно одлучивање. PROMETHEE (Preference Ranking Organization Method for Enrichment Evaluation)

ЗАВРШНИ РАД КЛИНИЧКА МЕДИЦИНА 5. школска 2016/2017. ШЕСТА ГОДИНА СТУДИЈА

7.3. Површина правилне пирамиде. Површина правилне четворостране пирамиде

ЗАШТИТА ПОДАТАКА Шифровање јавним кључем и хеш функције. Diffie-Hellman размена кључева

ИНФОРМАЦИJА ПЕРЦЕПЦИJЕ слобода, демократиjа и физика

Тестирање статистичких хипотеза. Методичка упутства и варијанте домаћих задатака

Аксиоме припадања. Никола Томовић 152/2011

ВИСОКА ТЕХНИЧКА ШКОЛА СТРУКОВНИХ СТУДИЈА У НИШУ

РЕШЕЊА ЗАДАТАКА - IV РАЗЕД 1. Мањи број: : x,

Школска 2010/2011 ДОКТОРСКЕ АКАДЕМСКЕ СТУДИЈЕ

АНАЛИТИЧКА ГЕОМЕТРИJА. Владица Андреjић ( ) УНИВЕРЗИТЕТ У БЕОГРАДУ МАТЕМАТИЧКИ ФАКУЛТЕТ БЕОГРАД 2015.

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

3.1. Однос тачке и праве, тачке и равни. Одређеност праве и равни

Универзитет у Београду. Математички факултет. Мастер рад. Тема: Геометријски случајни процеси

Нестандардна анализа као почетна настава анализе

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

РЕШЕНИ ЗАДАЦИ СА РАНИЈЕ ОДРЖАНИХ КЛАСИФИКАЦИОНИХ ИСПИТА

Количина топлоте и топлотна равнотежа

Примена првог извода функције

ИНФОРМАТИКА У ЗДРАВСТВУ

ПРИРОДА ВРЕМЕНА. информациjа материjе термодинамика теориjа релативности квантна механика. принцип вероватноће у физици

МАТРИЧНА АНАЛИЗА КОНСТРУКЦИЈА

КРУГ. У свом делу Мерење круга, Архимед је први у историји математике одрeдио приближну вред ност броја π а тиме и дужину кружнице.

Увод у теориjу игара и игра инспекциjе

Писмени испит из Теорије површинских носача. 1. За континуалну плочу приказану на слици одредити угиб и моменте савијања у означеним тачкама.

ТРАПЕЗ РЕГИОНАЛНИ ЦЕНТАР ИЗ ПРИРОДНИХ И ТЕХНИЧКИХ НАУКА У ВРАЊУ. Аутор :Петар Спасић, ученик 8. разреда ОШ 8. Октобар, Власотинце

Теорија одлучивања. Анализа ризика

УНИВЕРЗИТЕТ У НОВОМСАДУ ПРИРОДНО-МАТЕМАТИЧКИ ФАКУЛТЕТ ДЕПАРТМАН ЗА МАТЕМАТИКУ И

ПРИМЕНА МУЛТИВАРИЈАНТНЕ ДИСКРИМИНАЦИОНЕ АНАЛИЗЕ У ПРОЦЕСУ РЕВИЗИЈЕ

Упутство за избор домаћих задатака

МЕДИЦИНСКА СТАТИСТИКА И ИНФОРМАТИКА

Објектно орјентисано програмирање. Владимир Филиповић Александар Картељ

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

У н и в е р з и т е т у Б е о г р а д у Математички факултет. Семинарски рад. Методологија стручног и научног рада. Тема: НП-тешки проблеми паковања

Имплементациjа монада у програмском jезику Swift 1.1

6.5 Површина круга и његових делова

ПИТАЊА ЗА КОЛОКВИЈУМ ИЗ ОБНОВЉИВИХ ИЗВОРА ЕНЕРГИЈЕ

Вежба 4. Графика. Наредба има облик plot(x,y) Аргументи x и y су вектори, који морају имати исти број елемената.

6. ЛИНЕАРНА ДИОФАНТОВА ЈЕДНАЧИНА ах + by = c

ЕНЕРГЕТСКИ ПРЕТВАРАЧИ 2 (13Е013ЕП2) октобар 2016.

1. 2. МЕТОД РАЗЛИКОВАЊА СЛУЧАЈЕВА 1

Transcript:

Логистичка регресиjа 4.час 22. март 2016. Боjана Тодић Статистички софтвер 4 22. март 2016. 1 / 26

Логистичка расподела Логистичка расподела jе непрекидна расподела вероватноће таква да jе њена функциjа расподеле логистичка функциjа 1 f(x) =. 1 + e x m s Боjана Тодић Статистички софтвер 4 22. март 2016. 2 / 26

Историjат Логистичка функциjа jе настала у 19. веку за потребе моделовања раста различитих популациjа. Наиме, различити истраживачи су се jош у 18. веку бавили проучавањем и предвиђањем раста популациjе у некоj земљи. Оваj проблем се своди на проучавање неке количине W (t) коjа, на пример, може да буде величина људске популациjе у временском тренутку t и њеног прираштаjа у jединици времена коjи се означава са W (t) W (t) = dw (t) dt Боjана Тодић Статистички софтвер 4 22. март 2016. 3 / 26

Историjат Наjjедноставниjа претпоставка коjа jе коришћена у науци jош у 18. веку jе била да jе W (t) пропорционално са W (t), односно да постоjи нека константна β за коjу важи W (t) = βw (t), β = W (t) W (t). Решавањем ове диференциjалне jедначине се долази до закључка да jе раст популациjе експоненциjалан, односно да постоjи нека константа A за коjу важи W (t) = Ae βt, где се за A често узима величина популациjе у почетном тренутку посматрања W (0). Оваj модел се показао као добар при проучавању младих популациjа, као што je на пример, популациjа САД-а у првим децениjама по њиховом настанку. Боjана Тодић Статистички софтвер 4 22. март 2016. 4 / 26

Историjат Међутим, белгиjски математичар Келте (Alphonse Quetelet 1795-1874) и његов млађи сарадник математичар Велхурст (Pierre Francois Velhurst 1804-1849) су приметили да овакво решење после неког времена доводи до нереалних процена и да би требало ограничити прираштаj популациjе на неки начин. Они су у претходну диференциjалну jедначину додали елемент φ(w (t)) коjи представља отпор популациjе према даљем расту у тренутку t: W (t) = βw (t) φ(w (t)). Боjана Тодић Статистички софтвер 4 22. март 2016. 5 / 26

Историjат Велхурст jе затим експериментисао са различтим облицима за φ(w (t)) и дошао на идеjу да уведе константу Ω коjа би представљала горњу границу засићености за W. Прираштаj популациjе би тада био пропорционалан и тренутноj величини, али и њеном простору за даљи раст Ω W (t) W (t) = βw (t)(ω W (t)). Увођењем смене P (t) = W (t) Ω у претходу jедначину добиjамо диференциjалну jедначину P (t) = βp (t)(1 P (t)), а њено решење jе облика P (t) = eα+βt 1 + e α+βt. Ову функциjу jе Велхурст назвао логистичком функциjом. Боjана Тодић Статистички софтвер 4 22. март 2016. 6 / 26

Историjат Ова истраживања нису привукла велику пажњу математичке jавности. Тек захваљуjући развоjем рачунара у другоj половини 20. века логистичка расподела стиче широку популарност. Њена предност jе у jедноставном облику и повољним аналитичким своjствима коjи jе чине погодном за израчунавање уз помоћ различитих алгоритама. Данас jе логистичака расподела наjпознатиjа по своjоj примени у моделима логистичке регресиjе. Осим тога користи се и у хидрологиjи за моделовање водостаjа, у теориjи полупроводника и на многим другим местима. Боjана Тодић Статистички софтвер 4 22. март 2016. 7 / 26

Особине логистичке расподеле Логистичка расподела jе симетрична расподела тешких репова. Ако jе X случаjна величина са логистичком расподелом, тада X има следећу функциjу и густину расподеле: 1 F (x) =, s > 0, m R, x R. 1 + e x m s f(x) = ( s e x m s 1 + e x m s ) 2, s > 0, m R, x R. Боjана Тодић Статистички софтвер 4 22. март 2016. 8 / 26

Особине логистичке расподеле Очекивање EX = m Медиjана µ = m Мод mod = m Дисперзиjа DX = s2 π 2 3 Коефициjент симетриjе γ 1 = 0 Коефициjент спљоштености γ 2 = 6 5 Карактеристика расподеле ln(1 + e x m s ) ɛ(1) Боjана Тодић Статистички софтвер 4 22. март 2016. 9 / 26

Основни модел логистичке регресиjе Нека jе X независна случаjна променљива на основу коjе треба предвидети вредности за Y и нека Y може да има само две вредности, Ω Y = {0, 1}. Уместо директног предвиђања коjоj ће класи припадати Y, идеjа логистичке регресиjе jе оцењивање вероватноће да Y припадне свакоj од класа ако jе вредност за X позната. Дакле, треба проценити следеће вероватноће: P {Y = 1 X}, P {Y = 0 X}. Боjана Тодић Статистички софтвер 4 22. март 2016. 10 / 26

Основни модел логистичке регресиjе Ако уведемо ознаку p(x) = P {Y = 1 X}, тада се проблем своди на оцењивање вредности p(x). Kако p(x) представља неку вероватноћу, потребно jе да функциjа коjом се ова вредност моделира буде непрекидна, монотона и да узима вредности између 0 и 1. Многе функциjе са овим особинама, а у логистичкоj регресиjи се користи логистичка функциjа облика p(x) = eβ 0+β 1 X 1 + e β 0+β 1 X, β 0, β 1 R, β 1 0. Jедноставном транфсформациjом добиjамо jеднакост p(x) 1 p(x) = eβ 0+β 1 X. Боjана Тодић Статистички софтвер 4 22. март 2016. 11 / 26

Основни модел логистичке регресиjе Израз. p(x) 1 p(x) се назива квотом и може узимати вредности између 0 и Квоте се чешће користе од вероватноћа користе у моделовањима система за клађење jер jе интуитивниjе приказуjу шансе добитка: вредности близу 0 одговараjу веома малим шансама и зато што jе вредност квоте већа, то jе већа и шанса позитивног исхода клађења. Применом природног логаритма на претхидну jедначину добиjамо: ( ) p(x) ln = β 0 + β 1 X 1 p(x) Лева страна jедначине се назива logit трансформациjом од p(x). Приметимо да jе веза између logit трансформациjе и независне променљиве X линеарна. Боjана Тодић Статистички софтвер 4 22. март 2016. 12 / 26

Оцењивање параметара Модел логистичке регресиjе зависи од параметара β 0 и β 1 коjе jе потребно оценити. Оцењивање се врши методом максималне веродостоjности. Случаjна величина Y у зависности од X има расподелу ( Y X : коjа може да се напише и као 0 1 1 p(x) p(x) f(y X) = p(x) Y (1 p(x)) 1 Y, Y {0, 1}, X R. Функциjа максималне веродостоjности параметара на основу узорка обима n jе n L(β 0, β 1 ) = p(x i ) Y i (1 p(x i ) 1 Y i. i=1 Оцене ˆβ 0 и ˆβ 1 параметара β 0 и β 1 се добиjаjу као решења система ln L(β 0, β 1 ) = 0, β 0 ) ln L(β 0, β 1 ) β 1 = 0 Боjана Тодић Статистички софтвер 4 22. март 2016. 13 / 26

Валдов тест По добиjању оцена за параметре, потребно jе проверити да ли jе X заправо добар предиктор за вредности за Y, односно да ли постоjи статистички значаjна повезаност. Валдовим тестом се тестираjу следеће хипотезе H 0 : β 1 = 0, H 1 : β 1 0. Хипотеза H 0 проверава се формирањем Валдове тест статистике Z = ˆβ 1 ˆσ( ˆβ 1 ) коjа при важењу H 0 има стандардну нормалну расподелу, где jе ˆσ 2 ( ˆβ 1 ) оцена стандардне девиjациjе оцене ˆβ 1. Боjана Тодић Статистички софтвер 4 22. март 2016. 14 / 26

Предикциjа Када су параметри модела оцењени, оцена вредности p(x) се jедноставно добиjа из формуле ˆp(X) = e ˆβ 0 + ˆβ 1 X 1 + e ˆβ 0 + ˆβ. 1 X Класификациjа променљиве Y се затим врши на основу ˆp(X) { 0, ˆp(X) < q Ŷ = 1, ˆp(X) q где jе q унапред одређена константа. Стандардна вредност за q jе 1 2, али постоjе и случаjеви у коjима се узимаjу друге вредности. Боjана Тодић Статистички софтвер 4 22. март 2016. 15 / 26

Вишеструка логистичка регресиjа Нека су X = (X 1, X 2,..., X N ) случаjни вектор и Y случаjна применљива квалитативног типа коjа узима вредности из скупа G = {G 1, G 2,..., G M } и зависна jе од случаjног вектора X. Модел логистичке регресиjе дефинишемо на следећи начин: P {Y = G i X} = e β i0+β T i X 1 + M 1 j=1 eβ j0+β T j X, i {1, 2,..., M 1}, 1 P {Y = G i X} = 1 +. M 1 j=1 eβ j0+βj T X где су β 10,..., β (M 1)0 неки реални броjеви и β 1,..., β M 1 неки N-димензиони вектори. Сви поjмови уведени раниjе важе и овде. Боjана Тодић Статистички софтвер 4 22. март 2016. 16 / 26

Вишеструка логистичка регресиjа Други начин jе да се вишеструка логистичка регресиjа поjедностави и сведе на примену неколико основних логистичких регресиjа. Оваj метод се назива "сам против свих" (one-vs-all) и његова суштина jе да се креира M одвоjених класификатора коjи само процењуjу да ли променљива Y припада некоj одређеноj класи из G или не. Ово се постиже увођењем помоћних случаjних променљивих Z 1,..., Z M коjе служе као индикатори да ли Y припада одређеноj класи из G: { 0, Y G i Z i = I{Y = G i } = 1, Y = G i За свако i = 1, 2,..., M Боjана Тодић Статистички софтвер 4 22. март 2016. 17 / 26

Вишеструка логистичка регресиjа За овако уведене променљиве Z i се формираjу модели основне логистичке регресиjе оцењивањем вредности ˆp i (X) = P {Z i = 1 X}. На основу тих модела променљивоj Y се додељуjе класа за коjу jе ˆp i (X) наjвеће Ŷ = {G i ˆp i (X) = max ˆp j(x)}. j {1,2,...,M} На оваj начин се постижу ефекти вишеструке логистичке регресиjе без сложене примене у пракси коjу она захтева. Боjана Тодић Статистички софтвер 4 22. март 2016. 18 / 26

Пример Подаци садрже резултате два испита са приjемног испита на jедном универзитету у Америци и информациjу да ли jе студент примљен на мастер програм. На основу ових резултата направити модел логистичке регресиjе коjи може да предвиди да ли ће студент бити примљен на мастер. База садржи 100 опсервациjа и 3 променљиве (Exam1, Exam2, Admitted). Променљиве коjе садрже резултате испита су реални броjеви између 0 и 100, а трећа променљива има само две класе - 0 или 1. Наш модел ће имати облик P {Admitted = 1 Exam1, Exam2} = eβ 0+β 1 Exam1+β 2 Exam2 1 + e β 0+β 1 Exam1+β 2 Exam2. Боjана Тодић Статистички софтвер 4 22. март 2016. 19 / 26

Пример > head(baza) Exam1 Exam2 Admitted 1 34.62366 78.02469 0 2 30.28671 43.89500 0 3 35.84741 72.90220 0 4 60.18260 86.30855 1 5 79.03274 75.34438 1 6 45.08328 56.31637 0 > summary(baza) Exam1 Exam2 Admitted Min. :30.06 Min. :30.60 Min. :0.0 1st Qu.:50.92 1st Qu.:48.18 1st Qu.:0.0 Median :67.03 Median :67.68 Median :1.0 Mean :65.64 Mean :66.22 Mean :0.6 3rd Qu.:80.21 3rd Qu.:79.36 3rd Qu.:1.0 Max. :99.83 Max. :98.87 Max. :1.0 Боjана Тодић Статистички софтвер 4 22. март 2016. 20 / 26

Пример Више информациjа може нам дати графичко приказивање података. Приказаћемо све податке на графику тако што ће свака тачка имати координате коjе представљаjу резултате jедног и другог испита, а тип тачке ће носити информациjу о укупном успеху на приjемном испиту. > plot(exam1[admitted==0], Exam2[Admitted==0], xlab = Exam1", ylab = "Exam2", xlim = c(0,100), ylim=c(0,100))" > points(exam1[admitted==1], Exam2[Admitted==1], pch = 20) Боjана Тодић Статистички софтвер 4 22. март 2016. 21 / 26

Пример > model <- glm(admitted Exam1+Exam2, family = binomial) > summary(model) Call: glm(formula = Admitted ~ Exam1 + Exam2, family = binomial) Deviance Residuals: Min 1Q Median 3Q Max -2.19287-0.18009 0.01577 0.19578 1.78527 Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) -25.16133 5.79836-4.339 1.43e-05 *** Exam1 0.20623 0.04800 4.297 1.73e-05 *** Exam2 0.20147 0.04862 4.144 3.42e-05 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 134.6 on 99 degrees of freedom Residual deviance: 40.7 on 97 degrees of freedom AIC: 46.7 Number of Fisher Scoring iterations: 7 Боjана Тодић Статистички софтвер 4 22. март 2016. 22 / 26

Пример Коефициjенти модела: > coef(model) (Intercept) Exam1 Exam2-25.1613335 0.2062317 0.2014716 Интервали поверења за параметре: > confint(model) Waiting for profiling to be done... 2.5 % 97.5 % (Intercept) -38.9918822-15.7757315 Exam1 0.1279764 0.3204597 Exam2 0.1221850 0.3168368 Боjана Тодић Статистички софтвер 4 22. март 2016. 23 / 26

Пример Како су p вредности Валдових тестова веома мале, закључуjемо да се хипотезе да jе неки од параметара jеднак нули одбацуjу. Tражени модел jе: ˆP {Admitted = 1 Exam1, Exam2} = e 25.16+0.21 Exam1+0.20 Exam2 1 + e 25.16+0.21 Exam1+0.20 Exam2. Боjана Тодић Статистички софтвер 4 22. март 2016. 24 / 26

Пример Предвиђање на основу добиjемог модела: > p.x <- predict(model, type = response ) > y <- rep(0, length(admitted)) > y[p.x>0.5] <- 1 Проверимо да ли ће студент уписати мастер студиjе ако положи jедан испит са 50 поена, а други са 80. > newdata <- data.frame(exam1=50, Exam2=80) > predict(model,newdata,type = response ) 1 0.7803968 Боjана Тодић Статистички софтвер 4 22. март 2016. 25 / 26

Задатак 1. Из базе података mtcars (пакет MASS) издвоjити променљиве vs, mpg и am у нову базу. Наћи наjбољи логистички модел за коjи су mpg и am независне променљиве помоћу коjих предвиђамо зависну променљиву vs и предвидети вредности за vs. Боjана Тодић Статистички софтвер 4 22. март 2016. 26 / 26