Примена статистике у кинематографији

Σχετικά έγγραφα
Tестирање хипотеза. 5.час. 30. март Боjана Тодић Статистички софтвер март / 10

Могућност примене статистике у породилишту

Примена статистике у медицини

Статистичко истраживање у новинарству

Статистичка анализа територијалног распореда врста библиотека на територији Републике Србије

1.2. Сличност троуглова

налазе се у диелектрику, релативне диелектричне константе ε r = 2, на међусобном растојању 2 a ( a =1cm

НЕПАРАМЕТАРСКИ ТЕСТОВИ. Илија Иванов Невена Маркус

Потрошачки трендови и социјално стање у друштву

2. Наставни колоквијум Задаци за вежбање ОЈЛЕРОВА МЕТОДА

СИСТЕМ ЛИНЕАРНИХ ЈЕДНАЧИНА С ДВЕ НЕПОЗНАТЕ

Параметарски и непараметарски тестови

Теорија електричних кола

ПОГЛАВЉЕ 3: РАСПОДЕЛА РЕЗУЛТАТА МЕРЕЊА

Анализа Петријевих мрежа

7. ЈЕДНОСТАВНИЈЕ КВАДРАТНЕ ДИОФАНТОВE ЈЕДНАЧИНЕ

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА МАТЕМАТИКА ТЕСТ

I део ТЕОРИЈА ВЕРОВАТНОЋЕ Глава 1

Први корак у дефинисању случајне променљиве је. дефинисање и исписивање свих могућих eлементарних догађаја.

ОБЛАСТИ: 1) Тачка 2) Права 3) Криве другог реда

г) страница aa и пречник 2RR описаног круга правилног шестоугла јесте рац. бр. јесу самерљиве

Положај сваке тачке кружне плоче је одређен са поларним координатама r и ϕ.

6.2. Симетрала дужи. Примена

ТРАПЕЗ РЕГИОНАЛНИ ЦЕНТАР ИЗ ПРИРОДНИХ И ТЕХНИЧКИХ НАУКА У ВРАЊУ. Аутор :Петар Спасић, ученик 8. разреда ОШ 8. Октобар, Власотинце

КРУГ. У свом делу Мерење круга, Архимед је први у историји математике одрeдио приближну вред ност броја π а тиме и дужину кружнице.

РЕШЕЊА ЗАДАТАКА - IV РАЗЕД 1. Мањи број: : x,

5.2. Имплицитни облик линеарне функције

Упутство за избор домаћих задатака

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

АКАДЕМСКЕ ДОКТОРСКЕ СТУДИЈЕ - МЕДИЦИНСКЕ НАУКЕ

2.3. Решавање линеарних једначина с једном непознатом

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Тестирање статистичких хипотеза. Методичка упутства и варијанте домаћих задатака

ВЕЛИЧИНА ЕФЕКТА СТАТИСТИЧКИХ ТЕСТОВА У АГРОЕКОНОМСКИМ ИСТРАЖИВАЊИМА

ЛИНЕАРНА ФУНКЦИЈА. k, k 0), осна и централна симетрија и сл. 2, x 0. У претходном примеру неке функције су линеарне а неке то нису.

Скупови (наставак) Релације. Професор : Рака Јовановић Асиситент : Јелена Јовановић

2. EЛЕМЕНТАРНЕ ДИОФАНТОВЕ ЈЕДНАЧИНЕ

1. Функција интензитета отказа и век трајања система

Аксиоме припадања. Никола Томовић 152/2011

Висока техничка школа струковних студија Београд Математика 2 Интервали поверења и линеарна регресија предавач: др Мићо Милетић

ПИТАЊА ЗА КОЛОКВИЈУМ ИЗ ОБНОВЉИВИХ ИЗВОРА ЕНЕРГИЈЕ

ИНТЕГРИСАНЕ АКАДЕМСКЕ СТУДИЈЕ ФАРМАЦИЈЕ

предмет МЕХАНИКА 1 Студијски програми ИНДУСТРИЈСКО ИНЖЕЊЕРСТВО ДРУМСКИ САОБРАЋАЈ II ПРЕДАВАЊЕ УСЛОВИ РАВНОТЕЖЕ СИСТЕМА СУЧЕЉНИХ СИЛА

Предмет: Задатак 4: Слика 1.0

b) Израз за угиб дате плоче, ако се користи само први члан реда усвојеног решења, је:

МЕДИЦИНСКА СТАТИСТИКА И ИНФОРМАТИКА

1. 2. МЕТОД РАЗЛИКОВАЊА СЛУЧАЈЕВА 1

Количина топлоте и топлотна равнотежа

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Средња вредност популације (m), односно независно промењљиве t чија је густина расподеле (СЛИКА ) дата функцијом f(t) одређена је изразом:

ПОВРШИНа ЧЕТВОРОУГЛОВА И ТРОУГЛОВА

Прост случаjан узорак (Simple Random Sampling)

ЗАВРШНИ РАД КЛИНИЧКА МЕДИЦИНА 5. школска 2016/2017. ШЕСТА ГОДИНА СТУДИЈА

6.1. Осна симетрија у равни. Симетричност двеју фигура у односу на праву. Осна симетрија фигуре

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

6.5 Површина круга и његових делова

TAЧКАСТА НАЕЛЕКТРИСАЊА

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

4.4. Паралелне праве, сечица. Углови које оне одређују. Углови са паралелним крацима

МАТРИЧНА АНАЛИЗА КОНСТРУКЦИЈА

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

КОМПАРАТИВНА АНАЛИЗА КЛАСИЧНЕ ИНФЕРЕНЦИЈЕ И БАЈЕСОВОГ ПРИСТУПА У ОБРАДИ ЕКОНОМСКИХ ПОДАТАКА

3.1. Однос тачке и праве, тачке и равни. Одређеност праве и равни

Од површине троугла до одређеног интеграла

Теорија електричних кола

7. Модели расподела случајних променљивих ПРОМЕНЉИВИХ

7.3. Површина правилне пирамиде. Површина правилне четворостране пирамиде

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Ротационо симетрична деформација средње површи ротационе љуске

8.2 ЛАБОРАТОРИЈСКА ВЕЖБА 2 Задатак вежбе: Израчунавање фактора појачања мотора напонским управљањем у отвореној повратној спрези

Хомогена диференцијална једначина је она која може да се напише у облику: = t( x)

8. ПИТАГОРИНА ЈЕДНАЧИНА х 2 + у 2 = z 2

4. ЗАКОН ВЕЛИКИХ БРОЈЕВА

Школска 2010/2011 ДОКТОРСКЕ АКАДЕМСКЕ СТУДИЈЕ

Теорија друштвеног избора

МАТЕМАТИЧКИ ЛИСТ 2016/17. бр. LI-4

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

ИЗВОД ИЗ ИЗВЕШТАЈА О ЦЕНАМА КОМУНАЛНИХ УСЛУГА - УДРУЖЕЊЕ ЗА КОМУНАЛНЕ ДЕЛАТНОСТИ -

РЕШЕНИ ЗАДАЦИ СА РАНИЈЕ ОДРЖАНИХ КЛАСИФИКАЦИОНИХ ИСПИТА

Примена првог извода функције

МАСТЕР РАД УНИВЕРЗИТЕТ У БЕОГРАДУ МАТЕМАТИЧКИ ФАКУЛТЕТ. Тема: ГОРЊА И ДОЊА ГРАНИЧНА ВРЕДНОСТ НИЗА И НИЗА СКУПОВА И ЊИХОВЕ ПРИМЕНЕ У РЕЛНОЈ АНАЛИЗИ

2.1. Права, дуж, полуправа, раван, полураван

ИНФОРМАТИКА У ЗДРАВСТВУ

Вектори vs. скалари. Векторске величине се описују интензитетом и правцем. Примери: Померај, брзина, убрзање, сила.

Семинарски рад из линеарне алгебре

4. Троугао. (II део) 4.1. Појам подударности. Основна правила подударности троуглова

Основе теорије вероватноће

Универзитет у Крагујевцу Факултет за машинство и грађевинарство у Краљеву Катедра за основне машинске конструкције и технологије материјала

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА ТЕСТ МАТЕМАТИКА

6.3. Паралелограми. Упознајмо још нека својства паралелограма: ABD BCD (УСУ), одакле је: а = c и b = d. Сл. 23

I Линеарне једначине. II Линеарне неједначине. III Квадратна једначина и неједначина АЛГЕБАРСКЕ ЈЕДНАЧИНЕ И НЕЈЕДНАЧИНЕ

Теорија одлучивања. Анализа ризика

ЗАШТИТА ПОДАТАКА Шифровање јавним кључем и хеш функције. Diffie-Hellman размена кључева

10.3. Запремина праве купе

Теорија електричних кола

Испитвање тока функције

Монте Карло Интеграциjа

I Наставни план - ЗЛАТАР

ЛАБОРАТОРИЈСКЕ ВЕЖБЕ ИЗ ФИЗИКЕ ПРВИ КОЛОКВИЈУМ I група

Transcript:

Примена статистике у кинематографији Горан Мићовић Факултет техничких наука Чачак Мастер професор технике и информатике, 526/20 goranmico@gmail.com Ментор рада: др Вера Лазаревић,ванр. проф. Сажетак. У овом раду је представљена статистичка анализа над конкретим узорком. Рад се сатоји од неколико теоријских и практичних целина. Теоријске се баве статистичким посматрањем, дескриптивном статистиком, регресионом анализим. Пректичне се баве анализом у пакету Statistica, где је приказана дескриптивна статистика над конкретним узорком као и тестирање хипотеза и Пирсонов тест. Кључне речи: статистика, истраживање, анализа, хипотезе, дескриптивна статистика.увод Израз статистика се у почетку односио на прикупљање података који су били од значаја за државу, као што су евиденције о становништву, поседима и приходима, а води порекло од италијанске речи ''стато'' што значи држава. Потреба за ефикаснијом државном администрацијом, као и оснивање првих осигуравајућих друштава, утицали су на развој виталне статистике. Широка примена рачунарске технологије од осамдесетих година XX века допринела је да статистика постане једна од научних области са највећим степеном развоја у последњих тридесет година. Кинематографија је укупан друштвени процес производње, дистрибуције и приказивања филмова, са пропратним делатностима, занимањима и установама. Филм је тотална уметност која омогућава свом творцу да покретним сликама и звуцима, као што су говор, музика и шум, у потпуности изрази идеје, осећања и поглед на свет. Сајт који представља највећу филмску базу података на интернету, надалеко познати www.imdb.com (The Internet Movie Database), објавио је листу 250 најбољих филмова свих времена, креирану на основу оцена регистрованих корисника и одређених математичких прорачуна. Овај рад се бави статистичком обрадом података везаних за те, најбоље, филмове. Први део рада се бави теоријским основама статистичког истраживања, док други део се бави статистичком обрадом тим података у програмском пакету Statistica. 2. Дефиниција и основни појмови статистике Статистику можемо дефинисати као метод квантитативног истраживања појава. Предмет истраживања статистике су скупови (популације, масе, целокупности) чији су елементи, објекти и појаве разноликог карактера. Те скупове називамо популацијама, а њихове елементе статистичким јединицама. Статистика изучава суштинска, нумеричка обележја јединица популације, па се зато таква обележја називају статистичким обележјима 3. Етапе статистичког проучавања Прва етапа у статистчког проучавања представља избор узорка над којим ће бити извршено посматрање, односно прикупљање података. Друга етапа се састоји у статистичком посматрању изабраног узорка. У овој етапи врше се анкетирања и прикупљање података на терену или нека друга мерења над елементима узорка у циљу прикупљања потребних података. У трећој етапи групишемо и сређујемо податке добијене при статистичком посматрању. Четврта етапа се састоји из обраде сређених података и научне анализе резултата. Резултати добијени на основу обраде узорка придружују се целој популацији.

4. Дескриптивна статистика Сређивањем података добијају се статистичке серије које се по начину формирања и анализирања деле на структурне и временске серије. Серије структуре расподеле статистичког скупа по вредностима обележја састоји се из два реда обавештења: модалитета и фреквенције (броја јединица). У зависности од врсте обележја постоје серије структуре са номиналним (квалитативним) и са нумеричким (квантитативним) обележјем. 4.. Графичко приказивање расподела фреквенција Обавља се уз помоћ графикона који се конструишу тако што се на хоризонталноиј оси наноси вредност обележја Х (Х=прекидно) или границе групних интервала (Х=непрекидно). Код графикона апсолутних фреквенција на Y оси се наносе вредности одговарајућих фреквенција за групни интервал или Х, и констуришу се правоугаоници изнад групних интервала са висинама једнаким фреквенцијама; када се споје тачке на среднама групних интервала добија се полигон апсолутних фреквенција. Код релативних фреквенција користе се хистограми: на Х оси су средине групних интервала, а затим се око тих тачака врши конструисање правоугаоника чије ће површине бити једнаке вредностима релативних фреквенција. 4.2. Средње вредности обележја Слика. Пример хистограма Аритметичка средина низа бројева је број који се добије кад се њихов збир подели са укупним бројем чланова тог низа. x x... x n Геометријска средина (најпогоднија у анализама временских серија) низа бројева је -ти корен из производа његових чланова. Нека су вредности посматраног обележја Х на елементима статистичког скупа. Геометријска средина је једнака: G X X 2... X n Хармонијска средина низа бројева је реципрочна вредност аритметичке средине реципрочних вредности чланова тог низа. Ако су X..., X вредности обележја Х на елемената статистичког скупа, тада је хармонијска средина: H... x x x 2 n n, H i x i H i x i

4.4 Интервали поверења Код неких проблема није неопходно утврдити једну вредност параметра, већ неки интервал у коме би могла да се налази права вредност тог параметра. Кад такав интервал одређујемо преко узорка онда тај интервал зовемо интервал поверења. 5. Регресиона анализа Регресиона анализа показује облик повезаности између две променљиве помоћу регресионе линије. Слика 2. Регресиона права 6. Примена рачунара у статистици Своју експанзију у последњих тридесет година статистика највише дугује рачунарима. Ако у обради податак користимо рачунар наш задатек се своди само на тачно уношење података добијених посматрањем. Данас постоји велики број пакета за статистичку обраду. Неки од њих су једноставнији за коришћење, тако да се намењени за широку популацију, док постоје и пакети намењени професионалном бављењу статистиком. Неки од њих су: S-Plus. Statgraphics. SPSS, Statistica 7. Статистичка обрада над конкретном узорку уз помоћ софтвера Статистика У овом делу биће приказана статистичка обрада над конкретном узорку. Пре било какве статистичке анализе потребно је направити базу прикупљених података. Ова база се може формирати у самом програму или може бити унета из неког другог пакета. У свом конкретном примеру користио сам Microsoft Excel. За узорак узео сам 250 најбољих филмова свих времена са IMDB ( internet movie datebase ) сајта. У овој листи можемо видети називе филмова са годином приказивања и оцену која им је додељена, на основу које је и направњена листа. Поред ових података, у своју базу сам унео и време трајања филма, буџет и зараду филма као и број регистрованих чланова горе поменутог сајта који су гласали за филм са листе. 7.. Дескриптивна статистика у програмском пакету Statistica Служи за израчунавање нумеричких карактеристика обележја и за графичко приказивање узорачке расподеле. Дескриптивна статистика за обележје буџет :

Слика 3. Сумарна табела за обележје Буџет Слика 4. Табела фреквенција за обележје Буџет Слика 5. Група графика за обележје Буџет 7.2. Тестирање хипотеза Тестирање статистичких хипотеза је вид статистичког закључивања који се примењује у ситуацијама: када се унапред претпоставља постојање одређене везе међу изучаваним појавама, када се претпоставља да посматрано обележје има одређену расподелу. Статистичка хипотеза је свака претпоставка која се односи на расподелу обележја. Она може бити тачна или нетачна. Одлука о прихватању или одбацивање хипотезе доносе се на основу узорка. Статистички тест је поступак верификовања статистичке хипотезе на основу узорка. 7.2.. Тестирање хипотезе о параметру m када је познато σ2

Отвара се Statistics Basic Statistics/Tables Difference tests: r, %, means Тестираћемо хипотезу да је средња вредност обележја оцена 8.3. Ту вредност уносимо за М2. Из сумарне таеле за ову обележје узећемо средњу вредност и стандарну девијацију и унећемо те вредности за М и StDev. Са слике видимо да је p= 0.0936 што је веће од α за које је узето 0.05. Можемо са 95 % сигурношћу прихватити хипотезу да средња вредност обележја оцена износи 8.3 Слика 6. Тачна хипотеза 7.2.2. Тестирање хипотезе о параметру m када је непознато σ2 Отвара се Statistics - Basic Statistics/Tables - t test, single sample Изабрали смо обележје трајање. Тестираћемо хипотезу да је средња вредност за ову обележје 30. Кликнемо на summary и добијемо следећу табелу Слика 7. Табела добијених резултата. Из табеле видимо стварну вредност средње вредности као и да је p= 0.2335, тако да хипотезу да је средња вредност 30 можемо прихватити 7.2.3. Тестирање Н0 (m = m2) против H (m m2) када је непознато σ2, σ22 Пре почетка овог теста морамо направити два подузорка користећи опцију data-subset/random sampling. За оба подузорка копирећемо подате о заради филмова у excel документ а затим ћемо направити нову листу у програмском пакету статистика. Имаћемо два обележја, зарада и зарада 2 и те вредности ћемо искористити за овај тест.

Слика 8. Изглед листе са подацима о вредности зарада из 2 насумична подузорка Отвара се са Statistics - Basic Statistics/Tables - t-test, independent, by Variables После избора обележја и потврђивања добијамо табелу као на слици Слика 9. Табела са резултатима. 7.3.Непараметарски тестови Базирани су на моделу који укључује никакве предуслове у вези параметара популације из које је узорак извучен. Одређене претпоставке су карактеристичне за већину непараметарских тестова, али их је мање и слабије су него код параметарских, па непараметарски тестови не захтевају тако прецизна мерења као параметарских из чега произилази њихова значајна улога. 7.4. ПИРСОНОВ Х 2 ТЕСТ Пирсонов Х2 тест је непараметарски тест који се се користи за испитивање: сагласности узорка са претпостављеном расподелом, независности два обележја 7.4.. Пирсонов тест у програмског пакету Statistica. Користи се опција Statistics Disribution Fitting, одаберемо ormal од Countinuous distributions.

Слика 0. Табела груписаних фрекфенција Видимо да је p вредност већа од 0.05 тако да обележје трајање филма има нормалну расподелу. 7.4.2. Испитивање независности Х 2 тестом Идемо на Basic Statistics/Tables а затим на Tables and Banners. Затим изаберемо обележја, у овом случају тестираћемо да ли су обележја година приказивања и буџет зависна или независна обележја. Слика. Резултати теста За p=0.00092 са 95 % сигурношћу одбацујемо хипотезу да су обележја буџет и година приказивања независна обележја. Стога закључујемо да ово јесу зависна обележја. 7. Закључак Математичка статистика је савремено оруђе инжињера, економиста, лекара, биолога, физичара, психолога и многих других. У почетку су се на прсте могле набројати области људског истраживања које су користиле статистику. Данас се на прсте могу набројати области које не користе математичку статистику. Примена рачунара и програмских пакета данас знатно олакшава статистичку обраду и смањује могућност грешке на минимум. Као што је речено у раду, данас постоје многи алати и програмски пакети за статистичку обраду. У свом раду сам представио примену пакета Statistica. Као љубитељ седме уметности чинило ми се занимљивим да статистички обрадим податке везане за филмове, нарочито за листу од 250 најбољих филмова свих времена. У овом раду сам приказаo фазе статистичког истраживања и обраду података на узорку који сам прикупио. Пакет Statistica се показао као веома користан пакет за статистичку обраду, у ком се и без неког великог теоријско знања о статистици, корисник лако снађе. Приказани су основни подаци о филмовима, табеле, графикони, регресиона анализа и тестирање хипотеза. Могли смо да приметимо како се са годинама буџети за снимање филмова, али и зарада повећавали, да би данас износиле огромне цифре. Такође се могло приметити да огроман број људи посећује IMDb сајт, прегледава новости везане за кинематографију и даје оцене филмовима. Занимљиво је и то да је један српски филм на поменутој листи, то је филм Подземље редитеља Емира Кустурице.

9. Литература [] Андреа Тепавчић, Зорана Лужанин, Математичке методе у таксономији, Нови Сад, Србија: Природноматематички факултет, Нови Сад, 2006. [2] Вера Лазаревић, Марија Ђукић, Инжењерска математика, Чачак, Србија: Технички факултет Чачак, 200. [3] Светозар Вукадиновић, Елементи теорије вероватноће и математичке статистике, Београд, Србија: Привредни преглед 988. [4] Ж. Мицић, М. Вујичић, В. Лазаревић, Analysis of Knowledge Base Unit within Standardized Eectrical Engeenering Subfields, Acta Polytechnica Hungarica, Vol. o.2, 204. Коришћени сајтови:. http://www.statsoft.com 2. http://www.imdb.com 3. http://www.fonforum.org 4. http://en.wikipedia.org 5. http://www.the-numbers.com