Потрошачки трендови и социјално стање у друштву Тијана Костић Факултет техничких наука, Чачак СП ИАС Професор технике и информатике, школска 203./204. година e-mail: tijana.kostic@gmail.com Ментор рада: др Вера Лазаревић Апстракт Циљ овог мастер рада је да се прикажу статистичке анализе на основу прикупљених узорака о личној потрошњи домаћинстава у Републици Србији у периоду од 2006. године до 20. године. Велике користи у статистичкој анализи пружа рачунар и употреба програмског пакета Statistica 8. Узорци су прикупљени са званичног сајта Републичког завода за статистику Републике Србије. Кључне речи статистика, дескриптивна статистика, хипотезе, анализа, временска серија. УВОД Једна од најпримењенијих математичких дисциплина у готово свим подручјима човековог деловања данас је несумњиво статистика. Писци историје статистике сматрају да реч статистика има корен у једној од следећих речи: италијанска реч ''stato'' што значи држава, италијанска реч statista што значи државник или од латинске речи status што значи стање или држава. Без статистике су данашња наука и целокупан људски живот практично незамисливи. Савремено тумачење појма статистика подразумева посебну делатност коју организују различити правни субјекти као што су разне организације, предузећа и други. Многи стручни и образовани људи су реч статистика прихватили и употребљавају је као назив за нешто што им је потребно у стручном или научном раду и за лично информисање о појавама у свом окружењу или у свету. За неке појединце реч статистика се односи само на податке о одређеној појави који су приказани у низу или у табели из које се могу израчунати одређене величине. У овом раду статистички су обрађени узорци о личној потрошњи домаћинстава у Републици Србији. Лична потрошња домаћинства, или познатије као потрошачка корпа, се узима у обзир да би се утврдила граница сиромаштва у неком граду или држави. Тиме се одређује апсолутни минимум производа који су неопходни да би особа преживела. С обзиром да потрошачке корпе варирају од државе до државе, тако свака држава има одређену границу сиромаштва. Појам потрошачке корпе је подложан статистичкој манипулацији тако да се ова статистика првенствено користи да би се приказали трендови у здравој економији. 2 РАЗВОЈ СТАТИСТИКЕ Почеци статистике као научне дисциплине скоро истовремено датирају од XVII века у Немачкој и Енглеској. Почетком XIX века долази до наглог развоја статистичких теорија, највише захваљујући развоју теорије вероватноће и сложенијих математичких анализа. Наравно, развој система рачунара у другој половини XX века, иницирао је огроман скок у аспекту примене статистичких метода у, сада већ, готово свим анализама било којих масовних појава. У данашње време статистика представља симбиозу следећих компоненти: - дескриптивна статистика која се бави прикупљањем, обрадом и приказивањем већ постојећих података; - статистичка анализа која представља скуп статистичких метода помоћу којих се врши квантитативна анализа међусобних односа између појава које имају масовни карактер и помоћу којих се доносе одређени закључци и дефинишу законитости понашања посматраних појава; - статистичка теорија која проналази нове статистичке методе и усавршава већ постојеће. Данас се статистичке методе истраживања врло успешно примењују у свим научним подручјима, чак и у оним где је то до пре једне или две деценије било незамисливо (нпр. нека подручја физике и хемије). Статистчика веза са другим наукама се састоји у томе што се упоредо са развојем теорије и потреба за практичним истраживањима у разним подручјима јављају и односна статистичка истраживања у тим подручјима, а из тога настају потребе за даљим развојем статистичке теорије и методологије.
3 ПРЕДМЕТ, МЕТОД И САДРЖАЈ СТАТИСТИКЕ Предмет статистичког истраживања су масовне појаве, које су по својој природи варијабилне, па их треба посматрати на великом броју случајева и на основу тих посматрања донети закључке. Због тога се статистика најчешће интерпретира као научни метод квантитативног истраживања масовних појава. Статистика је по својој природи индуктивни метод. Она може полазити од извесних хипотеза, али закључке доноси на основу искуства, чињеница, догађаја и статистичких експеримената. То је емпиријски метод и један је од бројних прилаза креирању нових и потврдивању постојећих сазнања, на широком подручју научног истраживања. Данас нема више ниједне гране науке у којој се не би успешно могао применити статистички начин истраживања. 4 ПЛАН СТАТИСТИЧКОГ ИСТРАЖИВАЊА Општи (оквирни) план се састоји од три дела:. Садржински део плана потребно је дефинисати: 2. Организациони део плана потребно је прецизно одредити следеће: 3. Технички део плана садржи: Оперативни планови се израђују на основу општег плана истраживања. У оперативним плановима се прецизно одређује следеће:. методолошки поступци и активности са редоследом извођења, 2. лична задужења, надлежности и одговорности, 3. начини добијања података на терену и вршење њихове контроле, чувања и доставе одређеној организационој јединици, 4. конкретну техничку и телекомуникацијску опрему и друга материјална средства, 5. рокове завршетка посла по фазама и друге потребне елементе. Када су у питању велика статистичка истраживања (нпр. попис становништва) постоји пет фаза поступака и активности које чине јасно заокружене делове укупног посла који се односи на таква истраживања, а то су:. припрема реализације истраживања, 2. прикупљање изворних података, 3. сређивање, обрада, груписање и приказивање података, 4. статистичка анализа појаве и 5. објављивање резултата истраживања. 5 АНАЛИЗА ПОДАТАКА Да би се успешно извршила анализа статистичког скупа израчунавају се параметри одређених особина. Параметри који се најчешће користе су: средња вредност (аритметичка средина), мере варијабилитета (дисперзија) и мере асиметрије и спљоштености. Дисперзија је један од важнијих статистичких појмова којима се бројчано изражава степен варијабилности података. Већу дисперзију или распршеност имају серије чији чланови показују већи варијабилитет. У пракси се користи већи број мера дисперзије: распон варијације, интерквартил, коефицијент квартилне девијације, варијанса, стандардна девијација и коефицијент варијације. Мере дисперзије имају широко подручје примене. Мере облика расподеле - За неки распоред кажемо да је симетричан ако фреквенције вредности обележја равномерно расту од доње границе интервала варијације до аритметичке средине, а затим истом равномерношћу опадају до горње границе интервала варијације. Симетричан распоред има једнаке вредности аритметичке средине, медијане и модуса. Слика. Симетричан распоред Слика 2. Лева асиметрија Слика 3. Десна асиметрија 6 РЕГРЕСИОНА АНАЛИЗА Под појмом регресиона анализа подразумева се скуп статистичких процедура за испитивање облика зависности између два или више обележја. Уколико се испитује облик и степен зависности само између два обележја, онда се такав процес назива проста регресиона анализа (утврђивање облика зависности два обележја) и проста корелациона анализа (утврђивање степена зависности два обележја).
Уколико се испитује облик и степен зависности између више обележја, онда се такав процес назива вишеструка регресиона анализа (утврђивање облика зависности више обележја), односно вишеструка корелациона анализа (утврђивање степена зависности више обележја). Слика 4. Дијаграми распршености 7 ОЦЕНЕ ПАРАМЕТАРА РАСПОДЕЛЕ Слика 5. Регресиона линија Користе се две врсте оцена расподеле: тачкаста и интервална оцена. Тачкаста оцена је оцена неког параметра реалним бројем који се израчунава на основу узорака и представља реализовану вредност одабране статистике. Тај број је тачка на реалној оси и служи као апроксимација непознате вредности. Интервалне оцене се дају преко интервала који се називају интервалима поверења, јер са унапред задатом поузданошћу прекривају непознати параметар. Та поузданост се назива ниво поверења и означава се са β. У пракси се чешће користе интервалне оцене параметара θ. Суштина ових оцена своди се на одређивање ˆ ˆ, 2 који садржи непознати параметар θ са вероватноћом 00 %. Проблем се своди на то да се одреде две статистике ˆ f( X,..., X n ) и ˆ 2 f2( X,..., X n) такве да је P ˆ ˆ 2 и P ˆ ˆ 2, где је β задата вероватноћа која се зове ниво поверења за θ. Интервал ˆ ˆ, 2 је случајан интервал - интервал поверења за θ. 7. Интервал поверења за очекивану вредност применом пакета Statistica Поступак добијања интервала поверења за неку очекивану вредност у програмском пакету Statistica је следећи: Statistic> Basic Statistic/Tables>OK. На добијеном прозору одаберемо картицу Advanced и селектујемо Confirm limits for means са интервалом од 95%. Кликом на Variables изаберемо жељену групу варијабли > ОК (слика 9). Након тога добијамо резултате приказане на слици 6. Слика 6. Интервал поверења за очекивану вредност и избор варијабли
Слика 7. Интервали поверења за потрошњу од 2006. до 20. при коефицијенту поузданости 95% 8 ДЕСКРИПТИВНЕ СТАТИСТИКЕ Дескриптивне статистике садрже методе и процедуре за презентовање и сумирање података. Сврха дескриптивне статистике је да помоћу неколико бројева опише значење података који стоје иза њих. Дескриптивне статистике су обично први корак у анализи података, а служи за описивање прикупљених података. Оне обично претходе статистичком закључивању и предвиђању, али може бити и крајњи циљ статистичке анализе. Извођењем закључака се бави друго подручје статистике које се зове статистика закључивања. Најчешће коришћене процедуре у дескриптивној статистици су графичко и табеларно приказивање података и израчунавање мера централне тенденције и варијабилитета. 9 СТАТИСТИЧКА ОБРАДА ПОДАТАКА НА КОНКРЕТНОМ УЗОРКУ УЗ ПОМОЋ ПРОГРАМСКОГ ПАКЕТА STATISTICA У овом делу рада биће приказана статистичка обрада над конкретном узорку личне потрошње домаћинстава у Србији у периоду од 2006. до 20. године. Варијабле које су узете за испитивање личне потрошње домаћинства су: 2006. година [мил.рсд], 2007. година [мил.рсд], 2008. година [мил.рсд], 2009. година [мил.рсд], 200. година [мил.рсд] и 20. година [мил.рсд]. Део табеле са датим варијаблама приказан је на слици 8. Слика 8. Део базе података 9. Дескриптивна статистика у програмском пакету Statistica Да би над узорком извршили статистичка тестирања у програму Statistica потребно је урадити следеће кораке: Statistics>Basic Statistics/Tables>Descriptive Statistics>OK. Потребно је селектовати Descriptive statistic и потврдити на ОК. Затим нам се појављује прозор (слика 23.) у ком је потребно селектовати одређену групу са варијаблама на којима извршавамо статистичке тестове. Постоји 5 врста тестирања: Summary Statistics (сумарна статистика), Summary Graphs (графички приказ сумарних статистика), Frequency tables (табеле фреквенције), Histograms (хистограм) и Box & whisker plot for all variables (кутијасти дијаграм за све варијабле). 9.. Статистичко тестирање за 2006. годину Слика 9. Сумарна статистика за 2006. годину
Слика 0. Графички приказ сумарних статистика за 2006. год. Слика. Табела фреквенција за 2006. годину Слика 2. Хистограм за 2006. годину Слика 3. Кутијасти дијаграм 2006. годину 9..2 Графичко приказивање података помоћу пита (pie) дијаграма Слика 4. Транспорт Слика 5. Електрична енергија 9.2 Тестирање статистичких хипотеза Под тестирањем статистичких хипотеза подразумева се провера, односно тестирање истинитости формулисаних хипотеза. Тестирање хипотеза врши се помоћу узорака. Статистички тестови се најчешће деле у две групе:. параметарски тестови 2. непараметарски тестови Статистичка хипотеза је свака претпоставка која се односи на расподелу обележја. Она може бити тачна или нетачна. Одлука о прихватању или одбацивање хипотезе доносе се на основу узорка. Статистички тест је поступак верификовања статистичке хипотезе на основу узорка. Овај тест се користи за статистику која се назива тест статистика. Истовремено се посматрају две хипотезе које су једна другој супростављене. Хипотеза коју тестирамо зове се нулта (Н 0 ), насупрот алтернативној (Н ) хипотези. Ако хипотеза потпуно одређује расподелу, онда се назива проста хипотеза: H ), а ако хипотеза није проста онда се назива сложена хипотеза: 0( 0 H ), H ( ), H ( ) и др. Када претпоставимо да обележје Х има нормалну расподелу онда ( 0 0 0 пажњу поклањамо параметрима m и 2.
Тестирање хипотеза на основу датог узорка Тест За ову врсту тестирања нам је потребна табела Sumary Statistics из дескриптивних статистика. У програму STATISTICA радимо тест користећи следећу путању: Statistics>Basic Statistic>Diference tests : r, %, means и добијамо прозор приказан на слици 77. За избор two sided тест ради се алтернативна хипотеза H ( m 0 ), а за one-sided се тестира H m ) или H m ). За тестирање користимо варијабле: m ( m0 2006. година [мил.рсд] и 2007. година [мил.рсд]. ( m0 Слика 6. Тестирање алтернативне хипотезе Тест 2 У програму STATISTICA радимо тест за доказивање хипотезе H 0 (m =m 2 ) против H (m m 2 ), где је непознато σ и σ 2, путањом Statistic>Basic statistic>difference test r% mean. У овом тестирању утврђујемо да ли је аритметичка средина потрошачке корпе за 2006. и 2008. годину иста. Слика 7. Упоређивање аритметичких средина потрошачке корпе за 2006. и 2008. Годину Пошто смо добили вредност за p= 0,5338 чиме се испуњава услов да је p> α. Што значи да су у ове две аритметичке средине сличне количине годишње потрошње грађана. Тест 3 У програму STATISTICA радимо тест за доказивање хипотезе H 0 (m =m 2 ) против H (m m 2 ), где је непознато σ и σ 2. Да би над узорком извршили статистичка тестирања у програму Statistica потребно је урадити следеће кораке: Statistic>Basic statistic > t-test independent by Variables. Тестираћемо, да ли ће аритметичке средине годишње потрошње грађана за 2009. годину и 200. годину бити исте. На картици Variables (groups) добијамо прозор у ком селектујемо групе варијабли над којима вршимо тестирање. У нашем случају то су 2009. и 200. година. Кад извршимо селектовање група потврђујемо на ОК после чега нам се појављује прозор као на слици 83. ( First list: 2009. година [мил. РСД], Second list: 200. година [мил. РСД]). У катрици Options унесимо вредности за α што је у нашем случају p-level for highlighting: 0,05. Након задатих вредности за α, у картици Quick бирамо Summary: T-tests и добијамо табелу приказану на слици 8. Слика 8. Сумарна табела за T-тест Пошто смо као резултат за тестирање (р) добили вредност 0,89639988374 која је већа од 0,05 (α), хипотеза се прихвата. То значи да је просечна потрошња за 2009. и 200. годину слична, тј. бројно једнака. На основу тога даље закључујемо да посматрана популација, коју сачињавају 59 различитих врста производа и услуга, добро репрезентују проблематику, јер претходно тестирање показује да резултати не зависе од тога који смо узорак изабрали из те популације, тј. сваки коректно одабран узорак из ове популације је репрезентативан.
9.3 Пирсонов χ 2 тест Пирсонов хи - квадрат (χ 2 ) тест је врло практичан тест који може послужити онда кад желимо да утврдимо да ли неке добијене (опажене) фреквенције одступају од фреквенција које бисмо очекивали под одређеном хипотезом. Код овог теста каткада тражимо постоји ли повезаност између две променљиве и он показује вероватноћу повезаности. Пирсонов χ 2 тест се најчешће употребљава у овим случајевима:. кад имамо фреквенције узорка па желимо установити одступају ли те фреквенције од фреквенција које очекујемо уз неку хипотезу 2. кад имамо фреквенције 2 или више независних узорака те желимо установити разликују ли се узорци у опаженим својствима 3. кад имамо фреквенцију 2 зависна узорка, који имају дихотомна својства, те желимо установити разликују ли се узорци у мерним својствима, тј је ли дошло до промене. Да би одрадили овај тест у програму STATISTICA пратимо следећу путању: Statistics>Distribution Fitting. У добијеном прозору у нашем случају бирамо Normal тј.користимо нормалну расpоделу>ок. У картици Variables вршимо избор жељене варијабле за тестирање. У нашем случају то је 2009. година [мил.рсд]. Потврдом на ОК па на Sumary добијамо за резултат табеларни приказ као на слици 9. 0. АНАЛИЗА ВРЕМЕНСКИХ СЕРИЈА Слика 9. Сумарна табела за 2009. годину Временске серије приказују промену посматране појаве у функцији времена: Y f t. Анализом временских серија жели се постићи четири парцијала циља, а то су:. Дескрипција 2. Објашњење 3. Прогнозирање 4. Контрола У зависности од временског периода у ком се дешавају постоје 4 основне компоненте временске серије: тренд, цикличне варијације, сезонске варијације и нерегуларне (случајне) варијације 0. Анализа временских серија применом пакета Statistica Да би започели тестирање временских серија потребно је пратити следећу путању: Statistic> Advanced Linear / Nonlinear Models> Time Series / Forecasting након чега је потребно да изаберемо шта желимо да анализирамо (у нашем случају потрошњу на услуге смештаја од 2006. до 20. године). Потврдимо са OK (transformations,autocorrelations, crosscorelations, plots)>ok (transform selected series) и добијамо дијаграм као на слици 20. Слика 20. Дијаграм са резултатима анализе
. ЗАКЉУЧАК У данашње време статистика је свуда око нас. Сведоци смо свакодневног стварања великог броја података. Узнапредована технологија потпомогнута рачунарима омогућава нам мерење различитих пословних процеса као и чување и лаку доступност мерних резултата. Само на основу прикупљених података немогуће је било што закључити о нашим процесима. Потребан нам је алат који прикупљене податке претвара у кратку и објективну информацију на основу које можемо анализирати све процесе и доносити добре одлуке. Тај алат који нам је потребан је статистика. Постоји велики број програмских пакета и апликација који су доступни на тржишту и омогућавају брз и лак начин статистичке обраде података без мукотрпног рачунања и коришћења сложених формула. Један од таквих програмских пакета је коришћен при изради овог мастер рада. Програмски пакет Statistica се показао као лак за савлађивање, али да би се знао правилно употребљавати потребно је одређено предзнање из статистике. Без предзнања из статистике, само на основу резултата мерења не можемо са сигурношћу закључивати. У истраживањима се дошло до закључка да је у периоду од 2006. до 20. године највише порасла лична потрошња на дуван (2%), затим образовање и електрична енергија (8%), храна (7%), одећа и транспорт (6%). На лекове, медицинске уређаје и опрему се у просеку потроши око 6497,83 мил. РСД, на смештај 3230,50 мил. РСД док се на осигурање потроши 3230,50 мил. РСД. При тестирању хипотезе да је потрошња грађана за 2009. и 200. годину релативно слична смо дошли до закључка да је хипотеза тачна и да се са сигурношћу може прихватити јер смо за р добили вредност 0,89639988374 која је већа од 0,05 (α). То значи да је просечна потрошња за 2009. и 200. годину слична, тј. бројно једнака. На основу тога даље закључујемо да посматрана популација, коју сачињавају 59 различитих врста производа и услуга, добро репрезентују проблематику, јер претходно тестирање показује да резултати не зависе од тога који смо узорак изабрали из те популације, тј. сваки коректно одабран узорак из ове популације је репрезентативан. Лична потрошња домаћинстава од 2006. до 200. године у сталном порасту, док је 20. године опала за 28246,00 мил.рсд. Разлог томе је све нижи стандард у земљи. ЛИТЕРАТУРА [] Васо Драговић, Статистика, Завод за уџбенике и наставна средства, Источно Сарајево, 2008. [2] Вера Лазаревић, Марија Ђукић, Инжењерска математика, Чачак, Србија: Технички факултет Чачак, 200. [3] Д. Младеновић, Економска статистика, Економски факултет, Београд, 2009. [4] Ивана Ковачевић, Вероватноћа и статистика са збирком задатака, Универзитет Сингидунум, Београд, 20. [5] Милан Меркле, Вероватноћа и статистика за инжењере и студенте технике, Академска мисао, Београд, 2006. [6] Мирко Савић, Пословна статистика, Суботица, 2005. [7] Презентација са сајта факултета: Вера Лазаревић, Пројекат 540 TEMPUS JPCR Master prograмe in 203.) (200.-, MAS Applied Statistics [8] Рабија Сомун Капетановић, Статистика у економији и менаџменту, Економски факултет, Сарајево, 2008 [9] Светозар Вукадиновић, Елементи теорије вероватноће и математичке статистике, Београд, Србија: Привредни преглед 988. [0] Стојан Рачић, Статистика, Висока школа за организацију рада, Нови Сад, 98.