Analiza diferentiala a datelor

Σχετικά έγγραφα
Analiza datelor de marketing utilizand S.P.S.S. - analiza diferentiala -

Analiza bivariata a datelor

Mihai Orzan joi, 19:30, sala 1406

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Subiecte Clasa a VII-a

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

8 Intervale de încredere

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

TESTE STATISTICE PENTRU DATE ORDINALE. M. Popa

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

9 Testarea ipotezelor statistice

Metode de interpolare bazate pe diferenţe divizate

Recapitulare - Tipuri de date

Curs 4 Serii de numere reale

Metode iterative pentru probleme neliniare - contractii

Integrala nedefinită (primitive)

Aplicaţii ale principiului I al termodinamicii la gazul ideal

MARCAREA REZISTOARELOR

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

PRELEGEREA XII STATISTICĂ MATEMATICĂ

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

Variabile statistice. (clasificare, indicatori)

riptografie şi Securitate

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

5.4. MULTIPLEXOARE A 0 A 1 A 2

7 Distribuţia normală

sunt comparate grupuri formate din subiecńi diferińi, evaluańi în condińii diferite testul t pentru eşantioane independente ANOVA

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

Distribuţia multinomială Testul chi-pătrat. M. Popa

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

Seminar 5 Analiza stabilității sistemelor liniare

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

DistributiiContinue de Probabilitate Distributia Normala

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

1.7. AMPLIFICATOARE DE PUTERE ÎN CLASA A ŞI AB

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Aparate de măsurat. Măsurări electronice Rezumatul cursului 2. MEE - prof. dr. ing. Ioan D. Oltean 1

Statisticǎ - curs 4. 1 Generalitǎţi privind ipotezele statistice şi problema verificǎrii ipotezelor statistice 2

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

NOTIUNI DE BAZA IN STATISTICA

Fig Impedanţa condensatoarelor electrolitice SMD cu Al cu electrolit semiuscat în funcţie de frecvenţă [36].

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Scoruri standard Curba normală (Gauss) M. Popa

Proiectarea filtrelor prin metoda pierderilor de inserţie

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

Sisteme diferenţiale liniare de ordinul 1


CURS: METODE EXPERIMENTALE ÎN FCS

Curs 1 Şiruri de numere reale

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

Subiecte Clasa a VIII-a

Modul de calcul al prețului polițelor RCA

ANALIZA DATELOR EXPERIMENTALE

Erori si incertitudini de măsurare. Modele matematice Instrument: proiectare, fabricaţie, Interacţiune măsurand instrument:

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

TESTAREA IPOTEZELOR STATISTICE

prin egalizarea histogramei

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

BARAJ DE JUNIORI,,Euclid Cipru, 28 mai 2012 (barajul 3)

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

Asupra unei inegalităţi date la barajul OBMJ 2006

Msppi. Curs 3. Modelare statistica Exemplu. Studiu de caz

Distribuţia binomială Teste statistice neparametrice nominale. M. Popa


Curs 2 DIODE. CIRCUITE DR

Coeficientul de corelaţie Pearson(r) M. Popa

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

Analiza datelor de marketing utilizand S.P.S.S. - analiza predictiva -

STATISTICĂ DESCRIPTIVĂ

Cursul 6. Tabele de incidenţă Sensibilitate, specificitate Riscul relativ Odds Ratio Testul CHI PĂTRAT

Olimpiada de Fizică Etapa naţională- ARAD 2011 TEORIE Barem. Subiect Parţial Punctaj 1. Barem subiect 1 10 A. Condiţiile de echilibru pentru pârghii:

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

Laborator 11. Mulţimi Julia. Temă

V O. = v I v stabilizator

Laborator biofizică. Noţiuni introductive

TERMOCUPLURI TEHNICE

Stabilizator cu diodă Zener

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Spatii liniare. Exemple Subspaţiu liniar Acoperire (înfăşurătoare) liniară. Mulţime infinită liniar independentă

Problema a II - a (10 puncte) Diferite circuite electrice

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

Examen AG. Student:... Grupa:... ianuarie 2011

Progresii aritmetice si geometrice. Progresia aritmetica.

1.3 Baza a unui spaţiu vectorial. Dimensiune

Capitolul ASAMBLAREA LAGĂRELOR LECŢIA 25

Examen AG. Student:... Grupa: ianuarie 2016

Metode Runge-Kutta. 18 ianuarie Probleme scalare, pas constant. Dorim să aproximăm soluţia problemei Cauchy

a. 11 % b. 12 % c. 13 % d. 14 %

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

Regresie si corelatie

Diagnoza sistemelor tehnice

3.5. Indicatori de împrăştiere

Transcript:

Analiza diferentiala a datelor

Analiza diferentiala a datelor Utilizata pentru stabilirea reprezentativitatii statistie a diferentelor onstatate intre: o valoare presupusa a unui indiator (ipoteza) si valoarea estimata la nivelul populatiei investigate; doua sau mai multe variabile independente; doua sau mai multe esantioane dependente (analiza transversala sau longitudinala).

Testarea ipotezelor statistie Exemple de ipoteze utilizate in marketing: In inematografele buurestene merg el putin o data pe an 0% dintre louitorii orasului; Consumatorii freventi si oazionali ai unui produs (mara) au arateristii psihografie diferite; Imaginea publia a hotelului Howard Johnson este mai buna deat ea a hotelului Ibis.

Testarea ipotezelor statistie Etape pentru testarea ipotezelor:. Identifiarea testelor statistie adevate.. Formularea ipotezei nule H 0 si a ipotezei alternative H. 3. Alegerea unei probabilitati de garantare a rezultatelor. 4. Calularea indiatorului asoiat testului statisti. 5. Stabilirea ipotezei aeptate (nula sau alternative). 6. Formularea unei onluzii logie in limbajul speifi marketingului.

Testarea ipotezelor statistie Cunosuta si sub denumirea de analiza diferentiala univariata. Variabile ategoriale: se utilizeaza testul χ univariat; Variabile parametrie: se utilizeaza testul Student univariat (in varianta t sau z, depinzand de marimea esantionului).

Testul χ univariat Utilizat pentru variabilele ategoriale. Exemplu: in Romania, 5% dintre onsumatori prefera Daia. In urma unei eretari (sondaj) s a onstatat a 33% dintre soferi se afla la volanul unui autoturism Daia. Ipoteza este falsa sau oreta? H 0 : nu exista diferente semnifiative statisti intre ei doi parametrii.

Testul χ univariat Valori asteptate (onform ipotezei): Condu Daia: 5% Nu ondu Daia: 75% Valori observate (din sondaj): Condu Daia: 33% Nu ondu Daia: 67%

Testul χ univariat Indiatorul (alulat) al testului χ : χ r k i j O ( ij A A ij ij ) (33 5) (67 75) χ +,56 + 0,85 5 75 3,4

Testul χ univariat Pentru o probabilitate de garantare a rezultatelor de 99%, valoarea tabelata a lui t univariat este de 6,635. Se observa a χ χ t (3,4 < 6,635) > se aepta ipoteza nula (nu exista diferente semnifiative statisti intre valorile prognozate si ele observate, dei ipoteza initiala a fost oreta!)

Testul Student univariat Utilizat pentru variabile parametrie (se poate alula media), normal distribuite. Exemplu: venitul mediu in gospodariile elor are isi umpara Daia este de 000 de lei lunar. In urma aeluiasi sondaj, am onstatat a venitul in auza este de fapt de 75 de lei. Este onfirmata sau infirmata ipoteza initiala? H 0 : nu exista diferente semnifiative statisti intre valoarea din ipoteza si ea estimata la nivelul populatiei investigate, pe baza valorii observate in esantionul eretat.

Testul Student univariat Valoarea alulata a testului: t s x x μ s x σ n

Testul Student univariat Pentru o dimensiune a esantionului de 000 de persoane si o abaterea medie patratia de de 335, avem t,36. Gradele de libertate asoiate testului t univariat sunt n, in azul de fata 999 si probabilitate de garantare a rezultatelor α alease este de 95%. In aest az gasim t t,64 Interpretarea teoretia a testului Student: t t t : se aepta ipoteza nula t > t t : se respinge ipoteza nula

Testul Student univariat t (,36) > t t (,64) > se respinge ipoteza nula (exista diferente semnifiative statisti intre valoarea ipotezei si ea estimata la nivelul populatiei, dei ipoteza formulata este gresita).

Analiza diferentiala bivariata Testele utilizate sunt alese in funtie de modul de masurare al variabilelor, numarul de esantioane (grupuri) analizate si relatiile existente intre esantioane: Variabile ategoriale: grupuri:» Independente: χ, Mann Whitney, Wald Wolfowitz;» Dependente: χ (varianta MNemar), Wiloxon; mai multe grupuri: Kruskal Wallis; Variabile proportionale: grupuri:» Independente: testul Student pentru variabile independente;» Dependente: testul Student pentru variabile dependente; mai multe grupuri: ANOVA;

Testul neparametri χ In varianta lasia, testul χ presupune testarea unor variabile ategoriale (de regula non parametrie) si independenta esantioanelor analizate. Se bazeaza pe utilizarea tabelelor de ontingenta.

Testul neparametri χ Preferinta pentru imbraaminte sport, in funtie de statutul marital. Prefera imbraaminte sport Adesea Rar Total Statut marital Casatoriti Neasatoriti 96 04 58 4 54 46 Total 300 00 500 Valorile din tabelul de ontingenta, rezultate in urma eretarii, sunt denumite valori observate.

Testul neparametri χ Bazat pe ipoteza nula: H 0 : NU exista diferente semnifiative intre ele doua variabile. H : Exista diferente semnifiative intre ele doua variabile. Valoarea alulata a testului este data de: χ r k i j O ( Valorile asteptate sunt determinate onform distributiei χ r k de formula: O ij O ij A ij i r ij k A i j A ij j O ij ij )

Testul neparametri χ Valoarea alulata χ a testului este omparata u valoarea tabelata χ t a aestuia, obtinuta in funtie de probabilitatea de garantare a rezultatului si gradele de libertate asoiate: (r )(k ). χ χ t : se aepta ipoteza nula χ > χ t : se respinge ipoteza nula Pentru mai mult de doua subesantioane independente trebuie a freventele O ij > si O ij < 5 sa nu depaseasa 0%.

Testul Fisher Inlouieste testul χ atuni and dimensiunea esantionului n<0 si kr Tabelul de ontingenta pentru kr Prefera imbraaminte sport Casatoriti Statut marital Neasatoriti Total Adesea A B A+B Rar C D C+D Total A+C B+D N

Testul Fisher Testul probabilitatii exate (Fisher) are aeiasi ipoteza nula: H 0 : nu exista diferente semnifiative intre ele doua variabile. p (A + B)! (C + D)! (A + N! A! B! C! D! C)! (B + D)! Valoarea alulata p a testului se ompara u probabilitatea de garantare a rezultatului (ex.: 95%). p 0,05 : se respinge ipoteza nula p > 0,05 : se aepta ipoteza nula

Testul Fisher Atuni and dimensiunea esantionului n>0 si kr se utilizeaza oretia lui Yates a testului Fisher: χ (a + N( ad b b)( + d)(a N ) + )(b + d)

Testul MNemar Inlouieste testul χ atuni and ele doua esantioane investigate sunt dependente (analiza longitudinala sau transversala). Testul MNemar are aeiasi ipoteza nula: H 0 : nu exista diferente semnifiative intre ele doua variabile. χ ( a a si d reprezinta freventele subesantioanelor independente. Interpretarea este aeiasi a si in azul testului χ : a d + d χ χ t : se aepta ipoteza nula χ > χ t : se respinge ipoteza nula )

Testul Mann Whitney Utilizat de preferinta pentru pentru identifiarea diferentelor semnifiative intre (doua) variabile e provin din esantioane independente, masurate u ajutorul salei ordinale (se poate utiliza insa si in azul variabilelor proportionale), distribuite normal. Ipotezele testului Mann Whitney: H 0 : NU exista diferente semnifiative intre ele doua variabile. H : Cele doua variabile difera in mod semnifiativ. Valoarea alulata a testului U este data de: U i R i n (n i i + ), undei {,}

Testul Mann Whitney R i reprezinta rangurile asoiate valorilor din esantionul i (primul sau al doilea). Pentru esantioane totale (n +n ) mai mii de 30, valorile lui U t sunt tabelate. Pentru esantioane de peste 30 de subieti se utilizeaza testul Student pentru stabilirea semnifiatiei statistie a testului U, dupa formula: unde: z U n σ U n σ U n n (n + n n + n + )

Testul Mann Whitney Interpretarea testului U pentru esantioane mai mii de 30 de subieti: U U t : se aepta ipoteza nula U > U t : se aepta ipoteza alternativa Interpretarea teoretia a testului U pentru esantioane mai mii de 30 de subieti: z z t : se aepta ipoteza nula z > z t : se aepta ipoteza alternativa

Testul Mann Whitney Presupunand a Esop nu a fost foarte satisfaut de experimentul sau lasi, in are o broasa testoasa intree un iepure si repeta experiementul u 6 iepuri si 6 broaste testoase. Clasamentul se afla in tabelul de mai jos: I II III IV V VI VII VIII IX X XI XII T I I I I I T T T T T I Suma rangurilor R asoiate testoaselor este: +7+8+9+0+ 46

Testul Mann Whitney U 6(6 + ) 46 5 Din tabelul asoiat testului Mann Whitney gasim a U t (pentru n 6, n 6 si α0,05) 5, dei putem onstata a U > U t > vom aepta ipoteza alternativa (exista diferente semnifiative intre omportamentul in onurs al broastelor testoase si al iepurilor, dat de suma rangurilor, mai exat 46 pentru testoase si 5 pentru iepuri)

Testul Wiloxon Testul Wiloxon este un test non parametri bivariat utilizat pentru identifiarea semnifiatiei statistie a diferentelor identifiate pentru variabile provenite din esantioane dependente (masuratori repetate sau variabile masurate ale aelorasi respondenti), masurate u ajutorul salelor ordinale, indiferent de tipul distributiei. Exemplu: existenta unor diferente semnifiative statisti intre pereptiile asupra a doua mari diferite (utilizand sala Likert) sau pentru pereptia asupra imaginii berii Redd s inainte si dupa realizarea unei ampanii promotionale.

Testul Wiloxon Ipotezele testului Wiloxon: H 0 : NU exista diferente semnifiative intre ele doua variabile. H : Cele doua variabile difera in mod semnifiativ. Pentru alulul statistiii W +, asoiata testului Wiloxon, se ordoneaza toate valorile observate, se aluleaza diferentele observate w i, aeste diferente sunt ordonate in funtie de marime, fieareia fiind ulterior asoiat un rang R i pe baza pozitiei in aeasta serie de diferente: w i y x i i i i R rangul w

Testul Wiloxon De asemenea, pentru alulul W + se utilizeaza o funtie indiator, Φ i : Valoarea W + este data de: φ I(w > i i W + 0) Sustinerea (sau respingerea) ipotezei nule se bazeaza pe probabilitatea de aparitie a valorii W +, data de tabele statistie asoiate testului (pentru n de maxim 30 de respondenti) sau estimata u ajutorul testului Student. n i φ i R i

Testul Wiloxon Utilizand sala Likert pentru identifiarea disponibilitatii respondentilor de a umpara berea Redd s, masurata inainte si dupa expunerea la un spot de promovare a produsului, au fost inregistrate urmatoarele valori (5 sigur da; 4 probabil da, 3 indiferent, probabil nu; sigur nu): Respondent 3 4 5 6 7 8 9 0 3 4 5 Inainte 5 3 5 4 4 3 5 4 Dupa 5 4 3 5 5 4 3 4 4 5 3 5 Diferente (w i ) 0 3 0 0 3 3 0 0 4 Ranguri R i 3 3 6 8 3 3 8 8 3 0

Testul Wiloxon Utilizand sala Likert pentru identifiarea disponibilitatii respondentilor de a umpara berea Redd s, masurata inainte si dupa expunerea la un spot de promovare a produsului, au fost inregistrate urmatoarele valori (5 sigur da; 4 probabil da, 3 indiferent, probabil nu; sigur nu): Respondent 3 4 5 6 7 8 9 0 3 4 5 Inainte 5 3 5 4 4 3 5 4 Dupa 5 4 3 5 5 4 3 4 4 5 3 5 Diferente (w i ) 0 3 0 0 3 3 0 0 4 Ranguri R i 3 3 6 8 3 3 8 8 3 0

Testul Wiloxon Insumand rangurile pozitive R i din tabelul anterior obtinem W +, areia ii este asoiata o probabilitate p()0,0036 (aleasa pentru n5 si α0,05), mai mia deat 0,05 pragul de sustinere al ipotezei nule in textul Wiloxon, dei se poate onluziona a ipoteza nula este respinsa (este adoptata ipoteza alternativa) > ele doua seturi de date difera in mod semnifiativ (spotul publiitar a shimbat atitudinea respondentilor fata de mara Redd s). Pentru esantioane dependente de peste 30 de respondenti se utilizeaza: z W + 0,05 σ W n(n + )(n + ) σ W n

Testul Student bivariat Utilizat pentru stabilirea semnifiatiei satistie a diferentelor onstatate intre doua esantioane (dependente sau independente). Exemplu: persoanele de sex masulin si feminin au un omportament diferit in utilizarea Internetului (numarul de ore de utilizare saptamanale)? Persoanele u venit mare au un proent mai ridiat de loialisti fata de mara deat persoanele u venit sazut? Analiza este realizata diferentiat pentru medii si proente.

Testul Student bivariat Bazat pe ipotezele H 0 : NU exista diferente semnifiative statisti intre (media) elor doua esantioane investigate. H : ele doua esantioane sunt diferite statisti. Analiza este realizata diferentiat in azul esantioanelor independente, in funtie de existenta unor diferente (semnifiative statisti) intre dispersiile elor doua grupuri.

Testul Student bivariat In azul esantioanelor independente, se utilizeaza testul F pentru stabilirea asoierii dintre dispersiile elor doua grupuri (in anumite azuri poate fi folosit si testul Kolmogorov Smirnov). Ipotezele testului F: H 0 : NU exista diferente semnifiative statisti intre dispersiile elor doua esantioane investigate. H : ele doua esantioane inregistreaza diferente ale valorilor observate semnifiative statisti. Valoarea testului F: F σ σ

Testul Student bivariat Gradele de libertate asoiate testului F sunt n sin, iar probabilitate de garantare a rezultatelor α este aleasa, in funtie de nevoile analizei. Daa probabilitatea asoiata testului F t (data de gradele de libertate si probabilitatea de garantare a rezultatelor) este mai mare deat ea asoiata F atuni se aepta H (ele doua esantioane au dispersii diferite), altfel se aepta H 0 (dispersiile elor doua esantioane independente sunt asemanatoare).

Testul Student bivariat Pentru esantioane independente (medii) formula testului t (z in esantioane de peste 30 de respondenti) este: z x s x x x

Testul Student bivariat Abaterea standard asoiata dispersiei, pentru esantioane independente, u dispersii diferite semnifiativ: Abaterea standard asoiata dispersiei, pentru esantioane independente, u dispersii asemanatoare: x x n σ n σ s + ) n n ( σ s x x +

Testul Student bivariat Gradele de libertate asoiate testului t bivariat (esantioane independente) sunt n +n si probabilitate de garantare a rezultatelor α. Interpretarea teoretia a testului Student: t t t : se aepta ipoteza nula t > t t : se aepta ipoteza alternativa Analiza difera in funtie de dispersiile asoiate elor doua esantioane utilizate

Testul Student bivariat 30 9 8 7 6 5 4 3 0 9 8 7 6 3 4 4 3 6 5 5 9 6 4 4 9 3 Ore Internet Sex 9 3 8 4 5 5 7 6 8 6 9 5 0 3 4 3 4 3 5 6 6 Sex 3 4 Ore Internet 3

Testul Student bivariat Sex Nr. de respondenti Media (orelor de navigatie saptamanale) Eroarea standard asoiata mediei Masulin 5 9.33.4 Feminin 5 3.87 0.44 F 5,507 > F 4,4,95%,46 > se aepta ipoteza alternativa (dispersiile elor doua esantioane sunt semnifiativ diferite) t 4,49 > t 8, 95%,70 > se aepta ipoteza alternativa (exista diferente semnifiative intre gradul de utilizare a Internetului pentru barbati si femei)

Testul Student bivariat Testul t bivariat (pentru esantioane independente) se poate folosi si pentru alti indiatori (ex.: proente). p p s p p z p p n ) p ( p n ) p ( p s +

Testul Student bivariat Testul t bivariat pentru esantioane dependente (masuratori repetate sau variabile masurate ale aelorasi respondenti). Exemplu: existenta unor diferente semnifiative statisti intre pereptiile asupra a doua mari diferite (utilizand sala Stapel) sau pentru pereptia asupra unei mari la doua momente diferite (inainte si dupa efetuarea unor ativitati promotionale?

Testul Student bivariat Testul t bivariat pentru esantioane dependente s D z n i D μ s (D D i n n D D ) D n i n D i

Analiza Variatiei (ANOVA) In iuda denumirii, reprezinta tot un test statisti, utilizat pentru stabilirea semnifiatiei satistie a diferentelor onstatate intre trei sau mai multe esantioane (dependente sau independente), masurate pe o sala proportionala. Ehivalentul testului Stundent pentru mai mult de doua esantioane Exemple: utilizarea Internetului (numarul de ore de utilizare saptamanale) difera in funtie de nivelul de eduatie al persoanelor investigate (gimnazial, lieal, universitar, post universitar)? Categoriile (intervalele) de varsta influenteaza semnifiativ nivelul salarial al respondentilor?

Analiza Variatiei (ANOVA) Utilizeaza: o variabila de grupare X (e determina subgrupurile), denumita si variabila independenta; o variabila analizata (dependenta), masurata pe sala proportionala; Variabila dependenta este subdivizata in subesantioane (grupuri), de dimensiuni n, n, n. In analiza diferentelor onstatate intre mediile subgrupurilor, ANOVA utilizeaza notiunea de desompunere a variatiei totale, in variatie interna (in interiorul aestor grupuri) si variatie externa (diferenta onstatata intre grupuri).

Analiza Variatiei (ANOVA) Variatia totala: E I T V V V + j n i ij T j ) x (x V j j E ) x x ( V j n i j ij I j ) x (x V

Analiza Variatiei (ANOVA) Gradele de libertate asoiate: variatia totala: n ; variatia interna: n ; variatia externa: ; Magnitudinea (importanta) variatiilor se aluleaza u ajutorul unui indiator, denumit media patratia η: V I η Media patratia interna: interna n Media patratia externa: η externa V E -

Analiza Variatiei (ANOVA) Ipotezele asoiate ANOVA: NU exista o diferenta semnifiativa statisti intre (mediile) grupurile analizate; grupurile investigate (mediile lor) difera in mod semnifiativ; Ipotezele sunt aeptate sau respinse in funtie de valoarea oefiientului F asoiat ANOVA: F V E V I

Analiza Variatiei (ANOVA) Valorile teoretie ale testului F se regases in tabele, indexate pe baza probabilitatii de garantare a rezultatelor ( α) si gradele de libertate interne (n ) si externe ( ). Interpretarea teoretia a testului F (ANOVA): F F t : se aepta ipoteza nula F > F t : se aepta ipoteza alternativa

Analiza Variatiei (ANOVA) Exemplu: Zone Reords doreste sa lanseze pe piata noul album IRIS si, pentru ineput, produe 0000 de ópii. Trimite ate 000 de exemplare in ele 5 depozite regionale sau tine seama de vanzarile elorlalte grupuri de rok din fieare regiune din ultimul an?

Analiza Variatiei (ANOVA) Date istorie asupra vanzarilor Grup Buuresti Constanta Iasi Cluj Timisoara Total Holograf 3000 800 000 500 000 7300 Compat 750 00 00 000 500 5650 Celelalte uvinte 50 400 300 400 000 4350 Sarmalele rei 000 500 600 400 800 4300 Diretia 5 000 400 00 00 700 400 Total 9000 300 300 5500 5000 5000 Medii partiale 800 460 640 00 000 000

Analiza Variatiei (ANOVA) n 5x55 de observatii V ( x r5 E j x ) j 0700 V I n j j i (x ij x j ) 355000 + 98800 + 85000 + 360000 + 380000 39040800 F V E (n ) V ( ) I 0700(5 39040800(4 5) ),87

Analiza Variatiei (ANOVA) F,87 < F t (5,5,α0,05) 5,05 > se aepta ipoteza nula (mediile subesantioanelor nu difera in mod semnifiativ). Cum se distribuie CD ul elor de la IRIS?

Testul Levene Un test bivariat, pentru stabilirea gradului de asemanare intre variatiile a doua esantioane (dependente sau independente), masurate pe o sala ategoriala sau ontinua, normal distribuite. Ipotezele asoiate testului Levene: NU exista o diferenta semnifiativa statisti intre dispersiile grupurile analizate (diserpersiile sunt asemanatoare avem o relatie de homosedastiitate); Disersiile grupurilor investigate sunt semnifiativ diferite (prezinta o relatie de heterosedastiitate);

Testul Levene Indiatorul testului este denumit Levene F sau W si se aluleaza onform formulei: W (n ) ( j ) n j i nj( D j ( D i ij D D ) i ) unde: D ij y ij y j

Testul Levene Valorile teoretie ale testului Levene se regases in tabele, indexate pe baza probabilitatii de garantare a rezultatelor ( α) si gradele de libertate (n ). Interpretarea teoretia a testului Levene: F F t : se aepta ipoteza nula (relatia este homosedastiva) F > F t : se aepta ipoteza alternativa (relatia este heterosedastiva)

Testul Kruskal Wallis utilizat pentru stabilirea semnifiatiei satistie a diferentelor onstatate intre trei sau mai multe esantioane (dependente sau independente), masurate pe o sala ordinala, normal distribuite si homosedastie. Kruskal Wallis este ehivalentul testelor Mann Whitney si Wiloxon pentru mai mult de doua esantioane. Exemple: identifiarea gradului in are nivelul de eduatie influenteaza preferinta pentru un anumit produs, masurat pe o sala ategoriala; Stabilirea gradului in are gradul de loialitate al respondentilor este influentat de pereptia imaginii unui produs?

Testul Kruskal Wallis Ipotezele asoiate testului Kruskal Wallis: NU exista o diferenta semnifiativa statisti intre (medianele) grupurile analizate; Grupurile investigate (medianele) difera in mod semnifiativ; Gradele de libertate asoiate K sunt ( reprezentand numarul de grupuri determinat de variabila de grupare asupra variabilei independente).

Testul Kruskal Wallis Ipotezele sunt aeptate sau respinse in funtie de valoarea oefiientului K asoiat testului: K (n ) j j n j j i n ( r (r r ) r ) unde: r ij reprezinta rangul observatiei i din grupul j; r j media subesantionului j; n j dimensiunea subesantionului j; numarul de grupuri (>) j ij

Testul Kruskal Wallis Interpretarea teoretia a testului Kruskal Wallis se bazeaza pe valorile tabelate ale testului χ, pentru grade de libertate si o probabilitate de garantare a rezultatelor de α: K χ t : se aepta ipoteza nula (grupurile nu sunt semnifiativ diferite) K > χ t : se aepta ipoteza alternativa (grupurile au omportamente diferite) In azul variabilelor nominale se utilizeaza testul χ, indiferent de numarul subesantioanelor; Testul K este mai exat deat χ in azul variabilelor ordinale, utilizand rangurile, spre deosebire de χ, are utilizeaza frevente de aparitie.

Testul Kruskal Wallis Exemplu: In urma unor fous grupuri realizate pentru identifiarea pereptiei onsumatorilor potentiali pentru berea Redd s, inainte de lansarea aesteia pe piata, au fost stranse date despre nivelul de eduatie (lieu, universitar, postuniversitar) al respondentilor, a si asupra pereptiei asupra gustului, pretului si imaginii produsului, folosindu se sala Stapel (note de la la 0, 0 reprezentand valoarea maxima). Datele stranse se regases in tabelul urmator.

Testul Kruskal Wallis Pentru fieare respondent, valorile elor 3 indiatori ai pereptiei (gust, pret si imagine) sunt agregati utilizandu se media algebria. Lieu Faultate Master/Dotor 6.4.5.3 6.8 3.7 4. 3 7. 4.9 4.9 4 8.3 5.4 5. 5 8.4 5.9 5.5 6 9. 8. 8. 7 9.4 8. 8 9.7 Medie 8. 5.5 4.9

Testul Kruskal Wallis Valorile sunt agregate intr o singura variabila, de dimensiunea n, iar apoi sunt atribuite ranguri, dupa sistemul expliat pentru testul Mann Whitney: 3 4 5 6 7 8 Suma rangurilor Medie Lieu 3 7 8 9 0 3 6.4 Faultate 3 5.5 8 0 4 5.5 58 8.3 Master/Dotor 4 5.5 7 9 5.5 4 7

Testul Kruskal Wallis Suma tuturor rangurilor este 3, u o medie de (3/). Tabelul patratelor diferentelor de rang este: Lieu Faultate Master/Dotor 0 8 00 64 49 3 4 30.5 30.5 4 36 9 6 5 49 4 6 64 9 0.5 7 8 0.5 8 00 Suma rangurilor 9.6 7.9 6

Testul Kruskal Wallis Suma patratelor diferentelor intre rangurile observate si media rangurilor este 769, in timp e patratul diferentelor dintre rangurile mediie ale grupurilor si media generala a rangurilor este 5,45. In aest fel, putem alula: K (n j ) j n j j i n ( r (r j ij r ) 769 0 5. 45 r ) 93, 3 Observam a K 93,3 > χ t 5,99, alulat pentru 3 grade de libertate si un α0,05, dei aeptam impoteza alternativa, onluzionand a nivelul de eduatie influenteaza semnifiativ modul in are este pereputa mara de bere Redd s

Analiza CoVariatiei (ANCOVA) Reprezinta un test statisti, utilizat pentru stabilirea semnifiatiei satistie a diferentelor onstatate intre trei sau mai multe esantioane (dependente sau independente), masurate pe o sala ategoriala sau ontinua, normal distribuite si homosedastie. Exemple: utilizarea Internetului (tipuri de abonament) difera in funtie de nivelul de eduatie al persoanelor investigate (gimnazial, lieal, universitar, postuniversitar)? Cum este influentata intentia de umparare pentru un produs, la nivelul unor grupuri distinte, de atre expunerea la instrumente promotionale distinte, in onditiile in are respondentii unosteau deja produsul?

Analiza CoVariatiei (ANCOVA) ANCOVA testeaza in plus (fata de ANOVA) efete ale ovariantei (influenta unor variabile independente suplimentare) variabilei dependente. CoVarianta este utilizata pentru izolarea efetelor altor variabile indepentente (ovariante) asupra variabilei dependente investigate. Variabilele independente suplimentare sunt denumite variabile de ontrol.

Analiza CoVariatiei (ANCOVA) Variabila dependenta este subdivizata in subesantioane (grupuri), de dimensiuni n, n, n. Covariatia totala a subesantioanelor este desompusa in ovariatie interna (in interiorul aestor grupuri) si ovariatie externa (diferenta onstatata intre grupuri).

Analiza CoVariatiei (ANCOVA) Variatia totala: E I T V V V + j j n i ij n i ij T n ) y ( y V j j ) ( ) ( j ij j ij x x y y j n i E V j I V ) )( ( x x y y n j j

Analiza CoVariatiei (ANCOVA) CoVariatia: COV E COV j I n j i x ij n y ij - ( x ij y j i j n j i ij j n j i x ij n n x y j ij n j i ij ) j y ij

Analiza CoVariatiei (ANCOVA) Gradele de libertate asoiate (fieare variabila de ontrol suplimentara due la pierderea unui grad de libertate): variatia interna: n ; variatia externa: ; Coefiientul de determinare (india in e masura variatia din interiorul/exteriorul grupurilor identifiate la nivelul variabilei dependente este expliata de variabila de grupare): externa (intre grupuri): extern interna (in interiorul grupurilor): r COV V V T E E r intern COV V V T I I

Analiza CoVariatiei (ANCOVA) Ipotezele asoiate ANCOVA: NU exista o diferenta semnifiativa statisti intre (mediile) grupurile analizate; grupurile investigate (mediile lor) difera in mod semnifiativ; Ipotezele sunt aeptate sau respinse in funtie de valoarea oefiientului F asoiat ANCOVA: F V ( V (n I E ) )

Analiza CoVariatiei (ANCOVA) Interpretarea testului F se fae la fel a in azul ANOVA, prin identifiarea valorilor tabelate, indexate pe baza probabilitatii de garantare a rezultatelor ( α) si gradele de libertate interne (n ) si externe ( ). Interpretarea teoretia a testului F (ANCOVA): F F t : se aepta ipoteza nula F > F t : se aepta ipoteza alternativa

Analiza CoVariatiei (ANCOVA) Exemplu: Pentru ursul de Analiza Datelor de Marketing utilizand SPSS avem 4 manuale alternative. Pentru a testa are dintre ele este mai util studentilor, am oferit ate un manual fiearei grupe. Am administrat un examen omun, u 5 de inrebari, tuturor elor 4 grupe, iar apoi am prelevat esantioane formate din 0 studenti din fieare grupa, pentru a determina daa exista diferente semnifiative in pregatirea aestora.

Analiza CoVariatiei (ANCOVA) Raspunsuri orete la examen, pe baza unor manuale diferite Nota la SPSS 3 4 5 6 7 8 9 0 Total Medii partiale Grupa 5 4 4 8 8 6 4 9 9 59 5,9 Grupa 3 6 5 6 9 7 9 3 9 79 7,9 Grupa 3 4 6 8 0 8 9 3 0 9 9, Grupa 4 5 6 3 5 9 7 0 8 0 74 7,4 Media generala a raspunsurilor orete: 7,57

Analiza CoVariatiei (ANCOVA) n 4 x 0 40 de observatii V 0, iar r 4 I n j i j (x ij x j ) V E ( x j x ) j 5, 675 54,9 + 86,9 + 66,9 + 6,4 7, F V E (n ) V ( ) I 5,675(40 7,(0 0) ) 0,0648

Analiza CoVariatiei (ANCOVA) F 0,0648 > F t (39,9,α0,05),84 > se aepta ipoteza alternativa (mediile subesantioanelor difera in mod semnifiativ) > dintre ele 4 grupe, exista el putin doua ale aror masteranzi au o pregatire semnifiativ diferita la Analiza Datelor de Marketing Utilizand SPSS (ex.: grupa a raspuns oret, in medie, la 6 intrebari, iar membrii grupei 3 au raspuns oret, in medie, la 9 intrebari). Putem onluziona a ar trebui a, inepand de anul viitor, sa le reomand tuturor studentilor suportul de urs pe are l am reomandat Grupei 3?

Analiza CoVariatiei (ANCOVA) Dupa um stiti, la Marketing Strategi studentii sunt ordonati in diferite grupe in funtie de faultatile absolvite, dei este teoreti posibil a unii dintre ei sa aiba o pregatire anterioare in domeniul analizei datelor, eea e ar afeta auratetea testului efetuat. Pregatirea anterioare poate fi estimata prin intermediul notei la Metode si Modele in Marketing, de pe primul semestru, are presupunea unostinte in aproximativ aelasi domeniu.

Analiza CoVariatiei (ANCOVA) Raspunsuri orete la examen, pentru grupe are s au pregatit u manuale diferite, inluzand nota la Metode si Modele in Marketing. 3 4 5 6 7 8 9 0 Total Medii partiale Grupa SPSS Modelare 5 5 5 4 6 4 7 8 7 8 8 6 8 4 9 9 9 9 0 59 74 5,9 7,4 Grupa SPSS 3 6 5 6 9 7 9 3 9 79 7,9 Modelare 4 4 5 6 6 8 8 9 0 0 70 7 Grupa 3 SPSS 4 6 8 0 8 9 3 0 9 9, Modelare 4 4 6 6 7 8 8 9 0 0 7 7, Grupa 4 SPSS 5 6 3 5 9 7 0 8 0 74 7,4 Modelare 4 5 5 6 6 7 7 9 9 0 68 6,8

Analiza CoVariatiei (ANCOVA) Analiza ovariatiei: n V E (y ij y j (x ) ij x j ) 6 j i V I n ( y j y )( x j x ) 3,3 F j V E ( ) V (n ) I 6 (9 ) 3,3(40 9 ) 3,

Analiza CoVariatiei (ANCOVA) F 3, > F t (39,9,α0,05),84 > se aepta ipoteza nula (mediile subesantioanelor nu difera in mod semnifiativ) > nu exista diferente semnifiative intre ontributiile la pregatirea studentilor a elor 4 manuale utilizate!