ΑΡΙΣΟΣΕΛΕΙΟ ΠΑΝΕΠΙΣΗΜΙΟ ΘΕΑΛΟΝΙΚΗ ΧΟΛΗ ΘΕΣΙΚΩΝ ΕΠΙΣΗΜΩΝ ΣΜΗΜΑ ΜΑΘΗΜΑΣΙΚΩΝ ΣΟΜΕΑ ΣΑΣΙΣΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΙΑΚΗ ΕΡΕΤΝΑ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Πεξηγξαθηθή ζηαηηζηηθή δύν κεηαβιεηώλ Δηζαγσγή ζηε ζεσξία ειέγρσλ ππνζέζεσλ Γνθηκαζία Υ 2 Έιεγρνο αλεμαξηεζίαο Επιμέλεια : Ελεςθεπίος Μ. & Σκοςπκέαρ Αν. Υποσπεωηικό μάθημα 4 ος εξαμήνος 1 Πεξηγξαθηθή ηαηηζηηθή Γύν Μεηαβιεηώλ Ζ ύπαξμε δύν ή πεξηζζνηέξσλ κεηαβιεηώλ ζε κηα έξεπλα, νδεγεί εύινγα ζηελ αλαδήηεζε ηεο (πηζαλήο) κεηαμύ ηνπο ζρέζεο. Δμεηάδεηαη ε ζπκπεξηθνξά ησλ ηηκώλ κηαο κεηαβιεηήο ζε ζρέζε κε ηηο ηηκέο θάπνηαο άιιεο. Ζ επηινγή ηεο ζηαηηζηηθήο ηερληθήο εμαξηάηαη απνθιεηζηηθά από ηε δηάθξηζε ησλ κεηαβιεηώλ ζε πνζνηηθέο ή πνηνηηθέο. Θα αζρνιεζνύκε κε ηελ: πεξηγξαθηθή ζηαηηζηηθή δύν πνηνηηθώλ κεηαβιεηώλ πεξηγξαθηθή ζηαηηζηηθή κηαο πνζνηηθήο κεηαβιεηήο κέζα ζηηο θαηεγνξίεο κηαο πνηνηηθήο-ώλ. 2 1
Πεξηγξαθηθή ζηαηηζηηθή δύν ποιοηικών κεηαβιεηώλ FILE OPEN DATA salary.sav (δεδνκέλα γηα 474 ππαιιήινπο πνπ απνιύζεθαλ από κηα ηξάπεδα κεηαμύ ηνπ 1969 θαη ηνπ 1971) Γηαδηθαζία Crosstabs Analyze Descriptive Statistics Crosstabs Γεκηνπξγεί Ραβδνγξάκκαηα 3 s : Παξαηεξνύκελεο ζπρλόηεηεο (observed) είλαη νη κεηξήζεηο ζε θάζε θειί, ελώ αλακελόκελεο (expected) είλαη ν αξηζκόο ησλ πεξηπηώζεσλ πνπ ζα ήηαλ ζε θάζε θειί αλ νη κεηαβιεηέο πνπ νξίδνπλ ηηο γξακκέο θαη ηηο ζηήιεο ηνπ πίλαθα ζπλάθεηαο είλαη ζηαηηζηηθά αλεμάξηεηεο. Percentages: Σα πνζνζηά ησλ γξακκώλ/ζηειώλ αζξνίδνπλ ζην 100% θαηά κήθνο ηεο θάζε γξακκήο/ζηήιεο ηνπ πίλαθα ζπλάθεηαο, ελώ ηα ζπλνιηθά πνζνζηά αζξνίδνπλ ζην 100% κέζα ζε όια ηα θειηά ηνπ πίλαθα. Residuals: Σα ππόινηπα είλαη νη δηαθνξέο κεηαμύ παξαηεξνύκελσλ θαη αλακελόκελσλ ηηκώλ ηνπ θάζε θειηνύ. 4 2
EMPLOYMENT * SEX OF Crossta bula tion SEX OF EMPLOYMENT CLERICAL MALES FEMALES Total 110 117 227 48.5% 51.5% 100.0% 42.6% 54.2% 47.9% OFFICE TRAINEE 23.2% 24.7% 47.9% 47 89 136 34.6% 65.4% 100.0% 18.2% 41.2% 28.7% SECURITY OFFICER 9.9% 18.8% 28.7% 27 0 27 100.0%.0% 100.0% 10.5%.0% 5.7% COLLEGE TRAINEE 5.7%.0% 5.7% 34 7 41 82.9% 17.1% 100.0% 13.2% 3.2% 8.6% EXEMPT 7.2% 1.5% 8.6% 30 2 32 93.8% 6.3% 100.0% 11.6%.9% 6.8% MBA TRAINEE 6.3%.4% 6.8% 4 1 5 80.0% 20.0% 100.0% 1.6%.5% 1.1% TECHNICAL.8%.2% 1.1% 6 0 6 100.0%.0% 100.0% 2.3%.0% 1.3% Total 1.3%.0% 1.3% 258 216 474 54.4% 45.6% 100.0% 100.0% 100.0% 100.0% 54.4% 45.6% 100.0% 5 Ο πίλαθαο δηαβάδεηαη σο εμήο : Σα κπιε ρξσκαηηζκέλα πνζνζηά δηαβάδνληαη (αζξνίδνληαη) νξηδόληηα. Σα θόθθηλα θαη γαιάδηα ρξσκαηηζκέλα πνζνζηά δηαβάδνληαη (αζξνίδνληαη) θάζεηα. Σα ππνγξακκηζκέλα θαη πλάγια ποζοζηά δηαβάδνληαη (αζξνίδνληαη) θάζεηα θαη νξηδόληηα. Σν 48,5% ησλ ηακηώλ είλαη άλδξεο θαη ην 51,5% γπλαίθεο. (άζξνηζκα 100%). Από ηνπο άλδξεο πνπ απνιύζεθαλ, έρνπκε: 42.6% ηακίεο, 18.2% office-trainee,10.5% security-officer, 13.2% college trainee, 11.6% exempt employee, 1.6% MBA-trainee θαη 2.3 % ηερληθνί. (άζξνηζκα :100%). Από ηο ζύνολο αςηών πος απολύθηκαν, για ηοςρ άνδπερ έσοςμε: 23.2% ηαμίερ, 9.9% office-trainee, 5.7% security-officer, 7.2% college trainee, 6.3% exempt employee, 0.8% MBA-trainee και 1.3 % ηεσνικοί. (άθποιζμα :54,4%, πος είναι και ηο ποζοζηό ηων ανδπών). 6 3
Οκαδνπνηεκέλν Ραβδόγξακκα (Clustered bar chart) Γξαθηθή αλαπαξάζηαζε ησλ απνηειεζκάησλ ηνπ πξνεγνύκελνπ πίλαθα 7 Διέγρνληαο ηα ραξαθηεξηζηηθά ηνπ γξαθήκαηνο Αλαγξαθή ηνπ πιήζνπο ησλ ππνθεηκέλσλ πνπ αλαπαξηζηά θάζε ξάβδνο Chart editor Show Data Labels Data Value Labels, Displayed: 8 4
Αλ ζέινπκε ην ποζοζηό πνπ αληηζηνηρεί ζε θάζε ξάβδν, παξάγνπκε θαηλνύξην ξαβδόγξακκα. Graphs Bar Clustered, Summaries for group of cases επηιέγνπκε επηιέγνπκε 9 Αθνύ αλνίμνπκε ηνλ chart editor επηιέγνπκε σο label: Percent Chart editor Show Data Labels Data Value Labels, Displayed: Percent 5
Percent πζζσξεπκέλν Ραβδόγξακκα (Stacked bar chart) 100,0% 80,0% 24,68% 18,78% 1,48% 0,42% 0,21% SEX OF MALES FEMALES Πώο παξάγνπκε έλα ηέηνην γξάθεκα? Γηα θάζε κία από ηηο θαηεγνξίεο ηνπ επαγγέικαηνο δεκηνπξγείηαη κία ξάβδνο κε κήθνο ην 100% πνζνζηό. 60,0% 40,0% 5,7% 7,17% 6,33% 0,84% 1,27% Οη δηάθνξεο ζηνίβεο κέζα ζηελ θάζε ξάβδν αληηζηνηρνύλ ζην πνζνζηό πνπ έρνπλ ζηε ζπγθεθξηκέλε θαηεγνξία ηνπ επαγγέικαηνο νη θαηεγνξίεο ηνπ θύινπ. 20,0% 0,0% 23,21% 9,92% CLERICAL OFFICE SECURITY COLLEGE EXEMPT MBA TECHNICA TRAINEE OFFICER TRAINEE TRAINEE L EMPLOYMENT Σα ζπκπεξάζκαηα πνπ κπνξνύκε λα βγάινπκε, αθνξνύλ ηελ αλαδήηεζε ηνπ ίδηνπ πξνθίι κέζα ζηηο 7 ξάβδνπο (πνπ ζα ζήκαηλε αλεμαξηεζία) πνπ εδώ δε θαίλεηαη λα ππάξρεη. 11 6
Γύν πνηνηηθέο ζηηο ηάμεηο κηαο 3 εο πνηνηηθήο κεηαβιεηήο Ζ δηαδηθαζία Crosstabs κπνξεί λα ρξεζηκνπνηεζεί θαη γηα πνζνηηθέο κεηαβιεηέο, αξθεί νη ηηκέο απηώλ λα έρνπλ θσδηθνπνηεζεί ζε δηαζηήκαηα ηηκώλ (Transform Recode.). To SPSS παξέρεη κε ηε βνήζεηα ηεο επηινγήο Layers, ηε δπλαηόηεηα λα νξίζνπκε κία ή πεξηζζόηεξεο πνηνηηθέο κεηαβιεηέο ζαλ κεηαβιεηέο ειέγρνπ ησλ δεηνύκελσλ πηλάθσλ ζπλάθεηαο : αξθεί λα ηε κεηαθηλήζνπκε ζηνλ θαηάινγν Layers. 1 ε πνηνηηθή κεηαβιεηή 2 ε πνηνηηθή κεηαβιεηή FILE OPEN DATA cats.sav 3 ε πνηνηηθή κεηαβιεηή (layer) Πίλαθαο ζπλάθεηαο κε layer Layer Οη 2 πνηνηηθέο κεηαβιεηέο Ζ ζηαηηζηηθή αλάιπζε ησλ δύν κεηαβιεηώλ γίλεηαη γηα θάζε ζηξώκα (θαηεγνξία) ηεο κεηαβιεηήο ειέγρνπ (Layer). 7
Ραβδνγξάκκαηα ηεο Crosstabs κε layers Γηα θάζε θατεγορία τες layer ποηοτηθής κεταβιετής σχεκατίδεταη έλα clustered γράυεκα Σν κόλν ζπκπέξαζκα αθνξά ηε ζύγθξηζε ηνπ κήθνπο ησλ ξάβδσλ κέζα ζηελ θάζε νκάδα. Πώο ηα παξάγνπκε 16 8
Γηπιό αξηζηεξό θιίθ ζην γξάθεκα γηα λα αλνίμεη ν chart editor. Edit Properties Variables ηελ θαξηέια Variables: Αιιάδσ ηα ραξαθηεξηζηηθά x-axis θαη x-cluster ζηηο δύν κεηαβιεηέο. 18 9
Γηαδηθαζία Means (αλάιπζε κέζσλ ηηκώλ) Αλνίγνπκε πάιη ην salary.sav Analyze Compare Means Means Μέζεο ηηκέο ηεο πνζνηηθήο salbeg ζηηο θαηεγνξίεο ηεο πνηνηηθήο sex αιιά & jobcat Δπηπιένλ ζηαηηζηηθά 19 Απνηειέζκαηα ηεο δηαδηθαζίαο Means Μνλαδηθό layer : employment category Γύν layers: employment category & sex 20 10
Σξόπνη γξαθηθήο αλαπαξάζηαζεο ησλ απνηειεζκάησλ ηεο δηαδηθαζίαο MEANS (έλα Layer) Graphs Bar Charts Simple 21 Σξόπνη γξαθηθήο αλαπαξάζηαζεο ησλ απνηειεζκάησλ ηεο δηαδηθαζίαο MEANS (δύν Layers) Graphs Bar Charts Clustered 22 11
Υ 2 test αλεμαξηεζίαο: ζρέζε 2 πνηνηηθώλ κεηαβιεηώλ ΣΟ ΣΔΣ ΑΤΣO ΔΛΔΓΥΔΗ ΣΖΝ ΤΠΑΡΞΖ ΥΔΖ ΜΔΣΑΞΤ ΓΤΟ ΠΟΗΟΣΗΚΩΝ ΜΔΣΑΒΛΖΣΩΝ. Βαζηθά ζηνηρεία ηεο ζεσξίαο ειέγρνπ ππνζέζεσλ Έιεγρνο ππνζέζεσλ: ε ζηαηηζηηθή δηαδηθαζία εμαγσγήο ζπκπεξαζκάησλ γηα ηνλ πιεζπζκό ειέγρνληαο ην δείγκα Αλ νη πξαγκαηηθέο ηηκέο ησλ παξακέηξσλ ηνπ πιεζπζκνύ ηθαλνπνηνύλ ηηο ππνζέζεηο κε βάζε ηα δεδνκέλα ηνπ δείγκαηνο, κπνξνύκε λα πξνρσξήζνπκε ζηε δηαδηθαζία ιήςεο απνθάζεσλ Σηνηρεία ζεσξίαο ειέγρνπ ππνζέζεσλ Οξίδνπκε εθ ησλ πξνηέξσλ 2 ππνζέζεηο Τε κεδεληθή ππόζεζε Η 0 κε ζθνπό λα δηαςεπζηεί Τελ ελαιιαθηηθή ππόζεζε Η 1. Παξαηεξήζεηο Η κεδεληθή ππόζεζε Η 0 δηαηππώλεηαη κε ζθνπό λα ακθηζβεηεζεί. Σπλήζσο, ην αληίζεην ηνπ ζπκπεξάζκαηνο ζην νπνίν επηζπκεί λα θζάζεη ν εξεπλεηήο γίλεηαη κεδεληθή ππόζεζε. Με ην ζηαηηζηηθό έιεγρν είηε απνξξίπηνπκε ηελ Η 0 ή εάλ δελ απνξξηθζεί ΣΟΝΗΕΟΤΜΔ όηη ηα δεδνκέλα ζηα νπνία ζηεξίδεηαη ν ζηαηηζηηθόο έιεγρνο δελ επαξθνύλ γηα ηελ απόξξηςε ηεο αξρηθήο ππόζεζεο. Εάλ απνξξίςνπκε ηελ Η 0, ηα δεδνκέλα δελ επαιεζεύνπλ ηελ αξρηθή ππόζεζε θαη είλαη ζπκβαηά κε ηελ ελαιιαθηηθή ππόζεζε Η 1. 12
Σηνηρεία ζεσξίαο ειέγρνπ ππνζέζεσλ Οη ππνζέζεηο Η 0, Η 1 δηαηππώλνληαη κε ηε βνήζεηα ησλ ζηαηηζηηθώλ παξακέηξσλ ηνπ κνληέινπ πνπ πηνζεηείηαη γηα ηελ αλάιπζε ησλ δεδνκέλσλ. Ζ 0 : ζ = ζ 0 Ζ 1 : ζ ζ 0 (ακθίπιεπξνο ζηαηηζηηθόο έιεγρνο) ή ζ > ζ 0 (ζ < ζ 0 ) (κνλόπιεπξνο ζηαηηζηηθόο έιεγρνο) Οξίδεηαη ε ζηαηηζηηθή ζπλάξηεζε ηνπ ειέγρνπ από ην δείγκα. θάικα ηύπνπ Ι (type I error) : ε απόξξηςε ηεο κεδεληθήο ππόζεζεο Η 0, ελώ είλαη ζσζηή = a = P(απόξξηςε ηεο Η 0 / ε Η 0 είλαη αιεζήο) πόζν ιάζνο θάλσ αλ απνξξίςσ ηελ Ζ 0 θάικα ηύπνπ ΙI (type II error) : ε απνδνρή ηεο κεδεληθήο ππόζεζεο Η 0, ελώ είλαη ιάζνο = β = P(απνδνρή ηεο Η 0 / ε Η 0 είλαη ςεπδήο) πόζν ιάζνο θάλσ αλ απνξξίςσ ηελ Ζ 1 25 Σηνηρεία ζεσξίαο ειέγρνπ ππνζέζεσλ φύση (πραγματικότη τα) στατιστικός (συμπέρασμα) Αληθεύει η Η 0 Αληθεύει η Η 1 ΑΠΟΔΟΧΗ της Η 0 p=1-a σφάλμα τύπου ΙΙ ΑΠΟΡΡΙΨΗ της Η 0 σφάλμα τύπου Ι p=1-β = γ α, β όζν ην δπλαηό κηθξόηεξα Όηαλ ε Η 0 αιεζεύεη θαη ν ζηαηηζηηθόο απνδερζεί ηελ Η 0 δε γίλεηαη ζθάικα, ελώ αλ ν ζηαηηζηηθόο απνξξίςεη ηελ Η 0 ηόηε γίλεηαη ζθάικα ηύπνπ Ι. Όηαλ αιεζεύεη ε ελαιιαθηηθή ππόζεζε Η 1 θαη ν ζηαηηζηηθόο απνδερζεί ηελ Η 0 γίλεηαη ζθάικα ηύπνπ ΙΙ, ελώ αλ απνξξίςεη ηελ Η 0 δε γίλεηαη ζθάικα. Τα δύν ζθάικαηα είλαη ηπραία ελδερόκελα. Η πηζαλόηεηα a ηνπ ζθάικαηνο ηύπνπ Ι νλνκάδεηαη επίπεδν ζεκαληηθόηεηαο ηνπ ζηαηηζηηθνύ ειέγρνπ. 26 13
Υ 2 test αλεμαξηεζίαο: ζρέζε 2 πνηνηηθώλ κεηαβιεηώλ Ζ 0 : Σα δύν ραξαθηεξηζηηθά είλαη αλεμάξηεηα Ζ 1 : Σα δύν ραξαθηεξηζηηθά είλαη εμαξηεκέλα ΠΡΟΫΠΟΘΔΔΗ γηα ηελ εθαξκνγή ηνπ ειέγρνπ: 1) Θ ij >= 5 Γειαδή νη αλακελόκελεο (expected) παξαηεξήζεηο ζε θάζε θειί ηνπ πίλαθα ζπλάθεηαο λα είλαη ηνπιάρηζηνλ 5 ή ην πνιύ 20% ησλ ζ ij <= 5. 2) Σν θάζε άηνκν λα εκθαλίδεηαη κόλν κηα θνξά ζε θάζε θειί, δειαδή λα κελ ππάξρεη επηθάιπςε ζηηο θαηεγνξίεο. 27 Υ 2 test αλεμαξηεζίαο (από crosstabs) Αλνίμηε ην αξρείν Gss Analyze Descriptives Statistics Crosstabs 14
Υ 2 test αλεμαξηεζίαο (από crosstabs) RS Highest Degree Total RS Highest Degree * Is life exciting or dull Crosstabulation Less than HS High school Junior college Bachelor Graduate Expected Expected Expected Expected Expected Expected Is life exciting or dull Dull Routine Exciting Total 24 96 66 186 12,0 85,8 88,2 186,0 35 251 231 517 33,3 238,5 245,3 517,0 2 33 27 62 4,0 28,6 29,4 62,0 2 58 97 157 10,1 72,4 74,5 157,0 1 21 51 73 4,7 33,7 34,6 73,0 64 459 472 995 64,0 459,0 472,0 995,0 Διέγρνπκε ηηο πξνϋπνζέζεηο γηα ην ρ 2 ηεζη. ε 2 θειηά έρνπκε: Θij<5. Σν ζπλνιηθό πνζνζηό ηνπο είλαη κηθξόηεξν ηνπ 20% θαη άξα ηθαλνπνηνύληαη νη πξνϋπνζέζεηο γηα ην ρ 2 ηεζη. Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (2-sided) 53,962 a 8,000 55,874 8,000 47,633 1,000 995 a. 2 cells (13,3%) have expected count less than 5. The minimum expected count is 3,99. Sig<0.05 => Απνξξίπηεηαη ε Ζo Γειαδή δελ είλαη αλεμάξηεηεο νη κεηαβιεηέο. Γνθηκάζηε ηώξα κόλνη ζαο : ΑΚΖΖ 3 users.auth.gr/askourke 30 15