ΑΡΙΣΟΣΕΛΕΙΟ ΠΑΝΕΠΙΣΗΜΙΟ ΘΕΑΛΟΝΙΚΗ ΧΟΛΗ ΘΕΣΙΚΩΝ ΕΠΙΣΗΜΩΝ ΣΜΗΜΑ ΜΑΘΗΜΑΣΙΚΩΝ ΣΟΜΕΑ ΣΑΣΙΣΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΙΑΚΗ ΕΡΕΤΝΑ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Με παξακεηξηθνί Έιεγρνη Υπνζέζεωλ γηα έλα δείγκα Έιεγρνο Υπόζεζεο γηα ηε κέζε ηηκή πιεζπζκνύ 4 ε δηάιεμε Επιμέλεια: Ελεςθεπίος Μ. & Σκοςπκέαρ Αν. Υποσπεωτικό μάθημα 4 ος εξαμήνος 1 Με παξακεηξηθά ηεζη Έιεγρνο ηπραηόηεηαο (Κξηηήξην Ρνώλ) Binomial test Kolmogorov-Smirnov test πξνζαξκνγήο ζε θαηαλνκή (γηα έλα δείγκα) Παξακεηξηθά ηεζη Tests θαλνληθόηεηαο Σ-test γηα έλα δείγκα 1
Πιενλεθηήκαηα Δελ απαηηνύλ ππνζέζεηο γηα ηνπο πιεζπζκνύο από ηνπο νπνίνπο πξνέξρνληαη ηα δείγκαηα θαη ηα κεγέζε ηνπο. Δελ απαηηνύλ δει θαλνληθόηεηα ή νπνηαδήπνηε άιιε θαηαλνκή. πλεπώο εθαξκόδνληαη πάληα. Μεηνλεθηήκαηα Μεγαιύηεξν ζθάικα ηύπνπ β ζε ζρέζε κε ηα παξακεηξηθά (όπνπ ππάξρεη ε πξνϋπόζεζε ηεο θαλνληθόηεηαο). πλεπώο είλαη ιηγόηεξν αμηόπηζηα από ηα παξακεηξηθά. Ειέγρεη αλ ππάξρεη θάπνην ζπγθεθξηκέλν κνηίβν (pattern) ζηνλ ηξόπν πνπ εκθαλίδνληαη ηα δεδνκέλα ζην αξρείν. πγθεθξηκέλα ειέγρεη ηελ ππόζεζε Η 0 : Σν δείγκα είλαη ηπραίν Η 1 : Σν δείγκα δελ είλαη ηπραίν (ππάξρεη pattern). FILE OPEN DATA gss.sav Test Ρνώλ Analyze Nonparametric Tests Runs 2
Εθαξκόδεηαη : είηε ζε κηα πνηνηηθή κεηαβιεηή κε 2 θαηεγνξίεο είηε ζε κηα πνζνηηθή πνπ «θόβεηαη» ζε δύν θαηεγνξίεο κε βάζε θάπνην κέηξν ζέζεο (π.ρ. ηε δηάκεζν). εκείν απνθνπήο: δηάκεζνο p-value < 0.05 Απνξξίπηνπκε ηελ H 0 άξα ην δείγκα δελ είλαη ηπραίν Εθαξκόδεηαη ζε πνζνηηθέο κεηαβιεηέο Ειέγρεη αλ ε παξαηεξνύκελε ζπλάξηεζε αζξνηζηηθήο θαηαλνκήο κηαο κεηαβιεηήο, ζπκπίπηεη κε θάπνηα εθ ησλ γλσζηώλ ζεσξεηηθώλ F 0 (x). Δειαδή: Η 0 : F(x)=F 0 (x) H 1 : F(x) F 0 (x) ΠΑΡΑΔΕΙΓΜΑ Αθνινπζεί ε ειηθία ησλ εξσηώκελσλ νκνηόκνξθε θαηαλνκή; Μήπσο θαλνληθή; 3
Analyze Nonparametric Tests 1-Sample K-S p-value < 0.05. Απνξξίπηεηαη ε κεδεληθή ππόζεζε, δειαδή ππνζέηνπκε όηη ην δείγκα δελ πξνέξρεηαη νύηε από θαλνληθή νύηε από νκνηόκνξθε θαηαλνκή ΠΡΟΟΧΗ: Σν Κ-S ΔΕΝ είλαη αμηόπηζην γηα πνιιέο παξαηεξήζεηο. Εηδηθά ζε κεγάια δείγκαηα δίλεη όηη ηα δεδνκέλα ΔΕΝ αθνινπζνύλ θαλνληθή γηαηί ην ζθάικα ηύπνπ ΙΙ γίλεηαη πνιύ κεγάιν. Γηα απηό ζε πεξηπηώζεηο όπνπ n>30 ζπρλά επηθαινύκαζηε ην Κ.Ο.Θ θαη ππνζέηνπκε θαηεπζείαλ θαλνληθόηεηα. Σν K-S καο νδεγεί λα απνξξίςνπκε ηελ θαλνληθόηεηα, ελώ γξαθηθά παξαηεξνύκε όηη έρνπκε κηα θαιή πξνζέγγηζε απηήο 4
Εθαξκόδεηαη : είηε ζε κηα πνηνηηθή κεηαβιεηή κε 2 θαηεγνξίεο είηε ζε κηα πνηνηηθή κεηαβιεηή κε πεξηζζόηεξεο θαηεγνξίεο όπνπ επηιέγεηαη κηα ηηκή (cut point) πνπ ζα ηελ δηρνηνκήζεη. είηε ζε κηα πνζνηηθή πνπ δηρνηνκείηαη ζε δύν θαηεγνξίεο κε βάζε θάπνην κέηξν ζέζεο (π.ρ. ηε δηάκεζν). Ειέγρεη αλ ην πνζνζηό κηαο θαηεγνξίαο είλαη ίζν κε ην πνζνζηό ηεο άιιεο. Δειαδή: Η 0 : p=p 0 H 1 : p > p 0 ή p < p 0 (αλάινγα). ΠΑΡΑΔΕΙΓΜΑ Είλαη ην πνζνζηό ησλ αληξώλ ίζν 48% ; Analyze Nonparametric Tests Binomial Ο έιεγρνο πνπ γίλεηαη αλαθέξεηαη ζηελ πξώηε θαηεγνξία ηεο κεηαβιεηήο, δει. ζε απηήλ πνπ έρνπκε δώζεη ην κηθξόηεξν λνύκεξν ζηελ θσδηθνπνίεζε (εδώ άλδξεο = 1, γπλαίθεο = 2) < ` p 0 = πνζνζηό ειέγρνπ p-value < 0.05 Απνξξίπηνπκε ηελ H 0 θαη δερόκαζηε όηη ην πνζνζηό είλαη κηθξόηεξν Η 1 :p<p 0, γηαηί 0.43<0.48. 5
Έιεγρνη βαζηζκέλνη ζηελ πεξηγξαθηθή ζηαηηζηηθή (ρξήζε ηνπ ζπληειεζηή ινμόηεηαο) ηαηηζηηθνί έιεγρνη (Κ-S θαη Shapiro-Wilk) Οπηηθνί έιεγρνη (QQ-plots) Έιεγρνο θαλνληθόηεηαο Explore Explore Analyze Descriptive Statistics Explore Δηεμάγεη 2 ειέγρνπο γηα ηελ ππόζεζε ηεο θαλoληθόηεηαο: Σν Kolmogorov-Smirnov Σν Shapiro-Wilk Παξάγεη θαη ην QQ plot 6
ηαηηζηηθνί έιεγρνη p-value < 0.05, νπόηε ππνζέηνπκε όηη δελ ππάξρεη θαλνληθόηεηα. Οπηηθνί έιεγρνη Σν QQ plot ζπγθξίλεη ηα πνζνζηηαία ζεκεία ηεο θαλνληθήο θαηαλνκήο κε ηα αληίζηνηρα ηεο εθάζηνηε ππό έιεγρν θαηαλνκήο Αλ ε θαηαλνκή είλαη πεξίπνπ θαλνληθή ζα πξέπεη ζρεδόλ όια ηα πνζνζηηαία ζεκεία λα θείηνληαη επί ηεο επζείαο y=x. Εδώ νη απνθιίζεηο είλαη ζνβαξέο. Έιεγρνη πεξηγξ. ζηαηηζηηθήο ινμόηεηα standard error ινμόηεηαο Αλ ην πειίθν 2,2 ηόηε εθηηκνύκε όηη έρνπκε θαλνληθή θαηαλνκή 0.5/0.063 = 7.94, νπόηε εθηηκνύκε όηη δελ έρνπκε θαλνληθόηεηα Ο ίδηνο έιεγρνο κπνξεί λα γίλεη ειέγρνληαο ηελ ηηκή ησλ πειίθσλ ηεο θύξησζεο ή ηεο κέζεο ηηκήο δηά ησλ αληίζηνηρσλ ηππηθώλ ζθαικάησλ ηνπο 7
Εθαξκόδεηαη ε κηα κεηαβιεηή όηαλ απηή αθνινπζεί θαλνληθή θαηαλνκή ηόρνο Να ειέγμεη αλ ε κέζε ηηκή ηνπ πιεζπζκνύ σο πξνο ηε ζπγθεθξηκέλε κεηαβιεηή είλαη ίζε κε κηα πξνθαζνξηζκέλε ηηκή, δει: Η 0 : κ = κ 0 Η 1 : κ κ 0 (δίπιεπξν ηεζη) Τπνινγίδεηαη από ηα δεδνκέλα ην ζηαηηζηηθό: t x s/ θαη ζπγθξίλεηαη κε ηελ θξίζηκε (ζεσξεηηθή) ηηκή t n-1 (πνπ αληηζηνηρεί ζε όζνπο β.ε. ππάξρνπλ ζηα δεδνκέλα). Αλ t > t n-1 ε Η 0 απνξξίπηεηαη. Γεληθά ηα παξακεηξηθά test έρνπλ κεγαιύηεξε ηζρύ (κηθξόηεξν ζθάικα ηύπνπ β θαη γη απηό πξνηηκνύληαη έλαληη ησλ κε- παξακεηξηθώλ. n FILE OPEN DATA country15.sav ΠΑΡΑΔΕΙΓΜΑ Μπνξνύκε λα ππνζέζνπκε κε αζθάιεηα από ην δείγκα καο (country15.sav), όηη ην κέζν πνζνζηό ησλ αζηηθώλ πεξηνρώλ ζε όιεο ηηο ρώξεο (πιεζπζκόο) είλαη 50% ; Αθνινπζεί ε κεηαβιεηή θαλνληθή θαηαλνκή; Analyze Descripive Statistics Explore Αθνινπζεί θαλνληθή θαηαλνκή νπόηε κπνξώ λα εθαξκόζσ Σ test. 8
Σ test Analyze Compare Means One Sample T test 95% δηάζηεκα εκπηζηνζύλεο γηα ηε κ είλαη: (-12.42+50, 11.13+50)= (37.58, 61.13) t x 0 s n ~ t n 1, a 2 n-1 Δεθηή ε Η0: κ=50 Μπνξνύκε λα ππνζέζνπκε κε αζθάιεηα από ην δείγκα καο (country15.sav), όηη ην κέζν πνζνζηό ησλ αζηηθώλ πεξηνρώλ ζε όιεο ηηο ρώξεο (πιεζπζκόο) είλαη μικρότερο από 50%; Επεηδή ε ηηκή ηνπ ζηαηηζηηθνύ t = -0.118 <0 κ-κ 0 <0 Μπνξώ λα ειέγμσ: Η 0 : κ=κ 0, έλαληη ηεο Η 1 : κ<κ 0 (κνλόπιεπξν ηεζη, αληίζηνηρνο έιεγρνο όηαλ t>0) Η ζηάζκε ζεκαληηθόηεηαο ηνπ κνλόπιεπξνπ ζ.ζ. ηεζη είλαη ε ζ.ζ. ηνπ δίπιεπξνπ /2. Δει. 0.908/2 = 0.454 >0.05 Δελ απνξξίπηεηαη ε Η 0, δει. κ=κ 0 9
Δνθηκάζηε ηώξα κόλνη ζαο : ΑΚΗΗ 4 users.auth.gr/askourke 19 10