Μεθοδολογία Έρευνας: Μάθημα 3 ο ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ Δημήτρης Ιωαννίδης Τμήμα Οικονομικών Επιστημών Email: dimioan@uom.gr Εμπιστευτικό Σελίδα 1
Μάθημα 5 ο Ελέγχοντας την Θεωρία ΙΙ: Στατιστικοί Έλεγχοι για τον μέσο ενός πληθυσμού την σύγκριση των μέσων δυο πληθυσμών αλλά και περισσοτέρων. Εμπιστευτικό Σελίδα 2
Περίληψη μαθήματος έλεγχου της ανεξαρτησίας Στο προηγούμενο μάθημα εξετάσαμε τον έλεγχο της ανεξαρτησίας. Πότε δυο μεγέθη είναι ανεξάρτητα; Έτσι: στο 3ο Παράδειγμα (της Πολυδιάστατης Ανάλυσης): Μια έρευνα που έγινε για την ανεργία και το φύλλο των ανέργων έδειξε ότι για τον έλεγχο της υπόθεσης H: Ανεξαρτησία φύλου και ανεργία έναντι της Α: όχι Ανεξαρτησία, απορρίπτουμε την Η σε ε.σ. 0,05 ή και ακόμη 0,001 ή και μικρότερο, επειδή η p-τιμή 0 είναι μικρότερη της 0,05 αλλά και όλων των υπολοίπων. στο 4ο Παράδειγμα: ο βαθμός εξάρτησης μεταξύ κερδών και εξόδων της είναι στατιστικά σημαντικός σε ε.σ. 0,05 επειδή για τον έλεγχο της H: συσχέτιση έναντι της Α: όχι συσχέτιση, ΔΕΧΟΜΑΣΤΕ ΤΗΝ ΕΝΑΛΛΑΚΤΙΚΗ Α. Διατύπωση Υποθέσεων Μια από τις πιο σημαντικές φράσεις που πρέπει να χρησιμοποιείται σε έρευνες αγορών είναι αυτή της Στατιστικής Σημαντικότητας. ΠΑΡΑΔΕΙΓΜΑΤΑ Για παράδειγμα, ο κατασκευαστής κάποιων προϊόντων θέλει να γνωρίζει αν τα μέτρα βελτίωσης που έλαβε για την παραγωγή τους ελάττωσαν σημαντικά το μέσο ποσοστό των ελαττωματικών προϊόντων. Το διευθύνων στέλεχος υγείας αν είναι σε θέση να εξηγήσει ότι ο μέσος χρόνος αναμονής των ασθενών για εγχείρηση έχει στατιστικά σημαντικά Εμπιστευτικό Σελίδα 3
μειωθεί. Από τα ιστορικά στοιχεία που διαθέτει μπορεί να υποθέσει ότι είναι άνω των 35 ημερών, ή κάτω ή απλά διάφορο του 35. Αν μ συμβολίζει τον μέσο χρόνο, τότε μπορούμε και γράφουμε μ>35 ή μ<35 ή μ 35, αντίστοιχα. Επίσης, αν είναι στατιστικά σημαντικά μεγαλύτερη η μέση κατανάλωση για ένα απορρυπαντικό από κάποιο άλλο κτλ. Αν με μ1, μ2, συμβολίσουμε τις μέσες καταναλώσεις, αντίστοιχα μπορούμε να υποθέσουμε μ1= μ2 ή μ1> μ2ή μ1< μ2 ή μ1 μ2 Το δείγμα που έχουμε σε κάθε έρευνα αποτελεί τη βάση στο να υποστηριχθεί ή όχι η Θεωρία μας, δηλ. η υπόθεση. Όταν λαμβάνουμε μετρήσεις από τον πληθυσμό μας δημιουργούμε δείγματα από τα οποία υπολογίζαμε, αριθμητικό μέσο, διάμεσο κτλ, με μια λέξη στατιστικές. Μας ενδιαφέρει κύρια ο Αριθμητικός Μέσος Αν μπορούσαμε να πάρουμε μετρήσεις σε όλο τον πληθυσμό μας τότε θα λέγαμε ότι έχουμε παραμέτρους. Το τελευταίο σχεδόν δεν γίνεται ποτέ, αλλά οι στατιστικές λέμε ότι μπορούν να αντικαταστήσουν τις παραμέτρους, καθιστώντας αυτές γνωστές. (πρόβλεψη ψήφων-αποτελέσματα εκλογών). Από έναν πληθυσμό (μεγάλο) μπορούμε να πάρουμε «άπειρα» δείγματα τα οποία διαφέρουν μεταξύ τους, και θα δίνουν υπολογιστικά διαφορετικές τιμές Αριθμητικών Μέσων, η οποία διαφορετικότατα δίνεται από το Στατιστικό σφάλμα (Standard Error-SE). Αν με μ συμβολίσουμε τον μέσο του πληθυσμού μας ή του χαρακτηριστικού μας, τότε είναι σημαντικό να γνωρίζουμε αν ο Εμπιστευτικό Σελίδα 4
Αριθμητικός Μέσος ή ο Δειγματικός μέσος ( X ) παίρνει τιμές κοντά στο μ, αριστερά του ή δεξιά του. Λέμε ότι οι τιμές του ( X ) αποκλίνουν σ με ένα τυπικό σφάλμα n από το μ, όπου σ η τυπική απόκλιση στον πληθυσμό και n το μέγεθος του δείγματος. Συνήθως, το σ είναι άγνωστο οπότε αντικαθίσταται από την εμπειρική διακύμανση (S), που είναι η τετραγωνική ρίζα της δειγματικής διακύμανσης. Ι. ΕΛΕΓΧΟΣ ΤΟΥ ΜΕΣΟΥ ΣΕ ΕΝΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟ Ο συνηθισμένος τρόπος για να ελέγξουμε αν ο πληθυσμιακός μέσος, μ, δεν διαφέρει στατιστικά σημαντικά από μια ενδεχομένη μ 0 τιμή. Άρα πρέπει να μετρήσουμε την διάφορα του δειγματοληπτικού μέσου από την τιμή του μ που συζητάμε. Καταρχήν, δημιουργούμε την: Εμπιστευτικό Σελίδα 5
Μηδενική υπόθεση, που συμβολίζεται με H ή Η 0, και εκφράζει την υπάρχουσα κατάσταση δηλ. ότι μ=μ 0, κάθε τι το διαφορετικό και εκφράζεται μέσω της εναλλακτικής, και συμβολίζεται με Α ή Η 1. Κανόνας απόφασης Αν Τ ή Ζ = (ΜΕΣΟΣ ΕΜΠΕΙΡΙΑΣ - ΘΕΩΡΗΤΙΚΟ ΜΕΣΟ όταν ισχύει η μηδενική υπόθεση) / Στατιστικό σφάλμα = nx ( μο) σ, λαμβάνει μικρή τιμή για το δείγμα μας και το μ 0 τότε αποδεχόμαστε την Η, αν μεγάλη αποδεχόμαστε την Α. ΠΩΣ καθορίζεται το μικρό ή το μεγάλο? Ι. Από τον τύπο της κατανομής της παραπάνω ποσότητας, που είναι τύπου Κανονικής. Αν έχω μικρό δείγμα προϋπόθεση ο πληθυσμός μου να είναι κανονικός, κάτι που το διαπιστώνουμε με έλεγχο Κανονικότητας και ενδεδειγμένος συμβολισμός είναι το Τ. Αν έχω μεγάλο δείγμα η προϋπόθεση ο πληθυσμός μου να είναι κανονικός, δεν είναι απαραίτητος και ενδεδειγμένος συμβολισμός είναι το Ζ. Εμπιστευτικό Σελίδα 6
Συνήθως, συγκρίνουμε την παραπάνω ποσότητα με 2 αν θέλουμε να έχουμε σφάλμα τύπου ίσον με 0,05. Τι είναι το 2? Οι τιμές της Ζ ή της Τ μεταβλητής μου συγκεντρώνονται με τον επόμενο τρόπο: Εικόνα 1: Σύγκριση των τιμών της Ζ ή της Τ μεταβλητής (δύο εναλλακτικές) Την σταθερά c1 στο επόμενο σχήμα ονομάζουμε κρίσιμη σταθερά. Εμπιστευτικό Σελίδα 7
Εικόνα 2: Η σταθερά c1 (κρίσιμη σταθερά) Στην περίπτωση με το Case Study 1, αν θεωρήσουμε το χαρακτηριστικό «Πώληση» (SALE) και θέλουμε να ελέγξουμε αν η μέση του τιμή είναι το 60, δηλ. H: μ=60 έναντι της Α : μ 60 σε επίπεδο σημαντικότητας 0,05, τότε έχουμε ότι: One-Sample Statistics N Mean Std. Std. Error Deviation Mean Amount of last 70 sale 55,4500 103,93940 12,42313 Εμπιστευτικό Σελίδα 8
H : μ=60 % Πώληση(Sale) 55,45 60 64,55 Τ ή Z 0 55,45-60 Z= -0,363 104 / 69 Σφ.Τυπ. Ι, 2Χ0,3575 =0,71 Z = x - μ s / n Z= 0,363 Εικόνα 3: Case study 1 έλεγχος αν η μέση τιμή είναι 60 Αν Z ή Τ κατά απόλυτη τιμή μεγαλύτερο του 2 θα πηγαίνω στην εναλλακτική. Εικόνα 4: Αν Ζ ή Τ μεγαλύτερο του 2 εναλλακτική λύση ΟΛΑ ΤΑ ΠΑΡΑΠΑΝΩ ΕΙΝΑΙ ΑΡΚΕΤΑ ΔΥΣΚΟΛΑ για αυτό προχωράμε με άλλο τρόπο. Αναλυτικά όλοι οι έλεγχοι τους δίνουν στο αρχείο Στατιστικοί Έλεγχου (pdf). Γενικά κατά την διαδικασία του ελέγχου υποθέσεων έχουμε τα εξής σφάλματα: Εμπιστευτικό Σελίδα 9
Πίνακας 1: Σφάλματα κατά την διαδικασία ελέγχου υποθέσεων Αληθής H Αληθής Α Αποφασίζω για H σωστά Σφάλμα τύπου II (Beta) Αποφασίζω για Α Σφάλμα τύπου I, (alfa) σωστά Εμπιστευτικό Σελίδα 10
Εικόνα 5: Σφάλματα κατά την διαδικασία ελέγχου υποθέσεων Η πιθανότητα να συμβεί το σφάλμα τύπου I είναι το επίπεδο σημαντικότητας (a) που θέλουμε να είναι πολύ μικρή 0,05 ή 0,01 ή 0,1 κτλ., ενώ το II όσο γίνεται με μικρότερη πιθανότητα. p-τιμή = το μικρότερο παρατηρούμενο επίπεδο σημαντικότητας. Εμπιστευτικό Σελίδα 11
Αποδέχομαι την H αν p-τιμή > a. Απορρίπτουμε την H αν p-τιμή < a. ΤΙ ΑΠΟΦΑΣΙΖΟΥΜΕ ΜΕ ΒΑΣΕΙ ΤΑ ΠΑΡΑΠΑΝΩ και το ερώτημα μας στο αρχείο Contact? Από το SPSS έχουμε ότι significance =0,715, άρα κρατώ την Η. Εμπιστευτικό Σελίδα 12
Εμπιστευτικό Σελίδα 13
ΠΟΤΕ και κάτω από ποιες συνθήκες αποδεχόμαστε την Η; Βασική προϋπόθεση θα είναι ότι οι μετρήσεις μας είναι από Κανονικό πληθυσμό αν το δείγμα μικρό. Πρακτικά σημαίνει ότι όλες οι μετρήσεις σχηματίζουν συμμετρικό Ιστόγραμμα. Αν δεν συμβαίνει το τελευταίο τότε απαιτούμε να έχουμε μεγάλα δείγματα. Για την διατήρηση της H.(αποδοχή της) ή την απόρριψη της στηριζόμαστε στην εξής Στατιστική ελέγχου t = (δειγματοληπτικός μέσος-θεωρητικός μέσος) / τυπικό σφάλμα Αν η τιμή αυτή είναι μεγαλύτερη από κάποια t-τιμή (κρίσιμη τιμή) τότε αυτό μας οδηγεί στην αποδοχή της εναλλακτικής. ΠΑΡΑΔΕΙΓΜΑΤΑ Παράδειγμα 1.1: Σ ένα εργοστάσιο εμφιάλωσης ποτών όπου παρατηρήθηκε ότι η ποσότητα X του ποτού σε κάθε φιάλη ακολουθεί την κανονική κατανομή N(500, 1,5 2 ) λαμβάνεται ένα δείγμα μεγέθους n=25 με X = 499,28 (cm 3 ). Να ελεγχθεί η υπόθεση H: μ = 500 cm 3 έναντι α) της A1 : μ 500 cm 3, για την οποία υπόθεση θα ενδιαφέρονται περισσότερο ελεγκτές από το κράτος. β) της A2 : μ>500 cm 3, για την οποία υπόθεση θα ενδιαφέρονται περισσότερο οι ιδιοκτήτες του εργοστασίου. γ) της A3 : μ<500 cm 3, για την οποία υπόθεση Εμπιστευτικό Σελίδα 14
Λύση: θα ενδιαφέρονται περισσότερο οι καταναλωτές. 1. Σαν επίπεδο σημαντικότητας επιλέγουμε α = 0,01 2. ( 8 500) 25 499,2 z = = 2,4 1,5 3. α) H κρίσιμη περιοχή σύμφωνα με το βήμα τρία είναι (, 2,576) ( 2,576, + ) c = και απεικονίζεται με το γραμμοσκιασμένο μέρος στο επόμενο σχήμα (α). β) H κρίσιμη περιοχή σύμφωνα με το βήμα τρία της δεύτερης περίπτωσης είναι η ( c = 2,326, ) και απεικονίζεται με το γραμμοσκιασμένο μέρος στο επόμενο σχήμα (β). Εμπιστευτικό Σελίδα 15
(α) 0,60 (β) 0,60 0,45 0,45 0,30 0,30 0,15 0,15 0,00 3,50 1,75 0,00 1,75 2,576 2,576 3,50 0,00 3,50 1,75 0,00 1,75 2,326 3,50 Εικόνα 6: Παράδειγμα 1.1 βήμα 3 ο δεύτερης περίπτωσης κρίσιμη περιοχή γ) H κρίσιμη περιοχή σύμφωνα με το βήμα τρία της τρίτης περίπτωσης είναι η (c =, 2,326) και απεικονίζεται με το γραμμοσκιασμένο μέρος. Εμπιστευτικό Σελίδα 16
(γ) 0,60 0,45 0,30 0,15 0,00 3,50 1,75 2,326 0,00 1,75 3,50 Εικόνα 7: Παράδειγμα 1.1 βήμα 3 ο τρίτης περίπτωσης κρίσιμη περιοχή 4. α) Επειδή z = 2,4 δεν ανήκει στο C, δεν απορρίπτουμε την H. β) Επειδή z = 2,4 δεν ανήκει στο C, οι ιδιοκτήτες δεν απορρίπτουν την H. γ) Επειδή z = 2,4 ανήκει στο C, οι καταναλωτές απορρίπτουν την H. 2. Κανονικός πληθυσμός Παράδειγμα 1.2: Μία οινοβιομηχανία διατηρεί το κρασί της σε βαρέλια των 500 lt. Η ποσότητα του κρασιού που περιέχεται στα βαρέλια ακολουθεί την Κανονική Εμπιστευτικό Σελίδα 17
κατανομή με μέσο 470 lt και τυπική απόκλιση 10 lt. Οι υπεύθυνοι της οινοβιομηχανίας υποπτεύονται ότι αφαιρούνται ποσότητες κρασιού από τα βαρέλια. Για να ελέγξουν την άποψή τους (τη θεωρία τους) μετρούν την ποσότητα κρασιού σε πέντε τυχαία επιλεγμένα βαρέλια α) Διατυπώσατε τη μηδενική και την εναλλακτική υπόθεση. β) Η μέση ποσότητα κρασιού στα 5 βαρέλια βρέθηκε να είναι 464 lt. Υπολογίσατε την p-τιμή. γ) Σε ποια από τα παρακάτω επίπεδα σημαντικότητας ισχύει η θεωρία των υπευθύνων της εταιρείας: 10%, 8%, 5%, 2%, 1%. Λύση: α) Η μέση ποσότητα του κρασιού σ όλα τα βαρέλια είναι μ = 470 lt. Σαν μηδενική υπόθεση έχουμε την Η : μ = 470 ( 470) ενώ σαν εναλλακτική την υποψία των υπευθύνων Α: μ < 48. β) Η στατιστική ελέγχου Ζ για τα δεδομένα του προβλήματος γίνεται x μ 0 464 470 Ζ= = = 1,36. σ / n 10/ 5 Με τη βοήθεια πινάκων έχουμε ότι PZ ( 1,36) = 1 PZ ( 1,36) = 0,09 και επειδή PZ ( 1,36) = PZ ( 1,36) = 0,09 το 1,36 αντιστοιχεί στην 0,09 τιμή της Ζ μεταβλητής. γ) Η p-τιμή είναι 0,09 ή 9% που είναι μικρότερη μόνο του 10%. Άρα μόνο σε επίπεδο σημαντικότητας 10% είναι σωστή η θεωρία των υπευθύνων. Εμπιστευτικό Σελίδα 18
Παράδειγμα 1.3: Μια μηχανή γεμίζει κεσεδάκια με βούτυρο. Κάτω από κανονικές συνθήκες το ποσό του βουτύρου που περιέχουν τα κεσεδάκια ακολουθεί την Κανονική κατανομή με μέσο 110 gr και τυπική απόκλιση 1,5 gr. Μερικές φορές η μηχανή δε λειτουργεί σωστά με αποτέλεσμα τα κεσεδάκια να είναι υπέρβαρα ή ελλιπή. Για να ελεγχθούν τα παραπάνω γίνεται κάθε μέρα έλεγχος του βάρους των παραγομένων αντικειμένων επιλέγονται τυχαία 10 κεσεδάκια από την παραγωγή της μέρας και ζυγίζονται. α) Διατυπώσατε τη μηδενική υπόθεση και την εναλλακτική υπόθεση. β) Ελέγξατε σε ε.σ. α = 0,05, θεωρώντας ότι η τυπική απόκλιση παραμένει ίδια. γ) Μια μέρα ο έλεγχος έδωσε x =118 gr. Ποιο είναι το συμπέρασμά σας. Λύση: α) Εδώ είναι H: μ = 110 και Α: μ 110. β) Για τον έλεγχο της Η έναντι της Α σε ε.σ. α = 0,05, η στατιστική μας ελέγχου είναι x 110 Ζ=. 1,5 / 10 Από την Ενότητα 11.2 του βιβλίου έχουμε ότι αποδεχόμαστε την Α σε ε.σ. 0,05 αν Z z 0,025 = 1,96 ή Z z =. Το τελευταίο ισοδυναμεί ότι αποδεχόμαστε την Α σε ε.σ. 0,05 αν 0,025 1,96 1,5 x 110 + 1,96 111 ή 10 1,9 x 110 1,96 109. 10 γ) Φυσικά x =113 μεγαλύτερο του 111 οπότε αποδεχόμαστε την Α. Εμπιστευτικό Σελίδα 19
Ποιοτικός Έλεγχος Πολύ συχνά όταν έχουμε ένα τυχαίο δείγμα από έναν κανονικό πληθυσμό οι έλεγχοι για τη μέση τιμή αυτού είναι χρήσιμοι για ποιοτικούς ελέγχους βιομηχανικών μεθόδων. Το επόμενο παράδειγμα θα μας διαφωτίσει περισσότερο. Πίνακας 2: Μέση τιμή τυχαίου δείγματος από κανονικό πληθυσμό 1 2 3 4 5 6 7 8 9 10 11 12 16,03 15,99 16,01 16,01 15,97 16,10 15,98 16,05 16,00 15,88 15,85 15,80 4 8 6 3 6 4 2 1 3 7 2 3 Στην 11 περίπτωση βρισκόμαστε κάτω από το Κάτω Προειδοποιητικό Όριο, και στη 12 περίπτωση κάτω από το Κάτω Όριο Ελέγχου, οπότε σταματάμε τη βιομηχανική μέθοδο, και διορθώνουμε τις μηχανές. Παράδειγμα 1.4: Σε μια μέθοδο παραγωγής, π.χ. κάποιων αντικειμένων όπου μας ενδιαφέρει το γνώρισμα X, που μπορεί να είναι μήκος, βάρος κ.λπ., θεωρούμε ότι αυτό ακολουθεί τη N(μ, σ 2 ), με σ 2 γνωστό. Κατά τη διάρκεια της παραγωγής, σε τακτά χρονικά διαστήματα δημιουργούμε δείγματα μεγέθους n, με n συνήθως μεταξύ 5 και 10. Με τη βοήθεια αυτών των δειγματοληψιών ελέγχουμε την H: μ = μ 0 έναντι της A: μ μ 0 σε ε.σ. α = 0,01 και α = 0,05. Τότε Αν H απορρίπτεται σε ε.σ. 0,01 σταματάμε την παραγωγή, και διορθώνουμε τις μηχανές. Αν H δεν απορρίπτεται σε ε.σ. 0,01, αλλά απορρίπτεται σε ε.σ. α=0,05, Εμπιστευτικό Σελίδα 20
τότε παίρνουμε ένα νέο δείγμα, που αν δεν απορριφθεί η H σε ε.σ. 0,05, τότε συνεχίζουμε την παραγωγή. Μία γραφική παράσταση της μεθόδου αυτής παρουσιάζεται με τη λεγόμενη κάρτα ελέγχου. H περίοδος αποδοχής της H γίνεται για εκείνα τα x 1,, x n, ώστε. Για α = 0,01 έχουμε τα όρια σ 0 2,58 n σ, μ και μ 0 + 2,58 n που ονομάζονται όρια ελέγχου, ενώ για α = 0,05 έχουμε τα αντίστοιχα σ 0 1,96 n σ, μ και μ 0 + 1,96 n που ονομάζονται προειδοποιητικά όρια ελέγχου. Εμπιστευτικό Σελίδα 21
x δειγματικός μέσος 16,172 Άνω όριο Ελέγχου 16,131 Άνω όριο Προειδοποιητικού Ελέγχου μ 0 =16 15,869 15,828 Kάτω όριο Προειδοποιητικού Ελέγχου Kάτω όριο Ελέγχου 1 2 3 4 5 6 7 8 9 10 11 12 Αριθμός δειγμάτων Εικόνα 8: Προειδοποιητικά όρια ελέγχου Έτσι αν μας ενδιέφερε σαν γνώρισμα των αντικειμένων το μήκος, που πρέπει να είναι ίσο με 16 cm, δηλ. μ=16, και με γνωστή διακύμανση σ 2 = 0,04, ας δημιουργήσουμε 12 δειγματοληψίες μεγέθους 9 από τις οποίες έχουμε τους εξής δειγματικούς μέσους. ΙΙ. Τ- ΕΛΕΓΧΟΣ ΓΙΑ ΤΟΝ ΕΛΕΓΧΟ ΤΗΣ ΔΙΑΦΟΡΑΣ ΔΥΟ ΜΕΣΩΝ με ανεξάρτητα δείγματα. Εμπιστευτικό Σελίδα 22
Μια από τις πιο συχνές και σημαντικές ερωτήσεις σε έρευνες αγοράς είναι αν οι διαφορές μέσων από δύο ομάδες(πληθυσμούς) είναι στατιστικά σημαντικές ή όχι. Οι βασικές προϋποθέσεις που έχουμε είναι : 1. Δυο πληθυσμούς κανονικούς 2. Οι δυο πληθυσμοί έχουν μέσους και διακυμάνσεις. Οι διακυμάνσεις μεταξύ 3. των δυο πληθυσμών μπορεί να είναι ίσες ή άνισες. Ελέγχουμε την H: οι μέσοι 4. είναι ίδιοι έναντι της Α: οι μέσοι είναι διάφοροι. Η βασική ποσότητα που 5. χρησιμοποιείται για τον έλεγχο είναι: t = (διαφορά μεταξύ των μέσων των δυο δειγμάτων) / τυπικό σφάλμα της διαφοράς των μετρήσεων των δυο πληθυσμών. Οι συλλογισμοί για την αποδοχή ή απόρριψη της H είναι ανάλογη όπως στην προηγούμενη περίπτωση. Εμπιστευτικό Σελίδα 23
Εικόνα 9: Καμπύλες μεταβλητότητας Παράδειγμα 2.1: Σε μια μεγάλη επιχείρηση οι νέοι υπάλληλοι συμμετέχουν σε κάποια ταχύρρυθμη εκπαίδευση. Τα έξοδα της επιχείρησης δεν είναι μόνο αυτά που απαιτούνται για την εκπαίδευση, όπως διάθεση κονδυλίων για εκπαιδευτές κ.τ.λ. αλλά και το ότι οι νέοι υπάλληλοι δεν συνεισφέρουν άμεσα σ αυτήν εργασία. Έτσι, ο οργανισμός ενδιαφέρεται για τέτοια προγράμματα εκμάθησης ώστε οι νέοι υπάλληλοι να έχουν το μέγιστο της απόδοσής τους στο συντομότερο χρόνο. Προτείνεται μια νέα μέθοδος εκμάθησης και θέλουμε να τη συγκρίνουμε με την πάγια μέθοδο. Δύο ομάδες από τους εννέα υπαλλήλους εκπαιδεύτηκαν για ένα μήνα, η μια με τη νέα μέθοδο ενώ η άλλη με την παλιά. Στο τέλος, οι επιδόσεις των υπαλλήλων μετρήθηκαν ανάλογα με το χρόνο (σε λεπτά) Εμπιστευτικό Σελίδα 24
που χρειάζονται για τη διεκπεραίωση της δουλειάς τους. Πίνακας 3: Χρόνος διεκπεραίωσης εργασίας Παλιά μέθοδος Νέα μέθοδος 32 44 35 40 37 35 31 27 35 31 29 32 28 34 25 31 41 34 Συνηγορούν οι παραπάνω βαθμολογίες είναι διαφορετικές ; Λύση: Βήμα 1 ο : Ελέγχουμε την H: μ 1 =μ 2 έναντι της A: μ 1 >μ 2 (τρίτη περίπτωση) και επιλέγουμε σαν α=0,05. Εμπιστευτικό Σελίδα 25
Οι δειγματικοί μέσοι και διακυμάνσεις είναι: 2 1 x = 35,22 και s 1 = 195,56. 8 y = 31,56 και Βήμα 2 ο : Άρα για το Βήμα 2ο έχουμε: 35,22 31,56 t = = 1, 64 195,56 + 160,22 9+ 9 2 και επειδή. 1, 76 xα = t n t 1+ n 2 2; α = 16;0,05 = Βήμα 3 ο : Στο Βήμα 3ο έχουμε: μηδενική υπόθεση. 2 1 s 2 = 160,22. 8 t = 1, 64 < t = 1, 76 16; 0,05 ΛΥΣΗ ΜΕ SPSS ΒΑΖΩ ΤΑ ΔΕΔΟΜΕΝΑ ΜΟΥ ΣΕ ΔΥΟ ΣΤΗΛΕΣ του SPSS 32,00 1,00 37,00 1,00 35,00 1,00 28,00 1,00 41,00 1,00 44,00 1,00 35,00 1,00, δηλ. απορρίπτουμε τη Εμπιστευτικό Σελίδα 26
31,00 1,00 34,00 1,00 35,00 2,00 31,00 2,00 29,00 2,00 25,00 2,00 34,00 2,00 40,00 2,00 27,00 2,00 32,00 2,00 31,00 2,00 Εμπιστευτικό Σελίδα 27
Εμπιστευτικό Σελίδα 28
2.1 Έλεγχοι Σύγκρισης των Διακυμάνσεων Δύο Πληθυσμών Παράδειγμα 2.1.1: Το κλείσιμο τιμών δύο κοινών μετοχών σημειώθηκε για 15 ημέρες. Οι δειγματικοί μέσοι και διακυμάνσεις ήταν: x = 37,58 y = 38,24 2 s 1 = 1,54 2 s 2 = 2,96 Παρέχουν τα παραπάνω δεδομένα ένδειξη ότι η μεταβλητότητα είναι μεγαλύτερη στην πρώτη μετοχή; (α = 0,05) Λύση: 2 2 2 2 Ενδιαφερόμαστε για τον έλεγχο της H: σ = σ έναντι της A: σ σ 1 σε επίπεδο σημαντικότητας α = 0,05. Έτσι, για το 2ο βήμα της (γ) περίπτωσης έχουμε, Επίσης, F = F =. n1 1; n2 1;0,05 14,14;0,05 2,46 Οπότε για το 3ο βήμα έχουμε: s 1,54 f = = = 0,52 s 2,96 2 1 2 2 f = 0, 52 < F 2,46 n1 1; n2 1;0,05 =. 2, >, 1 2 και δεν απορρίπτουμε τη μηδενική υπόθεση. H κρίσιμη περιοχή ή η περιοχή απόρριψης της H είναι η c = [2,46, ) και απεικονίζεται με το γραμμοσκιασμένο μέρος του επόμενου σχήματος. Εμπιστευτικό Σελίδα 29
1,500 1,125 0,750 0,375 0,000 0 1 2 3 2,46 4 Εικόνα 10: Κρίσιμη περιοχή Η ΙΙI. Τ- ΕΛΕΓΧΟΣ ΓΙΑ ΤΟΝ ΕΛΕΓΧΟ ΤΗΣ ΔΙΑΦΟΡΑΣ ΔΥΟ ΜΕΣΩΝ με εξαρτημένα δείγματα (ζευγαρωτές παρατηρήσεις). Στα προηγούμενα θεωρήσαμε ότι έχουμε δύο ανεξάρτητα δείγματα από δύο πληθυσμούς. Σε πολλά όμως στατιστικά προβλήματα δημιουργούμε πριν και μετά μετρήσεις για τις ίδιες στατιστικές μονάδες. Για παράδειγμα, θέλοντας να εξετάσουμε την καταναλωτική συμπεριφορά κάποιων ατόμων γι ένα ορισμένο προϊόν, μετρούμε την κατανάλωση των Εμπιστευτικό Σελίδα 30
ατόμων πριν γίνει μια διαφήμιση και μετά. Έτσι εδώ μας ενδιαφέρει η τυχόν αλλαγή που έγινε στον καταναλωτή πριν τη διαφήμιση και μετά απ αυτήν. Αν με X i, i=1,, n μετρούμε την κατανάλωση το i-καταναλωτή πριν τη διαφήμιση και με Y i, i=1,, n μετρούμε την κατανάλωση μετά τη διαφήμιση, τότε οι Di = Xi Y i, i= 1,, n μας δείχνουν τη διαφορά κατανάλωσης στον ίδιο καταναλωτή. (ΑΝΑΛΟΓΟ παράδειγμα με το case study 1) Γενικά για τις ζευγαρωτές παρατηρήσεις επιλέγουμε ένα δείγμα από τον πληθυσμό που θέλουμε να μελετήσουμε. Σε κάθε στατιστική μονάδα του πληθυσμού μας δημιουργούμε δύο μετρήσεις πριν από κάποιο συμβάν και μετά. Έτσι δημιουργούμε σαν δεδομένα τις διαφορές των μετρήσεών μας. Σε ορισμένες περιπτώσεις είναι δυνατόν να έχουμε ζευγαρωτές παρατηρήσεις αν και οι μετρήσεις γίνονται σε διαφορετικές μονάδες, π.χ. περιπτώσεις διδύμων. Έτσι αν θέλουμε να εξετάσουμε την αποτελεσματικότητα δύο μεθόδων διδασκαλίας A και B, και εφαρμόζουμε την A σε μια τάξη μαθητών, ενώ εφαρμόζουμε την B σε μια άλλη τάξη μαθητών όπου κάθε μαθητής σ αυτήν έχει την ίδια ικανότητα προς έναν αντίστοιχο της άλλης τάξης, έχουμε μετρήσεις σε διαφορετικές μονάδες. Εδώ ενδείκνυται η χρήση ζευγαρωτών παρατηρήσεων. Παράδειγμα : Θέλουμε να διαπιστώσουμε κατά πόσο οι άνδρες και οι γυναίκες με την ίδια εκπαίδευση ξεκινούν με τους ίδιους μισθούς στην αγορά εργασίας. Ζευγάρια δημιουργούνται επιλέγοντας έναν άνδρα και μία γυναίκα με την ίδια κατεύθυνση. Λαμβάνουμε ένα δείγμα μεγέθους n=10 και σημειώνουμε τους μισθούς κάθε εργαζομένου. Έτσι είχαμε Ζευγάρι Άνδρας Γυναίκα Διαφορά Εμπιστευτικό Σελίδα 31
(X) (Y) (Άνδρας - Γυναίκα) 1 2.930 2.880 50 2 3.150 3.160 3 3.040 2.980 4 2.850 2.850 5 3.350 3.260 6 2.780 2.800 7 2.950 2.920 8 3.120 3.010 9 2.840 2.820 10 2.920 2.850 Να γίνει ο έλεγχος. Εμπιστευτικό Σελίδα 32
Λύση: Εμπιστευτικό Σελίδα 33
Εμπιστευτικό Σελίδα 34
Εμπιστευτικό Σελίδα 35
Απ όπου συμπεραίνουμε ότι οι μισθοί των ανδρών ξεπερνούν τους μισθούς των γυναικών σε επιπεδο σημαντικότητας 0,05(0,017<0,05). ΙV. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Όταν η εξαγωγή συμπερασμάτων αφορά δυο ομάδες, τότε χρησιμοποιούμε τους t-ελέγχους. Στην περίπτωσή που έχουμε πέραν των δυο ομάδων χρησιμοποιούμε την Ανάλυση Διακύμανσης. 3.1 Μονοπαραγοντική Ανάλυση Διακύμανσης H τεχνική που χρησιμοποιείται για τη σύγκριση των μέσων πολλών πληθυσμών ονομάζεται ανάλυση διακύμανσης, και βασίζεται στη σύγκριση της μεταβλητότητας μεταξύ των πληθυσμών και της μεταβλητότητας στο εσωτερικό των πληθυσμών. Έτσι αν δεχθούμε ότι δεν υπάρχει μεταβλητότητα μεταξύ των πληθυσμών μας αυτό δεν θα συνεπάγεται ότι όλες οι μετρήσεις θα είναι ίδιες, αλλά ενδέχεται να είναι διάφορες λόγω της τυχαίας φύσης των μετρήσεών μας. Το τελευταίο μας οδηγεί στο γεγονός ότι θα υπάρχει μεταβλητότητα στο εσωτερικό του κάθε πληθυσμού μας που μπορεί να εκτιμηθεί. Ανάλογη εκτίμηση μπορούμε να έχουμε για τη μεταβλητότητα ή τη διακύμανση μεταξύ των πληθυσμών μας. Αν οι μεταβλητότητες μεταξύ των πληθυσμών μας και του εσωτερικού τους είναι του αυτού μεγέθους, Εμπιστευτικό Σελίδα 36
τότε συμπεραίνουμε ότι δεν υπάρχει διαφορά μεταξύ των μέσων των πληθυσμών μας. Αν η μεταβλητότητα μεταξύ των πληθυσμών μας είναι μεγαλύτερη από τη μεταβλητότητα στο εσωτερικό των πληθυσμών μας, τότε θα δεχόμαστε ότι οι μέσοι των πληθυσμών μας είναι διάφοροι μεταξύ τους. Στην ανάλυση διακύμανσης θεωρούμε k πληθυσμούς ή ομάδες με άγνωστους μέσους μ1,, μk, που από τον καθένα λαμβάνουμε ανεξάρτητα ένα τυχαίο δείγμα. μ 1 = = μ k H μηδενική υπόθεση είναι H : A: τουλάχιστον μία από τις ισότητες δεν ισχύει., ενώ η εναλλακτική ΠΑΡΑΔΕΙΓΜΑ Παράδειγμα 3.1.1: Τέσσερις ομάδες μαθητών υποβάλλονται σε διαφορετικές μεθόδους διδασκαλίας. Μετά το πέρας της εκπαίδευσης τους υποβλήθηκαν σε εξετάσεις και είχαμε τα εξής αποτελέσματα: Πίνακας 4: Δεδομένα παραδείγματος 3.1.1 Ομάδες (πληθυσμοί) 1 2 3 4 65 75 59 94 87 69 78 89 73 83 67 80 74 81 62 88 81 72 83 69 79 76 Εμπιστευτικό Σελίδα 37
90 O κύριος παράγοντας που επηρεάζει τις επιδόσεις θεωρείται ότι είναι η μέθοδος διδασκαλίας. Καλούμαστε να εξετάσουμε αν οι μέθοδοι διδασκαλίας είναι ισοδύναμες μεταξύ τους, προϋποθέτοντας ότι οι μετρήσεις μας προέρχονται από Κανονικούς πληθυσμούς με μέσους μ 1, μ 2, μ 3 και μ 4 θεωρώντας τις διακυμάνσεις τους άγνωστες και ίσες. 3.2 Διπαραγοντική Ανάλυση Διακύμανσης με μια παρατήρηση ανά γραμμή και στήλη H ανάλυση διακύμανσης μπορεί να χρησιμοποιηθεί και σε περιπτώσεις που ενδιαφερόμαστε να μελετήσουμε τις επιδράσεις δύο ή και περισσοτέρων παραγόντων σε μία μεταβλητή. Για παράδειγμα, στην περίπτωση που ενδιαφερόμαστε για τα αποτελέσματα διαφορετικών πόρων διαφήμισης ανάλογα με τα επίπεδα των εξόδων στις πωλήσεις ενός προϊόντος. Επίσης, να μελετήσουμε τα αποτελέσματα διαφορετικών μεθόδων σε διαφορετικές ημέρες της εβδομάδας. H ανάλυση διακύμανσης που εμπεριέχει δύο παράγοντες, ονομάζεται διπαραγοντική ανάλυση διακύμανσης, και στα προβλήματα που εφαρμόζεται μετρά τις επιδράσεις διαφόρων επιπέδων ενός παράγοντα (ή μεταβλητής) στα επίπεδα ενός άλλου παράγοντα (ή μεταβλητής). Ειδικότερα, αφού επιλέξουμε τα επίπεδα των παραγόντων, μπορούμε να μελετήσουμε τις επιδράσεις κάθε παράγοντα χωριστά, αλλά και των δύο Εμπιστευτικό Σελίδα 38
όταν ενεργούν συγχρόνως. Σ αυτήν την παράγραφο θα θεωρήσουμε πειράματα με δύο παράγοντες, που απλά θα τους κατατάσσουμε σε στήλες (ή ομάδες) και γραμμές (ή μπλόκς ή επίπεδα). Θα υποθέσουμε ότι δεν υπάρχουν αλληλοεπιδράσεις μεταξύ γραμμών και στηλών, δηλ. οι επιδράσεις των γραμμών θα είναι ίδιες για κάθε στήλη και αντίστροφα. Επιπλέον θεωρούμε ότι έχουμε μια παρατήρηση ανά ομάδα και μπλοκ ή ανά στήλη και γραμμή. Ένα παράδειγμα διπαραγοντικής ανάλυσης είναι το επόμενο. ΠΑΡΑΔΕΙΓΜΑ Παράδειγμα 3.2.1: Μία εταιρεία ενδιαφέρεται να μελετήσει τις ικανότητες των πωλητών της A, B, Γ και Δ σε 3 διαφορετικές περιοχές Π 1, Π 2 και Π 3. Οι εβδομαδιαίες πωλήσεις τους ήταν οι εξής: Πίνακας 5: Δεδομένα παραδείγματος 3.2.1 Πωλητές Περιοχή A B Γ Δ Π 1 550 450 700 500 Π 2 300 350 550 400 Εμπιστευτικό Σελίδα 39
Π 3 350 550 400 600 Θέμα: Αρχείο Bakery. Ο σχεδιαστής παραγωγής άρτου πιστεύει ότι το ψωμί του πρώτου τύπου σημειώνει περισσότερες πωλήσεις. Συμμερίζεστε την άποψη του; Λύση: Ας υποθέσουμε ότι ο υπεύθυνος για την παραγωγή άρτων θέλει να γνωρίζει κατά πόσο και οι επτά τύποι ψωμιών πωλούνται εξ ίσου. Στην περίπτωση αυτή η μηδενική είναι H : Οι πωλήσεις είναι εξ ίσου ίσες ενώ η εναλλακτική Α: Οι πωλήσεις δεν είναι εξ ίσου ίσες. Ενδιαφερόμαστε να διαπιστώσουμε αν οι διαφορές στις πωλήσεις οφείλονται στην τύχη ή ο τύπος του ψωμιού κάνει τις πωλήσεις. Τα αποτελέσματα του Excel στο αρχείο Bakery_Anova. 3.3 Συζήτηση για την κατανομή του κανόνα απόφασης μας: γιατί κανονικότητα Κάθε τιμή ενός μέσου θα αποτελεί μια εκτίμηση του θεωρητικού μέσου του πληθυσμού μας, ενώ κάθε τιμή της διακύμανσης μια εκτίμηση της θεωρητικής διακύμανσης του πληθυσμού κτλ. Οι τιμές των δειγματοληπτικών μέσων, που προκύπτουν λόγω των διαφορετικών δειγμάτων, αποτελούν εκτιμήσεις του θεωρητικών μέσου. Ποια από όλες τις τιμές πλησιάζει ή πετυχαίνει ακριβώς τον μέσο; Εμπιστευτικό Σελίδα 40
Μπορούμε να πούμε ότι καμία δεν πετυχαίνει ακριβώς τον μέσο. Η διαφορά της τιμής ενός δειγματοληπτικού μέσου από τον αληθινό μέσο ονομάζεται σφάλμα εκτίμησης. Υπολογίζεται μόνο όταν είναι γνωστός ο μέσος του πληθυσμού. Το μόνο σταθερό σημείο αναφοράς είναι ότι η κατανομή των μέσων είναι κανονική με μέσο, τον μέσο του πληθυσμού και διακύμανση όσο του πληθυσμού αλλά διαιρεμένη με την τετραγωνική ρίζα του μεγέθους του δείγματος μας. Οι κατανομές τους είναι κανονικές, όταν το δείγμα μας είναι πολύ μεγάλο ή όταν οι μετρήσεις προέρχονται από κανονικό πληθυσμό. Κατανομή αρχικού πληθυσμού: Τα διαγράμματα της πρώτης στήλης αφορούν σε κανονικός πληθυσμός, όμοια τα διαγράμματα της δεύτερης στήλης αφορούν ομοιόμορφο πληθυσμό, ενώ η τρίτη στήλη αφορά πληθυσμό που είναι λοξός προς τα δεξιά πληθυσμός. ) Εικόνα 11: Κατανομή μέσου μίας μέτρησης ( X 2 n = 1 Εικόνα 12: Κατανομή μέσου δύο μετρήσεων ( ) X 2 Εμπιστευτικό Σελίδα 41
n = 2 Εικόνα 13: Κατανομή μέσου τριών δύο μετρήσεων ( ) X 3 n = 3 Εικόνα 14: Κατανομή μέσου τεσσάρων μετρήσεων ( ) X 4 n = 4 Εικόνα 15: Κατανομή μέσου δώδεκα μετρήσεων ( ) X 12 n = 12 Εικόνα 16: Γραφική παράσταση μέσου είκοσι ένα μετρήσεων ( ) X 21 n = 21 X n H κατανομή της από τρεις διαφορετικούς πληθυσμούς, όταν το δειγματικό μέγεθος n μεταβάλλεται. Εμπιστευτικό Σελίδα 42
Οι μετρήσεις μας στο δείγμα μπορούν να θεωρηθούν ότι είναι οι τιμές μιας τυχαίας μεταβλητής που περιγράφει ένα τυχαίο πείραμα. Έτσι, ένα απλό τυχαίο δείγμα με n μετρήσεις θεωρείται ότι είναι το αποτέλεσμα από n ανεξάρτητες επαναλήψεις του τυχαίου μας πειράματος με την κατανομή της τυχαίας μεταβλητής να παραμένει ίδια από πείραμα σε πείραμα. Για παράδειγμα, αν Χ η τυχαία μεταβλητή που παριστάνει τον βαθμό ικανοποίησης ενός καταναλωτή για ένα προϊόν από 1 έως 5 της κλίμακα Lickert, τότε η τιμή της Χ εξαρτάται από ποιο άτομο ρωτήσαμε. Η απάντηση της ερώτησης έχει τον ρόλο πλέον του τυχαίου πειράματος και οι απαντήσεις από τα n διαφορετικά άτομα X1, X2,, Xn στην ουσία σημαίνει n επαναλήψεις του πειράματος, με βαθμολογίες, του 1ου, 2ου, και toy n ου X, X,, Xn 1 2 ερωτώμενου ατόμου. Η αθροιστική συμπεριφορά των X παίζουν σπουδαίο ρόλο στην στατιστική. i= 1, n X i αλλά και του δειγματικού(αριθμητικού) μέσου Αν με μ συμβολίσουμε τον μέσο του πληθυσμού μας, τότε είναι σημαντικό να γνωρίζουμε αν ο X παίρνει τιμές κοντά στο μ, αριστερά του ή δεξιά του. Λέμε ότι ότι οι τιμές του X αποκλίνουν με ένα τυπικό σφάλμα n από το μ, όπου σ η τυπική απόκλιση στον πληθυσμό και n το μέγεθος του δείγματος. Αν σ άγνωστο τότε αντικαθίσταται από την S, που είναι η τετραγωνική ρίζα της δειγματικής διακύμανσης. Για παράδειγμα, αν σε μια έρευνα μας, επισκεφτούμε ένα εμπορικό κέντρο και αποφασίσουμε να ρωτήσουμε τυχαία X1, X2,, X12 12 καταναλωτές, τότε αν είναι οι απαντήσεις από τους 12 καταναλωτές, και ενδεχομένως μετά την πραγματοποίηση των 12 πειραμάτων να παίρνανε τις τιμές, 4, 5, 4, 4, 4, 3, 3, 1, 4, 3, 5, και 5 αντίστοιχα. Στο παρακάτω σχήμα φαίνεται ότι το πρώτο άτομο βαθμολογεί με 4. Μετά την ολοκλήρωση των απαντήσεων από τα 12 άτομα έχουμε ότι το άθροισμα των βαθμολογιών από τα 12 άτομα είναι το 45, ενώ η τιμή του δειγματικού μέσου είναι το 3,75. Επίσης στο σχήμα θεωρείται ότι ο μέσος του πληθυσμού είναι το 3,72, δηλ. αν ο διαθέσιμος πληθυσμός την ώρα που κάναμε την δειγματοληψία ήταν 100 καταναλωτές και τους ρωτούσαμε όλους θα έπρεπε να έχουμε άθροισμα βαθμολογιών από τους καταναλωτές ίσο με 372. Επί πλέον το τυπικό σφάλμα S 0,138 0,328 υπολογίζεται ότι είναι n = 12 = και η εκτίμηση μας 3,75 είναι μέσα στο εύρος ενός τυπικού σφάλματος ( 3,75 3,72 = 0,03 < 0,328). σ Εμπιστευτικό Σελίδα 43
Μεταβλητή 1 2 3 4 5 απάντηση Στατιστική Εκτίμηση Μέσος όρος = 3,75 δείγμα Παράμετρος Μέσος όρος = 3,72 πληθυσμός Εικόνα 17: Βαθμολογία πρώτου ατόμου Ο αριθμός των δειγμάτων μας μεγέθους 12 είναι, 1.050.420.000.000.000, κάτι βέβαια που θα σήμαινε ότι πρέπει να υπολογίσουμε και τους αντίστοιχους δειγματικούς μέσους. Το τελευταίο όμως είναι κάτι πολύ επίπονο επειδή θα χρειαζόταν ενδεχομένως να υπολογίσουμε 1.050.420.000.000.000 μέσους, αλλά όχι όμως και απαραίτητο, επειδή μπορούμε να έχουμε την κατανομή του X, δηλ. τον τρόπο συγκέντρωσης των τιμών της X για διάφορα δείγματα. Η κατανομή του X είναι η Κανονική. Η κατανομή ενός μεγάλου αριθμού δειγμάτων του ίδιου μεγέθους από τον πληθυσμό μας ονομάζεται δειγματοληπτική κατανομή. Στο παρακάτω σχήμα στην πρώτη γραμμή δείχνεται η κατανομή (ιστόγραμμα) του αρχικού μας πληθυσμού με τις ενδεχόμενες θέσεις των μέσων των τριών δειγμάτων, ενώ στην επόμενη γραμμή δείχνεται η κατανομή των 1.050.420.000.000.000 δειγματικών μέσων. Εμπιστευτικό Σελίδα 44
Εικόνα 18: Κατανομή ενός μεγαλύτερου δείγματος Κανονικές Κατανομές Εικόνα 19: Κανονικές Κατανομές Αν έχω πληθυσμούς (με γνωστές διακυμάνσεις), όπως παραπάνω τότε X μ X μ = σ σ X Οι τιμές της (ΕΜΠΕΙΡΙΑΣ- ΘΕΩΡΗΤΙΚΟ ΜΕΣΟ) / Τυπικό σφάλμα = N ακολουθούν κατανομή της επόμενης μορφής, δηλαδή Κανονικής με μέσο 0 και απόκλιση 1. Εμπιστευτικό Σελίδα 45
Εικόνα 20: Κανονική κατανομή Site: http://onlinestatbook.com/stat_sim/sampling_dist/index.html Εμπιστευτικό Σελίδα 46