Έλεγχος Χ -Προβλήματα και Ασκήσεις Έλεγχος Χ (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Προβλήματα και Ασκήσεις 1. Στη βιβλιογραφία αναφέρεται ότι τα ποσοστά των ομάδων αίματος Α, Β, ΑΒ και Ο σε έναν πληθυσμό είναι, 0.41, 0.10, 0.04 και 0.45, αντίστοιχα. Μια ομάδα ερευνητών, προκειμένου να ελέγξει αν τα ποσοστά των ομάδων αίματος σε αυτόν τον πληθυσμό είναι πράγματι αυτά που αναφέρονται στην βιβλιογραφία, επέλεξε τυχαία 00 άτομα από αυτόν τον πληθυσμό και για καθένα κατέγραψε την ομάδα αίματός του. Στον πίνακα που ακολουθεί φαίνεται η κάθε ομάδας αίματος που παρατηρήθηκε στο δείγμα. Ομάδα αίματος Α Β ΑΒ Ο 89 18 1 81 Σε επίπεδο σημαντικότητας 5%, τα ποσοστά που παρατηρούνται στο δείγμα συμφωνούν ή όχι, με τα αντίστοιχα ποσοστά που αναφέρονται στη βιβλιογραφία;. Ένας ερευνητής σχεδίασε και εκτέλεσε το εξής πείραμα: σε έναν κλειστό διάδρομο στο τέλος του οποίου υπήρχαν τρεις έξοδοι διαφορετικού χρώματος (πράσινου, κόκκινου και μπλε αντίστοιχα), απελευθέρωσε ένα ποντίκι 90 φορές και κατέγραψε πόσες φορές διέφυγε από την πράσινη έξοδο, πόσες από την κόκκινη και πόσες από τη μπλε. Η που παρατηρήθηκε για κάθε έξοδο διαφυγής φαίνεται στον πίνακα που ακολουθεί. Έξοδος διαφυγής Πράσινη Κόκκινη Μπλε 0 39 31 Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα πειραματικά δεδομένα ότι ο ποντικός δε δείχνει την ίδια προτίμηση και στις τρεις εξόδους; 3. Ένας ερευνητής μέτρησε την τιμή ένας αιματολογικού δείκτη 100 ζώων, τυχαία επιλεγμένων, από μια μεγάλη κτηνοτροφική μονάδα. Τις παρατηρήσεις που πήρε τις ομαδοποίησε σε πέντε κλάσεις αφού προηγουμένως τις τυποποίησε (από κάθε μια αφαίρεσε τη μέση τιμή τους και διαίρεσε τη διαφορά που προέκυψε με την τυπική απόκλισή τους). Προέκυψε, έτσι, ο ακόλουθος πίνακας συχνοτήτων. Τιμή του δείκτη (τυποποιημένη) < -1.5 8 [-1.5, -0.5) 0 [-0.5, 0.5) 40 [0.5, 1.5) 9 1.5 3 Σε επίπεδο σημαντικότητας 5%, μπορούμε να ισχυρισθούμε ότι οι τυποποιημένες τιμές του δείγματος προέρχονται από την τυποποιημένη κανονική κατανομή; 4. (Συνέχεια της άσκησης-18 Περιγραφικής Στατιστικής). Να κατασκευάσετε ένα 95% διάστημα εμπιστοσύνης για την άγνωστη μέση συγκέντρωση υδραργύρου στο συκώτι των αρσενικών δελφινιών του συγκεκριμένου είδους. Σε επίπεδο σημαντικότητας 5%, να ελέγξετε αν ικανοποιείται η υπόθεση που χρειάσθηκε να κάνετε για να κατασκευάσετε το ζητούμενο διάστημα εμπιστοσύνης. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 71
Έλεγχος Χ -Προβλήματα και Ασκήσεις 5. Στην εικόνα που ακολουθεί φαίνονται οι θέσεις 168 φρεατίων έρευνας για κοίτασμα πετρελαίου σε μια περιοχή του Texas. Η περιοχή έχει διαιρεθεί σε 10 x16 = 160 τμήματα σχήματος τετραγώνου και εμβαδού 10mi το καθένα. Ο πίνακας συχνοτήτων της χωροδιάταξης των φρεατίων είναι ο ακόλουθος: Αριθμός φρεατίων ανά τμήμα 0 70 1 4 6 3 17 4 3 5 1 6 1 Σύνολο 160 Να ελέγξετε, σε επίπεδο σημαντικότητας 5%, αν η χωροδιάταξη των φρεατίων περιγράφεται από μια κατανομή Poisson. 6. Ένας ερευνητής μέτρησε σε μια πλάκα Petri τον αριθμό βακτηρίων ανά τετραγωνίδιο εμβαδού 1cm. Στον πίνακα που ακολουθεί φαίνονται τα αποτελέσματα των μετρήσεων σε 50 τέτοια τετραγωνίδια. Αριθμός βακτηρίων/cm 0 4 1 15 16 3 1 4 5 1 Σύνολο 50 Να ελέγξετε, σε επίπεδο σημαντικότητας 5%, αν ο αριθμός των βακτηρίων/cm περιγράφεται από την κατανομή Poisson με μέση τιμή βακτήρια/cm. 7. Από κατάλληλη διασταύρωση φυτών πετούνιας προκύπτουν, ως προς το χρώμα του άνθους και το σχήμα του φύλλου, οι εξής τέσσερις τύποι φυτών: ΑΒ (κόκκινα άνθη και στρογγυλά φύλλα), Αb (κόκκινα άνθη και μακρόστενα φύλλα), aβ (λευκά άνθη και στρογγυλά φύλλα) και ab (λευκά άνθη και μακρόστενα φύλλα). Σύμφωνα με το μοντέλο κληρονομικότητας του Mendel, οι τέσσερις τύποι απογόνων, AB, Ab, ab και ab πρέπει να βρίσκονται σε αναλογία 9:3:3:1. Σε ένα σχετικό πείραμα, από 160 πειραματικά φυτά, τα 95 βρέθηκαν να είναι τύπου AB, τα 30 τύπου Ab, τα 8 τύπου ab και τα 7 τύπου ab. Σε επίπεδο Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 7
Έλεγχος Χ -Προβλήματα και Ασκήσεις σημαντικότητας 1%, αυτά τα πειραματικά δεδομένα δίνουν άραγε σημαντικές αποδείξεις εναντίον του μοντέλου κληρονομικότητας του Mendel; Σε επίπεδο σημαντικότητας 5%; 8. Μια βιομηχανία τροφίμων παράγει από τρεις γραμμές παραγωγής Γ 1, Γ και Γ 3, ελαφρά συμπυκνωμένο χυμό τομάτας σε συσκευασίες των 00gr. Το τμήμα ποιοτικού ελέγχου της βιομηχανίας, όταν διαπιστώνει ότι κάποιο προϊόν είναι ελαττωματικό το κατατάσσει σε μία από τέσσερις κατηγορίες Α 1, Α, Α 3 ή Α 4, ανάλογα με το είδος και τη σοβαρότητα των ελαττωμάτων που παρουσιάζει. Επίσης, καταγράφει από ποια γραμμή παραγωγής παρήχθη. Στον πίνακα που ακολουθεί φαίνεται πώς κατανέμονται 309 προϊόντα που βρέθηκαν ελαττωματικά στις τέσσερις κατηγορίες Α 1, Α, Α 3, Α 4 και στις τρεις γραμμές παραγωγής Γ 1, Γ, Γ 3. Γραμμή Παραγωγής Γ 1 Γ Γ 3 Κατηγορία κατάταξης Α 1 15 6 33 Α 1 31 17 Α 3 45 34 49 Α 4 13 5 0 Σε επίπεδο σημαντικότητας 5%, δίνουν αυτά τα δεδομένα σημαντικές αποδείξεις ότι η κατηγορία κατάταξης ενός ελαττωματικού προϊόντος εξαρτάται από το ποια γραμμή παραγωγής προέρχεται; 9. Σε μια αγροτική περιοχή έγινε μια μελέτη για να ελεγχθεί η αποτελεσματικότητα ενός νέου εμβολίου, το οποίο χορηγείται σε δύο δόσεις, για την προστασία από τη γρίπη. Στους 1000 κατοίκους της περιοχής δόθηκε η δυνατότητα να κάνουν το εμβόλιο δωρεάν και εθελοντικά. Για κάθε κάτοικο, η ερευνητική ομάδα κατέγραψε πόσες δόσεις του εμβολίου έκανε (καμία, μία ή δύο) και αν αρρώστησε ή όχι από τη γρίπη. Αρρώστησαν Αριθμός δόσεων Καμία Μια Δύο Ναι 4 9 13 Όχι 89 100 565 α) Σε επίπεδο σημαντικότητας 5%, δίνουν αυτά τα δεδομένα σημαντικές αποδείξεις ότι ο αριθμός των περιστατικών γρίπης εξαρτάται από τον αριθμό των δόσεων; β) Η έρευνα για την αποτελεσματικότητα του εμβολίου θα μπορούσε να γίνει ως εξής: σε ένα συγκεκριμένο αριθμό κατοίκων, τυχαία επιλεγμένων, να μη χορηγηθεί το εμβόλιο, σε έναν άλλο αριθμό κατοίκων, επίσης τυχαία επιλεγμένων, να δοθεί μια μόνο δόση και στους υπόλοιπους να χορηγηθούν και οι δύο δόσεις. Να σχολιάσετε (συγκριτικά) τους δύο πειραματικούς σχεδιασμούς. 10. Ένας ερευνητής, για να ελέγξει αν η ανθεκτικότητα ενός συγκεκριμένου είδους φυτού σε κάποια συγκεκριμένη ασθένεια σχετίζεται με το μέγεθός του, πήρε ένα τυχαίο δείγμα 100 φυτών αυτού του είδους, τα κατέταξε ως προς το μέγεθος τους σε «μεγάλα» και «μικρά» και εξέτασε αν έχουν προσβληθεί ή όχι από την συγκεκριμένη ασθένεια. Ο αριθμός των φυτών σε κάθε κατηγορία φαίνεται στον πίνακα που ακολουθεί. Μέγεθος Μεγάλα Μικρά Ναι 15 15 Αρρώστησαν Όχι 5 45 Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 73
Έλεγχος Χ -Προβλήματα και Ασκήσεις Σε επίπεδο σημαντικότητας 5%, δίνουν αυτά τα δεδομένα σημαντικές αποδείξεις ότι η ανθεκτικότητα των φυτών εξαρτάται από το μέγεθός τους; 11. Από καθένα από τρία συνοικιακά super market Α 1, Α και Α 3, επιλέξαμε, με βάση ένα σχέδιο τυχαίας δειγματοληψίας, ένα δείγμα 00 πελατών (ένα δείγμα από κάθε super market) και ρωτήσαμε αν θα αγόραζαν βιολογικά όσπρια, εφόσον αυτά υπήρχαν στα ράφια του super market. Για κάθε super market, οι απαντήσεις των πελατών (ναι, όχι, ίσως) δίνονται στον πίνακα που ακολουθεί. Πρόθεση για αγορά Super market Α 1 Α Α 3 Ναι 1 78 94 Όχι 101 63 7 Ίσως 78 59 79 α) Με βάση τα αποτελέσματα αυτής της έρευνας, και σε επίπεδο σημαντικότητας 5%, τι μπορούμε να συμπεράνουμε για τις προθέσεις των πελατών στα τρία super market (ως προς το αν θα αγόραζαν βιολογικά όσπρια). β) Εξηγείστε τι ακριβώς ελέγξατε στο ερώτημα (α). 1. Θέλουμε να ελέγξουμε αν οι παράμετροι p A, pb, pc τριών διωνυμικών πληθυσμών Α, Β και C, αντίστοιχα, είναι ίσες ή όχι. Για το σκοπό αυτό πήραμε τρία ανεξάρτητα τυχαία δείγματα, ένα από κάθε πληθυσμό, μεγέθους 100 το καθένα. Τα δεδομένα που συγκεντρώσαμε φαίνονται στον πίνακα που ακολουθεί. Πληθυσμός Α Β C Αριθμός επιτυχιών 6 1 35 Αριθμός αποτυχιών 74 79 65 Να διατυπώσετε και να κάνετε κατάλληλο στατιστικό έλεγχο (σε επίπεδο σημαντικότητας 5%). Για τι έλεγχο πρόκειται; 13. Στο πλαίσιο μιας έρευνας για τη διερεύνηση παραγόντων που επηρεάζουν την επιθετικότητα των ποντικιών έγινε, μεταξύ άλλων, το εξής πείραμα. Επελέγησαν τυχαία 140 νεογέννητα ποντίκια και αμέσως μετά τη γέννηση τους απομακρύνθηκαν από τις φυσικές τους μητέρες και δόθηκαν σε «θετές μητέρες». Εκατόν εξήντα επτά άλλα νεογέννητα ποντίκια, τα οποία επελέγησαν επίσης τυχαία, αφέθηκαν να μεγαλώσουν με τις φυσικές τους μητέρες. Όταν, κάθε ποντίκι, συμπλήρωνε τρεις μήνες ζωής, οι ερευνητές το έκλειναν σε ένα μικρό κλουβί μαζί με ένα άλλο ποντίκι που δεν είχε ξαναδεί. Στη συνέχεια παρατηρούσαν το ποντίκι για προκαθορισμένο χρονικό διάστημα (έξι λεπτών) και κατέγραφαν αν εκδήλωσε ή όχι επιθετική συμπεριφορά. Τα δεδομένα που προέκυψαν, φαίνονται στον πίνακα που ακολουθεί. Μητέρα Φυσική Θετή Επιθετική Ναι 7 47 συμπεριφορά Όχι 140 93 Σε επίπεδο σημαντικότητας 5%, μπορούμε, με βάση αυτά τα πειραματικά δεδομένα, να συμπεράνουμε ότι α) η πρόωρη απομάκρυνση των ποντικιών από τις φυσικές τους μητέρες επηρεάζει την εκδήλωση επιθετικής συμπεριφοράς στο μέλλον; (ο έλεγχος να γίνει με δύο τρόπους), β) το ποσοστό των ποντικιών που εκδηλώνουν επιθετική συμπεριφορά και έχουν απομακρυνθεί πρόωρα από τις Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 74
Έλεγχος Χ -Προβλήματα και Ασκήσεις φυσικές τους μητέρες είναι μεγαλύτερο από το ποσοστό των ποντικιών που εκδηλώνουν επιθετική συμπεριφορά και δεν έχουν απομακρυνθεί πρόωρα από τις φυσικές τους μητέρες; 14. Μια ομάδα ερευνητών για να μελετήσει την εξάπλωση μιας ασθένειας (υφέρπουσα σήψη) στις φυτικές καλλιέργειες, διαίρεσε μια καλλιέργεια λάχανου σε 70 τετράγωνα τμήματα καθένα από τα οποία περιείχε τον ίδιο αριθμό λάχανων και κατέγραψε, ανά τμήμα, τον αριθμό των φυτών που παρουσίαζαν σημάδια υφέρπουσας σήψης. Τα αποτελέσματα των μετρήσεων στα 70 τμήματα της καλλιέργειας δίνονται στον πίνακα συχνοτήτων που ακολουθεί. Αριθμός φυτών που έχουν προσβληθεί/τμήμα 0 38 1 57 68 3 47 4 3 5 9 6 10 7 7 8 3 9 4 10 11 Σύνολο 70 Να ελέγξετε, σε επίπεδο σημαντικότητας 5%, αν ο αριθμός των φυτών που παρουσιάζουν σημάδια υφέρπουσας σήψης (ανά τμήμα) περιγράφεται από μια κατανομή Poisson. Πώς μπορούμε να εξηγήσουμε το αποτέλεσμα αυτού του ελέγχου; Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 75
Έλεγχος Χ -Προβλήματα και Ασκήσεις ΑΠΑΝΤΗΣΕΙΣ 1. Σε επίπεδο σημαντικότητας 5%, δεν υποστηρίζουν ασυμφωνία αφού X = 3. 70 ενώ χ 7. 815. 3 ;0.05 =. Σε επίπεδο σημαντικότητας 5%, ναι, αφού X = 6.067 > χ ;0.05 = 5. 99. 3. Σε επίπεδο σημαντικότητας 5%, δε μπορεί να απορριφθεί ο ισχυρισμός αφού X = 4. 047 ενώ χ 4 ;0.05 = 9. 488. 4. α) Με την υπόθεση ότι το δείγμα προέρχεται από κανονικό πληθυσμό, ένα 95% διάστημα εμπιστοσύνης είναι [181.79, 91.61] β) Σε επίπεδο σημαντικότητας 5%, δεν απορρίπτεται η υπόθεση. 5. Σε επίπεδο σημαντικότητας 5%, απορρίπτεται η υπόθεση ότι η χωροδιάταξη περιγράφεται από μια κατανομή Poisson αφού X = 13. > χ ;0.05 = 5. 99 6. Σε επίπεδο σημαντικότητας 5%, δε μπορεί να απορριφθεί η υπόθεση ότι ο πληθυσμός ακολουθεί την κατανομή Poisson με μέση τιμή, αφού X = 5.188 ενώ χ 4 ;0.05 = 9. 488. 7. Σε επίπεδο σημαντικότητας 1% αλλά και σε 5%, όχι, αφού X = 1. 3111 ενώ χ 3 ;0.01 = 11.345 και χ 3 ;0.05 = 7. 815, αντίστοιχα. 8. Σε επίπεδο σημαντικότητας 5%, ναι, αφού X = 19.18 > χ 6;0.05 = 1. 59. 9. α) Σε επίπεδο σημαντικότητας 5%, ναι, αφού X = 17.313 > χ ;0.05 = 5. 991 β) Στο δεύτερο σχεδιασμό ελέγχουμε την ισότητα τριών διωνυμικών ποσοστών δηλαδή την ομογένεια τριών πληθυσμών, ενώ στον πρώτο την ανεξαρτησία δύο χαρκτηριστικών/μεταβλητών που μετρώνται επί των ίδιων πειραματικών μονάδων (μιας διωνυμικής και μιας από κοινού τριδιάστατης πολυωνυμικής). Και στους δύο ελέγχους ως στατιστική συνάρτηση ελέγχου χρησιμοποιείται η X και η απορριπτική περιοχή είναι η ίδια X > χ ; α. Το συμπέρασμα και στους δύο ελέγχους έχει το ίδιο νόημα. 10. Σε επίπεδο σημαντικότητας 5%, όχι, αφού X = 1. 786 ενώ χ 1 ;0.05 = 3. 841. 11. α) Σε επίπεδο σημαντικότητας 5%, τα δεδομένα δίνουν σημαντικές αποδείξεις ότι σε δύο τουλάχιστον super market τα ποσοστά των απαντήσεων, για μία τουλάχιστον κατηγορία απάντησης, δεν είναι ίδια, αφού X = 9.315 > χ 4;0.05 = 9.488 β) Κάναμε έλεγχο ομογένειας. Ελέγξαμε τα αντίστοιχα ποσοστά τριών πολυωνυμικών πειραμάτων. 1. H 0 : p A = pb = pc και q A = qb = qc έναντι της H1 : Δ εν είναι αληθής η H 0 Σε επίπεδο σημαντικότητας 5%, η μηδενική υπόθεση δεν απορρίπτεται αφού X = 5.068 ενώ χ ;0.05 = 5. 991. Πρόκειται για έλεγχο ομογένειας τριών πληθυσμών. 13. α) Σε επίπεδο σημαντικότητας 5%, ναι, αφού X = 1.61 > χ1;0.05 = 3. 841 (πρώτος τρόπος) και z = 3.46 > z0. 05 = 1. 96 (δεύτερος τρόπος). β) Εργαζόμενοι με το δεύτερο τρόπο, προφανώς ναι (αφού η μηδενική απορρίπτεται στον αμφίπλευρο) 14. Σε επίπεδο σημαντικότητας 5%, όχι, αφού X = 46.75 > χ5;0.05 = 11. 070. Η χωροδιάταξη των φυτών που έχουν προσβληθεί δεν είναι τυχαία, η ασθένεια μάλλον είναι μεταδοτική (καταστρατηγείται, έτσι, η υπόθεση της ανεξαρτησίας). Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 76
Έλεγχος Χ -Προβλήματα και Ασκήσεις Τιμές χ n ;a της κατανομής χ n Ο Πίνακας δίνει τα άνω α -ποσοστιαία σημεία της κατανομής χ με n βαθμούς ελευθερίας Αν X χ, ισχύει, P ( X > χ α ) = α. ~ n n; n α = 0.995 α = 0.99 α = 0.975 α = 0.95 α = 0.05 α = 0.05 α = 0.01 α = 0.005 1 0.000 0.000 0.001 0.004 3.841 5.04 6.635 7.879 0.010 0.00 0.051 0.103 5.991 7.378 9.10 10.597 3 0.07 0.115 0.16 0.35 7.815 9.348 11.345 1.838 4 0.07 0.97 0.484 0.711 9.488 11.143 13.77 14.860 5 0.41 0.554 0.831 1.145 11.070 1.83 15.086 16.750 6 0.676 0.87 1.37 1.635 1.59 14.449 16.81 18.548 7 0.989 1.39 1.690.167 14.067 16.013 18.475 0.78 8 1.344 1.647.180.733 15.507 17.535 0.090 1.955 9 1.735.088.700 3.35 16.919 19.03 1.666 3.589 10.156.558 3.47 3.940 18.307 0.483 3.09 5.188 11.603 3.053 3.816 4.575 19.675 1,90 4.75 6.757 1 3.074 3.571 4.404 5.6 1.06 3.337 6.17 8.300 13 3.565 4.107 5.009 5.89.36 4.736 7.688 9.819 14 4.075 4.660 5.69 6.571 3.685 6.119 9.141 31.319 15 4.601 5.9 6.6 7.61 4.996 7.488 30.578 3.801 16 5.14 5.81 6.908 7.96 6.96 8.845 3.000 34.67 17 5.697 6.408 7.564 8.67 7.587 30.191 33.409 35.718 18 6.65 7.015 8.31 9.390 8.869 31.56 34.805 37.156 19 6.844 7.633 8.907 10.117 30.144 3.85 36.191 38.58 0 7.434 8.60 9.591 10.851 31.414 34.170 37.566 39.997 1 8.034 8.897 10.83 11.591 3.671 35.479 38.93 41.401 8.643 9.54 10.98 1.338 33.94 36.781 40.89 4.796 3 9.60 10.196 11.689 13.091 35.17 38.076 41.638 44.181 4 9.886 10.856 1.401 13.848 36.415 39.364 4.980 45.558 5 10.50 11.54 13.10 14.611 37.65 40.646 44.314 46.98 6 11.160 1.198 13.844 15.379 38.885 41.93 45.64 48.90 7 11.808 1.878 14.573 16.151 40.113 43.194 46.963 49.645 8 1.461 13.565 15.308 16.98 41.337 44.461 48.78 50.994 9 13.11 14.56 16.047 17.708 4.557 45.7 49.588 5.335 30 13.787 14.953 16.791 18.493 43.773 46.979 50.89 53.67 40 0.706.164 4.4331 6.509 55.756 59.34 63.691 66.766 50 7.991 9.708 3.3574 34.764 67.505 71.40 76.154 79.490 60 35.535 37.485 40.4817 43.188 79.08 83.98 88.379 91.95 70 43.75 45.44 48.7576 51.739 90.531 95.03 100.45 104.15 80 51.17 53.540 57.153 60.39 101.879 106.69 11.39 116.31 90 59.196 61.754 65.6466 69.16 113.145 118.136 14.116 18.99 100 67.38 70.065 74.19 77.930 14.34 19.561 135.807 140.169 Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 77