Ν161_(6)_Στατιστική στη Φυσική Αγωγή 07_Έλεγχος_Συχνοτήτων Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.. 1 Σύγκριση παρατηρούμενων συχνοτήτων με τις αντίστοιχες θεωρητικές συχνότητες εωρητικές συχνότητες: - από τη βιβλιογραφία - αναμενόμενες τιμές 1
Ερώτημα: αν οι παρατηρούμενες συχνότητες συμφωνούν (είναι ίδιες) με τις θεωρητικές Μηδενική υπόθεση: Δεν υπάρχουν διαφορές μεταξύ των δύο υπό έλεγχο συχνοτήτων 3 Έλεγχος καλής προσαρμογής (μιάς ποιοτικής μεταβλητής) - κατανομή Όταν ένα δείγμα είναι ταξινομημένο σε κλάσεις και διαθέτουμε την κατανομή συχνοτήτων του, αυτή η κατανομή προέρχεται από μια άλλη γνωστή κατανομή ή κάποια που μπορούμε να την υποθέσουμε; 4
Παράδειγμα: Σε ένα συγκεκριμένο αριθμό αγώνων μπάσκετ καταγράφεται ο αριθμός των φάουλ (ποιοτική μεταβλητή) των παικτών που συμμετέχουν. Έστω ότι συνολικά καταγράφτηκε ο αριθμός των φάουλ 80 παικτών. Στη συνέχεια υπολογίζεται ο αριθμός των παικτών που σημείωσαν από 1 έως 5 φάουλ (κατηγορίες, κλάσεις, τάξεις), δηλαδή υπολογίζεται η συχνότητα με την οποία πραγματοποιούνται 1,, 3, 4 ή 5 φάουλ σε κάθε αγώνα. Αυτή η συχνότητα πραγματοποίησης του αντίστοιχου αριθμού φάουλ, που αποτελεί την «παρατηρούμενη συχνότητα», παρουσιάζεται στον παρακάτω πίνακα. αριθμός φάουλ 1 3 4 5 παρατηρούμενη συχνότητα= αριθμός παικτών που σημείωσαν τον αντίστοιχο αριθμό φάουλ 18 5 10 5 5 υπολογισμός θεωρητικής συχνότητας: ίδια πιθανότητα να σημειωθούν από 1 έως 5 φάουλ άθροισμα πραγματικών τιμών θεωρητική συχνότητα:------------------------------------- σύνολο περιπτώσεων αριθμός φάουλ 1 3 4 5 παρατηρούμενη συχνότητα= αριθμός παικτών που σημείωσαν τον αντίστοιχο αριθμό φάουλ 18 5 10 5 θεωρητική συχνότητα 18 5 10 5 80 16 5 5 6 3
αριθμός φάουλ 1 3 4 5 παρατηρούμενη συχνότητα (Π) 18 5 10 5 θεωρητική συχνότητα () 16 16 16 16 16 Μηδενική υπόθεση: Δεν υπάρχουν διαφορές μεταξύ των δύο υπό έλεγχο συχνοτήτων (οι παρατηρούμενες και οι θεωρητικές συχνότητες είναι ίδιες μεταξύ τους) ο έλεγχος πραγματοποιείται μέσω της χ- κατανομής (Π ) i1 7 i1 (Π ) X Π Π- (Π-) (Π ) 1 18 16 4 0.5 16 6 36.5 3 5 16 9 81 5.065 4 10 16-6 36 5.5 5 5 16-11 11 7.565 i1 (Π ) =17.375 8 4
i1 (Π ) X Π Π- (Π-) (Π ) 1 18 16 4 0.5 16 6 36.5 3 5 16 9 81 5.065 4 10 16-6 36 5.5 5 5 16-11 11 7.565 i1 (Π ) =17.375 9 i1 (Π ) X Π Π- (Π-) (Π ) 1 18 16 4 0.5 16 6 36.5 3 5 16 9 81 5.065 4 10 16-6 36 5.5 5 5 16-11 11 7.565 i1 (Π ) =17.375 10 5
i1 (Π ) X Π Π- (Π-) (Π ) 1 18 16 4 0.5 16 6 36.5 3 5 16 9 81 5.065 4 10 16-6 36 5.5 5 5 16-11 11 7.565 i1 (Π ) =17.375 (Π ) i1 17.375 11 Η τιμή = 17.375 θα πρέπει να συγκριθεί με μία κρίσιμη -τιμή για επίπεδο σημαντικότητας α= 0.05 (1-0.05 = 0.95) και βαθμούς ελευθερίας -1 1 6
επίπεδο σημαντικότητας α=0.05 1-0.05= 0.95 β.ε.: -1 (όπου = αριθμός κλάσεων) = 5-1= 4 = 17,375 > κρίσιμο=9.49 df \p.005.01.05.05.10.90.95.975.99.995 1.00004.00016.00098.0039.0158.71 3.84 5.0 6.63 7.88.0100.001.0506.106.107 4.61 5.99 7.38 9.1 10.60 3.0717.115.16.35.584 6.5 7.81 9.35 11.34 1.84 4.07.97.484.711 1.064 7.78 9.49 11.14 13.8 14.86 5.41.554.831 1.15 1.61 9.4 11.07 1.83 15.09 16.75.6.676.87 1.4 1.64.0 10.64 1.59 14.45 16.81 18.55 7.989 1.4 1.69.17.83 1.0 14.07 16.01 18.48 0.8 8 1.34 1.65.18.73 3.49 13.36 15.51 17.53 0.09 1.96 9 1.73.09.70 3.33 4.17 14.68 16.9 19.0 1.67 3.59 10.16.56 3.5 3.94 4.87 15.99 18.31 0.48 3.1 5.19 11.60 3.05 3.8 4.57 5.58 17.8 19.68 1.9 4.73 6.76 1 3.07 3.57 4.40 5.3 6.30 18.55 1.03 3.34 6. 8.30 13 3.57 4.11 5.01 5.89 7.04 19.81.36 4.74 7.69 9.8 14 4.07 4.66 5.63 6.57 7.79 1.06 3.68 6.1 9.14 31.3 15 4.6 5.3 6.6 7.6 8.55.31 5 7.49 30.58 3.80 16 5.14 5.81 6.91 7.96 9.31 3.54 6.30 8.85 3.00 34.7 18 6.6 7.01 8.3 9.39 10.86 5.99 8.87 31.53 34.81 37.16 0 7.43 8.6 9.59 10.85 1.44 8.41 31.41 34.17 37.57 40.00 4 9.89 10.86 1.40 13.85 15.66 33.0 36.4 39.36 4.98 45.56 30 13.79 14.95 16.79 18.49 0.60 40.6 43.77 46.98 50.89 53.67 40 0.71.16 4.43 6.51 9.05 51.81 55.76 59.34 63.69 66.77 60 35.53 37.48 40.48 43.19 46.46 74.40 79.08 83.30 88.38 91.95 13 10 83.85 86.9 91.58 95.70 100.6 140.3 146.57 15.1 158.95 163.64 = 17.375 > - κρίσιμο=9.49 απορρίπτουμε τη μηδενική υπόθεση H o : οι πραγματικές τιμές δεν διαφέρουν από τις θεωρητικές αποδεχόμαστε την εναλλακτική υπόθεση Η Α : οι πραγματικές τιμές διαφέρουν από τις θεωρητικές Δεν υπάρχει η ίδια πιθανότητα να σημειωθούν από 1 έως 5 φάουλ 14 7
Έλεγχος ανεξαρτησίας (δύο ποιοτικών μεταβλητών) αν δύο ποιοτικά χαρακτηριστικά είναι ανεξάρτητα ή όχι μεταξύ τους Ανεξάρτητα: οι συχνότητες του ενός ΔΕΝ μεταβάλλονται σε σχέση με το άλλο Μη ανεξάρτητα: οι συχνότητες του ενός μεταβάλλονται σε σχέση με το άλλο Μηδενική υπόθεση: Οι συχνότητες του ενός ποιοτικού ο ούχαρακτηριστικού είναι ανεξάρτητες από τις συχνότητες του άλλου ποιοτικού χαρακτηριστικού (οι συχνότητες του ενός ΔΕΝ μεταβάλλονται σε σχέση με το άλλο) 15 Δεδομένα: Πίνακας συνάφειας (συχνοτήτων) (πόσες φορές εμφανίζεται ταυτόχρονα αυτό που αντιστοιχεί στη διασταύρωση της γραμμής και της στήλης) R= γραμμές C= στήλες Πίνακας παρατηρούμενων συχνοτήτων Β1 Β... Βc Σύνολο Α1 N11 N1... N1c N1 Α N1 N... Nc N Α3 N31 N3... N3c N3............ ΑR NR1 NR... NRc NR Σύνολο N1 N... N c N 16 8
Β1 Β... Βc Σύνολο Α1 N11 N1... N1c N1 Α N1 N... Nc N Α3 N31 N3... N3c N3............ ΑR NR1 NR... NRc NR Σύνολο N1 N... N c N Καθορισμός θεωρητικών συχνοτήτων Πιθανότητα εμφάνισης οποιουδήποτε στοιχείου N - με το χαρακτηριστικό Α i. i Αν Αi ανεξάρτητο του Βi τότε η πιθανότητα N.. N ταυτόχρονης εμφάνισης Αi και Βi.i και με το χαρακτηριστικό B i N.. Ni. N. i NN i.. i N.. N.. N.. 17 ο έλεγχος πραγματοποιείται μέσω της - κατανομής (Π ) i1 για προεπιλεγμένο επίπεδο σημαντικότητας α: (1-α) και βαθμούς ελευθερίας: (R-1)X(C-1) 18 9
παράδειγμα: Ένας ερευνητής καταγράφει ένα δείγμα 100 κολυμβητών σε δύο ποιοτικές μεταβλητές. Η πρώτη ποιοτική μεταβλητή αναφέρεται στο είδος της ξηρής προπόνησης που εκτελούν οι κολυμβητές και διαχωρίζεται σε τρεις κατηγορίες: Α1= «ξηρή προπόνηση μόνο όομε λάστιχα», Α= «ξηρή προπόνηση μόνο με βάρη», Α3= «ξηρή προπόνηση και με λάστιχα και με βάρη». Η δεύτερη ποιοτική μεταβλητή αναφέρεται στην συμμετοχή των κολυμβητών σε αγώνες: B1= «σε προημιτελικές σειρές», Β= «σε ημιτελικές σειρές», Β3 = «σε τελικές σειρές». Το ερώτημα που τίθεται είναι κατά πόσο το είδος της ξηρής προπόνησης που εκτελούν οι κολυμβητές επηρεάζει ή όχι τη συμμετοχή τους σε «προημιτελικές», «ημιτελικές» ή «τελικές» σειρές αγώνων, αν δηλαδή οι δύο ποιοτικές μεταβλητές είναι ανεξάρτητες μεταξύ τους ή όχι. 19 παρατηρούμενες συχνότητες Α1 Α Α3 Σύνολο Β1 0 0 10 50 Β 5 5 15 5 Β3 5 5 15 5 Σύνολο 30 30 40 100 εωρητικές συχνότητες Α1 Α Α3 Σύνολο Β1 (50 Χ30)/100=15 (50Χ30)/100=15 (50Χ40)/100=0 50 Β (5Χ30)/100=7.5 (5Χ30)/100=7.5 (5Χ40)/100=10 5 Β3 (5Χ30)/100=7.5 (5Χ30)/100=7.5 (5Χ40)/100=10 5 Σύνολο 30 30 40 100 0 10
παρατηρούμενες συχνότητες Α1 Α Α3 Σύνολο Β1 0 0 10 50 Β 5 5 15 5 Β3 5 5 15 5 Σύνολο 30 30 40 100 εωρητικές συχνότητες Α1 Α Α3 Σύνολο Β1 (50 Χ30)/100=15 (50Χ30)/100=15 (50Χ40)/100=0 50 Β (5Χ30)/100=7.5 (5Χ30)/100=7.5 (5Χ40)/100=10 5 Β3 (5Χ30)/100=7.5 (5Χ30)/100=7.5 (5Χ40)/100=10 5 Σύνολο 30 30 40 100 1 Υπολογισμός -τιμής i1 (Π ) Π Π- (Π-) ( ) 0 15 5 5 1.66 0 15 5 5 1.66 10 0-10 100 5 5 7.5 -.5 6.5 0.83 5 7.5 -.5 6.5 0.83 15 10 5 5.5 5 7.5 -.5 6.5 0.83 5 7.5 -.5 6.5 0.83 15 10 5 5.5 i ( 1 =16.64 11
i1 (Π ) Υπολογισμός -τιμής Π Π- (Π-) ( ) 0 15 5 5 1.66 0 15 5 5 1.66 10 0-10 100 5 5 7.5 -.5 6.5 0.83 5 7.5 -.5 6.5 0.83 15 10 5 5.5 5 7.5 -.5 6.5 0.83 5 7.5 -.5 6.5 0.83 15 10 5 5.5 i ( 1 =16.64 3 Υπολογισμός -τιμής i1 (Π ) Π Π- (Π-) ( ) 0 15 5 5 1.66 0 15 5 5 1.66 10 0-10 100 5 5 7.5 -.5 6.5 0.83 5 7.5 -.5 6.5 0.83 15 10 5 5.5 5 7.5 -.5 6.5 0.83 5 7.5 -.5 6.5 0.83 15 10 5 5.5 i ( 1 =16.64 4 1
i1 (Π ) Υπολογισμός -τιμής Π Π- (Π-) ( ) 0 15 5 5 1.66 0 15 5 5 1.66 10 0-10 100 5 5 7.5 -.5 6.5 0.83 5 7.5 -.5 6.5 0.83 15 10 5 5.5 5 7.5 -.5 6.5 0.83 5 7.5 -.5 6.5 0.83 15 10 5 5.5 i ( 1 =16.64 5 Η τιμή = 16.64 θα πρέπει να συγκριθεί με μία κρίσιμη -τιμή για επίπεδο σημαντικότητας α= 0.05 (1-0.05 = 0.95) και βαθμούς ελευθερίας (R-1)X(C-1)= (3-1)Χ(3-1)= 4 6 13
επίπεδο σημαντικότητας α=0.05 1-0.05= 0.95 β.ε.: (R-1)X(C-1)= (3-1)Χ(3-1)= 4 = 16.64 > κρίσιμο=9.49 df \p.005.01.05.05.10.90.95.975.99.995 1.00004.00016.00098.0039.0158.71 3.84 5.0 6.63 7.88.0100.001.0506.106.107 4.61 5.99 7.38 9.1 10.60 3.0717.115.16.35.584 6.5 7.81 9.35 11.34 1.84 4.07.97.484.711 1.064 7.78 9.49 11.14 13.8 14.86 5.41.554.831 1.15 1.61 9.4 11.07 1.83 15.09 16.75.6.676.87 1.4 1.64.0 10.64 1.59 14.45 16.81 18.55 7.989 1.4 1.69.17.83 1.0 14.07 16.01 18.48 0.8 8 1.34 1.65.18.73 3.49 13.36 15.51 17.53 0.09 1.96 9 1.73.09.70 3.33 4.17 14.68 16.9 19.0 1.67 3.59 10.16.56 3.5 3.94 4.87 15.99 18.31 0.48 3.1 5.19 11.60 3.05 3.8 4.57 5.58 17.8 19.68 1.9 4.73 6.76 1 3.07 3.57 4.40 5.3 6.30 18.55 1.03 3.34 6. 8.30 13 3.57 4.11 5.01 5.89 7.04 19.81.36 4.74 7.69 9.8 14 4.07 4.66 5.63 6.57 7.79 1.06 3.68 6.1 9.14 31.3 15 4.6 5.3 6.6 7.6 8.55.31 5 7.49 30.58 3.80 16 5.14 5.81 6.91 7.96 9.31 3.54 6.30 8.85 3.00 34.7 18 6.6 7.01 8.3 9.39 10.86 5.99 8.87 31.53 34.81 37.16 0 7.43 8.6 9.59 10.85 1.44 8.41 31.41 34.17 37.57 40.00 4 9.89 10.86 1.40 13.85 15.66 33.0 36.4 39.36 4.98 45.56 30 13.79 14.95 16.79 18.49 0.60 40.6 43.77 46.98 50.89 53.67 40 0.71.16 4.43 6.51 9.05 51.81 55.76 59.34 63.69 66.77 60 35.53 37.48 40.48 43.19 46.46 74.40 79.08 83.30 88.38 91.95 7 10 83.85 86.9 91.58 95.70 100.6 140.3 146.57 15.1 158.95 163.64 = 16.64 > - κρίσιμο=9.49 απορρίπτουμε τη μηδενική υπόθεση H o : Οι συχνότητες του ενός ποιοτικού χαρακτηριστικού είναι ανεξάρτητες από τις συχνότητες του άλλου ποιοτικού χαρακτηριστικού (οι συχνότητες του ενός ΔΕΝ μεταβάλλονται σε σχέση με το άλλο) αποδεχόμαστε την εναλλακτική υπόθεση Η Α : Οι συχνότητες του ενός ποιοτικού χαρακτηριστικού δεν είναι ανεξάρτητες από τις συχνότητες του άλλου ποιοτικού χαρακτηριστικού (οι συχνότητες του ενός μεταβάλλονται σε σχέση με το άλλο) 8 14
Παράδειγμα: (έλεγχος της επίδρασης δύο ποιοτικών μεταβλητών): η επίδραση της προθέρμανσης στην εμφάνιση τραυματισμών παρατηρούμενες συχνότητες προθέρμανση απουσία Σύνολο προθέρμανσης τραυματισμοί 5 15 0 απουσία 5 5 30 τραυματισμών Σύνολο 30 0 50 Να εξεταστεί σε επίπεδο σημαντικότητας α=0.05 αν η διεξαγωγή της προθέρμανσης και η εμφάνιση τραυματισμών είναι ανεξάρτητες μεταξύ τους 9 παρατηρούμενες συχνότητες προθέρμανση απουσία Σύνολο προθέρμανσης τραυματισμοί 5 15 0 απουσία 5 5 30 τραυματισμών Σύνολο 30 0 50 εωρητικές συχνότητες προθέρμανση απουσία προθέρμανσης Σύνολο τραυματισμοί μ (0Χ30)/50=1 (0Χ0)/50=8 0 απουσία (30Χ30)/50=18 (30Χ0)/50=1 30 τραυματισμών Σύνολο 30 0 50 30 15
Υπολογισμός -τιμής i1 (Π ) Π Π- (Π-) (Π ) 5 1-7 49 (49/1)= 4.08 15 8 7 49 (49/8)=6.15 5 18 7 49 (49/18)=.7 5 1-7 49 (49/1)=4.08 i1 (Π ) =17,005 31 Υπολογισμός -τιμής i1 (Π ) Π Π- (Π-) (Π ) 5 1-7 49 (49/1)= 4.08 15 8 7 49 (49/8)=6.15 5 18 7 49 (49/18)=.7 5 1-7 49 (49/1)=4.08 i1 (Π ) =17,005 3 16
Υπολογισμός -τιμής i1 (Π ) Π Π- (Π-) (Π ) 5 1-7 49 (49/1)= 4.08 15 8 7 49 (49/8)=6.15 5 18 7 49 (49/18)=.7 5 1-7 49 (49/1)=4.08 i1 (Π ) =17,005 33 Υπολογισμός -τιμής i1 (Π ) Π Π- (Π-) (Π ) 5 1-7 49 (49/1)= 4.08 15 8 7 49 (49/8)=6.15 5 18 7 49 (49/18)=.7 5 1-7 49 (49/1)=4.08 i1 (Π ) =17,005 34 17
Η τιμή = 17.005 θα πρέπει να συγκριθεί με μία κρίσιμη -τιμή για επίπεδο σημαντικότητας α= 0.05 (1-0.05 = 0.95) και βαθμούς ελευθερίας (R-1)X(C-1)= (-1)Χ(-1)= 1 35 επίπεδο σημαντικότητας α=0.05 1-0.05= 0.95 β.ε.: (R-1)X(C-1)= (-1)Χ(-1)= 1 = 17.005 > κρίσιμο=3.84 df \p.005.01.05.05.10.90.95.975.99.995 1.00004.00016.00098.0039.0158.71 3.84 5.0 6.63 7.88.0100.001.0506.106.107 4.61 5.99 7.38 9.1 10.60 3.0717.115.16.35.584 6.5 7.81 9.35 11.34 1.84 4.07.97.484.711 1.064 7.78 9.49 11.14 13.8 14.86 5.41.554.831 1.15 1.61 9.4 11.07 1.83 15.09 16.75.6.676.87 1.4 1.64.0 10.64 1.59 14.45 16.81 18.55 7.989 1.4 1.69.17.83 1.0 14.07 16.01 18.48 0.8 8 1.34 1.65.18.73 3.49 13.36 15.51 17.53 0.09 1.96 9 1.73.09.70 3.33 4.17 14.68 16.9 19.0 1.67 3.59 10.16.56 3.5 3.94 4.87 15.99 18.31 0.48 3.1 5.19 11.60 3.05 3.8 4.57 5.58 17.8 19.68 1.9 4.73 6.76 1 3.07 3.57 4.40 5.3 6.30 18.55 1.03 3.34 6. 8.30 13 3.57 4.11 5.01 5.89 7.04 19.81.36 4.74 7.69 9.8 14 4.07 4.66 5.63 6.57 7.79 1.06 3.68 6.1 9.14 31.3 15 4.6 5.3 6.6 7.6 8.55.31 5 7.49 30.58 3.80 16 5.14 5.81 6.91 7.96 9.31 3.54 6.30 8.85 3.00 34.7 18 6.6 7.01 8.3 9.39 10.86 5.99 8.87 31.53 34.81 37.16 0 7.43 8.6 9.59 10.85 1.44 8.41 31.41 34.17 37.57 40.00 4 9.89 10.86 1.40 13.85 15.66 33.0 36.4 39.36 4.98 45.56 30 13.79 14.95 16.79 18.49 0.60 40.6 43.77 46.98 50.89 53.67 40 0.71.16 4.43 6.51 9.05 51.81 55.76 59.34 63.69 66.77 60 35.53 37.48 40.48 43.19 46.46 74.40 79.08 83.30 88.38 91.95 36 10 83.85 86.9 91.58 95.70 100.6 140.3 146.57 15.1 158.95 163.64 18
απορρίπτουμε τη μηδενική υπόθεση = 17.005 > - κρίσιμο=3.84 H o : Οι συχνότητες του ενός ποιοτικού χαρακτηριστικού είναι ανεξάρτητες από τις συχνότητες του άλλου ποιοτικού χαρακτηριστικού (οι συχνότητες του ενός ΔΕΝ μεταβάλλονται σε σχέση με το άλλο) αποδεχόμαστε την εναλλακτική υπόθεση Η Α : Οι συχνότητες του ενός ποιοτικού χαρακτηριστικού δεν είναι ανεξάρτητες από τις συχνότητες του άλλου ποιοτικού χαρακτηριστικού 37 (η συχνότητα των τραυματισμών μεταβάλλεται σε σχέση με την προθέρμανση) 38 19