Έλεγχος Υποθέσεων: Είναι µια µέθοδος της Στατιστικής Συµπερασµατολογίας (tatitical iferece) που µας βοηθά να βγάλουµε συµπεράσµατα σε σχέση µετηντιµή µιας παραµέτρου του πληθυσµού, συγκρίνοντας τα αποτελέσµατα του δείγµατος µεεκείναπουθα περιµέναµεεάνηυπόθεση είναι αληθινή. Η µέθοδος αυτή µας βοηθά να διαπιστώσουµεεάνταδεδοµένα του δείγµατος υποστηρίζουν την υπόθεση ότι η παράµετρος του πληθυσµού έχει µια συγκεκριµένη τιµή. Με άλλα λόγια προσπαθούµε να προσδιορίσουµε την πιθανότητα να προκύψει ένα δείγµα όπουητιµή τηςπαραµέτρου είναι π.χ. µ από έναν πληθυσµό µε πραγµατική τιµή µ 0. Εάν η πιθανότητα είναι µεγάλη τότε η διαφορά µεταξύ του µ και µ 0 οφείλεται στις τυχαίες κυµάνσεις της δειγµατοληψίας. Αντίθετα, εάν διαπιστωθεί ότι η πιθανότητα είναι µικρή, τότε η υπόθεση δεν ισχύει. Παραδείγµατα: Έλεγχος ποσοστού εκλογικού σώµατος υπέρ κάποιου κόµµατος, έλεγχος ποιότητας στην βιοµηχανία,
Μηδενική υπόθεση (Null Hypothei) Η 0, είναι η υπόθεση που ελέγχουµε. Εναλλακτική υπόθεση (Alterative Hypothei) Η, είναι η υπόθεση που θα δεχθούµεεάνηµηδενική υπόθεση βρεθεί εσφαλµένη. Η Εναλλακτική υπόθεση δεν περιέχει το σύµβολο ίσον () όσον αφορά την τιµήτηςπαραµέτρου του πληθυσµού αλλά βασίζεται στο, >, < Ηαποδοχήήηαπόρριψητηςµηδενικής υπόθεσης βασίζεται στη τιµήτου κριτηρίου ελέγχου (tet tatitic). Κριτήριο ελέγχου είναι η στατιστική (µεταβλητή) που υπολογίζεται µε βάση τις πληροφορίες του δείγµατος και ακολουθεί µια γνωστή κατανοµή (Ζ κανονικήςκατανοµής, t κατανοµής tudet, κτλ). Εφόσον το κριτήριο ακολουθεί µια γνωστή κατανοµή, µετην χρήση των εµβαδών της αντίστοιχης κατανοµής θα προσδιορίσουµετην πιθανότητα µε βάση την οποία θα κρίνουµεεάνηh 0 είναι αληθινή ή όχι. Επίπεδο σηµαντικότητας (igificat level) και συµβολίζεται µεα, είναι ητιµή της πιθανότητας που µικρότερή της θα θεωρείται απίθανο να αποδοθεί στην τύχη ενώ µεγαλύτερη θα είναι φυσικό να ην αποδώσουµε στην τύχη.
ΈλεγχοςΥπόθεσηςΜέσου(γνωστή σ): κριτήριο Ζ Η 0 : µµ ο Η : µ µ ο Κριτήριο ελέγχου: Z σ / µ Εφόσον το επίπεδο σηµαντικότητας είναι α, τότε η περιοχή απόρριψης έχει εµβαδόν (πιθανότητα) α, και η περιοχή αποδοχής εµβαδόν ίσο µε -α Οι τιµές του κριτηρίου Ζ που αντιστοιχούν στα όρια της περιοχής απόρριψης ονοµάζονται κριτικές τιµές (critical value). Ηκάτωτιµή συµβολίζεται µεζ α/ και η άνω τιµή µε Ζ -α/ Εάν Ζ είναι η τιµή πουπροκύπτειαπόταδεδοµένα του δείγµατος τότε εάν: Ζ<Ζ α/ ήζ>ζ -α/ τότε η Η 0 απορρίπτεται Ζ α/ <Ζ<Ζ -α/ τότε η Η 0 γίνεται δεκτή
Κατανοµή ειγµατοληψίας και Περιοχές Απόρριψης και Αποδοχής της Η o Περιοχή απόρριψης (α/) Περιοχή αποδοχής της Ηο ( - α) Περιοχή απόρριψης (α/) Κριτική τιµή: Ζα/ Τιµή µέσου υπόθεσης Ηο Κριτική τιµή: Ζ-α/
Παράδειγµα: Μία εταιρεία παράγει συνθετικό δέρµα που χρησιµοποιείται για την υποδηµατοποιία. Μία από τις βασικές προδιαγραφές που πρέπει να τηρούνται είναι το πάχος. Από τις προδιαγραφές είναι γνωστό ότι ο συγκεκριµένος τύπος συνθετικού δέρµατος παράγεται µε µέσο πάχος 4 χιλιοστά και σ0, χιλιοστά. Από δείγµα 50 µετρήσεων προέκυψε µέσο παχος4,0 χιλιοστά. Το ερώτηµα που απασχολεί τον υπεύθυνο παραγωγής είναι εάν η παραγωγή εξελίσσεται οµαλά σύµφωνα µε τις προδιαγραφές ή κάποιο πρόβληµα στην παραγωγή προκαλεί µεταβολή στο πάχος του συνθετικού δέρµατος. 50 Η 0 : µ 4 χιλ. Η : µ 4χιλ. Οι κριτικές τιµές του κριτηρίου Ζ σύµφωνα µε την τυποποιηµένη κανονική κατανοµήείναι-,96 και,96 Z µ σ / 4,0 4,00 0,/ 50 +,4 Εφόσον Ζ+,4, βλέπουµε ότι-,96<ζ<,96 που σηµαίνει ότι η τιµή του κριτηρίου Ζ βρίσκεται στην περιοχή αποδοχής της Η 0
z 0.00 0.0 0.0 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.50000 0.50399 0.50798 0.597 0.5595 0.5994 0.539 0.5790 0.5388 0.53586 0. 0.53983 0.54380 0.54776 0.557 0.55567 0.5596 0.56356 0.56749 0.574 0.57535 0. 0.5796 0.5837 0.58706 0.59095 0.59483 0.5987 0.6057 0.6064 0.606 0.6409 0.3 0.679 0.67 0.655 0.6930 0.63307 0.63683 0.64058 0.6443 0.64803 0.6573 0.4 0.6554 0.6590 0.6676 0.66640 0.67003 0.67364 0.6774 0.6808 0.68439 0.68793 0.5 0.6946 0.69497 0.69847 0.7094 0.70540 0.70884 0.76 0.7566 0.7904 0.740 0.6 0.7575 0.7907 0.7337 0.73565 0.7389 0.745 0.74537 0.74857 0.7575 0.75490 0.7 0.75804 0.765 0.7644 0.76730 0.77035 0.77337 0.77637 0.77935 0.7830 0.7854 0.8 0.7884 0.7903 0.79389 0.79673 0.79955 0.8034 0.805 0.80785 0.8057 0.837 0.9 0.8594 0.8859 0.8 0.838 0.8639 0.8894 0.8347 0.83398 0.83646 0.8389.0 0.8434 0.84375 0.8464 0.84850 0.85083 0.8534 0.85543 0.85769 0.85993 0.864. 0.86433 0.86650 0.86864 0.87076 0.8786 0.87493 0.87698 0.87900 0.8800 0.8898. 0.88493 0.88686 0.88877 0.89065 0.895 0.89435 0.8967 0.89796 0.89973 0.9047.3 0.9030 0.90490 0.90658 0.9084 0.90988 0.949 0.9309 0.9466 0.96 0.9774.4 0.994 0.9073 0.90 0.9364 0.9507 0.9647 0.9786 0.99 0.93056 0.9389.5 0.9339 0.93448 0.93574 0.93699 0.938 0.93943 0.9406 0.9479 0.9495 0.94408.6 0.9450 0.94630 0.94738 0.94845 0.94950 0.95053 0.9554 0.9554 0.9535 0.95449.7 0.95543 0.95637 0.9578 0.9588 0.95907 0.95994 0.96080 0.9664 0.9646 0.9637.8 0.96407 0.96485 0.9656 0.96638 0.967 0.96784 0.96856 0.9696 0.96995 0.9706.9 0.978 0.9793 0.9757 0.9730 0.9738 0.9744 0.97500 0.97558 0.9765 0.97670.0 0.9775 0.97778 0.9783 0.9788 0.9793 0.9798 0.98030 0.98077 0.984 0.9869. 0.984 0.9857 0.98300 0.9834 0.9838 0.984 0.9846 0.98500 0.98537 0.98574. 0.9860 0.98645 0.98679 0.9873 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899.3 0.9898 0.98956 0.98983 0.9900 0.99036 0.9906 0.99086 0.99 0.9934 0.9958.4 0.9980 0.990 0.994 0.9945 0.9966 0.9986 0.99305 0.9934 0.99343 0.9936.5 0.99379 0.99396 0.9943 0.99430 0.99446 0.9946 0.99477 0.9949 0.99506 0.9950.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.996 0.9963 0.99643.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.9970 0.997 0.9970 0.9978 0.99736.8 0.99744 0.9975 0.99760 0.99767 0.99774 0.9978 0.99788 0.99795 0.9980 0.99807.9 0.9983 0.9989 0.9985 0.9983 0.99836 0.9984 0.99846 0.9985 0.99856 0.9986 3.0 0.99865 0.99869 0.99874 0.99878 0.9988 0.99886 0.99889 0.99893 0.99897 0.99900
Έλεγχος Υπόθεσης Μέσου (γνωστή σ) µε Επίπεδο Σηµαντικότητας 0,05 Απορρίπτουµε την Ηο (α/ 0,05) εν απορρίπτουµε την Ηο (-α 0,95) Απορρίπτουµε την Ηο (α/ 0,05) Ζ -,96 µο 4 χιλιοστά Ζ +,96
Έλεγχος Υπόθεσης µέσου του προγράµµατος Statgraphic Sample populatio4.0 Populatio tadard deviatio0. Sample ize50 95% cofidece iterval for mea:4.0+/- 0.077 [3.998;40477] Null Hypothei: µ4,0 Alterative: Not equal Computed Z tatitic.44 P-Value0.573 Cocluio: Do ot reject the ull hypothei for alfa0.05 The StatAdvior Give a ample of 50 obervatio with a mea of 4.0 ad a populatio tadard deviatio of 0. the computed Z tatitic equal.44. ice the P-value for the tet i grater tha or equal to 0.05, the ull hypothei caot be rejected at the 95.0% cofidece level. The cofidece iterval how that the value of µ upported by the data fall betwee 3.998 ad 4.0477
ΑπορρίπτουµετηνΗ 0 εάν Ζ > Ζ α/ (ή Ζ > Ζ -α/ εχόµαστε την Η 0 εάν Ζ < Ζ α/ (ή Ζ < Ζ -α/ Σχέση µεταξύ του ιαστήµατος Εµπιστοσύνης και του ελέγχου της υπόθεσης Ε Z : ± a. σ Μας πληροφορεί για το που µπορεί να βρίσκεται ο άγνωστος µ εάν γνωρίζουµε µόνο τον ΟέλεγχοςτηςΗ 0 µας λέει εάν ο µπορεί να προέρχεται από έναν πληθυσµό µε µέσο µ 0. Όλες οι τιµές του διαστήµατος εµπιστοσύνης µπορούν να γίνουν δεκτές σαν µ 0 εφόσον απέχουν από τον σ µέχρι ±. Z a Με άλλα λόγια αντί να κάνουµε τον κλασσικό έλεγχο της Η 0, εκτιµούµαι το διάστηµα εµπιστοσύνης και εάν περιλαµβάνεται η τιµή µ 0 τότε δεχόµαστε την Η 0 αλλιώς την απορρίπτουµε.
Εσφαλµένα Συµπεράσµατα από την ιεξαγωγή των Ελέγχων Υποθέσεων ΣφάλµαΤύπουΙ: Η Υπόθεσηµηδέν (H 0 ) απορρίπτεται ενώ είναι σωστή Παράδειγµα: κάποιες ακραίες τιµές στην δειγµατοληψία είχαν σαν αποτέλεσµαοµέσος όρος να ισούται µε 4, 03 µ 4,03 4,00 Z, >,96 σ / 0,/ 50 άρα η Η 0 απορρίπτεται ενώ είναι σωστή ΣφάλµαΤύπουΙΙ: ΗΥπόθεσηµηδέν (H 0 ) δεν απορρίπτεται (γίνεται δεκτή ενώ είναι λανθασµένη. Παράδειγµα: µ 4,05 4,00 4,05 Z,77 <, 96 σ / 0,/ 50 Ερώτηση:. Μπορούµενααποφύγουµετασφάλµατα κατά τον έλεγχο των υποθέσεων;. Μπορούµεναυπολογίσουµε την πιθανότητα να διαπράξουµε κατά τον έλεγχο των υποθέσεων;
Κατανοµές ειγµατοληψίας και Περιοχές Απόρριψης και Αποδοχής της Η o όταν η Η o είναι Λανθασµένη Περιοχή αποδοχής της Η0 β Περιοχή απόρριψης της Η0 ( - β) Η0: µ0 Ζ-α/ Η: µ
Περιοχές Απόρριψης και Αποδοχής της Η 0 σε Μονοκατάληκτα Κριτήρια Ελέγχου (α 0.05) Απορρίπτουµε την Ηο εν απορρίπτουµε την Ηο Η 0 : µµ 0 Έναντι της εναλλακτικής Η : µ<µ 0 Εάν Ζ<Ζ α απορρίπτουµε την υπόθεση µηδέν (Η 0 ) Ζ -,645 µο εν απορρίπτουµε την Ηο Απορρίπτουµε την Ηο Η 0 : µµ 0 Έναντι της εναλλακτικής Η : µ>µ 0 Εάν Ζ>Ζ α απορρίπτουµε την υπόθεση µηδέν (Η 0 ) µο Ζ +,645
ΈλεγχοςΥπόθεσηςΜέσου(άγνωστη σ): κριτήριο t Τις περισσότερες φορές η τυπική απόκλιση του πληθυσµού είναι άγνωστη και ως εκ τούτου χρησιµοποιούµετηνεκτίµηση από τα δεδοµένα του δείγµατος. Έτσι µε άγνωστη τυπική απόκλιση του πληθυσµού, χρησιµοποιούµετοκριτήριοt tudet µε - βαθµούς ελευθερίας για τον έλεγχο της υπόθεσης H 0 :µµ 0 Παράδειγµα: 4.7 4.5 4.8 5.0 5. 5.4 4.9 5.0 5. 4.3 5. 5.6 5.6 4.6 5. 4.5 4.3 4.9 5. 5.3 5.5 5. 5.6 4.8 4.5 5.3 5.5 4.9 5.0 5. µ 0 t / Η 0 : µ5 Η : µ 5 50.6 30 5.0 ( ) 4.88 30 0.44 0.38 t / µ 5.0 5 0 9 0.38 / 30 0.9 t 9,0.05.045 t 9 < t 9,0.05 Άρα ότι η Η 0 γίνεται δεκτή
ΈλεγχοςΥπόθεσηςΠοσοστού: κριτήριο Ζ Η 0 : ππ 0 µε Η : π π 0 για δικατάληκτο κριτήριο ή Η : π<π 0 ήη : π>π 0 για µονοκατάληκτο κριτήριο p/ κριτήριο Z p π 0 Z p π 0( π 0) p Γιαδικατάληκτοκριτήριοόταν Ζ < Ζ α/ ή Ζ < Ζ -α/ ηη 0 γίνεται δεκτή Για µονοκατάληκτο κριτήριο προς τα κάτω όταν Ζ>Ζ α ηη 0 γίνεται δεκτή Για µονοκατάληκτο κριτήριο προς τα πάνω όταν Ζ<Ζ -α ηη 0 γίνεται δεκτή
Παράδειγµα: Το Υπουργείο Αγροτικής Ανάπτυξης & Τροφίµων ενόψει της εφαρµογήςτηςνέαςκαπθέλεινα διαπιστώσει πόσοι από τους δικαιούχους άµεσων ενισχύσεων ξεπερνούν το όριο των 5.000. Παλαιότερη µελέτη της /νσης Αγροτικής Πολιτικής είχε καταλήξει στο συµπέρασµα ότι περίπου το 5% των δικαιούχων απολαµβάνουν ενισχύσεις µεγαλύτερες από 5.000. Έµπειρα στελέχη όµως του Υπουργείου εισηγούνται στον Υπουργό ότι το συγκεκριµένο ποσοστό έχει φτάσει στο 5% µε τάσεις ανόδου λόγω της επιτυχηµένης εφαρµογής των παλαιοτέρων διορθωτικών προγραµµάτων. Επειδήηβάσηδεδοµένων των πληρωµών του ΟΠΕΚΕΠΕ δεν είναι κατάλληλα ενηµερωµένη, η ηγεσία του Υπουργείου, προκειµένου να ελέγξει τους ισχυρισµούς των στελεχών, αποφασίζει να διεξάγει µία µικρής εµβέλειας έρευνα σε ένα τυχαίο δείγµα 700 δικαιούχων. Σε αυτό το τυχαίο δείγµα, 96 δικαιούχοι απάντησαν ότι απολαµβάνουν άµεσες ενισχύσεις µεγαλύτερες από 5.000. α). Να διατυπωθεί η µηδενικήκαιηεναλλακτικήυπόθεσηβ) Η α ποψη των στελεχών του υπουργείου είναι σωστή ή λάθος; Α. ιατύπωση ερευνητικών υποθέσεων: Β. Z Η 0 : π0.5 και Η : π>0.5 p96/7000.8 π ( π 0) 0.5( 0.5) 0 0. 064 700 p α0.05 p π p 0.8 0.5 0.064 0 Z -0.05 Z 0.95 +.645.83 Επειδή Ζ>Ζ -α ηη 0 απορρίπτεται
Έλεγχος ιαφοράς ύο Μέσων Είναι έλεγχος υποθέσεων µεταξύ δύο δειγµάτων. Σκοπός του κριτηρίου είναι να ελέγξουµε τηνδιαφοράµεταξύ των µέσων δύο πληθυσµών µε βάση τις παρατηρήσεις δύο ανεξαρτήτων δειγµάτων που έχουν επιλεγεί από τους δύο πληθυσµούς. Κατανοµή ειγµατοληψίας της ιαφοράς δύο Μέσων και Περιοχές Απόρριψης και Αποδοχής της Ηο Περιοχή απόρριψης (α/) Περιοχή αποδοχής της Ηο ( - α) Περιοχή απόρριψης (α/) Κριτική τιµή: Ζα/ Υπόθεση Ηο: µ - µ Κριτική τιµή: Ζ-α/
Η 0 : µ -µ θ 0 Η : µ -µ θ 0 ικατάληκτο κριτήριο Μονοκατάληκτο κριτήριο Μονοκατάληκτο κριτήριο Η 0 : µ -µ 0 Η 0 : µ -µ 0 Η 0 : µ -µ 0 Η µ -µ 0 Η : µ -µ >0 Η : µ -µ <0 Για µεγάλα δείγµατα (, >30) + 0 ) ( Z θ Για µικρά δείγµατα (, <30) Χρησιµοποιούµε το κριτήριο t tudet 0 ) ( t + θ ) ( p + ) ( ) ( ) ( ) ( + + p
Παράδειγµα Το ΕΘΙΑΓΕ θέλει να ελέγξει εάν το γεωργικό οικογενειακό εισόδηµα (ΓΟΕ) των γεωργών µε υψηλό µορφωτικό επίπεδο διαφέρει από το ΓΟΕ των γεωργών µε χαµηλό µορφωτικό επίπεδο. ύο τυχαία δείγµατα 50 γεωργών µε υψηλόγοεκαι00 γεωργών µε χαµηλό ΓΟΕ έδωσαν τα εξής αποτελέσµατα: Υψηλό Μορφωτικό Επίπεδο Χαµηλό Μορφωτικό Επίπεδο Μέγεθος δείγµατος 50 00 Μέσος 05 χιλ 5 χιλ Τυπική Απόκλιση 3 χιλ 35 χιλ. Η 0 : µ -µ 0 Η : µ -µ 0 3 35 ( + + 3.07 ) (05 5) Z 3. 50 5 3,07 Για επίπεδο σηµαντικότητας α0.05 Ζ α/ Ζ 0.05 -.96 Ζ<Ζ 0.05 άρα η Η 0 απορρίπτεται και γίνεται δεκτή η εναλλακτική υπόθεση. ηλαδή το ΓΟΕ διαφέρει ανάλογα µετοµορφωτικό επίπεδο του γεωργού.
Παράδειγµα Ένας γεωπόνος µελετά την απόδοση βαµβακιού σε δύο περιοχές κατά την περασµένη καλλιεργητική περίοδο. Το πρόβληµα που τον απασχολεί είναι εάν η καλλιέργεια βαµβακιού στην πρώτη περιοχή απέδωσε όσο και στην δεύτερη. Ο µελετητής συλλέγει ένα τυχαίο δείγµα 8 εκµεταλλεύσεων στην µία περιοχή και ένα δείγµα 0 εκµεταλλεύσεων στην δεύτερη περιοχή. Τα δεδοµένα έχουν ως εξής: Περιοχή I Περιοχή II Μέγεθος δείγµατος 8 0 Μέσος 3.5 to/ha.7 to/ha Τυπική Απόκλιση.3 to/ha.5 to/ha Η 0 : µ -µ 0 Η : µ -µ 0 p ( ) + ( ( ) + ( ) ) (8 ).3 + (0 ).5 (8 ) + (0 ).9856 ( + ).9856( + ) 0.4578 t p 36. 747 8 0 (3.5.7) 0.4578 Για επίπεδο σηµαντικότητας α0.05 t 36,α/ Ζ 36,0.055.08 άρα t 36 < t v,α/ όπου σηµαίνει ότι δεχόµαστε την Η 0 δηλαδή δεν υπάρχει διαφορά στην απόδοση βαµβακιού µεταξύ των δύο περιοχών.
Έλεγχος ιαφοράς ύο Ποσοστών: κριτήριο Ζ Ελέγχουµε τηνδιαφοράµεταξύ των ποσοστών π και π δύο πληθυσµών. Ο έλεγχος θα γίνει βάση των ποσοστών p και p που έχουν προκύψει από δύο ανεξάρτητα δείγµατα Η µηδενική υπόθεση είναι ότι η διαφορά των ποσοστών µεταξύ δύο πληθυσµών έχει µια σταθερή τιµήθ 0. Εάν το θ 0 είναι ίσο µε µηδέν οι πιθανοί έλεγχοι είναι: ικατάληκτο κριτήριο Μονοκατάληκτο κριτήριο Μονοκατάληκτο κριτήριο Η 0 : π -π 0 Η 0 : π -π 0 Η 0 : π -π 0 Η π -π 0 Η : π -π >0 Η : π -π <0 Κοινό ή συνδυασµένο (combied) ποσοστό p c : p p p ( p )( c c + Z ( p p ) p p ) + p + p c + + Εάν Ζ < Ζ α/ τότε αποδεχόµαστε την Η 0 p
Παράδειγµα Το τµήµα έκδοσης πιστωτικών καρτών της τράπεζας θέλει να διερευνήσει εάν η οικογενειακή κατάσταση των κατόχων πιστωτικών καρτών επιδρά στο ποσοστό των κατόχων πουέχουν ανεξόφλητες ληξιπρόθεσµες υποχρεώσεις. Τα δύο τυχαία δείγµατα 50 παντρεµένων και 00 ανύπαντρων κατόχων πιστωτικής κάρτας έδωσαν επίσης τα εξής αποτελέσµατα: Παντρεµένοι Ανύπαντροι Μέγεθος δείγµατος 50 00 Αριθµός κατόχων µε ανεξόφλητες ληξιπρόθεσµες υποχρεώσεις Χ 4 Χ 9 Εκτίµηση ποσοστού p 4/500.07 p 9/000.045 Η 0 : π -π 0 Η π -π 0 p c + + 4 + 9 50 + 00 0.037 p ( )( ) 0.037( 0.037)( ) 0.0 p p p + + c c 50 00 Z ( p p ) (0.07 0.045) 0.0 p p 0.90 Για επίπεδο σηµαντικότητας α0.05 Ζ α/ Ζ 0.05 -.96 δηλαδή Ζ > Ζ 0.05 που σηµαίνει ότι δεχόµαστε την Η 0
Έλεγχος ιαφοράς δύο ιακυµάνσεων: κριτήριο F Ο Έλεγχος ισότητας των διακυµάνσεων δύο πληθυσµών βασίζεται στο λόγο των δύο διακυµάνσεων και όχι στην διαφορά τους. Όταν τα δύο δείγµατα προέρχονται από κανονικούς πληθυσµούς, τότε ο λόγος των διακυµάνσεων ακολουθεί µία γνωστή θεωρητική κατανοµή που ονοµάζεται κατανοµή F. F νν Όπου ν η - και ν η - ικατάληκτο κριτήριο Μονοκατάληκτο κριτήριο Μονοκατάληκτο κριτήριο Η 0 : σ σ ήσ /σ Η 0 : σ σ ήσ /σ Η 0 : σ σ ήσ /σ Η σ σ ήσ /σ Η σ >σ ήσ /σ > Η σ <σ ήσ /σ <
Κατανοµές του Κριτηρίου Fν,ν για ιάφορες Τιµές των ν και ν ν, ν5 ν5, ν0 ν5, ν30 0 +
Κατανοµή ειγµατοληψίας του Κριτηρίου F / και Περιοχές Απόρριψης και Αποδοχής της Η 0 Περιοχή αποδοχής της Ηο ( - α) Περιοχή απόρριψης (α) 0 Κριτική τιµή: Fν,ν,α + Εάν η τιµή τουf είναι µεγαλύτερη από την κριτική τιµή Fv v,αδηλαδήfv v > Fv v,ατότε απορρίπτουµε τηνη 0 και γίνεται δεκτή η Η
ΈλεγχοςΑνεξαρτησίαςΙδιοτήτων: κριτήριο x Χ :οαριθµός των παρατηρήσεων που έχουν το υπο εξέταση χαρακτηριστικό p Χ / : το ποσοστό των παρατηρήσεων - : ο αριθµός των παρατηρήσεων που δεν έχουν το συγκεκριµένο χαρακτηριστικό Το κριτήριο x ελέγχει την υπόθεση µε το κριτήριο Ζ αλλά βασίζεται στις συχνότητες εµφάνισης ή µή του χαρακτηριστικού δηλ. Τα Χ, Χ, - και - και όχι τις τιµές των ποσοστών p και p. Επίσης ο συγκεκριµένο κριτήριο µας επιτρέπει να επεκτείνουµε τον έλεγχο διαφοράς µεταξύ των ποσοστών για περισσότερους από δύο πληθυσµούς H 0 : π π...π c Ελέγχουµε εάν οι πραγµατικές ή παρατηρούµενες συχνότητες (f 0 ) διαφέρουν στατιστικά σηµαντικά από τις αναµενόµενες (f e ). Εάν οι διαφορές είναι µικρές (στατιστικά ασήµαντες), τότε γίνεται δεκτή ηη 0 δηλ. Τα δύο χαρακτηριστικά είναι ανεξάρτητα.. Εάν η Η 0 απορριφθεί, τότε οι πραγµατικές συχνότητες δεν συµβιβάζονται µε την υπόθεση της ανεξαρτησίας. x ( f0 fe) ν fe Όπου: f 0 πραγµατικές ή παρατηρούµενες συχνότητες f e αναµενόµενες ή θεωρητικές συχνότητες v βαθµοί ελευθερίας: (αριθµός γραµµών-)(αριθµός στηλών-) Η κατανοµή τουκριτηρίουx έχει σχήµα ανάλογοµε εκείνο της κατανοµής F καιτείνειπροςτην κανονική κατανοµή γιαν>30
Παράδειγµα Το τµήµα έκδοσης πιστωτικών καρτών της τράπεζας θέλει να διερευνήσει εάν η οικογενειακή κατάσταση των κατόχων πιστωτικών καρτών επιδρά στο ποσοστό των κατόχων που έχουν ανεξόφλητες ληξιπρόθεσµες υποχρεώσεις. Τα δύο τυχαία δείγµατα 50 παντρεµένων και 00 ανύπαντρων κατόχων πιστωτικής κάρτας έδωσαν επίσης τα εξής αποτελέσµατα: Πίνακας f o Ανεξόφλητες Υποχρεώσεις Οικογενειακή κατάσταση Παντρεµένοι Ανύπαντροι Σύνολα Ναι Χ 4 9 3 Όχι -Χ 46-9 -337 x ( f0 fe) ν fe f o f e (f o -f e ) 4 5.6 -.6 9 7.4.6 46 44.4.6 (f o -f e ).56.56.56 (f o -f e ) /f e 0.457 0.346 0.08 Σύνολα 50 00 350 9 9.6 -.6.56 0.03 Πίνακας f e Παντρεµένοι Οικογενειακή κατάσταση Ανύπαντροι Σύνολα (-)(-) 0.834 0.5, 3.84 x 0.834 Ανεξόφλητες Υποχρεώσεις Ναι Όχι 50*3/350 5,6 50*337/350 44,4 00*3/350 7,4 00*337/350 9,6 3-337 0.5, > (-)(-) άρα η Η 0 γίνεται δεκτή που σηµαίνει ότι τα δύο χαρακτηριστικά (ή ιδιότητες) είναι ανεξάρτητα Σύνολα 50 00 350