ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού Με τις στατιστικές μεθόδους επιδιώκεται αφενός η συνοπτική αλλά εμπεριστατωμένη παρουσίαση των ευρημάτων μιας μελέτης (περιγραφική στατιστική και αφετέρου η συναγωγή συμπερασμάτων που βασίζονται στα ευρήματα αυτά (συμπερασματολογική στατιστική / επαγωγική στατιστική Πιθανότητα (P, Probablty είναι μέτρο του πόσο αναμενόμενο να συμβεί ένα γεγονός ή μια θέση (ισχυρισμός να είναι αληθής. Οι πιθανότητες παίρνουν τιμές μεταξύ 0 (δεν θα συμβεί και (θα συμβεί. Όσο μεγαλύτερη η πιθανότητα ενός γεγονότος, τόσο βέβαιοι είμαστε ότι θα συμβεί. Ως μεταβλητή θεωρούμε κάθε χαρακτηριστικό το οποίο μπορεί να μεταβληθεί ή να διαφοροποιηθεί κατά μήκος του χρόνου, απότόποσετόπο, από άτομο σε άτομο ή από ομάδα σε ομάδα (π.χ. ηλικία, ύψος, εισόδημα, συγκέντρωση χοληστερόλης, αρτηριακή πίεση, ρυθμός γεννητικότητας κτλ Ποιοτική ονομάζεται η μεταβλητή που περιγράφει κάποιο ποιοτικό χαρακτηριστικό ενός ατόμου ή μιας ομάδας. Ποσοτική ονομάζεται η μεταβλητή που μπορεί να μετρηθεί με τη συνήθη έννοια του όρου Συνεχής Ασυνεχής Ως ανεξάρτητη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζει μια άλλη μεταβλητή. Ως εξαρτημένη χαρακτηρίζεται μια μεταβλητή όταν επηρεάζεται από μια άλλη μεταβλητή.
ΠΕΡΙΓΡΑΦΗ ΔΕΔΟΜΕΝΩΝ Γραφικές μέθοδοι Ραβδογράμματα - Ιστογράμματα (Συχνότητα Κυκλικά διαγράμματα Διαγράμματα πλαισίου Αριθμητικοί στατιστικοί δείκτες ή μέτρα (tattc Κεντρικής τάσης - Μέση τιμή (mea - Διάμεσος (meda - Επικρατούσα τιμή (mode Διασποράς - Εκατοστημόρια ή ποσοστιαία σημεία (percetle - Διακύμανση ή Διασπορά (Varace - Τυπική απόκλιση (tadard devato Διάγραμμα πίτας (Pe chart Ραβδόγραμμα (bar chart Διάγραμμα πλαισίου (Bo plot Ma Ιστόγραμμα (Htogram 75% 5% Meda M
Μέση τιμή : (mea ή average N N Διάμεσος : (meda - Ταξινόμηση των μετρήσεων κατά μέγεθος - Επιλογή της τιμής στο μέσον των μετρήσεων Επικρατούσα τιμή : Η συχνότερη τιμή (mode 3
Εκατοστημόρια ή ποσοστιαία σημεία (percetle - Διατάσσουμε τα δεδομένα κατά τάξη μεγέθους - Το p-εκατοστημόριο είναι η τιμή που έχει p% των μετρήσεων μικρότερες από αυτήν Τεταρτημόρια (quartle Ειδικά εκατοστημόρια - Q 5% - Q 50% - Q 3 75% 4
ΜΕΤΡΑ ΤΗΣ ΔΙΑΣΠΟΡΑΣ Έκταση ή εύρος (rage : ma - m ( Διακύμανση Διασπορά (varace : Πληθυσμού «σ» Δείγματος N N Τυπική απόκλιση (tadard devato : N ( N Συντελεστής διακύμανσης (coeffcet of varace : 00% % CV Accurate but mprece accurate but prece Accurate ad prece Preco: ορθότητα ή επαναληψιμότητα Accuracy: ακρίβεια 5
f ( μ σ ( Κανονική κατανομή e πσ Ν(μ,σ X μ Z σ / Ν(0, f ( e π 6
Κεντρικό οριακό θεώρημα (cetral lmt theorem Για αρκούντως μεγάλα δείγματα από έναν πληθυσμό, οι μέσες τιμές ακολουθούν περίπου την κανονική κατανομή, ανεξάρτητα από το είδος της κατανομής του πληθυσμού. Όσο μεγαλύτερα τα δείγματα τόσο καλύτερα προσεγγίζεται η κανονική κατανομή. 7
Κατανομή t του Studet 8
ΕΚΤΙΜΗΤΙΚΗ Εκτίμηση σε σημείο Δίνουμε τους αριθμητικούς δείκτες του δείγματος ως προσεγγιστική (αβέβαιη εκτίμηση αυτών του πληθυσμού εκτιμώμενο τυπικό σφάλμα : τυπικό σφάλμα : σ Εκτίμηση σε διαστήματα εμπιστοσύνης (cofdece terval Δίνουμε ένα διάστημα μέσα στο οποίο αναμένεται με συγκεκριμένη πιθανότητα να εμπίπτει μια παράμετρος του πληθυσμού Στάθμη σημαντικότητας (σ.σ: -a 00(-a% δ.ε. μ ± t N σ N Διάστημα εμπιστοσύνης για τη μέση τιμή (μεγάλα δείγματα Η μεταβλητή Ζ ακολουθεί την κανονική κατανομή Αναζητούμε την πιθανότητα για κάποιο z από πίνακες της τυποποιημένης κανονικής κατανομής X σ σ Zα / μ X Zα α P / X μ Z σ / α/ α/ -Z α/ Z α/
Οδείκτης σωματικής μάζας Χ(kgr/m ενός ατόμου υπολογίζεται αν διαιρέσουμε το βάρος του με το τετράγωνο του ύψους του. Για άνδρες ηλικίας 30-40 ετών είναι γνωστό ότι Χ~N(μ,σ. Να προσδιορισθεί το 95% δ.ε. για την σωματική μάζα μ των ανδρών εάν από τυχαίο δείγμα 49 5 ανδρών από αυτόν τον πληθυσμό προέκυψε και 9. X Δ.ε. 95% Ζ α/ Z 0.05 (πίνακες->.96 X 3. 96 μ X. 96 49 3 49 Διάστημα εμπιστοσύνης για τη μέση τιμή (μικρά δείγματα Η μεταβλητή t ακολουθεί την κατανομή t Αναζητούμε την τιμή t από πίνακες για ν β.ε και a Y μ t / X t X t μ Από δείγμα 5 υγιών γυναικών ηλικίας 5-40 ετών, υπολογίσθηκε για την αμυλάση του ορού ότι X 96 μονάδες/00ml και 35 μονάδες/ml. Να υπολογισθεί το 90% διάστημα εμπιστοσύνης για την αληθή τιμή της μέσης τιμής μ της αμυλάσης στον πληθυσμό των υγιών γυναικών στις ίδιες ηλικίες. Δ.ε. 90% t 4,0.05 (πίνακες->.76 X 35. 76 μ X. 76 5 35 5
3 Διάστημα εμπιστοσύνης για τη διασπορά (μεγάλα και μικρά δείγματα Ακολουθεί την κατανομή X Αναζητούμε τις τιμές X από πίνακες για P(X > X ν;a a ( σ X /,( ( /, ( ( ( a a Χ < < Χ σ
4
Διάστημα εμπιστοσύνης για τη διαφορά μέσων δύο πληθυσμών (μεγάλα ανεξάρτητα δείγματα - Ακολουθεί την κανονική κατανομή - Αναζητούμε τις τιμές Ζ από πίνακες της τυποποιημένης κανονικής κατανομής ( X Y ( μ Z μ μ μ XY ±Ζa / Διάστημα εμπιστοσύνης για τη διαφορά μέσων δύο κανονικών πληθυσμών με κοινό σ (μικρά ανεξάρτητα δείγματα - Ακολουθεί την κατανομή t με ν ν β.ε. - Αναζητούμε την τιμή t από πίνακες για ν ν και a/ ( X Y ( μ μ t μ μ y± t Διάστημα εμπιστοσύνης για τη διαφορά μέσων ζευγαρωτών δειγμάτων - Διαφορά δ μεταξύ των μέσων τιμών των δύο δειγμάτων - Ακολουθεί την κατανομή t με ν - β.ε. - Αναζητούμε την τιμή t από πίνακες για ν και a/ Διάστημα εμπιστοσύνης για τον λόγο των διασπορών δύο κανονικών πληθυσμών - Ακολουθεί την κατανομή F με ν, ν β.ε. - Αναζητούμε την τιμή F από πίνακες για ν, ν και a/ 5
αριθμητής 6
ΔΟΚΙΜΑΣΙΑ ΥΠΟΘΕΣΕΩΝ (ΕΛΕΓΧΟΣ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ Sgfcace tetg Συγκρίνοντας δύο πληθυσμούς διαπιστώνουμε πάντοτε διαφορές μεταξύ των μέσων αλλά και μεταξύ των διασπορών τους. Απηχούν πραγματικές διαφορές μεταξύ των πληθυσμών; Μηδενική υπόθεση (ull Η 0 : Εναλλακτική υπόθεση (alteratve Η : μ ή μ σ ή μ μ σ σ σ Σφάλμα ου είδους (α : Πιθανότητα εσφαλμένης απόρριψης της Η 0 Σφάλμα ου είδους (β : Πιθανότητα εσφαλμένης απόρριψης της Η Έλεγχος για τη μέση τιμή μ (μεγάλα δείγματα, σ.σ. α y μ0 z / δειγματικός μέσος - υποτιθέμενος μέσος τυπικό σφάλμα του δειγματικού μέσου Κ.Ο.Θ Το «z» ακολουθεί την κανονική κατανομή Για κάθε α αντιστοιχεί ένα κρίσιμο z α Η Η 0 απορρίπτεται όταν z > z α Έλεγχος για τη μέση τιμή μ (μικρά δείγματα, σ.σ. α y μ t 0 / ακολουθεί την κατανομή t
Έλεγχος μέσων από δύο πληθυσμούς Όταν upared t-tet Δείγματα από ανεξάρτητους πληθυσμούς Διακυμάνσεις όχι σημαντικά διαφορετικές Π.χ. Σύγκριση τιμών γλυκόζης από ασθενείς δύο διαφορετικών νοσοκομείων Όταν κατά ζεύγη (pared t-tet Διακυμάνσεις όχι σημαντικά διαφορετικές Upared ΑΝΕΞΑΡΤΗΤΑ Έλεγχος για διαφορά δύο μέσων τιμών (μεγάλα δείγματα, σ.σ. α ( y z y δ ακολουθεί την κανονική κατανομή Για κάθε α αντιστοιχεί ένα κρίσιμο z α Η Η 0 απορρίπτεται όταν z > z α Έλεγχος για τη διαφορά δύο μέσων τιμών (μικρά δείγματα, σ.σ. α ( y t y δ ακολουθεί την κατανομή t ( ( t-tet_mmuoglobul.l β.ε. -
ΚΑΤΆ ΖΕΥΓΗ Έλεγχος σημαντικότητας για τη σύγκριση μέσων τιμών κατά ζεύγη (pared ή plt ample ( y y δ 0 t / ακολουθεί την κατανομή t d d : για τις διαφορές Έλεγχος σημαντικότητας για το «p» της διωνυμικής κατανομής (μεγάλα δείγματα 6_7.l Έστω επιτυχίες σε δοκιμές. Συγκρίνουμε την αναλογία / των επιτυχιών με μια δοθείσα πιθανότητα p 0 με την βοήθεια της τυποποιημένης μεταβλητής Ζ. Z p p 0 p 0 ( 0 Έλεγχος σημαντικότητας για τη διασπορά, σ.σ. α X ( σ ακολουθεί την κατανομή Χ Για κάθε α και ν αντιστοιχεί ένα κρίσιμο X α;v Η Η 0 απορρίπτεται όταν Χ > X α;v Σύγκριση των διασπορών δύο πληθυσμών, σ.σ. α F ακολουθεί την κατανομή F Για κάθε α και ν,ν αντιστοιχεί ένα κρίσιμο F ν,ν;α Η Η 0 απορρίπτεται όταν F F ν,ν;α για > Η Η 0 απορρίπτεται όταν F F ν,ν;α για < Folate.l 3
Power aaly Στατιστική ισχύς (Stattcal Power : P β, P τουλάχιστον.80 Σφάλμα ου είδους (β : Πιθανότητα εσφαλμένης απόρριψης της Η Ποιο μέγεθος δείγματος θα μου δώσει την απαιτούμενη ακρίβεια; Ηστατιστική ισχύς εξαρτάται από το μέγεθος της διαφοράς που μελετάμε και από το μέγεθος του δείγματος. Εάν η στατιστική ισχύς είναι υψηλή, η πιθανότητα να κάνουμε σφάλμα ου είδους (να συμπεράνουμε ότι δεν υπάρχει διαφορά ενώ υπάρχει είναι μικρή. cr μ0 cr 30. 64 Zcr. 64 cr 3. 6 / 0 3. 6 6 P z > P 0 ( z >. 4 0. 895 Η πιθανότητα ότι ορθώς απορρίψαμε την Η 0 είναι 0.895. 4
cr μ0 cr 30. 64 Zcr. 64 cr 3. 6 / 0 3. 6 6 P z > P 0 ( z >. 4 0. 895 ΑΝΑΛΥΣΗ ΤΗΣ ΔΙΑΚΥΜΑΝΣΗΣ (ANOVA Σύγκριση περισσοτέρων των δύο ανεξαρτήτων δειγμάτων από κανονικούς πληθυσμούς με ίδια διακύμανση Συνολική εκτίμηση για το αν οι μέσοι όλων των δειγμάτων είναι μεταξύ τους ίσοι ή αν τουλάχιστον ένας από αυτούς διαφέρει. Ελέγχουμε αν υπάρχει σημαντική διαφορά μεταξύ της διασποράς των μέσων τιμών και της συνολικής διασποράς των δειγμάτων. α κ ( υ κ ( F τετράγωνα μεταξύ δειγμάτων τετράγωνα εντός δειγμάτων α υ /( κ /( κ κ κ: πλήθος δειγμάτων Hb_ANOVA.l 5
Η 0 : 3 κ Η : Τουλάχιστον ένας από τους δειγματικούς μέσους δεν είναι ίσος με κάποιον άλλον ΠΙΝΑΚΑΣ ΑΝΑΛΥΣΗΣ ΔΙΑΣΠΟΡΑΣ Mεταβολή Μεταξύ δειγμάτων Εντός δειγμάτων Αθρ. Τετραγ. α υ Β.ε. κ- -κ Μέση μεταβλητ. α /( κ υ /( κ α υ F /( κ /( κ Προϋπόθεση : διασπορές των δειγμάτων ίσες. 09 3_Eample.l αριθμητής κ- 6
ΕΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ Προϋπόθεση όλων των «παραμετρικών δοκιμασιών» που αναφέρθηκαν είναι η «κανονικότητα» των δεδομένων. Πώς ελέγχουμε την κανονικότητα; Γράφημα συσχέτισης των ποσοστιαίων σημείων (quatle των δεδομένων με αυτά της κανονικής κατανομής (QQ-plot. Ευθεία γραμμή κανονικότητα Έλεγχος λοξότητας (kewe και κύρτωσης (kurto συντελεστής λοξότητας: μετρά την ασυμμετρία της κατανομής >0 η δεξιά ουρά μεγαλύτερη από την αριστερή συντελεστής κύρτωσης: μετρά το πόσο πιο απότομη ή πιο επίπεδη είναι η κατανομή σε σχέση με την κανονική. >0 απότομη στο κέντρο με μακρές ουρές <0 επίπεδη στο κέντρο με μικρές ουρές Αποδεχόμαστε ότι τα δεδομένα ακολουθούν την κανονική κατανομή, αν οι συντελεστές ασυμμετρίας και κύρτωσης είναι στο διάστημα (-,. 7
ΠΟΙΟΤΙΚΑ ΔΕΔΟΜΕΝΑ Κατηγορίας (omal --Διάταξης (ordal Ποσοστά - Σχετικές Συχνότητες - Αναλογίες p Πλήθος εμφανίσεων κάποιου φαινομένου Σύνολο παρατηρήσεων Σε μεγάλα δείγματα ακολουθεί κανονική κατανομή Δηλ. όταν p(-p 0 ΣΥΓΚΡΙΣΗ ΑΝΑΛΟΓΙΑΣ ΕΝΟΣ ΔΕΙΓΜΑΤΟΣ ΜΕ ΚΑΠΟΙΑ ΑΛΛΗ (H τ.μ. παίρνει δύο τιμές z p p p0( p0 / Διάστημα εμπιστοσύνης : 0 p ± z a / p( p ΣΥΓΚΡΙΣΗ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΑΝΕΞΑΡΤΗΤΩΝ ΔΕΙΓΜΑΤΩΝ z p p p( p p( p
ΣΥΓΚΡΙΣΗ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΔΕΙΓΜΑΤΩΝ ΚΑΤΑ ΖΕΥΓΗ Ανάλυση χ (Μη παραμετρικός έλεγχος Η τ.μ. παίρνει δύο τιμές (Κατηγορίες, - Πίνακες Ομάδα Κατηγορία Κατηγορία Σύνολο π π π π N π π π π N Σύνολο π π π π NN N - Αναμενόμενες τιμές κατ. ομάδας, θ (π π *(π π /N, θ (π π *(π π /N - Αναμενόμενες τιμές κατ. ομάδας, θ (π π *(π π /N, θ (π π *(π π /N Εξετάζουμε την τιμή της μεταβλητής : X ( π θ ( π θ ( π θ ( π θ ή θ η οποία ακολουθεί κατανομή χ με β.ε., θ όταν οι αναμενόμενες αναλογίες δεν είναι < 5 Η χ εξετάζει αμφίπλευρα, αλλά στον πίνακα αναζητούμε για σ.σ0.05 και όχι 0.05/. θ π π π π X N θ θ θ θ θ _quare_chmerzld.l _quare_operato.l
ΣΥΚΡΙΣΗ ΑΝΑΛΟΓΙΩΝ S ΔΕΙΓΜΑΤΩΝ ΜΕ Κ ΚΑΤΗΓΟΡΙΕΣ Ανάλυση χ Πίνακες Συνάφειας (cotgecy table Κατηγορία "j" Ομάδα "". k Σύνολο γραμμών π π. π k k Σ j π π. π k k Σ j...... π π π k k Σ j Σύνολο στηλών Σ Σ. k Σ k ΝΣΣ j θ j ( j ( N k j j X k j ( π j θj θ j ήαπλούστερα X k π j N j θj β.ε. (- (k- 3
4
ΑΠΛΗ ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ -- ΣΥΣΧΕΤΙΣΗ (Smple Lear Lear Regreo --Correlato Εύρεση μιας μαθηματικής ευθείας που εξηγεί τα δεδομένα y α β e α : τεταγμένη επί την αρχή (tercept β : κλίση (lope e : τυχαίο σφάλμα : ελεγχόμενη (predctor y : απόκριση (repoe Μέθοδος ελαχίστων τετραγώνων y a b e e (y a b
b y y a yb Προϋποθέσεις για τη χρήση της απλής γραμμικής παλινδρόμησης Τα τυχαία σφάλματα στην είναι αμελητέα Για κάθε τιμή της υπάρχει μια κανονική κατανομή τιμών της y. Η κατανομή του y για κάθε τιμή του έχει την ίδια διακύμανση Lear_Regr.l Απλή γραμμική παλινδρόμηση Παλινδρόμηση Demg
3 ( a y (y Τυπικό σφάλμα της εκτίμησης (tadard error of the etmato b ( Τυπικό σφάλμα για το b δ.ε. β b ± t b, β. ε. -, a Τυπικό σφάλμα για το a δ.ε. α a ± t a, β. ε. -, a ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ (Multple Lear Regreo ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ (Multple Lear Regreo e y k k β β β α... k k k k k k e y e y e y β β β β β β β β β β β β.......... 0 0 0 Έστω δείγμα μεγέθους e X Y β
4 y y y Y... k k k X............ β β β β... e e e e... β β β β... ( Y X X X ' ' β 0.4 7 6.5 0.4 6 5.7 0.4 5 4.0 0.4 4.0 0.3 7 7.5 0.3 6 6.6 0.3 5 5. 0.3 4 4.0 0. 7 8.0 0. 6 6.8 0. 5 5.5 0. 4 4.3 Σχετική υγρασία X Χρόνος έκθεσης X [h] Απώλεια βάρους Y[gr] 8.3.49 5 y
ΜΗ ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ (No (No Lear Lear Regreo y k α β β... βk e ΣΥΣΧΕΤΙΣΗ (Correlato Μέθοδος για την μέτρηση του βαθμού συμμεταβλητότητας των μεταβλητών. 5
6 Συντελεστής συσχέτισης Pearo (Correlato coeffcet y y y y r ( ( ( ( Διάστημα εμπιστοσύνης (Cofdece terval ± a t y / ; ( ( Διάστημα πρόβλεψης (Predcto terval ± a t y / ; ( ( y : τιμή που προβλέπεται από την γρ. παλ. για το : μέση τιμή του : τιμή της ανεξ. μετ. για την οποία αναζητούμε την y : τιμή της ανεξ. μετ. από τις μετρήσεις
7 r r t Δοκιμασία ανεξαρτησίας H 0 : b0, απορρίπτεται όταν t > t -;a/ b b t Δοκιμασία μη συσχέτισης H 0 : r0, απορρίπτεται όταν t > t -;a/ Γραμμική παλινδρόμηση Demg λ U U Demg b N N N y y y y U ( ( ( ( λ y S S λ
Μη Μηπαραμετρική συσχέτιση Συντελεστής συσχέτισης του του Spearma Συσχετίζει τάξεις τ.μ. Έστω ζεύγη τ.μ., y. Δημιουργούμε τις διαφορές των τάξεων των ζευγών των τ.μ. r T p_spearma_0 Eer.l d T -Ty 6 ( d 3 d d Δοκιμασία ανεξαρτησίας Η 0 : r T 0 5 Δεν μπορούμε να αποφανθούμε 5 < 0 Aπορρίπτουμε την Η 0 όταν r T S ;a rt > 0 To tt ακολουθεί την rt κατανομή t. Απορρίπτουμε την Η 0 όταν t T t -;a 8
ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΔΟΚΙΜΑΣΙΕΣ Δεν προαπαιτούν να ακολουθούν οι πληθυσμοί κάποια κατανομή. Ενδιαφέρει μόνο η τάξη και όχι η τιμή της τυχαίας μεταβλητής. Δοκιμασία Kolmogorov Smrov (Καλής προσαρμογής, Ομογένειας Κριτήριο των Ροών ή Wald-Wolfowtz (Δοκιμασία τυχαιότητας Δοκιμασία προσήμου (g tet Αθροίσματα τάξεων (rak um tet - Δοκιμασία Wlcoo - Δοκιμασία Ma-Whthey - Δοκιμασία Krukal-Wall ΔΟΚΙΜΑΣΙΑ ΟΜΟΓΕΝΕΙΑΣ (Kolmogorov Smrov Ελέγχει αν δύο δείγματα προέρχονται από την ίδια κατανομή. H 0 Τα δύο δείγματα προέρχονται από την ίδια κατανομή H Τα δύο δείγματα προέρχονται διαφορικές κατανομές Χρησιμοποιεί τον δείκτη D ma F ( F ( F ( και F ( είναι οι αθροιστικές συχνότητες των δύο δειγμάτων Η μηδενική υπόθεση απορρίπτεται, όταν το D από τον πίνακα VII. D a,m, Για μεγάλα m, (>5: α0.05 D a, m, 0 Eample.l. 36 m m α0.0 D a, m,. 63 m m
ΔΟΚΙΜΑΣΙΑ ΤΩΝ ΡΟΩΝ ή WALD-WOLFOWITZ (Δοκιμασία τυχαιότητας Εξετάζει αν μια ακολουθία παρατηρήσεων είναι τυχαία ή όχι. Π.χ. ΕΕ ΑΑ ΕΕ ΑΑΑ Ε ΑΑΑ ΕΕΕΕ ΑΑΑ Κάθε διαδοχή ομοίων συμβόλων λέγεται «ροή». Το πλήθος των συμβόλων μιας ροής λέγεται «μήκος ροής». Στο παράδειγμα έχουμε 8 ροές 9 E, A Εάν, Ν(μ u,σ με Algmet.l μ u 0 τότε το πλήθος των ροών U ακολουθεί την και U μu Z σ u σ u ( ( ( ΔΟΚΙΜΑΣΙΑ ΠΡΟΣΗΜΟΥ (Sg tet Ανάλογη προς τη δοκιμασία t Χρησιμοποιεί τον διάμεσο (meda Ζευγαρωτές παρατηρήσεις H 0 : Μ M H H 0 γίνεται αποδεκτή, όταν το πλήθος των αρνητικών (Ν - και θετικών (Ν διαφορών είναι ίσο. Αυτό συμβαίνει όταν το Ν - εμπίπτει στο διάστημα εμπιστοσύνης που προβλέπεται από πίνακες της διωνυμικής κατανομής για το πλήθος των μη μηδενικών διαφορών και για συγκεκριμένο a. Sg_tet.l 3
Όρια εμπιστοσύνης για το N p (διωνυμική κατανομή, p0.05; N0 έως 99 N 0 3 4 5 6 7 8 9 0 - - - - - - 0-6 0-7 0-8 -8 0-9 -0-0 - - 3-3-3 4-3 4-4 4-5 0 5-5 5-6 5-7 6-7 6-8 7-8 7-9 7-0 8-0 8-30 9-9- 9-3 0-3 0-4 -4-5 -5-6 -7 40 3-7 3-8 4-8 4-9 5-9 5-30 5-3 6-3 6-3 7-3 50 7-33 8-33 8-34 8-35 9-35 9-36 0-36 0-37 -37-38 60-39 -39-40 3-40 3-4 4-4 -4 5-4 5-43 5-44 70 6-44 6-45 7-45 7-46 8-46 8-47 8-48 9-48 9-49 30-49 80 30-50 3-50 3-5 3-5 3-5 3-53 33-53 33-54 34-54 34-55 90 35-55 35-56 36-56 36-57 37-57 37-58 37-59 38-59 38-60 39-60 N: πλήθος μη μηδενικών διαφορών ΔΟΚΙΜΑΣΙΑ ΑΘΡΟΙΣΜΑΤΩΝ ΤΑΞΕΩΝ ΚΑΤA WILCOXON Ζευγαρωτές παρατηρήσεις ( H 0 : Μ M Κατατάσσουμε τις απόλυτες τιμές των διαφορών κατά αύξουσα σειρά. Η σειρά εμφάνισης των διαφορών αποτελεί την τάξη τους. Γράφουμε δίπλα σε κάθε διαφορά την τάξη της και το πρόσημό της. Αθροίζουμε τις τάξεις των θετικών διαφορών (Τ Αθροίζουμε τις τάξεις των αρνητικών διαφορών (Τ - 4
Η μηδενική υπόθεση απορρίπτεται όταν: Tm{T,T - } Τ c. (T c από τον πίνακα ΧΙ, πλήθος μη μηδενικών παρατηρήσεων Για > 5 η Τ ακολουθεί κανονική κατανομή. μ T ( 4 Wlc_Sg_Rak_Sum.l 0 Eample.l T μt Z σ T σ T Εναλλακτικά, όταν Τ Τ - Τ - > T p (: πλήθος μη μηδενικών διαφορών ( ( 4 5
Όρια ασφαλείας του δείκτη για τη δοκιμασία προσήμου αθροιστικών τάξεων κατά Wlcoo a0.05 a0.05 Πλήθος διαφορών 0 T 0.95 T 0.975 5 5-6 7 7 4 8 6 30 9 9 35 0 35 39 40 46 44 5 3 49 57 4 55 63 5 60 70 6 66 76 7 7 83 8 77 9 9 84 98 0 90 06 T p Για > 0 z p ( ( 6 Z p : το p εκατοστιαίο σημείο της κανονικής κατανομής ΔΟΚΙΜΑΣΙΑ ΑΘΡΟΙΣΜΑΤΩΝ ΤΑΞΕΩΝ ΚΑΤA MANN-WHITNEY (U-tet Δείγματα διαφορετικού μεγέθους, Διατάσσουμε τις παρατηρήσεις των δύο δειγμάτων σε αύξουσα σειρά, σαν να ανήκαν στον ίδιο πληθυσμό. Σημειώνουμε την τάξη κάθε παρατήρησης. Υπολογίζουμε τα αθροίσματα Τ και Τ των τάξεων για κάθε δείγμα. Τ m {T,T } Εξετάζουμε, αν το Τ εμπίπτει στα όρια αποδοχής που βρίσκουμε σε πίνακες για, και συγκεκριμένη σ.σ. Στον πίνακα το Ν είναι το του δείγματος με το μικρότερο Τ. 6
ΔΟΚΙΜΑΣΙΑ KRUSKAL - WALLIS Μη παραμετρικό ανάλογο της ANOVA H τ.μ. πρέπει να έχει συνεχή κατανομή και να είναι διατάξιμη. Χρησιμοποιούμε τις τάξεις των παρατηρήσεων και τις υποβάλουμε σε ανάλυση των διακυμάνσεων. Υπολογίζουμε τον δείκτη H ο οποίος ακολουθεί την κατανομή χ H ( κ j R j j 3( κ: πλήθος δειγμάτων, j : πλήθος του δείγματος j, Σ j R j : άθροισμα των τάξεων στο δείγμα j Για κ3 και j μέχρι 5 ανατρέχουμε στον πίνακα ΧΙΙ. 7
Στην περίπτωση πολλαπλότητας «μ» των τιμών διορθώνουμε την τιμή του Η διαιρώντας με τον αριθμό C, που λαμβάνει υπόψη το άθροισμα των κύβων των βαθμών πολλαπλότητας καθώς και το άθροισμά των: C 3 3 3 ( μ μ... μ ( μ μ... 3 ρ μ ρ Παραμετρικές δοκιμασίες Δύοανεξάρτητα δείγματα Studet' t tet Κατά ζεύγη Studet' t tet ANOVA Συντελεστής συσχέτισης του Pearo Προϋποθέσεις παραμετρικών δοκιμασιών Τα δεδομένα και των δύο δειγμάτων έχουν συλλεγεί τυχαία Τα δεδομένα και των δύο δειγμάτων προέρχονται από πληθυσμούς με κανονική κατανομή 3 Οι διακυμάνσεις τους είναι ίσες Η διαφορές (d πρέπει να προέρχονται από πληθυσμό διαφορών με κανονική κατανομή Τα δεδομένα όλων των δειγμάτων έχουν συλλεγεί τυχαία Τα δεδομένα όλων των δειγμάτων προέρχονται από πληθυσμούς με κανονική κατανομή 3 Οι διακυμάνσεις τους είναι ίσες Τα δεδομένα Y για κάθε X πρέπει να έχουν συλλεγεί τυχαία από κανονική κατανομή των τιμών Y. Τα δεδομένα X για κάθε Y πρέπει να έχουν συλλεγεί τυχαία από κανονική κατανομή των τιμών X. Μη παραμετρικές εναλλακτικές Ma-Whtey U tet Wlcoo ged rak Krukal-Wall H tet Συντελεστής συσχέτισης τάξεως του Spearma 8