ΚΕΦΑΛΑΙΟ 7 ο ΜΕΘΟ ΟΛΟΓΙΑ ΤΗΣ ΕΡΕΥΝΑΣ

Σχετικά έγγραφα
Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Στατιστική ανάλυση αποτελεσμάτων

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Απαραμετρική Στατιστική. Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς

Αναλυτική Στατιστική

Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών.

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

ΚΕΦΑΛΑΙΟ 5 ΤΟ ΠΛΕΟΝΕΚΤΗΜΑ ΤΩΝ ΥΠΟΨΗΦΙΩΝ ΠΑΛΑΙΟΤΕΡΩΝ ΕΤΩΝ

Στατιστικοί Ελεγχοι. t - Έλεγχος για τον μέσο μ ενός πληθυσμού. t-έλεγχος για την σύγκριση των μέσων δύο πληθυσμών

Διαχείριση Υδατικών Πόρων

Γ. Πειραματισμός - Βιομετρία

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΠΑΡΑΡΤΗΜΑ. Πίνακας 9. Ποσοστιαία Σημεία της Ελεγχοσυνάρτησης των. Προσημασμένων Τάξεων Μεγέθους του Wilcoxon

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Εισόδημα Κατανάλωση

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

Μέθοδος μέγιστης πιθανοφάνειας

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ

Είδη Μεταβλητών. κλίµακα µέτρησης

Διάστημα εμπιστοσύνης της μέσης τιμής

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

Κεφάλαιο 5. Οι δείκτες διασποράς

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

3.4.1 Ο Συντελεστής ρ του Spearman

Κεφάλαιο 13. Εισαγωγή στην. Η Ανάλυση ιακύµανσης

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

07_Έλεγχος_Συχνοτήτων. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

09_Μη παραμετρικοί έλεγχοι υποθέσεων. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Γ. Πειραματισμός Βιομετρία

Χ. Εμμανουηλίδης, 1

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Στατιστική Συμπερασματολογία

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΠΕΡΙΕΧΟΜΕΝΑ. Μέρος Α. ΣΤΑΤΙΣΤΙΚΗ Θεωρία και Εφαρµογές Υπολογιστικοί αλγόριθµοι στον MS-Excel: υπολογισµός και ερµηνεία στατιστικών ευρηµάτων

Περιεχόμενα. Πρόλογος... 15

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ' ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2006 ΕΚΦΩΝΗΣΕΙΣ

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2014

9. Παλινδρόμηση και Συσχέτιση

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα

στατιστική θεωρεία της δειγµατοληψίας

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Γενικευμένα Γραμμικά Μοντέλα (GLM) Επισκόπηση

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Λογιστική Παλινδρόµηση

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Μη Παραµετρικά Κριτήρια. Παραµετρικά Κριτήρια

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΠΑΛΑΙΑ ΘΕΜΑΤΑ ******************************************************

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΑΣΚΗΣΕΙΣ ΜΕΡΟΣ ΙΙ - ΟΙΚΟΝΟΜΕΤΡΙΑ Ι Ι ΑΣΚΩΝ : ΤΣΕΡΚΕΖΟΣ ΙΚΑΙΟΣ ΑΣΚΗΣΗ 1. Ν'αποδειχθεί η σχέση : σ 2 =Ε(Χ 2 )-µ 2 ΑΣΚΗΣΗ 2

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Συνοπτικά περιεχόμενα

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

Transcript:

ΚΕΦΑΛΑΙΟ 7 ο ΜΕΘΟ ΟΛΟΓΙΑ ΤΗΣ ΕΡΕΥΝΑΣ ΕΙΣΑΓΩΓΗ Οι δυό βασικές κατευθύνσεις της ανάλυσης των δεδοµένων της έρευνας, επιχειρούν ανιχνεύοντας τους παράγοντες που προσδιορίζουν την πρόσβαση στις υπηρεσίες υγείας, αφενός την µελέτη της πιθανότητας χρησιµοποίησης των υπηρεσιών υγείας και αφετέρου του µεγέθους της (για την ανάλυση των δεδοµένων της έρευνας χρησιµοποιήθηκαν τα στατιστικά πακέτα SAS και SPSS). Για τον σκοπό της πρώτης περίπτωσης, οι µεταβλητές που εκφράζουν αριθµό επισκέψεων µετατράπηκαν σε δίτιµες µεταβλητές, µε το 1 να αντιστοιχεί στην χρησιµοποίηση των υπηρεσιών υγείας και το 0 στην µη χρησιµοποίηση. Σε πρώτο στάδιο, πραγµατοποίηθηκαν έλεγχοι χ 2 (όπου οι µεταβλητές ήταν σε ονοµαστική κλίµακα) και τάσης (για µεταβλητές σε κλίµακα διάταξης) προκειµένου να ελεγχθεί αν κάθε ένας από τους παράγοντες ξεχωριστά επηρεάζει την χρησιµοποίηση των υπηρεσιών υγείας. Σε δεύτερο στάδιο οι προσδιοριστικοί παράγοντες εξετάσθηκαν απο κοινού µέσω της λογιστικής παλινδρόµησης. Στην δεύτερη περίπτωση όπου το ζητούµενο ήταν η µελέτη του µεγέθους της χρησιµοποίησης των υπηρεσιών υγείας, µετά τους ελέγχους κανονικότητας, που έδειξαν ότι ο αριθµός των επισκέψεων δεν ακολουθεί την κανονική κατανοµή, πραγµατοποιήθηκαν µη παραµετρικοί έλεγχοι Mann Whitney (για διχοτοµικούς παράγοντες), Kruskall Wallis (για µεταβλητές µε περισσότερες από δυό κατηγορίες σε ονοµαστική κλίµακα) και Jokheere (για µεταβλητές σε κλίµακα διάταξης) προκειµένου να ελεγχθεί η ύπαρξη στατιστικά σηµαντικών διαφορών και τάσης στο µέγεθος της χρησιµοποίησης των υπηρεσιών υγείας για κάθε έναν από τους παράγοντες ξεχωριστά. Σε δεύτερο στάδιο οι διάφοροι παράγοντες εξετάσθηκαν από κοινού µέσω της παλινδρόµησης Poisson. 37

7.1 ΜΕΛΕΤΗ ΧΡΗΣΙΜΟΠΟΙΗΣΗΣ ΥΠΗΡΕΣΙΩΝ ΥΓΕΙΑΣ 7.1.1 ΕΛΕΓΧΟΣ χ 2 ΟΜΟΙΟΓΕΝΕΙΑΣ Ο έλεγχος χ 2 οµοιογένειας χρησιµοποιείται στην περίπτωση r ανεξαρτήτων δειγµάτων, τα στοιχεία των οποίων είναι ταξινοµηµένα σε c κατηγορίες και ελέγχει την υπόθεση: H o : οι πληθυσµοί από τους οποίους προήλθαν τα ανεξάρτητα δείγµατα, εκπροσωπούνται σε ίσα ποσοστά στις διάφορες κατηγορίες. H 1 : τουλάχιστον δυό από τους πληθυσµούς από τους οποίους προήλθαν τα ανεξάρτητα δείγµατα, εκπροσωπούνται σε διαφορετικά ποσοστά στις διάφορες κατηγορίες. Θεωρώντας τον rxc πίνακα: Κατηγορία είγµα 1 Ο 11 Ο 12... Ο 1j O 1c n 1 είγµα 2 O 21 O 22 O 2j O 2c n 2... είγµα r O r1 O r2 O rj... O rc n r Σύνολο C 1 C 2... C j C c N µε n i = Ο i1 + Ο i2 +...+ Ο ij + O i c, i=1,2,,r Ci= Ο 1j + O 2J + O Rj, j=1,2,,c και Ν= n 1 + n 2 + +n r, η τιµή της στατιστικής συνάρτησης Τ την οποία συγκρίνουµε µε την τιµή χ 2 1-α,(r- 1)(c-1), δίνεται από την σχέση Τ= ΣΣ(Ο ij -E ij ) 2 /E ij, όπου Ο ij οι παρατηρούµενες συχνότητες και E ij = n i C j /N οι αναµενόµενες. Οταν Τ > χ 2 (r-1)(c-1),1-α η µηδενική υπόθεση απορρίπτεται δηλαδή έχουµε διαφορετικά ποσοστά εκπροσώπησης δυό τουλάχιστον δειγµάτων στις διάφορες κατηγορίες (Armitage, 2002). 38

7.1.2. ΕΛΕΓΧΟΣ χ 2 ΑΝΕΞΑΡΤΗΣΙΑΣ Ο έλεγχος χ 2 ανεξαρτησίας χρησιµοποιείται στην περίπτωση ενός µοναδικού δείγµατος, τα στοιχεία του οποίου είναι ταξινοµηµένα σε r κατηγορίες ως πρός ένα χαρακτηριστικό και σε c ως πρός κάποιο άλλο και ελέγχει την υπόθεση: H o : τα δυό χαρακτηριστικά είναι ανεξάρτητα H 1 : τα δυό χαρακτηριστικά είναι εξαρτηµένα. Θεωρώντας τον rxc πίνακα: Χαρακτηριστικό Α Σύνολο Ο 11 Ο 12... Ο 1j O 1c R 1 O 21 O 22 O 2j O 2c R 2 ΧαρακτηριστικόB O r1 O r2 O rj... O rc R r Σύνολο C 1 C 2... C j C c N µε R i = Ο i1 + Ο i2 +...+ Ο ij + O i c, i=1,2,,r Ci= Ο 1j + O 2J + O Rj, j=1,2,,c και Ν= n 1 + n 2 + +n r, η τιµή της στατιστικής συνάρτησης Τ την οποία συγκρίνουµε µε την τιµή χ 2 1-α,(r- 1)(c-1), δίνεται από την σχέση Τ= ΣΣ(Ο ij -E ij ) 2 /E ij, όπου Ο ij οι παρατηρούµενες συχνότητες και E ij =N(R i /N)(C j /N) οι αναµενόµενες. Οταν Τ > χ 2 (r-1)(c-1),1-α η µηδενική υπόθεση απορρίπτεται, δηλαδή τα δυό χαρακτηριστικά είναι εξαρτηµένα (Rosner, 2000, Pagano-Gauvreau, 2000). 7.1.3 ΕΛΕΓΧΟΣ ΤΑΣΗΣ Οι έλεγχοι χ 2 είναι προτιµότερο να χρησιµοποιούνται για δεδοµένα σε ονοµαστική κλίµακα. Στην περίπτωση που η µια µεταβλητή είναι σε κλίµακα διάταξης και η άλλη δίτιµη ενδείκνυται έλεγχος τάσης. Θεωρώντας τον πίνακα: X=1 X=2... X= r Σύνολο Y=0 n 01 n 02 n 0r n0. Y=1 n 11 n 12 n 1r n1. Σύνολο n.1 n.2 n.r n.. 39

µε r> >2>1 για την µεταβλητή X οι υποθέσεις: H 0 : δεν υπάρχει τάση Η 1 : υπάρχει τάση, ελέγχονται µέσω της σύγκρισης της τιµής b 2 /V(b xy ) µε την τιµή χ 2 1,(1-α) όπου b xy = C yx /C xx και V(b xy ) = (1/n..)C yy /C xx, µε C yx = ΣΣ n ij y i x j (Σn i. y i )(Σn.j x j )/n.. Cxx= Σ n. j x 2 j (Σn.j x j ) 2 /n.. και C yy = Σ n i. y 2 i (Σn i. yi) 2 /n... Οταν b 2 /V(b xy ) > χ 2 1,(1-α) απορρίπτεται η µηδενική υπόθεση, δηλαδή υπάρχει τάση (Everit, 1980). 7.1.4. ΛΟΓΙΣΤΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ Η λογιστική παλινδρόµηση χρησιµοποιείται στις περιπτώσεις που η εξαρτηµένη µεταβλητή είναι δίτιµη (0,1). Στην απλή περίπτωση της µιάς ανεξάρτητης µεταβλητής, δεδοµένου ότι π(χ)=ε(υ δεδοµένου χ), το υπόδειγµα µπορεί να εκφρασθεί ως: π(χ)=exp(β 0 +β 1 χ)/1+ exp(β 0 +β 1 χ), ή χρησιµοποιώντας έναν µετασχηµατισµό γνωστό ως logit transformation σαν: g(χ)=ln[π(χ)/1-π(χ)]= β 0 +β 1 χ. Ισχύει δε ότι y= π(χ) +ε, µε το ε να παίρνει την τιµή ε = 1-π(χ) µε πιθανότητα π(χ) όταν y=1 και ε= -π(χ) µε πιθανότητα 1-π(χ) όταν y=0. Η κατανοµή των ε έχει µέσο 0 και διακύµανση π(χ)/1-π(χ). Η µέθοδος η οποία χρησιµοποιείται για την εκτίµηση των συντελεστών της λογιστικής παλινδρόµησης είναι γνωστή ως µέθοδος µεγιστοποίησης της πιθανότητας (maximum likelihood method). Eνας εύχρηστος τρόπος να εκφρασθεί η συνεισφορά κάθε ζεύγους (χ i,y i ) στην συνάρτηση πιθανότητας είναι µέσω του όρου : ξ(χ i ) = π(χ i ) yi [1-π(χ i )] 1-yi. εδοµένου ότι οι παρατηρήσεις θεωρούνται ανεξάρτητες η συνάρτηση πιθανότητας υπολογίζεται ως: l(β)=π ξ(χ i ). 40

Ως εκτίµηση του β χρησιµοποιείται η τιµή που µεγιστοποιεί το l(β). Ωστόσο, µαθηµατικά είναι ευκολότερη η χρήση του L(β)= ln[l(β)]. Υπολογισµός των τιµών του β που µεγιστοποιούν την ποσότητα L(β) προκύπτει µε διαφόριση του L(β) ως πρός β 0 και β 1 και θέτοντας τις αντίστοιχες εκφράσεις ίσες µε µηδέν. Οι εξισώσεις που προκύπτουν από αυτή την διαδικασία είναι οι: Σ[y i -π(χ i )]=0 Σχ i [y i -π(χ i )]=0. Μετά τον υπολογισµό των συντελεστών πρέπει να ελεγχθεί η σηµαντικότητα τους. Αυτό ισοδυναµεί µε έλεγχο του κατά πόσο το υπόδειγµα που περιέχει την µεταβλητή «µας λέει περισσότερα» σε σχέση µε αυτό που δεν την περιέχει. Για τον σκοπό του συγκεκριµένου ελέγχου υπολογίζεται η ποσότητα: G=-2ln(πιθανότητα µε την µεταβλητή/πιθανότητα χωρίς την µεταβλητή) η οποία κάτω από την µηδενική υπόθεση ότι β 1 =0 ακολουθεί χ 2 κατανοµή µε έναν βαθµό ελευθερίας. Ενας άλλος έλεγχος είναι ο έλεγχος Wald σύµφωνα µε τον οποίον υπολογίζεται η ποσότητα: W= β 1hat /se(β 1hat ), που κάτω από την µηδενική υπόθεση ακολουθεί την τυποποιηµένη κανονική κατανοµή. Οσον αφορά την πολλαπλή λογιστική παλινδρόµηση, έστω π(χ)=pr(y=1 δεδοµένου χ). Τότε θα ισχύει g(χ)=β 0 +β 1 χ 1 +...+β p χ p και π(χ)=exp[g(χ)]/1+exp[g(χ)]. Οι εξισώσεις που δίνουν τους συντελεστές είναι δε οι εξής: Σ[y i -π(χ i )]=0 Σχ ij [y i -π(χ i )]=0 Η σηµαντικότητα και των p µεταβλητών που περιέχονται στο υπόδειγµα ελέγχεται µέσω του G που κάτω από την µηδενική υπόθεση ότι όλοι οισυντελεστές β των p µεταβλητών είναι ίσοι µε µηδέν, ακολουθεί χ 2 κατανοµή µε p βαθµούς ελευθερίας. Ωστόσο επειδή το επιθυµητό είναι το υποδειγµά µας να περιέχει όσο το δυνατόν λιγότερες µεταβλητές συγκρίνονται µεταξύ τους υποδείγµατα που διαφέρουν κατά ένα ως πρός τον αριθµό των ανεξαρτήτων µεταβλητών µέσω του G που ακολουθεί κατανοµή χ 2 µε 1 βαθµό ελευθερίας. Η προσαρµογή των υποδειγµάτων ελέγχεται µε το Hosmer & Lemeshow test που υπολογίζει την ποσότητα C hat =Σ(ο κ -n π mean κ ) 2 /n π mean κ (1-π mean κ ) για g οµάδες 41

µε n τον αριθµό των παρατηρήσεων στην κ οµάδα, o κ το άθροισµα των Υ τιµών για την κ οµάδα και π mean κ το µέσο π hat για την κ οµάδα. Μικρές τιµές του C hat και µεγάλες για τα παρατηρούµενα επίπεδα σηµαντικότητας δείχνουν καλή προσαρµογή του υποδείγµατος (Hosmer-Lemeshow, 1989). 7.2 ΜΕΛΕΤΗ ΜΕΓΕΘΟΥΣ ΧΡΗΣΙΜΟΠΟΙΗΣΗΣ 7.2.1. ΕΛΕΓΧΟΣ MANN-WHITNEY-U Ως έλεγχος Mann-Whitney θεωρείται το µη παραµετρικό ανάλογο του t-test για δυό ανεξάρτητα δείγµατα ελέγχει δε τις υποθέσεις: H o : οι n 1 χ i παρατηρήσεις του πληθυσµού Χ κατανέµονται ακριβώς όπως και οι n 2 y j παρατηρήσεις του πληθυσµού Υ. H 1 : οι n 1 χ i παρατηρήσεις του πληθυσµού Χ κατανέµονται διαφορετικά από τις n 2 y j παρατηρήσεις του πληθυσµού Υ. Σε σχέση µε τις πρακτικές εφαρµογές, η διαφορά µεταξύ των συναρτήσεων κατανοµής δυό πληθυσµών, αναφέρεται στην διαφορά της θέσης των δυό κατανοµών οπότε οι υποθέσεις που ελέγχονται είναι: H o : Ε(Χ) = Ε(Υ) H 1 : Ε(Χ) Ε(Υ). Η ελεγχοσυνάρτηση που χρησιµοποιείται στην περίπτωση που υπάρχει ταύτιση τιµών είναι η : T =[ ΣR(x i )- n 1 (Ν+1)/2]/ {[n 1 n 2 /N(N-1)]ΣR 2 i }-{ n 1 n 2 (N+1) 2 /4(N- 1)}, µε R(x i ): βαθµός των x i παρατηρήσεων στο συνενωµένο δείγµα N= n 1 +n 2 και ΣR 2 i : άθροισµα τεραγώνων των Ν µέσων βαθµών που χρησιµοποιούνται στο συνενωµένο δείγµα. Ο έλεγχος πραγµατοποιείται µε σύγκριση της Τ µε τα ποσοστιαία σηµεία της τυποποιηµένης κανονικής κατανοµής (Ξεκαλάκη, 2001). 42

7.2.2. ΕΛΕΓΧΟΣ KRUSKAL-WALLIS Ο έλεγχος KRUSKAL-WALLIS είναι η µη παραµετρική ανάλυση διακύµανσης και ελέγχει τις υποθέσεις: H o : οι συναρτήσεις κατανοµής κ πληθυσµών είναι ίσες H 1 : δυό τουλάχιστον από τους κ πληθυσµούς έχουν διαφορετικές µέσες τιµές. Η ελεγχοσυνάρτηση που χρησιµοποιείται είναι η: T=12/N(N+1)[{(ΣR 2 1 )/n 1 }+ +{(ΣR 2 κ )/n κ }] 3(Ν+1) µε R i = τις τάξεις µεγέθους των κ ανεξάρτητων πληθυσµών σε συνενωµένο δείγµα Ν= n 1 +...+ n κ. Η απόφαση λαµβάνεται µε σύγκριση της τιµής της ελεγχοσυνάρτησης Τ µε την τιµή χ 2 (κ-1),1-α (Mason-Lind, 1996). 7.2.3. ΕΛΕΓΧΟΣ JONCKHEERE Ο έλεγχος Jonckheere χρησιµοποιείται όταν κ ανεξάρτητες οµάδες τις οποίες θέλουµε να ελέγξουµε ως πρός την ισότητα των διαµέσων τους είναι εκφρασµένες σε κλίµακα διάταξης. Αντιστοιχίζοντας τον αριθµό 1 στην οµάδα µε την µικρότερη υποτιθέµενη διάµεσο και το κ (κ>>κ-1>...>1) στην οµάδα µε την µεγαλύτερη διάµεσο οι υποθέσεις που διατυπώνονται είναι οι: H o : διάµεσος 1 = διάµεσος 2 =...=διάµεσος κ H 1 : διάµεσος 1 <διάµεσος 2 <...<διάµεσος κ. Η ελεγχοσυνάρτηση που χρησιµοποιείται είναι η : J=ΣΣU ij µε U ij = Σ#(Χ hi,j) και #(Χ hi,j) να εκφράζει τον αριθµό των φορών που η µονάδα Χ hi είναι µικρότερη από µια µονάδα στο δείγµα j για i<j. Για µεγάλα δείγµατα χρησιµοποιείται η ελεγχοσυνάρτηση J*=J-µ j /σ j h η οποία ακολουθεί κανονική κατανοµή µε µέσο 0 και τυπική απόκλιση 1 (Siegel- Castellan, 1988.) 43

7.2.4. ΠΑΛΙΝ ΡΟΜΗΣΗ POISSON Η παλινδρόµηση Poisson χρησιµοποιείται όταν η εξαρτηµένη µεταβλητή εκφράζει αριθµό γεγονότων (counts). Kάτω από την υπόθεση ότι η µεταβλητή Υ ακολουθεί την κατανοµή Poisson µε µέσο µ και Var(y)=µ ισχύει ότι: Pr Yi (y i,µ i )= µ yi i e -µi /y i! για κάθε y i =0,1,2... και n i =1,2,...n. Επειδή Ε(Υ i )=µ i = l i λ(x i,β) ισχύει τελικά ότι Pr Yi (y i,β)= Pr Yi (Υ=y i,β)=[ l i λ(x i,β)] yi e - liλ(xi,β) / y i!. Εποµένως η συνάρτηση πιθανότητας για την παλινδρόµηση Poisson είναι η L(y,β)= Π Pr Yi (y i,β). Οι συντελεστές β υπολογίζονται από τις εξισώσεις ln[l(y,β)]/ β j =0 οπότε τα υποδείγµατα είναι της µορφής : ln(µ Υ )= β 0 +β 1 Χ 1 +β 2 Χ 2 +...+β p X p Η προσαρµογή του µοντέλου ελέγχεται συνήθως µε τον έλεγχο καλής προσαρµογής που εξετάζει το πηλίκο των τιµών των συναρτήσεων πιθανότητας (likelihood ratio ή αλλιώς deviance:απόκλιση) (Likelihood Ratio (or Deviance) Goodness of fit test) και ελέγχει τις υποθέσεις: H o : ln(µ Υ )= β 0 +β 1 Χ 1 +β 2 Χ 2 +...+β p X p H 1 : ln(µ Υ ) β 0 +β 1 Χ 1 +β 2 Χ 2 +...+β p X p. Aφού υπολογιστεί η ποσότητα D=-2ln[L(y,β hat )/L(y,µ at )] που καλείται λογάριθµος του πηλίκου των τιµών των συναρτήσεων πιθανοτήτων είτε απόκλιση (likelihood ratio ή deviance) το παρατηρούµενο επίπεδο σηµαντικότητας δίνεται από την σχέση: p=p(απόκλιση από την τιµή που υπολογίστηκε) που ακολουθεί την χ 2 n-(p+1). Σύγκριση µεταξύ δύο υποδειγµάτων γίνεται µέσω της διαφοράς της απόκλισης των δύο υποδειγµάτων (Drop in Deviance test (DiD test)), όπου: DiD= Απόκλιση περιορισµένου υποδείγµατος - Απόκλιση πλήρους υποδείγµατος, df=df(πλήρους υποδείγµατος)-df(περιορισµένου υποδείγµατος) και p= P(χ 2 df DiD). 44

Οπως και στην λογιστική παλινδρόµηση η σηµαντικότητα των επιµέρους µεταβλητών ελέγχεται µε το Wald test. Ενα πρόβληµα που συνήθως συναντάται στην παλινδρόµηση Poisson είναι η µεγάλη διακύµανση (overdispersion) δηλαδή όταν η διακύµανση είναι µεγαλύτερη από τον µέσο. Το πρόβληµα αυτό λύνεται χρησιµοποιώντας ως 2 κατανοµή ανταπόκρισης την συνάρτηση Q(µ;y)= ( y t) / σ V ( t) dt, όπου σ 2 V(µ) η διακύµανση της Υ και σ>1 (Mc Gullagh-Nelder, 1997, Kleinbaum-Kupper- Muller, 1988). µ y 45

46