Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS



Σχετικά έγγραφα
Γενικευμένα Γραμμικά Μοντέλα (GLM) Επισκόπηση

ΓΙΑΓΚΟΥ ΔΗΜΗΤΡΙΟΣ. Επιβλέπων: Γιώργος Γιαννής, Καθηγητής ΕΜΠ. Αθήνα, Ιούλιος 2018 ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ

Άσκηση 10, σελ Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

τατιστική στην Εκπαίδευση II

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

Εισαγωγή στην Ανάλυση Διακύμανσης

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Λογιστική Παλινδρόµηση

Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Εισαγωγή στην Ανάλυση Συνδιακύμανσης (Analysis of Covariance, ANCOVA)

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

Λυμένες Ασκήσεις για το μάθημα:

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

SECTION II: PROBABILITY MODELS


1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

Κεφάλαιο 15. Παραγοντική ανάλυση διακύµανσης. Παραγοντική

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Επαναληπτικό μάθημα GLM

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Supplementary figures

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

ΤΕΙ ΗΠΕΙΡΟΥ ΣΧΟΛΗ ΕΠΑΓΓΕΛΜΑΤΩΝ ΥΓΕΙΑΣ ΚΑΙ ΠΡΟΝΟΙΑΣ ΤΜΗΜΑ ΛΟΓΟΘΕΡΑΠΕΙΑΣ. Μεγγίσογλου Ευθυμία Ξενογιώργη Αικατερίνη Σβολιανίτη Χριστίνα

2. ΕΠΙΛΟΓΗ ΤΟΥ ΜΕΓΕΘΟΥΣ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

τατιςτική ςτην Εκπαίδευςη II

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

Απλή Ευθύγραµµη Συµµεταβολή

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

χ 2 test ανεξαρτησίας

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ. Εαρινό εξάµηνο ακαδηµαϊκού έτους ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. Εργασία 4 - Ενδεικτική λύση

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Μέτρηση της ποιότητας ζωής των ασθενών μετά από διαδερμική τοποθέτηση αορτικής βαλβίδας (TAVI) στο Π.Γ.Ν.Ιωαννίνων

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Table 1: Military Service: Models. Model 1 Model 2 Model 3 Model 4 Model 5 Model 6 Model 7 Model 8 Model 9 num unemployed mili mili num unemployed

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

519.22(07.07) 78 : ( ) /.. ; c (07.07) , , 2008

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests)

Βοήθημα Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

Εισαγωγή στη Βιοστατιστική

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΛΟΓΙΣΤΙΚΗ ΕΞΑΡΤΗΣΗ. Πρώτα θα δούμε την επίδραση των παραπάνω παραγόντων με διμεταβλητή ανάλυση: Variables in the Equation

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

1991 US Social Survey.sav

Η βιτρίνα των καταστημάτων ως εργαλείο δημοσίων σχέσεων. Ονοματεπώνυμο: Ειρήνη Πορτάλιου Σειρά: 8 η Επιβλέπουσα: Αν. Καθηγήτρια : Βεντούρα Ζωή

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Στατιστική Επιχειρήσεων Ι

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

Άσκηση 2. i β. 1 ου έτους (Υ i )

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

Σύγκριση Συνδυασµένων Παραγόντων

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION)

Ιατρικά Μαθηματικά & Βιοστατιστική

Wan Nor Arifin under the Creative Commons Attribution-ShareAlike 4.0 International License. 1 Introduction 1

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

Summary of the model specified

ΑΝΑΛΥΣΗ ΚΟΣΤΟΥΣ ΟΦΕΛΟΥΣ ΣΤΟΝ ΚΛΑΔΟ ΤΗΣ ΕΝΕΡΓΕΙΑΣ

«ΘΥΜΑΤΟΠΟΙΗΣΗ ΚΑΙ ΦΟΒΟΣ ΤΟΥ ΕΓΚΛΗΜΑΤΟΣ ΣΤΟ ΔΙΑΔΙΚΤΥΟ»

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 12 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση) [µέρος 2ο]

Generalized additive models in R

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

Σπουδαστές Γιαννουλάκης Αντρέας Α.Μ Τσουρουνάκης 'Αγγελος Α.Μ Μουτουσίδου Πόπη Α.Μ Εισηγητής: Ταφιάδης Χρ.

ΜΑΘΗΜΑ 4 ο. Μοναδιαία ρίζα

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

Does anemia contribute to end-organ dysfunction in ICU patients Statistical Analysis

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Transcript:

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Ο παρακάτω πίνακας παρουσιάζει θανάτους από καρδιακή ανεπάρκεια ανάμεσα σε άνδρες γιατρούς οι οποίοι έχουν κατηγοριοποιηθεί κατά ηλικία και κάπνισμα το 1951 στη Βρετανία. (δεδομένα από Altham, Lecture notes in GLM) Καπνιστές Μη καπνιστές Ηλικία Θάνατοι Ανθρωποέτη Θάνατοι Ανθρωποέτη 35-44 32 52407 2 18790 45-54 104 43248 12 10673 55-64 206 28612 28 5710 65-74 186 12663 28 2585 75-84 102 5317 31 1462 Προσπαθήστε να μοντελοποιήσετε τα δεδομένα του παραπάνω προβλήματος σκεπτόμενοι ότι οι θάνατοι είναι ανάλογοι των ανθρωποετών (αριθμός ανθρώπων από τους οποίους ελήφθησαν τα δεδομένα σε όλα τα χρόνια που διήρκησε η έρευνα). Η μοντελοποίηση πρέπει να γίνει λαμβάνοντας υπόψι ότι πρέπει να απαντηθούν τα παρακάτω ερωτήματα: Ο ρυθμός θανάτου είναι μεγαλύτερος για τους καπνιστές από τους μη καπνιστές? Αν ναι πόσο πολύ? Υπάρχει επίδραση της ηλικίας στο ρυθμό θανάτου? Γράψτε το κατάλληλο μοντέλο που απαντάει σε αυτές τις ερωτήσεις ερμηνεύοντας κατάλληλα και τις παραμέτρους του. Απάντηση: Η εξαρτημένη μεταβλητή deaths αντιστοιχεί στον αριθμό των θανάτων. Ως επεξηγηματικές μεταβλητές έχουμε τους παράγοντες ηλικία (age) και το αν ο αντίστοιχος γιατρός είναι καπνιστής ή όχι. Η ηλικία κατηγοριοποιείται ως εξής: Ηλικία 35-44 :1 45-54 :2 55-64 :3 65-74 :4 75-84 :5

επίσης θεωρούμε τη ψευδομεταβλητή smoke=1 αν είναι καπνιστής και 0 διαφορετικά. Μέσω του γραφήματος, το οποίο παρουσιάζει τους θανάτους ανά ανθρωποέτη (ρυθμός θανάτων) συναρτήσει της ηλικιακής ομάδας για τους καπνιστές και τους μη καπνιστές, παρατηρούμε ότι με εξαίρεση την ηλικιακή ομάδα 75-84, ο ρυθμός θανάτου είναι μεγαλύτερος στους καπνιστές από τον αντίστοιχο στους μη καπνιστές, ενώ όσο μεγαλώνει η ηλικία μεγαλώνει και η διαφορά των ρυθμών θανάτου στις 2 ομάδες. Παρατηρούμε ότι η σχέση μεταξύ ρυθμών θανάτου και ηλικίας δεν είναι γραμμική, για αυτό θα συμπεριλάβουμε στην ανάλυση μας ως επεξηγηματική μεταβλητή και το τετράγωνο της ηλικίας, age 2 καθώς επίσης και όρο αλληλεπίδρασης μεταξύ του παράγοντα κάπνισμα και της ηλικίας. Συγκεκριμένα, θα προσαρμόσουμε μοντέλο Poisson με offset το λογάριθμο των ανθρωποετών της μορφής, 2 log deaths 0 1smoke 2age 3age 4( age* smoke) population 2 log deaths smoke age age ( age* smoke) offset. 0 1 2 3 4 Στο SPSS, από τις επιλογές των Generalized Linear Models, επιλέγουμε Poisson μοντέλο με συνάρτηση σύνδεσης τη log. Τα αποτελέσματα της ανάλυσης είναι τα ακόλουθα, Model Information Dependent Variable Probability Distribution Link Function Offset Variable deaths Poisson Log offs

Case Processing Summary N Percent Included 10 100,0% Excluded 0,0% Total 10 100,0% Continuous Variable Information N Minimum Maximum Mean Std. Deviation Dependent Variable deaths 10 2 206 73,10 73,422 Covariate Τετράγωνο της ηλικίας 10 1,00 25,00 11,0000 9,11653 smoke*age 10,00 5,00 1,5000 1,90029 smoke 10 0 1,50,527 age 10 1 5 3,00 1,491 Offset offs 10 7,29 10,87 9,2740 1,18561 Μέτρα καλής προσαρμογής του μοντέλου: Goodness of Fit b Value df Value/df Deviance 1,635 5,327 Scaled Deviance 1,635 5 Pearson Chi-Square 1,550 5,310 Scaled Pearson Chi-Square 1,550 5 Log Likelihood a -28,352 Akaike's Information Criterion (AIC) Finite Sample Corrected AIC (AICC) Bayesian Information Criterion (BIC) 66,703 81,703 68,216 Consistent AIC (CAIC) 73,216

Dependent Variable: deaths Model: (Intercept), age, smoke, age2, smokage, offset = offs a. The full log likelihood function is displayed and used in computing information criteria. b. Information criteria are in small-is-better form. Το μοντέλο που εκτιμήθηκε βελτιώνει την ικανότητα πρόβλεψης μας σε σχέση με μοντέλο όπου όλοι οι συντελεστές πλην του σταθερού όρου είναι μηδέν: Omnibus Test a Likelihood Ratio Chi-Square df Sig. 933,432 4,000 Dependent Variable: deaths Model: (Intercept), age, smoke, age2, smokage, offset = offs a. Compares the fitted model against the intercept-only model. Tests of Model Effects Type III Source Wald Chi-Square df Sig. (Intercept) 574,924 1,000 age 130,604 1,000 smoke 14,989 1,000 age2 52,173 1,000 smokage 10,044 1,002 Dependent Variable: deaths Model: (Intercept), age, smoke, age2, smokage, offset = offs Οι συντελεστές είναι στατιστικά σημαντικοί, συμπεριλαμβανομένου και του όρου αλληλεπίδρασης των παραγόντων:

Parameter Estimates 95% Wald Confidence 95% Wald Confidence Interval Hypothesis Test Interval for Exp(B) Paramete r B Std. Error Lower Upper Wald Chi- Square df Sig. Exp(B) Lower Upper (Intercept ) -10,792,4501-11,674-9,910 574,924 1,000 2,057E-5 8,513E-6 4,969E-5 age 2,376,2079 1,969 2,784 130,604 1,000 10,767 7,163 16,184 smoke 1,441,3722,711 2,170 14,989 1,000 4,225 2,037 8,762 age2 -,198,0274 -,251 -,144 52,173 1,000,821,778,866 smokage -,308,0970 -,498 -,117 10,044 1,002,735,608,889 (Scale) 1 a Dependent Variable: deaths Model: (Intercept), age, smoke, age2, smokage, offset = offs a. Fixed at the displayed value. Το μοντέλο που εκτιμήθηκε είναι: 2 log deaths 10, 792 1, 441smoke 2,376age 0,198age 0,308( age* smoke) offset, όπου όλοι οι συντελεστές είναι στατιστικά σημαντικοί. Συνεπώς η πιθανότητα θανάτου από καρδιακή ανεπάρκεια επηρεάζεται από τον αν είναι κάποιος καπνιστής ή όχι αλλά και από την ηλικία του. Από τη στήλη Exp(B) του πίνακα των εκτιμημένων συντελεστών συμπεραίνουμε ότι σταθερών των υπολοίπων μεταβλητών το ρίσκο θανάτου για τους καπνιστές είναι 4,2 φορές μεγαλύτερο έναντι των μη καπνιστών. Η καλή προσαρμογή του μοντέλου γίνεται αισθητή και στο γράφημα που ακολουθεί όπου παρουσιάζονται οι προβλεπόμενοι από το μοντέλο θάνατοι προς την ηλικία, για τους καπνιστές και τους μη καπνιστές σε σύγκριση με τις παρατηρούμενες τιμές.