Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Πολλαπλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 7 (συνέχεια)



Σχετικά έγγραφα
Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Α1.2 Παράδειγµα 1 (συνέχεια) Α1. ΙΤΙΜΕΣ ΚΑΤΗΓΟΡΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ΣΕ ΕΞΑΡΤΗΜΕΝΑ ΕΙΓΜΑΤΑ Παράδειγµα 1: αρτηριακή πίεση

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

StatXact ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. StatXact. ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 - συνέχεια ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ StatXact

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ& ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

Αναλυτική Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ ΠΡΩΤΟ

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ& ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Μοντέλα Πολλαπλής Παλινδρόμησης

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

1. Θα χρησιμοποιηθεί το αρχείο Ο γονικός έλεγχος στην εφηβική ηλικία. Στο. i. Με ποιες μεταβλητές που αφορούν σε σχέσεις εφήβων με τους γονείς τους

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

UNIVERSITY OF THESSALY FACULTY OF ENGINEERING DEPARTMENT OF PLANNINGAND REGIONAL DEVELOPMENT MASTER «EUROPEAN REGIONAL DEVELOPMENT STUDIES»

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Εισόδημα Κατανάλωση

Περιεχόμενα. Πρόλογος... 15

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΒΑΣΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΕΙΡΩΝ ΚΑΝΟΝΙΚΟΤΗΤΑ

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 11 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση)

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης

Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

ΚΕΦΑΛΑΙΟ 5 ΤΟ ΠΛΕΟΝΕΚΤΗΜΑ ΤΩΝ ΥΠΟΨΗΦΙΩΝ ΠΑΛΑΙΟΤΕΡΩΝ ΕΤΩΝ

Ενότητα 4 η : Ανάλυση ερευνητικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

Στατιστική Επιχειρήσεων Ι

Πολλαπλή παλινδρόμηση (Multivariate regression)

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ. Εαρινό εξάµηνο ακαδηµαϊκού έτους ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. Εργασία 4 - Ενδεικτική λύση

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου

Κλινική Επιδηµιολογία

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

Συσχέτιση και Παλινδρόμηση Correlation and Regression. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Βιοστατιστικής

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

Εργασία στο µάθηµα Ανάλυση εδοµένων

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

Στατιστικές Υποθέσεις

ΠΑΛΙΝ ΡΟΜΗΣΗ..Π.Μ.Σ. Μαθηµατικά των Υπολογιστών και των Αποφάσεων. Πάτρα, 27 Ιανουαρίου 2011

ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 4: ΔΙΑΛΕΞΗ 04

Εισαγωγή στην Ανάλυση Δεδομένων

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Ποσοτική & Ποιοτική Ανάλυση εδομένων Συσχέτιση. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη,

Κεφάλαιο 5. Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας

Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Μοντέλο πρόβλεψης αγοραίων αξιών ακινήτων βάσει των μεθόδων OLS και GWR με χρήση GIS Η περίπτωση του Δήμου Θεσσαλονίκης

Παραβίασητωνβασικώνυποθέσεωντηςπαλινδρόμησης (Violation of the assumptions of the classical linear regression model)

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΑ» και «ΝΕΚΑ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 12 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση) [µέρος 2ο]

6 / 4 / Βιοστατιστικός, MSc, PhD

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

Transcript:

ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΜΑΘΗΜΑ 12β ΕΡΓΑΣΤΗΡΙΟ 4β ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΜΕ ΤΗΝ ΧΡΗΣΗ SPSS 1. Πολλαπλή γραµµική παλινδρόµηση Παράδειγµα 7: ιάρκεια νοσηλείας Έχουµε στη διάθεσή µας δεδοµένα για 25 άτοµα που νοσηλεύτηκαν σε κάποιο νοσοκοµείο. (Rosner 1995) Μας ενδιαφέρει να διερευνήσουµε τους παράγοντες που καθορίζουν το χρόνο παραµονής ασθενών στο νοσοκοµείο. (θα πρέπει όλοι να έχουν στον υπολογιστή τους το data set: hospital.sav) 1 3 Στόχος µαθήµατος: Πως µπορούµε να συσχετίσουµε µία συνεχή µεταβλητή απόκρισης (Υ) που ακολουθεί την κανονική κατανοµή, µε περισσότερες από µία επεξηγηµατικές µεταβλητές (Χ) (συνεχής, ή και κατηγορικές 0-1). n=25 άτοµα Μεταβλητές: Κωδικός αριθµός ιάρκεια νοσηλείας (ηµέρες) Ηλικία Φύλο Θερµοκρασία κατά την εισαγωγή WBC(x1000) κατά την εισαγωγή Λήψη αντιβιοτικού (1-ναι, 2-όχι) Υπηρεσία (1-φάρµακα, 2- εγχείρηση) 1.2 Παράδειγµα 7 (συνέχεια) 2 4 1 2

1.3 ιερεύνηση δεδοµένων στο SPSS Ακολουθώντας: Utilities>File Info, ενηµερωνόµαστε για τα δεδοµένα του αρχείου (µεταβλητές, ονοµασίες, τύπος κλπ) 1.4.1 ιαγραµµατική απεικόνιση Graphs>Scatter: matrix ΕΠΙΛΕΓΟΥΜΕ ΟΛΕΣ ΤΙΣ ΣΥΝΕΧΕΙΣ ΜΕΤΑΒΛΗΤΕΣ 5 7 1.4 Ανάλυση 1.4.1 ιαγραµµατική απεικόνιση (συνέχεια) ιαγραµµατική απεικόνιση (Scatter-plots) είκτες συσχέτισης Μοντέλο Παλινδρόµησης Επιλογή Μεταβλητών Έλεγχος πολυσυγγραµικότητας??? ΘΑ ΤΟ ΚΑΝΟΥΜΕ ΑΥΤΟ??? Έλεγχος Προϋποθέσεων (Ανάλυση καταλοίπων) ΠΑΡΑΤΗΡΗΣ ΕΙΣ???? 6 8 3 4

1.4.2 Σύντοµοι προκαταρκτικοί έλεγχοι: α/κανονικότητα: έλεγχοι υποθέσεων Analyze> Descriptive Statistics> Explore (όλες τις συνεχείς µεταβλητές) «Plots»: Normality plots with tests 1.5.3 Σύντοµοι προκαταρκτικοί έλεγχοι: β/συσχέτιση: δείκτης γραµµικής συσχέτισης Pearson Analyze> Correlate> Bivariate 9 11 1.4.2 Σύντοµοι προκαταρκτικοί έλεγχοι: α/κανονικότητα: έλεγχοι υποθέσεων (συνέχεια) ΑΛΛΟ ΣΧΟΛΙΟ? 1.5.3 Σύντοµοι προκαταρκτικοί έλεγχοι: β/συσχέτιση: δείκτης γραµµικής συσχέτισης Pearson (συνέχεια) QQ Plots και έλεγχοι υποθέσεων κανονικότητας των K-S ΧΡΕΙΑΖΕΤΑΙ ΝΑ ΚΑΝΩ (µε correction) & S-W TRANSFORMATION ΤΟΥ DURATION??? Μόνο εδώ στατιστικά σηµαντική σχέση Από τους ελέγχους όλων των συνεχών, µόνο για την «διάρκεια» απορρίπτουµε την υπόθεση της ακολουθίας κανονικής κατανοµής 10 Οι τιµές των r(συντελεστή συσχέτισης) είναι σχετικά χαµηλές. ιάρκεια νοσηλείας ηλικία: θετική ιάρκεια νοσηλείας θερµοκρασία: θετική ιάρκεια νοσηλείας WBC: αρνητική Κανένας έλεγχος από τους παραπάνω στατιστικά σηµαντικός δεν απορρίπτουµε την Η 0 :ρ=0 δηλαδή καµία σχέση σηµαντικά ισχυρή 12 5 6

2. Πολλαπλή γραµµική παλινδρόµηση Πριν προχωρήσουµε στην εκτέλεση της πολλαπλής γραµµικής παλινδρόµησης ελέγχουµε τις µεταβλητές που θέλουµε να συµπεριλάβουµε στο µοντέλο. Α) συνεχείς Β) δίτιµες κατηγορικές: µε την µορφή 0-1!!!!!! 2.1 Πολλαπλή γραµµική παλινδρόµηση 2.1.1 Μετασχηµατισµός δεδοµένων (συνέχεια)!!! ΠΡΟΣΟΧΗ ΟΤΑΝ ΜΕΤΑΣΧΗΜΑΤΙΖΟΥΜΕ ΜΕΣΑ ΣΤΙΣ Ι ΙΕΣ ΜΕΤΑΒΛΗΤΕΣ Μέσα στις ίδιες µεταβλητές αλλάζουµε την τιµή 2 0 και αφήνουµε την1 ως έχει 13 15 2.1 Πολλαπλή γραµµική παλινδρόµηση 2.1.1 Μετασχηµατισµός δεδοµένων Οι κατηγορικές µας µεταβλητές παίρνουν τιµές: 1-2 Θα πρέπει να τις µετασχηµατίσουµε σε0-1 2.1 Πολλαπλή γραµµική παλινδρόµηση 2.1.1 Μετασχηµατισµός δεδοµένων (συνέχεια) Προσαρµόζουµε κατάλληλα τα labels των τιµών και σιγουρευόµαστε ότι έχουµε κάνει σωστή µετατροπή των δεδοµένων 14 16 7 8

2.2.2 Πολλαπλή γραµµική παλινδρόµηση στο SPSS 2.2.3 Πολλαπλή γραµµική παλινδρόµηση: συνοπτικός πίνακας µοντέλου (συνέχεια) Analyze>Regression>Linear Y: εξαρτηµένη X: ανεξάρτητες Μέθοδος επιλογής µεταβλητών Στο συγκεκριµένο παράδειγµα δεν έχουµε πολύ καλή προσαρµογή του µοντέλου (σταθερά + β 1 Χ 1 + β 2 Χ 2 +...+ β 7 Χ7), λόγω του χαµηλού R adj2 =0.17 (% διακύµανσης της Υ που εξηγείται από το µοντέλο διορθωµένο για τον αριθµό των µεταβλητών) σωστό???? Άλλο σχόλιο? 17 19 2.2.3 Πολλαπλή γραµµική παλινδρόµηση: συνοπτικός πίνακας µοντέλου 2.2.4 Πολλαπλή γραµµική παλινδρόµηση: πίνακας ανάλυσης διακύµανσης Στο συγκεκριµένο πίνακα (πολλαπλή παλινδρόµηση) ελέγχουµετην υπόθεση: Η 0 : β 1 = β 2 = =β 7 = 0 έναντι της εναλλακτικής Η 1 :τουλάχιστον ένα από τα β 1, β 2,..., β 7 0, δηλαδή ελέγχουµε αν το τρέχων µοντέλο διαφέρει από το σταθερό (δηλαδή το µοντέλο y=β 0 +ε) Στο παράδειγµά µας δεν απορρίπτουµε την Η 0, γεγονός που σηµαίνει ότι η επίδραση των υπό έλεγχο ανεξάρτητων µεταβλητής δεν είναι σηµαντική ΣΩΣΤΟ?? R 2 (coefficient of determination)= 0.414, δηλαδή το 41% της συνολική διακύµανση των «ηµερών νοσηλείας» εξηγείται από τις µεταβλητές: φύλο, ηλικία, θερµοκρασία, WBC, λήψη αντιβιοτικού, λήψη βακτηριακής καλλιέργειας, και υπηρεσίας. ΕΝ ΕΙΝΑΙ ΠΟΛΥ ΙΚΑΝΟΠΟΙΗΤΙΚΟ???? ΑΛΛΟ ΣΧΟΛΙΟ? 18 20 9 10

2.2.5 Πολλαπλή γραµµική παλινδρόµηση: πίνακας εκτίµησης παραµέτρων µοντέλου Από τον παρακάτω πίνακα εκτιµώµενη γραµµή παλινδρόµησης: ΗΜΕΡΕΣ ΝΟΣΗΛΕΙΑΣ = -322.04 + 0.09 ΗΛΙΚΙΑ + 1.20 ΦΥΛΟ + 3.31 ΘΕΡΜΟΚΡ 0.17 WBC + 3.45 ΑΝΤΙΒΙΟΤ + 1.65 ΒΑΚΤΙΡ + 3.12 ΥΠΗΡΕΣ + ε, ε~normal(0,????? 2 ) JR??? 2.2.6 Πολλαπλή γραµµική παλινδρόµησηεναλλακτικές προσεγγίσεις Λόγω του ότι δεν είναι ικανοποιητικά τα παραπάνω αποτελέσµατα και προκειµένου να διερευνήσουµε περαιτέρω την συσχέτιση των ανεξάρτητων µεταβλητών µε την µεταβλητή απόκρισης, θα εφαρµόσουµε άλλες δύο µεθόδους επιλογής µεταβλητών: Stepwise & Backward 21 23 2.2.5 Πολλαπλή γραµµική παλινδρόµηση: πίνακας εκτίµησης παραµέτρων µοντέλου (συνέχεια) Από την τιµή των p-values συνάγουµε ότι δεν απορρίπτουµε καµία υπόθεση Η 0 : β i =0, i=0,1,2,..,7 δηλαδή κανένας από τους υπό εκτίµηση παράγοντες δεν είναι στατιστικά σηµαντικοί για την εκτίµηση των ηµερών νοσηλείας (µε έναν παράγοντα να έχει αρνητική σχέση, ενώ οι υπόλοιποι θετική) Για το αλλο p-value της σταθεράς σχόλιο????? 2.2.7 Πολλαπλή γραµµική παλινδρόµηση- Stepwise 22 24 11 12

2.2.8 Πολλαπλή γραµµική παλινδρόµηση- Stepwise (συνέχεια) Με την µέθοδο Stepwise καµία µεταβλητή δεν βρέθηκε µέσα στο µοντέλο! 2.2.10 Πολλαπλή γραµµική παλινδρόµηση- Backward πίνακας µοντέλου Πραγµατοποιήθηκαν 6 βήµατα. Από το πλήρες καταλήξαµε στο µοντέλο που έχει µέσα µόνο «θερµοκρασία» και «ηλικία» 25 27 2.2.9 Πολλαπλή γραµµική παλινδρόµηση- Backward 2.2.11 Πολλαπλή γραµµική παλινδρόµηση- Backward πίνακας ανάλυσης διακύµανσης «Ξανα-τρέχουµε» linear regression µε µέθοδο «Backward» Ξεκινάει από το full µοντέλο (µε όλα τα Χ µέσα) και σε κάθε βήµα αφαιρεί και µία µεταβλητή. Σε κάθε βήµα παρουσιάζονται τα στοιχεία του µοντέλου, ο πίνακας ανάλυσης διακύµανσης και η εκτίµηση των παραµέτρων Στο τελευταίο βήµα έχουµε στατιστικά σηµαντικό p-value, γεγονός που υποδηλώνει ότι το µοντέλο µε τις δύο επιλεγείσες µεταβλητές είναι στατιστικά σηµαντικά διαφορετικό από το σταθερό µοντέλο 26 28 13 14

2.2.12 Πολλαπλή γραµµική παλινδρόµηση- Backward εκτίµηση παραµέτρων 2.2.14 Προϋποθέσεις µοντέλου 1ο βήµα τελευταίο βήµα... Κανονικότητα σφαλµάτων Ανεξαρτησία σφαλµάτων Οµοσκεδαστικότητα σφαλµάτων Γραµµικότητα Χ και Υ Έλεγχος πολυσυγγραµικότητας Ηλικία: στατιστικά σηµαντική Θερµοκρασία: οριακά στατιστικά σηµαντική (σε επίπεδο 10%) 29 31 2.2.13 Πολλαπλή γραµµική παλινδρόµηση: Ερµηνεία αποτελεσµάτων Με βάση το τελευταίο βήµα, το µοντέλο που τελικά αποδεχόµαστε είναι το: ΗΜΕΡΕΣ ΝΟΣΗΛΕΙΑΣ = -322.3 + 0.15 ΗΛΙΚΙΑ + 3.31 ΘΕΡΜΟΚΡ + ε ηλαδή, οι αναµενόµενες ηµέρες νοσηλείας αυξάνονται κατά 0.146 µέρες για κάθε αύξηση της ηλικίας κατά 1 έτος, για άτοµα µε την ίδια θερµοκρασία, καθώς επίσης οι αναµενόµενες ηµέρες νοσηλείας αυξάνονται κατά 3.3 µέρες για κάθε αύξηση της θερµοκρασίας κατά 1 µονάδα, για άτοµα της ίδιας ηλικίας. Partial-regression coefficients 30 15 16