Στατιστική Ανάλυση Δεδομένων II. Γραμμική Παλινδρόμηση με το S.P.S.S.

Σχετικά έγγραφα
(Στατιστική Ανάλυση) Δεδομένων I. Σύγκριση δύο πληθυσμών (με το S.P.S.S.)

ΠΡΟΚΑΤΑΡΚΤΙΚΗ Στατιστική Ανάλυση με το S.P.S.S.

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Statistics 104: Quantitative Methods for Economics Formula and Theorem Review

5.4 The Poisson Distribution.

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

Μηχανική Μάθηση Hypothesis Testing

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

Repeated measures Επαναληπτικές μετρήσεις

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Math 6 SL Probability Distributions Practice Test Mark Scheme

Does anemia contribute to end-organ dysfunction in ICU patients Statistical Analysis

Απλή Ευθύγραµµη Συµµεταβολή

Στατιστική Ανάλυση Δεδομένων ΙII. Γραμμική Παλινδρόμηση με το S.P.S.S.

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

Queensland University of Technology Transport Data Analysis and Modeling Methodologies

Aquinas College. Edexcel Mathematical formulae and statistics tables DO NOT WRITE ON THIS BOOKLET

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 6. Συσχέτιση

the total number of electrons passing through the lamp.

Approximation of distance between locations on earth given by latitude and longitude

2 Composition. Invertible Mappings

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΠΩΣ ΕΠΗΡΕΑΖΕΙ Η ΜΕΡΑ ΤΗΣ ΕΒΔΟΜΑΔΑΣ ΤΙΣ ΑΠΟΔΟΣΕΙΣ ΤΩΝ ΜΕΤΟΧΩΝ ΠΡΙΝ ΚΑΙ ΜΕΤΑ ΤΗΝ ΟΙΚΟΝΟΜΙΚΗ ΚΡΙΣΗ

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Biostatistics for Health Sciences Review Sheet

Supplementary Appendix

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

519.22(07.07) 78 : ( ) /.. ; c (07.07) , , 2008

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

Πανεπιστήµιο Μακεδονίας Οικονοµικών και Κοινωνικών Επιστηµών Τµήµα Εφαρµοσµένης Πληροφορικής

Potential Dividers. 46 minutes. 46 marks. Page 1 of 11

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Instruction Execution Times

ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 6/5/2006

Advanced Subsidiary Unit 1: Understanding and Written Response

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

Section 9.2 Polar Equations and Graphs

The challenges of non-stable predicates

Numerical Analysis FMN011

Lampiran 1 Output SPSS MODEL I

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

DESIGN OF MACHINERY SOLUTION MANUAL h in h 4 0.

ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. ΘΕΜΑ: «ιερεύνηση της σχέσης µεταξύ φωνηµικής επίγνωσης και ορθογραφικής δεξιότητας σε παιδιά προσχολικής ηλικίας»

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Homework 3 Solutions

LESSON 14 (ΜΑΘΗΜΑ ΔΕΚΑΤΕΣΣΕΡΑ) REF : 202/057/34-ADV. 18 February 2014

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για

Section 8.3 Trigonometric Equations

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

Ύλη 1 ης Εβδομάδας. Σχέσεις Μεταβλητών ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ. Σχέση μεταξύ Μεταβλητών Παραδείγματα. 2 η Διάλεξη

Solutions to Exercise Sheet 5

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής

χ 2 test ανεξαρτησίας

Lecture 34 Bootstrap confidence intervals

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Econ 2110: Fall 2008 Suggested Solutions to Problem Set 8 questions or comments to Dan Fetter 1

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

HISTOGRAMS AND PERCENTILES What is the 25 th percentile of a histogram? What is the 50 th percentile for the cigarette histogram?

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

CHAPTER 48 APPLICATIONS OF MATRICES AND DETERMINANTS

Finite Field Problems: Solutions

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ,

Μοντέλα Πολλαπλής Παλινδρόμησης

TABLES AND FORMULAS FOR MOORE Basic Practice of Statistics

Homework 8 Model Solution Section

Statistics & Research methods. Athanasios Papaioannou University of Thessaly Dept. of PE & Sport Science

Right Rear Door. Let's now finish the door hinge saga with the right rear door

Modbus basic setup notes for IO-Link AL1xxx Master Block

SUPERPOSITION, MEASUREMENT, NORMALIZATION, EXPECTATION VALUES. Reading: QM course packet Ch 5 up to 5.6

Συσχέτιση και Παλινδρόμηση Correlation and Regression. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Βιοστατιστικής

FORMULAS FOR STATISTICS 1

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch:

The Probabilistic Method - Probabilistic Techniques. Lecture 7: The Janson Inequality

EE512: Error Control Coding

Other Test Constructions: Likelihood Ratio & Bayes Tests

Δεδομένα (data) και Στατιστική (Statistics)

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για

; +302 ; +313; +320,.

4.6 Autoregressive Moving Average Model ARMA(1,1)

department listing department name αχχουντσ ϕανε βαλικτ δδσϕηασδδη σδηφγ ασκϕηλκ τεχηνιχαλ αλαν ϕουν διξ τεχηνιχαλ ϕοην µαριανι

Λυμένες Ασκήσεις για το μάθημα:

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Analyze/Forecasting/Create Models

ST5224: Advanced Statistical Theory II

LESSON 12 (ΜΑΘΗΜΑ ΔΩΔΕΚΑ) REF : 202/055/32-ADV. 4 February 2014

8. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Ι

The Simply Typed Lambda Calculus

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Transcript:

Στατιστική Ανάλυση Δεδομένων II Γραμμική Παλινδρόμηση με το S.P.S.S. μέρος Α (απλή παλινδρόμηση) Νίκος Τσάντας Πρόγραμμα Μεταπτυχιακών Σπουδών Τμήμ. Μαθηματικών Μαθηματικά και Σύγχρονες Εφαρμογές Ακαδημαϊκό έτος 2011-12 Υποθέστε ότι διαπιστώσατε την ύπαρξη (γραμμικής) σχέσης μεταξύ δύο μεταβλητών. Λογικά, στη συνέχεια θα πρέπει να προχωρήσετε στην περιγραφή αυτής της σχέσης. Μοντέλο: Αναζητάμε το (μαθηματικό) μοντέλο, που περιγράφει, με τον καλύτερο δυνατό τρόπο, τις τιμές μιας μεταβλητής (εξαρτημένη/προβλεπόμενη) συναρτήσει των τιμών μιας ή περισσότερων άλλων μεταβλητών (ανεξάρτητη/προβλέπουσα). Γραμμικά μοντέλα πρόβλεψης: 2 k y b0 b1 x b2 x bk x? Εύρεση b 0, b 1,, b k Ευθεία (ελαχίστων τετραγώνων): y = b 0 + b 1 x b 1 ερμηνεία b 0 ερμηνεία Προϋποθέσεις εφαρμογής κλίμακα μέτρησης τουλάχιστον ordinal ύπαρξη γραμμικής σχέσης βλέπε υπόλοιπα ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 1

A small example. SSR uses the differences between the observed data and the regression line. SST uses the differences between the observed data and the mean value of Y. SSM uses the differences between the mean value of Y and the regression line. The proportion of improvement due to the model. A measure of how much the model has improved the prediction of the outcome compared to the level of inaccuracy of the model. ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2

(αρχείο world95.sav) Is the measure of the education level (literacy rate for females) useful for predicting life expectancy? Graphs Scatter/Dot Simple Scatter?? εμφάνιση γραμμής παλινδρόμησης Ευθεία (ελαχίστων τετραγώνων): (female life expectancy) = b 0 + b 1 (female literacy) + ε Analyze Regression Linear... ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 3

Πόσο καλή είναι η προσαρμογή; (Pearson s r) Πόσο ποσοστό της συνολικής μεταβλητότητας εξηγείται; (R 2 ) Υπάρχει πράγματι μια σχέση ευθείας; (b 1 = 0) Έχουμε στα χέρια μας το σωστό μοντέλο; (δεν ξέρουμε) χρόνια (<10.72) (female life expectancy) = 47.17 + 0.307(female literacy) ΥΠΟΛΟΙΠΟ ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 4

(female life expectancy) = 47.17 + 0.307(female literacy) ΠΡΟΒΛΕΨΗ. ΠΡΟΣΟΧΗ ΣΤΟ ΕΥΡΟΣ για (female literacy) = 90 είναι (female life expectancy) = 74.8 The t-statistics provide some clue regarding the relative importance of (each) variable in the model. The probabilities should not be used for a formal test regarding the importance of each variable. These probabilities are appropriate if you want to do one preselected test and not if you are looking, say, for the strongest/weakest variable. As a guide regarding useful predictors, look for t values well below -2 or above +2. ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ (for the predicted means) (μέση τιμή δείγματος 67.26) Graphs Scatter/Dot Simple Scatter dependent= average female life expectancy independent= females who read ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 5

ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ (for individual cases) (μέση τιμή δείγματος 67.26) Graphs Scatter/Dot Simple Scatter dependent= average female life expectancy independent= females who read LAST, BUT NOT LEAST, CAUTIONS: Be careful about concluding if literacy is increased, the population will live longer. There is strong association between literacy and life expectancy, but association is not the same as causation. If an investigator observes the values of the independent and dependent variables for a set of subjects (cases), association does not establish causation. If an investigator does an experiment where he/she sets the values of the independent variable (for example, six specific doses of a drug) and watches the effect on the dependent variable, there may be little question that the results were caused by the independent variable. ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 6

Η αποδοχή του μοντέλου της παλινδρόμησης εξασφαλίζεται από την αποδοχή ότι θα πρέπει τα υπόλοιπα να ακολουθούν την κανονική κατανομή, τα υπόλοιπα να έχουν διακύμανση ίδια για όλες τις τιμές της ανεξάρτητης μεταβλητής, διαδοχικά υπόλοιπα να είναι ανεξάρτητα. (αρχείο world95.sav) Is the measure of the education level (literacy rate for females) useful for predicting life expectancy? (female life expectancy) = 47.17 + 0.307(female literacy) ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 7

(Statistics) *ZPRED: standardized predicted values (Plots) *SDRESID: Studentized deleted residuals *DEPENDNT Checking for Normality Standardized Residuals??? If the distribution of residuals is approximtly normal, you know that about 95% of the standardized residuals should be between -2 and +2. Of course, even if the model fits well, you expect to see about 5% of the cases with standardized residuals greater than 2 in absolute value. ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 8

Checking for Normality Standardized Residuals Άλλος τρόπος: στατιστικός έλεγχος (αφού πρώτα αποθηκευτούν / use the save dialog box) Checking for Constant Variance Studentized (deleted) Residuals??? Ideally, the points should fall in a horizontal band across the plot, you should see no systematic trends, and you should be concerned if gross outliers are identified. ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 9

Checking Independence (Durbin-Watson test) This statistic ranges in value from 0 to 4. If there is no correlation between successive residuals, the Durbin Watson statistic should be close to 2. Values close to 0 indicate that successive residuals are positively correlated, while values close to 4 indicate strong negative correlation. Always check the fitting use the save dialog box. If the model fits each data value exactly, the observed and predicted values would coincide on a straight line extending from the lower left corner to the upper right.? Zambia. Actually life expectancy for its females is among the lowest in this sample; yet its predicted value is close to the mean of all predicted values (0.0).? Botswana. ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 10

Βιβλιογραφία Andy Field (2009). Discovering statistics using SPSS, 3 rd edition. SAGE Publications M.J. Norusis (2011). IBM SPSS Statistics 19 Guide to Data Analysis. Prentice Hall. ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 11