Απλή Ευθύγραµµη Συµµεταβολή Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές Τοµέας Φυτών Μεγάλης Καλλιέργειας και Οικολογίας, Εργαστήριο Γεωργίας Viola adorata
Εισαγωγή
Ανάλυση Παλινδρόµησης και Συσχέτιση
Απλή Γραµµική Παλινδρόµηση
Το Υπόδειγµα ιαγραµµατικά Εξαρτηµένη Μεταβλητή Σφάλµα Ανεξάρτητη Μεταβλητή
Οι Συντελεστές Παλινδρόµησης
Η Ευθεία Παλινδρόµησης
Η Ευθεία Ελαχίστων Τετραγώνων (1) Y X
Η Ευθεία Ελαχίστων Τετραγώνων (2) Πραγµατική Τιµή Error or residual Σφάλµα Prediction Εκτίµηση 0 0 20
Ο Συντελεστής Γραµµικής Συσχέτισης (Pearson)
Ερµηνεία του Συντελεστή Γραµµικής Συσχέτισης
Στατιστική Σηµαντικότητα του Συντελεστή Συσχέτισης H 0 : r=0 (στον πληθυσµό) H 1 : r 0 Υπολογίζουµε το στατιστικό: t = r n 2 1 r 2 Το συγκρίνουµε µε την κρίσιµη τιµή της t-κατανοµής για (n-2) β.ε. σε επίπεδο σηµαντικότητας α/2.
Ο Συντελεστής Προσδιορισµού
Ερµηνεία του Συντελεστή Προσδιορισµού
Πίνακας Ανάλυσης Παραλλακτικότητας- ιασποράς (ANOVA) µετά την Παλινδρόµηση Εκτιµώµενες Τιµές της Υ Σύγκριση µε κρίσιµη τιµή της F(1, n-2)
Από τον Πίνακα ANOVA Στην ουσία ελέγχουµε την µηδενική υπόθεση: H 0 : b=0 (στον πληθυσµό) H 1 : b 0 Η τετραγωνική ρίζα του Μέσου Αθροίσµατος Τετραγώνων που αντιστοιχεί στα Σφάλµατα εκφράζει το Τυπικό Σφάλµα της εκτίµησης (S.E. of Estimate). Είναι ίση µε την τυπική απόκλιση των σφαλµάτων. Εκφράζει την ακρίβεια της πρόβλεψης σε σύγκριση µε το µέσο όρο της εξαρτηµένης µεταβλητής.
Παράδειγµα
Ερωτήµατα
Αθροίσµατα Λύση
b Υπολογισµοί
Ευθεία Παλινδρόµησης
Βοηθητικοί Υπολογισµοί Y Y Y 2 Y ) Y ) Y ( Y Y ) 2 ( Y Y ) 1-3.20 10.24 1.23-2.97 8.83 2-2.20 4.84 2.29-1.91 3.65 5 0.80 0.64 4.41 0.21 0.05 6 1.80 3.24 5.47 1.27 1.62 7 2.80 7.84 7.60 3.40 11.54 Σύνολο 26.80 25.69 Άθροισµα Τετραγώνων για τα Σφάλµατα Y = 4, 2 26,80-25,69=1,11 Κρίσιµη Τιµή της F(1, 3) σε α=0,05=10,128 )
Πίνακας Ανάλυσης Παραλλακτικότητας- ιασποράς µετά την Παλινδρόµηση ΑΝΑΛΥΣΗ ΙΑΚΥΜΑΝΣΗΣ β.ε. SS MS F p Παλινδρόµηση 1 25.686 25.686 69.170 0.004 Σφάλµατα 3 1.114 0.371 Σύνολο 4 26.800 H 0 : b=0 (στον πληθυσµό) H 1 : b 0 Το υπόδειγµα της Γραµµικής Παλινδρόµησης είναι στατιστικά σηµαντικό σε επίπεδο σηµαντικότηταςα=0,05
Συντελεστής Συσχέτισης
Συντελεστής Προσδιορισµού
Εκτίµηση
Αποτελέσµατα µε το SPSS (1) Descriptive Statistics Απώλεια Βάρους (κιλά) Αρ. Εβδοµάδων Mean Std. Deviation N 4.2 2.6 5 4.8 2.4 5 Pearson Correlation Sig. (1-tailed) N Correlations Απώλεια Βάρους (κιλά) Αρ. Εβδοµάδων Απώλεια Βάρους (κιλά) Αρ. Εβδοµάδων Απώλεια Βάρους (κιλά) Αρ. Εβδοµάδων Απώλεια Αρ. Βάρους (κιλά) Εβδοµάδων 1.000.979.979 1.000..002.002. 5 5 5 5
Αποτελέσµατα µε το SPSS (2) Model Summary b Model 1 Adjusted Std. Error of R R Square R Square the Estimate.979 a.958.945.61 a. Predictors: (Constant), Αρ. Εβδοµάδων b. Dependent Variable: Απώλεια Βάρους (κιλά) Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 25.686 1 25.686 69.170.004 a 1.114 3.371 26.800 4 a. Predictors: (Constant), Αρ. Εβδοµάδων b. Dependent Variable: Απώλεια Βάρους (κιλά)
Αποτελέσµατα µε το SPSS (3) Model 1 (Constant) Αρ. Εβδοµάδω Unstandardized Coefficients Coefficients a Standardized Coefficients 5% Confidence Interval for B Std. Error Beta t Sig. Lower BoundUpper Bound -.895.670-1.335.274-3.028 1.239 1.061.128.979 8.317.004.655 1.468 a. Dependent Variable: Απώλεια Βάρους (κιλά)
ιάγραµµα ιασποράς (Scatter Plot)
Ευθεία Ελαχίστων Τετραγώνων (Least Squares Regression Line) 8 7 6 y = - 0.8947+1.0614x R 2 = 0.9584 5 Y 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 X
Βέλτιστη Καµπύλη (µέθοδος Loess)
Γραµµική Παλινδρόµηση και Συσχέτιση (Ι)
Γραµµική Παλινδρόµηση και Συσχέτιση (ΙΙ)
Πίνακας Ανάλυσης ιακύµανσης µετά την Παλινδρόµηση
Παραδείγµατα (1)
Παραδείγµατα (2)
Παραδείγµατα 3
Γραµµική και Μη Γραµµική Παλινδρόµηση Y $y = b 0 + bx 1 Y $y = b 0 + bx 1 y$ = b + bx + bx 0 1 2 ( b < 0) 2 2 2 $y = b + bx + bx + bx 0 1 2 3 3 X 1 X 1
Βασική Υπόθεση (Ι)
Βασική Υπόθεση (ΙΙ)
Μηχανισµός
Βασικές Προϋποθέσεις Τα σφάλµατα ακολουθούν Κανονική Κατανοµή Ισχύει η Οµοσκεδαστικότητα των Σφαλµάτων εν υπάρχουν παράτυπα σηµεία (outliers) δηλ. τιµές µε z-score σε απόλυτη τιµή >3. εν υπάρχουν σηµεία µόχλευσης.
Αποκλίσεις από την Οµοσκεδαστικότητα (1) R e s id u a ls 160 120 80 40 0-40 -80-120 -160 0 20 40 60 80 100 120 140 160 Predicted values Για µεγάλες τιµές της εξαρτηµένης µεταβλητής µεγαλώνει και η διασπορά των σφαλµάτων
Αποκλίσεις από την Οµοσκεδαστικότητα (2) Variance increases with mean Residuals 3 2 1 0-1 -2-3 0 5 10 15 20 25 Predicted values
Αποκλίσεις από την Οµοσκεδαστικότητα (3) Model not adequate Residuals 1.5 1 0.5 0-0.5-1 -1.5 0 5 10 15 20 25 Predicted values
Αποκλίσεις από την Οµοσκεδαστικότητα (4) Residual Plot with an Outlier Residuals 60 50 40 30 20 10 0-10 Outlier 0 10 20 30 40 50 60 70 Predicted values
Οµοσκεδαστικότητα των Σφαλµάτων Random Residual Plot 1.50 1.00 Residuals 0.50 0.00-0.50 0 5 10 15 20 25-1.00 Predicted values
Σύνδεση της Απλής Ευθύγραµµης Συµµεταβολής µε την Ανάλυση Παραλλακτικότητας (1) Στον πίνακα δίνονται οι µέσοι όροι ενός βιολογικού χαρακτηριστικού για 6 επεµβάσεις (περιεκτικότητα % του εδάφους σε θρεπτικά συστατικά) από ένα RCBD Report y Treatmt 0% 5% 10% 15% 20% 25% Total Mean Std. Deviation N 4.75 1.500 4 5.75.957 4 5.75.957 4 6.70.258 4 7.00.860 4 6.88.750 4 6.14 1.174 24
Σύνδεση της Απλής Ευθύγραµµης Συµµεταβολής µε την Ανάλυση Παραλλακτικότητας (2) Ο έλεγχος του Tukey (HSD test) έδειξε ότι οι 6 µέσοι όροι δεν διαφέρουν στατιστικά σηµαντικά σεα=0,05 Tukey HSD a,b Treatmt 0% 5% 10% 15% 25% 20% Sig. y Subset N 1 4 4.75 4 5.75 4 5.75 4 6.70 4 6.88 4 7.00.061 Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = 1.026. a. Uses Harmonic Mean Sample Size = 4.000. b. Alpha =.05.
Σύνδεση της Απλής Ευθύγραµµης Συµµεταβολής µε την Ανάλυση Παραλλακτικότητας (3) Τίθεται το ερώτηµα, εάν υπάρχει στατιστικά σηµαντική τάση-συµµεταβολή (θετική, ανοδική) των µέσων όρων του βιολογικού χαρακτηριστικού και της περιεκτικότητας του εδάφους σε θρεπτικά συστατικά ιάγραµµα Μέσων Όρων
Σύνδεση της Απλής Ευθύγραµµης Συµµεταβολής µε την Ανάλυση Παραλλακτικότητας (4) Η εφαρµογή της µεθόδου της Απλής Ευθύγραµµης Συµµεταβολής στα 6 ζεύγη σηµείων έδωσε τα παρακάτω αποτελέσµατα: Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate.937 a.877.847.34316 a. Predictors: (Constant), Treat Model 1 (Constant) Treat a. Dependent Variable: Y Unstandardized Coefficients Coefficients a Standardized Coefficients B Std. Error Beta t Sig. 5.042.248 20.300.000 8.771 1.641.937 5.346.006
Σύνδεση της Απλής Ευθύγραµµης Συµµεταβολής µε την Ανάλυση Παραλλακτικότητας (5) Συµπέρασµα: Ενώ δεν υπάρχουν στατιστικά σηµαντικές διαφορές µεταξύ των µέσων όρων των 6 επεµβάσεων ωστόσο υπάρχει στατιστικά σηµαντική συµµεταβολή (θετική, ανοδική τάση) (R=0,937, p=0,006) µεταξύ των 6 επιπέδων περιεκτικότητας του εδάφους σε θρεπτικά συστατικά και των αντίστοιχων µέσων όρων του βιολογικού χαρακτηριστικού
Βιβλιογραφία Ελληνικό Ανοικτό Πανεπιστήµιο (2003). Σηµειώσεις Στατιστικής. Φασούλας, Α. Κ.. (ανατ( ανατ.. 2008). Στοιχεία Πειραµατικής Στατιστικής. Θεσσαλονίκη: Άγις-Σάββας. Γαρταγάνης. Steel, R. & Torrie,, J. (1986). Principles and Procedures of Statistics: A Biometrical Approach.. Singapore: McGraw-Hill Book Company. Gomez, K. & Gomez, A. (1984). Statistical Procedures for Agricultural Research.. Singapore: John Willey & Sons, Inc. Kuehl,, R. (2000). Designs of Experiments: Statistical Principles of Research Design and Analysis.. Pacific Grove: Duxbury Thomson Learning. Jacoby, W. (2000). Loess: a nonparametric, graphical tool for depicting relationships between variables. Electoral Studies, 19, 577-613. Κολυβά, Φ. και Μπόρα-Σέντα Σέντα, Ε.. (1995). Στατιστική: Θεωρία- Εφαρµογές. Θεσσαλονίκη: Εκδόσεις ΖΗΤΗ.
Viola adorata