ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 11 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση)



Σχετικά έγγραφα
ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 12 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση) [µέρος 2ο]

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Λυμένες Ασκήσεις για το μάθημα:

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

ΕΡΓΑΙΑ Εθηίκεζε αμίαο κεηαπώιεζεο ζπηηηώλ κε αλάιπζε δεδνκέλωλ. Παιεάο Δπζηξάηηνο

Μάθηµα εύτερο-τρίτο- Βασικά Ζητήµατα στο Απλό Γραµµικό Υπόδειγµα Ακαδηµαϊκό Έτος

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Πολλαπλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 7 (συνέχεια)

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Lampiran 1 Output SPSS MODEL I

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

Απλή Ευθύγραµµη Συµµεταβολή

ΠΡΟΒΛΗΜΑ ΣΥΓΓΡΑΜΜΙΚΟΤΗΤΑΣ

ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

Μοντέλα Πολλαπλής Παλινδρόμησης

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΔPersediaan = Persediaan t+1 - Persediaan t

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Η βιτρίνα των καταστημάτων ως εργαλείο δημοσίων σχέσεων. Ονοματεπώνυμο: Ειρήνη Πορτάλιου Σειρά: 8 η Επιβλέπουσα: Αν. Καθηγήτρια : Βεντούρα Ζωή

Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11

NI it (dalam jutaan rupiah)

LAMPIRAN. Lampiran I Daftar sampel Perusahaan No. Kode Nama Perusahaan. 1. AGRO PT Bank Rakyat Indonesia AgroniagaTbk.

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχολή Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

Κεφάλαιο 15. Παραγοντική ανάλυση διακύµανσης. Παραγοντική

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

ΕΙ Η ΠΑΛΙΝ ΡΟΜΗΣΗΣ. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΛΙΝ ΡΟΜΗΣΗ (Simple Linear Regression) ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ (Regression) ΠΑΛΙΝ ΡΟΜΗΣΗ.

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 4: ΔΙΑΛΕΞΗ 04

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

519.22(07.07) 78 : ( ) /.. ; c (07.07) , , 2008

Άσκηση 2. i β. 1 ου έτους (Υ i )

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Α μέρος: Πολυσυγγραμμικότητα. Παπάνα Αγγελική

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Εισαγωγή στη Βιοστατιστική

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ+ΠΑΤΡΩΝ+ Τμήμα+Διοίκησης+Επιχειρήσεων+

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

1991 US Social Survey.sav

Περιεχόμενα. Πρόλογος... v

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

τατιστική στην Εκπαίδευση II

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 3ο

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

Μη Παραµετρικοί Έλεγχοι

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Στατιστική Επιχειρήσεων Ι

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 10 Συµπερασµατολογία για 2 ποσοτικές µεταβλητές (ΑΠΛΗ ΠΑΛΙΝ ΡΟΜΗΣΗ)

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ. Εαρινό εξάµηνο ακαδηµαϊκού έτους ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. Εργασία 4 - Ενδεικτική λύση

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

Transcript:

Ενότητα ιαφάνειες Μαθήµατος: - Ενότητα ιαφάνειες Μαθήµατος: - ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 006-007, 3ο εξάµηνο.. Γενίκευση του µοντέλου ΜΑΘΗΜΑ Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση) Έστω ότι έχουµε p+ ποσοτικές µεταβλητές Υ: απόκρισης ή εξαρτηµένη Χ, Χ,... Χ p : επεξηγηµατικές ή ανεξάρτητες µεταβλητές Το µοντέλο: Y=β 0 +β Χ + β Χ +... + β p X p +ε, ε~ν( 0, σ ) ή ισοδύναµα Y~Ν(µ, σ ), Ε(Y)=µ= β 0 +β Χ + β Χ +... + β p X p Μοντέλο και δεδοµένα: Υ i, X i ζεύγη τιµών για i=,,, n Y i = β 0 +β Χ i + β Χ i +... + β p X ip +ε i, ε i ~Ν( 0, σ ) Y i ~Ν( µ i, σ ), µ i = β 0 +β Χ i + β Χ i +... + β p X ip ιαφάνεια - ιαφάνεια -3 ΠΕΡΙΕΧΟΜΕΝΑ.. Γενίκευση του µοντέλου Πολλαπλή Παλινδρόµηση (multiple regression) Γενίκευση του µοντέλου Ερµηνεία παραµέτρων Παράδειγµα - και εφαρµογή στο SPSS ιαδικασίες επιλογής µοντέλων και µεταβλητών (και Εφαρµογή στο SPSS παράδειγµα -) Το πρόβληµα της πολυσυγγραµµικότητας (και Εφαρµογή στο SPSS παράδειγµα -, Παράδειγµα -: προσοµοιωµένα δεδοµένα) ΠΑΡΑ ΕΙΓΜΑ -3 WORLD95 είκτες µερικής συσχέτισης (Partial correlations) (+ Συνέχεια παραδείγµατος -) Πολυωνυµική Παλινδρόµηση Χρήση κατηγορικών συµµεταβλητών σε παλινδροµικά µοντέλα Σχέση παλινδρόµησης και ANOVA/t-tests Αναλ. Συνδιακύµανσης (ANCOVA) ΠΡΟΫΠΟΘΕΣΕΙΣ: Ι ΙΕΣ ΕΡΜΗΝΕΙΑ: ΛΙΓΟ ΙΑΦΟΡΕΤΙΚΗ EXTRA ΠΡΟΒΛΗΜΑ: ΠΟΛΥ-ΣΥΓΓΡΑΜΙΚΟΤΗΤΑ µεταξύ επεξηγηµατικών µεταβλητών (ύπαρξη γραµµικών σχέσεων µεταξύ επεξηγηµατικών µεταβλητών) [Multi-collinearity] EXTRA ΕΡΩΤΗΜΑ: ΕΠΙΛΟΓΗ ΣΗΜΑΝΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ ιαφάνεια - ιαφάνεια -4

Ενότητα ιαφάνειες Μαθήµατος: -3 Ενότητα ιαφάνειες Μαθήµατος: -4.. Ερµηνεία παραµέτρων.3. Παράδειγµα - και εφαρµογή στο SPSS β 0 : Αναµενόµενη τιµή της Υ όταν όλες οι Χ είναι µηδέν Αν πάρουµε ως επεξηγηµατικές τις µεταβλητές κεντραρισµένες ως προς τον µέσο Χ j* =Χ j X j Τότε αντιστοιχεί στην αναµενόµενη τιµή του Υ όταν όλες οι Χ είναι ίσες µε τους δειγµατικούς µέσους (ένα τυπικό µέσο άτοµο του δείγµατος) β J : Αναµενόµενη µεταβολή τιµή της Υ όταν η Χ j αυξηθεί κατά µία µονάδα άλλα οι υπόλοιπες Χ παραµείνουν σταθερές. Επίδραση (effect) της µεταβλητής Χ j στην Υ διορθωµένη (adjusted) για τις επιδράσεις των υπόλοιπων µεταβλητών Επίδραση διορθωµένη ως προς τις Χ µεταβλητές σηµαίνει ότι τις έχουµε λάβει υπόψη µας στην ανάλυση µας ιαφάνεια -5 Παράδειγµα - Μονάδα µελέτης: Κατοικία n=30 Μεταβλητές p=4 Price: Τιµή σε δολάρια Living:Χώρος Κατοικίας (κτηρίου) Lotsize:Έκταση οικοπέδου Subdivis: Περιοχή που βρίσκεται το σπίτι ιαφάνεια -7.3. Παράδειγµα - και εφαρµογή στο SPSS.3. Παράδειγµα - και εφαρµογή στο SPSS Παράδειγµα - Ένα κτηµατοµεσίτης έκανε έρευνα αγοράς σε 3 περιοχές µε σκοπό να φτιάξει ένα απλό µοντέλο για να υπολογίζει προβλέπει τις αναµενόµενες τιµές των σπιτιών ανά περιοχή. Έτσι πήρε 0 σπίτια σε κάθε περιοχή τυχαία επιλεγµένα και µέτρησε Τιµή σε δολάρια Χώρος Κατοικίας (κτιρίου) Έκταση οικοπέδου Περιοχή που βρίσκεται το σπίτι ιαφάνεια -6 ΑΝΑΛΥΣΗ ΒΗΜΑΤΑ Ανάλυση ανά µία µεταβλητή ιαγραµµατική απεικόνιση (Scatter-plots) είκτες συσχέτισης Μοντέλο Παλινδρόµησης Επιλογή Μεταβλητών Έλεγχος πολυσυγγραµικότητας Έλεγχος Προϋποθέσεων (Ανάλυση καταλοίπων) ιαφάνεια -8

Ενότητα ιαφάνειες Μαθήµατος: -5 Ενότητα ιαφάνειες Μαθήµατος: -6.3. Παράδειγµα - και εφαρµογή στο SPSS ΙΑΓΡΑΜΜΑΤΙΚΗ ΑΠΕΙΚΟΝΙΣΗ.3. Παράδειγµα - και εφαρµογή στο SPSS ΕΙΚΤΕΣ ΓΡΑΜΜΙΚΗΣ ΣΥΣΧΕΤΙΣΗΣ price Price in US Dollars living Size of Living Area in Sq. ft lotsize Lot Size in Sq.ft. Pearson Correlation Sig. (-tailed) N Pearson Correlation Sig. (-tailed) N Pearson Correlation Sig. (-tailed) N Correlations **. Correlation is significant at the 0.0 level (-tailed). living Size of price Price in Living Area in lotsize Lot US Dollars Sq. ft Size in Sq.ft..963**.907**.000.000 30 30 30.963**.96**.000.000 30 30 30.907**.96**.000.000 30 30 30 ιαφάνεια -9 ιαφάνεια -.3. Παράδειγµα - και εφαρµογή στο SPSS ΙΑΓΡΑΜΜΑΤΙΚΗ ΑΠΕΙΚΟΝΙΣΗ.3. Παράδειγµα - και εφαρµογή στο SPSS Επιλογή µενού στο SPSS Εξαρτηµένη µεταβλητή ανεξάρτητες µεταβλητές ιαφάνεια -0 ιαφάνεια -

Ενότητα ιαφάνειες Μαθήµατος: -7 Ενότητα ιαφάνειες Μαθήµατος: -8.3. Παράδειγµα - και εφαρµογή στο SPSS Περιληπτικός πίνακας Summary Adjusted Std. Error of R R Square R Square the Estimate.965 a.930.95 908.657 a. Predictors: (Constant), lotsize Lot Size in Sq.ft., living Size of Living Area in Sq. ft σ=908.66$.3. Παράδειγµα - και εφαρµογή στο SPSS Πίνακας εκτιµήσεων των παραµέτρων (Constant) living Size of Living Area in Sq. ft lotsize Lot Size in Sq.ft. a Unstandardized a. Dependent Variable: price Price in US Dollars Στατιστικά σηµαντικό (διάφορο του µηδενός) Standardized B Std. Error Beta t Sig. 49.97 955.44.39.08 77.04.967.80 6.436.000 -.345.900 -.6 -.34.8 εν είναι Στατιστικά σηµαντικό (άρα ίσο µε µηδέν) Τιµή = 50 + 77 Μεγ.Σπιτ (sq.ft).35 Μέγ.Οικ.(sq.ft.) ιαφάνεια -3 ιαφάνεια -5.3. Παράδειγµα - και εφαρµογή στο SPSS Regression Residual Total Πίνακας ανάλυσης ιακύµανσης ANOVA b Sum of Squares df Mean Square F Sig. 976365086.9.488E+00 80.397.000 a 735593.80 7 8494663.47 399008000.000 9 a. Predictors: (Constant), lotsize Lot Size in Sq.ft., living Size of Living Area in Sq. ft b. Dependent Variable: price Price in US Dollars Ελέγχει την Η0: β =β =0 δηλαδή αν υπάρχει σηµαντική διαφοροποίηση από το σταθερό µοντέλο.3. Παράδειγµα - και εφαρµογή στο SPSS Ερµηνεία παραµέτρων Τιµή = 50 + 77 Μεγ.Σπιτ (sq.ft).35 Μέγ.Οικ.(sq.ft.) Όταν το οικόπεδο και το κτίριο έχουν µηδενική έκταση (???) τότε η αναµενόµενη τιµή είναι 50$ εν στέκει ως ερµηνεία Μόνο µπορούµε να θεωρήσουµε το ποσό των 50 κάποια πάγια έξοδα Γενικά θα είναι µάλλον πιο λογικό να αφαιρέσουµε τη σταθερά (αν και είναι στατιστικά σηµαντική) Αύξηση της έκτασης του κτιρίου κατά sq.ft. συνεπάγεται αύξηση κατά 77$ όταν η έκταση του οικοπέδου παραµείνει σταθερή ΠΙΟ ΣΩΣΤΗ ΕΡΜΗΝΕΙΑ: Αν συγκρίνουµε δύο συµβόλαια µε ίδια έκταση οικοπέδου και διαφορά στο µέγεθος του κτιρίου κατά sq.ft. τότε αναµένουµε διαφορά ίση µε 77$ ΠΙΟ ΣΩΣΤΗ ΕΡΜΗΝΕΙΑ: Αν συγκρίνουµε δύο συµβόλαια µε ίδια έκταση κτιρίου και διαφορά στο µέγεθος του οικοπέδου κατά sq.ft. τότε αναµένουµε διαφορά ίση µε.35$ (υπέρ του µεγαλύτερου οικοπέδου)???? [ ΕΝ ΣΤΕΚΕΙ ΟΜΩΣ ΕΙΝΑΙ ΣΤΑΤΙΣΤΙΚΑ ΜΗ ΣΗΜΑΝΤΙΚΟ] ιαφάνεια -4 ιαφάνεια -6

Ενότητα ιαφάνειες Μαθήµατος: -9 Ενότητα ιαφάνειες Μαθήµατος: -0.3. Παράδειγµα - και εφαρµογή στο SPSS Αφαίρεση σταθεράς.3. Παράδειγµα - και εφαρµογή στο SPSS Αφαίρεση σταθεράς a,b Στατιστικά σηµαντικό (διάφορο του µηδενός) living Size of Living Area in Sq. ft lotsize Lot Size in Sq.ft. a. Dependent Variable: price Price in US Dollars b. Linear Regression through the Origin Unstandardized B Std. Error Standardized Beta 6.808.05.90 5.683.000.850.407.096.604.55 t Sig. εν είναι Στατιστικά σηµαντικό (άρα ίσο µε µηδέν) Τιµή = 6.8 Μεγ.Σπιτ (sq.ft) + 0.85 Μέγ.Οικ.(sq.ft.) ιαφάνεια -7 ιαφάνεια -9.3. Παράδειγµα - και εφαρµογή στο SPSS Αφαίρεση σταθεράς Summary R R Square a R Square the Estimate Adjusted Std. Error of.998 b.995.995 9766.756 a. For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regression. This CANNOT be compared to R Square for models which include an intercept. b. Predictors: lotsize Lot Size in Sq.ft., living Size of Living Area in Sq. ft ιαφάνεια -8.3. Παράδειγµα - και εφαρµογή στο SPSS Ερµηνεία παραµέτρων (Χωρίς σταθερά) Τιµή = 6.8 Μεγ.Σπιτ (sq.ft) + 0.85 Μέγ.Οικ.(sq.ft.) Όταν το οικόπεδο και το κτίριο έχουν µηδενική έκταση τότε η αναµενόµενη τιµή είναι 0$ (πολύ λογικότερό ως προσέγγιση) Αύξηση της έκτασης του κτιρίου κατά sq.ft. συνεπάγεται αύξηση κατά 6.8$ όταν η έκταση του οικοπέδου παραµείνει σταθερή ΠΙΟ ΣΩΣΤΗ ΕΡΜΗΝΕΙΑ: Αν συγκρίνουµε δύο συµβόλαια µε ίδια έκταση οικοπέδου και διαφορά στο µέγεθος του κτιρίου κατά sq.ft. τότε αναµένουµε διαφορά ίση µε 6.8$ ΠΙΟ ΣΩΣΤΗ ΕΡΜΗΝΕΙΑ: Αν συγκρίνουµε δύο συµβόλαια µε ίδια έκταση κτιρίου και διαφορά στο µέγεθος του οικοπέδου κατά sq.ft. τότε αναµένουµε αύξηση της τιµής κατά 0.85$ [ΕΙΝΑΙ ΣΤΑΤΙΣΤΙΚΑ ΣΗΜΑΝΤΙΚΟ] ιαφάνεια -0

Ενότητα ιαφάνειες Μαθήµατος: - Ενότητα ιαφάνειες Μαθήµατος: -.3. Παράδειγµα - και εφαρµογή στο SPSS.3. Παράδειγµα - και εφαρµογή στο SPSS Μοντέλο µε σταθερά και Μεταβλητές κεντραρισµένες στο µέσο Summary R R Square Adjusted R Square Std. Error of the Estimate.965 a.930.95 908.657 a. Predictors: (Constant), lot.c, liv.c a (Constant) liv.c lot.c Unstandardized Standardized B Std. Error Beta t Sig. 3430.0 658.59 80.946.000 77.04.967.80 6.436.000 -.345.900 -.6 -.34.8 a. Dependent Variable: price Price in US Dollars Ένα µέσο σπίτι (εκτ.90 sq.ft.) κοστίζει περίπου 3430$ ιαφάνεια - Έλεγχοι Προϋποθέσεων. Κανονικά θα έπρεπε να αφαιρέσουµε και το LOTSIZE. Ας πούµε ότι το κρατάµε για να έχουµε ένα πιο ρεαλιστικό µοντέλο. ΚΑΝΟΝΙΚΟΤΗΤΑ (QQPLOT, HISTOGRAM, SW/KS TESTS) 3. ΟΜΟΣΚΕ ΑΣΤΙΚΟΤΗΤΑ ΓΡΑΜΜΙΚΟΤΗΤΑ ΑΚΡΑΙΕΣ ΤΙΜΕΣ (PRED-ST.RESIDUALS) 4. TYXAIOTHTA (LINE PLOT, RUNS TEST, DW TEST, ACF+PACF) ιαφάνεια -3.3. Παράδειγµα - και εφαρµογή στο SPSS.3. Παράδειγµα - και εφαρµογή στο SPSS Μοντέλο χωρίς σταθερά και Μεταβλητές κεντραρισµένες στο µέσο Summary R????? R Square a Adjusted R Square Std. Error of the Estimate.8 b.05 -.06 397.4 a. For regression through the origin (the no-intercept model), R Square measures the proportion of the variability Unstandardized in the dependent variable Standardized about the origin explained by regression. This CANNOT be compared to R Square B for Std. models Error which include Beta an intercept. t Sig. liv.c b. Predictors: 77.07lot.c, 83.438 liv.c.79.40.678 lot.c -.346 9.3 -.054 -.08.936 a. Dependent Variable: price Price in US Dollars b. Linear Regression through the Origin ιαφάνεια - Έλεγχοι Προϋποθέσεων Κανονικότητα ιαφάνεια -4

Ενότητα ιαφάνειες Μαθήµατος: -3 Ενότητα ιαφάνειες Μαθήµατος: -4.3. Παράδειγµα - και εφαρµογή στο SPSS.3. Παράδειγµα - και εφαρµογή στο SPSS Έλεγχοι Προϋποθέσεων Κανονικότητα Έλεγχοι Προϋποθέσεων Οµοσκεδαστικότητα, Γραµµικότητα, Ακραίες τιµές RES_ Unstandardized Residual *. This is a lower bound of the true significance. a. Lilliefors Significance Correction Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig..03 30.00*.973 30.67 ιαφάνεια -5 ιαφάνεια -7.3. Παράδειγµα - και εφαρµογή στο SPSS.3. Παράδειγµα - και εφαρµογή στο SPSS Έλεγχοι Προϋποθέσεων Οµοσκεδαστικότητα, Γραµµικότητα, Ακραίες τιµές Έλεγχοι Προϋποθέσεων Οµοσκεδαστικότητα, Γραµµικότητα, Ακραίες τιµές Test of Homogeneity of Variances Quartiles of LIVING Quartiles of LOTSIZE RES_ Unstandardized Residual Levene StatisticTest of Homogeneity df of df Variances Sig..88 3 6.055 RES_ Unstandardized Residual Levene Statistic df df Sig..735 3 6.064 ιαφάνεια -6 ιαφάνεια -8

Ενότητα ιαφάνειες Μαθήµατος: -5 Ενότητα ιαφάνειες Μαθήµατος: -6.3. Παράδειγµα - και εφαρµογή στο SPSS.3. Παράδειγµα - και εφαρµογή στο SPSS Έλεγχοι Προϋποθέσεων Οµοσκεδαστικότητα, Γραµµικότητα, Ακραίες τιµές Έλεγχοι Προϋποθέσεων - Τυχαιότητα ιαφάνεια -9 ιαφάνεια -3.3. Παράδειγµα - και εφαρµογή στο SPSS.3. Παράδειγµα - και εφαρµογή στο SPSS Έλεγχοι Προϋποθέσεων Οµοσκεδαστικότητα, Γραµµικότητα, Ακραίες τιµές Έλεγχοι Προϋποθέσεων Ανεξαρτησία Σφαλµάτων Summary c,d Κοντά στο άρα ΟΚ R R Square a R Square the Estimate Watson Adjusted Std. Error of Durbin-.998 b.995.995 9766.756.964 a. For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regression. This CANNOT be compared to R Square for models which include an intercept. b. Predictors: lotsize Lot Size in Sq.ft., living Size of Living Area in Sq. ft c. Dependent Variable: price Price in US Dollars d. Linear Regression through the Origin ιαφάνεια -30 ιαφάνεια -3

Ενότητα ιαφάνειες Μαθήµατος: -7 Ενότητα ιαφάνειες Μαθήµατος: -8.3. Παράδειγµα - και εφαρµογή στο SPSS.4. ιαδικασίες επιλογής µεταβλητών Έλεγχοι Προϋποθέσεων Ανεξαρτησία Σφαλµάτων Stepwise procedure: Κλιµακωτή διαδικασία προσθαφαίρεσης µεταβλητών Ξεκινάµε από ένα µοντέλο και σε κάθε βήµα ελέγχουµε ποιες µεταβλητές πρέπει να προστεθούν ή να αφαιρεθούν µε βάση κάποιο κριτήριο (συνήθως p-value του β ή ελέγχου πιθανοφάνειας) Σταµατάµε όταν δεν µπορούµε να προσθέσουµε ή να αφαιρέσουµε άλλες µεταβλητές Συνηθισµένα µοντέλα εκκίνησης είναι το σταθερό (χωρίς καµία µεταβλητή SPSS) ή το πλήρες (µε όλες τις µεταβλητές) ιαφάνεια -33 ιαφάνεια -35.4. ιαδικασίες επιλογής µεταβλητών.4. ιαδικασίες επιλογής µεταβλητών Stepwise procedure: Κλιµακωτή διαδικασία προσθαφαίρεσης µεταβλητών Backward procedure: Κλιµακωτή διαδικασία αφαίρεσης µεταβλητών Forward procedure: Κλιµακωτή διαδικασία πρόσθεσης µεταβλητών Backward procedure: Κλιµακωτή διαδικασία αφαίρεσης µεταβλητών Ξεκινάµε από το πλήρες µοντέλο και σε κάθε βήµα ελέγχουµε ποιες µεταβλητές πρέπει να αφαιρεθούν Σταµατάµε όταν δεν µπορούµε να αφαιρέσουµε άλλες µεταβλητές Forward procedure: Κλιµακωτή διαδικασία πρόσθεσης µεταβλητών Ξεκινάµε από το σταθερό µοντέλο και σε κάθε βήµα ελέγχουµε ποιες µεταβλητές πρέπει να προστεθούν Σταµατάµε όταν δεν µπορούµε να προσθέσουµε άλλες µεταβλητές ιαφάνεια -34 ιαφάνεια -36

Ενότητα ιαφάνειες Μαθήµατος: -9 Ενότητα ιαφάνειες Μαθήµατος: -0.4. ιαδικασίες επιλογής µεταβλητών.4. ιαδικασίες επιλογής µοντέλων και µεταβλητών (Εφαρµογή στο SPSS: Συνέχεια παραδείγµατος -) ΚΡΙΤΗΡΙΑ ΣΗΜΑΝΤΙΚΟΤΗΤΑΣ ΕΠΙΛΟΓΗΣ ΜΕΤΑΒΛΗΤΩΝ F test από τη διαφορά διαδοχικών µοντέλων t-test για β BIC, AIC, Cp (Splus/R) ΛΕΠΤΟΜΕΡΕΙΕΣ Καλύτερη η Stepwise γιατί κάνει διπλούς ελέγχους Σηµείο εκκίνησης το πλήρες. Αν έχουµε πολλές µεταβλητές τότε σηµείο εκκίνησης το σταθερό ιαφορετικές διαδικασίες µπορούν να καταλήξουν σε άλλα µοντέλα ιαφορετικά σηµεία εκκίνησης µπορεί να καταλήξουν σε διαφορετικό µοντέλο. Variables Entered/Removed b,c Variables Entered lotsize Lot Size in Sq. ft., living Size of Living Area in Sq. ft a. Variables Removed lotsize Lot Size in Sq. ft. a. All requested variables entered. Method. Enter Backward (criterion: Probabilit y of F-to-remo ve >=. 00). b. Dependent Variable: price Price in US Dollars c. Linear Regression through the Origin Mode Summary d,e Adjusted Std. Error of Durbin- R R Square a R Squarehe Estimate Watson.998 b.995.995 9766.756.998 c.995.995 9659.5.96 a. For regression through the origin (the no-intercept m measures the proportion of the variability in the dep about the origin explained by regression. This CAN R Square for models which include an intercept. b. Predictors: lotsize Lot Size in Sq.ft., living Size of c. Predictors: living Size of Living Area in Sq. ft d. Dependent Variable: price Price in US Dollars e. Linear Regression through the Origin ιαφάνεια -37 ιαφάνεια -39.4. ιαδικασίες επιλογής µοντέλων και µεταβλητών (Εφαρµογή στο SPSS: Συνέχεια παραδείγµατος -).4. ιαδικασίες επιλογής µοντέλων και µεταβλητών (Εφαρµογή στο SPSS: Συνέχεια παραδείγµατος -) a,b Μέθοδος επιλογής µεταβλητών living Size of Living Area in Sq. ft lotsize Lot Size in Sq.ft. living Size of Living Area in Sq. ft a. Dependent Variable: price Price in US Dollars b. Linear Regression through the Origin Unstandardized B Std. Error Standardized Beta 6.808.05.90 5.683.000.850.407.096.604.55 69.46.889.998 78.49.000 t Sig. ιαφάνεια -38 ιαφάνεια -40

Ενότητα ιαφάνειες Μαθήµατος: - Ενότητα ιαφάνειες Μαθήµατος: -.4. ιαδικασίες επιλογής µοντέλων και µεταβλητών (Εφαρµογή στο SPSS: Συνέχεια παραδείγµατος -) lotsize Lot Size in Sq.ft. Excluded Variables b,c a. Predictors in the : living Size of Living Area in Sq. ft b. Dependent Variable: price Price in US Dollars c. Linear Regression through the Origin Collinearity Partial Statistics Beta In t Sig. Correlation Tolerance.096 a.604.55.3.007 ΠΑΡΕΝΕΡΓΕΙΕΣ Όταν υπάρχει πλήρη γραµµική σχέση δεν µπορούν να βρεθούν εκτιµητές Μεγ.Πιθ. (ή ελ.τετρ.) Υψηλά τυπικά σφάλµατα Αστάθεια εκτιµητών Αλλοίωση επιδράσεων (ακόµα και αλλαγή πρόσηµων στις επιδράσεις) ιαφάνεια -4 ιαφάνεια -43 Πολυσυγγραµικότητα (multi-collinearity) Η υψηλή (στατιστικά) γραµµική σχέση µεταξύ µιας επεξηγηµατικής µεταβλητής µε τις υπόλοιπες Συγγραµµικότητα (collinearity) Η τέλεια γραµµική σχέση µεταξύ µιας επεξηγηµατικής µεταβλητής µε τις υπόλοιπες Στη βιβλιογραφία πολλές φορές οι όροι ταυτίζονται Για λεπτοµέρειες βλ. Ryan (997, σελ. 3) Γιατί είναι πρόβληµα; ΛΟΓΙΚΗ ΕΠΕΞΗΓΗΣΗ Αν µεταβλητές σχετίζονται ισχυρά µεταξύ τους, τότε µεταφέρουν παρόµοια πληροφορία (εφόσον γνωρίζοντας τη µια µπορούµε µε ακρίβεια να προβλέψουµε την άλλη). Συνεπώς τέτοιες µεταβλητές δεν προσθέτουν πληροφορία όταν τις προσθέτουµε στο µοντέλο Παρόµοια είναι η περίπτωση αν έχουµε εξάρτηση µε περισσότερες από µία µεταβλητές ιαφάνεια -4 ιαφάνεια -44

Ενότητα ιαφάνειες Μαθήµατος: -3 Ενότητα ιαφάνειες Μαθήµατος: -4 Γιατί είναι πρόβληµα; ΕΡΜΗΝΕΥΤΙΚΗ ΑΡΙΘΜΗΤΙΚΗ ΕΞΗΓΗΣΗ Έστω το παλινδροµικό µοντέλο Υ= β 0 +β Χ + β Χ +ε Όµως Χ = a+b X (τέλεια γραµµική σχέση) εν µπορούµε να χρησιµοποιήσουµε την προηγούµενη ερµηνεία διότι µεταβολή στη Χ συνεπάγεται µεταβολή και στην Χ ΕΠΙΠΛΕΟΝ Υ= β 0 +β Χ + β (a+bχ )+ε = (β 0 +a β )+(β +β b)χ +ε Γιατί είναι πρόβληµα; ΜΑΘΗΜΑΤΙΚΗ ΕΞΗΓΗΣΗ βˆ =(Χ T Χ) - Χ Τ y ΠΡΟΒΛΗΜΑ: Αν µια µεταβλητή (δηλ. Στήλη του Χ) είναι γραµµικός συνδυασµός των υπόλοιπων τότε δεν υπάρχει ο αντίστροφος (Χ T Χ) - ΣΤΗΝ ΠΡΑΞΗ: Σπάνια έχουµε τέλεια γραµµική σχέση. Αν όµως µια µεταβλητή σχετίζεται υψηλά µε τις υπόλοιπες (δηλ. Κάνουµε παλινδρόµηση µεταξύ τους και προκύψει µεγάλο R ) τότε έχουµε ασταθείς (unstable) εκτιµήσεις και µεγάλα τυπικά σφάλµατα. Ποια είναι η σωστή επίδραση της Χ ; ιαφάνεια -45 ιαφάνεια -47 Γιατί είναι πρόβληµα; ΜΑΘΗΜΑΤΙΚΗ ΕΞΗΓΗΣΗ βˆ =(Χ T Χ) - Χ Τ y T β ˆ = (βˆ ) 0,βˆ,...,βˆ p είναι το διάνυσµα των εκτιµητών µέγιστης πιθανοφάνειας διάστασης (p+)x Χ είναι ο πίνακας σχεδιασµού ή δεδοµένων διάστασης nx(p+). Η πρώτη στήλη αναφέρεται στο σταθερό όρο και έχει όλα της τα στοιχεία της ίσα µε ένα (). Οι υπόλοιπες έχουν τα δεδοµένα κάθε µεταβλητής y είναι το διάνυσµα διάστασης nx µε τα δεδοµένα της µεταβλητής απόκρισης. ΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ. Συσχετίσεις Pearson. Συντελεστές Πληθωρισµού ιακυµάνσεων (variance inflation factors) 3. Έλεγχος µε ιδιοτιµές και ιδιοδιανύσµατα της µήτρας Χ T Χ 4. Αναλογίες Αποσύνθεσης διακύµανσης (variance-decomposition proportions ή απλά variance proportions) ιαφάνεια -46 ιαφάνεια -48

Ενότητα ιαφάνειες Μαθήµατος: -5 Ενότητα ιαφάνειες Μαθήµατος: -6 ΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ. Συσχετίσεις Pearson [ είχνουν υψηλές γραµµικές σχέσεις ανά αλλά όχι για περισσότερες µεταβλητές όπως για X =X +X 3 +X 4 ]. Συντελεστές Πληθωρισµού ιακυµάνσεων (variance inflation factors) VIF(j) = (-R j ) - R j = Συντελεστής προσδιορισµού που προκύπτει από την παλινδρόµηση των υπόλοιπων επεξηγηµατικών µεταβλητών στην Χ j. Tolerance j =(-R j )=/VIF(j) : είκτης Ανεκτικότητας. είχνει το ποσοστό της διακύµανσης που δεν εξηγείται από τις υπόλοιπες συµµεταβλητές. Χαµηλές τιµές υποδεικνύουν πρόβληµα. Αν VIF(j)>0 έχουµε πρόβληµα Για p= ( επεξηγηµατικές µεταβλητές) τότε VIF(i)>0 r XX >0.949 ιαφάνεια -49 ΤΡΟΠΟΙ ΑΝΤΙΜΕΤΩΠΙΣΗΣ. Προσεκτικός σχεδιασµός πειράµατος. Όχι τυχαία Χ αλλά µε βάση πειραµατικό σχεδιασµό δύσκολο στην πράξη. Αφαίρεση Προβληµατικών µεταβλητών. Με µεγάλα VIF>0 & Αντιστοιχεί σε µικρή ιδιοτιµή Αφαιρούµε µόνο µία από αυτές µε µεγάλα proportion variance που αντιστοιχούν στην ίδια µικρή ιδιοτιµή Τσεκάρουµε R το οποίο πρέπει να αλλάξει ελάχιστα (εδώ βοηθάνε και οι κλιµακωτές διαδικασίες επιλογής µεταβλητών) Προσπαθούµε να έχουµε CI<5 (ή έστω CI<30) 3. Χρήση ορθογώνιου µετασχηµατισµού (Κυρίες συνιστώσες) των Χ. ύσκολη ερµηνεία ιαφάνεια -5 ΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ 3. Έλεγχος µε ιδιοτιµές και ιδιοδιανύσµατα της µήτρας Χ T Χ Ιδιοτιµές κοντά στο µηδέν υποδεικνύουν πρόβληµα. Condition Index=Τετραγωνική ρίζα (ΜΑΧ(Ιδιοτιµών)/Ιδιοτιµή) Αν CI j >30 σοβαρό πρόβληµα Αν CI j >5 πιθανό πρόβληµα Μεταβλητές που έχουν υψηλές τιµές ιδιοδιανυσµάτων είναι µεταβλητές που συµµετέχουν στην γραµµική σχέση. 4. Αναλογίες Αποσύνθεσης διακύµανσης (variance-decomposition proportions ή απλά variance proportions) Αναλογία (Ποσοστό) του VIF που προκύπτει από τη γραµµική σχέση που απεικονίζει η αντίστοιχη ιδιοτιµή (και ιδιοδιάνυσµα). (Εφαρµογή στο SPSS: Συνέχεια παραδείγµατος -) ιαφάνεια -50 ιαφάνεια -5

Ενότητα ιαφάνειες Μαθήµατος: -7 Ενότητα ιαφάνειες Μαθήµατος: -8 a. b. (Εφαρµογή στο SPSS: Συνέχεια παραδείγµατος -) living Size of Living Area in Sq. ft Unstandardized B Std. Error a,b Standardized Beta Collinearity Statistics t Sig. Tolerance VIF 6.808.05.90 5.683.000.007 5.04 lotsize Lot Size in Sq.ft..850.407.096.604.55.007 5.04 Dependent Variable: price Price in US Dollars Linear Regression through the Origin (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΧΡΗΣΙΜΟΠΟΙΟΥΜΕ ΠΡΟΣΟΜΟΙΩΜΕΝΑ Ε ΟΜΕΝΑ n=00 Χ, X 3, X 4,X 5,X 6,X 7 ~ Ν(0,) X =X +X 3 +X 4 Y = 4 + Χ -3 X 4 +5 X 6 + ε, ε~ Ν(0,0.5=0.5 ) VIF>0 ΠΡΟΒΛΗΜΑ ιαφάνεια -53 ιαφάνεια -55 (Εφαρµογή στο SPSS: Συνέχεια παραδείγµατος -) (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) Collinearity Diagnostics a,b Dimension Variance Proportions living Size of Condition Living Area in lotsize Lot Eigenvalue Index Sq. ft Size in Sq.ft..997.000.00.00.003 4.55.00.00 a. Dependent Variable: price Price in US Dollars b. Linear Regression through the Origin Στο γραµµικό συνδυασµό της προβληµατικής µεταβλητής συµµετέχουν οι µεταβλητές ΠΡΟΒΛΗΜΑΤΙΚΗ Ι ΙΟΤΙΜΗ ΜΕ CP>5 ιαφάνεια -54 ιαφάνεια -56

Ενότητα ιαφάνειες Μαθήµατος: -9 Ενότητα ιαφάνειες Μαθήµατος: -30 (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) COMPUTE x = RV.NORMAL(0,). EXECUTE. COMPUTE x3 = RV.NORMAL(0,). EXECUTE. COMPUTE x4 = RV.NORMAL(0,). EXECUTE. COMPUTE x5 = RV.NORMAL(0,). EXECUTE. COMPUTE x6 = RV.NORMAL(0,). EXECUTE. COMPUTE x7 = RV.NORMAL(0,). EXECUTE. COMPUTE x8 = RV.NORMAL(0,). EXECUTE. COMPUTE e = RV.NORMAL(0,0.5). EXECUTE. COPY+PASTE ιαφάνεια -57 (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) COMPUTE x = x+x3+x4. EXECUTE. COMPUTE y = 4 + x - 3*x4 +5* x6 + e. EXECUTE. ΚΑΝΟΥΜΕ ΤΗΝ ΠΑΛΙΝ ΡΟΜΗΣΗ ΤΩΝ Χ ΣΤΗΝ Υ ιαφάνεια -59 (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΤΟ ΠΡΟΓΡΑΜΜΑ ΑΠΟΦΑΣΙΣΕ ΑΠΟ ΜΟΝΟ ΤΟΥ ΝΑ ΑΦΑΙΡΕΣΕΙ ΜΙΑ ΑΠΟ ΤΙΣ ΜΕΤΑΒΛΗΤΕΣ ΠΟΥ ΕΜΠΛΕΚΟΝΤΑΙ ΣΤΗΝ ΤΕΛΕΙΑ ΓΡΑΜΜΙΚΗ a Unstandardized Standardized Collinearity Statistics B Std. Error Beta t Sig. Tolerance VIF (Constant) 4.030.044 9.6.000 x.943.059.68 5.970.000.500.000 x4-3.034.060 -.484-50.909.000.608.645 x5 -.08.05 -.004 -.536.593.98.078 x6 4.930.043.867 4.906.000.967.034 x7.046.050.007.903.369.908.0 x8 -.05.048 -.004 -.54.609.844.85 x.0.04.006.50.604.46.404 a. Dependent Variable: y Excluded Variables b Collinearity Statistics Partial Minimum Beta In t Sig. Correlation Tolerance VIF Tolerance x3. a....000..000 a. Predictors in the : (Constant), x, x6, x5, x7, x8, x4, x b. Dependent Variable: y ιαφάνεια -58 ιαφάνεια -60

Ενότητα ιαφάνειες Μαθήµατος: -3 Ενότητα ιαφάνειες Μαθήµατος: -3 a. (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΤΟ ΠΡΟΓΡΑΜΜΑ ΑΠΟΦΑΣΙΣΕ ΑΠΟ ΜΟΝΟ ΤΟΥ ΝΑ ΑΦΑΙΡΕΣΕΙ ΜΙΑ ΑΠΟ ΤΙΣ ΜΕΤΑΒΛΗΤΕΣ ΠΟΥ ΕΜΠΛΕΚΟΝΤΑΙ ΣΤΗΝ ΤΕΛΕΙΑ ΓΡΑΜΜΙΚΗ Dimension 3 4 5 6 7 8 Dependent Variable: y Collinearity Diagnostics a Variance Proportions Condition Eigenvalue Index (Constant) x x4 x5 x6 x7 x8 x.000.00.96.06.06.0.00.0.04.09.44.63.9.08.09.03.00.06.04.00.37.48.03.00.00.4.6.04.7.00.987.396..0.0.7.03.5.03.00.874.484.03.00.0.7.65.0.0.00.79.65.63..9.00.05.06.0.00.600.79.00.00.09.7.00.9.59.08.3.939.00.73.55.0.0.0.0.8 ιαφάνεια -6 (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) (Constant) x x x3 x4 x5 x6 x7 x8 a. Dependent Variable: y Unstandardized a Standardized Collinearity Statistics t Sig. Tolerance VIF B Std. Error Beta 4.03.044 90.649.000 -.97.449 -.055 -.440.66.004 77.006.6.450.06.58.0.009 5.060.9.45.040.486.68.008 0.070 -.84.454 -.449-6.03.000.0 94.506 -.06.05 -.004 -.503.66.94.08 4.95.044.866.30.000.96.09.047.05.007.9.360.906.04 -.04.048 -.004 -.509.6.844.85 ΠΡΑΓΜΑΤΙΚΗ ΣΧΕΣΗ: Y = 4 + Χ -3 X 4 +5 X 6 + ε, ε~ Ν(0,0.5=0.5 ) ΕΚΤΙΜΩΜΕΝΗ ΣΧΕΣΗ: Y = 4 0. Χ +. Χ +0. X 3.8 X 4 0.0 X 5 +4.9 X 6 +0.05 X 7 0.0 X 8 + ε, ε~ Ν(0, (0.4) ) ιαφάνεια -63 (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΜΕΤΑΒΑΛΟΥΜΕ ΤΩΡΑ ΤΗΝ ΤΕΛΕΙΑ ΓΡΑΜΜΙΚΗ ΣΧΕΣΗ ΣΕ ΠΟΛΥ ΥΨΗΛΗ ΗΛΑ Η COMPUTE e = RV.NORMAL(0,0.). EXECUTE. COMPUTE x = x+x3+x4 + e. EXECUTE. ΞΑΝΑΚΑΝΟΥΜΕ ΤΗΝ ΠΑΛΙΝ ΡΟΜΗΣΗ ΤΩΝ Χ ΣΤΗΝ Υ ιαφάνεια -6 a. Dimension 3 4 5 6 7 8 9 Dependent Variable: y (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) Collinearity Diagnostics a Variance Proportions Condition Eigenvalue Index (Constant) x x x3 x4 x5 x6 x7 x8.000.00.998.00.00.00.00.00.00.0.03.484.60.6.00.00.00.00.05.00.0.04.7.54.00.00.00.00.00.4..0.4.0.347.06.00.00.00.00..0.06.08.983.45.6.00.00.00.00.3.04.45.06.87.54.05.00.00.00.00.8.6.0.07.70.666.56.00.00.00.00.0.06.03.00.57.870.00.00.00.00.00.7.00.3.58.00 34.993.00.00.99.99.99.00.05.00.00 ΣΤΗΝ ΠΡΟΒΛΗΜΑΤΙΚΗ Ι ΙΟΤΙΜΗ ΑΝΤΙΣΤΟΙΧΕΙ ΓΡΑΜΜΙΚΟΣ ΣΥΝ ΙΑΣΜΟΣ ΣΤΟΝ ΟΠΟΙΟ ΣΥΜΜΕΤΕΧΟΥΝ ΜΕ ΜΕΓΑΛΑ ΠΟΣΟΣΤΑ (ΣΧΕ ΟΝ 00%) ΟΙ Χ, Χ, Χ 3 ΚΑΙ Χ 4. ΜΙΚΡΗ (ΠΡΟΒΛΗΜΑΤΙΚΗ) Ι ΙΟΤΙΜΗ ΜΕ CP>30 ΣΥΝΕΠΩΣ ΥΠΑΡΧΕΙ ΕΝΑΣ ΓΡΑΜΜΙΚΟΣ ΣΥΝ ΙΑΣΜΟΣ (ΣΧΕΣΗ) ΜΕΤΑΞΥ ΤΩΝ Χ ΑΡΑ ΠΡΕΠΕΙ ΝΑ ΑΦΑΙΡΕΣΟΥΜΕ ΜΕΤΑΒΛΗΤΗ ΜΟΝΟ ιαφάνεια -64

Ενότητα ιαφάνειες Μαθήµατος: -33 Ενότητα ιαφάνειες Μαθήµατος: -34 (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΑΝ ΒΑΛΟΥΜΕ BACKWARD SELECTION ΑΝ ΒΑΛΟΥΜΕ BACKWARD SELECTION Variables Entered/Removed b 3 4 5 6 Variables Variables Entered Removed Method x8, x3, x6, x7, x5, x, x4, x a. Enter. x Backward (criterion: Probability of F-to-remove >=.00).. x8 Backward (criterion: Probability of F-to-remove >=.00).. x3 Backward (criterion: Probability of F-to-remove >=.00).. x5 Backward (criterion: Probability of F-to-remove >=.00).. x7 Backward (criterion: Probability of F-to-remove >=.00). a. All requested variables entered. b. Dependent Variable: y ΠΡΑΓΜΑΤΙΚΗ ΣΧΕΣΗ: Y = 4 +.00 Χ 3X 4 +5.0 X 6 + ε, ε~ Ν(0, (0.50) ) ΕΚΤΙΜΩΜΕΝΗ ΣΧΕΣΗ: Y = 4 + 0.98 Χ 3X 4 + 4.9 X 6 + ε, ε~ Ν(0, (0.4) ) ΟΚ ιαφάνεια -65 ιαφάνεια -67 (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΑΝ ΒΑΛΟΥΜΕ BACKWARD SELECTION ΑΝ ΒΑΛΟΥΜΕ BACKWARD SELECTION Summary 3 4 5 6 Adjusted Std. Error of R R Square R Square the Estimate.997 a.995.995.4489.997 b.995.995.430.997 c.995.995.434.997 d.995.995.4978.997 e.995.995.485.997 f.995.995.4808 a. Predictors: (Constant), x8, x3, x6, x7, x5, x, x4, x b. Predictors: (Constant), x8, x3, x6, x7, x5, x, x4 c. Predictors: (Constant), x3, x6, x7, x5, x, x4 d. Predictors: (Constant), x6, x7, x5, x, x4 e. Predictors: (Constant), x6, x7, x, x4 f. Predictors: (Constant), x6, x, x4 ΜΕΤΑΒΟΛΗ R, R & σ ΑΝΑ ΒΗΜΑ ( ΗΛΑ Η ΓΙΑ ΚΑΘΕ ΜΟΝΤΕΛΟ ΜΕΤΑ ΑΠΟ ΤΗΝ ΣΤΑ ΙΑΚΗ ΑΦΑΙΡΕΣΗ ΜΕΤΑΒΛΗΤΩΝ) ιαφάνεια -66 ΟΚ ΕΛΑΧΙΣΤΟ TOLERANCE AN ΠΡΟΣΤΕΘΕΙ ΑΥΤΗ Η ΜΕΤΑΒΛΗΤΗ ΣΤΟ ΜΟΝΤΕΛΟ Collinearity diagnostics της κάθε µεταβλητής αν προστεθεί στο µοντέλο ιαφάνεια -68

Ενότητα ιαφάνειες Μαθήµατος: -35 Ενότητα ιαφάνειες Μαθήµατος: -36 (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΑΝ ΒΑΛΟΥΜΕ STEPWISE PROCEDURE Variables Entered/Removed a (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΑΝ ΒΑΛΟΥΜΕ STEPWISE PROCEDURE Variables Variables Entered Removed x6. x4. 3 x. a. Dependent Variable: y Method Stepwise (Criteria: Probability-of-F-to-enter <=.050, Probability-of-F-to-remove >=.00). Stepwise (Criteria: Probability-of-F-to-enter <=.050, Probability-of-F-to-remove >=.00). Stepwise (Criteria: Probability-of-F-to-enter <=.050, Probability-of-F-to-remove >=.00). Summary 3 Adjusted Std. Error of R R Square R Square the Estimate.854 a.79.76.9990.98 b.965.964.0844.997 c.995.995.4808 a. Predictors: (Constant), x6 b. Predictors: (Constant), x6, x4 c. Predictors: (Constant), x6, x4, x ιαφάνεια -69 ιαφάνεια -7 (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΑΝ ΒΑΛΟΥΜΕ STEPWISE PROCEDURE (ΠΑΡΑ ΕΙΓΜΑ - ΣΥΓΓΡΑΜΜΙΚΑ Ε ΟΜΕΝΑ) ΑΝ ΒΑΛΟΥΜΕ STEPWISE PROCEDURE ΜΟΝΤΕΛΟ: Υ=β 0 +β 6 Χ 6 a Unstandardized Standardized Collinearity Statistics B Std. Error Beta t Sig. Tolerance VIF (Constant) 3.93.300 0.64.000 x6 4.856.99.854 6.38.000.000.000 (Constant) 3.88. 34.85.000 x6 4.846.08.85 44.936.000.000.000 x4-3.044.9 -.486-5.66.000.000.000 3 (Constant) 4.030.044 9.53.000 x6 4.934.04.868 7.877.000.99.008 x4-3.00.046 -.480-65.56.000.999.00 x.975.04.73 3.56.000.99.009 a. Dependent Variable: y ιαφάνεια -70 ΠΑΛΙΝ ΡΟΜΗΣΗ Χ & Χ 6 ΣΤΗΝ Υ Υ=β 0 +β 6 Χ 6 +β Χ (Constant) x6 x Unstandardized a Standardized Collinearity Statistics t Sig. Tolerance VIF B Std. Error Beta 3.09.95 0.876.000 4.88.94.849 6.40.000.998.00 -.396.87 -.09 -..037.998.00 a. Dependent Variable: y ιαφάνεια -7

Ενότητα ιαφάνειες Μαθήµατος: -37 Ενότητα ιαφάνειες Μαθήµατος: -38 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) Ποια στοιχεία - δείκτες καθορίζουν το το γενικό οικονοµικό επίπεδο µιας χώρας; BHMATA. ΕΠΙΛΟΓΗ Υ HISTOGRAM. ΕΠΙΛΟΓΗ Χ BACKWARD/STEPWISE SELECTION 3. ΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ 4. ΕΡΜΗΝΕΙΑ ΤΕΛΙΚΟΥ ΜΟΝΤΕΛΟΥ (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95)... ΕΠΙΛΟΓΗ Χ ΑΡΧΙΚΗ ΕΠΙΛΟΓΗ Χ populatn density urban lifeexpf lifeexpm literacy pop_incr babymort calories aids.birth_rt.death_rt 3.aids_rt 4.lg_aidsr 5.b_to_d 6.fertilty 7.log_pop 8.cropgrow 9.lit_male 0.lit_fema ιαφάνεια -73 ιαφάνεια -75 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95)... ΕΠΙΛΟΓΗ Υ GDP_CAP = Gross domestic product / capita Ακαθάριστο εθνικό προϊόν ανά άτοµο Υ = log(gdp) λόγω ασυµµετρίας (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95)... ΕΠΙΛΟΓΗ Χ BACKWARD SELECTION ιαφάνεια -74 ιαφάνεια -76

Ενότητα ιαφάνειες Μαθήµατος: -39 Ενότητα ιαφάνειες Μαθήµατος: -40 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95)... ΕΠΙΛΟΓΗ Χ BACKWARD SELECTION (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) BACKWARD ME P-TO-REMOVE = 0.05 ΜΕΤΑΒΛΗΤΕΣ ΣΤΟ ΜΟΝΤΕΛΟ ) urban People living in cities (%) ) calories Daily calorie intake 3) fertilty Fertility: average number of kids 4) birth_rt Birth rate per 000 people 5) log_pop Log (base 0) of Population STEPWISE ME P-TO-REMOVE = 0.05/ P-TO-ADD 0.050 ΜΕΤΑΒΛΗΤΕΣ ΣΤΟ ΜΟΝΤΕΛΟ ΟΙ ΠΑΡΑΠΑΝΩ + AIDS ιαφάνεια -77 ιαφάνεια -79 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95)... ΕΠΙΛΟΓΗ Χ STEPWISE SELECTION Variables Entered/Removed a BACKWARD STEPWISE 3 4 5 6 Variables Variables Entered Removed calories Daily calorie intake. urban People living in cities (%). log_pop Log (base 0) of Population. birth_rt Birth rate per 000 people. aids Aids cases. fertilty Fertility: average number of kids. Method Stepwise (Criteria: Probability-of-F-to-enter <=. 050, Probability-of-F-to-remove >=.05). Stepwise (Criteria: Probability-of-F-to-enter <=. 050, Probability-of-F-to-remove >=.05). Stepwise (Criteria: Probability-of-F-to-enter <=. 050, Probability-of-F-to-remove >=.05). Stepwise (Criteria: Probability-of-F-to-enter <=. 050, Probability-of-F-to-remove >=.05). Stepwise (Criteria: Probability-of-F-to-enter <=. 050, Probability-of-F-to-remove >=.05). Stepwise (Criteria: Probability-of-F-to-enter <=. 050, Probability-of-F-to-remove >=.05). a. Dependent Variable: log_gdp Log (base 0) of GDP_CAP ιαφάνεια -78 ιαφάνεια -80

Ενότητα ιαφάνειες Μαθήµατος: -4 Ενότητα ιαφάνειες Μαθήµατος: -4 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΣΤΑΤΙΣΤΙΚΑ ΤΩΝ EXCLUDED VARIABLES ΑΠΟ ΤΗ BACKWARD PROCEDURE (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΣΥΝΕΠΩΣ ΟΥΛΕΥΟΥΜΕ ΤΩΡΑ ΜΕ ΤΟ ΤΕΛΙΚΟ ΜΟΝΤΕΛΟ ΠΟΥ ΕΠΙΛΕΧΘΗΚΕ ΑΠΟ ΤΗ STEPWISE PROCEDURE urban calories fertilty birth_rt log_pop AIDS ιαφάνεια -8 ιαφάνεια -83 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΣΤΑΤΙΣΤΙΚΑ ΤΩΝ EXCLUDED VARIABLES ΑΠΟ ΤΗ BACKWARD PROCEDURE (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΣΥΝΕΠΩΣ ΟΥΛΕΥΟΥΜΕ ΤΩΡΑ ΜΕ ΤΟ ΤΕΛΙΚΟ ΜΟΝΤΕΛΟ ΠΟΥ ΕΠΙΛΕΧΘΗΚΕ ΑΠΟ ΤΗ STEPWISE PROCEDURE Unstandardized a Standardized Collinearity Statistics (Constant) urban People living in cities (%) B Std. Error Beta t Sig. Tolerance VIF 8.03.000 3.58.397.008.00.98 4.748.000.453.09 ΑΡΑ ΚΡΑΤΑΜΕ ΤΟ ΜΟΝΤΕΛΟ ΤΗΣ STEPWISE ΙΑ ΙΚΑΣΙΑΣ calories Daily calorie intake log_pop Log (base 0) of Population aids Aids cases fertilty Fertility: average number of kids birth_rt Birth rate per 000 people.000.000.33 4.75.000.3 3. -.79.050 -.69-3.6.00.80.0.8E-006.000.086.908.06.886.8..068.645 3.65.00.046.883 -.054.0 -.00-4.643.000.038 6.57 a. Dependent Variable: log_gdp Log (base 0) of GDP_CAP ιαφάνεια -8 ιαφάνεια -84

Ενότητα ιαφάνειες Μαθήµατος: -43 Ενότητα ιαφάνειες Μαθήµατος: -44 a. (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΣΥΝΕΠΩΣ ΟΥΛΕΥΟΥΜΕ ΤΩΡΑ ΜΕ ΤΟ ΤΕΛΙΚΟ ΜΟΝΤΕΛΟ ΠΟΥ ΕΠΙΛΕΧΘΗΚΕ ΑΠΟ ΤΗ STEPWISE PROCEDURE Dimension 3 4 5 6 Collinearity Diagnostics a Variance Proportions fertilty Fertility: urban log_pop Log average birth_rt Birth Condition People living calories Daily (base 0) of aids Aids number of rate per 000 Eigenvalue Index (Constant) in cities (%) calorie intake Population cases kids people 5.5.000.00.00.00.00.00.00.00.949.40.00.00.00.00.85.00.00.453 3.487.00.06.00.00.04.0.00.06 9.400.00.56.0.09.0.0.00.06 8.665.00.35.43.35.00.0.0.006 3.58.33.04.04.48.06.44.3 7.003 44.58.67.00.5.07.0.5.75 Dependent Variable: log_gdp Log (base 0) of GDP_CAP Αφαιρούµε το Birth διότι έχει µεγαλύτερο VIF+µεγαλύτερη συµµετοχή στον γρ. Συνδιασµό µε τη µικρότερη ιδιοτιµή a. (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ BIRTH_RT R : 0.88 -> 0.84 R adj : 0.87-> 0.83 Dimension 3 4 5 Collinearity Diagnostics a Variance Proportions fertilty Fertility: urban log_pop Log average Condition People living calories Daily (base 0) of aids Aids number of Eigenvalue Index (Constant) in cities (%) calorie intake Population cases kids 4.665.000.00.00.00.00.00.00.93.37.00.00.00.00.88.00.33 3.800.00.08.00.00.0.7.059 8.858.0.5.0.09.0.3.05 7.454.00.38.59.40.00.0 6.004 3.0.99.0.40.5.08.50 Dependent Variable: log_gdp Log (base 0) of GDP_CAP Υπάρχουν CP µεγάλα όµως στο χειρότερο γρ. Συνδιασµό δεν εµπλέκεται µε µεγάλο ποσοστό κάποια από τις Χ Και επειδή δεν έχουµε µεγάλα VIF προχωράµε µε αυτό το µοντέλο ιαφάνεια -85 ιαφάνεια -87 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ BIRTH_RT R : 0.88 -> 0.84 R adj : 0.87-> 0.83 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ BIRTH_RΤ a (Constant) Unstandardized Standardized Collinearity Statistics B Std. Error Beta t Sig. Tolerance VIF 6.0.000.446.407 urban People living in.008.00.95 4..000.453.09 cities (%) calories Daily calorie.00.000.484 6.99.000.393.54 intake log_pop Log (base 0) -.95.056 -.83-3.456.00.83.5 of Population aids Aids cases.9e-006.000.087.697.094.886.8 fertilty Fertility: average -.077.05 -.5-3.37.003.453.09 number of kids a. Dependent Variable: log_gdp Log (base 0) of GDP_CAP OK ιαφάνεια -86 Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df df Sig. Statistic Sig. ZRE_ Standardized.8 74.004.964 74.035 Residual a. Lilliefors Significance Correction ιαφάνεια -88

Ενότητα ιαφάνειες Μαθήµατος: -45 Ενότητα ιαφάνειες Μαθήµατος: -46 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ FERTILITY (OXI TO BIRTH_RATE) R : 0.88 -> 0.84 -> 0.86 R adj : 0.87-> 0.83 -> 0.85 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ FERTILITY (OXI TO BIRTH_RATE) a (Constant) Unstandardized Standardized Collinearity Statistics B Std. Error Beta t Sig. Tolerance VIF 7.00.000.989.45 urban People.007.00.76 4.44.000.458.85 living in cities (%) calories Daily.000.000.399 5.80.000.343.93 calorie intake aids Aids cases.6e-006.000.09.95.060.888.6 log_pop Log (base -.04.05 -.9-3.89.000.838.93 0) of Population birth_rt Birth rate -.08.004 -.334-4.557.000.379.640 per 000 people a. Dependent Variable: log_gdp Log (base 0) of GDP_CAP OK ιαφάνεια -89 ZRE_5 Standardized Residual Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig..083 74.00*.973 74.5 *. This is a lower bound of the true significance. a. Lilliefors Significance Correction OK KANONIKOTHTA ιαφάνεια -9 a. (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ FERTILITY (OXI TO BIRTH_RATE) R : 0.88 -> 0.84 -> 0.86 R adj : 0.87-> 0.83 -> 0.85 Dimension 3 4 5 Collinearity Diagnostics a Variance Proportions urban log_pop Log birth_rt Birth Condition People living calories Daily aids Aids (base 0) of rate per 000 Eigenvalue Index (Constant) in cities (%) calorie intake cases Population people 4.70.000.00.00.00.00.00.00.933.45.00.00.00.88.00.00.94 4.00.00.0.00.0.00..053 9.49.00.55.0.0.0.7.05 7.786.00.33.47.0.49.0 6.004 35.0.99.0.5.07.4.59 Dependent Variable: log_gdp Log (base 0) of GDP_CAP Υπάρχουν CP µεγάλα όµως στο χειρότερο γρ. Συνδιασµό δεν εµπλέκεται µε µεγάλο ποσοστό κάποια από τις Χ Και επειδή δεν έχουµε µεγάλα VIF προχωράµε µε αυτό το µοντέλο (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ FERTILITY (OXI TO BIRTH_RATE) ΠΕΡΙΜΕΝΟΥΜΕ ΤΟ 5% ΤΩΝ ΤΙΜΩΝ ΝΑ ΕΙΝΑΙ ΕΚΤΟΣ ΟΡΙΩΝ ΗΛ. 0.05*74 = 4 (ΠΕΡΙΠΟΥ) ΟΚ ιαφάνεια -90 ιαφάνεια -9

Ενότητα ιαφάνειες Μαθήµατος: -47 Ενότητα ιαφάνειες Μαθήµατος: -48 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ FERTILITY (OXI TO BIRTH_RATE) ΒΛΕΠΟΥΜΕ ΜΙΚΡΕΣ ΑΛΛΑΓΕΣ ΣΤΙΣ ΙΑΚΥΜΑΝΣΕΙΣ ΚΥΡΙΩΣ ΣΤΑ ΑΚΡΑ ιαφάνεια -93 a. (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ FERTILITY (OXI TO BIRTH_RATE) R : 0.88 -> 0.84 -> 0.86 R adj : 0.87-> 0.83 -> 0.85 (Constant) Unstandardized a Standardized Collinearity Statistics B Std. Error Beta t Sig. Tolerance VIF 7.00.000.9895.45 urban People.0073.00.76 4.44.000.458.85 living in cities (%) calories Daily.0005.000.399 5.80.000.343.93 calorie intake aids Aids cases.6e-006.000.09.95.060.888.6 log_pop Log (base -.036.05 -.9-3.89.000.838.93 0) of Population birth_rt Birth rate -.079.004 -.334-4.557.000.379.640 per 000 people Dependent Variable: log_gdp Log (base 0) of GDP_CAP LOG(GDP)=.99 + 0.0073 ΑΣΤΙΚΟΠΟΙΗΣΗ + 0.0005 ΘΕΡΜΙ ΕΣ/ΗΜΕΡΑ +.6 0-6 ΠΕΡΙΠΤΩΣΕΙΣ AIDS 0.04 LOG(ΠΛΗΘΥΣΜΟΣ) 0.079 (ΓΕΝΝΗΣΕΙΣ ΑΝΑ 000 ΚΑΤΟΙΚΟΥΣ) + ε ιαφάνεια -95 (ΠΑΡΑ ΕΙΓΜΑ -3 WORLD 95) ΑΦΑΙΡΟΥΜΕ ΤΟ FERTILITY (OXI TO BIRTH_RATE) Ε ΦΑΙΝΕΤΑΙ ΚΑΠΟΙΑ ΤΑΣΗ ιαφάνεια -94 ΟΚ