ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ

Σχετικά έγγραφα
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 28 Μαρτίου /36

Λογιστική Παλινδρόµηση

(i) Περιγραφική ανάλυση των μεταβλητών PRICE

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32

Γραµµική Παλινδρόµηση

Ανάλυση της ιακύµανσης

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Μάθηµα εύτερο-τρίτο- Βασικά Ζητήµατα στο Απλό Γραµµικό Υπόδειγµα Ακαδηµαϊκό Έτος

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

1. Εισαγωγή...σελ Δεδομένα της εργασίας...σελ Μεθοδολογία...σελ Ανάλυση των δεδομένων.σελ Συγκριτικά αποτελέσματα..σελ.

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Εισόδημα Κατανάλωση

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R


F x h F x f x h f x g x h g x h h h. lim lim lim f x

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

ΦΥΛΛΑΔΙΟ ΑΣΚΗΣΕΩΝ ΣΤΑΤΙΣΤΙΚΗΣ ΠΑΝΟΣ ΣΑΡΑΚΗΝΟΣ

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Πολλαπλή παλινδρόμηση (Multivariate regression)

Ορισμός Τετραγωνική ονομάζεται κάθε συνάρτηση της μορφής y = αx 2 + βx + γ με α 0.

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Άσκηση 2. i β. 1 ου έτους (Υ i )

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Ορισμός και Ιδιότητες

SOURCE DF SUM OF SQUARES MEAN SQUARE F VALUE PR F MODEL (a) E04 (e) (g) (h) ERROR (b) (d) (f) TOTAL (c) E04 R SQUARE (i) PARAMETER

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Εισαγωγή στη Βιοστατιστική

Αναλυτική Στατιστική

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

9. Παλινδρόμηση και Συσχέτιση

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

Άσκηση 1. Πληθυσμός (Χ i1 )

8. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Ι

Ενδεικτικές ασκήσεις ΔΙΠ 50

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

ΤΡΑΠΕΖΑ ΘΕΜΑΤΩΝ ΑΛΓΕΒΡΑ Β ΛΥΚΕΙΟΥ

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Χ. Εμμανουηλίδης, 1

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική


4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Εισαγωγή στη Στατιστική

1.1 ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ

1 ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

Εργαστηριακή Άσκηση 5

Θέμα: Ενδεικτικό Θέμα εξετάσεων: Μέτρα θέσης Παλινδρόμηση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Ύλη 1 ης Εβδομάδας. Σχέσεις Μεταβλητών ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ. Σχέση μεταξύ Μεταβλητών Παραδείγματα. 2 η Διάλεξη

Transcript:

ΜΕΜ264: Εφαρμοσμένη Στατιστική 1 ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ 1. Σε μελέτη της επίδρασης γεωργικών χημικών στην προσρόφηση ιζημάτων και εδάφους, δίνονται στον πιο κάτω πίνακα 13 δεδομένα για το δείκτη προσρόφησης φωσφορικού άλατος (Υ), για το εξαγώγιμο σίδηρο (Χ1) και το εξαγώγιμο αργίλιο (Χ2). Α/Α Σίδηρο (Χ1) Αργίλιο (Χ2) δεικτης προσρόφησης 1 61 13 4 2 175 21 18 3 111 24 14 4 124 23 18 5 130 64 26 6 173 38 26 7 169 33 21 8 169 61 30 9 160 39 28 10 244 71 36 11 257 112 65 12 333 88 62 13 199 54 40 a) Να εφαρμόσετε το μοντέλο Υ = β0 + β1 Χ1 + β2 Χ2 +ε. i. Να εκτιμήσετε τα βi σημειακά και με δ.ε. συντελεστού 95%. Ποια η ερμηνεία τους; ii. Πως ερμηνεύετε το παρόν μοντέλο; iii. Nα κάνετε τον έλεγχο Η0: β1 = β2 =0 του μοντέλου μέσω του F-τεστ. Ποια είναι η εκτίμηση της διασποράς των σφαλμάτων; iv. Τι ποσοστό της μεταβλητότητας των Yi ερμηνεύεται από το μοντέλο; v. Να γίνει έλεγχος ορθότητας του μοντέλου: υπόλοιπων και των μεταβλητών Υ, Χ1, Χ2. Απάντηση: Εισάγω τα δεδομένα και σχηματίζω το μοντέλο στην R: >iron<-c(61, 175, 111, 124, 130, 173, 169, 169, 160, 244, 257, 333, 199) >argile<-c(13, 21, 24, 23, 64, 38, 33, 61, 39, 71, 112, 88, 54) >ind<-c(4, 18, 14, 18, 26, 26, 21, 30, 28, 36, 65, 62, 40) >my.data<-data.frame(ind, iron, argile) >lm.1<-lm(ind~iron + argile, data=my.data) >summary.lm(lm.1) >confint(lm.1)

ΜΕΜ264: Εφαρμοσμένη Στατιστική 2 Εκτιμ ητής β1 Εκτιμ ητής β2 Αποτέλεσμα: Call: lm(formula = ind ~ iron + argile, data = my.data) Residuals: Min 1Q Median 3Q Max -8.9352-2.2182 0.4613 3.3448 6.0708 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -7.35066 3.48467-2.109 0.061101. iron 0.11273 0.02969 3.797 0.003504 ** argile 0.34900 0.07131 4.894 0.000628 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 4.379 on 10 degrees of freedom Multiple R-squared: 0.9485, Adjusted R-squared: 0.9382 F-statistic: 92.03 on 2 and 10 DF, p-value: 3.634e-07 Διαστήματα εμπιστοσύνης των βi 2.5 % 97.5 % (Intercept) -15.11498341 0.4136638 iron 0.04657763 0.1788882 argile 0.19011968 0.5078809 P-value του β1: 0.003504< 0.01 (=1/100) άρα η Η0: β1=0 απορρίπτεται Δ/τα εμπιστοσύνης για τα β1 και β2. Παρατηρούμε ότι κανένα δ/μα δεν περιέχει το 0. P-value του β2: 0.000628 < 0.01 (=1/100) άρα η Η0: β2=0 απορρίπτεται Απάντηση στο ερώτημα (i): Εκτιμητής του β1: 0.11273 (σημειακός) με 95% δ/μα εμπιστοσύνης: [0.04657763,0.1788882]. Ερμηνεία: Η αύξηση του σιδήρου κατά μία μονάδα επιφέρει αύξηση στο δείκτη προσρόφησης κατά 0.112, δεδομένου ότι η ποσότητα αργιλίου παραμένει σταθερή. Εκτιμητής του β2: 0.34900 (σημειακός) με 95% δ/μα εμπιστοσύνης: [0.19011968, 0.5078809]. Ερμηνεία: Η αύξηση του αργιλίου κατά μία μονάδα επιφέρει αύξηση στο δείκτη προσρόφησης κατά 0.349, δεδομένου ότι η ποσότητα σιδήρου παραμένει σταθερή. Απάντηση στο ερώτημα (ii): Παρατηρούμε πως και τα 2 P-value (του β1 και του β2) συνιστούν απόρριψη των Η0: β1=0 και Η0: β2=0. Επιπλέον τα αντίστοιχα διαστήματα εμπιστοσύνης δεν περιέχουν το 0. Ακόμα περισσότερο, το F test για έλεγχο της Η0: β1=β2=0 έχει p- value: 3.634e-07 που συνιστά απόρριψη της υπόθεσης ότι οι 2 μεταβλητές δεν επηρεάζουν ταυτόχρονα το μοντέλο. Για όλους αυτούς του λόγους, η ερμηνεία της ανάλυσης του μοντέλου είναι ότι συμπεραίνουμε ότι το εξαγώγιμο σίδηρο και αργίλιο επηρεάζουν σημαντικά το δείκτη προσρόφησης και καλώς συμπεριλαμβάνονται στο μοντέλο. Απάντηση στο ερώτημα (iii): Όπως είπαμε στο ερώτημα (ii), το F test για έλεγχο της Η0: β1=β2=0 έχει p-value: 3.634e-07 που συνιστά απόρριψη της υπόθεσης ότι οι 2 μεταβλητές δεν επηρεάζουν ταυτόχρονα το μοντέλο. Η εκτίμηση της διασποράς των σφαλμάτων είναι : Residual standard error: 4.379 άρα: 4.379 (σε τί μονάδες;) Απάντηση στο ερώτημα (iv):

ΜΕΜ264: Εφαρμοσμένη Στατιστική 3 Adjusted R-squared: 0.9382: Αυτές οι 2 μεταβλητές ερμηνεύουν το περίπου 94% της μεταβλητότητας του δείκτη προσρόφησης. Απάντηση στο ερώτημα (v (α)): Για να πάρουμε το ιστόγραμμα και το qq plot δίνουμε τις εντολές: >res<- residuals.lm(lm.1) #απομονώνουμε τα υπόλοιπα σε μια μεταβλητή >stres<-rstandard(lm.1) #κανονικοποιούμε τα υπόλοιπα >par(mfrow=c(1,2)) # λέμε στην R να χωρέσει 2 γραφήματα μαζί >hist(stres) # ιστόγραμμα >qqnorm(stres) # qqplot Το αποτέλεσμα που παίρνουμε είναι: Ερμηνεία των γραφημάτων: Το ιστόγραμμα γίνεται δεκτό σαν προσέγγιση της κανονικής κατανομής γιατί έχουμε μόλις 13 παρατηρήσεις οπότε α) ξέρουμε ότι δεν πρόκειται να πάρουμε ακριβώς το ζητούμενο σχήμα β) δεν απέχει πολύ από το σχήμα της κανονικής. Το qqplot φαίνεται να προσαρμόζει τα σημεία πάνω σε ευθεία (όχι τέλεια) αλλά δεν φαίνεται και μεγάλη απόκλιση. Οπότε ο γραφικός έλεγχος συνιστά κανονικότητα των υπολοίπων.

ΜΕΜ264: Εφαρμοσμένη Στατιστική 4 Απάντηση στο ερώτημα (v (β)): Για να πάρουμε τα 3 γραφήματα δίνουμε τις εντολές: >par(mfrow=c(1,3)) # λέμε στην R να χωρέσει 3 γραφήματα δίπλα-δίπλα >plot(ind, stres) >plot(iron, stres) >plot(argile, stres) Ερμηνεία των γραφημάτων: Σε σχέση με την Υ (πρώτο γράφημα από αριστερά) παρατηρούμε ότι η κατανομή των υπόλοιπων είναι τυχαία, χωρίς να σχηματίζεται κάποια πατέντα ή να αυξάνεται η διακύμανση. Επίσης παρατηρούμε ότι οι τιμές των υπολοίπων (άξονας Υ) είναι μέσα στο 95% των ορίων των τιμών της κανονικής κατανομής. 2. Σε κοιλάδες τρίτης τάξης μετρήθηκαν: α) ο αριθμός των ρυακιών πρώτης τάξης (Υ) β) η πυκνότητα αποστράγγισης 1 (Χ1) γ) το εμβαδόν κάθε κοιλάδας (Χ2), δ) η υψομετρική διαφορά του υψηλότερου και του χαμηλότερου σημείου της λεκάνης κάθε κοιλάδας (Χ3) και ε) το σχήμα 2 κάθε κοιλάδας (Χ4). Τα αποτελέσματα των μετρήσεων φαίνονται στον πίνακα που ακολουθεί. 1 Η πυκνότητα αποστράγγισης της κοιλάδας ορίζεται ως το πηλίκο του συνολικού μήκους όλων των ρυακιών της κοιλάδας προς το εμβαδόν της κοιλάδας. 2 Ως σχήμα της κοιλάδας ορίζεται το πηλίκο του πλάτους προς το μήκος της κοιλάδας.

ΜΕΜ264: Εφαρμοσμένη Στατιστική 5 Κοιλάδα Υ Αριθμός ρυακιών Πυκνότητα αποστράγγισης Χ1 (Km/Km 2 ) Εμβαδόν Χ2 (Km 2 ) Υψομετρική διαφορά Χ3 (m) 1 25 7.16 0.968 998 0.42 2 7 8.28 0.198 562 0.53 3 12 11.73 0.254 542 0.33 4 59 11.47 1.018 817 0.25 5 5 14.62 0.117 635 0.17 6 12 10.53 0.339 332 0.41 7 6 14.76 0.126 275 0.65 8 23 10.57 0.564 786 0.73 9 6 11.62 0.154 695 0.47 10 7 11.28 0.218 885 0.45 11 5 7.32 0.254 690 0.71 12 10 9.43 0.332 592 0.36 13 9 7.76 0.595 735 0.66 14 6 7.06 0.306 548 0.42 15 5 12.14 0.098 576 0.38 16 9 11.76 0.272 713 0.25 17 11 12.52 0.440 805 0.31 18 7 12.44 0.156 384 0.39 19 17 8.46 0.766 910 0.32 20 5 9.55 0.179 507 0.42 Σχήμα a) Να κατασκευάσετε όλα τα (ανά δύο) γραφήματα διασποράς των μεταβλητών Υ, Χ1, Χ2, Χ3, Χ4. Φαίνεται να υπάρχει γραμμική ή άλλη σχέση μεταξύ των μεταβλητών; b) Να εφαρμόσετε το μοντέλο Υ = β0 + β1 Χ1 + β2 Χ2 + β3 Χ3 + β4 Χ4 +ε. i. Να εκτιμήσετε τα βi σημειακά και με δ.ε. συντελεστού 95%. ii. Ποιες ανεξάρτητες μεταβλητές φαίνεται να επηρεάζουν τον αριθμό ρυακιών; iii. Nα κάνετε τον έλεγχο Η0: β1 = β2 = β3 = β4=0 του μοντέλου μέσω του F- τεστ. Ποια είναι η εκτίμηση της διασποράς των σφαλμάτων; iv. Τι ποσοστό της μεταβλητότητας των Yi ερμηνεύεται από το μοντέλο; v. Να γίνει έλεγχος ορθότητας του μοντέλου: υπόλοιπων και των μεταβλητών Υ, Χ1, Χ2, Χ3, Χ4. c) Να εφαρμόσετε το μοντέλο Υ = β0 + β1 Χ1 + β2 Χ2 +ε. vi. Να εκτιμήσετε τα βi σημειακά και με δ.ε. συντελεστού 95%. Ποια η ερμηνεία τους; vii. Πως κρίνετε το παρόν μοντέλο σε σχέση με το προηγούμενο; Χ4

ΜΕΜ264: Εφαρμοσμένη Στατιστική 6 viii. Nα κάνετε τον έλεγχο Η0: β1 = β2 =0 του μοντέλου μέσω του F-τεστ. Ποια είναι η εκτίμηση της διασποράς των σφαλμάτων; ix. Τι ποσοστό της μεταβλητότητας των Yi ερμηνεύεται από το μοντέλο; x. Να γίνει έλεγχος ορθότητας του μοντέλου: υπόλοιπων και των μεταβλητών Υ, Χ1, Χ2. 3. Στον πίνακα που ακολουθεί φαίνονται οι μετρήσεις της συστολικής πίεσης του αίματος SBP, του δείκτη QUET = βάρος/υψος 2, της ηλικίας AGE και του ιστορικού σχετικά με το κάπνισμα SMK (SMK = 0 για μη καπνιστές, SMK = 1 για καπνιστές ή πρώην καπνιστές) 32 ανδρών ηλικίας άνω των 40 ετών από μια συγκεκριμένη περιοχή. Άτομο SBP (Y) QUET (Χ1) AGE (Χ2) SMK (Χ3) 1 135 2.876 45 0 2 122 3.251 41 0 3 130 3.1 49 0 4 148 3.768 52 0 5 146 2.979 54 1 6 129 2.79 47 1 7 162 3.668 60 1 8 160 3.612 48 1 9 144 2.368 44 1 10 180 4.637 64 1 11 166 3.877 59 1 12 138 4.032 51 1 13 152 4.116 64 0 14 138 3.673 56 0 15 140 3.562 54 1 16 134 2.998 50 1 17 145 3.36 49 1 18 142 3.024 46 1 19 135 3.171 57 0 20 142 3.401 56 0 21 150 3.628 56 1 22 144 3.751 58 0 23 137 3.296 53 0 24 132 3.21 50 0 25 149 3.301 54 1

ΜΕΜ264: Εφαρμοσμένη Στατιστική 7 26 132 3.017 48 1 27 120 2.789 43 0 28 126 2.956 43 1 29 161 3.8 63 0 30 170 4.132 63 1 31 152 3.962 62 0 32 164 4.01 65 0 a) Να κατασκευάσετε όλα τα (ανά δύο) γραφήματα διασποράς των μεταβλητών SBP, QUET, AGE, SMK. Φαίνεται να υπάρχει γραμμική ή άλλη σχέση μεταξύ των μεταβλητών; b) Να εφαρμόσετε το μοντέλο Υ = β0 + β1 Χ1 + β2 Χ2 + β3 Χ3 +ε. i. Να εκτιμήσετε τα βi σημειακά και με δ.ε. συντελεστού 95%. ii. Ποιες ανεξάρτητες μεταβλητές φαίνεται να επηρεάζουν τον αριθμό ρυακιών; iii. Nα κάνετε τον έλεγχο Η0: β1 = β2 = β3 = 0 του μοντέλου μέσω του F-τεστ. Ποια είναι η εκτίμηση της διασποράς των σφαλμάτων; iv. Τι ποσοστό της μεταβλητότητας των Yi ερμηνεύεται από το μοντέλο; v. Να γίνει έλεγχος ορθότητας του μοντέλου: υπόλοιπων και των μεταβλητών Υ, Χ1, Χ2, Χ3. c) Να εφαρμόσετε το μοντέλο Υ = β0 + β1 Χ2 + β2 Χ3 +ε. vi. Να εκτιμήσετε τα βi σημειακά και με δ.ε. συντελεστού 95%. Ποια η ερμηνεία τους; vii. Πως κρίνετε το παρόν μοντέλο σε σχέση με το προηγούμενο; viii. Nα κάνετε τον έλεγχο Η0: β1 = β2 =0 του μοντέλου μέσω του F-τεστ. Ποια είναι η εκτίμηση της διασποράς των σφαλμάτων; ix. Τι ποσοστό της μεταβλητότητας των Yi ερμηνεύεται από το μοντέλο; x. Να γίνει έλεγχος ορθότητας του μοντέλου: υπόλοιπων και των μεταβλητών Υ, Χ2, Χ3. 4. Στο αρχείο BGSgirls.csv περιέχονται τα δεδομένα 70 κοριτσιών που γεννήθηκαν στο Berkeley, California, ανάμεσα στον Ιανουάριο του 1928 και τον Ιούνιο του 1929. Τα στοιχεία μετριόντουσαν περιοδικά μέχρι την ηλικία των 18. Οι μεταβλητές είναι: WT2: βάρος (kg) σε ηλικία 2 ετών, HT2: ύψος (cm) σε ηλικία 2 ετών, WT9: βάρος (kg) σε ηλικία 9 ετών, HT9: ύψος (cm) σε ηλικία 9 ετών, LG9: περίμετρος ποδιού (cm) σε ηλικία 9 ετών, ST9: δύναμη(kg) σε ηλικία 9 ετών, WT18: βάρος (kg) σε ηλικία 18 ετών, HT18: ύψος (cm) σε ηλικία 18 ετών, LG18:

ΜΕΜ264: Εφαρμοσμένη Στατιστική 8 περίμετρος ποδιού (cm) σε ηλικία 18 ετών, ST18: δύναμη (kg) σε ηλικία 18 ετών Soma: σωματότυπος, από 1 (πολύ λεπτή), μέχρι 7, (πολύ παχιά). a) Να κατασκευάσετε όλα τα (ανά δύο) γραφήματα διασποράς των μεταβλητών του αρχείου. Φαίνεται να υπάρχει γραμμική ή άλλη σχέση μεταξύ των μεταβλητών; b) Να εφαρμόσετε το μοντέλο Υ = β0 + β1 WT9 + β2 LG9 +ε. i. Να εκτιμήσετε τα βi σημειακά και με δ.ε. συντελεστού 95%. ii. Κατά πόσο φαίνεται να εξηγούν αυτές οι μεταβλητές τη μεταβλητότητα της Y; iii. Nα κάνετε τον έλεγχο Η0: β1 = β2 = 0 του μοντέλου μέσω του F-τεστ. Ποια iv. είναι η εκτίμηση της διασποράς των σφαλμάτων; Να γίνει έλεγχος ορθότητας του μοντέλου: υπόλοιπων και των μεταβλητών Υ, HT9, WT9. c) Να εφαρμόσετε το μοντέλο Υ = β0 + β1 HT2 + β2 WT2+ β3 HT9 + β4 WT9 + β5 ST9 +ε. v. Να εκτιμήσετε τα βi σημειακά και με δ.ε. συντελεστού 95%. vi. vii. viii. Κατά πόσο φαίνεται να εξηγούν αυτές οι μεταβλητές τη μεταβλητότητα της Y; Nα κάνετε τον έλεγχο Η0: β1 = β2 = β3 = β4 = β5 = 0 του μοντέλου μέσω του F-τεστ. Ποια είναι η εκτίμηση της διασποράς των σφαλμάτων; Να γίνει έλεγχος ορθότητας του μοντέλου: υπόλοιπων και των μεταβλητών Υ, HT2, WT2, HT9, WT9, ST9.