Π.Μ.Σ. ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΚΑΙ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΤΕΛΙΚΟ ΔΙΑΓΩΝΙΣΜΑ 27/6/2016

Σχετικά έγγραφα
ΟΙΚΟΝΟΜΕΤΡΙΑ 2 ΦΡΟΝΤΙΣΤΗΡΙΟ 2 BASICS OF IV ESTIMATION USING STATA

ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ ΔΕΙΓΜΑ ΟΙΚΟΝΟΜΕΤΡΙΑ Ι (3ο Εξάμηνο) Όνομα εξεταζόμενου: Α.Α. Οικονομικό Πανεπιστήμιο Αθήνας -- Τμήμα ΔΕΟΣ Καθηγητής: Γιάννης Μπίλιας

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Μάθηµα εύτερο-τρίτο- Βασικά Ζητήµατα στο Απλό Γραµµικό Υπόδειγµα Ακαδηµαϊκό Έτος

!"!"!!#" $ "# % #" & #" '##' #!( #")*(+&#!', & - #% '##' #( &2(!%#(345#" 6##7

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

SOURCE DF SUM OF SQUARES MEAN SQUARE F VALUE PR F MODEL (a) E04 (e) (g) (h) ERROR (b) (d) (f) TOTAL (c) E04 R SQUARE (i) PARAMETER

Απλή Ευθύγραµµη Συµµεταβολή

ΕΚΤΙΜΗΣΗ ΤΗΣ ΠΟΙΟΤΗΤΑΣ ΖΩΗΣ ΑΣΘΕΝΩΝ ΜΕΤΑ ΑΠO ΕΜΦΥΤΕΥΣΗ ΑΠΙΝΙΔΩΤΗ

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Κεφάλαιο 15. Παραγοντική ανάλυση διακύµανσης. Παραγοντική

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

Λογιστική Παλινδρόµηση

ΠΑΛΙΝ ΡΟΜΗΣΗ..Π.Μ.Σ. Μαθηµατικά των Υπολογιστών και των Αποφάσεων. Πάτρα, 27 Ιανουαρίου 2011

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

MATHACHij = γ00 + u0j + rij

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Political Science 552. Qualitative Variables. Dichotomous Predictor. Dummy Variables-Gender. Qualitative Variables March 3, 2004

Άσκηση 1. Πληθυσμός (Χ i1 )

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Εισαγωγή στην Ανάλυση Δεδομένων

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Νίκος Πανταζής Βιοστατιστικός, PhD ΕΔΙΠ Ιατρικής Σχολής ΕΚΠΑ Εργαστήριο Υγιεινής, Επιδημιολογίας & Ιατρικής Στατιστικής

Στατιστική Ι. Ανάλυση Παλινδρόμησης

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ

Start Random numbers Distributions p-value Confidence interval.

ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΙΕΘΝΩΝ ΚΑΙ ΕΥΡΩΠΑΪΚΩΝ ΟΙΚΟΝΟΜΙΚΩΝ ΣΠΟΥ ΩΝ

ΠΑΛΙΝΔΡΟΜΗΣΗ. Απλή Παλινδρόμηση. (Όγκος πωλήσεων = α +b έξοδα διαφήμησης +e ) Εκτίμηση Απλής Παλινδρόμησης. α= εκτίμηση της τεταγμένης για χ=0

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Λυμένες Ασκήσεις για το μάθημα:

Η βιτρίνα των καταστημάτων ως εργαλείο δημοσίων σχέσεων. Ονοματεπώνυμο: Ειρήνη Πορτάλιου Σειρά: 8 η Επιβλέπουσα: Αν. Καθηγήτρια : Βεντούρα Ζωή

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

LAMPIRAN. Fixed-effects (within) regression Number of obs = 364 Group variable (i): kode Number of groups = 26

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Στατιστική Επιχειρήσεων Ι

Δοκιμές προτίμησης και αποδοχής

Άσκηση 2. i β. 1 ου έτους (Υ i )

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

1991 US Social Survey.sav

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

Εισόδημα Κατανάλωση

Lecture 8: Serial Correlation. Prof. Sharyn O Halloran Sustainable Development U9611 Econometrics II

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Mann Whitney U τεστ)

7. Ανάλυση Διασποράς-ANOVA

ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ Βασικά Εργαλεία και Μέθοδοι για τον Έλεγχο της Ποιότητας [ΔΙΠ 50], ΕΡΓΑΣΙΑ 4. Ενδεικτική Λύση

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Διάστημα εμπιστοσύνης της μέσης τιμής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Εισαγωγή στην Ανάλυση Συνδιακύμανσης (Analysis of Covariance, ANCOVA)

Μάθημα 5-6: Στάσιμες πολυμεταβλητές χρονοσειρές και μοντέλα Διασυσχέτιση Διανυσματικά αυτοπαλίνδρομα μοντέλα Δίκτυα από πολυμεταβλητές χρονοσειρές

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

Αναλυτική Στατιστική

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Απλή Γραμμική Παλινδρόμηση II

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Οικονομετρία. Πολλαπλή Παλινδρόμηση. Συντελεστής Προσδιορισμού και έλεγχος υπόθεσης συγκεκριμένου συντελεστή. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Διάλεξη 8 Εφαρμογές της στατιστικής στην έρευνα - Ι. Υπεύθυνος Καθηγητής Χατζηγεωργιάδης Αντώνης

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα

ΜΑΘΗΜΑ 4 ο. Μοναδιαία ρίζα

Εισαγωγή στη Βιοστατιστική

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

Transcript:

Π.Μ.Σ. ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΚΑΙ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΤΕΛΙΚΟ ΔΙΑΓΩΝΙΣΜΑ 27/6/2016 Πρόβλημα 1. Σε μια μελέτη συγκεντρώθηκαν δεδομένα σχετικά με το μέγεθος του πληθυσμού (σε ζεύγη πτηνών) ενός είδους πτηνών (μεταβλητή pop) και την έκταση της αποικίας (σε km 2, μεταβλητή area), για 22 αποικίες αυτού του πτηνού. Για την ανάλυση εκτελέστηκε το μοντέλο pop = β 0+ β 1 area + ε 1. Να ερμηνεύσετε τις εκτιμήσεις ελαχίστων τετραγώνων. 2. Υπολογίστηκαν οι προβλεπόμενες τιμές (yhat), τα τυπικά σφάλματα εκτίμησης και πρόβλεψης (stdp, stdf), τα κατάλοιπα jackknife και η απόσταση Cook για όλες τις παρατηρήσεις (στατιστικά στοιχεία παρουσιάζονται στο παράρτημα). Με βάση αυτά απαντήστε (σε επίπεδο σημαντικότητας 5%) ποιες παρατηρήσεις είναι outliers και ποιες influential (αν υπάρχουν). 3. Να υπολογίσετε και να ερμηνεύσετε (με όρους της εφαρμογής) ένα διάστημα εμπιστοσύνης για τη μέση τιμή της εξαρτημένης μεταβλητής όταν η ανεξάρτητη μεταβλητή πάρει την τιμή 1570. 4. Σε κάποιες παρατηρήσεις προκύπτουν αρνητικές προβλεπόμενες τιμές. Πού νομίζετε ότι οφείλεται αυτό; Πώς θα ελέγχατε αν η υπόθεσή σας ευσταθεί; Πρόβλημα 2. Σε μια μελέτη συγκεντρώθηκαν δεδομένα σχετικά με τη θνησιμότητα σε μια πολιτεία των Η.Π.Α. και ένα σύνολο από δημογραφικούς/οικονομικούς/κλιματικούς παράγοντες που ενδεχομένως να σχετίζονται με αυτήν. pop_hse Αριθμός ατόμων ανά οικογένεια educ Μέση διάρκεια μόρφωσης ατόμων άνω των 25 gdhse Ποσοστό οικογενειών που ζουν σε αξιοπρεπή καταλύματα nonw Ποσοστό πληθυσμού που ανήκει σε μειονότητες wcol Ποσοστό εργαζομένων σε δουλειές γραφείου poor Ποσοστό οικογενειών με ετήσιο εισόδημα κάτω των $3000 mort Θνησιμότητα ανά 100.000 κατοίκους popden Πυκνότητα πληθυσμού (κάτοικοι ανά τετραγωνικό μίλι) hc Σχετικό επίπεδο μόλυνσης από υδρογονάνθρακες nox Σχετικό επίπεδο μόλυνσης από οξείδια του αζώτου so2 Σχετικό επίπεδο μόλυνσης από διοξείδιο του θείου smsa Πόλη rain Ετήσιος ρυθμός βροχόπτωσης (σε ίντσες) jan Μέση θερμοκρασία Ιανουαρίου (Φαρενάιτ) july Μέση θερμοκρασία Ιουλίου (Φαρενάιτ) humid Μέση σχετική υγρασία (%) 1. Έστω το Μοντέλο 1 με εξαρτημένη μεταβλητή τη mort και ανεξάρτητες όλες τις υπόλοιπες με τη σειρά που δίνονται παραπάνω. Για το μοντέλο αυτό δίνονται οι πίνακες partial F-tests τύπου Ι και ΙΙΙ. a. Ποιο είναι το p-value του partial F-tests type I και του partial F-test ΙΙΙ για τη μεταβλητή educ? Πού οφείλεται η διαφορά στις δύο τιμές; b. Ποιες είναι οι τιμές των R 2 και adjusted- R 2 ; Πού οφείλεται η διαφορά μεταξύ τους; 2. Έστω το Μοντέλο 2: μοντέλο απλής παλινδρόμησης με εξαρτημένη μεταβλητή τη mort και ανεξάρτητη τη so2. Να συγκρίνετε το επίπεδο σημαντικότητας του μοντέλου αυτού με το partial F-tests type I της μεταβλητής so2 από το ερώτημα 1.a και με το partial F-tests type III της μεταβλητής so2 από το ερώτημα 1.b. Να εξηγήσετε με λόγια τι παρατηρείτε. Πού οφείλονται τυχόν διαφορές; 3. Έστω το Μοντέλο 3 που περιέχει τις nonw, rain, poor μόνο. Υπολογίστε την τιμή του στατιστικού Cp- Mallows για το Μοντέλο 2 ως προς το πλήρες μοντέλο. Τι συμπεραίνετε;

Πρόβλημα 3. Σε μια μελέτη συγκεντρώθηκαν δεδομένα σχετικά με τη δοσολογία (dosage) ενός αντιαλλεργικού φαρμάκου σε καπνιστές και μη καπνιστές (μεταβλητή smoking, 0=μη καπνιστές, 1=καπνιστές) όπως επίσης και τη συγκέντρωση του αντίστοιχου αλλεργιογόνου στο αίμα (allergenic), μετρημένα σε κατάλληλες μονάδες. Στα παρακάτω ερωτήματα η συγκέντρωση του αλλεργιογόνου είναι η εξαρτημένη μεταβλητή. H μεταβλητή dosagec είναι η δοσολογία κεντρικοποιημένη ως προς τη μέση τιμή της. Η μεταβλητή smdosc=smoking*dosagec. 1. Έστω το Μοντέλο 1: allergenic = β 0 + β 1 dosagec. Να ερμηνεύσετε τις εκτιμήσεις ελαχίστων τετραγώνων και να εκτιμήσετε τη στατιστική σημαντικότητα της μεταβλητής dosage. 2. Έστω το Μοντέλο 2: allergenic = β 0 + β 1 dosagec + β 2 smoking + β 3 smdosc. Να γράψετε και να ερμηνεύσετε την εξίσωση παλινδρόμησης για καπνιστές και μη καπνιστές. 3. Ποια η στατιστική σημαντικότητα της κεντρικοποιημένης δοσολογίας στο Μοντέλο 2; Να εξηγήσετε τυχόν διαφορά στην απάντηση με αυτή του ερωτήματος 1. Πρόβλημα 4. Σε μια στατιστική ανάλυση εξετάστηκε η συσχέτιση μιας μεταβλητής Y με πιθανούς παράγοντες το φύλο (sex, 1=male) και την ηλικία (agec, κεντραρισμένη ως προς τη μέση τιμή =38.5). Το μοντέλο κύριων επιδράσεων (μοντέλο 1) και το μοντέλο αλληλεπιδράσεων (μοντέλο 2) έδωσαν τα αποτελέσματα που φαίνονται στους αντίστοιχους πίνακες. 1. Για κάθε μοντέλο να ερμηνεύσετε τις εξισώσεις παλινδρόμησης για κάθε φύλο. 2. Στο μοντέλο 1 οι κύριες επιδράσεις είναι μη στατιστικά σημαντικές και φαίνεται ότι κανένας από τους δύο παράγοντες δεν συσχετίζεται με την Y. Όμως στο μοντέλο 2 και οι δυο κύριες επιδράσεις είναι στατιστικά σημαντικές. Πώς εξηγείτε αυτή τη διαφορά;

Παράρτημα: Αποτελέσματα Αναλύσεων Πρόβλημα 1. sum area pop Variable Obs Mean Std. Dev. Min Max ------ area 22 965.3418 965.0855 60.12 3957 pop 22 2452.818 4060.955 134 17000. reg pop area Source SS df MS Number of obs = 22 -------------+------------------------------ F( 1, 20) = 32.06 Model 213266632 1 213266632 Prob > F = 0.0000 Residual 133051869 20 6652593.44 R-squared = 0.6158 -------------+------------------------------ Adj R-squared = 0.5966 Total 346318501 21 16491357.2 Root MSE = 2579.3 pop Coef. Std. Err. t P>t [95% Conf. Interval] area 3.302068.5832034 5.66 0.000 2.085527 4.518609 _cons -734.8063 786.9873-0.93 0.362-2376.433 906.8206. li area pop yhat stdp stdf jack cooksd +------------------------------------------------------------------------+ area pop yhat stdp stdf jacknife cooksd 1. 207.7 311-48.96672 705.4291 2673.99.1414947.000851 2. 1570 3872 4449.441 653.257 2660.703 -.2258667.0018355 3. 1588 495 4508.878 658.983 2662.114-1.681574.0904687 4. 125.7 134-319.7363 736.3281 2682.307.179059.0014948 5. 353.4 485 432.1446 655.5598 2661.269.020652.0000155 6. 931 372 2339.419 550.2651 2637.306 -.7728586.0145341 7. 1616 284 4601.336 668.1206 2664.391-1.832305.1080087 8. 1317 10767 3614.017 586.9001 2645.193 3.600312.2214471 9. 614 1975 1292.664 586.8357 2645.178.2652833.0020146 10. 60.12 970-536.2859 762.2985 2689.552.6014744.0178831 11. 1273 3243 3468.727 578.433 2643.327 -.0875471.0002135 12. 595.7 500 1232.236 590.6469 2646.027 -.2848652.0023536 13. 105.6 250-386.1079 744.1754 2684.472.2514734.0030123 14. 241.9 925 63.964 693.1102 2670.767.3388219.0046745 15. 111.1 970-367.9465 742.0179 2683.875.5318303.0132352 16. 302.4 278 263.7391 672.2152 2665.421.005582 1.20e-06 17. 808.9 1036 1936.237 557.418 2638.808 -.3495437.0031305 18. 2927 5570 8930.347 1269.343 2874.687-1.547974.3579319 19. 1069 2430 2795.104 553.2136 2637.923 -.1413313.0005064 20. 898.2 731 2231.111 551.293 2637.521 -.5855001.0084843 21. 564.8 1364 1130.202 597.4599 2647.556.0908401.0002461 22. 3957 17000 12331.48 1829.351 3162.138 3.05651 3.336568 +------------------------------------------------------------------------+

Πρόβλημα 2 ΜΟΝΤΕΛΟ 1. anova mort pop_hse educ gdhse nonw wcol poor popden hc nox so2 rain jan july hum > id, continuous(pop_hse educ gdhse nonw wcol poor popden hc nox so2 rain jan july > humid). anova, sequential. anova, partial Number of obs = 60 R-squared = 0.7583 Root MSE = 35.0178 Adj R-squared = 0.6831 Source Seq. SS df MS F Prob > F Model 173115.967 14 12365.4262 10.08 0.0000 pop_hse 29110.7805 1 29110.7805 23.74 0.0000 educ 36980.8937 1 36980.8937 30.16 0.0000 gdhse 5157.26091 1 5157.26091 4.21 0.0461 nonw 57494.4153 1 57494.4153 46.89 0.0000 wcol 106.266966 1 106.266966 0.09 0.7698 poor 16928.1928 1 16928.1928 13.80 0.0006 popden 2386.95033 1 2386.95033 1.95 0.1698 hc 1511.95497 1 1511.95497 1.23 0.2727 nox 12712.3825 1 12712.3825 10.37 0.0024 so2 223.989476 1 223.989476 0.18 0.6711 rain 3024.10374 1 3024.10374 2.47 0.1233 jan 3754.75361 1 3754.75361 3.06 0.0870 july 3723.88686 1 3723.88686 3.04 0.0882 humid.134820314 1.134820314 0.00 0.9917 Residual 55180.9546 45 1226.24343 Total 228296.921 59 3869.43934 Number of obs = 60 R-squared = 0.7583 Root MSE = 35.0178 Adj R-squared = 0.6831 Source Partial SS df MS F Prob > F Model 173115.967 14 12365.4262 10.08 0.0000 pop_hse 1475.80519 1 1475.80519 1.20 0.2785 educ 1855.34737 1 1855.34737 1.51 0.2251 gdhse 285.479915 1 285.479915 0.23 0.6318 nonw 29932.0185 1 29932.0185 24.41 0.0000 wcol 97.0273422 1 97.0273422 0.08 0.7798 poor 245.770702 1 245.770702 0.20 0.6565 popden 976.570446 1 976.570446 0.80 0.3769 hc 1681.82758 1 1681.82758 1.37 0.2477 nox 1471.20165 1 1471.20165 1.20 0.2792 so2 688.770531 1 688.770531 0.56 0.4575 rain 3962.69051 1 3962.69051 3.23 0.0789 jan 2524.64343 1 2524.64343 2.06 0.1582 july 2260.6519 1 2260.6519 1.84 0.1813 humid.134820314 1.134820314 0.00 0.9917 Residual 55180.9546 45 1226.24343 Total 228296.921 59 3869.43934

. reg Source SS df MS Number of obs = 60 -------------+------------------------------ F( 14, 45) = 10.08 Model 173115.967 14 12365.4262 Prob > F = 0.0000 Residual 55180.9546 45 1226.24343 R-squared = 0.7583 -------------+------------------------------ Adj R-squared = 0.6831 Total 228296.921 59 3869.43934 Root MSE = 35.018 mort Coef. Std. Err. t P>t [95% Conf. Interval] _cons 1487.288 355.4614 4.18 0.000 771.3523 2203.224 pop_hse -59.32543 54.07727-1.10 0.278-168.2426 49.59178 educ -13.7298 11.16195-1.23 0.225-36.21112 8.751516 gdhse -.8495865 1.760792-0.48 0.632-4.396004 2.696831 nonw 5.287571 1.070229 4.94 0.000 3.13202 7.443122 wcol -.4553317 1.618711-0.28 0.780-3.715582 2.804919 poor -1.356943 3.030992-0.45 0.657-7.461674 4.747789 popden.0035727.0040034 0.89 0.377 -.0044906.011636 hc -.5658888.483202-1.17 0.248-1.539107.4073299 nox 1.070114.976972 1.10 0.279 -.897609 3.037836 so2.1093758.1459393 0.75 0.457 -.184561.4033126 rain 1.313561.7307072 1.80 0.079 -.1581592 2.78528 jan -1.3317.9280998-1.43 0.158-3.200989.5375891 july -2.456251 1.809023-1.36 0.181-6.099811 1.18731 humid.0122287 1.166249 0.01 0.992-2.336717 2.361175 ΜΟΝΤΕΛΟ 2. reg mort so2 Source SS df MS Number of obs = 60 -------------+------------------------------ F( 1, 58) = 12.85 Model 41397.2304 1 41397.2304 Prob > F = 0.0007 Residual 186899.691 58 3222.40846 R-squared = 0.1813 -------------+------------------------------ Adj R-squared = 0.1672 Total 228296.921 59 3869.43934 Root MSE = 56.766 mort Coef. Std. Err. t P>t [95% Conf. Interval] so2.4178647.1165844 3.58 0.001.1844957.6512337 _cons 917.8978 9.643602 95.18 0.000 898.594 937.2016 ΜΟΝΤΕΛΟ 3. reg mort nonw rain poor Source SS df MS Number of obs = 60 -------------+------------------------------ F( 3, 56) = 19.53 Model 116716.319 3 38905.4398 Prob > F = 0.0000 Residual 111580.602 56 1992.51075 R-squared = 0.5112 -------------+------------------------------ Adj R-squared = 0.4851 Total 228296.921 59 3869.43934 Root MSE = 44.638 mort Coef. Std. Err. t P>t [95% Conf. Interval] nonw 4.630447.9223484 5.02 0.000 2.782762 6.478133 rain 2.218578.6768323 3.28 0.002.8627196 3.574436 poor -3.578352 2.089147-1.71 0.092-7.763417.6067128 _cons 853.9706 26.85779 31.80 0.000 800.1679 907.7732

Πρόβλημα 3 ΜΟΝΤΕΛΟ 1. reg allergenic dosagec Source SS df MS Number of obs = 50 -------------+------------------------------ F( 1, 48) = 0.53 Model 7567.5826 1 7567.5826 Prob > F = 0.4690 Residual 681776.897 48 14203.6854 R-squared = 0.0110 -------------+------------------------------ Adj R-squared = -0.0096 Total 689344.48 49 14068.2547 Root MSE = 119.18 allergenic Coef. Std. Err. t P>t [95% Conf. Interval] dosagec -.1402113.19209-0.73 0.469 -.5264341.2460116 _cons 281.52 16.85449 16.70 0.000 247.6318 315.4082 ΜΟΝΤΕΛΟ 2. reg allergenic dosagec smoking smdosc Source SS df MS Number of obs = 50 -------------+------------------------------ F( 3, 46) = 87.45 Model 586504.308 3 195501.436 Prob > F = 0.0000 Residual 102840.172 46 2235.65592 R-squared = 0.8508 -------------+------------------------------ Adj R-squared = 0.8411 Total 689344.48 49 14068.2547 Root MSE = 47.283 allergenic Coef. Std. Err. t P>t [95% Conf. Interval] dosagec -.9106229.090288-10.09 0.000-1.092363 -.7288827 smoking -17.74979 13.71236-1.29 0.202-45.35135 9.851758 smdosc 2.729622.1696796 16.09 0.000 2.388075 3.07117 _cons 279.4156 8.647505 32.31 0.000 262.0091 296.8222 Πρόβλημα 4 ΜΟΝΤΕΛΟ 1.reg y agec sex Source SS df MS Number of obs = 48 -------------+------------------------------ F( 2, 45) = 1.61 Model 621.145253 2 310.572626 Prob > F = 0.2119 Residual 8699.32966 45 193.318437 R-squared = 0.0666 -------------+------------------------------ Adj R-squared = 0.0252 Total 9320.47491 47 198.307977 Root MSE = 13.904 y Coef. Std. Err. t P>t [95% Conf. Interval] agec -.2708372.1759272-1.54 0.131 -.6251726.0834983 sex 4.190217 4.11291 1.02 0.314-4.093609 12.47404 _cons 57.45027 3.194067 17.99 0.000 51.01709 63.88345 ΜΟΝΤΕΛΟ 2

.gen sagc=sex*agec.reg y agec sex sagc Source SS df MS Number of obs = 48 -------------+------------------------------ F( 3, 44) = 99.66 Model 8124.75017 3 2708.25006 Prob > F = 0.0000 Residual 1195.72474 44 27.1755623 R-squared = 0.8717 -------------+------------------------------ Adj R-squared = 0.8630 Total 9320.47491 47 198.307977 Root MSE = 5.213 y Coef. Std. Err. t P>t [95% Conf. Interval] agec 1.17944.1093996 10.78 0.000.9589592 1.39992 sex 3.33729 1.542916 2.16 0.036.2277468 6.446833 sagc -2.278622.1371282-16.62 0.000-2.554986-2.002259 _cons 58.81506 1.200371 49.00 0.000 56.39587 61.23425