ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΙΕΘΝΩΝ ΟΙΚΟΝΟΜΙΚΩΝ ΣΧΕΣΕΩΝ ΚΑΙ ΑΝΑΠΤΥΞΗΣ ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΚΑΘΗΓΗΤΗΣ: ΣΑΒΒΑΣ ΠΑΠΑ ΟΠΟΥΛΟΣ ΠΑΛΑΙΑ ΘΕΜΑΤΑ ****************************************************** (Ι) [00 µονάδες] Αναλύουµε 506 κοινότητες στην περιοχή της Βοστόνης για τις οποίες έχουµε τις ακόλουθες µεταβλητές:. LOG(PRICE) = log(διάµεσος από τις τιµές των κατοικιών των κοινοτήτων). LOG(NOX) = log(ποσότητα διοξειδίου του αζώτου στην ατµόσφαιρα, σωµατίδια ανά εκατοµµύριο) 3. DIST = απόσταση σε πέντε εµπορικά κέντρα 4. ROOMS = µέσος αριθµός δωµατίων σε κάθε σπίτι 5. STRATIO = µέση αναλόγια φοιτητών ανά δάσκαλο στα σχολεία 6. CRIME = κατά κεφαλήν εγκλήµατα 7. RADIAL = δείκτης πρόσβασης σε περιφερειακούς αυτοκινητόδροµους 8. PROPTAX = φόροι ιδιοκτησίας ανά $000 9. LOWSTAT = ποσοστό της χαµηλής τάξης (µε χαµηλό εισόδηµα) Οι έξοδοι (output) των αποτελεσµάτων δύο παλινδροµήσεων και ενός F-test (Wald test) για τον έλεγχο περιορισµών αποκλεισµού: Εξαρτηµένη µεταβλητή: log(price) Παρατηρήσεις: 506 Μοντέλο υπό Περιορισµούς (υπό δέσµευση - restricted) Μεταβλητή Εκτιμητές Τ.Σφάλματα t τιμή Pr(> t ) ********** β 0 Τεταγμένη.998755 0.5853 46.44 <e 6 *** β log(ox) 0.635366 0.09498 6.689 6.05e *** β log(dist) 0.84785 0.0360 8.735 <e 6 *** β 3 rooms 0.00043 0.0697 6.39.70e 09 *** β 4 stratio 0.037857 0.00488 7.84.75e 4 *** β 5 crime 0.0694 0.00348 9.44 <e 6 *** β 6 radial 0.059 0.00603 5.850 8.94e 09 *** β 7 proptax 0.007533 0.00348 5.587 3.8e 08 *** β 8 lowstat 0.08776 0.00875 5.347 <e 6 *** *************************************************** Άθροισµα τετραγώνων των καταλοίπων: 8.75 µε 497 βαθµούς ελευθερίας (β.ε.) R-τετράγωνο: 0.7783, Προσαρµοσµένο R-τετράγωνο: 0.7748 F-στατιστική: 8. µε 8 και 497 β.ε., π-τιµή: <.e-6 *************************************************** e-p = 0 -p, *** π-τιµή < 0.00, ** 0.00 < π-τιµή < 0.0, * 0.0 < π-τιµή < 0.05, 0.05 < π-τιµή < 0.
Εξαρτηµένη µεταβλητή: log(price) Παρατηρήσεις: 506 Μοντέλο χωρίς Περιορισµούς (χωρίς δέσµευση - urestricted) Μεταβλητή Εκτιμητές Τ.Σφάλματα t τιμή Pr(> t ) γ 0 Τεταγμένη.797 0.9947 50.86 <e 6 *** γ log(ox) 0.365884 0.879 3.4 0.007 ** γ log(dist).947737 0.3954 7.455 4.09e 3 *** γ 3 [log(dist)] 0.347868 0.08758.666 0.0968. γ 4 rooms.386446 0.4305 5.746.6e 08 *** γ 5 rooms.70978 0.09 5.789.7e 08 *** γ 6 stratio 0.0946 0.00453 6.444.77e 0 *** γ 7 crime 3.670875 0.380.797 <e 6 *** γ 8 crime.580078 0.735 5.80.8e 08 *** γ 9 radial 0.05994 0.0493 4.05 6.88e 05 *** γ 0 proptax 0.006975 0.0060 5.537 5.0e 08 *** γ lowstat 4.6387 0.8776 6.3 <e 6 *** γ lowstat 0.96887 0.7370 4.454.04e 05 *** γ 3 log(ox)*radial 0.037 0.008040.65 0.0087 ** *************************************************** Άθροισµα τετραγώνων των καταλοίπων: 5.0 µε 49 βαθµούς ελευθερίας (β.ε.) R-τετράγωνο: 0.84, Προσαρµοσµένο R-τετράγωνο: 0.877 F-στατιστική: 75.3 µε 3 και 49 β.ε., π-τιµή: <.e-6 *************************************************** e-p = 0 -p, *** π-τιµή < 0.00, ** 0.00 < π-τιµή < 0.0, * 0.0 < π-τιµή < 0.05, 0.05 < π-τιµή < 0. H 0 : γ 3 = γ 5 = γ 8 = γ = γ 3 =0 H : η H 0 δεν ισχύει F-test (Wald test) για τον έλεγχο περιορισµών αποκλεισµού: F-test = 4.445 µε 5 και 49 βαθµούς ελευθερίας π-τιµή < 0.0
() [5 µονάδες] Γράψτε την εξίσωση της παλινδρόµησης για το µοντέλο µε περιορισµούς (όπως διατυπώνεται στα παραδείγµατα των σηµειώσεων και του βιβλίου. () [5 µονάδες] Σχολιάστε κατά πόσο το µοντέλο χωρίς περιορισµούς είναι ικανοποιητικό. Αναφέρεται τα κριτήρια τα οποία χρησιµοποιείται. (3) [5 µονάδες] Στο µοντέλο µε περιορισµούς, αιτιολογήστε αν οι µεταβλητές έχουν τα κατάλληλα πρόσηµα; Αν όχι, προσπαθήστε να δώσετε κάποια λογική εξήγηση. (4) [5 µονάδες] Ποιές µεταβλητές είναι στατιστικά σηµαντικές σε επίπεδο σηµαντικότητας 0.05 και 0.; (5) [5 µονάδες] Αναφέρεται αν από το µοντέλο απουσιάζουν κάποιες σηµαντικές µεταβλητές και ποιες είναι αυτές. Γενικά τι πρόβληµα υπάρχει όταν δεν περιλαµβάνουµε στο µοντέλο µας κάποιες βασικές µεταβλητές. (6) [5 µονάδες] Πως προκύπτει η t-τιµή.666 που αντιστοιχεί στην µεταβλητή [log(dist)], στο µοντέλο χωρίς περιορισµούς. (7) [0 µονάδες] Βρείτε την πλησιέστερη τιµή, χρησιµοποιώντας τον κατάλληλο πίνακα, της t- τιµής.666 που αντιστοιχεί στην µεταβλητή [log(dist)], στο µοντέλο χωρίς περιορισµούς. (8) [5 µονάδες] Στο µοντέλο µε περιορισµούς, πόσο είναι η ελαστικότητα της τιµής των κατοικιών προς την ποσότητα διοξειδίου του αζώτου στην ατµόσφαιρα και ποια είναι η ερµηνεία της; (9) [0 µονάδες] Στο µοντέλο µε περιορισµούς, ελέγχουµε την υπόθεση: Η 0 : β =-0.5 και Η : β -0.5, εξηγήστε τι στην ουσία ελέγχουµε και εκτελέστε τον έλεγχο. Τι συµπεραίνεται από τον έλεγχο; (0) [0 µονάδες] Στο µοντέλο µε περιορισµούς, βρείτε την ακριβή ποσοστιαία μεταβολή της price όταν μεταβάλλεται η μεταβλητή rooms κατά δύο μονάδες και οι άλλες παραμένουν σταθερές, χρησιμοποιώντας τον τύπο: %Δprice = [exp(β 3 Δrooms) ]. Διαφέρει πολύ από την ποσοστιαία μεταβολή που προκύπτει άμεσα από το μοντέλο; () [0 µονάδες] Στο µοντέλο µε περιορισµούς, εξηγείστε πως μεταβάλλεται η μεταβλητή price όταν μεταβάλλεται η μεταβλητή crime από. σε.6 και οι άλλες μεταβλητές παραμένουν σταθερές, χρησιμοποιώντας έναν μόνο τύπο από τους ακόλουθους τύπους: i) Δprice [συντελεστής πρωτοβάθμιου όρου + *(συντελεστής δευτεροβάθμιου όρου) crime]δcrime ii) %Δprice [συντελεστής πρωτοβάθμιου όρου + *(συντελεστής δευτεροβάθμιου όρου) crime]%δcrime iii) %Δprice [συντελεστής πρωτοβάθμιου όρου + *(συντελεστής δευτεροβάθμιου όρου) crime]δcrime iv) Δprice [συντελεστής πρωτοβάθμιου όρου + *(συντελεστής δευτεροβάθμιου όρου) crime]%δcrime () [0 µονάδες] Στο µοντέλο χωρίς περιορισµούς, εξηγείστε πως μεταβάλλεται η μεταβλητή price όταν μεταβάλλεται η μεταβλητή dist από 3.5 κατά 6% και οι άλλες μεταβλητές παραμένουν σταθερές, χρησιμοποιώντας έναν μόνο τύπο από τους ακόλουθους τύπους: i) Δprice [συντελεστής πρωτοβάθμιου όρου + *(συντελεστής δευτεροβάθμιου όρου) log(dist)]δdist ii) %Δprice [συντελεστής πρωτοβάθμιου όρου + *(συντελεστής δευτεροβάθμιου όρου) log(dist)]%δdist iii) %Δprice [συντελεστής πρωτοβάθμιου όρου + *(συντελεστής δευτεροβάθμιου όρου) log(dist)]δdist iv) Δprice [συντελεστής πρωτοβάθμιου όρου + *(συντελεστής δευτεροβάθμιου όρου) log(dist)]%δdist 3
(3) [0 µονάδες] Βρείτε το ελάχιστο της συνάρτησης log(price)= γ 7 crime + γ 8 crime όπως φαίνεται στο παρακάτω σχήμα. Αν δεν έχετε τον τύπο βρείτε που μηδενίζεται η πρώτη παράγωγο. Τι πληροφορία μας δίνει αυτό το σημείο; Συμφωνείται με αυτή την σχέση μεταξύ log(price) και crime; Είναι η αναμενόμενη; Αν δεν είναι η αναμενόμενη σε κάποια διάστημα της crime, δώστε μία πιθανή λογική εξήγηση; (4) [0 µονάδες] Στο µοντέλο χωρίς περιορισµούς, εξηγείστε πως μεταβάλλεται η μεταβλητή price όταν μεταβάλλεται η μεταβλητή ox κατά 3%, η μεταβλητή radial παίρνει την τιμή 5, και οι άλλες παραμένουν σταθερές, χρησιμοποιώντας τον τύπο: %Δprice = [γ + γ 3 radial]%δox. Πως προκύπτει αυτός ο τύπος; (5) [0 µονάδες] Πως υπολογίζεται η τιµή της F στατιστικής 4.445 για τον έλεγχο περιορισµών αποκλεισµού που δίνεται στην έξοδο του υπολογιστή (output). Γράψτε τον κατάλληλο τύπο και αντικαταστήσετε τα σωστά νούµερα. (6) [5 µονάδες] Στην παραπάνω F στατιστική για τον έλεγχο περιορισµών αποκλεισµού γιατί οι βαθµοί ελευθερίας είναι 5 και 49. (7) [0 µονάδες] Σε συνέχεια της προηγούµενης ερώτησης, εξηγήστε πως προκύπτει ότι η π- τιµή είναι < 0.0. Από ποιον πίνακα και ποιο είναι το κοντινότερο σηµείου του πίνακα στο οποίο βασιζόµαστε; (8) [5 µονάδες] Τι συµπέρασµα βγάζετε από την παραπάνω F στατιστική σχετικά µε την γραµµικότητα του µοντέλου; ********************************************************************* () [0 µονάδες] Περιγράψτε την στατιστική του πολλαπλασιαστή του Lagrage (µε τα βιβλία του κ. Χρήστου Στατιστική Χ ). Τι ελέγχουµε µε αυτήν την στατιστική; ώστε τα πέντε βασικά βήµατα ενός ελέγχου υποθέσεων (Η 0, Η, τεστ, κατανοµή του τεστ, περιοχή απόρριψης, και συµπέρασµα). () [0 µονάδες] Γράψτε µόνο τις γενικές ιδιότητες της διακύµανσης, και της διακύµανσης, για γραµµικούς συνδυασµούς, για διακριτές µεταβλητές. 4
(3) [0 µονάδες] Θεωρήστε την γραµµική παλινδρόµηση, Y = b0 + bx+ bx, µε τις οικονοµικές µεταβλητές Υ, Χ, και Χ. Αν Var{ Χ }=, Var{ Χ }=3.7, και Cov{ Χ, Χ }=.75, γράψτε τις ακόλουθες ποσότητες σε σχέση µε τους συντελεστές (εξηγήστε αναλυτικά, ποιες ιδιότητες και πως τις χρησιµοποιείται): (α) [0 µονάδες] Var{Υ}= (β) [0 µονάδες] Cov{Υ, Χ }= (4) [80 µονάδες] Θεωρούµε το υπόδειγµα (µοντέλο) του ερωτήµατος () και εφαρµόζουµε την µεθοδολογία του ερωτήµατος () για τον έλεγχο σηµαντικότητας της µεταβλητής Χ στο υπόδειγµα. Παρόλο που αυτός έλεγχος µπορεί να πραγµατοποιηθεί µε απλούστερα τεστ, π.χ. t- τεστ, καλείστε να εφαρµόσετε την στατιστική του πολλαπλασιαστή του Lagrage. Οι τιµές των µεταβλητών δίνονται στον επόµενο πίνακα. Πινάκας. Υ - 0 0 Χ - - Χ - - 3 Τα αποτελέσµατα των δύο παλινδροµήσεων της στατιστικής του πολλαπλασιαστή του Lagrage καταγράφονται στους παρακάτω δύο πίνακες στην επόµενη σελίδα. (α) [5 µονάδες] Ποιες µεταβλητές παλινδροµούµε στην δεύτερη παλινδρόµηση; (β) [5 µονάδες] Ερµηνεύστε την κλίση στην πρώτη παλινδρόµηση; R ()= Προσαρµοσµένο ( ιορθωµένο) R ()= Πινάκας. Παλινδρόµηση ANOVA df (β.ε.) SS (Α.Τ.) MS (Μ.Τ.) F-τεστ π-τιµή Παλινδρόµηση ---- (5)= ---- Κατάλοιπα (4)= ---- Σύνολο 3 (3)= Τυπικό Σφάλµα t-τεστ π-τιµή Κάτω φράγµα.ε. 95% Άνω φράγµα.ε. 95% Συντελεστές Τεταγµένη της αρχής (6)= 0,35 0,00,00 -,5,5 x 0,50 0,35 (7)= (8)= -,0,0 Κατάλοιπα Παρατήρηση Προβλέψεις Κατάλοιπα (9)= (0)= -0,5 0,5 3 0,5-0,5 5
4 0,5 0,5 R 0,90 Προσαρµοσµένο ( ιορθωµένο) R 0,70 Πινάκας 3. Παλινδρόµηση ANOVA df (β.ε.) SS (Α.Τ.) MS (Μ.Τ.) F-τεστ π-τιµή Παλινδρόµηση 3,6,8 4,5 0,3 Κατάλοιπα 0,4 0,4 Σύνολο 3 4 Κάτω φράγµα Άνω φράγµα Συντελεστές Τυπικό Σφάλµα t-τεστ π-τιµή.ε. 95%.Ε. 95% Τεταγµένη της αρχής -0,3 0,33-0,90 0,53-4,5 3,9 x -, 0,77 -,73 0, -,86 7,66 x, 0,40 3,00 0,0-3,88 6,8 6
(γ) [50 µονάδες] Συµπληρώστε τα 0 ζητούµενα νούµερα στον Πίνακα, αριθµούµενα ως ()- (0). Για την π-τιµή, (8), δώστε ένα κάτω φράγµα. Γράψτε παρακάτω τους τύπους που χρισιµοποιήσατε: () () (3) (4) (5) (6) (7) (8) (9) (0) (δ) [0 µονάδες] Ολοκληρώστε την στατιστική του πολλαπλασιαστή του Lagrage (µε τα βιβλία του κ. Χρήστου Στατιστική Χ ). ώστε τα πέντε βασικά βήµατα ενός ελέγχου υποθέσεων (Η 0, Η, τεστ, κατανοµή του τεστ, περιοχή απόρριψης, και συµπέρασµα) 7
******************************************************************8 ) [05 µονάδες] Ο πίνακας που ακολουθεί δηµιουργήθηκε χρησιµοποιώντας πραγµατικά δεδοµένα: Ανεξάρτητες Μεταβλητές Εξαρτηµένη µεταβλητή: log(µισθός) Μοντέλο () log(πωλήσεις) 0,4 (0,07) Μοντέλο () 0,58 (0,040) log(αξία) 0, (0,050) κέρδη -0,003 (0,00) Μοντέλο (3) 0,88 (0,040) 0,00 (0,049) 0,00 (0,00) προϋπηρεσία 0,07 (0.0055) προϋπηρεσία -0,009 (0,0033) τεταγµένη της αρχής 4,94 (0,0) 4.6 (0,5) 4,57 (0,5) R-τετράγωνο 0,8 0,304 0,353 Αριθµός Παρατηρήσεων = = 77 Οι µεταβλητές ορίζονται ως εξής: µισθός = ο µισθός του γενικού διευθυντή της εταιρίας πωλήσεις = οι πωλήσεις της εταιρίας αξία = η αξία της επιχείρησης στην αγορά κέρδη = είναι τα κέρδη ως ποσοστό των πωλήσεων προϋπηρεσία_ = είναι τα έτη στη θέση του γενικού διευθυντή στην εταιρεία προϋπηρεσία_ = είναι το σύνολο των ετών της παραµονής του διευθυντή στην εταιρία Σηµειώστε ότι σε παρένθεση αναφέρονται τα τυπικά σφάλµατα των εκτιµητών: (α) [0 µονάδες] Σχολιάστε την επίδραση της µεταβλητής αξία στο µισθό του γενικού διευθυντή. Ερµηνεύστε τον συντελεστή της. Εξηγήστε την απάντηση σας στατιστικά, µε το κατάλληλο τεστ. (β) [0 µονάδες] Σχολιάστε την επίδραση της µεταβλητής κέρδη στο µισθό του γενικού διευθυντή. Ερµηνεύστε τον συντελεστή της. Εξηγήστε την απάντηση σας στατιστικά, µε το κατάλληλο τεστ. 8
(γ) [0 µονάδες] Σχολιάστε την επίδραση των µεταβλητών προϋπηρεσία_ και προϋπηρεσία_ στο µισθό του γενικού διευθυντή. Ερµηνεύστε τους συντελεστές αυτών. Εξετάστε ταυτοχρόνως την στατιστική σηµαντικότητα των προαναφερθέντων συντελεστών, µε το κατάλληλο τεστ. (δ) [0 µονάδες] Τι συµπεραίνετε για το γεγονός ότι η πιο πολυετής παραµονή στην ίδια εταιρία, όταν διατηρήσουµε σταθερούς τους άλλους παράγοντες, συνδέεται µε ένα χαµηλότερο µισθό; (ε) [5 µονάδες] Χρησιµοποιώντας την Στατιστική F συγκρίνεται τα µοντέλα () και (). Αναφέρεται όλα τα σχετικά: µηδενική και εναλλακτική υπόθεση, κριτήριο, και συµπέρασµα. (στ) [0 µονάδες] Από τα παραπάνω αποτελέσµατα, πιο από τα µοντέλα (), () και (3) θα θεωρούσατε ως το καλύτερο; Συµπεραίνετε το ίδιο από τις τιµές των R-τετραγώνων; Παρακαλώ αιτιολογήστε το. (ζ) [0 µονάδες] Από το µοντέλο (3) θα αποµακρύνεται κάποια από τις µεταβλητές. Γενικά η παραµονή µιας ασήµαντης µεταβλητής, δηµιουργεί προβλήµατα στις τιµές των άλλων µεταβλητών; (η) [0 µονάδες] Από το µοντέλο (3) πιστεύεται ότι απουσιάζει µια σηµαντική µεταβλητή; Αν ναι, αναφέρεται την µεταβλητή που θεωρείτε σηµαντική. Γενικά η απουσία µιας σηµαντικής µεταβλητής, δηµιουργεί προβλήµατα στις τιµές των άλλων µεταβλητών; (θ) [0 µονάδες] Περιληπτικά αναφέρεται ποια είναι τα βασικά συµπεράσµατα σας από την παραπάνω µελέτη. ) [0 µονάδες] Πότε ένας εκτιµητής καλείται αµερόληπτος και πότε συνεπής. Μπορεί ένας εκτιµητής να είναι και αµερόληπτος και συνεπής; 3) [0 µονάδες] Σε τι διαφέρουνε τα Ενοποιηµένα ή Σφαιρικά (Πάνελ) δεδοµένα από τις Χρονοσειρές; 4) [5 µονάδες] Στον παρακάτω τύπο σχολιάστε πως µεταβάλλεται η διακύµανση του εκτιµητή της κλίσης ως προς τη µεταβολή σχετικών ποσοτήτων, αιτιολογώντας τις µεταβολές αυτές. Var ( ˆ j ) β = σ SSTj( R j ) ( ), όπου j = ij j και j είναι το απο την παλινδρόµηση της j επί SST x x R R x όλων των άλλων x's 9
5) [0 µονάδες] Αποδείξτε και εξηγείστε αναλυτικά ότι: ( x xx ) = ( x x) i i i i= i= 6) [0 µονάδες] Αποδείξτε και εξηγείστε αναλυτικά ότι: Var ( ci c) + ( ci c)( zi µ z) = σ z ( ci c) i= i= i= όπου τα c i είναι σταθερές και z i είναι ανεξάρτητες τυχαίες µεταβλητές µε αναµενόµενη τιµή µ z και διακύµανση σ. z (7) [60 µονάδες] Εκτελώντας γραµµική παλινδρόµηση στις οικονοµικές µεταβλητές, Υ και Χ, οι τιµές των οποίων δίνονται στον επόµενο πίνακα, υπολογίστε τις ζητούµενες ποσότητες. Y = b0 + b X. Υ -3-0 4 Χ -3-3 (α) [5 µονάδες] Υπολογίστε τον συντελεστή του Χ, b. (β) [5 µονάδες] Προβλέψτε την τιµή του Υ για Χ=-.5. (γ) [0 µονάδες] Εκτιµήστε τα κατάλοιπα, δηλαδή u. (δ) [0 µονάδες] Εκτιµήστε την διακύµανση των καταλοίπων, ˆ σ = S. (ε) [0 µονάδες] Να ελεγχθεί η υπόθεση H0 : β = 0 έναντι της H ε : β 0, σε επίπεδο σηµαντικότητας α=0.05, και αναφέρετε τα συµπεράσµατα σας. (στ) [0 µονάδες] Υπολογίστε τον συντελεστή R και ερµηνεύστε το µέγεθος του. 8) [0 µονάδες] Αποδείξτε και εξηγείστε αναλυτικά ότι: α) [0 µονάδες] β) [0 µονάδες] ( x x)( y y) = ( x x) y i i i i i= i= ( x x) y = x ( y y) i i i i i= i= 0
9) [0 µονάδες] Αν =3 όπου τα α i είναι σταθερές µε τιµές α =-, α =0, και α 3 =, και αν x, x, και x 3 είναι ανεξάρτητες τυχαίες µεταβλητές µε αναµενόµενη τιµή µ x =0.3 και διακύµανση σ = 0.5, δείξτε και εξηγείστε αναλυτικά ότι: 3 3 Var ( ai a) + ( ai a)( x i µ x) = i= i= x 0) [40 µονάδες] Θεωρήστε το υπόδειγµα y = β + β x + β x + u i 0 i i i και τον εκτιµητή ( xi x) yi =, ο οποίος δεν είναι ο εκτιµητής ελαχίστων τετραγώνων. ( x x ) i= β i= i α) [5 µονάδες] είξτε ότι ( xi x) yi = β ( xi x) + β ( xi x) xi + ( xi x) ui i= i= i= i= β) [5 µονάδες] Χρησιµοποιώντας την σχέση στην α) δείξτε ότι E( β ) = β + β = i i= ( x x ) x i i ( x x ) i γ) [0 µονάδες] Εξηγήστε ποτέ ο εκτιµητής β είναι αµερόληπτος και συνεπής. ώστε τον τύπο της µεροληψίας του β. ) [30 µονάδες] Απαντήστε τις ακόλουθες ερωτήσεις. α) [0 µονάδες] Πως θα εξετάζατε γραφικά και αριθµητικά, µε απλό τρόπο, στην απλή παλινδρόµηση αν το µοντέλο είναι γραµµικό; β) [0 µονάδες] Αν υπάρχει µη γραµµική σχέση στην απλή παλινδρόµηση, αναφέρεται δύο τρόπους κατάλληλους για µη γραµµική παλινδρόµηση. Πως θα εξετάζατε ότι αυτοί οι δύο τρόποι θα βελτίωναν το υπόδειγµα σας. γ) [0 µονάδες] Η πολυσυγγραµικότητα είναι πλεονέκτηµα η µειονέκτηµα και γιατί; Μπορεί να υπάρχει πολυσυγγραµικότητα στην απλή παλινδρόµηση; Εξηγήστε γιατί; Πως θα εξετάζατε, µε απλό τρόπο, την ύπαρξη πολυσυγγραµικότητας; ) [35 µονάδες] Ελέγξτε αν υπάρχουν διαφορές στις συναρτήσεις παλινδρόµησης ανάµεσα στις χρονικές περιόδους 970-98 και 98-995, εκτελώντας το κατάλληλο στατιστικό τεστ. Πίνακας. Καταθέσεις και προσωπικά εισοδήµατα (δις. $) ΗΠΑ, 970-995
Α/Α Έτος Καταθέσεις Εισόδηµα Έτος Καταθέσεις Εισόδηµα 970 6 77. 98 05.5 347.3 97 68.6 790. 983 67 5.4 3 97 63.6 855.3 984 35.7 80 4 973 89.6 965 985 06. 300 5 974 97.6 054. 986 96.5 387.6 6 975 04.4 59. 987 68.4 3363. 7 976 96.4 73 988 89. 3640.8 8 977 9.5 40.4 989 87.8 3894.5 9 978.6 580. 990 08.7 466.8 0 979 30. 769.5 99 46.4 4343.7 980 6.8 973.3 99 7.6 463.7 98 99. 00. 993 4.4 4790. 3 994 89.4 50.7 4 995 49.3 530.8 Παλινδροµώντας τις καταθέσεις (y) στα εισοδήµατα (x) στις παρακάτω χρονικές περιόδους παίρνουµε: Α) για 970-98, R =0.90, SST=? (υπολογίστε το) Β) για 98-995, R =0.97, SST=434. Γ) για 970-995, R =0.767, SST=99863.8 Υπόδειξη: Μπορείτε να χρησιµοποιήσετε τον τύπο του R 3) [0 µονάδες] Υπολογίστε το προσαρµοσµένο R-τετράγωνο σε ένα µοντέλο παλινδρόµησης µε R =0.7, µε 30 παρατηρήσεις, και όταν το µοντέλο περιέχει α) µία µεταβλητή β) πέντε µεταβλητές γ) δέκα µεταβλητές Υπάρχει περίπτωση το R να είναι πολύ µικρότερο από το προσαρµοσµένο R-τετράγωνο. Εξηγήστε περιληπτικά. Αν ναι, δώστε ένα αριθµητικό παράδειγµα. 4) [0 µονάδες] Προβλέψτε την τιµή του y για x=.5 στο παρακάτω εκτιµώµενο µοντέλο loˆ g( y) = 0.5+.x στο οποίο τα κατάλοιπα ακολουθούν κανονική κατανοµή µε µέση τιµή 0 και τυπική απόκλιση 0.8. 5) [40 µονάδες] Θεωρούµε µετρήσεις ύψη (σε ίντσες) 8 φοιτητριών και 80 φοιτητών (ύψος). Ένα υπόδειγµα παλινδρόµησης του ύψους σε µία τεταγµένη της αρχής και σε µία
ψευδοµεταβλητή (φοιτήτρια), η οποία παίρνει την τιµή για φοιτήτριες και την τιµή 0 για φοιτητές, δίνει τα ακόλουθα αποτελέσµατα: ύψος = 7.0-4.83 φοιτήτρια, R = 0.45, (0.3) (0.56) Στις παρενθέσεις δίνονται τα τυπικά σφάλµατα (α) [5 µονάδες] Ερµηνεύστε την τεταγµένη της αρχής. (β) [0 µονάδες] Ερµηνεύστε την κλίση. (γ) [5 µονάδες] Ερµηνεύστε το R. (δ) [0 µονάδες] Ελέγξτε τη υπόθεση ότι οι φοιτήτριες, κατά µέσο όρο, είναι πιο κοντές από τους φοιτητές, µε επίπεδο σηµαντικότητας, %. (ε) [0 µονάδες] Θεωρείτε πιθανό ότι ο όρος των σφαλµάτων είναι οµοσκεδαστικό; Εξηγήστε γιατί. 3