ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ-ΠΕΜΠΤΟ ΘΕΩΡΙΑΣ- ΠΟΛΛΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Σηµειώσεις: Θωµόπουλος Γιώργος Ρογκάκος Γιώργος Καθηγητής: Κουνετάς Κωνσταντίνος Ακαδηµαϊκό Έτος 200-20
ΠΑΡΟΥΣΙΑΣΗ ΠΟΛΛΑΠΛΟΥ ΓΡΑΜΜΙΚΟΥ ΥΠΟ ΕΙΓΜΑΤΟΣ Ας θεωρήσουµε το πολλαπλό γραµµικό υπόδειγµα της µορφής Yi =β0+βxi+ β2χ2i+ βκ Xκi+ εi Υ: ονοµάζεται εξαρτηµένη ή ερµηνευόµενη µεταβλητή, Χκi: είναι οι ανεξάρτητες ή ερµηνευτικές µεταβλητές, ε καλείται ο στοχαστικός ή διαταρακτικός όρος, και i: είναι µία αντιπροσωπευτική από τις η παρατηρήσεις του δείγµατος. Τα στοιχεία του µοντέλου µας είναι: Εξαρτηµένη µεταβλητή Yi: Investments: Επενδύσεις Και οι ανεξάρτητες Χi: Fixtot: Βαθµός Παγιοποίησης(Πάγια/Συνολικό Κεφάλαιο) Profit: Κερδοφορία Τurnover: Κύκλος Εργασιών Assets: Κεφάλαιο Rdexpens: Επενδύσεις σε Έρευνα και Ανάπτυξη Άρα η συνάρτηση µας είναι: Ι= ) β 0 + ) β P+ˆ ) β 2 Α+ ) β 3 Τ+ ) β 4 FixTot+ ) β 5 RDEXPE Στη συνέχεια παράγουµε τα διάφορα στατιστικά µέτρα για κάθε µεταβλητή ξεχωριστά µέσω της διαδικασίας: analyze descriptive statistics frequencies Γράφηµα : ιαδικασία Analyze->Descriptive Statistics->Frequencies 2
Περνάµε τις µεταβλητές στο Variable(s). Ρυθµίζουµε όποια στατιστικά µέτρα χρειαζόµαστε στο Statistics(Mean, Variance, min, MAX)και εφόσον δεν θέλουµε να εµφανίζεται πίνακας συχνοτήτων ξεκλικάρουµε το Display Frequency Tables. Γράφηµα. O πίνακας που µας εµφανίζεται είναι ο εξής: Πίνακας : Πίνακας στατιστικών µέτρων που συµµετέχουν στο υπόδειγµα N Mean Variance Minimum Maximum Valid Missing inv fixtot profit turnover assets rdexpens 26 26 26 26 26 25 0 0 0 0 0 3E+008,7384 E+007 2E+008 2E+008 42843,9 6E+07 4,382 3E+05 3E+07 E+08 4E+02 50,00,000-5E+007 866,00-20332,00,00 7E+009 22,865 5E+008 5E+009 E+00 2E+007 Το πλήθος των δεδοµένων µας αρχικά είναι n=26. Παρατηρούµε ότι τιµές των µεταβλητών µας είναι αρκετά υψηλές όπως και το ότι στην µεταβλητή rdexpe υπάρχουν πολλά µηδενικά. Αυτό φαίνεται και από την παρακάτω γραµµή valid percent σε 0 του rdexpe. ηλαδή το 79,2% των παρατηρήσεων µας είναι µηδενικά (αυτό µπορεί να επηρεάσει αρνητικά την εκτίµηση του µοντέλου µας). 3
Πίνακας 2 Επίσης πρέπει να προσέξουµε ώστε οι το περιεχόµενο των µεταβλητών, τα δεδοµένα µας δηλαδή να ανταποκρίνονται στην πραγµατικότητα. πχ. όπως βλέπουµε στα δεδοµένα(frequency table:assets) στην µεταβλητή assets υπάρχει µια αρνητική τιµή πράγµα που δεν είναι δυνατό. Οπότε διαγράφουµε όλη τη σειρά από τα δεδοµένα µας(άρα n=25). Εάν οι υπόλοιπες παρατηρήσεις µας ακολουθούν την παραπάνω λογική συνεχίζουµε. Βρίσκουµε τους συντελεστές συσχέτισης: analyze correlate bivariate Γράφηµα 2 4
Και έπειτα παίρνουµε τον παρακάτω πίνακα: inv fixtot profit turnover assets rdexpens Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Πίνακας 3: Πίνακας συσχετίσεων Correlations **. Correlation is significant at the 0.0 level (2-tailed). inv fixtot profit turnover assets rdexpens -,009,778**,420**,6 -,06,99,000,000,073,500 25 25 25 25 25 24 -,009 -,007 -,05,002 -,03,99,940,870,980,734 25 25 25 25 25 24,778** -,007,50**,343** -,022,000,940,000,000,8 25 25 25 25 25 24,420** -,05,50**,9**,058,000,870,000,000,59 25 25 25 25 25 24,6,002,343**,9**,098,073,980,000,000,280 25 25 25 25 25 24 -,06 -,03 -,022,058,098,500,734,8,59,280 24 24 24 24 24 24 Άρα τα p values των µεταβλητών ως προς το inv: Profit= 0,778 Assets= 0,6 Turnover= 0,420 Fixtot= -0,009 Rdexpens= -0,06 Επίσης PAT=0,9 δηλαδή το turnover µε τα assets πιθανόν να δηµιουργήσουν πρόβληµα πολυσυγγραµικότητας λόγω υψηλού συντελεστή συσχέτισης. Σηµείωση: Θέλουµε υψηλή συσχέτιση ανάµεσα σε x και y και όχι ανάµεσα σε και x και x. Ακόµα το γεγονός πως ο συντελεστής συσχέτισης του rdexpen είναι αρνητικός και σε συνδυασµό µε τον µεγάλο αριθµό µηδενικών παρατηρήσεων που έχει, συµπεραίνουµε πως η µεταβλητή αυτή λογικά δεν θα συµµετέχει στο τελικό µοντέλο µας. Έπειτα θα τρέξουµε το µοντέλο µας: Analyze regression linear 5
Γράφηµα 3 Γράφηµα 3. Και θα εµφανιστεί ο εξής πίνακας: Πίνακας 4: Εκτιµήσεις του πολλαπλού µας υποδείγµατος (Constant) fixtot profit turnover assets rdexpens a. Dependent Variable: inv Coefficients a Unstandardized Standardized Coefficients Coefficients 95% Confidence Interval for B B Std. Error Beta t Sig. Lower Bound Upper Bound 4E+007 5E+007,974,332-46302645,7 35969936,9 3900939 2E+007,00,2,834-327827,6 40584050,9 8,66,846,69 0,237,000 6,986 0,337,22,88,89 6,46,000,84,584 -,670,099 -,862-6,799,000 -,865 -,475-5,822 8,825 -,05 -,309,758-43,099 3,456 6
Παρακάτω ελέγχουµε το Sig. των συντελεστών δεχόµαστε ή απορρίπτουµε τη µηδενική υπόθεση και κρίνουµε αν οι συντελεστές είναι στατιστικά σηµαντικοί ή ασήµαντοι. Επίσης οι στήλες Lower, Upper Bounds µας δείχνουν τα κατώτερα και τα ανώτερα άκρα του διαστήµατος εµπιστοσύνης των συντελεστών που υπολογίσαµε. I=4,48*0^7+ 8,66P -0,670A+,22T+3900939FIXTOT-5,822RDEXPE Πίνακας 5: Summary b Adjusted Std. Error of R R Square R Square the Estimate,848 a,79,707 4328479 a. Predictors: (Constant), rdexpens, profit, fixtot, assets, turnover b. Dependent Variable: inv Με R 2 =0,707 Έλεγχος στατιστικής σηµαντικότητας εκτιµητών Ho: ) β 0 =0 H: ) β ο 0 Από τον πίνακα coefficients το sig του constant είναι 0,332>α=0,05 άρα αποδεχόµαστε την Ηo άρα ο βο είναι στατιστικά µη σηµαντικός. Ho: β ) =0 H: ) β 0 Από τον πίνακα coefficients το sig του profit είναι 0,000<α=0,05 άρα αποδεχόµαστε την Ηo άρα ο β είναι στατιστικά σηµαντικός. Ηo: ) β 2 =0 H: ) β 2 0 7
Από τον πίνακα coefficients το sig του assets είναι 0,000<α=0,05 άρα αποδεχόµαστε την Ηo άρα ο β2 είναι στατιστικά σηµαντικός. Hο: ) β 3 =0 H: ) β 3 0 Από τον πίνακα coefficients το sig του turnover είναι 0,000<α=0,05 άρα αποδεχόµαστε την Ηo άρα ο β3 είναι στατιστικά σηµαντικός. Ho: ) β 4 =0 H: ) β 4 0 Από τον πίνακα coefficients το sig του fixtot είναι 0,834>α=0,05 άρα αποδεχόµαστε την Ηo άρα ο β4 είναι στατιστικά µη σηµαντικός. Ho: ) β 5 =0 H: ) β 5 0 Από τον πίνακα coefficients το sig του rdexpens είναι 0,758 >α=0,05 άρα αποδεχόµαστε την Ηo άρα ο β5 είναι στατιστικά µη σηµαντικός. Έλεγχος στατιστικής σηµαντικότητας υποδείγµατος Ελέγχουµε αν το υπόδειγµα µας είναι στατιστικά σηµαντικό µέσω του πίνακα ANOVA: 8
Πίνακας 6: Πίνακας Ανάλυσης ιακύµανσης ANOVA Regression Residual Total Sum of Squares df Mean Square F Sig. 6E+09 5,28E+09 60,238,000 a 2E+09 8,873E+07 8E+09 23 a. Predictors: (Constant), rdexpens, profit, fixtot, assets, turnover b. Dependent Variable: inv Ho: ) β = ) β 2 = ) β 5 =0 Η: αλλιώς 0,000(sig)<a=0,05 άρα απόρριψη Hο και το µοντέλο µας είναι στατιστικά σηµαντικό. Εποµένως διώχνουµε την µεταβλητή rdexpen και ξανατρέχουµε το υπόδειγµα µε την ίδια διαδικασία. Πίνακας 7: Summary b Adjusted Std. Error of R R Square R Square the Estimate,847 a,77,708 43040927 a. Predictors: (Constant), assets, fixtot, profit, turnover b. Dependent Variable: inv Πίνακας 7: Coefficients 9
(Constant) fixtot profit turnover assets a. Dependent Variable: inv Unstandardized Coefficients B Std. Error Standardized Coefficients Beta a 95% Confidence Interval for B t Sig. Lower Bound Upper Bound 5E+007 4E+007,06,32-4303677,3 3390482,6 3839686 2E+007,00,209,835-3260688, 40285559,60 8,674,84,620 0,32,000 7,008 0,339,2,86,890 6,502,000,842,580 -,67,098 -,863-6,88,000 -,864 -,478 I=4,54*0^7+8,674P-0,67A+,2T+3839686FIXTOT Το R 2 =0,708 ανέβηκε σε σχέση µε το προηγούµενο και αυτό είναι θετικό συγκριτικά µε πριν. Με την ίδια διαδικασία που ακολουθήσαµε πριν κάνουµε πάλι τον έλεγχο ) β 0 p-value=0,32 (Σ.Μ.Σ.) ) β p-value=0,000 (Σ.Σ.) ) β 2 p-value=0,000 (Σ.Σ.) ) β 3 p-value=0,000 (Σ.Σ.) ) β 4 p-value=0,835 (Σ.Μ.Σ.) Ελέγχουµε αν το υπόδειγµα µας είναι στατιστικά σηµαντικό από τον πίνακα ANOVA: Regression Residual Total Πίνακας 8:ANOVA b Sum of Squares df Mean Square F Sig. 6E+09 4,408E+09 76,007,000 a 2E+09 20,853E+07 8E+09 24 a. Predictors: (Constant), assets, fixtot, profit, turnover b. Dependent Variable: inv 0
Ho: ) β = ) β 2 = ) β 4 =0 Η: αλλιώς 0,000(sig)<a=0,05 άρα απόρριψη Hο και το µοντέλο µας είναι στατιστικά σηµαντικό. Επειδή ο συντελεστής του FixTotal είναι αρκετά µεγάλος τον µετατρέπουµε σε πιο κατάλληλο µέσω της εντολής: Transform Compute Γράφηµα 4: Transform->Compute σε FX=FixTotal*000000. Γράφηµα 4. Στη συνέχεια ξανατρέξαµε το µοντέλο αντικαθιστώντας την FixTotal µε την FX και βγήκε ο παρακάτω πίνακας ANOVA: Regression Residual Total Πίνακας 9: ANOVA Sum of Squares df Mean Square F Sig. 6E+09 4,408E+09 76,007,000 a 2E+09 20,853E+07 8E+09 24 a. Predictors: (Constant), FX, assets, profit, turnover b. Dependent Variable: inv Έλεγχος ανάµεσα στα υποδείγµατα
. Στατιστική F 2. AIC, SBC Έστω το καινούριο µας µοντέλο : I= ) β 0 +ˆ ) β P+ ) β 2 Α+ ) β 3 Τ Πίνακας 0: Summary Adjusted Std. Error of R R Square R Square the Estimate,847 a,77,70 428706380 a. Predictors: (Constant), assets, profit, turnover b. Dependent Variable: inv Regression Residual Total Πίνακας : ANOVA Sum of Squares df Mean Square F Sig. 6E+09 3,877E+09 02,36,000 a 2E+09 2,838E+07 8E+09 24 a. Predictors: (Constant), assets, profit, turnover b. Dependent Variable: inv (Constant) profit turnover assets a. Dependent Variable: inv Πίνακας 2: Coefficients Unstandardized Standardized Coefficients Coefficients 95% Confidence Interval for B B Std. Error Beta t Sig. Lower Bound Upper Bound 5E+007 4E+007,45,255-35274746,9 3972569,5 8,676,838,620 0,357,000 7,08 0,335,209,85,889 6,524,000,842,576 -,670,097 -,862-6,906,000 -,862 -,478 Με R 2 =0,70. Στατιστική F H0: ) β 4 =0 2
Η: ) β 4 0 Το β4 είναι από το προηγούµενο µοντέλο µας (FixTotal) ( 2 2 R ) old R new F = 2 ( R old) / / df df = 2 2 ( R old R new) /# of 2 ( R old) / df regressors =[(0,708-0,70)/]/[(-0,708)/(25-4)]=-0,8298-0,8298 ~F,2,α=3,92 Σχόλια: Το # of regressors= ( ο αριθµός των εκτιµητών που έχουν φύγει). Df= Ν-κ=4 (Ο αριθµός των παραµέτρων στο µη περιορισµένο µοντέλο). Εφόσον το -0,8298 µικρότερο του 3,92 αποδεχόµαστε την Ηo, άρα Ηο: β4=0 (Σ.Μ.Σ.). Συνεπώς µπορούµε να τη διώξουµε(fx) γιατί το τελευταίο υπόδειγµα είναι καλύτερο. 2. AIC, SBC 3
2k Το κριτήριο του Akaike (AIC): AIC = n + ln ESS n Το κριτήριο του Schwarz (SIC): SIC = k n ln( n) + ln ESS n Κάνοντας τις πράξεις και βγάζοντας τα αποτελέσµατα επιλέγουµε το µοντέλο µε τους µικρότερους συντελεστές. Ελέγχουµε τα AIC και τα SBC για το υπόδειγµα µε τις 4 παραµέτρους: 2k AIC = n + ln ESS n k ESS 4 SBC = ln( n) + ln = n n 25 0.5+39.6=39.76 2* 4 2E+ 09 = + In = 0.064+ 39. 6=39.674 25 25 *ln(25)+ 39. 6 =0.032*4.83+39.6= Ελέγχουµε τα AIC και τα SBC για το υπόδειγµα µε τις 3 παραµέτρους: 2k AIC = n SBC = + ln ESS n 2*3 2E+ 09 = + In = 0.048+ 39, 6=39.66 25 25 k ESS 3 ln( n) + ln = *ln(25)+39.6 =0.024*4.83+39.6=39.72 n n 25 Από ότι βλέπουµε, συγκρίνοντας τα υποδείγµατα το 2 ο υπόδειγµα, δηλαδή αυτό µε τις 3 παραµέτρους έχει µικρότερες τιµές, άρα είναι πιο κατάλληλο. 4