ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση"

Transcript

1 ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 7. Παλινδρόµηση

2 Γενικά Επέκταση της έννοιας της συσχέτισης: Πώς µπορούµε να προβλέπουµε τη µια µεταβλητή από την άλλη; Απλή παλινδρόµηση (simple regression): Κατασκευή µοντέλου πρόβλεψης της µιας µεταβλητής από την άλλη Πολλαπλή παλινδρόµηση (multiple regression): Κατασκευή µοντέλου πρόβλεψης της µιας µεταβλητής από πολλές άλλες ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 2

3 Εισαγωγή στην παλινδρόµηση Κατασκευή µοντέλου πρόβλεψης εξαρτηµένης µεταβλητής (dependent variable) από ανεξάρτητες µεταβλητές (independent variables) Απλούστερο µοντέλο: Προσαρµογή ευθείας (γραµµικό µοντέλο) στα δεδοµένα Υπολογισµός της ευθείας µε µέθοδο ελαχίστων τετραγώνων (least squares) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 3

4 Το απλό γραµµικό µοντέλο Y = ( b + b X i i ) ε i Εξαρτηµένη µεταβλητή Σηµείο τοµής µε τον κατακόρυφο άξονα (intercept) Κλίση της ευθείας (slope) Ανεξάρτητη µεταβλητή Υπόλοιπο (residual) b 0, b 1 : Συντελεστές παλινδρόµησης (regression coefficients) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 4

5 Η µέθοδος των ελαχίστων τετραγώνων Επιλογή της ευθείας (εύρεση των συντελεστών b0, b1) ώστε να ελαχιστοποιείται η ποσότητα i ε 2 i = i ( Y b b X ) 2 Υπολογίζεται µε µαθηµατικό τρόπο (ακρότατα συνάρτησης) i 0 1 i ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 5

6 SS Αξιολόγηση της προσαρµογής (goodness of fit) Πόσο καλά προσαρµόζεται η ευθεία στα δεδοµένα; R SS = T i = ( Y Y i i 2 ) ( Y b b X ) 2 i 0 1 i Συνολικό άθροισµα τετραγώνων (Total Sum of Squares) Άθροισµα τετραγώνων υπολοίπων (Residual Sum of Squares) SS M = SS T SS R Άθροισµα τετραγώνων µοντέλου (Model Sum of Squares) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 6

7 Ερµηνεία των αθροισµάτων τετραγώνων SS T : Η απόκλιση των δεδοµένων από το «χειρότερο µοντέλο» (µέση τιµή) SS R : Η απόκλιση των δεδοµένων από το «καλύτερο µοντέλο» (ευθεία) SS M : Η διαφορά ανάµεσα στο «χειρότερο» και στο «καλύτερο µοντέλο» Μεγάλο SS M : σηµαντική η συνεισφορά του µοντέλου στην πρόβλεψη της Y Μικρό SS M : το µοντέλο ελάχιστα βελτιώνει την «χειρότερη πρόβλεψη» της µέσης τιµής ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 7

8 Μέτρο αξιολόγησης του µοντέλου: R 2 Η ποιότητα της προσαρµογής του µοντέλου µπορεί να µετρηθεί ως ποσοστό «βελτίωσης της πρόβλεψης» που οφείλεται στο µοντέλο R 2 SSM SST SS = = R = 1 SS SS T Ερµηνεία: το ποσοστό της µεταβλητότητας της εξαρτηµένης µεταβλητής που εξηγείται από το µοντέλο Συµπίπτει µε το τετράγωνο του συντελεστή Pearson T SS SS R T ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 8

9 Μέτρο αξιολόγησης του µοντέλου: F-test SS MS M M = = degrees_of_freedom SSM # variables Μέσα αθροίσµατα τετραγώνων (Mean Sum of Squares) MS R = SSR degrees_of_freedom = SSR n # regr. coefficients F = MS MS M R Ερµηνεία: Για ένα καλό µοντέλο το MS M θα είναι µεγάλο και το MS R µικρό άρα «συνολικά» το F θα είναι µεγάλο (sig. < 0.05) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 9

10 Σηµαντικότητα των συντελεστών Ερµηνεία του b 1 : η αλλαγή που επέρχεται στην εξαρτηµένη µεταβλητή αν η ανεξάρτητη αλλάξει κατά µια µονάδα Σε κακό µοντέλο: b 1 0 Για να ελέγξουµε αν η τιµή του b 1 είναι σηµαντικά διαφορετική του 0 χρησιµοποιούµε t-test (Sig.<0.05) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 10

11 Απλή παλινδρόµηση µε το SPSS file: Record1.sav Ανεξάρτητη µεταβλητή: adverts (ποσό διαφήµισης δίσκου) Εξαρτηµένη µεταβλητή: sales (αριθµός πωλήσεων δίσκου) N Mean Median Std. Deviation Minimum Maximum Valid Missing Statistics Advertsing Budget (thousands Record Sales of pounds) (thousands) , , , , , , ,10 10, ,86 360,00 ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 11

12 Εξαρτηµένη µεταβλητή Ανεξάρτητη µεταβλητή ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 12

13 Αποτελέσµατα παλινδρόµησης Συνολική προσαρµογή του µοντέλου Model 1 a. Model Summary Adjusted Std. Error of R R Square R Square the Estimate,578 a,335,331 65,99144 Predictors: (Constant), Advertsing Budget (thousands of pounds) Συντελεστής συσχέτισης Pearson Το µοντέλο εξηγεί το 33.5% της µεταβλητότητας των πωλήσεων ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 13

14 Αποτελέσµατα παλινδρόµησης Συνολική προσαρµογή του µοντέλου SS R SS M MS M Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig , ,833 99,587,000 a , , a. Predictors: (Constant), Advertsing Budget (thousands of pounds) b. Dependent Variable: Record Sales (thousands) SS T MS R Συµπέρασµα: Από το F-test (sig<0,001) συµπεραίνουµε ότι το µοντέλο συνεισφέρει σηµαντικά στην πρόβλεψη του αριθµού των πωλήσεων ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 14

15 Αποτελέσµατα παλινδρόµησης παράµετροι του µοντέλου Model 1 (Constant) Advertsing Budget (thousands of pounds) Coefficients a Unstandardized Coefficients a. Dependent Variable: Record Sales (thousands) Standardized Coefficients B Std. Error Beta t Sig. 134,140 7,537 17,799,000,096,010,578 9,979,000 Record Sales=134,140+0,096*Advertising Budget sig<0,001 άρα οι δύο παράµετροι είναι σηµαντικά διαφορετικές από το 0 και εποµένως η συνεισφορά του µοντέλου στην πρόβλεψη των πωλήσεων είναι σηµαντική ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 15

16 Ερµηνεία των παραµέτρων του µοντέλου b0=134,140: Σε περίπτωση που δεν ξοδευτούν καθόλου χρήµατα για διαφήµιση (Χ=0) το µοντέλο προβλέπει ότι θα πουληθούν δίσκοι b1=0,096: Αν το ποσό της διαφήµισης αυξηθεί κατά 1 µονάδα ( 1000) το µοντέλο προβλέπει 96 (=0,096*1000) επιπλέον πωλήσεις δίσκων (!!) Παράδειγµα πρόβλεψης: Πόσοι δίσκοι θα πωληθούν αν ξοδέψουµε ; Με αντικατάσταση (Χ=100) παίρνουµε Υ=143,75 (δηλ. περίπου δίσκους) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 16

17 Πολλαπλή παλινδρόµηση (multiple regression) Επέκταση του γραµµικού µοντέλου µε περισσότερες ανεξάρτητες µεταβλητές Y i = ( b + b X + L 0 1 i + b k X k ) + ε i Η εξίσωση της ευθείας επεκτείνεται στο επίπεδο (2 ανεξ. µεταβλητές) και στο υπερεπίπεδο (>2 ανεξ. µετ/τές) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 17

18 Αξιολόγηση του µοντέλου SS T, SS R, SS M υπολογίζονται µε πιο πολύπλοκο τρόπο αλλά η ερµηνεία τους είναι η ίδια Υπολογίζεται συντελεστής πολλαπλής συσχέτισης (multiple R) που δείχνει πόσο ισχυρή είναι η συσχέτιση εξαρτηµένης µε όλες τις ανεξάρτητες Το R 2 ερµηνεύεται µε ακριβώς τον ίδιο τρόπο ως ποσοστό µεταβλητότητας που εξηγείται από το µοντέλο ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 18

19 Μέθοδοι παλινδρόµησης Βασικό πρόβληµα: Πώς επιλέγουµε τις ανεξάρτητες µεταβλητές που θα χρησιµοποιηθούν για το µοντέλο; Οι ανεξάρτητες µεταβλητές συνήθως είναι συσχετισµένες µεταξύ τους Υπάρχουν µεθοδολογίες επιλογής των καταλληλότερων µεταβλητών ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 19

20 Επιλογή µεταβλητών Αναγκαστική εισαγωγή (Forced Entry Enter): όλες οι µεταβλητές ταυτόχρονα Εισαγωγή και εξαγωγή µε βήµατα (Stepwise): η σειρά καθορίζεται από µαθηµατικά κριτήρια Προς τα εµπρός εισαγωγή (Forward) Προς τα πίσω εξαγωγή (Backward) Γενικές οδηγίες: Η επιλογή µε βήµατα δίνει διαφορετικά µοντέλα, δεν αφήνει τον ερευνητή να επιλέξει. Προτιµότερο να στηριζόµαστε σε θεωρητικά βιβλιογραφικά αποτελέσµατα. ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 20

21 Ακρίβεια του µοντέλου Βασικά ερωτήµατα: Το µοντέλο προσαρµόζεται καλά στα δεδοµένα ή επηρεάζεται από λίγες περιπτώσεις; Μπορεί το µοντέλο να γενικευτεί και σε άλλα δείγµατα; ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 21

22 ιαγνωστικά προσαρµογής του µοντέλου (diagnostics) Παράτυπα σηµεία (outliers): εδοµένα (cases) που διαφέρουν σηµαντικά από τα υπόλοιπα Μπορούν να επηρεάσουν σηµαντικά τις τιµές των συντελεστών της παλινδρόµησης Μπορούν να εντοπιστούν από τα µεγάλα υπόλοιπα (residuals) που δίνουν ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 22

23 Υπόλοιπα Γενικά: Τα υπόλοιπα υπολογίζονται ως διαφορές ανάµεσα στις παρατηρήσεις και τις εκτιµήσεις της παλινδρόµησης µικρά υπόλοιπα καλή προσαρµογή µεγάλα υπόλοιπα κακή προσαρµογή σηµεία µε ιδιαίτεραµεγάλα υπόλοιπα παράτυπα σηµεία ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 23

24 Μετασχηµατισµοί υπολοίπων Για µελέτη σύγκριση υπολοίπων τα τυποποιούµε (standardized residuals) διαιρώντας µε την τυπική τους απόκλιση Τυποποιηµένα υπόλοιπα µε απόλυτη τιµή > 3 προβληµατίζουν Αν πάνω από 1% των τυπ. υπολοίπων είναι > 2.5 έχουµε ένδειξη κακής προσαρµογής Αν πάνω από 5% των τυπ. υπολοίπων είναι >2 έχουµε ένδειξη κακής προσαρµογής Studentized residuals: Τα υπόλοιπα διαιρεµένα µε εκτιµητή της τυπ. απόκλισης που µεταβάλλεται από σηµείο σε σηµείο. Θεωρούνται ακριβέστερα ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 24

25 εδοµένα µε σηµαντική επιρροή (Influential cases) Άλλος τρόπος ελέγχου παράτυπων σηµείων: Υπάρχουν σηµεία που έχουν αδικαιολόγητα µεγάλη επίδραση στο µοντέλο; Adjusted Predicted Value: υπολογίζεται για κάθε case αφαιρώντας την από το δείγµα και εκτιµώντας την µε το µοντέλο που προκύπτει DFFit: ιαφορά ανάµεσα στην Adj. Pred. value και στην αρχική Pred. value Standardized DFFit Deleted Residual: ιαφορά ανάµεσα στην Adj. Pred. value και στην παρατηρούµενη τιµή Studentized deleted residual ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 25

26 εδοµένα µε σηµαντική επιρροή (Influential cases) Cook s distance: Μέτρο συνολικής επίδρασης ενός σηµείου στο µοντέλο. εδοµένα µε τιµή >1 προβληµατίζουν Άλλα µέτρα: leverage values Mahalanobis distances DFBeta & Standardized DFBeta Covariance Ratio (CVR) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 26

27 Παράδειγµα (File: pubs.sav) Ανεξάρτητη µεταβλητή: Number of pubs Εξαρτηµένη µεταβλητή: Number of deaths (σε µια χρονική περίοδο) Case Summaries a Number of Pubs Deaths Total N 8 8 a. Limited to first 100 cases. ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 27

28 ιαφορά residual influence statistics Total N Case Summaries a Centered Standardized Standardized Cook's Leverage Standardized DFBETA DFBETA Standardized Residual Distance Value DFFIT Intercept DFBETA pubs Intercept DFBETA pubs -1,33839,21328, , ,6518 1, ,74317,36886 a. Limited to first 100 cases. -,87895,08530, , ,1277, ,40766, ,41950,01814, , ,1066, ,17494,07132,03995,00015,01759, , ,02658, ,00564,49940,02294,01200, , ,27267, ,05933,95885,08092,00748, , ,41116, , ,41830,17107,00402, , ,44422, , , ,14286, ,7 3351,955-85, , , Πολύ µικρό υπόλοιπο Πολύ µεγάλη επίδραση στο µοντέλο ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 28

29 Γενίκευση του µοντέλου βασικές υποθέσεις (1/2) Τύπος µεταβλητών: Οι ανεξάρτητες είναι ποσοτικές ή δίτιµες και η εξαρτηµένη συνεχής Καµιά µεταβλητή δεν έχει διασπορά 0 Οι ανεξάρτητες δεν πρέπει να έχουν µεγάλες συσχετίσεις µεταξύ τους (multicollinearity) Τα υπόλοιπα πρέπει να έχουν σταθερή διασπορά (homoscedasticity). Προβληµατική η διαφορετική διασπορά (heteroscedasticity). ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 29

30 Γενίκευση του µοντέλου βασικές υποθέσεις (2/2) Ανεξάρτητα σφάλµατα (independent errors). Υποθέτουµε ότι δεν υπάρχει αυτοσυσχέτιση (autocorrelation) Σφάλµατα κανονικά κατανεµηµένα (υποθέτουµε ότι τα υπόλοιπα ακολουθούν κανονική κατανοµή µε µέση τιµή 0) Ανεξαρτησία των τιµών της εξαρτηµένης µεταβλητής Η πραγµατική σχέση είναι γραµµική ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 30

31 Ακρίβεια του µοντέλου για άλλα δείγµατα Cross Validation Adjusted R 2 : «ιόρθωση» του R 2 ερµηνεύεται ως το ποσοστό της µεταβλητότητας της Y που θα ερµηνευόταν από το µοντέλο του πληθυσµού Τυχαία διαµέριση των δεδοµένων σε training set και test set. Tο µοντέλο δηµιουργείται από το training και προβλέπει τα σηµεία του test ακολουθεί αξιολόγηση ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 31

32 Έλεγχοι για παραβίαση των υποθέσεων Multicollinearity: Εξέταση πίνακα συσχετίσεων ανεξάρτητων µεταβλητών Variance inflation factor (VIF) Tolerance Heteroscedasticity - Normality: Γραφικές παραστάσεις υπολοίπων Autocorrelation: Durbin-Watson test ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 32

33 Πολλαπλή παλινδρόµηση µε το SPSS file: Record2.sav Ανεξάρτητές µεταβλητές: adverts (ποσό διαφήµισης δίσκου) airplay (αριθµός ραδιοφωνικών µεταδόσεων του δίσκου από συγκεκριµένο σταθµό) attract (ελκυστικότητα του καλλιτέχνη / συγκροτήµατος 0-10 από προηγούµενη έρευνα) Εξαρτηµένη µεταβλητή: sales (αριθµός πωλήσεων δίσκου) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 33

34 Analyze->Regression->Linear Εξαρτηµένη µεταβλητή Ανεξάρτητες µεταβλητές Επιλογή µεθόδου εισαγωγής µεταβλητών ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 34

35 Statistics Προσαρµογή του µοντέλου Στατιστικά µέτρα για τους συντελεστές της παλινδρόµησης Στατιστικά µέτρα υπολοίπων ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 35

36 Plots-Γραφικές παραστάσεις για ανάλυση των υπολοίπων ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 36

37 Save regression diagnostics Υπόλοιπα, Προβλέψεις και Στατιστικά µέτρα υπολοίπων αποθηκεύονται ως νέες µεταβλητές ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 37

38 Κριτήρια για αλγόριθµους µε βήµατα, διαχείριση χαµένων τιµών και υπολογισµός σταθεράς ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 38

39 Αποτελέσµατα παλινδρόµησης Descriptive Statistics Record Sales (thousands) Advertsing Budget (thousands of pounds) No. of plays on Radio 1 per week Attractiveness of Band Mean Std. Deviation N 193, , , , , , ,7700 1, Περίληψη όλων των µεταβλητών ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 39

40 Συσχετίσεις ανάµεσα στις µεταβλητές (δεν φαίνεται multicollinearity) Correlations Pearson Correlation Sig. (1-tailed) N Record Sales (thousands) Advertsing Budget (thousands of pounds) No. of plays on Radio 1 per week Attractiveness of Band Record Sales (thousands) Advertsing Budget (thousands of pounds) No. of plays on Radio 1 per week Attractiveness of Band Record Sales (thousands) Advertsing Budget (thousands of pounds) No. of plays on Radio 1 per week Record Sales (thousands) Advertsing Budget (thousands of pounds) No. of plays on Radio 1 per week Attractiveness of Band 1,000,578,599,326,578 1,000,102,081,599,102 1,000,182,326,081,182 1,000.,000,000,000,000.,076,128,000,076.,005,000,128, Attractiveness of Band ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ

41 Προσαρµογή του µοντέλου Model 1 a. Model Summary b Adjusted Std. Error of Durbin- R R Square R Square the Estimate Watson,815 a,665,660 47, ,950 Predictors: (Constant), Attractiveness of Band, Advertsing Budget (thousands of pounds), No. of plays on Radio 1 per week b. Dependent Variable: Record Sales (thousands) Το µοντέλο εξηγεί 66.5% της συνολικής µεταβλητότητας Το adjusted R2 δεν είναι πολύ µικρότερο και δείχνει ότι το µοντέλο µπορεί να γενικευτεί στον πληθυσµό Το D-W είναι κοντά στο 2 οπότε σύµφωνα µε εµπειρικό κανόνα τα σφάλµατα είναι ανεξάρτητα (ανησυχούµε για τιµές <1 ή >3!!) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 41

42 Σηµαντικότητα του µοντέλου Model 1 a. Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig , , ,498,000 a , , Predictors: (Constant), Attractiveness of Band, Advertsing Budget (thousands of pounds), No. of plays on Radio 1 per week b. Dependent Variable: Record Sales (thousands) Το F-test δίνει sig.<0.001 οπότε το µοντέλο είναι πολύ σηµαντικό στην εξήγηση της µεταβλητότητας ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 42

43 Παράµετροι του µοντέλου Model 1 (Constant) Advertsing Budget (thousands of pounds) No. of plays on Radio 1 per week Attractiveness of Band Unstandardized Coefficients a. Dependent Variable: Record Sales (thousands) Standardized Coefficients Coefficients a 95% Confidence Interval for B B Std. Error Beta t Sig. Lower Bound Upper Bound -26,613 17,350-1,534,127-60,830 7,604 Collinearity Statistics Tolerance,085,007,511 12,261,000,071,099,986 1,015 3,367,278,512 12,123,000 2,820 3,915,959 1,043 11,086 2,438,192 4,548,000 6,279 15,894,963 1,038 VIF sales= *adverts *airplay *attract ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 43

44 Ερµηνεία του µοντέλου (1/2) Όλοι οι συντελεστές των µεταβλητών είναι θετικοί οπότε όσο αυξάνουν οι τιµές των µεταβλητών αυξάνονται οι πωλήσεις Το µέγεθος του κάθε συντελεστή δείχνει πόσο αυξάνονται οι πωλήσεις όταν αυξηθεί κατά 1 µονάδα η αντίστοιχη µεταβλητή κρατώντας τις υπόλοιπες σταθερές ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 44

45 Ερµηνεία του µοντέλου (2/2) Τα t-tests για κάθε συντελεστή των µεταβλητών δίνουν sig.<0.001 και εποµένως όλες οι µεταβλητές είναι σηµαντικές Το µέγεθος του t µας δείχνει ότι η διαφήµιση και η ραδιοφωνική µετάδοση είναι εξίσου σηµαντικές ενώ η ελκυστικότητα λιγότερο σηµαντική (το ίδιο προκύπτει και από τους standardized coefficients) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 45

46 Multicollinearity Πρόβληµα όταν: max(vif)>10 mean(vif)>>1 Tolerance<0.1 ή 0.2 Εδώ δεν υπάρχει πρόβληµα! Υπάρχουν και άλλα στατιστικά µέτρα ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 46

47 Casewise diagnostics Case Number Casewise Diagnostics a Record Sales Predicted Std. Residual (thousands) Value Residual 2, ,00 229, , , ,00 228, ,949 2, ,00 200, , ,442 40,00 154, ,970 2, ,00 92, , , ,00 304, ,123 2, ,00 201, , ,345 70,00 180, ,416 2, ,00 152, , , ,00 241, ,324 3, ,00 215, , , ,00 207, ,20606 a. Dependent Variable: Record Sales (thousands) Λογικός ο αριθµός των µεγάλων υπολοίπων (12/200) ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 47

48 Γραφική ανάλυση υπολοίπων ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 48

49 Γραφική ανάλυση υπολοίπων ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 49

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 10 ο 10.1 Πολλαπλή Γραµµική Παλινδρόµηση 10.2 Η εφαρµογή της Πολλαπλής Γραµµικής Παλινδρόµησης 10.3 Παράδειγµα

Διαβάστε περισσότερα

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία. . ΣΤΑΤΙΣΤΙΚΗ ΣΥΣΧΕΤΙΣΗ. Υπολογισµός συντελεστών συσχέτισης Προκειµένου να ελέγξουµε την ύπαρξη γραµµικής σχέσης µεταξύ δύο ποσοτικών µεταβλητών, χρησιµοποιούµε συνήθως τον παραµετρικό συντελεστή συσχέτισης

Διαβάστε περισσότερα

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ Κωνσταντίνος Ζαφειρόπουλος Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Μακεδονίας Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 11 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση)

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 11 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση) Ενότητα ιαφάνειες Μαθήµατος: - Ενότητα ιαφάνειες Μαθήµατος: - ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 006-007, 3ο εξάµηνο.. Γενίκευση του µοντέλου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

Ανάλυση εδοµένων - Χρήση του στατιστικού πακέτου SPSS. 1 η ΕΝΟΤΗΤΑ ΕΙΣΑΓΩ ΓΗ ΣΤΟ SPSS ΒΑΣΙΚΕΣ ΛΕΙΤΟΥΡΓΙΕΣ

Ανάλυση εδοµένων - Χρήση του στατιστικού πακέτου SPSS. 1 η ΕΝΟΤΗΤΑ ΕΙΣΑΓΩ ΓΗ ΣΤΟ SPSS ΒΑΣΙΚΕΣ ΛΕΙΤΟΥΡΓΙΕΣ Ανάλυση εδοµένων - Χρήση του στατιστικού πακέτου SPSS η ΕΝΟΤΗΤΑ ΕΙΣΑΓΩ ΓΗ ΣΤΟ SPSS ΒΑΣΙΚΕΣ ΛΕΙΤΟΥΡΓΙΕΣ (Α) Καταγραφή δεδοµένων και επιλογή κατάλληλων ρυθµίσεων των µεταβλητών Η βασική οθόνη του στατιστικού

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

Εισαγωγή στη Βιοστατιστική

Εισαγωγή στη Βιοστατιστική Εισαγωγή στη Βιοστατιστική Π.Μ.Σ.: Έρευνα στη Γυναικεία Αναπαραγωγή Οκτώβριος Νοέµβριος 2013 Αλέξανδρος Γρυπάρης, PhD Αλέξανδρος Γρυπάρης, PhD 4 Περιεχόµενα o Ορισµός της Στατιστικής o Περιγραφική στατιστική

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA) ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 8. Ανάλυση διασποράς (ANOVA) Γενικά Επέκταση της σύγκρισης µέσων τιµών µεταβλητής ανάµεσα σε 2 δείγµατα (οµάδες ήστάθµες): Σύγκριση πολλών δειγµάτων (K>2) µαζί Σχέση ανάµεσα σε µια ποσοτική

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΟΙΚΟΝΟΜΕΤΡΙΑΣ

ΣΗΜΕΙΩΣΕΙΣ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΗΜΕΙΩΣΕΙΣ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΕΙΣΑΓΩΓΗ. Ο ορισµός της οικονοµετρίας περιλαµβάνει την εµπειρική εκτίµηση των οικονοµικών σχέσεων. Χρησιµοποιώντας δηλαδή την οικονοµική θεωρία την στατιστική θεωρία αλλά και τα

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 12 ο 12.1 Λογιστική Παλινδρόµηση 12.2 Η εξίσωση της Λογιστικής Παλινδρόµησης. 12.3 Βήµατα δηµιουργίας του

Διαβάστε περισσότερα

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 12 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση) [µέρος 2ο]

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. ΜΑΘΗΜΑ 12 Συµπερασµατολογία για την επίδραση πολλών µεταβλητών σε µια ποσοτική (Πολλαπλή Παλινδρόµηση) [µέρος 2ο] Ενότητα 2 ιαφάνειες Μαθήµατος: 2- Ενότητα 2 ιαφάνειες Μαθήµατος: 2-2 ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο.6. είκτες µερικής συσχέτισης

Διαβάστε περισσότερα

ΣΕΜΙΝΑΡΙΟ ΧΩΡΟΣ ΚΑΙ ΠΟΣΟΤΙΚΕΣ ΑΝΑΛΥΣΕΙΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ. Εισηγητής: Πανταζής Παναγιώτης

ΣΕΜΙΝΑΡΙΟ ΧΩΡΟΣ ΚΑΙ ΠΟΣΟΤΙΚΕΣ ΑΝΑΛΥΣΕΙΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ. Εισηγητής: Πανταζής Παναγιώτης ΣΕΜΙΝΑΡΙΟ ΧΩΡΟΣ ΚΑΙ ΠΟΣΟΤΙΚΕΣ ΑΝΑΛΥΣΕΙΣ ΜΕΘΟΔΟΙ ΚΑΙ ΤΕΧΝΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ Εισηγητής: Πανταζής Παναγιώτης Μάιος 2005 Θεματική Χαρτογραφία 1. ΒΑΣΙΚΑ ΣΗΜΕΙΑ ΧΑΡΤΟΓΡΑΦΙΚΗΣ ΑΠΕΙΚΟΝΙΣΗΣ 1.1 Εννοιολογική αποσαφήνιση

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Μηχανικών Πληροφορικής (ΤΕ) Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

ROEHAMPTON UNIVERSITY MA IN EDUCATION Ρ ΚΟΡΡEΣ ΚΩΝΣΤΑΝΤIΝΟΣ ΑΘΗΝΑ 2011

ROEHAMPTON UNIVERSITY MA IN EDUCATION Ρ ΚΟΡΡEΣ ΚΩΝΣΤΑΝΤIΝΟΣ ΑΘΗΝΑ 2011 Ι.Τ.Ε. ROEHAMPTON UNIVERSITY MA IN EDUCATION ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΤΟ SPSS Ρ ΚΟΡΡEΣ ΚΩΝΣΤΑΝΤIΝΟΣ ΑΘΗΝΑ 2011 ΕΚΚΙΝΗΣΗ ΤΟΥ SPSS Από την Έναρξη των Windows, επιλέγουµε: Προγράµµατα SPSS for Windows SPSS *.*

Διαβάστε περισσότερα

INFORMATION MANAGEMENT

INFORMATION MANAGEMENT INFORMATION MANAGEMENT Εισηγητής ΜΙΧΑΛΟΠΟΥΛΟΣ ΒΑΣΙΛΕΙΟΣ ιδάκτορας Πανεπιστηµίου Πειραιώς ΑΘΗΝΑ ΣΚΟΠΟΣ ΤΗΣ ΣΤΑΤΙΣΤΙΚΗΣ Ανάγκησυλλογής, περιγραφής, ανάλυσηςκαι ερµηνείαςτωνπληροφοριών. Η Στατιστική παρέχει

Διαβάστε περισσότερα

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... v

Περιεχόμενα. Πρόλογος... v Περιεχόμενα Πρόλογος... v 1 Χρήση της έκδοσης 10 του SPSS για Windows και καταχώριση δεδομένων... 1 2 Περιγραφή μεταβλητών: πίνακες και γραφήματα... 19 3 Περιγραφή μεταβλητών αριθμητικά: μέσοι όροι, διακύμανση,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΣΕ ΠΕΡΙΒΑΛΛΟΝ C++ ΓΙΑ ΤΗΝ ΠΛΗΡΗ ΜΕΛΕΤΗ ΤΩΝ ΓΡΑΜΜΙΚΩΝ ΣΤΟΧΑΣΤΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ Διπλωματική

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΑΛΙΝΔΡΟΜΗΣΗ Δημοκρίτειο Πανεπιστήμιο Θράκης Τμήμα Δασολογίας και Διαχείρισης Περιβάλλοντος και Φυσικών Πόρων 4 0 εξάμηνο ΚΙΤΙΚΙΔΟΥ ΚΥΡΙΑΚΗ ΕΙΣΑΓΩΓΗ Σχέσεις εξάρτησης μεταξύ των μεταβλητών

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 6 ο 6.1 Ερωτήσεις Πολλαπλών Απαντήσεων 6.2 Εντολή Case Summaries 6.3 Ο έλεγχος t : (correlate t-test) 6.3.1Σύγκριση

Διαβάστε περισσότερα

Κεϕάλαιο 5 Συσχέτιση και Παλινδρόµηση

Κεϕάλαιο 5 Συσχέτιση και Παλινδρόµηση Κεϕάλαιο 5 Συσχέτιση και Παλινδρόµηση Στο προηγούµενο κεϕάλαιο µελετήσαµε τη διάδοση του σϕάλµατος από µια τυχαία µεταβλητή X σε µια τ.µ. Y που δίνεται ως συνάρτηση της X. Σε αυτό το κεϕάλαιο ϑα διερευνήσουµε

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΜΕΘΟΔΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ

ΣΤΑΤΙΣΤΙΚΗ ΜΕΘΟΔΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ Α. ΕΜΒΑΛΩΤΗΣ Α. ΚΑΤΣΗΣ Γ. ΣΙΔΕΡΙΔΗΣ ΣΤΑΤΙΣΤΙΚΗ ΜΕΘΟΔΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ Α ΕΚΔΟΣΗ ΙΩΑΝΝΙΝΑ 2006 Α. Εμβαλωτής: Επίκουρος Καθηγητής Πανεπιστημίου Ιωαννίνων Α. Κατσής: Επίκουρος Καθηγητής Πανεπιστημίου

Διαβάστε περισσότερα

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΚΕΦΑΛΑΙΟ 13 ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Στις προηγούμενες ενότητες ασχοληθήκαμε με μεθόδους που οδηγούν σε εκτιμήτριες των τιμών μιας ή και περισσοτέρων αγνώστων παραμέτρων. Αυτό έγινε με την κατασκευή

Διαβάστε περισσότερα

ιατµηµατικό Πρόγραµµα Μετα τυχιακών Σ ουδών των Τµηµάτων Μαθηµατικών & Μηχανικών Η/Υ & Πληροφορικής «Μαθηµατικά των Υ ολογιστών και των Α οφάσεων»

ιατµηµατικό Πρόγραµµα Μετα τυχιακών Σ ουδών των Τµηµάτων Μαθηµατικών & Μηχανικών Η/Υ & Πληροφορικής «Μαθηµατικά των Υ ολογιστών και των Α οφάσεων» ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ιατµηµατικό Πρόγραµµα Μετα τυχιακών Σ ουδών των Τµηµάτων Μαθηµατικών & Μηχανικών Η/Υ & Πληροφορικής «Μαθηµατικά των Υ ολογιστών και των Α οφάσεων» Κατεύθυνση: Στατιστική Θεωρία Α οφάσεων

Διαβάστε περισσότερα

ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας και Ανάπτυξης. Σημειώσεις EViews. Παναγιώτης Λαζαρίδης Αναπληρωτής Καθηγητής. Y j.

ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας και Ανάπτυξης. Σημειώσεις EViews. Παναγιώτης Λαζαρίδης Αναπληρωτής Καθηγητής. Y j. ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας και Ανάπτυξης Σημειώσεις EViews Παναγιώτης Λαζαρίδης Αναπληρωτής Καθηγητής Υ Y j u j û j ( Y X j ) = β + β X j E 1 ˆ ˆ ˆ Yj = β X j Χ j Χ Το EViews

Διαβάστε περισσότερα