ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ



Σχετικά έγγραφα
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Στατιστική Επιχειρήσεων Ι

Προϋποθέσεις : ! Και οι δύο µεταβλητές να κατανέµονται κανονικά και να έχουν επιλεγεί τυχαία.

1. Θα χρησιμοποιηθεί το αρχείο Ο γονικός έλεγχος στην εφηβική ηλικία. Στο. i. Με ποιες μεταβλητές που αφορούν σε σχέσεις εφήβων με τους γονείς τους

Μάθηµα εύτερο-τρίτο- Βασικά Ζητήµατα στο Απλό Γραµµικό Υπόδειγµα Ακαδηµαϊκό Έτος

Απλή Ευθύγραµµη Συµµεταβολή

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Η βιτρίνα των καταστημάτων ως εργαλείο δημοσίων σχέσεων. Ονοματεπώνυμο: Ειρήνη Πορτάλιου Σειρά: 8 η Επιβλέπουσα: Αν. Καθηγήτρια : Βεντούρα Ζωή

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Λυμένες Ασκήσεις για το μάθημα:

Άσκηση 2. i β. 1 ου έτους (Υ i )

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ SPSS

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕ ΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Περιεχόμενα. Πρόλογος... v

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΠΑΝΕΠΙΣΤΗΜΙΟ+ΠΑΤΡΩΝ+ Τμήμα+Διοίκησης+Επιχειρήσεων+

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Εισόδημα Κατανάλωση

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αναλυτική Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Μοντέλα Πολλαπλής Παλινδρόμησης

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Άσκηση 1. Πληθυσμός (Χ i1 )

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

Ελένη Κανδηλώρου Αναπλ. Καθηγήτρια. Γραμμικά Μοντέλα. Λύσεις Ασκήσεων

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Πρακτικές Θετικής Οργανωσιακής Αλλαγής και οι στάσεις των εργαζομένων απέναντι στην αλλαγή

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 6. Συσχέτιση

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ& ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Εξετάσεις περιόδου στο μάθημα ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ& ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Γραμμική Παλινδρόμηση II

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

Οικονομετρία Ι. Ενότητα 6: Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

Εισαγωγή στη Βιοστατιστική

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Εισαγωγή στη Βιοστατιστική

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Γ. Πειραματισμός Βιομετρία

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΕΡΓΑΙΑ Εθηίκεζε αμίαο κεηαπώιεζεο ζπηηηώλ κε αλάιπζε δεδνκέλωλ. Παιεάο Δπζηξάηηνο

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Transcript:

Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών μεταβλητών... 2 Παράδειγμα 1... 2 1.1 Δεδομένα... 2 1.2 Ζητήματα... 2 1.3 Διάγραμμα διασποράς... 2 1.4 Συντελεστής Γραμμικής Συσχέτισης... 3 1.5 Ερμηνεία αποτελεσμάτων... 3 1.6 Αναφορά αποτελεσμάτων... 4 2. Γραμμική Παλινδρόμηση... 5 Παράδειγμα 2.1 (Απλή Παλινδρόμηση)... 5 2.1.1 Δεδομένα... 5 2.1.2 Ζητήματα... 5 2.1.3 Επιλογή και προσδιορισμός του μαθηματικού μοντέλου... 5 2.1.4 Ερμηνεία αποτελεσμάτων... 7 2.1.5 Αναφορά αποτελεσμάτων... 7 Παράδειγμα 2.2 (Πολλαπλή Παλινδρόμηση)... 8 2.2.1 Δεδομένα... 8 2.2.2 Ζητήματα... 8 2.2.3 Επιλογή και προσδιορισμός του μαθηματικού μοντέλου... 8 2.2.4 Αναφορά αποτελεσμάτων... 9 1

1. Συσχέτιση μεταξύ δύο ποσοτικών μεταβλητών (Διαδικασίες: Bivariate Correlations & Scatter/Dot) Ο προσδιορισμός της φύσης και της έντασης της συσχέτισης μεταξύ δύο ποσοτικών μεταβλητών πραγματοποιείται με την κατασκευή του διαγράμματος διασποράς (διαδικασία Scatterplot) και με τον υπολογισμό του συντελεστή γραμμικής συσχέτισης του Pearson (διαδικασία Bivariate Correlations). Παράδειγμα 1 1.1 Δεδομένα Για το παρακάτω παράδειγμα, θα χρησιμοποιηθεί το αρχείο ERG-STAT-Askisi_3_data 1.2 Ζητήματα Θα θέλαμε να προσδιορίσουμε την φύση και την ένταση της συσχέτισης, η οποία ενδεχομένως να υπάρχει, μεταξύ του τρέχοντος μισθού (current salary) των εργαζομένων στην επιχείρηση αυτή και του αντίστοιχου αρχικού μισθού πρόσληψης τους (beginning salary). 1.3 Διάγραμμα διασποράς Για τον προσδιορισμό της φύσης της συσχέτισης που ενδεχομένως υπάρχει μεταξύ των δύο χαρακτηριστικών (μεταβλητών), κατασκευάζουμε το διάγραμμα διασποράς (Graphs - ScatterPlot). Συγκεκριμένα, η κατασκευή αυτή πραγματοποιείται ως εξής: Από τη βασική ράβδο προτιμήσεων του λογισμικού επιλέγουμε Graphs Scatter/Dot Simple Scatter -- Define Στο πλαίσιο διαλόγου της διαδικασίας Simple Scatterplot, επιλέγουμε τις δύο ποσοτικές μεταβλητές που μας ενδιαφέρουν και τις μετακινούμε στα πλαίσια Y Axis και X Axis. Όταν η μια από τις δύο μεταβλητές θεωρείται ως ανεξάρτητη μετακινείται στο πλαίσιο X Axis (στο παράδειγμα αυτό ως ανεξάρτητη θεωρείται η μεταβλητή Beginning Salary). 2

1.4 Συντελεστής Γραμμικής Συσχέτισης Για να εκτιμήσουμε την ένταση της συσχέτισης αυτής, υπολογίζουμε τον συντελεστή γραμμικής συσχέτισης του Pearson (r). Ο συντελεστής γραμμικής συσχέτισης του Pearson (r) παίρνει τις τιμές: -1 r +1, όπου r = -1 r = 0 r = +1 Μηδενική (δεν υπάρχει) γραμμική συσχέτιση Τέλεια αρνητική γραμμική συσχέτιση Τέλεια θετική γραμμική συσχέτιση Συγκεκριμένα: Όσο το r βρίσκεται πιο κοντά στο +1 (-1), τόσο πιο ισχυρή θετική (αρνητική) συσχέτιση υπάρχει. Όσο το r βρίσκεται πιο κοντά στο 0, τόσό πιο ασθενής συσχέτιση υπάρχει. Ενδεικτικά, μπορούμε να θεωρήσουμε ότι η συσχέτιση είναι: Ικανοποιητική έως πολύ ισχυρή, όταν 0,7 < r < 1 Μέτρια έως ικανοποιητική, όταν 0,5 < r < 0,7 Ασθενής έως μέτρια, όταν 0 < r < 0,5 Ο υπολογισμός του συντελεστή γραμμικής συσχέτισης πραγματοποιείται ως εξής: Από τη βασική ράβδο προτιμήσεων του λογισμικού επιλέγουμε: Analyze Correlate Bivariate Στο πλαίσιο διαλόγου της διαδικασίας Bivariate Correlations, επιλέγουμε τις μεταβλητές των οποίων τη σχέση αναζητούμε και τις μετακινούμε στο πλαίσιο variable(s). Μπορούμε να μετακινήσουμε περισσότερες από δύο μεταβλητές. Στην περίπτωση αυτή οι υπολογισμοί θα γίνουν για κάθε ένα συνδυασμό τους ανά δύο. 1.5 Ερμηνεία αποτελεσμάτων Το διάγραμμα διασποράς υποδεικνύει την ύπαρξη γραμμικής συσχέτισης μεταξύ των δύο χαρακτηριστικών (τρέχον μισθός αρχικός μισθός). Παρατηρούμε ότι τα σημεία τείνουν να συγκεντρώνονται γύρω από μία νοητή ευθεία. Με άλλα λόγια, παρατηρούμε ότι όταν ο αρχικός μισθός αυξάνεται, και ο τρέχον μισθός αυξάνεται επίσης, κατά μέσο όρο. Από τον πίνακα αποτελεσμάτων που αφορά στον συντελεστή γραμμικής συσχέτισης, καταγράφουμε την τιμή του συντελεστή (r = + 0,880) και την σημαντικότητα του ελέγχου (sig.=0,000). Ο συντελεστής (r) ερμηνεύεται σύμφωνα με όσα έχουν αναφερθεί στην προηγούμενη ενότητα. Ο έλεγχος υποθέσεων που πραγματοποιείται αφορά στην πραγματική τιμή του συντελεστή γραμμικής συσχέτισης ρ (στον πληθυσμό). Συγκεκριμένα, ο έλεγχος υποθέσεων περιγράφεται ως εξής: 3

Η 0 : ρ = 0 Η a : ρ 0 Εφαρμογή του ελέγχου sig. = 0,000 < 0,05, συνεπώς απορρίπτουμε τη μηδενική υπόθεση. Δηλαδή, ο συντελεστής ρ θεωρείται ότι είναι στατιστικά σημαντικά διάφορος του μηδέν, και συνεπώς υπάρχει στατιστικά σημαντική συσχέτιση μεταξύ του αρχικού και του τρέχοντος μισθού. Παρατηρήσεις α) Η διαφορά μεταξύ του ρ και του r είναι ότι το πρώτο αναφέρεται στον πραγματικό συντελεστή συσχέτισης (δηλαδή εκείνον που θα προέκυπτε εάν είχαμε δεδομένα από το σύνολο του πληθυσμού των εργαζόμενων, και την τιμή του οποίου δεν γνωρίζουμε και θέλουμε να εκτιμήσουμε), ενώ το r αναφέρεται στον συντελεστή συσχέτισης που υπολογίζεται από τα δεδομένα του συγκεκριμένου δείγματος εργαζομένων. Συνεπώς, πρώτα ελέγχουμε εάν ο συντελεστής ρ μπορεί να θεωρηθεί ότι είναι στατιστικά σημαντικά διάφορος από το μηδέν (0), και μόνο στην περίπτωση αυτή προχωρούμε στην καταγραφή της έντασης της συσχέτισης αυτής με την ερμηνεία της τιμής του r. β) Στην περίπτωση κατά την οποία η τιμή του συντελεστή ΓΡΑΜΜΙΚΗΣ συσχέτισης (r) βρίσκεται κοντά στο 0 κατά απόλυτη τιμή, μπορούμε να συμπεράνουμε ότι οι δύο μεταβλητές δεν συσχετίζονται μεταξύ τους ΓΡΑΜΜΙΚΑ (δηλαδή η σχέση τους δεν μπορεί να περιγραφεί ικανοποιητικά από μία ευθεία). Αυτό όμως δεν αποκλείει ότι μπορεί να συσχετίζονται με κάποιον άλλο τρόπο, ΜΗ ΓΡΑΜΜΙΚΟ. Για το λόγο αυτό, είναι απαραίτητο να κατασκευάζουμε πρώτα το διάγραμμα διασποράς, το οποίο μπορεί να υποδείξει την φύση της συσχέτισης που μπορεί να υφίσταται μεταξύ δύο μεταβλητών. 1.6 Αναφορά αποτελεσμάτων Οι παραπάνω ερμηνείες μπορούν να καταγραφούν σε μία αναφορά αποτελεσμάτων ως εξής: Το διάγραμμα διασποράς υποδεικνύει την ύπαρξη γραμμικής συσχέτισης μεταξύ των δύο χαρακτηριστικών (τρέχον μισθός αρχικός μισθός). Συγκεκριμένα, παρατηρούμε ότι όταν ο αρχικός μισθός αυξάνεται, και ο τρέχον μισθός αυξάνεται επίσης, κατά μέσο όρο. Σύμφωνα με τον συντελεστή γραμμικής συσχέτισης (r = +0,880, sig.<0,000), θεωρούμε ότι υπάρχει αρκετά ισχυρή, θετική, γραμμική συσχέτιση μεταξύ του αρχικού και του τρέχοντος μισθού. 4

2. Γραμμική Παλινδρόμηση (Διαδικασία: Linear Regression) Η Γραμμική Παλινδρόμηση αποτελεί μία στατιστική μέθοδο η οποία αποσκοπεί στον προσδιορισμό ενός μαθηματικού μοντέλου για την περιγραφή / ερμηνεία / πρόβλεψη των τιμών ενός χαρακτηριστικού (μεταβλητής) σε σχέση με τις τιμές ενός πλήθους άλλων χαρακτηριστικών (μεταβλητών). Παράδειγμα 2.1 (Απλή Παλινδρόμηση) 2.1.1 Δεδομένα Για το παρακάτω παράδειγμα, θα χρησιμοποιηθεί το αρχείο ERG-STAT-Askisi_3_data 2.1.2 Ζητήματα Θα θέλαμε να προσδιορίσουμε ένα μαθηματικό μοντέλο το οποίο να περιγράφει τον τρέχοντα μισθό των εργαζόμενων (current salary) σε σχέση με τον αντίστοιχο αρχικό μισθό πρόσληψης τους (beginning salary). Το ζήτημα αυτό βασίζεται στην λογική υπόθεση ότι ο τρέχων μισθός ενός εργαζόμενου μπορεί να «εξαρτάται» από το μισθό πρόσληψης (αρχικό μισθό). 2.1.3 Επιλογή και προσδιορισμός του μαθηματικού μοντέλου Όπως έχουμε διαπιστώσει από το προηγούμενο παράδειγμα, ο τρέχων και ο αρχικός μισθός συσχετίζονται αρκετά ισχυρά και γραμμικά μεταξύ τους. Συνεπώς, το μαθηματικό μοντέλο, το οποίο μπορούμε να επιλέξουμε και να προσαρμόσουμε στα δεδομένα μας είναι το γραμμικό. Το γραμμικό μοντέλο: Y = α + β Χ + ε εξαρτημένη μεταβλητή ανεξάρτητη μεταβλητή σφάλμα όπου, α β και ε πραγματικοί αριθμοί Ο προσδιορισμός και η αξιολόγηση του εν λόγω μοντέλου (Γραμμή Παλινδρόμησης) πραγματοποιείται ως εξής: Από τη βασική ράβδο προτιμήσεων του λογισμικού επιλέγουμε: Analyze Regression Linear Μεταφέρουμε τη μεταβλητή την οποία μελετούμε (ή / και θέλουμε να κάνουμε πρόβλεψη των τιμών της) στο πλαίσιο Dependent (current salary) και την μεταβλητή, την οποία θα χρησιμοποιήσουμε για να ερμηνεύσουμε τις τιμές της πρώτης, στο πλαίσιο Independent(s) (beginning salary). ΟΚ. 5

Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate.880 a.775.774 $8,115.356 a. Predictors: (Constant), Beginning Salary Model 1 Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 1E+011 1 1.068E+011 1622.118.000 a 3E+010 472 65858997.22 1E+011 473 a. Predictors: (Constant), Beginning Salary b. Dependent Variable: Current Salary Model 1 (Constant) Beginning Salary Coefficients a Unstandardized Coefficients a. Dependent Variable: Current Salary Standardized Coefficients B Std. Error Beta t Sig. 1928.206 888.680 2.170.031 1.909.047.880 40.276.000 6

2.1.4 Ερμηνεία αποτελεσμάτων Πρώτος Πίνακας Ο δείκτης R-square (R 2 = 0,775) εκφράζει το ποσοστό της διακύμανσης της εξαρτημένης μεταβλητής το οποίο ερμηνεύεται από τη διακύμανση των τιμών της ανεξάρτητης μεταβλητής. Δηλαδή στο παράδειγμα, το 77,5% της διακύμανσης των μισθών των εργαζομένων ερμηνεύεται από τη διακύμανση των αρχικών μισθών τους. Ο συντελεστής αυτός ονομάζεται συντελεστής προσδιορισμού και υποδεικνύει την ποιότητα προσαρμογής της γραμμής παλινδρόμησης στα δεδομένα. Δεύτερος Πίνακας Στον πίνακα των αποτελεσμάτων της Ανάλυσης Διακύμανσης (ANOVA), παρατηρείται ότι το επίπεδο σημαντικότητας είναι: sig.=0,000 < 0,05. Συνεπώς, η γραμμή παλινδρόμησης που έχει εκτιμηθεί θεωρείται ότι είναι στατιστικά σημαντική (F=1622,118, sig. = 0,000). Τρίτος Πίνακας Το μαθηματικό μοντέλο το οποίο προκύπτει (γραμμή παλινδρόμησης), σύμφωνα με τον τρίτο πίνακα, είναι το εξής: (Current Salary) = 1928,206 + 1,909 (Beginning Salary) Έλεγχος του συντελεστή παλινδρόμησης β: Η 0 : β = 0 Η a : β 0 Εφαρμογή του t-test sig = 0,000 < 0,05, συνεπώς απορρίπτουμε τη μηδενική υπόθεση Ο συντελεστής παλινδρόμησης β είναι στατιστικά σημαντικά διάφορος του μηδέν (t = 40,276, sig < 0,001), συνεπώς ο αρχικός μισθός ερμηνεύει στατιστικά σημαντικά το μισθό των εργαζομένων. Ερμηνεία του συντελεστή παλινδρόμησης β Δεδομένου ότι ο συντελεστής αυτός είναι στατιστικά σημαντικός, η τιμή του ερμηνεύεται ως εξής: όταν ο αρχικός μισθός είναι αυξημένος κατά μία μονάδα (1 δολάριο), τότε ο μισθός αναμένεται να είναι αυξημένος κατά 1,909 μονάδες (1,909 δολάρια, δηλαδή σχεδόν κατά δύο δολάρια). 2.1.5 Αναφορά αποτελεσμάτων Οι παραπάνω ερμηνείες μπορούν να καταγραφούν σε μία αναφορά αποτελεσμάτων ως εξής: Ο τρέχων μισθός των εργαζομένων σε σχέση με τον αρχικό μισθό τους περιγράφεται σύμφωνα με την εξής γραμμή παλινδρόμησης: (Current Salary) = 1928,206 + 1,909 (Beginning Salary). Η γραμμή παλινδρόμησης που έχει εκτιμηθεί θεωρείται ότι είναι στατιστικά σημαντική (F=1622,118, sig.=0,000). Συγκεκριμένα, ο αρχικός μισθός ερμηνεύει στατιστικά σημαντικά το μισθό των εργαζομένων (t = 40,276, sig < 0,001). Το 77,5% της διακύμανσης του τρέχοντος μισθού των εργαζομένων ερμηνεύεται από τη διακύμανση των αρχικών μισθών τους. Επίσης, το εκτιμώμενο μοντέλο υποδεικνύει ότι, όταν ο αρχικός μισθός είναι αυξημένος κατά μία μονάδα (1 δολάριο), τότε ο τρέχων μισθός αναμένεται να είναι, κατά μέσο όρο, αυξημένος κατά 1,909 μονάδες (1,909 δολάρια, δηλαδή σχεδόν κατά δύο δολάρια). 7

Παράδειγμα 2.2 (Πολλαπλή Παλινδρόμηση) 2.2.1 Δεδομένα Το παράδειγμα αυτό αποτελεί συνέχεια του προηγούμενου παραδείγματος (Παράδειγμα 2.1) και βασίζεται στο ίδιο αρχείο (ERG-STAT-Askisi_3_data) 2.2.2 Ζητήματα Θα θέλαμε να προσδιορίσουμε ένα μαθηματικό μοντέλο το οποίο να περιγράφει τον τρέχοντα μισθό των εργαζόμενων (current salary) σε σχέση με τον αντίστοιχο αρχικό μισθό πρόσληψης τους (beginning salary) και την προϋπηρεσία τους (previous experience). Το ζήτημα αυτό βασίζεται στην λογική υπόθεση ότι ο τρέχων μισθός ενός εργαζόμενου μπορεί να «εξαρτάται» από τον αρχικό μισθό πρόσληψης και από την προϋπηρεσία τους. 2.2.3 Επιλογή και προσδιορισμός του μαθηματικού μοντέλου Το γραμμικό μοντέλο: Y = α + β 1 Χ 1 + β 2 Χ 2 + ε εξαρτημένη μεταβλητή ανεξάρτητες μεταβλητές σφάλμα όπου, α β και ε πραγματικοί αριθμοί Εκτιμούμε το μαθηματικό μοντέλο αυτό όπως το πραγματοποιήσαμε στην προηγούμενο παράδειγμα (Παράδειγμα 2.1). Η μόνη διαφορά είναι ότι στο πλαίσιο Independent(s) εισάγουμε τις μεταβλητές beginning salary και previous experience. 8

2.2.4 Αναφορά αποτελεσμάτων Οι ερμηνείες των αποτελεσμάτων προκύπτουν σύμφωνα με όσα έχουν αναφερθεί στο προηγούμενο παράδειγμα (Παράδειγμα 2.1), ενώ η καταγραφή τους σε μία αναφορά αποτελεσμάτων μπορεί να πραγματοποιηθεί ως εξής: Ο τρέχων μισθός των εργαζομένων σε σχέση με τον αρχικό μισθό τους και την προϋπηρεσία τους περιγράφεται σύμφωνα με την εξής γραμμή παλινδρόμησης: (Current Salary) = 3850,718 + 1,923 (Beginning Salary) 22,445 (Previous Experience). Η γραμμή παλινδρόμησης που έχει εκτιμηθεί θεωρείται ότι είναι στατιστικά σημαντική (F=904,752, sig.=0,000). Συγκεκριμένα, ο αρχικός μισθός ερμηνεύει στατιστικά σημαντικά το μισθό των εργαζομένων (t = 42,283, sig < 0,001), όπως επίσης και η προϋπηρεσία τους (t = -6,558, sig < 0,001). Το 79,3% της διακύμανσης του τρέχοντος μισθού των εργαζομένων ερμηνεύεται από τη διακύμανση του αρχικού μισθού τους και της αντίστοιχης προϋπηρεσίας τους. Επίσης, το εκτιμώμενο μοντέλο υποδεικνύει ότι, όταν ο αρχικός μισθός είναι αυξημένος κατά μία μονάδα (1 δολάριο) και η αντίστοιχη προϋπηρεσία παραμένει σταθερή, τότε ο τρέχων μισθός αναμένεται να είναι, κατά μέσο όρο, αυξημένος κατά 1,923 μονάδες (1,923 δολάρια). Αντίστοιχα,, όταν ο αρχικός μισθός παραμένει σταθερός και η αντίστοιχη προϋπηρεσία είναι αυξημένη κατά μία μονάδα (1 μήνα), τότε ο τρέχων μισθός αναμένεται να είναι, κατά μέσο όρο, μειωμένος κατά 22,445 μονάδες (22,445 δολάρια). Παρατήρηση Η εισαγωγή ενός νέου ανεξάρτητου χαρακτηριστικού (μεταβλητής) στο μοντέλο της γραμμικής παλινδρόμησης βελτίωσε την ερμηνευτική ικανότητα του (R-square) κατά (μόνο) 1,8 ποσοστιαίες μονάδες! 9