Η εργασία αυτή στοιχειοθετήθηκε με το πρόγραμμα L A TEX. Η συγγραφή έγινε με τη βοήθεια του προγράμματος Kile στο λειτουργικό σύστημα Ubuntu Linux. Γι

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Η εργασία αυτή στοιχειοθετήθηκε με το πρόγραμμα L A TEX. Η συγγραφή έγινε με τη βοήθεια του προγράμματος Kile στο λειτουργικό σύστημα Ubuntu Linux. Γι"

Transcript

1 Ανάλυση παλινδρόμησης με χρήση ποιοτικών ερμηνευτικών μεταβλητών: Διευρεύνηση της επίδρασης του φύλου στις επιδόσεις μαθητών του γυμνασίου Ο.Ι. Μαλλή Διατμηματικό Π.Μ.Σ. Μαθηματικά των Υπολογιστών και των Αποφάσεων Πανεπιστήμιο Πατρών Διπλωματική Εργασία Επιβλέπων: Φ. Αλεβίζος 1

2 Η εργασία αυτή στοιχειοθετήθηκε με το πρόγραμμα L A TEX. Η συγγραφή έγινε με τη βοήθεια του προγράμματος Kile στο λειτουργικό σύστημα Ubuntu Linux. Για την ανάπτυξη των προγραμμάτων χρησιμοποιήθηκε η γλώσσα προγραμματισμού R. Οι γραφικές παραστάσεις έγιναν με τη βοήθεια των προγραμμάτων R και Libreoffice. 2

3 Περιεχόμενα 1 Ανάλυση παλινδρόμησης Το κλασσικό γραμμικό μοντέλο Περιγραφή του μοντέλου με μήτρες Εξίσωση παλινδρόμησης Η μέθοδος των ελαχίστων τετραγώνων Γραμμική συσχέτιση Ποιοτικές ερμηνευτικές μεταβλητές Διαχρονικές επιδράσεις μεταβολή του σταθερού όρου β Μεταβολή της κλίσης β Μεταβολή του σταθερού όρου β 0 και της κλίσης β Πολυεπίπεδες ψευδομεταβλητές Μεταβολή του σταθερού όρου β Μεταβολή της κλίσης β Μεταβολή του σταθερού όρου β 0 και της κλίσης β Παράδειγμα μοντέλου που περιέχει αλληλεπίδραση Περισσότερες από μια ποιοτικές ερμηνευτικές μεταβλητές Κατά τμήματα γραμμική παλινδρόμηση Περισσότερα από δύο τμήματα στην γραμμή παλινδρόμησης Ασυνέχεια στην συνάρτηση παλινδρόμησης Εφαρμογή των ψευδομεταβλητών στις χρονοσειρές Προβληματισμοί σε σχέση με την χρήση μεταβλητών δεικτών Μεταβλητές δείκτες ενάντια στην χορήγηση κωδικών Μεταβλητές δείκτες ενάντια στις ποσοτικές μεταβλητές Άλλες κωδικοποιήσεις για τις μεταβλητές δείκτες Εξαρτημένη μεταβλητή δείκτης Ελεγχος υποθέσεων Η μηδενική και η εναλλακτική υπόθεση Σφάλματα κατά τον έλεγχο υποθέσεων Ελεγχος για την διαφορά των μέσων τιμών δυο πληθυσμών Στατιστικός έλεγχος του γραμμικού μοντέλου Συντελεστής προσδιορισμού Ελεγχος της υπόθεσης β i = Ελεγχος της υπόθεσης β 1 =... = β k = Ελεγχος της υπόθεσης β h+1 = β h+2 =... = β k = Ελεγχος για τον συντελεστή συσχέτισης Σύγκριση δυο συντελεστών συσχέτισης Σχέση του φύλου του μαθητή με τις επιδόσεις του Ερευνες για τις διαφορές των φύλων Περιγραφή Δεδομένων Σύγκριση των μέσων τιμών Το γραμμικό μοντέλο Εφαρμογή του γραμμικού μοντέλου στα δεδομένα Σχέση επίδοσης στα μαθηματικά με την μέση επίδοση

4 5.5.2 Σχέση επίδοσης στη γλώσσα με την μέση επίδοση Μεταβολή της επίδοσης στα μαθηματικά από την Α στην Γ Γυμνασίου Μεταβολή της επίδοσης στη γλώσσα από την Α στην Γ Γυμνασίου Εφαρμογή της κατά τμήματα γραμμικής παλινδρόμησης Συμπεράσματα 89 Κατάλογος Σχημάτων 1 Μέθοδος των ελαχίστων τετραγώνων Μεταβολή του σταθερού όρου β Μεταβολή της κλίσης β Μεταβολή του σταθερού όρου β 0 και της κλίσης β Μεταβολή του σταθερού όρου β 0 σε καταστάσεις Α, Β, Γ και Δ Ταχύτητα ανταπόκρισης μιας επιχείρησης σε μια καινοτομία σε σχέση με το μέγεθος της Υπαρξη αλληλεπίδρασης μεταξύ του τύπου και του μεγέθους της επιχείρησης Κατά τμήματα γραμμική παλινδρόμηση Ασυνέχεια στην συνάρτηση παλινδρόμησης Κατανομή των δειγματικών μέσων Γραμμή παλινδρόμησης Ŷt = b 0 + b 1 X Κατανομή των δύο φύλων στο δείγμα Μέση τιμή της επίδοσης στα μαθηματικά για κάθε τάξη Μέση τιμή της επίδοσης στην γλώσσα για κάθε τάξη Μέση τιμή της συνολικής επίδοσης για κάθε τάξη Μέση τιμή της επίδοσης στα μαθηματικά για κάθε τάξη αγοριών κοριτσιών Μέση τιμή της επίδοσης στην γλώσσα για κάθε τάξη αγοριών κοριτσιών Μέση τιμή της συνολικής επίδοσης για κάθε τάξη αγοριών κοριτσιών Επίδοση στα μαθηματικά σε σχέση με την συνολική επίδοση για την Α Γυμνασίου Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στα μαθηματικά (Α Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση-επίδοση στα μαθηματικά(β Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση-επίδοση στα μαθηματικά(γ Γυμνασίου) Ευθείες παλινδρόμησης: Μέσος συνολική επίδοση - Μέσος μαθηματικά Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στη γλώσσα (Α Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στη γλώσσα (Β Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στη γλώσσα (Γ Γυμνασίου) Ευθείες παλινδρόμησης: Μέσος συνολική επίδοση - Μέσος γλώσσα 76 4

5 28 Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στα μαθηματικά(διαφορά από την Α στην Γ Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στη γλώσσα(διαφορά από την Α στην Γ Γυμνασίου) Κατά τμήματα γραμμική παλινδρόμηση(μέσος συνολική επίδοσημέσος γλώσσα) Κατά τμήματα γραμμική παλινδρόμηση(μέσος συνολική επίδοσημέσος μαθηματικά) Κατάλογος Πινάκων 1 Συχνότητα χρήσης προϊόντος Κατανομή πιθανοτήτων Σχέση μεταξύ απόφασης και πραγματικής κατάστασης της H Ανάλυση διασποράς Στοιχεία από τις καρτέλες των μαθητών Αποτελέσματα σύγκρισης των μέσων τιμών(μαθηματικά) Αποτελέσματα σύγκρισης των μέσων τιμών(γλώσσα) Αποτελέσματα σύγκρισης των μέσων τιμών(συνολική επίδοση) Αποτελέσματα για τα μαθηματικά της Α Γυμνασίου Αποτελέσματα για τα μαθηματικά της Β Γυμνασίου Αποτελέσματα για τα μαθηματικά της Γ Γυμνασίου Στοιχεία από τις καρτέλες των μαθητών με τους μέσους μαθηματικών και συνολικής επίδοσης Αποτελέσματα για τα μαθηματικά (μέσος όρος Α Β Γ Γυμνασίου) Αποτελέσματα για τη γλώσσα της Α Γυμνασίου Αποτελέσματα για τη γλώσσα της Β Γυμνασίου Αποτελέσματα για τη γλώσσα της Γ Γυμνασίου Αποτελέσματα για τη γλώσσα(μέσος όρος Α Β Γ Γυμνασίου) Αποτελέσματα σύγκρισης των μέσων τιμών(μεταβολή της επίδοσης στα μαθηματικά από την Α στην Γ Γυμνασίου) Αποτελέσματα για την μεταβολή της επίδοσης στα μαθηματικά από την Α στην Γ Γυμνασίου Αποτελέσματα έλεγχου για τον συντελεστή συσχέτισης (μεταβολή της επίδοσης στα μαθηματικά από την Α στην Γ Γυμνασίου) Αποτελέσματα σύγκρισης των μέσων τιμών(μεταβολή της επίδοσης στη γλώσσα από την Α στην Γ Γυμνασίου) Αποτελέσματα για την μεταβολή της επίδοσης στη γλώσσα από την Α στην Γ Γυμνασίου Αποτελέσματα έλεγχου για τον συντελεστή συσχέτισης (μεταβολή της επίδοσης στη γλώσσα από την Α στην Γ Γυμνασίου) Αποτελέσματα κατά τμήματα γραμμικής παλινδρόμησης (μέσος συνολική επίδοση-μέσος μαθηματικά) Αποτελέσματα κατά τμήματα γραμμικής παλινδρόμησης (μέσος συνολική επίδοση-μέσος γλώσσα)

6 Ευχαριστίες Θα ήθελα να ευχαριστήσω θερμά τον καθηγητή μου κ.φίλιππο Αλεβίζο για την καθοδήγηση του, χάρη στην οποία ολοκλήρωσα την εργασία αυτή και είχα την ευκαιρία να ασχοληθώ με ένα θέμα σύμφωνο με τα επαγγελματικά μου ενδιαφέροντα. Ευχαριστώ επίσης τα μέλη της τριμελούς επιτροπής κ.ευτύχιο Παπαδοπετράκη και κ.κωνσταντίνο Πετρόπουλο. Ενα ιδιαίτερο ευχαριστώ στον διευθυντή του σχολείου από όπου άντλησα τα δεδομένα που χρησιμοποίησα στην παρούσα εργασία. Τέλος θα ήθελα να ευχαριστήσω την οικογένειά μου για την συμπαράσταση που μου προσέφερε κατά την διάρκεια της εκπόνησης της εργασίας μου. Ουρανία Μαλλή Πάτρα, Σεπτέμβριος

7 Περίληψη Σε πολλά προβλήματα υπάρχει η ανάγκη να ασχοληθούμε ταυτόχρονα με την μελέτη δύο μεταβλητών ώστε να δούμε αν υπάρχει αλληλεξάρτηση μεταξύ τους, καθώς και να εντοπίσουμε την σχέση που εκφράζει αυτήν την αλληλεξάρτηση. Η σχέση αυτή ονομάζεται εξίσωση παλινδρόμησης και περιγράφει τον τρόπο αλληλεξάρτησης των μεταβλητών, τον κανόνα δηλαδή που διαμορφώνει τις τιμές της μιας μεταβλητής από τις τιμές της άλλης. Η πρώτη θα ονομάζεται ανεξάρτητη (ερμηνευτική) και η δεύτερη που οι τιμές της θα καθορίζονται από αυτές της πρώτης εξαρτημένη(ερμηνευόμενη). Κάποιες φορές οι ερμηνευτικές μεταβλητές που χρησιμοποιούμε είναι ποιοτικές και υπάρχουν τρόποι ποσοτικού προσδιορισμού των κατηγοριών μιας ποιοτικής μεταβλητής. Η μελέτη αυτή έχει ως στόχο την διερεύνηση της σχέσης του φύλου του μαθητή με τις επιδόσεις του στα μαθηματικά, ώστε να αναλυθούν οι διαφορές που εμφανίζονται μεταξύ των δυο φύλων. Για τον σκοπό αυτό θα χρησιμοποιηθούν γραμμικά μοντέλα, όπου όμως η ερμηνευτική μεταβλητή(το φύλο) είναι ποιοτική. Θα γίνει ποσοτικός προσδιορισμός των κατηγοριών της με την χρήση δύο τιμών: 0 αν είναι κορίτσι, 1 αν είναι αγόρι. Ο πληθυσμός της έρευνας αποτελείται από μαθητές γυμνασίου της ορεινής Αχαΐας που άρχισαν και τελείωσαν το γυμνάσιο στο συγκεκριμένο σχολείο. Για κάθε μαθητή έχει καταγραφεί από την καρτέλα του για κάθε τάξη η επίδοση στα μαθηματικά, στη γλώσσα, η συνολική επίδοση και το φύλο. 7

8 1 Ανάλυση παλινδρόμησης Ιστορικά ο όρος παλινδρόμηση(regression) χρησιμοποιήθηκε για πρώτη φορά το 1877 από τον Άγγλο ανθρωπολόγο SirF rancisgalton( ), ο οποίος μελετώντας τη σχέση μεταξύ των αναστημάτων γονέων και παιδιών παρατήρησε ένα είδος επαναφοράς (παλινδρόμησης) των αναστημάτων των παιδιών στα αναστήματα των γονέων τους. Με την ανάλυση παλινδρόμησης εξετάζουμε τη σχέση μεταξύ δύο ή περισσοτέρων μεταβλητών για να προσδιορίσουμε με ποιόν τρόπο οι μεταβλητές αυτές σχετίζονται μεταξύ τους. Στόχος μας είναι να προβλέψουμε τις τιμές της μιας μέσω των τιμών της άλλης ή των άλλων. Διακρίνουμε δύο είδη μεταβλητών: τις ανεξάρτητες και τις εξαρτημένες. Η ύπαρξη συναρτησιακής σχέσης που περιγράφει τον τρόπο αλληλεξάρτησης μεταξύ των μεταβλητών μπορεί να είναι εξαιρετικά πολύτιμη για την πρόβλεψη των τιμών μιας μεταβλητής από τις γνώσεις που διαθέτουμε για άλλες μεταβλητές υπό κάποιες συγκεκριμένες συνθήκες. Ας θεωρήσουμε δύο μεταβλητές X, Y. Αν οι μεταβλητές αυτές συνδέονται με μια σχέση της μορφής Y = f(x) μέσω της οποίας για κάθε τιμή της X μπορούμε να προβλέψουμε ακριβώς την τιμή της Y, δηλαδή αν οι τιμές της Y δεν υπόκεινται σε σφάλματα, τότε λέμε ότι οι δύο μεταβλητές συνδέονται με τη συναρτησιακήπροσδιοριστική(deterministic) σχέση Y = f(x). Σε αυτή την περίπτωση τα σημεία του διαγράμματος διασποράς βρίσκονται όλα πάνω στην καμπύλη που έχει εξίσωση Y = f(x) και όσες φορές και αν επαναλάβουμε το πείραμα θέτοντας X = x i, θα παίρνουμε πάντα την ίδια τιμή για το Y. Οι μη προσδιοριστικές σχέσεις μεταξύ μεταβλητών ονομάζονται στοχαστικές, στατιστικές (stochastic, probabilistic) σχέσεις. Στην περίπτωση αυτή, αν X είναι η ανεξάρτητη και Y η εξαρτημένη μεταβλητή, η U βρίσκεται σε στοχαστική σχέση-εξάρτηση από τη X, γιατί επηρεάζεται και από άλλους παράγοντες. Στην περίπτωση αυτή, αν επαναλάβουμε το πείραμα πολλές φορές θέτοντας Q = x i τότε στην τιμή x i της X δεν αντιστοιχεί μια μόνο τιμή y i της Y αλλά γενικά αντιστοιχεί ένα πλήθος διαφορετικών τιμών της Y. Σε μια στοχαστική σχέση το διάγραμμα διασποράς είναι γενικά ένα νέφος σημείων το οποίο πολλές φορές καθορίζει μια ιδεατή γραμμή η οποία δίνει μια πρώτη εικόνα της σχέσης που συνδέει τις δύο μεταβλητές. 1.1 Το κλασσικό γραμμικό μοντέλο Στο κλασσικό γραμμικό μοντέλο ασχολούμαστε με την μελέτη δυο μεταβλητών X ανεξάρτητη-ερμηνευτική και Y εξαρτημένη - ερμηνευόμενη και ψάχνω μια συναρτησιακή σχέση Y = f(x). Το X όμως δεν είναι ο μόνος παράγοντας που καθορίζει την τιμή του Y. Ετσι το μοντέλο γίνεται στοχαστικό με την εισαγωγή τυχαίου παράγοντα ε. και η σχέση γίνεται Y = f(x) + ε. Στην γενική μορφή με K ερμηνευτικές μεταβλητές και T παρατηρήσεις οι υποθέσεις είναι: όπου Y i = β 0 + β 1 X i1 + β 2 X i β K X ik + ε i E(ε i ) = 0, i = 1,..., T 8

9 V ar(ε i ) = σ 2, i = 1,..., T Ανά δύο είναι γραμμικά ασυσχέτιστες Cov(ε i, ε j ) i j ε i N(0, σ 2 ) i = 1,..., T 1.2 Περιγραφή του μοντέλου με μήτρες Η σχέση του γραμμικού μοντέλου μπορεί να γραφτεί Y i = β 0 X i0 + β 1 X i1 + β 2 X i β K X ik + ε i όπου X i0 = 1 i = 1,..., T, οπότε σε ένα δείγμα T παρατηρήσεων έχουμε το σύστημα: Y 1 = β 0 X 10 + β 1 X 11 + β 2 X β K X 1K + ε 1 Y 2 = β 0 X 20 + β 1 X 21 + β 2 X β K X 2K + ε 2... Y T = β 0 X T 0 + β 1 X T 1 + β 2 X T β K X T K + ε T Με τη χρήση μητρών το σύστημα μπορεί να γραφτεί: Y 1 β Y 2 1 X 11 X 12 X 0 ε 1 1K... = β ε X T 1 X T 2 X T K ή Y T Y = Xβ + ε β K και οι υποθέσεις του γραμμικού μοντέλου διατυπώνονται: E(ε) = 0 ε T E(εε ) = σ 2 I 1.3 Εξίσωση παλινδρόμησης Το X είναι αριθμητική μεταβλητή, σταθερά. Τα β 0 και β 1 άγνωστες παράμετροι αλλά σταθερές, το ε i τυχαία μεταβλητή και οι υποθέσεις του περνάνε στο Y, άρα είναι και αυτό τυχαία μεταβλητή. Για δεδομένη τιμή λοιπόν του X δεν υπάρχει μοναδική τιμή του Y αλλά κατανομή. Για την μέση τιμή και την διακύμανση έχουμε: E(Y i ) = E(β 0 + β 1 X i + ε i ) = E(β 0 ) + E(β 1 X i ) + E(ε i ) = β 0 + β 1 X i 9

10 V ar(y i ) = E(Y i EY i ) 2 = E(β 0 + β 1 X i + ε i β 0 β 1 X i ) 2 = E(ε i ) 2 = σ 2 Άρα Y i (β 0 + β 1 X i, σ 2 ) Η πληθυσμιακή εξίσωση παλινδρόμησης είναι: E(Y i ) = β 0 + β 1 X i ενώ ο τυχαίος παράγοντας ε i διαμορφώνει την τιμή του: Y i = E(Y i ) + ε i Χωρίς όμως τις τιμές των παραμέτρων β 0 και β 1 δεν μπορούμε να γνωρίζουμε την πληθυσμιακή εξίσωση παλινδρόμησης, οπότε θα εκτιμήσουμε τις τιμές τους μέσα από δείγμα παρατηρήσεων των μεταβλητών X και Y. Αν οι εκτιμητές τους είναι αντίστοιχα b 0 και b 1 τότε έχουμε την δειγματική εξίσωση παλινδρόμησης (sample regression line) Ŷ = b 0 + b 1 X i όπου Ŷ είναι η τιμή της Y που υπολογίζουμε από την δειγματική εξίσωση παλινδρόμησης Η διαφορά μεταξύ των δύο τιμών ονομάζεται κατάλοιπο(residual) e i = Y i Ŷi και λειτουργεί ως εκτιμητής του τυχαίου παράγοντα ε i. 1.4 Η μέθοδος των ελαχίστων τετραγώνων Μέσα από το πλήθος των δυνατών εκτιμήσεων των παραμέτρων β 0 και β 1 πρέπει να επιλέξουμε. Η μέθοδος των ελαχίστων τετραγώνων προκρίνει αυτούς που σε ένα δείγμα από k παρατηρήσεις X, Y ελαχιστοποιούν την συνάρτηση (e 2 i ). Συνίσταται δηλαδή στον προσδιορισμό των παραμέτρων β 0 και β 1 ώστε να ελαχιστοποιείται το άθροισμα των τετραγώνων των κατακόρυφων αποστάσεων των σημείων x, y από την ευθεία Ŷ = b 0 + b 1 X i, όπως φαίνεται και στο σχήμα 1. Η ελαχιστοποίηση της (e 2 i ) ως συνάρτηση των b 0 και b 1 οδηγεί σε ένα ομογενές σύστημα δυο εξισώσεων με δυο αγνώστους και έτσι έχουμε τις κανονικές εξισώσεις: (Yi ) = kb 0 + b 1 (Xi ) (Yi X i ) = b 0 (Xi ) + b 1 (X 2 i ) που όταν λυθεί το σύστημα δίνει τους εκτιμητές: (Xi X)(Y i Y ) b 1 = (Xi X) 2 b 0 = Y b 1 X Η γενική μορφή του γραμμικού μοντέλου 10

11 Y Ŷ t =b 0 +b 1 X t e t Y t Ŷ t Y t X t X Σχήμα 1: Μέθοδος των ελαχίστων τετραγώνων όπου Y i = β 0 X i0 + β 1 X i1 + β 2 X i β K X ik + ε i X i0 = 1 i = 1,..., T σε ένα δείγμα T παρατηρήσεων μπορεί να γραφτεί με μήτρες και οι κανονικές εξισώσεις θα έχουν την μορφή: (X X)b = X Y ενώ οι εκτιμητές ελαχίστων τετραγώνων δίνονται από την σχέση b = (X X) 1 X Y όπου T (X1 )... (XK ) X X = (X1 ) (X 2 1 )... (X1 X K ) (XK ) (X1 X K )... (X 2 K ) b 0 b = b 1... b K 11

12 Αφού για τα κατάλοιπα ισχύει ότι: (Y ) X Y = (Y X1 )... (Y XK ) e i = Y i Ŷi οι τιμές τους σε μορφή πίνακα θα δίνεται από τον τύπο: όπου e = Y Ŷ Ŷ = Xb 1.5 Γραμμική συσχέτιση Ŷ 1 Ŷ = Ŷ2... ˆ Y T e 0 e = e 1... Οταν τα σημεία στο διάγραμμα διασποράς δύο μεταβλητών βρίσκονται γύρω α- πό μια ευθεία έχουν γραμμική συσχέτιση(linear correlation) Η ευθεία γύρω από την οποία συγκεντρώνονται τα σημεία του διαγράμματος διασποράς λέγεται ευθεία παλινδρόμησης(regression line). Δυο μεταβλητές λέγονται θετικά συσχετισμένες όταν η αύξηση των τιμών της μιας συνεπάγεται αύξηση των τιμών της άλλης, ενώ αρνητικά συσχετισμένες όταν η αύξηση των τιμών της μιας συνεπάγεται μείωση των τιμών της άλλης. Είναι απαραίτητη η χρήση μέτρου για τον βαθμό συσχέτισης μεταξύ των μεταβλητών, έναν αριθμό που ονομάζεται συντελεστές συσχέτισης (correlation coefficient). Για δύο μεταβλητές X και Y μέτρο της γραμμικής συσχέτισης τους είναι ο καθαρός αριθμός που δίνεται από τον τύπο r = cov(x, Y )/s x s y και μεταβάλλεται από -1 έως +1. Ονομάζεται συντελεστής Pearson και όταν έ- χουμε τέλεια θετική συσχέτιση παίρνει την τιμή +1 ενώ στην τέλεια αρνητική την τιμή -1. Στην περίπτωση που δεν υπάρχει συσχέτιση ισχύει ότι r = 0. e T 12

13 2 Ποιοτικές ερμηνευτικές μεταβλητές Σε πολλά προβλήματα οι εμπλεκόμενες μεταβλητές είναι ποιοτικές, όπως το φύλο, το χρώμα ή μια κατάσταση. Ενας σοβαρός περιορισμός της γραμμικής παλινδρόμησης είναι ότι οι εμπλεκόμενες μεταβλητές είναι ποσοτικές. Ο περιορισμός αυτός μπορεί να αρθεί και να εισαχθούν οι ποιοτικές μεταβλητές στο γραμμικό μοντέλο μέσω της χρήσης ψευδομεταβλητών (dummy variables), που αριθμητικοποιούν τα ποιοτικά χαρακτηριστικά. Εστω ότι μας ενδιαφέρει να μελετήσουμε την επίδραση της ποιοτικής μεταβλητής φύλο στην ποσοτική σχολική επίδοση Αντιστοιχίζουμε λοιπόν την μεταβλητή φύλο σε δυο διαφορετικά και αμοιβαίως αποκλειόμενα επίπεδα για να λάβουμε υπόψιν μας ότι τα διαφορετικά αυτά επίπεδα επιδρούν με διαφορετικό τρόπο στην εξαρτημένη μεταβλητή σχολική επίδοση. Συνήθως για να ορίσουμε μια ψευδομεταβλητή χρησιμοποιούμε μια μεταβλητή δείκτη (indicator variable) με τιμές 0 ή 1. Ετσι μας δείχνει σε ποια από τις δύο προκαθορισμένες κατηγορίες της ποιοτικής μεταβλητής ανήκει η παρατήρηση. Οταν θέλουμε να ποσοτικοποιήσουμε μια ποιοτική μεταβλητή που παίρνει τιμές σε περισσότερες από δύο προκαθορισμένες κατηγορίες, έστω με n κατηγορίες. Τότε χρειαζόμαστε n 1 ψευδομεταβλητές. Στην περίπτωση της ποιοτικής μεταβλητής φύλο η δίτιμη ψευδομεταβλητή έχει την μορφή: { 1 για άνδρα X = 0 για γυναίκα Αυτή η έκφραση είναι αυθαίρετη και δεν θα είχε κάποια διαφορά στο αποτέλεσμα αν η ποσοτικοποίηση της ποιοτικής μεταβλητής φύλο γινόταν με ψευδομεταβλητή που θα είχε την μορφή: { 1 για άνδρα X = 1 για γυναίκα Στην περίπτωση της ποιοτικής μεταβλητής με n κατηγορίες αυτή που μένει ονομάζεται κατηγορία αναφοράς. Στο παράδειγμα μας κατηγορία αναφοράς είναι αυτή των γυναικών. Αν είχαμε ως ποιοτική μεταβλητή το χρώμα με τρεις κατηγορίες, κόκκινο, κίτρινο, μπλε θα χρειαζόμασταν δύο ψευδομεταβλητές: { 1 κόκκινο X 1 = 0 αλλιώς και X 2 = { 1 κίτρινο 0 αλλιώς οπότε όταν X 1 = X 2 = 0 θα ανήκει η παρατήρηση στην κατηγορία μπλε που θα είναι και η κατηγορία αναφοράς Συχνά χρησιμοποιούμε τις ψευδομεταβλητές για να φτιάξουμε μοντέλα για τις κατηγορίες της ποιοτικής μεταβλητής και στη συνέχεια να τα συγκρίνουμε. Στην περίπτωση που οι ψευδομεταβλητές έχουν δύο κατηγορίες ονομάζονται δίτιμες, ενώ αν έχουν περισσότερες πολυεπίπεδες. Για τις ποιοτικές μεταβλητές οι έλεγχοι υποθέσεων που γίνονται έχουν ως στόχο να διερευνηθεί η σχέση ποσοτικής - ποιοτικής μεταβλητής και δεν επηρεάζονται από τον αυθαίρετο ορισμό των ψευδομεταβλητών. Ωστόσο χρειάζεται προσοχή στην ερμηνεία των αποτελεσμάτων με γνώμονα πάντα την εκάστοτε ποσοτικοποίηση της ποιοτικής μεταβλητής. 13

14 2.1 Διαχρονικές επιδράσεις Μια συνηθισμένη εφαρμογή των ψευδομεταβλητών είναι για την ανάλυση των διαχρονικών επιδράσεων Εστω η εξαρτημένη μεταβλητή Y που θέλω να την μελετήσω για ένα χρονικό διάστημα το οποίο όμως είναι ποιοτική μεταβλητή που παίρνει τιμές δυο διαφορετικές καταστάσεις, Α και Β. Οπότε για την εκτίμηση του Y λαμβάνω υπόψιν αν το χρονικό διάστημα ανήκει στην κατάσταση Α ή Β. Στην περίπτωση που εκτός από το χρονικό διάστημα υπάρχει και ανεξάρτητη ποσοτική μεταβλητή X 1 για να λύσουμε το πρόβλημα θα έπρεπε να εκτιμήσουμε δυο γραμμικά μοντέλα, ένα για κάθε χρονικό διάστημα. κατάσταση Α : Y i = β 0 + β 1 X i1 + ε i κατάσταση Β : Y i = β 0 + β 1X i1 + ε i Η μεταβολή από την μια κατάσταση στην άλλη μπορεί να αναφέρεται στον σταθερό όρο β 0, στην κλίση β 1 ή και στα δύο μεταβολή του σταθερού όρου β 0 Στην περίπτωση που έχω μεταβολή μόνο στον σταθερό όρο β 0 το διπλό μοντέλο θα διαμορφώνεται: κατάσταση Α : Y i = β 0 + β 1 X i1 + ε i κατάσταση Β : Y i = β 0 + β 1 X i1 + ε i Εναλλακτικά του διπλού μοντέλου αν γίνει χρήση ψευδομεταβλητής για την ποιοτική μεταβλητή X 2 που ορίζεται ως εξής: { 1 κατάσταση Α X 2 = 0 κατάσταση Β το μοντέλο απλοποιείται και γίνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + ε i κατάσταση Α με X 2 = 1: Y i = β 0 + β 2 + β 1 X i1 + ε i κατάσταση Β με X 2 = 0: Y i = β 0 + β 1 X i1 + ε i Ο συντελεστής β 2 της ψευδομεταβλητής X 2 παριστάνει την διαφορά του σταθερού όρου ανάμεσα στις καταστάσεις Α και Β (βλέπε σχήμα 2). Οι παράλληλες ευθείες δείχνουν ότι η επιμέρους επίδραση κάθε ανεξάρτητης μεταβλητής είναι ίδια ανεξάρτητα από την συγκεκριμένη τιμή στην οποία η άλλη ανεξάρτητη μεταβλητή παραμένει σταθερή. Στην συνέχεια προχωράμε σε έλεγχο υποθέσεων για το αν πραγματικά η Y επηρεάζεται από την κατάσταση Α ή Β. Αυτό σημαίνει έλεγχο σημαντικότητας για τον συντελεστή β 2 της ψευδομεταβλητής X 2 ως εξής: H 0 : β 2 = 0 H 1 : β 2 0 Αν β 2 = 0 τότε οι δυο ευθείες είναι ταυτιζόμενες και κάτι τέτοιο σημαίνει ότι δεν υπάρχει στατιστικά σημαντική διαφορά εξαιτίας των καταστάσεων Α και Β. 14

15 Y E(Y )=β 0 +β 2 +β 1 X 1 Κατάσταση Α Κατάσταση Β β 2 E(Y )=β 0 +β 1 X 1 X 1 Σχήμα 2: Μεταβολή του σταθερού όρου β Μεταβολή της κλίσης β 1 Στην περίπτωση που έχω μεταβολή μόνο της κλίσης β 1 το διπλό μοντέλο θα διαμορφώνεται: κατάσταση Α : Y i = β 0 + β 1 X i1 + ε i κατάσταση Β : Y i = β 0 + β 1X i1 + ε i Αντί για το διπλό μοντέλο μπορεί να γίνει χρήση της της μεταβλητής X 1 X 2 που είναι γινόμενο της ποσοτικής μεταβλητής X 1 και της ψευδομεταβλητής X 2 και λέγεται πολλαπλασιαστική ψευδομεταβλητή (multiplicative dummy variable). { 1 κατάσταση Α X 2 = 0 κατάσταση Β οπότε κατά συνέπεια θα έχει τιμές { X1 κατάσταση Α X 1 X 2 = 0 κατάσταση Β το μοντέλο απλοποιείται και γίνεται : κατάσταση Α με X 1 X 2 = X 1 : Y i = β 0 + β 1 X i1 + β 2 X 1i X i2 + ε i Y i = β 0 + β 1 X i1 + β 2 X i2 + ε i = β 0 + (β 1 + β 2 )X i1 + ε i 15

16 κατάσταση Β με X 1 X 2 = 0: Y i = β 0 + β 1 X i1 + ε i Ο συντελεστής β 2 της ψευδομεταβλητής X 1 X 2 παριστάνει την διαφορά της κλίσης ανάμεσα στις καταστάσεις Α και Β (σχήμα 3). Y E(Y )=β 0 +(β 1 + β 2 ) X 1 Κατάσταση Α Κατάσταση Β β 0 E(Y )=β 0 +β 1 X 1 X 1 Σχήμα 3: Μεταβολή της κλίσης β 1 Στην συνέχεια προχωράμε σε έλεγχο υποθέσεων για το αν πραγματικά η Y επηρεάζεται από την κατάσταση Α ή Β. Αυτό σημαίνει έλεγχο σημαντικότητας για τον συντελεστή β 2 της ψευδομεταβλητής X 1 X 2 ως εξής: H 0 : β 2 = 0 H 1 : β 2 0 Αν β 2 = 0 τότε οι δυο ευθείες είναι ταυτιζόμενες και κάτι τέτοιο σημαίνει ότι δεν υπάρχει στατιστικά σημαντική διαφορά εξαιτίας των καταστάσεων Α και Β Μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 Στην περίπτωση που έχω μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 το μοντέλο θα διαμορφώνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i1 X i2 + ε i οπότε για τις δυο περιπτώσεις αφού η ποιοτική μεταβλητή X 2 παίρνει τιμές: 16

17 θα έχω: { 1 κατάσταση Α X 2 = 0 κατάσταση Β κατάσταση Α με X 2 = 1: Y i = β 0 + β 1 X i1 + β 2 + β 3 X i1 + ε i = (β 0 + β 2 ) + (β 1 + β 3 )X i1 + ε i κατάσταση Β με X 2 = 0: Y i = β 0 + β 1 X i1 + ε i (σχήμα 4) Y E(Y )=( β 0 +β 2 )+(β 1 +β 3 ) X 1 Κατάσταση Α Κατάσταση Β β 2 E(Y )=β 0 +β 1 X 1 X 1 Σχήμα 4: Μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 Στην συνέχεια προχωράμε σε διπλό έλεγχο υποθέσεων για το αν πραγματικά η Y επηρεάζεται από την κατάσταση Α ή Β. Αυτό σημαίνει: t-έλεγχο για τον συντελεστή β 3 της ψευδομεταβλητής X 1 X 2 ως εξής: H 0 : β 2 = 0 H 1 : β 2 0 και F -έλεγχο για τους συντελεστές β 2 και β 3 : H 0 : β 2 = β 3 = 0 H 1 : β 2 0 ή β

18 2.2 Πολυεπίπεδες ψευδομεταβλητές Οταν θέλουμε να ποσοτικοποιήσουμε μια ποιοτική μεταβλητή που παίρνει τιμές σε περισσότερες από δύο προκαθορισμένες κατηγορίες, έστω με n κατηγορίες, τότε χρειαζόμαστε n 1 ψευδομεταβλητές. Εστω ότι έχω το μοντέλο : Y i = β 0 + β 1 X i1 + ε i όπου το Y είναι συνάρτηση της ποσοτικής ερμηνευτικής μεταβλητής X 1 και οι παρατηρήσεις μου αναφέρονται σε τέσσερις διαφορετικές καταστάσεις Α, Β, Γ και Δ Μεταβολή του σταθερού όρου β 0 Αν επηρεάζεται μόνο ο σταθερός όρος θα χρειαστώ τρεις ψευδομεταβλητές και αν επιλέξω ως κατηγορία αναφοράς την κατάσταση Δ θα οριστούν ως εξής: { 1 κατάσταση Α X 2 = 0 αλλιώς { 1 κατάσταση Β X 3 = 0 αλλιώς { 1 κατάσταση Γ X 4 = 0 αλλιώς και προφανώς όταν X 2 = X 3 = X 4 = 0 σημαίνει ότι η παρατήρηση ανήκει στην κατάσταση Δ. Με την χρήση των ψευδομεταβλητών το μοντέλο γράφεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i3 + β 4 X i4 + ε i και στις τέσσερις διαφορετικές καταστάσεις θα έχω: κατάσταση Α με X 2 = 1 και X 3 = X 4 = 0:Y i = β 0 + β 1 X i1 + β 2 + ε i κατάσταση Β με X 3 = 1 και X 2 = X 4 = 0:Y i = β 0 + β 1 X i1 + β 3 + ε i κατάσταση Γ με X 4 = 1 και X 2 = X 3 = 0:Y i = β 0 + β 1 X i1 + β 4 + ε i κατάσταση Δ με X 2 = X 3 = X 4 = 0:Y i = β 0 + β 1 X i1 + ε i (σχήμα 5) Ο σταθερός όρος β 0 αντιστοιχεί στον σταθερό όρο της κατάστασης Δ, ενώ οι συντελεστές των ψευδομεταβλητών β 2, β 3 και β 4 αντιστοιχούν στην διαφορά ανάμεσα στον σταθερό όρο της κατάστασης Δ και στον σταθερό όρο των καταστάσεων Α, Β και Γ αντίστοιχα. Θα κάνουμε F -έλεγχο για τους συντελεστές β 2, β 3 και β 4 H 0 : β 2 = β 3 = β 4 = 0 H 1 : β 2 0 ή β 3 0 ή β

19 Y E(Y )=( β 0 +β 4 )+β 1 X 1 Κατάσταση Γ Κατάσταση Β E(Y )=( β 0 +β 3 )+ β 1 X 1 Κατάσταση Δ β 3 β 4 E(Y )=β 0 +β 1 X 1 Κατάσταση Α β 2 β 0 E(Y )=( β 0 +β 2 )+ β 1 X 1 X 1 Σχήμα 5: Μεταβολή του σταθερού όρου β 0 σε καταστάσεις Α, Β, Γ και Δ Μεταβολή της κλίσης β 1 Μπορεί να γίνει χρήση των μεταβλητών X 1 X 2, X 1 X 3, X 1 X 4 που είναι γινόμενο της ποσοτικής μεταβλητής X 1 και των ψευδομεταβλητών X 2, X 3 και X 4 αντίστοιχα(πολλαπλασιαστική ψευδομεταβλητή). { 1 κατάσταση Α X 2 = 0 αλλιώς { 1 κατάσταση Β X 3 = 0 αλλιώς { 1 κατάσταση Γ X 4 = 0 αλλιώς οπότε κατά συνέπεια οι πολλαπλασιαστικές ψευδομεταβλητές θα έχουν τιμές: { X1 κατάσταση Α X 1 X 2 = 0 αλλιώς { X1 κατάσταση Β X 1 X 3 = 0 αλλιώς το μοντέλο γίνεται : X 1 X 4 = { X1 κατάσταση Γ 0 αλλιώς 19

20 Y i = β 0 + β 1 X i1 + β 2 X 1i X i2 + β 3 X i1 X i3 + β 4 X i1 X i4 + ε i κατάσταση Α με X 1 X 2 = X 1 : Y i = β 0 + β 1 X i1 + β 2 X i1 + ε i = β 0 + (β 1 + β 2 )X i1 + ε i κατάσταση Β με X 1 X 3 = X 1 : Y i = β 0 + β 1 X i1 + β 3 X i1 + ε i = β 0 + (β 1 + β 3 )X i1 + ε i κατάσταση Γ με X 1 X 4 = X 1 : Y i = β 0 + β 1 X i1 + β 4 X i1 + ε i = β 0 + (β 1 + β 4 )X i1 + ε i κατάσταση Δ με X 1 X 2 = X 1 X 3 = X 1 X 4 = 0: Y i = β 0 + β 1 X i1 + ε i Οι συντελεστές β 2, β 3 και β 4 των ψευδομεταβλητών X 1 X 2, X 1 X 3 και X 1 X 4 αντίστοιχα παριστάνουν την διαφορά της κλίσης ανάμεσα στις καταστάσεις Α, Β, Γ και Δ Μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 Στην περίπτωση που έχω μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 το μοντέλο θα διαμορφώνεται: Y i = β 0 +β 1 X i1 +β 2 X i2 +β 3 X i3 +β 4 X i4 +β 5 X i1 X i2 +β 6 X i1 X i3 +β 7 X i1 X i4 +ε i οπότε για τις τέσσερις περιπτώσεις αφού η ποιοτικές μεταβλητές X 2, X 3 και X 4 παίρνουν τιμές: { 1 κατάσταση Α X 2 = 0 αλλιώς { 1 κατάσταση Β X 3 = 0 αλλιώς { 1 κατάσταση Γ X 4 = 0 αλλιώς οπότε κατά συνέπεια οι πολλαπλασιαστικές ψευδομεταβλητές θα έχουν τιμές: { X1 κατάσταση Α X 1 X 2 = 0 αλλιώς { X1 κατάσταση Β X 1 X 3 = 0 αλλιώς θα έχω : X 1 X 4 = { X1 κατάσταση Γ 0 αλλιώς κατάσταση Α με X 2 = 1: Y i = β 0 + β 1 X i1 + β 2 + β 5 X i1 + ε i = (β 0 + β 2 ) + (β 1 + β 5 )X i1 + ε i 20

21 κατάσταση Β με X 3 = 1: Y i = β 0 + β 1 X i1 + β 3 + β 6 X i1 + ε i = (β 0 + β 3 ) + (β 1 + β 6 )X i1 + ε i κατάσταση Γ με X 4 = 1: Y i = β 0 + β 1 X i1 + β 4 + β 7 X i1 + ε i = (β 0 + β 4 ) + (β 1 + β 7 )X i1 + ε i κατάσταση Δ με X 2 = X 3 = X 4 = 0: Y i = β 0 + β 1 X i1 + ε i 2.3 Παράδειγμα μοντέλου που περιέχει αλληλεπίδραση Ενα μοντέλο παλινδρόμησης με ψευδομεταβλητές μπορεί να λάβει υπόψιν του αλληλεπιδράσεις μεταξύ ποσοτικών και ποιοτικών μεταβλητών. Ο όρος αλληλεπίδρασης ορίζεται από το γινόμενο των τιμών των μεταβλητών που ελέγχουμε για το ενδεχόμενο της αλληλεπίδρασης. Ο όρος αλληλεπίδραση αναφέρεται στην συνδυασμένη επιρροή που ασκούν στην εξαρτημένη μεταβλητή και όχι απαραίτητα στην μεταξύ τους σχέση. Παράδειγμα: Ενας οικονομολόγος θέλει να μελετήσει την ταχύτητα ανταπόκρισης μιας επιχείρησης σε μια καινοτομία σε σχέση με το μέγεθος και τον τύπο της. εξαρτημένη μεταβλητή Y = ταχύτητα ανταπόκρισης σε μήνες πρώτη ανεξάρτητη μεταβλητή, ποσοτική X 1 = μέγεθος της εταιρείας (μετριέται από το σύνολο του ενεργητικού σε χιλιάδες δολάρια) δεύτερη ανεξάρτητη μεταβλητή, ποιοτική X 2 = ο τύπος της επιχείρησης με δυο κατηγορίες, μετοχικών και αμοιβαίων Προκειμένου η ποιοτική αυτή μεταβλητή να χρησιμοποιηθεί σε ένα μοντέλο παλινδρόμησης θα χρησιμοποιηθούν ποσοτικοί δείκτες για τις κατηγορίες της. Υπάρχουν αρκετοί τρόποι για τον ποσοτικό προσδιορισμό των κατηγοριών μιας ποιοτικής μεταβλητής. Στην περίπτωση μας θα χρησιμοποιήσουμε μεταβλητή δείκτη (indicator variable) με τιμές 0 ή 1. Η μεταβλητή δείκτης είναι εύκολη στην χρήση και ευρέως διαδεδομένη αλλά δεν είναι ο μοναδικός τρόπος ποσοτικοποίησης μιας ποιοτικής μεταβλητής. Αναμένουμε ότι υπάρχει αλληλεπίδραση μεταξύ του μεγέθους της εταιρίας και του τύπου της οπότε το μοντέλο διαμορφώνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i1 X i2 + ε i με X 1 = μέγεθος της εταιρείας και { 1 μετοχικών X 2 = 0 αμοιβαίων η αναμενόμενη τιμή είναι: E(Y ) = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 1 X 2 Η έννοια των παραμέτρων παλινδρόμησης στην αναμενόμενη τιμή μπορεί να κατανοηθεί καλύτερα με την εξέταση της φύσης της για κάθε τύπο επιχείρησης. Η αναμενόμενη τιμή για καθένα από τους δυο τύπους επιχείρησης θα είναι: 21

22 E(Y ) = β 0 + β 1 X 1 + β 2 + β 3 X 1 = (β 0 + β 2 ) + (β 1 + β 3 )X 1 για μετοχικών E(Y ) = β 0 + β 1 X 1 για αμοιβαίων Y Ταχύτητα ανταπόκρισης σε μήνες E(Y )=( β 0 +β 2 )+(β 1 +β 3 ) X 1 μετοχικών β 2 β 0 E(Y )=β 0 +β 1 X 1 αμοιβαίων β 0 + β 2 Μέγεθος της επιχείρησης X 1 Σχήμα 6: Ταχύτητα ανταπόκρισης μιας επιχείρησης σε μια καινοτομία σε σχέση με το μέγεθος της Στο σχήμα 6 η β 2 δείχνει πόσο ψηλότερα ή χαμηλότερα είναι το σημείο τομής με τον Y για κάθε κατηγορία επιχείρησης και αναλόγως η β 3 δείχνει πόσο μεγαλύτερη ή μικρότερη είναι η κλίση για κάθε κατηγορία επιχείρησης. Επειδή τόσο το σημείο τομής με τον Y όσο και η κλίση διαφέρουν για κάθε κατηγορία επιχείρησης δεν αληθεύει πια ότι η β 2 δείχνει πόσο ψηλότερα ή χαμηλότερα είναι η αναμενόμενη τιμή του Y για οποιαδήποτε τιμή του X 1 μας δίνεται. Στο σχήμα φαίνεται πως η επίδραση του τύπου της επιχείρησης στο μοντέλο εξαρτάται από το μέγεθός της. Οι μικρότερες επιχειρήσεις αμοιβαίων τείνουν να καινοτομούν πιο γρήγορα, αλλά οι μεγαλύτερες επιχειρήσεις μετοχικών τείνουν να καινοτομούν γρηγορότερα. Οταν υπάρχει υπάρχει φαινόμενο αλληλεπίδρασης, η δράση της ποιοτικής μεταβλητής μπορεί να μελετηθεί συγκρίνοντας τις ευθείες παλινδρόμησης για κάθε κατηγορία της ποιοτικής μεταβλητής. Το σχήμα 7 απεικονίζει μια άλλη πιθανή κατάσταση αλληλεπίδρασης όπου οι επιχειρήσεις αμοιβαίων τείνουν να εισάγουν πιο γρήγορα από τις επιχειρήσεις μετοχικών την καινοτομία για όλα τα μεγέθη επιχειρήσεων στο πεδίο εφαρμογής του μοντέλου, αλλά η απόκλιση είναι μικρότερο για μεγαλύτερες επιχειρήσεις από ότι για μικρότερες. Προκειμένου να κάνω έλεγχο για την παρουσία αλληλεπίδρασης θα πραγματοποιήσω το τεστ: 22

23 Y Ταχύτητα ανταπόκρισης σε μήνες μετοχικών αμοιβαίων Μέγεθος της επιχείρησης X 1 Σχήμα 7: Υπαρξη αλληλεπίδρασης μεταξύ του τύπου και του μεγέθους της επιχείρησης H 0 : β 3 = 0 H 1 : β 3 0 ο οποίος μας δείχνει και αν οι γραμμές παλινδρόμησης έχουν ίδια κλίση. Ο έλεγχος αν οι γραμμές παλινδρόμησης ταυτίζονται θα είναι: H 0 : β 2 = β 3 = 0 H 1 : β 2 0 ή β Περισσότερες από μια ποιοτικές ερμηνευτικές μεταβλητές Μπορούν εύκολα να κατασκευαστούν μοντέλα όπου δύο ή περισσότερες από τις ανεξάρτητες μεταβλητές είναι ποιοτικές. Εστω ότι έχω: εξαρτημένη μεταβλητή Y = ποσοτική πρώτη ανεξάρτητη μεταβλητή X 1 = ποσοτική δεύτερη ανεξάρτητη μεταβλητή X 2 = ποιοτική με δυο κατηγορίες, Α και Β τρίτη ανεξάρτητη μεταβλητή X 3 = ποιοτική με δυο κατηγορίες, Γ και Δ Προκειμένου η ποιοτικές μεταβλητές να χρησιμοποιηθούν σε ένα μοντέλο παλινδρόμησης θα γίνει ποσοτικός προσδιορισμός των κατηγοριών τους. Στην περίπτωση μας θα χρησιμοποιήσουμε μεταβλητή δείκτη (indicator variable) με τιμές 0 ή 1. 23

24 { 1 κατηγορία Α X 2 = 0 κατηγορία Β { 1 κατηγορία Γ X 3 = 0 κατηγορία Δ Θεωρώ ότι οι συναρτήσεις παλινδρόμησης για όλους τους συνδυασμούς των ποιοτικών μεταβλητών X 2 και X 3 έχουν την ίδια κλίση β 1 και οι συντελεστές β 2 β 3 υποδηλώνουν τις προσθετικές επιδράσεις της διαφορετικότητας των κατηγοριών Α, Β και Γ, Δ Τότε το γραμμικό μοντέλο διαμορφώνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i3 + ε i Οι συναρτήσεις παλινδρόμησης για τις τέσσερις δυνατές περιπτώσεις θα είναι: E(Y ) = β 0 +β 1 X 1 +β 2 +β 3 για παρατηρήσεις που ανήκουν στις κατηγορίες Α και Γ E(Y ) = β 0 + β 1 X 1 + β 2 για παρατηρήσεις που ανήκουν στις κατηγορίες Α και Δ E(Y ) = β 0 + β 1 X 1 + β 3 για παρατηρήσεις που ανήκουν στις κατηγορίες Β και Γ E(Y ) = β 0 + β 1 X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Β και Δ Οι επιδράσεις όμως των ερμηνευτικών μεταβλητών μπορεί να μην είναι μόνο προσθετικές αλλά να αλληλοσυνδέονται, οπότε δρουν στο μοντέλα και πολλαπλασιαστικά. Τότε προσθέτοντας όρο αλληλεπίδρασης το μοντέλο διαμορφώνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i3 + β 4 X i1 X i2 + β 5 X i1 X i3 + β 6 X i2 X i3 + ε i Οι συναρτήσεις παλινδρόμησης για τις τέσσερις δυνατές περιπτώσεις θα είναι: E(Y ) = (β 0 + β 2 + β 3 + β 6 ) + (β 1 + β 4 + β 5 )X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Α και Γ E(Y ) = (β 0 + β 2 ) + (β 1 + β 4 )X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Α και Δ E(Y ) = (β 0 + β 3 ) + (β 1 + β 5 )X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Β και Γ E(Y ) = β 0 + β 1 X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Β και Δ Οχι μόνο οι συναρτήσεις παλινδρόμησης για τους συνδυασμούς των ποιοτικών μεταβλητών X 2 και X 3 διαφέρουν, αλλά τα διαφορετικά αποτελέσματα μιας ποιοτικής μεταβλητής στο σημείο τομής εξαρτώνται από την κατηγορία της άλλης ποιοτικής μεταβλητής. Οταν κινούμαστε από τον συνδυασμό Α - Δ στον Β - Δ το σημείο τομής αλλάζει κατά β 2, ενώ όταν κινούμαστε από τον συνδυασμό Α - Γ στον Β - Γ το σημείο τομής αλλάζει κατά β 2 + β 6. 24

25 2.5 Κατά τμήματα γραμμική παλινδρόμηση Κάποιες φορές η παλινδρόμηση του Y στο X ακολουθεί μια γραμμική σχέση που αλλάζει κλίση μετά από μια συγκεκριμένη τιμή της ερμηνευτικής μεταβλητής. Εστω ότι έχω: εξαρτημένη μεταβλητή Y = ποσοτική ανεξάρτητη μεταβλητή X = ποσοτική X a η συγκεκριμένη τιμή της X που επέρχεται η μεταβολή Στην περίπτωση αυτή η γραμμική παλινδρόμηση του Y στο X θα αποτελείται από δυο τμήματα, γιαυτό και ονομάζεται κατά τμήματα γραμμική παλινδρόμηση (piecewise linear regression). Με την βοήθεια ψευδομεταβλητών ένα μοντέλο κατά τμήματα γραμμικής παλινδρόμησης θα διατυπώνεται ως εξής: όπου Επομένως Y i = β 0 + β 1 X i1 + β 2 (X i1 X a )X i2 + ε i { 1 αν Xi1 > X X 2 = a 0 αλλιώς { β0 β Y i = 2 X a + (β 1 + β 2 )X i1 + ε i αν X i1 > X a β 0 + β 1 X i1 + ε i αλλιώς Y E(Y )=( β 0 β 2 X a )+(β 1 +β 2 ) X 1 β 0 E(Y )=β 0 +β 1 X 1 X a X 1 Σχήμα 8: Κατά τμήματα γραμμική παλινδρόμηση 25

26 Οπως βλέπουμε στο σχήμα 8, ο συντελεστής β 1 είναι η κλίση του πρώτου τμήματος και ο (β 1 + β 2 ) η κλίση του δεύτερου τμήματος. Η μεταβολή της παλινδρόμησης που επέρχεται στην τιμή X a θα είναι σημαντική αν ο συντελεστής β 2 είναι σημαντικός, κάτι που κρίνεται με το στατιστικό t Περισσότερα από δύο τμήματα στην γραμμή παλινδρόμησης Η επέκταση του γραμμικού μοντέλου σε περισσότερα από δύο τμήματα στην γραμμή παλινδρόμησης μπορεί να γίνει ως εξής: Εστω ότι έχω: εξαρτημένη μεταβλητή Y = ποσοτική ανεξάρτητη μεταβλητή X = ποσοτική X a η πρώτη τιμή της X που επέρχεται η μεταβολή X b η δεύτερη τιμή της X που επέρχεται η μεταβολή Με την βοήθεια ψευδομεταβλητών ένα μοντέλο θα διατυπώνεται ως εξής: Y i = β 0 + β 1 X i1 + β 2 (X i1 X a )X i2 + β 3 (X i1 X b )X i3 + ε i Ασυνέχεια στην συνάρτηση παλινδρόμησης Κάποιες φορές η συνάρτηση γραμμικής παλινδρόμησης δεν αλλάζει απλά κλίση για κάποια συγκεκριμένη τιμή X a της ανεξάρτητης μεταβλητής X αλλά παρουσιάζει και μια ασυνέχεια στο σημείο αυτό. Σ αυτήν την περίπτωση μια άλλη μεταβλητή δείκτης πρέπει να εισαχθεί προκειμένου να καλυφθεί η ασυνέχεια. Αν η κλίση της γραμμής παλινδρόμησης αλλάζει για την τιμή X = X a και η γραμμή παλινδρόμησης μπορεί να είναι ασυνεχής εκεί, τότε το μοντέλο θα διατυπώνεται ως εξής: Y i = β 0 + β 1 X i1 + β 2 (X i1 X a )X i2 + β 3 (X i3 ) + ε i όπου: εξαρτημένη μεταβλητή Y = ποσοτική ανεξάρτητη μεταβλητή X 1 = ποσοτική X a η τιμή της X που επέρχεται η μεταβολή { 1 αν Xi1 > X X 2 = a 0 αλλιώς { 1 αν Xi1 > X X 3 = a 0 αλλιώς Η συνάρτηση παλινδρόμησης θα είναι: E(Y ) = β 0 + β 1 X 1 + β 2 (X 1 X a )X 2 + β 3 X 3 Οταν X 1 X a τότε X 2 = X 3 = 0 η συνάρτηση παλινδρόμησης θα είναι: E(Y ) = β 0 + β 1 X 1 Οταν X 1 > X a τότε X 2 = X 3 = 1 η συνάρτηση παλινδρόμησης θα είναι: E(Y ) = (β 0 β 2 X a + β 3 ) + (β 1 + β 2 )X 1 26

27 Y E(Y )=( β 0 β 2 X a +β 3 )+(β 1 +β 2 ) X 1 β 3 β 3 X a β 2 E(Y )=β 0 +β 1 X 1 β 0 X a X 1 Σχήμα 9: Ασυνέχεια στην συνάρτηση παλινδρόμησης Στο σχήμα 9 βλέπουμε ότι β 3 εκφράζει την διαφορά των μέσων αποκλίσεων για τις ευθείες παλινδρόμησης στο σημείο X a. Το β 2 εκφράζει την διαφορά των δύο κλίσεων. Αν ο t έλεγχος μας δώσει ότι β 3 = 0 συμπεραίνουμε ότι η συνάρτηση είναι συνεχής στο σημείο X a οπότε και θα έχω μοντέλο ίδιο με αυτό της κατά τμήματα γραμμικής παλινδρόμησης. 2.6 Εφαρμογή των ψευδομεταβλητών στις χρονοσειρές Οι οικονομολόγοι χρησιμοποιούν συχνά δεδομένα χρονοσειρών στην ανάλυση παλινδρόμησης. Για παράδειγμα η αποταμίευση Y μπορεί να παλινδρομήσει πάνω στο εισόδημα X, όπου τα δεδομένα αφορούν μια σειρά ετών. Το προτεινόμενο μοντέλο είναι: Y t = β 0 + β 1 X t + ε t όπου t = 1,..., n όπου Y t και X t οι αποταμιεύσεις και το εισόδημα αντίστοιχα για την χρονική περίοδο t. Ας υποθέσουμε ότι η περίοδος που καλύπτουν περιλαμβάνει χρονική περίοδο τόσο πολέμου όσο και ειρήνης που παίζει ρόλο αφού η αποταμίευση εν καιρώ πολέμου αναμένεται υψηλότερη. Το προτεινόμενο μοντέλο είναι: 27

28 όπου t = 1,..., n όπου: Y t οι αποταμιεύσεις X t1 το εισόδημα Y t = β 0 + β 1 X t1 + β 2 X t2 + ε t X t2 = { 1 αν t περίοδος ειρήνης 0 αλλιώς Το μοντέλο αυτό υποθέτει πως η οριακή ροπή προς αποταμίευση β 1 είναι σταθερή τόσο εν καιρώ ειρήνης όσο και εν καιρώ πολέμου και μόνο το ύψος της ευθείας παλινδρόμησης επηρεάζεται από αυτήν την ποιοτική μεταβλητή. Μια άλλη χρήση των μεταβλητών δεικτών στις εφαρμογές των χρονοσειρών είναι όταν χρησιμοποιούμε μηνιαία ή τριμηνιαία στοιχεία. Αν υποθέσουμε ότι οι τριμηνιαίες πωλήσεις Y εξαρτώνται από τις τριμηνιαίες διαφημιστικές δαπάνες X 1 και το τριμηνιαίο διαθέσιμο ατομικό εισόδημα X 2. Αν οι εποχιακές επιδράσεις επηρεάζουν επίσης τις τριμηνιαίες πωλήσεις, ένα μοντέλο που ενσωματώνει τις εποχιακές επιδράσεις θα είναι: Y t = β 0 + β 1 X t1 + β 2 X t2 + β 3 X t3 + β 4 X t4 + β 5 X t5 + ε t όπου t = 1,..., n όπου Y t τριμηνιαίες πωλήσεις X t1 τριμηνιαίες διαφημιστικές δαπάνες X t2 τριμηνιαίο διαθέσιμο ατομικό εισόδημα { 1 πρώτο τρίμηνο X t3 = 0 αλλιώς { 1 δεύτερο τρίμηνο X t4 = 0 αλλιώς { 1 τρίτο τρίμηνο X t5 = 0 αλλιώς 2.7 Προβληματισμοί σε σχέση με την χρήση μεταβλητών δεικτών Μεταβλητές δείκτες ενάντια στην χορήγηση κωδικών Μια εναλλακτική της χρήσης μεταβλητών δεικτών για μια ποιοτική ανεξάρτητη μεταβλητή είναι η χορήγηση κωδικών. Εστω η ποιοτική ανεξάρτητη μεταβλητή συχνότητα χρήσης προϊόντος η ο- ποία έχει τρεις κατηγορίες: συχνή, περιστασιακή και καθόλου χρήση. Με την προσέγγιση χορήγησης κωδικών μόνο μία μεταβλητή χρησιμοποιείται και οι τιμές που αποδίδονται στις κατηγορίες της είναι: 3 συχνή χρήση X 1 = 2 περιστασιακή χρήση 1 καθόλου χρήση 28

29 Οι κωδικοί που χορηγούνται είναι φυσικά αυθαίρετοι και θα μπορούσαν να είναι άλλα σύνολα αριθμών. Το μοντέλο μας στην περίπτωση που δεν υπήρχαν άλλες ανεξάρτητες μεταβλητές θα ήταν: Y i = β 0 + β 1 X i1 + ε t Η βασική δυσκολία με την χορήγηση κωδικών είναι ότι ορίζουν ένα μέτρο για τις κατηγορίες της ποιοτικής μεταβλητής που δεν είναι λογικό. Αυτό φαίνεται αν εξετάσουμε τις αναμενόμενες τιμές για τις τρεις κατηγορίες της ποιοτικής μεταβλητής: β 0 + 3β 1 συχνή χρήση E(Y ) = β 0 + 2β 1 περιστασιακή χρήση β 0 + β 1 καθόλου χρήση Το οποίο επιφέρει: E(Y/συχνή χρήση) E(Y/περιστασιακή χρήση) = E(Y/περιστασιακή χρήση) E(Y/καθόλου χρήση) = β 1 Ετσι η κωδικοποίηση 1, 2, 3 συνεπάγεται ίσες αποστάσεις μεταξύ των τριών κατηγοριών χρηστών, κάτι που δεν συμφωνεί απαραίτητα με την πραγματικότητα. Μια άλλη χορήγηση κωδικών θα μπορούσε να συνεπάγεται διαφορετικές αποστάσεις μεταξύ των κατηγοριών της ποιοτικής μεταβλητής αλλά θα εξακολουθούσε να είναι αυθαίρετη. Αντίθετα οι μεταβλητές δείκτες δεν κάνουν υποθέσεις σχετικά με την απόσταση των κατηγοριών και βασίζονται στα δεδομένα για να δείξουν τις επιδράσεις που προκαλούν στην απόσταση. Το ίδιο παράδειγμα με δυο μεταβλητές δείκτες X 1 και X 2 να χρησιμοποιούνται για να ποσοτικοποιήσουν την ποιοτική μεταβλητή συχνότητα χρήσης προϊόντος είναι όπως βλέπουμε στον πίνακα 1: κατηγορίες X 1 X 2 συχνή χρήση 1 0 περιστασιακή χρήση 0 1 καθόλου χρήση 0 0 Πίνακας 1: Συχνότητα χρήσης προϊόντος Στην περίπτωση αυτή το μοντέλο μου θα ήταν: Y i = β 0 + β 1 X i1 + β 2 X i2 + ε t όπου το β 1 μετρά την διαφορά E(Y/συχνή χρήση) E(Y/καθόλου χρήση) και το β 2 μετρά την διαφορά E(Y/περιστασιακή χρήση) E(Y/καθόλου χρήση) και το β 1 β 2 μετρά την διαφορά E(Y/συχνή χρήση E(Y/περιστασιακή χρήση) χωρίς αυθαίρετους περιορισμούς που πρέπει να πληρούνται λόγω της διαφορετικότητας. 29

30 2.7.2 Μεταβλητές δείκτες ενάντια στις ποσοτικές μεταβλητές Οι μεταβλητές δείκτες μπορούν να χρησιμοποιηθούν ακόμα και αν η ερμηνευτική μεταβλητή είναι ποσοτική. Για παράδειγμα η ποσοτική μεταβλητή ηλικία μπορεί να μετασχηματιστεί με ομαδοποίηση των ηλικιών σε κατηγορίες. Στη συνέχεια μεταβλητές δείκτες μπορούν να χρησιμοποιηθούν για τις κατηγορίες της νέας αυτής ανεξάρτητης μεταβλητής. Αυτό αρχικά φαίνεται να είναι μια αμφισβητήσιμη προσέγγιση επειδή οι πληροφορία για τις πραγματικές ηλικίες χάνεται. Επιπλέον οι πρόσθετες παράμετροι που προστίθενται στο μοντέλο οδηγούν σε μείωση των βαθμών ελευθερίας που σχετίζονται με το M SE. Παρ όλα αυτά υπάρχουν περιπτώσεις που η αντικατάσταση μιας ποσοτικής μεταβλητής από μεταβλητή δείκτη μπορεί να είναι κατάλληλη. Αν για παράδειγμα έχουμε μιας μεγάλης κλίμακας έρευνα για την σχέση μεταξύ των ρευστών διαθέσιμων Y και της ηλικίας του επικεφαλής της οικογένειας X η απώλεια μερικών βαθμών ελευθερίας είναι αμελητέα. Η ανάλυση είναι πολύ αμφίβολη ως προς την μορφή της συνάρτησης παλινδρόμησης, η οποία θα μπορούσε να είναι εξαιρετικά πολύπλοκη και γιαυτό θα μπορούσε να προτιμηθεί η προσέγγιση της μεταβλητής δείκτη, προκειμένου να πάρει πληροφορίες από την μορφή της συνάρτησης παλινδρόμησης χωρίς να κάνει υποθέσεις σχετικά με την συναρτησιακή μορφή της. Μια άλλη εναλλακτική επίσης χρησιμοποιώντας μεταβλητές δείκτες είναι διαθέσιμη αν υπάρχει αμφιβολία για την λειτουργικότητα σε μια σύνθετη συνάρτηση παλινδρόμησης. Θα μπορούσε να χρησιμοποιηθεί για την ποσοτική μεταβλητή η- λικία κατά τμήματα γραμμική παλινδρόμηση με μια σειρά από τμήματα. Αυτή η προσέγγιση επίσης χάνει σε βαθμούς ελευθερίας για την εκτίμηση του M SE αλλά αυτό δεν αποτελεί πρόβλημα σε μελέτες μεγάλης κλίμακας. Το όφελος θα είναι ότι οι πληροφορίες σχετικά με την μορφή της συνάρτησης παλινδρόμησης επιτυγχάνεται χωρίς ισχυρές παραδοχές σχετικά με την συναρτησιακή μορφή της Άλλες κωδικοποιήσεις για τις μεταβλητές δείκτες Υπάρχουν πολλές δυνατότητες για την κωδικοποίηση των μεταβλητών δεικτών. Οι δυο εναλλακτικές 0 και 1 κωδικοποιούνται με c 1 μεταβλητές δείκτες για μια ποιοτική μεταβλητή με c κατηγορίες. Επανερχόμαστε στο παράδειγμα όπου ένας οικονομολόγος θέλει να μελετήσει την ταχύτητα ανταπόκρισης μιας επιχείρησης σε μια καινοτομία σε σχέση με το μέγεθος και τον τύπο της. εξαρτημένη μεταβλητή Y = ταχύτητα ανταπόκρισης σε μήνες πρώτη ανεξάρτητη μεταβλητή, ποσοτική X 1 = μέγεθος της εταιρείας (μετριέται από το σύνολο του ενεργητικού σε χιλιάδες δολάρια) δεύτερη ανεξάρτητη μεταβλητή, ποιοτική X 2 = ο τύπος της επιχείρησης με δυο κατηγορίες, μετοχικών και αμοιβαίων Εδώ μια κωδικοποίηση θα μπορούσε να είναι: { 1 μετοχικών X 2 = 1 αμοιβαίων Στην περίπτωση αυτή το μοντέλο θα ήταν: με συνάρτηση παλινδρόμησης: Y i = β 0 + β 1 X i1 + β 2 X i2 + ε t 30

31 E(Y ) = β 0 + β 1 X 1 + β 2 X 2 που για τους δυο τύπους εταιρείας διαμορφώνεται: E(Y ) = (β 0 + β 2 ) + β 1 X 1 για μετοχικών E(Y ) = (β 0 β 2 ) + β 1 X 1 για αμοιβαίων Ετσι το β 0 μπορεί να θεωρηθεί ως μέσος τομής της γραμμής παλινδρόμησης από όπου η εταιρία μετοχικών και αμοιβαίων διαφέρουν κατά β 2 προς αντίθετες κατευθύνσεις. Ενας έλεγχος υποθέσεων για το κατά πόσο οι ευθείες παλινδρόμησης είναι ίδιες για τις δύο κατηγορίες εταιρειών θα είναι: H 0 : β 2 = 0 H 1 : β 2 0 Μια εναλλακτική κωδικοποίηση χρησιμοποιώντας μεταβλητή δείκτη με τιμές 0 και 1 για κάθε μία από τις κατηγορίες της ποιοτικής μεταβλητής δίνει το μοντέλο που διαμορφώνεται: με X 1 = μέγεθος της εταιρείας Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i3 + ε i και X 2 = { 1 μετοχικών 0 αλλιώς X 3 = { 1 αμοιβαίων 0 αλλιώς με συνάρτηση παλινδρόμησης για τους δυο τύπους εταιρείας να διαμορφώνεται: E(Y ) = β 2 + β 1 X 1 για μετοχικών E(Y ) = β 3 + β 1 X 1 για αμοιβαίων Ενας έλεγχος υποθέσεων για το κατά πόσο οι ευθείες παλινδρόμησης είναι ίδιες για τις δύο κατηγορίες εταιρειών θα είναι: H 0 : β 2 = β 3 H 1 : β 2 β 3 31

32 2.8 Εξαρτημένη μεταβλητή δείκτης Σε κάποιες περιπτώσεις, η εξαρτημένη μεταβλητή που μας ενδιαφέρει έχει μόνο δύο δυνατά αποτελέσματα, και συνεπώς μπορεί να παρασταθεί από μια μεταβλητή δείκτη με τιμές 0 και 1. Παράδειγμα: Σε μία ανάλυση για το κατά πόσο οι επιχειρήσεις έχουν τμήμα εργασιακών σχέσεων ανάλογα με το μέγεθος της επιχείρησης, η εξαρτημένη μεταβλητή που ορίζεται έχει δυο δυνατά αποτελέσματα: να έχει ή να μην έχει τμήμα εργασιακών σχέσεων. Αυτά τα αποτελέσματα μπορούν να κωδικοποιηθούν με 0 και 1. Οταν η εξαρτημένη μεταβλητή είναι δίτιμη σε ένα απλό μοντέλο θα ήταν: όπου Y i = 0, 1 Η συνάρτηση παλινδρόμησης Y i = β 0 + β 1 X i1 + ε i E(Y ) = β 0 + β 1 X i1 έχει ιδιαίτερη σημασία στην περίπτωση αυτή. Η κατανομή πιθανοτήτων για το Y i φαίνεται στον πίνακα 2: Y i πιθανότητα 1 P (Y i = 1) = π i 0 P (Y i = 0) = 1 π i Πίνακας 2: Κατανομή πιθανοτήτων Ετσι π i είναι η πιθανότητα το Y i να είναι 1 και 1 π i είναι η πιθανότητα το Y i να είναι 0. Οπότε η αναμενόμενη τιμή θα είναι E(Y i ) = 1(π i ) + 0(1 π i ) = π i και αφού βρίσκουμε: E(Y ) = β 0 + β 1 X i1 E(Y ) = β 0 + β 1 X i1 = π i που αντιπροσωπεύει όταν η εξαρτημένη μεταβλητή είναι μεταβλητή δείκτης με τιμές 0 και 1 την πιθανότητα το Y i να είναι 1 για δεδομένες τιμές των ανεξάρτητων μεταβλητών. 32

33 3 Ελεγχος υποθέσεων Τις περισσότερες φορές δεν είναι εφικτό να παρατηρηθούν από τον ερευνητή όλα τα άτομα σε έναν πληθυσμό. Ο έλεγχος υποθέσεων είναι μια συμπερασματική διαδικασία που χρησιμοποιεί τα δεδομένα ενός δείγματος για να εκτιμήσει την α- ξιοπιστία μιας υπόθεσης που έγινε για τον πληθυσμό. Η διαδικασία του ελέγχου ξεκινάει κάνοντας την υπόθεση για τον πληθυσμό, συνεχίζεται με την λήψη ενός τυχαίου δείγματος και ολοκληρώνεται με την σύγκριση των δεδομένων του δείγματος με την υπόθεση. Σκοπός της διαδικασίας είναι η λήψη απόφασης για το αν οι πραγματικές τιμές των παραμέτρων ικανοποιούν τις υποθέσεις με βάση τα δεδομένα του δείγματος και εμπεριέχει το αντίστοιχο ρίσκο. 3.1 Η μηδενική και η εναλλακτική υπόθεση Υπάρχουν δυο είδη στατιστικών υποθέσεων: οι μηδενικές υποθέσεις H 0 και οι εναλλακτικές υποθέσεις H 1. Αυτή που ελέγχεται είναι η μηδενική υπόθεση και είναι αυτή που συμφωνεί με τις συνθήκες που θεωρούμε ότι αληθεύουν για τον υπό μελέτη πληθυσμό. Η μηδενική υπόθεση διατυπώνεται με σκοπό να αμφισβητηθεί και μπορεί να απορριφθεί ή να μην απορριφθεί. Αν δεν απορριφθεί τότε τα δεδομένα στα οποία στηρίζεται ο έλεγχος δεν επαρκούν για την απόρριψή της. Αν απορριφθεί τότε τα δεδομένα δεν επαληθεύουν την μηδενική υπόθεση, αλλά είναι συμβατά με την εναλλακτική υπόθεση. Η μηδενική υπόθεση H 0 δηλώνει ότι στον πληθυσμό δεν σημειώνεται καμία αλλαγή ή δεν υπάρχει διαφορά και αντίθετη αυτής είναι η εναλλακτική υπόθεση H 1. Η τελική απόφαση στηρίζεται στην σύγκριση των δεδομένων του δείγματος με την H 0. Η μια δυνατότητα είναι να απορριφθεί η μηδενική υπόθεση. Αυτό συμβαίνει όταν τα δεδομένα του δείγματος είναι σημαντικά διαφορετικά από αυτό που προβλέπει η μηδενική υπόθεση. Η άλλη δυνατότητα είναι τα δεδομένα του δείγματος να είναι συνεπή με την μηδενική υπόθεση, οπότε και αποτυγχάνουμε να απορρίψουμε την μηδενική υπόθεση. 3.2 Σφάλματα κατά τον έλεγχο υποθέσεων Τα δεδομένα ενός δείγματος μπορεί να μας οδηγήσουν σε λανθασμένες αποφάσεις, για τις οποίες υπάρχουν δυο δυνατές περιπτώσεις. 1.Να απορρίψουμε την μηδενική υπόθεση ενώ είναι αληθής (σφάλμα τύπου Ι) 2.Να δεχτούμε την μηδενική υπόθεση ενώ είναι ψευδής (σφάλμα τύπου ΙΙ) Στόχος είναι κατά την διαδικασία ελέγχου οι πιθανότητες να γίνουν αυτά τα σφάλματα: Ρ(σφάλμα τύπου Ι)=α Ρ(σφάλμα τύπου ΙΙ)=β να είναι όσο το δυνατό μικρότερες. Στον πίνακα 3 φαίνεται η σχέση μεταξύ απόφασης και πραγματικής κατάστασης της H 0. Τα εφαρμοζόμενα κριτήρια ελέγχου πρέπει να ελαχιστοποιούν τις πιθανότητες και των δυο τύπων σφαλμάτων. Αυτό που αρχικά προσπαθούμε να αποφύγουμε είναι η απόρριψή της H 0 ενώ είναι σωστή. Για αυτό το λόγο επιλέγουμε μια σταθερή τιμή για το α και στη συνέχεια προσπαθούμε να ελαχιστοποιήσουμε την πιθανότητα για σφάλμα τύπου ΙΙ, το β δηλαδή. Η σταθερή τιμή του α λέγεται επίπεδο σημαντικότητας και είναι η πιθανότητα απόρριψης της μηδενικής υπόθεσης που είναι αληθής, υπέρ της εναλλακτικής. Την τιμή της πιθανότητας την καθορίζει ο ερευνητής. Αν έχω καθορίσει α = 0, 05(5%) και απορρίψουμε της H 0, τότε 33

34 Πραγματική κατάσταση της H 0 απόφαση αληθής H 0 ψευδής H 0 Απορρίπτουμε την H 0 σφάλμα τύπου Ι με πιθανότητα α σωστή απόφαση με πιθανότητα 1-β Δεχόμαστε την H 0 σωστή απόφαση με πιθανότητα 1-α σφάλμα τύπου ΙΙ με πιθανότητα β Πίνακας 3: Σχέση μεταξύ απόφασης και πραγματικής κατάστασης της H 0 είμαστε κατά 95% ότι πήραμε την σωστή απόφαση. Οταν λέμε λοιπόν ότι η H 0 απορρίπτεται σε επίπεδο σημαντικότητας 5% εννοούμε ότι η πιθανότητα να έχουμε κάνει λάθος είναι 5%. Οπως φαίνεται στο σχήμα 10, το επίπεδο σημαντικότητας (ή αλλιώς α-επίπεδο) χωρίζει την κατανομή των δειγματικών μέσων σε: 1.Αυτούς που συμφωνούν με την H 0 και βρίσκονται στο κέντρο της κατανομής 2.Αυτούς που είναι σημαντικά διαφορετικοί από την H 0 και βρίσκονται στα άκρα της κατανομής. Οταν η H 0 είναι αληθής, η εμφάνιση ακραίων τιμών έχει πολύ μικρή πιθανότητα(α). Αν όμως εμφανιστούν τότε έχουμε κάνει σφάλμα τύπου Ι με πιθανότητα α. E(Y )=( β 0 β 2 X a +β 3 )+(β 1 +β 2 ) X 1 β 3 Απόρριψη της Η 0 Απόρριψη της Η 0 Πιθανότητα α/2 Πιθανότητα α/2 E(Y )=β 0 +β 1 X 1 Σχήμα 10: Κατανομή των δειγματικών μέσων Οταν μικραίνουμε το α-επίπεδο, μικραίνει αντίστοιχα και το ρίσκο που παίρνουμε για σφάλμα τύπου Ι. Οπότε έχουμε μεταφορά των ορίων της κρίσιμης περιοχής και κατά συνέπεια χρειαζόμαστε πιο πολλές αποδείξεις για την απόρριψη της H 0. Για παράδειγμα, μπορεί σε ένα δείγμα τα δεδομένα να επαρκούν για απόρριψη της 34

35 H 0 με επίπεδο σημαντικότητας α=0,05, αλλά να μην συμβαίνει το ίδιο σε επίπεδο σημαντικότητας α=0, Ελεγχος για την διαφορά των μέσων τιμών δυο πληθυσμών Σε πολλές περιπτώσεις χρειάζεται να συγκρίνουμε τις μέσες τιμές δυο πληθυσμών χρησιμοποιώντας δύο δείγματα αντίστοιχα των πληθυσμών αυτών. Τέτοια περίπτωση είναι το να προσπαθήσουμε να αποφασίσουμε αν υπάρχει πραγματική διαφορά ανάμεσα στην μέση επίδοση των μαθητών που είναι αγόρια(πρώτος πληθυσμός) και στην μέση επίδοση των μαθητών που είναι κορίτσια(δεύτερος πληθυσμός). Εστω λοιπόν µ 1 και µ 2 οι αντίστοιχες μέσες τιμές και ν 1 και ν 2 τα αντίστοιχα μεγέθη των δειγμάτων. Η μηδενική υπόθεση είναι: H 0 : µ 1 = µ 2 έναντι της εναλλακτικής: H 1 : µ 1 µ 2 Παίρνουμε ως κριτήριο ελέγχου το όπου sp 2 t = X 1 X 2 v 1 + sp 2 v 2 s p 2 = (v 1 1)s (v 2 1)s 2 2 v 1 + v 2 2 που ακολουθεί t - κατανομή με v 1 + v 2 2 βαθμούς ελευθερίας για την περίπτωση που οι διακυμάνσεις είναι άγνωστες αλλά ίσες, ενώ αν είναι άνισες βαθμός ελευθερίας λογίζεται ο μικρότερος από τους v 1 1 και v

36 4 Στατιστικός έλεγχος του γραμμικού μοντέλου Για τον στατιστικό έλεγχο του μοντέλου (με T παρατηρήσεις και K ερμηνευτικές μεταβλητές)υποθέτουμε ότι ο τυχαίος παράγοντας ε i ακολουθεί την κανονική κατανομή, δηλαδή ε i N(0, σ 2 ). Ως συναρτήσεις των τυχαίων μεταβλητών ε 1, ε 2,..., ε T, οι εκτιμητές b 0, b 1,..., b K ακολουθούν κανονική κατανομή, και αφού E(b j ) = β j έχουμε: b j β j σ c jj N(0, 1) όπου c jj το j διαγώνιο στοιχείο της μήτρας (X X) 1. Ανεξάρτητη της στατιστικής b j β j σ c jj είναι η στατιστική (T K 1) s2 σ 2 ελευθερίας: που ακολουθεί κατανομή X 2 με (Τ-Κ-1) βαθμούς οπότε (T K 1) s2 σ 2 X2 T K 1 b j β j s c jj t T K Συντελεστής προσδιορισμού Σε ένα γραμμικό μοντέλο με K ερμηνευτικές μεταβλητές και T παρατηρήσεις, ο συντελεστής προσδιορισμού είναι το μέτρο της ικανότητας προσαρμογής του και ορίζεται ως η αναλογία της εξαρτημένης μεταβλητής Y που ερμηνεύεται από την παλινδρόμηση. Ο τύπος του είναι: R 2 = Σŷ2 Σy 2 = Σe2 Σy 2 Με τιμή αναφοράς το μέσο του δείγματος, η μεταβλητότητα της Y ορίζεται ως το άθροισμα των τετραγώνων των αποκλίσεων των παρατηρήσεων της Y από το μέσο τους. Μεταβλητότητα της Y = Σ(Y Y ) 2 όταν η γραμμή παλινδρόμησης είναι Ŷ t = b 0 + b 1 X Η απόκλιση της t παρατήρησης της Y από τον μέσο, όπως βλέπουμε και στο σχήμα 11,είναι ή Y t Y = (Ŷt Y ) + e t 36

37 Y Y t Ŷ t =b 0 +b 1 X t Ȳ... Ŷ t Ȳ... e t. Y t Ȳ. X X t X Σχήμα 11: Γραμμή παλινδρόμησης Ŷt = b 0 + b 1 X y t = ŷ t + e t όπου y t = Y t Y η απόκλιση του δείγματος από τον μέσο ŷ t = Ŷt Y η απόκλιση της υπολογισμένης τιμής από τον μέσο e t = Y t Ŷt η απόκλιση της τιμής του δείγματος από την γραμμή παλινδρόμησης Γνωρίζουμε από τις ιδιότητες της γραμμής παλινδρόμησης ότι το άθροισμα των καταλοίπων είναι μηδέν: Σe i = 0, καθώς επίσης ότι το άθροισμα των γινομένων των καταλοίπων και των Ŷ είναι μηδέν: ΣŶ e i = 0 Με βάση αυτά τα δύο και υψώνοντας την σχέση Y t Y = (Ŷt Y ) + e t στο τετράγωνο και αθροίζοντας για όλες τις τιμές του Y παίρνουμε: ή Σ(Y Y ) 2 = Σ(Ŷ Y )2 + Σe 2 Σy 2 = Σŷ 2 + Σe 2 Ο όρος Σy 2 = Σ(Y Y ) 2 είναι η συνολική μεταβλητότητα του Y ή sum of squares total(sst) Ο όρος Σŷ 2 = Σ(Ŷ Y )2 είναι η μεταβλητότητα του Y που ερμηνεύεται από την παλινδρόμηση ή sum of squares regression(ssr) Ο όρος Σe 2 είναι η μεταβλητότητα που οφείλεται σε τυχαίους παράγοντες ή sum of squares error(sse). Δηλαδή SST = SSR + SSE 37

38 Σε ένα γραμμικό μοντέλο με Κ ερμηνευτικές μεταβλητές και Τ παρατηρήσεις θα έχω: Τους εκτιμητές ελαχίστων τετραγώνων δίνονται από το (K + 1) 1 διάνυσμα b = (X X) 1 X Y Τις παρατηρήσεις της εξαρτημένης μεταβλητής από το T 1 διάνυσμα Y Τον T (K + 1) πίνακα X Ομως SST = Σ(Y Y ) 2 = ΣY 2 T Y 2 = Y Y T Y 2 Οπότε αφού SSR = b X Y T Y 2 παίρνω SSE = SST SSR = Y Y b X Y όπως φαίνονται στον παρακάτω πίνακα 4: πηγή μεταβλητότητας άθροισμα τετραγώνων βαθμοί ελευθερίας μέσο τετράγωνο παλινδρόμηση SSR = b X Y T Y 2 K MSR = SSR K υπόλοιπο SSE = Y Y b X Y T K 1 MSE = SSE T K 1 σύνολο SST = Y Y T Y 2 T 1 Πίνακας 4: Ανάλυση διασποράς F F = MSR MSE F K,T K 1 Συντελεστής προσδιορισμού είναι η αναλογία της μεταβλητότητας του Y που ερμηνεύεται από την παλινδρόμηση και είναι το μέτρο της ικανότητας προσαρμογής του μοντέλου. Ο τύπος υπολογισμού είναι: R 2 = Σŷ2 Σy 2 = 1 Σe2 Σy 2 Διαιρώντας με τους αντίστοιχους βαθμούς ελευθερίας παίρνουμε τον διορθωμένο συντελεστή προσδιορισμού: R 2 = 1 Σe2 /(T K 1) Σy 2 /(T 1) 4.2 Ελεγχος της υπόθεσης β i = 0 = 1 s2 s y 2 Πραγματοποιώντας στο γραμμικό μοντέλο Y i = β 0 + β 1 X i ε i τον έλεγχο: H 0 : β 1 = 0 H 1 : β 1 0 ουσιαστικά ελέγχουμε αν υπάρχει σχέση μεταξύ της εξαρτημένης μεταβλητής Y και της ανεξάρτητης X, αφού ελέγχουμε αν ο συντελεστής β 1 είναι σημαντικά διαφορετικός από το μηδέν. Με χρήση της στατιστικής ελέγχου την t, σε περίπτωση ισχύος της μηδενικής υπόθεσης έχουμε: t = b 1 β 1 s b1 = b 1 s b1 και η μηδενική υπόθεση απορρίπτεται αν: 38

39 t = b 1 s b1 t T 2,α/2 Απόρριψη της μηδενικής υπόθεσης σημαίνει ότι η μεταβλητή X είναι σημαντική για την ερμηνεία της Y. Αν με ανάλογο τρόπο πραγματοποιήσουμε τον έλεγχο: H 0 : β 0 = 0 H 1 : β 0 0 και ισχύει η μηδενική υπόθεση, σημαίνει ότι η ευθεία παλινδρόμησης περνάει από την αρχή των αξόνων. 4.3 Ελεγχος της υπόθεσης β 1 =... = β k = 0 Ο Ελεγχος H 0 : β 1 =... = β k = 0 αναφέρεται στην ικανότητα όλων των Κ ερμηνευτικών μεταβλητών να να διαμορφώσουν τις τιμές της εξαρτημένης μεταβλητής Y. Αν ισχύει η μηδενική υπόθεση, τότε: ή SSR/K SSE/(T K 1) = Σy 2 /K Σe 2 /(T K 1) F (K, T K 1) R 2 /K (1 R 2 )/(T K 1) F (K, T K 1) Αν ισχύει η μηδενική υπόθεση τότε η τιμή της F θα είναι μικρή, αφού το άθροισμα των τετραγώνων της παλινδρόμησης θα είναι μικρότερο από το άθροισμα των τετραγώνων του σφάλματος. Αντίθετα, για μεγάλες τιμές της F η μηδενική υπόθεση απορρίπτεται. 4.4 Ελεγχος της υπόθεσης β h+1 = β h+2 =... = β k = 0 Ο έλεγχος της υπόθεσης H 0 : β h+1 = β h+2 =... = β k = 0 έναντι της εναλλακτικής H 1 : τουλάχιστον ένα εξ αυτών διαφορετικό από το μηδέν σημαίνει ότι οι ερμηνευτικές μεταβλητές X h+1, X h+2,..., X k που αντιστοιχούν στους συντελεστές β h+1, β h+2,..., β k δεν επιδρούν στην διαμόρφωση των τιμών της εξαρτημένης μεταβλητής Y. Το να προσθέσουμε τις k h αυτές μεταβλητές στο μοντέλο δεν αυξάνει την ερμηνευτική του ικανότητα. Συμβολίζουμε: SSR H : το άθροισμα των τετραγώνων της παλινδρόμησης ανάμεσα στην Y και τις Η μεταβλητές. SSR K : το άθροισμα των τετραγώνων της παλινδρόμησης στην παλινδρόμηση ανάμεσα στην Y και τις Κ μεταβλητές όπου K > H. Αν ισχύει η μηδενική υπόθεση, τότε: (SSR K SSR H )/(K H) SSE K /(T K 1) F ( K H, T K 1) Χρησιμοποιώντας λοιπόν το κριτήριο F, αν F > F ( K H, T K 1, α), τότε η μηδενική υπόθεση απορρίπτεται. Για K H = 1 η μηδενική υπόθεση γίνεται H 0 : β i = 0 όπου i = 1,..., k. Στην περίπτωση αυτή ο έλεγχος είναι ισοδύναμος με τον t έλεγχο. 39

40 4.5 Ελεγχος για τον συντελεστή συσχέτισης Ιδιος με τον έλεγχο αν ο συντελεστής β 1 είναι σημαντικά διαφορετικός από το μηδέν, είναι και ο έλεγχος αν ο συντελεστής συσχέτισης ρ είναι μηδέν. Συγκεκριμένα: H 0 : ρ = 0 H 1 : ρ 0 Ουσιαστικά υποθέτουμε ότι δεν υπάρχει γραμμική σχέση μεταξύ του X και του Y. Υπολογίζουμε την στατιστική: t = r T 2 1 r 2 και αν t t a/2,t 2 απορρίπτουμε την H Σύγκριση δυο συντελεστών συσχέτισης Βασιζόμενοι σε ανεξάρτητα δείγματα από δυο πληθυσμούς θέλουμε να δούμε αν οι πληθυσμοί αυτοί έχουν τον ίδιο συντελεστή συσχέτισης. Εστω οι πληθυσμοί Y 1 και Y 2 και οι αντίστοιχοι συντελεστές συσχέτισης των πληθυσμών ρ 1 και ρ 2. Τα αντίστοιχα μεγέθη των δειγμάτων n 1 και n 2 και οι συντελεστές συσχέτισης των δειγμάτων r 1 και r 2. Θα πραγματοποιήσω τον έλεγχο: H 0 : ρ 1 = ρ 2 H 1 : ρ 1 ρ 2 Η στατιστική που χρησιμοποιούμε φτιάχνεται με την χρήση του Fisher z transformation: z = 1 2 log e( 1 + r 1 r ) για καθέναν από τους δυο συντελεστές συσχέτισης στα δείγματα. Η στατιστική που χρησιμοποιούμε είναι: z = z 1 z 2 1 n n 2 3 και για z z(1 α/2) αποδεχόμαστε την μηδενική υπόθεση. 40

41 5 Σχέση του φύλου του μαθητή με τις επιδόσεις του 5.1 Ερευνες για τις διαφορές των φύλων Από τα πρώτα τους χρόνια τα παιδια έρχονται αντιμέτωπα με διαφορετικές προσδοκίες από το περιβάλλον τους εξαρτώμενες από το φύλο τους[6]. Οι προσδοκίες αυτές λειτουργούν ως αυτοεκπληρούμενη προφητεία. Η αναμενόμενη λόγω του φύλου του συμπεριφορά του παιδιού ενθαρρύνεται και αυτό αυξάνει την πιθανότητα συνέχιση της. Τα τελευταία χρόνια παρατηρείται μεταβολή στη μορφή της ανισότητας των φύλων στην εκπαίδευση. Εκτός από την οφειλόμενη στα στερεότυπα ανισότητα, οι διαφορές που υπάρχουν μεταξύ των φύλων στην εκπαίδευση έχουν αρνητικές συνέπειες με οικονομική και κοινωνική διάσταση. Προκύπτει ότι οι γυναίκες εκπροσωπούνται λιγότερο σε σχέση με τους άντρες σε τομείς όπως των μαθηματικών, των επιστημών και της τεχνολογίας, ενώ τα αγόρια έχουν χαμηλότερες επιδόσεις στην ανάγνωση. Αυτά τα δύο μόνο παραδείγματα δείχνουν την αναγκαιότητα βελτίωσης του εκπαιδευτικού συστήματος ώστε να δίνεται η δέουσα προσοχή στις διαφορές των φύλων στον χώρο της εκπαίδευσης. Οι διαφορές των φύλων στην εκπαίδευση είναι ένας από τους τομείς που συχνά αποτελούν αντικείμενο έρευνας. Οι Maccoby και Jacklin [7] επιχείρησαν μια σύνοψη στο βιβλίο τους The Psychology of Sex Differences, όπου εξέτασαν ερευνητικές μελέτες με θέμα τις διαφορές των φύλων. Συμπέραναν ότι ενώ κάποια πρότυπα εμμένουν, όπως η γυναικεία υπεροχή στην ικανότητα προφορικής έκφρασης και η ανωτερότητα των αντρών στις μαθηματικές δεξιότητες, είναι δύσκολο να διασαφηνιστεί η επιρροή των στερεοτύπων στις αντιλήψεις και τις συμπεριφορές των ανθρώπων και να καταστεί ξεκάθαρο εάν και σε ποιον βαθμό οι εγγενείς ή επίκτητες συμπεριφορές ενισχύουν την ανάπτυξη γνωστικών διαφορών μεταξύ των φύλων. Οι Gipps και Murphy [8] επισημαίνουν ότι τα τεστ που παρουσιάζουν διαφορές των φύλων ενδέχεται να μην είναι ακριβή στην πρόβλεψη της επίδοσης ή της μελλοντικής μαθησιακής ικανότητας. Οι διαφορές των φύλων που εξάγονται, ενδεχομένως να οφείλονται στο ίδιο το τεστ ή στις διαφοροποιημένες απαντήσεις που έδωσαν άντρες και γυναίκες, δηλαδή στα στερεότυπα του κοινωνικού φύλου. Τα τεστ μπορεί να μην αντανακλούν ή να προβλέπουν τη μαθησιακή ικανότητα που απαιτείται από το σχολικό αναλυτικό πρόγραμμα, αλλά μάλλον να αντανακλούν αυτό που οι ερευνητές θεωρούν ότι αποτελεί συγκεκριμένη ικανότητα μάθησης. Συνοπτικά, ίσως αυτά τα τεστ να μην έχουν καμία απολύτως χρησιμότητα για να προβλέψουν ποιοι μαθητές είναι πιθανόν να έχουν ιδιαίτερα καλή (ή κακή) επίδοση στο σχολικό πλαίσιο και σημείωσαν ότι το εύρος των διαφορών είναι μικρό σε σύγκριση με τις ομοιότητες των φύλων. Ο Wiliam [9] ισχυρίζεται ότι οι διαφορές των φύλων σε γνωστικό επίπεδο είναι μικρές και τα τελευταία χρόνια έχουν αμβλυνθεί περισσότερο σε κάποια γνωστικά αντικείμενα. Οπως αναφέρει, το πιο σημαντικό εύρημα έγκειται στο γεγονός ότι οι διαφορές των φύλων, ακόμη και σε μαθήματα όπως τα μαθηματικά, είναι μικρές και διαγράφουν σταθερά πτωτική πορεία στη διάρκεια των τελευταίων 20 ετών. Πολύ λίγα τεστ δείχνουν τυπική μέση διαφορά υπέρ των αντρών ή των γυναικών πέραν του 0,4, γεγονός που σημαίνει ότι λιγότερο από το 4% της απόκλισης των βαθμολογιών στα τεστ σχετίζεται με διαφορές των φύλων. 41

42 Σε ότι αφορά πιο συγκεκριμένα τα μαθηματικά, η έρευνα PISA ανέφερε κάποιο πλεονέκτημα για τα αγόρια σε όλους τους γύρους εξετάσεων αν και όχι σε όλες τις χώρες. Η αξιολόγηση PISA 2000 στην περίπτωση εφήβων ηλικίας 15 ετών αποκάλυψε ότι τα αγόρια είχαν καλύτερες βαθμολογίες από τα κορίτσια στις μισές ευρωπαϊκές χώρες, ενώ στις υπόλοιπες δεν καταγράφηκαν διαφορές [10]. Μεγαλύτερο μέρος του πλεονεκτήματος των αγοριών οφειλόταν στο γεγονός ότι περισσότερα αγόρια σημείωσαν εξαιρετικά καλή επίδοση και όχι στη σχετική απουσία αγοριών από τον πληθυσμό όσων είχαν χαμηλή επίδοση. Στους κόλπους των μαθητών με χαμηλή επίδοση (εκείνοι οι μαθητές οι οποίοι τυπικά δεν είναι ικανοί να συμπληρώσουν ένα απλό διαδικαστικό βήμα που αποτελείται από την αναπαράσταση βασικών μαθηματικών γεγονότων ή διαδικασιών ή να εφαρμόσουν απλές υπολογιστικές δεξιότητες), η αναλογία κοριτσιών και αγοριών ήταν περίπου ίση [10]. Τα αποτελέσματα της έρευνας PISA 2003 έδειξαν μάλλον μικρές διαφορές των φύλων στη μαθητική επίδοση, δηλαδή τα αγόρια είχαν σημαντικά καλύτερη επίδοση στα μαθηματικά μόνο στην Ελλάδα, τη Σλοβακία και το Λιχτενστάιν [11]. Μολονότι οι επιδόσεις των κοριτσιών, σε γενικές γραμμές, ήταν παρόμοιες με ε- κείνες των αγοριών, τα κορίτσια είχαν την τάση να αναφέρουν χαμηλότερα επίπεδα ενδιαφέροντος και απόλαυσης για τα μαθηματικά. Κατά μέσον όρο, τα αγόρια είχαν υψηλότερο επίπεδο αυτοπεποίθησης στη διεκπεραίωση συγκεκριμένων εργασιών. Τα αγόρια κατέγραψαν επίσης υψηλότερα επίπεδα αυτοαντίληψης στις μαθηματικές τους δεξιότητες. Αντιστρόφως, τα κορίτσια είχαν υψηλότερα επίπεδα αγωνίας σε σχέση με το συγκεκριμένο γνωστικό αντικείμενο. Η Πολωνία ήταν η μοναδική χώρα που δεν έδειξε σημαντική διαφορά των φύλων στα επίπεδα αυτοαποτελεσματικότητας, αυτοαντίληψης και αγωνίας στα μαθηματικά. Παράλληλα, ούτε η Ιταλία παρουσίασε σημαντικές διαφορές των φύλων όσον αφορά στην αυτοαντίληψη και την αγωνία [11]. Η αξιολόγηση PISA 2006 βρήκε σημαντικό πλεονέκτημα των α- γοριών στο μέσο επίτευγμα στα μαθηματικά σχεδόν στις μισές ευρωπαϊκές χώρες. Δεν σημειώθηκε χάσμα των φύλων στο Βέλγιο, τη Βουλγαρία, τη Δημοκρατία της Τσεχίας, την Εσθονία, την Ελλάδα, τη Γαλλία, τη Λετονία, τη Λιθουανία, τη Σλοβενία, τη Σουηδία, την Ισλανδία, το Λιχτενστάιν και την Τουρκία. 5.2 Περιγραφή Δεδομένων Ο πληθυσμός της έρευνας αυτής αποτελείται από μαθητές γυμνασίου της ορεινής Αχαΐας που άρχισαν και τελείωσαν το γυμνάσιο στο συγκεκριμένο σχολείο. Οι μαθητές αυτοί προέρχονται όχι μόνο από το χωριό όπου βρίσκεται το σχολείο, αλλά και από αρκετά ακόμα μικρότερα χωριά, που βρίσκονται στην ευρύτερη περιοχή και δεν έχουν γυμνάσιο. Η μετακίνηση τους γίνεται καθημερινά με λεωφορείο. Ο πληθυσμός στην ευρύτερη περιοχή του σχολείου είναι κατά κύριο λόγο αγροτικόσ-κτηνοτροφικός. Για κάθε μαθητή που ξεκινάει το γυμνάσιο δημιουργείται μία καρτέλα που τον ακολουθεί έως ότου τελειώσει την φοίτησή του. Στην καρτέλα αυτή υπάρχει, πέρα από τα προσωπικά του στοιχεία, πλήρης καταγραφή των σχολικών του επιδόσεων για κάθε έτος φοίτησής του. Σε κάθε μάθημα που διδάσκεται όλη την σχολική χρονιά αποδίδονται στον μαθητή οι εξής βαθμοί: Βαθμός Α τριμήνου Βαθμός Β τριμήνου Βαθμός Γ τριμήνου 42

43 Βαθμός τελικών γραπτών εξετάσεων Από τους τέσσερις αυτούς βαθμούς εξάγεται ένας μέσος όρος, που είναι και ο τελικός βαθμός για το μάθημα την συγκεκριμένη σχολική χρονιά. Για παράδειγμα ο βαθμός των μαθηματικών για την Α Γυμνασίου θα είναι: Μαθηματικά Α Γυμνασίου = (Βαθμός Α τριμήνου+βαθμός Β τριμήνου+βαθμός Γ τριμήνου+βαθμός τελικών γραπτών εξετάσεων)/4 Προσθέτοντας όλους τους τελικούς βαθμούς των μαθημάτων που διδάχτηκαν την σχολική χρονιά και διαιρώντας με το πλήθος τους έχουμε την συνολική επίδοση για την χρονιά. Η βαθμολογική κλίμακα είναι Για την έρευνα αυτή έχουν χρησιμοποιηθεί οι καρτέλες εβδομήντα μαθητών. Για κάθε μαθητή έχει καταγραφεί από την καρτέλα του για κάθε τάξη η επίδοση στα μαθηματικά, στη γλώσσα και η συνολική επίδοση, καθώς και το φύλο του. Ετσι έχει κατασκευαστεί ένας πίνακάς παρόμοιος με τον πίνακα 5 που φαίνεται παρακάτω: μαθητής μαθητής 1 μαθητής 2... μαθητής 70 φύλο αγόρι κορίτσι... κορίτσι Μαθηματικά Α Γυμνασίου Μαθηματικά Β Γυμνασίου Μαθηματικά Γ Γυμνασίου Γλώσσα Α Γυμνασίου Γλώσσα Β Γυμνασίου Γλώσσα Γ Γυμνασίου Συνολική επίδοση Α Γυμνασίου 15,9 18, ,2 Συνολική επίδοση Β Γυμνασίου 11,7 14, Συνολική επίδοση Γ Γυμνασίου 15 16, ,8 Πίνακας 5: Στοιχεία από τις καρτέλες των μαθητών Η κατανομή των δύο φύλων στο δείγμα δεν διαφέρει πολύ, με τα κορίτσια να υπερέχουν με ποσοστό 54% έναντι των αγοριών που αποτελούν το 46% του δείγματος, όπως φαίνεται και στο κυκλικό διάγραμμα 12. Η μέση τιμή των επιδόσεων στα μαθηματικά του συνόλου των μαθητών για κάθε τάξη φαίνεται στο σχήμα 13, ενώ η αντίστοιχη εικόνα που παρουσιάζουν για το μάθημα της γλώσσας φαίνεται στο σχήμα 14. Η εικόνα της συνολικής επίδοσης των μαθητών για κάθε σχολική χρονιά φαίνεται στο σχήμα 15. Αν τώρα επαναλάβουμε την διαδικασία έχοντας διαχωρίσει το δείγμα σε δύο ομάδες, αγόρια και κορίτσια, θα πάρουμε τις μέσες τιμές για την επίδοση αγοριών - κοριτσιών στα μαθηματικά, την γλώσσα και την συνολική επίδοση όπως φαίνεται στα σχήματα 16, 17 και 18 αντίστοιχα. 43

44 Σχήμα 12: Κατανομή των δύο φύλων στο δείγμα Σχήμα 13: Μέση τιμή της επίδοσης στα μαθηματικά για κάθε τάξη 44

45 Σχήμα 14: Μέση τιμή της επίδοσης στην γλώσσα για κάθε τάξη Σχήμα 15: Μέση τιμή της συνολικής επίδοσης για κάθε τάξη 45

46 Σχήμα 16: Μέση τιμή της επίδοσης στα μαθηματικά για κάθε τάξη αγοριών κοριτσιών Σχήμα 17: Μέση τιμή της επίδοσης στην γλώσσα για κάθε τάξη αγοριών κοριτσιών 46

47 Σχήμα 18: Μέση τιμή της συνολικής επίδοσης για κάθε τάξη αγοριών κοριτσιών 47

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 8.1 Η Φύση των Ψευδομεταβλητών Οι μεταβλητές που παίρνουν τιμές 0 και 1 ονομάζονται ψευδομεταβλητές

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ Το ενδιαφέρον επικεντρώνεται πάντα στον πληθυσμό Το δείγμα χρησιμεύει για εξαγωγή συμπερασμάτων για τον πληθυσμό π.χ. το ετήσιο εισόδημα των κατοίκων μιας περιοχής Τα στατιστικά

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Μοντέλα Παλινδρόμησης Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Εισαγωγή (1) Σε αρκετές περιπτώσεις επίλυσης προβλημάτων ενδιαφέρει η ταυτόχρονη μελέτη δύο ή περισσότερων μεταβλητών, για να προσδιορίσουμε με ποιο

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση II

Απλή Γραμμική Παλινδρόμηση II . Ο Συντελεστής Προσδιορισμού Η γραμμή Παλινδρόμησης στο δείγμα, αποτελεί μία εκτίμηση της γραμμής παλινδρόμησης στον πληθυσμό. Αν και από τη μέθοδο των ελαχίστων τετραγώνων προκύπτουν εκτιμητές που έχουν

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100 Ποσοτικές Μέθοδοι Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR 50100 Απλή Παλινδρόμηση Η διερεύνηση του τρόπου συμπεριφοράς

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση I

Απλή Γραμμική Παλινδρόμηση I Απλή Γραμμική Παλινδρόμηση I. Εισαγωγή Έστω ότι θέλουμε να ερευνήσουμε εμπειρικά τη σχέση που υπάρχει ανάμεσα στις δαπάνες κατανάλωσης και στο διαθέσιμο εισόδημα, των οικογενειών. Σύμφωνα με την Κεϋνσιανή

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Έλεγχοι σταθερότητας των συντελεστών. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Έλεγχοι σταθερότητας των συντελεστών. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 8: Η τεχνική των ψευδομεταβλητών - Έλεγχοι σταθερότητας των συντελεστών Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο «Περιγραφική & Επαγωγική Στατιστική» 1. Πάνω από το 3 ο τεταρτημόριο ενός δείγματος βρίσκεται το: α) 15%

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Οικονομετρία Ι. Ενότητα 2: Ανάλυση Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Οικονομετρία Ι. Ενότητα 2: Ανάλυση Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Οικονομετρία Ι Ενότητα 2: Ανάλυση Παλινδρόμησης Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commos. Για εκπαιδευτικό

Διαβάστε περισσότερα

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation Σταμάτης Πουλακιδάκος Μερικά εισαγωγικά λόγια Οι έλεγχοι των ερευνητικών υποθέσεων πραγματοποιούνται με διάφορους στατιστικούς ελέγχους,

Διαβάστε περισσότερα

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει Θέματα ομάδας A 1. Σε κάποιο πείραμα τύχης μία τυχαία μεταβλητή λαμβάνει τις τιμές = 10 και = 10. Τότε η μέση τιμή x της θα είναι α. 10 β. 10 γ.,5 10 δ. 19,5 10 1= 10, = 10,. Δυο τυχαίες μεταβλητές, ακολουθούν

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ B Δημήτρης Κουγιουμτζής e-mal: dkugu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://uer.auth.gr/~dkugu/teach/cvltraport/dex.html Εφαρμοσμένη Στατιστική:

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Παλινδρόμηση Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

5. Έλεγχοι Υποθέσεων

5. Έλεγχοι Υποθέσεων 5. Έλεγχοι Υποθέσεων Υποθέσεις Η μηδενική υπόθεση Η (ή ΗΑ) εναλλακτική υπόθεση Δεχόμαστε Η Απορρίπτουμε Η Η σωστή Σωστή απόφαση -α Σφάλμα τύπου Ι α Η λάθος Σφάλμα τύπου ΙΙ β Σωστή απόφαση -β ΒΙΟ39-Έλεγχος

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

Διάστημα εμπιστοσύνης της μέσης τιμής

Διάστημα εμπιστοσύνης της μέσης τιμής Διάστημα εμπιστοσύνης της μέσης τιμής Συντελεστής εμπιστοσύνης Όταν : x z c s < μ < x +z s c Ν>30 Στον πίνακα δίνονται κρίσιμες τιμές z c και η αντιστοίχισή τους σε διάφορους συντελεστές εμπιστοσύνης:

Διαβάστε περισσότερα

1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05

1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05 1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05 2. ΜΕΤΑΒΛΗΤΕΣ -ΣΧΕΣΕΙΣ ΜΕΤΑΞΥ ΜΕΤΑΒΛΗΤΩΝ Όλες οι έρευνες αναφέρονται σε μεταβλητές

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη ΕΚΔΟΣΕΙΣ ΚΕΛΑΦΑ 59 Θέμα 1 ο (ΜΑΪΟΣ 004, ΜΑΪΟΣ 008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Έχουμε f (x+h) - f (x) = c - c = 0 και για h 0 είναι f (x + h) - f (x) 0 m

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση

Διαβάστε περισσότερα

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ Α εξεταστική περίοδος χειµερινού εξαµήνου 4-5 ιάρκεια εξέτασης ώρες και 45 λεπτά Θέµατα Θέµα (α) Τα υποδείγµατα που χρησιµοποιούνται στην οικονοµική θεωρία ονοµάζονται ντετερµινιστικά ενώ τα οικονοµετρικά

Διαβάστε περισσότερα

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές Εαρινό εξάμηνο 2018-2019 μήμα Μαθηματικών ΑΠΘ Διδάσκουσα: Αγγελική Παπάνα Μεταδιδακτορική Ερευνήτρια Πολυτεχνική σχολή, Α.Π.Θ. & Οικονομικό μήμα, Πανεπιστήμιο

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Θα εξεταστούν μόνο οι περιπτώσεις των ψευδομεταβλητών που χρησιμοποιούνται σαν ανεξάρτητες μεταβλητές

Θα εξεταστούν μόνο οι περιπτώσεις των ψευδομεταβλητών που χρησιμοποιούνται σαν ανεξάρτητες μεταβλητές Όταν ένα μέγεθος είναι αδύνατο να ποσοτικοποιηθεί αλλά πρέπει οπωσδήποτε να χρησιμοποιηθεί σε ένα υπόδειγμα προσεγγίζεται συνήθως με μια μεταβλητή η οποία ονομάζεται ποιοτική μεταβλητή ή ψευδομεταβλητή.

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 015 Ανάλυση Διακύμανσης Η Ανάλυση Διακύμανσης είναι μία τεχνική που

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών ΟΙΚΟΝΟΜΕΤΡΙΑ Βιολέττα Δάλλα Τµήµα Οικονοµικών Επιστηµών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών 1 Εισαγωγή Οικονοµετρία (Econometrics) είναι ο τοµέας της Οικονοµικής επιστήµης που περιγράφει και αναλύει

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 6: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου 4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου Για την εκτίμηση των παραμέτρων ενός πληθυσμού (όπως η μέση τιμή ή η διασπορά), χρησιμοποιούνται συνήθως δύο μέθοδοι εκτίμησης. Η πρώτη ονομάζεται σημειακή εκτίμηση.

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών ΟΙΚΟΝΟΜΕΤΡΙΑ Βιολέττα Δάλλα Τµήµα Οικονοµικών Επιστηµών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών 1 Μη γραµµικά υποδείγµατα παλινδρόµησης Έστω µία συνάρτηση f = f(x 1,..., X K ) των µεταβλητών X 1,...,

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 30 Μαρτίου 2017 1/32 Ανάλυση Παλινδρόμησης: Γενικά. Με την ανάλυση παλινδρόμησης εξετάζουμε

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 5: Παλινδρόμηση Συσχέτιση θεωρητική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ 1 ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ 1. Ποιες μεταβλητές λέγονται ποσοτικές; (ΓΕΛ 2005) 2. Πότε μια ποσοτική μεταβλητή ονομάζεται διακριτή και πότε συνεχής; (ΓΕΛ 2005,2014) 3. Τι ονοµάζεται απόλυτη

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Η μέθοδος των βοηθητικών μεταβλητών. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Η μέθοδος των βοηθητικών μεταβλητών. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 12: Σφάλματα μέτρησης στις μεταβλητές Η μέθοδος των βοηθητικών μεταβλητών Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (1 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) 5 H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) Περίληψη Σκοπός του κεφαλαίου είναι η εφαρμογή της ανάλυσης συσχέτισης (Pearson r) μέσω του PASW. H ανάλυση συσχέτισης Pearson r χρησιμοποιείται για να εξεταστεί η

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου 4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου Για την εκτίμηση των παραμέτρων ενός πληθυσμού (όπως η μέση τιμή ή η διασπορά), χρησιμοποιούνται συνήθως δύο μέθοδοι εκτίμησης. Η πρώτη ονομάζεται σημειακή εκτίμηση.

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. σε μη γραμμικές μορφές. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. σε μη γραμμικές μορφές. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 7: Επεκτάσεις του γραμμικού υποδείγματος σε μη γραμμικές μορφές Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα