Η εργασία αυτή στοιχειοθετήθηκε με το πρόγραμμα L A TEX. Η συγγραφή έγινε με τη βοήθεια του προγράμματος Kile στο λειτουργικό σύστημα Ubuntu Linux. Γι

Save this PDF as:
 WORD  PNG  TXT  JPG

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Η εργασία αυτή στοιχειοθετήθηκε με το πρόγραμμα L A TEX. Η συγγραφή έγινε με τη βοήθεια του προγράμματος Kile στο λειτουργικό σύστημα Ubuntu Linux. Γι"

Transcript

1 Ανάλυση παλινδρόμησης με χρήση ποιοτικών ερμηνευτικών μεταβλητών: Διευρεύνηση της επίδρασης του φύλου στις επιδόσεις μαθητών του γυμνασίου Ο.Ι. Μαλλή Διατμηματικό Π.Μ.Σ. Μαθηματικά των Υπολογιστών και των Αποφάσεων Πανεπιστήμιο Πατρών Διπλωματική Εργασία Επιβλέπων: Φ. Αλεβίζος 1

2 Η εργασία αυτή στοιχειοθετήθηκε με το πρόγραμμα L A TEX. Η συγγραφή έγινε με τη βοήθεια του προγράμματος Kile στο λειτουργικό σύστημα Ubuntu Linux. Για την ανάπτυξη των προγραμμάτων χρησιμοποιήθηκε η γλώσσα προγραμματισμού R. Οι γραφικές παραστάσεις έγιναν με τη βοήθεια των προγραμμάτων R και Libreoffice. 2

3 Περιεχόμενα 1 Ανάλυση παλινδρόμησης Το κλασσικό γραμμικό μοντέλο Περιγραφή του μοντέλου με μήτρες Εξίσωση παλινδρόμησης Η μέθοδος των ελαχίστων τετραγώνων Γραμμική συσχέτιση Ποιοτικές ερμηνευτικές μεταβλητές Διαχρονικές επιδράσεις μεταβολή του σταθερού όρου β Μεταβολή της κλίσης β Μεταβολή του σταθερού όρου β 0 και της κλίσης β Πολυεπίπεδες ψευδομεταβλητές Μεταβολή του σταθερού όρου β Μεταβολή της κλίσης β Μεταβολή του σταθερού όρου β 0 και της κλίσης β Παράδειγμα μοντέλου που περιέχει αλληλεπίδραση Περισσότερες από μια ποιοτικές ερμηνευτικές μεταβλητές Κατά τμήματα γραμμική παλινδρόμηση Περισσότερα από δύο τμήματα στην γραμμή παλινδρόμησης Ασυνέχεια στην συνάρτηση παλινδρόμησης Εφαρμογή των ψευδομεταβλητών στις χρονοσειρές Προβληματισμοί σε σχέση με την χρήση μεταβλητών δεικτών Μεταβλητές δείκτες ενάντια στην χορήγηση κωδικών Μεταβλητές δείκτες ενάντια στις ποσοτικές μεταβλητές Άλλες κωδικοποιήσεις για τις μεταβλητές δείκτες Εξαρτημένη μεταβλητή δείκτης Ελεγχος υποθέσεων Η μηδενική και η εναλλακτική υπόθεση Σφάλματα κατά τον έλεγχο υποθέσεων Ελεγχος για την διαφορά των μέσων τιμών δυο πληθυσμών Στατιστικός έλεγχος του γραμμικού μοντέλου Συντελεστής προσδιορισμού Ελεγχος της υπόθεσης β i = Ελεγχος της υπόθεσης β 1 =... = β k = Ελεγχος της υπόθεσης β h+1 = β h+2 =... = β k = Ελεγχος για τον συντελεστή συσχέτισης Σύγκριση δυο συντελεστών συσχέτισης Σχέση του φύλου του μαθητή με τις επιδόσεις του Ερευνες για τις διαφορές των φύλων Περιγραφή Δεδομένων Σύγκριση των μέσων τιμών Το γραμμικό μοντέλο Εφαρμογή του γραμμικού μοντέλου στα δεδομένα Σχέση επίδοσης στα μαθηματικά με την μέση επίδοση

4 5.5.2 Σχέση επίδοσης στη γλώσσα με την μέση επίδοση Μεταβολή της επίδοσης στα μαθηματικά από την Α στην Γ Γυμνασίου Μεταβολή της επίδοσης στη γλώσσα από την Α στην Γ Γυμνασίου Εφαρμογή της κατά τμήματα γραμμικής παλινδρόμησης Συμπεράσματα 89 Κατάλογος Σχημάτων 1 Μέθοδος των ελαχίστων τετραγώνων Μεταβολή του σταθερού όρου β Μεταβολή της κλίσης β Μεταβολή του σταθερού όρου β 0 και της κλίσης β Μεταβολή του σταθερού όρου β 0 σε καταστάσεις Α, Β, Γ και Δ Ταχύτητα ανταπόκρισης μιας επιχείρησης σε μια καινοτομία σε σχέση με το μέγεθος της Υπαρξη αλληλεπίδρασης μεταξύ του τύπου και του μεγέθους της επιχείρησης Κατά τμήματα γραμμική παλινδρόμηση Ασυνέχεια στην συνάρτηση παλινδρόμησης Κατανομή των δειγματικών μέσων Γραμμή παλινδρόμησης Ŷt = b 0 + b 1 X Κατανομή των δύο φύλων στο δείγμα Μέση τιμή της επίδοσης στα μαθηματικά για κάθε τάξη Μέση τιμή της επίδοσης στην γλώσσα για κάθε τάξη Μέση τιμή της συνολικής επίδοσης για κάθε τάξη Μέση τιμή της επίδοσης στα μαθηματικά για κάθε τάξη αγοριών κοριτσιών Μέση τιμή της επίδοσης στην γλώσσα για κάθε τάξη αγοριών κοριτσιών Μέση τιμή της συνολικής επίδοσης για κάθε τάξη αγοριών κοριτσιών Επίδοση στα μαθηματικά σε σχέση με την συνολική επίδοση για την Α Γυμνασίου Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στα μαθηματικά (Α Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση-επίδοση στα μαθηματικά(β Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση-επίδοση στα μαθηματικά(γ Γυμνασίου) Ευθείες παλινδρόμησης: Μέσος συνολική επίδοση - Μέσος μαθηματικά Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στη γλώσσα (Α Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στη γλώσσα (Β Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στη γλώσσα (Γ Γυμνασίου) Ευθείες παλινδρόμησης: Μέσος συνολική επίδοση - Μέσος γλώσσα 76 4

5 28 Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στα μαθηματικά(διαφορά από την Α στην Γ Γυμνασίου) Ευθείες παλινδρόμησης: συνολική επίδοση - επίδοση στη γλώσσα(διαφορά από την Α στην Γ Γυμνασίου) Κατά τμήματα γραμμική παλινδρόμηση(μέσος συνολική επίδοσημέσος γλώσσα) Κατά τμήματα γραμμική παλινδρόμηση(μέσος συνολική επίδοσημέσος μαθηματικά) Κατάλογος Πινάκων 1 Συχνότητα χρήσης προϊόντος Κατανομή πιθανοτήτων Σχέση μεταξύ απόφασης και πραγματικής κατάστασης της H Ανάλυση διασποράς Στοιχεία από τις καρτέλες των μαθητών Αποτελέσματα σύγκρισης των μέσων τιμών(μαθηματικά) Αποτελέσματα σύγκρισης των μέσων τιμών(γλώσσα) Αποτελέσματα σύγκρισης των μέσων τιμών(συνολική επίδοση) Αποτελέσματα για τα μαθηματικά της Α Γυμνασίου Αποτελέσματα για τα μαθηματικά της Β Γυμνασίου Αποτελέσματα για τα μαθηματικά της Γ Γυμνασίου Στοιχεία από τις καρτέλες των μαθητών με τους μέσους μαθηματικών και συνολικής επίδοσης Αποτελέσματα για τα μαθηματικά (μέσος όρος Α Β Γ Γυμνασίου) Αποτελέσματα για τη γλώσσα της Α Γυμνασίου Αποτελέσματα για τη γλώσσα της Β Γυμνασίου Αποτελέσματα για τη γλώσσα της Γ Γυμνασίου Αποτελέσματα για τη γλώσσα(μέσος όρος Α Β Γ Γυμνασίου) Αποτελέσματα σύγκρισης των μέσων τιμών(μεταβολή της επίδοσης στα μαθηματικά από την Α στην Γ Γυμνασίου) Αποτελέσματα για την μεταβολή της επίδοσης στα μαθηματικά από την Α στην Γ Γυμνασίου Αποτελέσματα έλεγχου για τον συντελεστή συσχέτισης (μεταβολή της επίδοσης στα μαθηματικά από την Α στην Γ Γυμνασίου) Αποτελέσματα σύγκρισης των μέσων τιμών(μεταβολή της επίδοσης στη γλώσσα από την Α στην Γ Γυμνασίου) Αποτελέσματα για την μεταβολή της επίδοσης στη γλώσσα από την Α στην Γ Γυμνασίου Αποτελέσματα έλεγχου για τον συντελεστή συσχέτισης (μεταβολή της επίδοσης στη γλώσσα από την Α στην Γ Γυμνασίου) Αποτελέσματα κατά τμήματα γραμμικής παλινδρόμησης (μέσος συνολική επίδοση-μέσος μαθηματικά) Αποτελέσματα κατά τμήματα γραμμικής παλινδρόμησης (μέσος συνολική επίδοση-μέσος γλώσσα)

6 Ευχαριστίες Θα ήθελα να ευχαριστήσω θερμά τον καθηγητή μου κ.φίλιππο Αλεβίζο για την καθοδήγηση του, χάρη στην οποία ολοκλήρωσα την εργασία αυτή και είχα την ευκαιρία να ασχοληθώ με ένα θέμα σύμφωνο με τα επαγγελματικά μου ενδιαφέροντα. Ευχαριστώ επίσης τα μέλη της τριμελούς επιτροπής κ.ευτύχιο Παπαδοπετράκη και κ.κωνσταντίνο Πετρόπουλο. Ενα ιδιαίτερο ευχαριστώ στον διευθυντή του σχολείου από όπου άντλησα τα δεδομένα που χρησιμοποίησα στην παρούσα εργασία. Τέλος θα ήθελα να ευχαριστήσω την οικογένειά μου για την συμπαράσταση που μου προσέφερε κατά την διάρκεια της εκπόνησης της εργασίας μου. Ουρανία Μαλλή Πάτρα, Σεπτέμβριος

7 Περίληψη Σε πολλά προβλήματα υπάρχει η ανάγκη να ασχοληθούμε ταυτόχρονα με την μελέτη δύο μεταβλητών ώστε να δούμε αν υπάρχει αλληλεξάρτηση μεταξύ τους, καθώς και να εντοπίσουμε την σχέση που εκφράζει αυτήν την αλληλεξάρτηση. Η σχέση αυτή ονομάζεται εξίσωση παλινδρόμησης και περιγράφει τον τρόπο αλληλεξάρτησης των μεταβλητών, τον κανόνα δηλαδή που διαμορφώνει τις τιμές της μιας μεταβλητής από τις τιμές της άλλης. Η πρώτη θα ονομάζεται ανεξάρτητη (ερμηνευτική) και η δεύτερη που οι τιμές της θα καθορίζονται από αυτές της πρώτης εξαρτημένη(ερμηνευόμενη). Κάποιες φορές οι ερμηνευτικές μεταβλητές που χρησιμοποιούμε είναι ποιοτικές και υπάρχουν τρόποι ποσοτικού προσδιορισμού των κατηγοριών μιας ποιοτικής μεταβλητής. Η μελέτη αυτή έχει ως στόχο την διερεύνηση της σχέσης του φύλου του μαθητή με τις επιδόσεις του στα μαθηματικά, ώστε να αναλυθούν οι διαφορές που εμφανίζονται μεταξύ των δυο φύλων. Για τον σκοπό αυτό θα χρησιμοποιηθούν γραμμικά μοντέλα, όπου όμως η ερμηνευτική μεταβλητή(το φύλο) είναι ποιοτική. Θα γίνει ποσοτικός προσδιορισμός των κατηγοριών της με την χρήση δύο τιμών: 0 αν είναι κορίτσι, 1 αν είναι αγόρι. Ο πληθυσμός της έρευνας αποτελείται από μαθητές γυμνασίου της ορεινής Αχαΐας που άρχισαν και τελείωσαν το γυμνάσιο στο συγκεκριμένο σχολείο. Για κάθε μαθητή έχει καταγραφεί από την καρτέλα του για κάθε τάξη η επίδοση στα μαθηματικά, στη γλώσσα, η συνολική επίδοση και το φύλο. 7

8 1 Ανάλυση παλινδρόμησης Ιστορικά ο όρος παλινδρόμηση(regression) χρησιμοποιήθηκε για πρώτη φορά το 1877 από τον Άγγλο ανθρωπολόγο SirF rancisgalton( ), ο οποίος μελετώντας τη σχέση μεταξύ των αναστημάτων γονέων και παιδιών παρατήρησε ένα είδος επαναφοράς (παλινδρόμησης) των αναστημάτων των παιδιών στα αναστήματα των γονέων τους. Με την ανάλυση παλινδρόμησης εξετάζουμε τη σχέση μεταξύ δύο ή περισσοτέρων μεταβλητών για να προσδιορίσουμε με ποιόν τρόπο οι μεταβλητές αυτές σχετίζονται μεταξύ τους. Στόχος μας είναι να προβλέψουμε τις τιμές της μιας μέσω των τιμών της άλλης ή των άλλων. Διακρίνουμε δύο είδη μεταβλητών: τις ανεξάρτητες και τις εξαρτημένες. Η ύπαρξη συναρτησιακής σχέσης που περιγράφει τον τρόπο αλληλεξάρτησης μεταξύ των μεταβλητών μπορεί να είναι εξαιρετικά πολύτιμη για την πρόβλεψη των τιμών μιας μεταβλητής από τις γνώσεις που διαθέτουμε για άλλες μεταβλητές υπό κάποιες συγκεκριμένες συνθήκες. Ας θεωρήσουμε δύο μεταβλητές X, Y. Αν οι μεταβλητές αυτές συνδέονται με μια σχέση της μορφής Y = f(x) μέσω της οποίας για κάθε τιμή της X μπορούμε να προβλέψουμε ακριβώς την τιμή της Y, δηλαδή αν οι τιμές της Y δεν υπόκεινται σε σφάλματα, τότε λέμε ότι οι δύο μεταβλητές συνδέονται με τη συναρτησιακήπροσδιοριστική(deterministic) σχέση Y = f(x). Σε αυτή την περίπτωση τα σημεία του διαγράμματος διασποράς βρίσκονται όλα πάνω στην καμπύλη που έχει εξίσωση Y = f(x) και όσες φορές και αν επαναλάβουμε το πείραμα θέτοντας X = x i, θα παίρνουμε πάντα την ίδια τιμή για το Y. Οι μη προσδιοριστικές σχέσεις μεταξύ μεταβλητών ονομάζονται στοχαστικές, στατιστικές (stochastic, probabilistic) σχέσεις. Στην περίπτωση αυτή, αν X είναι η ανεξάρτητη και Y η εξαρτημένη μεταβλητή, η U βρίσκεται σε στοχαστική σχέση-εξάρτηση από τη X, γιατί επηρεάζεται και από άλλους παράγοντες. Στην περίπτωση αυτή, αν επαναλάβουμε το πείραμα πολλές φορές θέτοντας Q = x i τότε στην τιμή x i της X δεν αντιστοιχεί μια μόνο τιμή y i της Y αλλά γενικά αντιστοιχεί ένα πλήθος διαφορετικών τιμών της Y. Σε μια στοχαστική σχέση το διάγραμμα διασποράς είναι γενικά ένα νέφος σημείων το οποίο πολλές φορές καθορίζει μια ιδεατή γραμμή η οποία δίνει μια πρώτη εικόνα της σχέσης που συνδέει τις δύο μεταβλητές. 1.1 Το κλασσικό γραμμικό μοντέλο Στο κλασσικό γραμμικό μοντέλο ασχολούμαστε με την μελέτη δυο μεταβλητών X ανεξάρτητη-ερμηνευτική και Y εξαρτημένη - ερμηνευόμενη και ψάχνω μια συναρτησιακή σχέση Y = f(x). Το X όμως δεν είναι ο μόνος παράγοντας που καθορίζει την τιμή του Y. Ετσι το μοντέλο γίνεται στοχαστικό με την εισαγωγή τυχαίου παράγοντα ε. και η σχέση γίνεται Y = f(x) + ε. Στην γενική μορφή με K ερμηνευτικές μεταβλητές και T παρατηρήσεις οι υποθέσεις είναι: όπου Y i = β 0 + β 1 X i1 + β 2 X i β K X ik + ε i E(ε i ) = 0, i = 1,..., T 8

9 V ar(ε i ) = σ 2, i = 1,..., T Ανά δύο είναι γραμμικά ασυσχέτιστες Cov(ε i, ε j ) i j ε i N(0, σ 2 ) i = 1,..., T 1.2 Περιγραφή του μοντέλου με μήτρες Η σχέση του γραμμικού μοντέλου μπορεί να γραφτεί Y i = β 0 X i0 + β 1 X i1 + β 2 X i β K X ik + ε i όπου X i0 = 1 i = 1,..., T, οπότε σε ένα δείγμα T παρατηρήσεων έχουμε το σύστημα: Y 1 = β 0 X 10 + β 1 X 11 + β 2 X β K X 1K + ε 1 Y 2 = β 0 X 20 + β 1 X 21 + β 2 X β K X 2K + ε 2... Y T = β 0 X T 0 + β 1 X T 1 + β 2 X T β K X T K + ε T Με τη χρήση μητρών το σύστημα μπορεί να γραφτεί: Y 1 β Y 2 1 X 11 X 12 X 0 ε 1 1K... = β ε X T 1 X T 2 X T K ή Y T Y = Xβ + ε β K και οι υποθέσεις του γραμμικού μοντέλου διατυπώνονται: E(ε) = 0 ε T E(εε ) = σ 2 I 1.3 Εξίσωση παλινδρόμησης Το X είναι αριθμητική μεταβλητή, σταθερά. Τα β 0 και β 1 άγνωστες παράμετροι αλλά σταθερές, το ε i τυχαία μεταβλητή και οι υποθέσεις του περνάνε στο Y, άρα είναι και αυτό τυχαία μεταβλητή. Για δεδομένη τιμή λοιπόν του X δεν υπάρχει μοναδική τιμή του Y αλλά κατανομή. Για την μέση τιμή και την διακύμανση έχουμε: E(Y i ) = E(β 0 + β 1 X i + ε i ) = E(β 0 ) + E(β 1 X i ) + E(ε i ) = β 0 + β 1 X i 9

10 V ar(y i ) = E(Y i EY i ) 2 = E(β 0 + β 1 X i + ε i β 0 β 1 X i ) 2 = E(ε i ) 2 = σ 2 Άρα Y i (β 0 + β 1 X i, σ 2 ) Η πληθυσμιακή εξίσωση παλινδρόμησης είναι: E(Y i ) = β 0 + β 1 X i ενώ ο τυχαίος παράγοντας ε i διαμορφώνει την τιμή του: Y i = E(Y i ) + ε i Χωρίς όμως τις τιμές των παραμέτρων β 0 και β 1 δεν μπορούμε να γνωρίζουμε την πληθυσμιακή εξίσωση παλινδρόμησης, οπότε θα εκτιμήσουμε τις τιμές τους μέσα από δείγμα παρατηρήσεων των μεταβλητών X και Y. Αν οι εκτιμητές τους είναι αντίστοιχα b 0 και b 1 τότε έχουμε την δειγματική εξίσωση παλινδρόμησης (sample regression line) Ŷ = b 0 + b 1 X i όπου Ŷ είναι η τιμή της Y που υπολογίζουμε από την δειγματική εξίσωση παλινδρόμησης Η διαφορά μεταξύ των δύο τιμών ονομάζεται κατάλοιπο(residual) e i = Y i Ŷi και λειτουργεί ως εκτιμητής του τυχαίου παράγοντα ε i. 1.4 Η μέθοδος των ελαχίστων τετραγώνων Μέσα από το πλήθος των δυνατών εκτιμήσεων των παραμέτρων β 0 και β 1 πρέπει να επιλέξουμε. Η μέθοδος των ελαχίστων τετραγώνων προκρίνει αυτούς που σε ένα δείγμα από k παρατηρήσεις X, Y ελαχιστοποιούν την συνάρτηση (e 2 i ). Συνίσταται δηλαδή στον προσδιορισμό των παραμέτρων β 0 και β 1 ώστε να ελαχιστοποιείται το άθροισμα των τετραγώνων των κατακόρυφων αποστάσεων των σημείων x, y από την ευθεία Ŷ = b 0 + b 1 X i, όπως φαίνεται και στο σχήμα 1. Η ελαχιστοποίηση της (e 2 i ) ως συνάρτηση των b 0 και b 1 οδηγεί σε ένα ομογενές σύστημα δυο εξισώσεων με δυο αγνώστους και έτσι έχουμε τις κανονικές εξισώσεις: (Yi ) = kb 0 + b 1 (Xi ) (Yi X i ) = b 0 (Xi ) + b 1 (X 2 i ) που όταν λυθεί το σύστημα δίνει τους εκτιμητές: (Xi X)(Y i Y ) b 1 = (Xi X) 2 b 0 = Y b 1 X Η γενική μορφή του γραμμικού μοντέλου 10

11 Y Ŷ t =b 0 +b 1 X t e t Y t Ŷ t Y t X t X Σχήμα 1: Μέθοδος των ελαχίστων τετραγώνων όπου Y i = β 0 X i0 + β 1 X i1 + β 2 X i β K X ik + ε i X i0 = 1 i = 1,..., T σε ένα δείγμα T παρατηρήσεων μπορεί να γραφτεί με μήτρες και οι κανονικές εξισώσεις θα έχουν την μορφή: (X X)b = X Y ενώ οι εκτιμητές ελαχίστων τετραγώνων δίνονται από την σχέση b = (X X) 1 X Y όπου T (X1 )... (XK ) X X = (X1 ) (X 2 1 )... (X1 X K ) (XK ) (X1 X K )... (X 2 K ) b 0 b = b 1... b K 11

12 Αφού για τα κατάλοιπα ισχύει ότι: (Y ) X Y = (Y X1 )... (Y XK ) e i = Y i Ŷi οι τιμές τους σε μορφή πίνακα θα δίνεται από τον τύπο: όπου e = Y Ŷ Ŷ = Xb 1.5 Γραμμική συσχέτιση Ŷ 1 Ŷ = Ŷ2... ˆ Y T e 0 e = e 1... Οταν τα σημεία στο διάγραμμα διασποράς δύο μεταβλητών βρίσκονται γύρω α- πό μια ευθεία έχουν γραμμική συσχέτιση(linear correlation) Η ευθεία γύρω από την οποία συγκεντρώνονται τα σημεία του διαγράμματος διασποράς λέγεται ευθεία παλινδρόμησης(regression line). Δυο μεταβλητές λέγονται θετικά συσχετισμένες όταν η αύξηση των τιμών της μιας συνεπάγεται αύξηση των τιμών της άλλης, ενώ αρνητικά συσχετισμένες όταν η αύξηση των τιμών της μιας συνεπάγεται μείωση των τιμών της άλλης. Είναι απαραίτητη η χρήση μέτρου για τον βαθμό συσχέτισης μεταξύ των μεταβλητών, έναν αριθμό που ονομάζεται συντελεστές συσχέτισης (correlation coefficient). Για δύο μεταβλητές X και Y μέτρο της γραμμικής συσχέτισης τους είναι ο καθαρός αριθμός που δίνεται από τον τύπο r = cov(x, Y )/s x s y και μεταβάλλεται από -1 έως +1. Ονομάζεται συντελεστής Pearson και όταν έ- χουμε τέλεια θετική συσχέτιση παίρνει την τιμή +1 ενώ στην τέλεια αρνητική την τιμή -1. Στην περίπτωση που δεν υπάρχει συσχέτιση ισχύει ότι r = 0. e T 12

13 2 Ποιοτικές ερμηνευτικές μεταβλητές Σε πολλά προβλήματα οι εμπλεκόμενες μεταβλητές είναι ποιοτικές, όπως το φύλο, το χρώμα ή μια κατάσταση. Ενας σοβαρός περιορισμός της γραμμικής παλινδρόμησης είναι ότι οι εμπλεκόμενες μεταβλητές είναι ποσοτικές. Ο περιορισμός αυτός μπορεί να αρθεί και να εισαχθούν οι ποιοτικές μεταβλητές στο γραμμικό μοντέλο μέσω της χρήσης ψευδομεταβλητών (dummy variables), που αριθμητικοποιούν τα ποιοτικά χαρακτηριστικά. Εστω ότι μας ενδιαφέρει να μελετήσουμε την επίδραση της ποιοτικής μεταβλητής φύλο στην ποσοτική σχολική επίδοση Αντιστοιχίζουμε λοιπόν την μεταβλητή φύλο σε δυο διαφορετικά και αμοιβαίως αποκλειόμενα επίπεδα για να λάβουμε υπόψιν μας ότι τα διαφορετικά αυτά επίπεδα επιδρούν με διαφορετικό τρόπο στην εξαρτημένη μεταβλητή σχολική επίδοση. Συνήθως για να ορίσουμε μια ψευδομεταβλητή χρησιμοποιούμε μια μεταβλητή δείκτη (indicator variable) με τιμές 0 ή 1. Ετσι μας δείχνει σε ποια από τις δύο προκαθορισμένες κατηγορίες της ποιοτικής μεταβλητής ανήκει η παρατήρηση. Οταν θέλουμε να ποσοτικοποιήσουμε μια ποιοτική μεταβλητή που παίρνει τιμές σε περισσότερες από δύο προκαθορισμένες κατηγορίες, έστω με n κατηγορίες. Τότε χρειαζόμαστε n 1 ψευδομεταβλητές. Στην περίπτωση της ποιοτικής μεταβλητής φύλο η δίτιμη ψευδομεταβλητή έχει την μορφή: { 1 για άνδρα X = 0 για γυναίκα Αυτή η έκφραση είναι αυθαίρετη και δεν θα είχε κάποια διαφορά στο αποτέλεσμα αν η ποσοτικοποίηση της ποιοτικής μεταβλητής φύλο γινόταν με ψευδομεταβλητή που θα είχε την μορφή: { 1 για άνδρα X = 1 για γυναίκα Στην περίπτωση της ποιοτικής μεταβλητής με n κατηγορίες αυτή που μένει ονομάζεται κατηγορία αναφοράς. Στο παράδειγμα μας κατηγορία αναφοράς είναι αυτή των γυναικών. Αν είχαμε ως ποιοτική μεταβλητή το χρώμα με τρεις κατηγορίες, κόκκινο, κίτρινο, μπλε θα χρειαζόμασταν δύο ψευδομεταβλητές: { 1 κόκκινο X 1 = 0 αλλιώς και X 2 = { 1 κίτρινο 0 αλλιώς οπότε όταν X 1 = X 2 = 0 θα ανήκει η παρατήρηση στην κατηγορία μπλε που θα είναι και η κατηγορία αναφοράς Συχνά χρησιμοποιούμε τις ψευδομεταβλητές για να φτιάξουμε μοντέλα για τις κατηγορίες της ποιοτικής μεταβλητής και στη συνέχεια να τα συγκρίνουμε. Στην περίπτωση που οι ψευδομεταβλητές έχουν δύο κατηγορίες ονομάζονται δίτιμες, ενώ αν έχουν περισσότερες πολυεπίπεδες. Για τις ποιοτικές μεταβλητές οι έλεγχοι υποθέσεων που γίνονται έχουν ως στόχο να διερευνηθεί η σχέση ποσοτικής - ποιοτικής μεταβλητής και δεν επηρεάζονται από τον αυθαίρετο ορισμό των ψευδομεταβλητών. Ωστόσο χρειάζεται προσοχή στην ερμηνεία των αποτελεσμάτων με γνώμονα πάντα την εκάστοτε ποσοτικοποίηση της ποιοτικής μεταβλητής. 13

14 2.1 Διαχρονικές επιδράσεις Μια συνηθισμένη εφαρμογή των ψευδομεταβλητών είναι για την ανάλυση των διαχρονικών επιδράσεων Εστω η εξαρτημένη μεταβλητή Y που θέλω να την μελετήσω για ένα χρονικό διάστημα το οποίο όμως είναι ποιοτική μεταβλητή που παίρνει τιμές δυο διαφορετικές καταστάσεις, Α και Β. Οπότε για την εκτίμηση του Y λαμβάνω υπόψιν αν το χρονικό διάστημα ανήκει στην κατάσταση Α ή Β. Στην περίπτωση που εκτός από το χρονικό διάστημα υπάρχει και ανεξάρτητη ποσοτική μεταβλητή X 1 για να λύσουμε το πρόβλημα θα έπρεπε να εκτιμήσουμε δυο γραμμικά μοντέλα, ένα για κάθε χρονικό διάστημα. κατάσταση Α : Y i = β 0 + β 1 X i1 + ε i κατάσταση Β : Y i = β 0 + β 1X i1 + ε i Η μεταβολή από την μια κατάσταση στην άλλη μπορεί να αναφέρεται στον σταθερό όρο β 0, στην κλίση β 1 ή και στα δύο μεταβολή του σταθερού όρου β 0 Στην περίπτωση που έχω μεταβολή μόνο στον σταθερό όρο β 0 το διπλό μοντέλο θα διαμορφώνεται: κατάσταση Α : Y i = β 0 + β 1 X i1 + ε i κατάσταση Β : Y i = β 0 + β 1 X i1 + ε i Εναλλακτικά του διπλού μοντέλου αν γίνει χρήση ψευδομεταβλητής για την ποιοτική μεταβλητή X 2 που ορίζεται ως εξής: { 1 κατάσταση Α X 2 = 0 κατάσταση Β το μοντέλο απλοποιείται και γίνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + ε i κατάσταση Α με X 2 = 1: Y i = β 0 + β 2 + β 1 X i1 + ε i κατάσταση Β με X 2 = 0: Y i = β 0 + β 1 X i1 + ε i Ο συντελεστής β 2 της ψευδομεταβλητής X 2 παριστάνει την διαφορά του σταθερού όρου ανάμεσα στις καταστάσεις Α και Β (βλέπε σχήμα 2). Οι παράλληλες ευθείες δείχνουν ότι η επιμέρους επίδραση κάθε ανεξάρτητης μεταβλητής είναι ίδια ανεξάρτητα από την συγκεκριμένη τιμή στην οποία η άλλη ανεξάρτητη μεταβλητή παραμένει σταθερή. Στην συνέχεια προχωράμε σε έλεγχο υποθέσεων για το αν πραγματικά η Y επηρεάζεται από την κατάσταση Α ή Β. Αυτό σημαίνει έλεγχο σημαντικότητας για τον συντελεστή β 2 της ψευδομεταβλητής X 2 ως εξής: H 0 : β 2 = 0 H 1 : β 2 0 Αν β 2 = 0 τότε οι δυο ευθείες είναι ταυτιζόμενες και κάτι τέτοιο σημαίνει ότι δεν υπάρχει στατιστικά σημαντική διαφορά εξαιτίας των καταστάσεων Α και Β. 14

15 Y E(Y )=β 0 +β 2 +β 1 X 1 Κατάσταση Α Κατάσταση Β β 2 E(Y )=β 0 +β 1 X 1 X 1 Σχήμα 2: Μεταβολή του σταθερού όρου β Μεταβολή της κλίσης β 1 Στην περίπτωση που έχω μεταβολή μόνο της κλίσης β 1 το διπλό μοντέλο θα διαμορφώνεται: κατάσταση Α : Y i = β 0 + β 1 X i1 + ε i κατάσταση Β : Y i = β 0 + β 1X i1 + ε i Αντί για το διπλό μοντέλο μπορεί να γίνει χρήση της της μεταβλητής X 1 X 2 που είναι γινόμενο της ποσοτικής μεταβλητής X 1 και της ψευδομεταβλητής X 2 και λέγεται πολλαπλασιαστική ψευδομεταβλητή (multiplicative dummy variable). { 1 κατάσταση Α X 2 = 0 κατάσταση Β οπότε κατά συνέπεια θα έχει τιμές { X1 κατάσταση Α X 1 X 2 = 0 κατάσταση Β το μοντέλο απλοποιείται και γίνεται : κατάσταση Α με X 1 X 2 = X 1 : Y i = β 0 + β 1 X i1 + β 2 X 1i X i2 + ε i Y i = β 0 + β 1 X i1 + β 2 X i2 + ε i = β 0 + (β 1 + β 2 )X i1 + ε i 15

16 κατάσταση Β με X 1 X 2 = 0: Y i = β 0 + β 1 X i1 + ε i Ο συντελεστής β 2 της ψευδομεταβλητής X 1 X 2 παριστάνει την διαφορά της κλίσης ανάμεσα στις καταστάσεις Α και Β (σχήμα 3). Y E(Y )=β 0 +(β 1 + β 2 ) X 1 Κατάσταση Α Κατάσταση Β β 0 E(Y )=β 0 +β 1 X 1 X 1 Σχήμα 3: Μεταβολή της κλίσης β 1 Στην συνέχεια προχωράμε σε έλεγχο υποθέσεων για το αν πραγματικά η Y επηρεάζεται από την κατάσταση Α ή Β. Αυτό σημαίνει έλεγχο σημαντικότητας για τον συντελεστή β 2 της ψευδομεταβλητής X 1 X 2 ως εξής: H 0 : β 2 = 0 H 1 : β 2 0 Αν β 2 = 0 τότε οι δυο ευθείες είναι ταυτιζόμενες και κάτι τέτοιο σημαίνει ότι δεν υπάρχει στατιστικά σημαντική διαφορά εξαιτίας των καταστάσεων Α και Β Μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 Στην περίπτωση που έχω μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 το μοντέλο θα διαμορφώνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i1 X i2 + ε i οπότε για τις δυο περιπτώσεις αφού η ποιοτική μεταβλητή X 2 παίρνει τιμές: 16

17 θα έχω: { 1 κατάσταση Α X 2 = 0 κατάσταση Β κατάσταση Α με X 2 = 1: Y i = β 0 + β 1 X i1 + β 2 + β 3 X i1 + ε i = (β 0 + β 2 ) + (β 1 + β 3 )X i1 + ε i κατάσταση Β με X 2 = 0: Y i = β 0 + β 1 X i1 + ε i (σχήμα 4) Y E(Y )=( β 0 +β 2 )+(β 1 +β 3 ) X 1 Κατάσταση Α Κατάσταση Β β 2 E(Y )=β 0 +β 1 X 1 X 1 Σχήμα 4: Μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 Στην συνέχεια προχωράμε σε διπλό έλεγχο υποθέσεων για το αν πραγματικά η Y επηρεάζεται από την κατάσταση Α ή Β. Αυτό σημαίνει: t-έλεγχο για τον συντελεστή β 3 της ψευδομεταβλητής X 1 X 2 ως εξής: H 0 : β 2 = 0 H 1 : β 2 0 και F -έλεγχο για τους συντελεστές β 2 και β 3 : H 0 : β 2 = β 3 = 0 H 1 : β 2 0 ή β

18 2.2 Πολυεπίπεδες ψευδομεταβλητές Οταν θέλουμε να ποσοτικοποιήσουμε μια ποιοτική μεταβλητή που παίρνει τιμές σε περισσότερες από δύο προκαθορισμένες κατηγορίες, έστω με n κατηγορίες, τότε χρειαζόμαστε n 1 ψευδομεταβλητές. Εστω ότι έχω το μοντέλο : Y i = β 0 + β 1 X i1 + ε i όπου το Y είναι συνάρτηση της ποσοτικής ερμηνευτικής μεταβλητής X 1 και οι παρατηρήσεις μου αναφέρονται σε τέσσερις διαφορετικές καταστάσεις Α, Β, Γ και Δ Μεταβολή του σταθερού όρου β 0 Αν επηρεάζεται μόνο ο σταθερός όρος θα χρειαστώ τρεις ψευδομεταβλητές και αν επιλέξω ως κατηγορία αναφοράς την κατάσταση Δ θα οριστούν ως εξής: { 1 κατάσταση Α X 2 = 0 αλλιώς { 1 κατάσταση Β X 3 = 0 αλλιώς { 1 κατάσταση Γ X 4 = 0 αλλιώς και προφανώς όταν X 2 = X 3 = X 4 = 0 σημαίνει ότι η παρατήρηση ανήκει στην κατάσταση Δ. Με την χρήση των ψευδομεταβλητών το μοντέλο γράφεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i3 + β 4 X i4 + ε i και στις τέσσερις διαφορετικές καταστάσεις θα έχω: κατάσταση Α με X 2 = 1 και X 3 = X 4 = 0:Y i = β 0 + β 1 X i1 + β 2 + ε i κατάσταση Β με X 3 = 1 και X 2 = X 4 = 0:Y i = β 0 + β 1 X i1 + β 3 + ε i κατάσταση Γ με X 4 = 1 και X 2 = X 3 = 0:Y i = β 0 + β 1 X i1 + β 4 + ε i κατάσταση Δ με X 2 = X 3 = X 4 = 0:Y i = β 0 + β 1 X i1 + ε i (σχήμα 5) Ο σταθερός όρος β 0 αντιστοιχεί στον σταθερό όρο της κατάστασης Δ, ενώ οι συντελεστές των ψευδομεταβλητών β 2, β 3 και β 4 αντιστοιχούν στην διαφορά ανάμεσα στον σταθερό όρο της κατάστασης Δ και στον σταθερό όρο των καταστάσεων Α, Β και Γ αντίστοιχα. Θα κάνουμε F -έλεγχο για τους συντελεστές β 2, β 3 και β 4 H 0 : β 2 = β 3 = β 4 = 0 H 1 : β 2 0 ή β 3 0 ή β

19 Y E(Y )=( β 0 +β 4 )+β 1 X 1 Κατάσταση Γ Κατάσταση Β E(Y )=( β 0 +β 3 )+ β 1 X 1 Κατάσταση Δ β 3 β 4 E(Y )=β 0 +β 1 X 1 Κατάσταση Α β 2 β 0 E(Y )=( β 0 +β 2 )+ β 1 X 1 X 1 Σχήμα 5: Μεταβολή του σταθερού όρου β 0 σε καταστάσεις Α, Β, Γ και Δ Μεταβολή της κλίσης β 1 Μπορεί να γίνει χρήση των μεταβλητών X 1 X 2, X 1 X 3, X 1 X 4 που είναι γινόμενο της ποσοτικής μεταβλητής X 1 και των ψευδομεταβλητών X 2, X 3 και X 4 αντίστοιχα(πολλαπλασιαστική ψευδομεταβλητή). { 1 κατάσταση Α X 2 = 0 αλλιώς { 1 κατάσταση Β X 3 = 0 αλλιώς { 1 κατάσταση Γ X 4 = 0 αλλιώς οπότε κατά συνέπεια οι πολλαπλασιαστικές ψευδομεταβλητές θα έχουν τιμές: { X1 κατάσταση Α X 1 X 2 = 0 αλλιώς { X1 κατάσταση Β X 1 X 3 = 0 αλλιώς το μοντέλο γίνεται : X 1 X 4 = { X1 κατάσταση Γ 0 αλλιώς 19

20 Y i = β 0 + β 1 X i1 + β 2 X 1i X i2 + β 3 X i1 X i3 + β 4 X i1 X i4 + ε i κατάσταση Α με X 1 X 2 = X 1 : Y i = β 0 + β 1 X i1 + β 2 X i1 + ε i = β 0 + (β 1 + β 2 )X i1 + ε i κατάσταση Β με X 1 X 3 = X 1 : Y i = β 0 + β 1 X i1 + β 3 X i1 + ε i = β 0 + (β 1 + β 3 )X i1 + ε i κατάσταση Γ με X 1 X 4 = X 1 : Y i = β 0 + β 1 X i1 + β 4 X i1 + ε i = β 0 + (β 1 + β 4 )X i1 + ε i κατάσταση Δ με X 1 X 2 = X 1 X 3 = X 1 X 4 = 0: Y i = β 0 + β 1 X i1 + ε i Οι συντελεστές β 2, β 3 και β 4 των ψευδομεταβλητών X 1 X 2, X 1 X 3 και X 1 X 4 αντίστοιχα παριστάνουν την διαφορά της κλίσης ανάμεσα στις καταστάσεις Α, Β, Γ και Δ Μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 Στην περίπτωση που έχω μεταβολή του σταθερού όρου β 0 και της κλίσης β 1 το μοντέλο θα διαμορφώνεται: Y i = β 0 +β 1 X i1 +β 2 X i2 +β 3 X i3 +β 4 X i4 +β 5 X i1 X i2 +β 6 X i1 X i3 +β 7 X i1 X i4 +ε i οπότε για τις τέσσερις περιπτώσεις αφού η ποιοτικές μεταβλητές X 2, X 3 και X 4 παίρνουν τιμές: { 1 κατάσταση Α X 2 = 0 αλλιώς { 1 κατάσταση Β X 3 = 0 αλλιώς { 1 κατάσταση Γ X 4 = 0 αλλιώς οπότε κατά συνέπεια οι πολλαπλασιαστικές ψευδομεταβλητές θα έχουν τιμές: { X1 κατάσταση Α X 1 X 2 = 0 αλλιώς { X1 κατάσταση Β X 1 X 3 = 0 αλλιώς θα έχω : X 1 X 4 = { X1 κατάσταση Γ 0 αλλιώς κατάσταση Α με X 2 = 1: Y i = β 0 + β 1 X i1 + β 2 + β 5 X i1 + ε i = (β 0 + β 2 ) + (β 1 + β 5 )X i1 + ε i 20

21 κατάσταση Β με X 3 = 1: Y i = β 0 + β 1 X i1 + β 3 + β 6 X i1 + ε i = (β 0 + β 3 ) + (β 1 + β 6 )X i1 + ε i κατάσταση Γ με X 4 = 1: Y i = β 0 + β 1 X i1 + β 4 + β 7 X i1 + ε i = (β 0 + β 4 ) + (β 1 + β 7 )X i1 + ε i κατάσταση Δ με X 2 = X 3 = X 4 = 0: Y i = β 0 + β 1 X i1 + ε i 2.3 Παράδειγμα μοντέλου που περιέχει αλληλεπίδραση Ενα μοντέλο παλινδρόμησης με ψευδομεταβλητές μπορεί να λάβει υπόψιν του αλληλεπιδράσεις μεταξύ ποσοτικών και ποιοτικών μεταβλητών. Ο όρος αλληλεπίδρασης ορίζεται από το γινόμενο των τιμών των μεταβλητών που ελέγχουμε για το ενδεχόμενο της αλληλεπίδρασης. Ο όρος αλληλεπίδραση αναφέρεται στην συνδυασμένη επιρροή που ασκούν στην εξαρτημένη μεταβλητή και όχι απαραίτητα στην μεταξύ τους σχέση. Παράδειγμα: Ενας οικονομολόγος θέλει να μελετήσει την ταχύτητα ανταπόκρισης μιας επιχείρησης σε μια καινοτομία σε σχέση με το μέγεθος και τον τύπο της. εξαρτημένη μεταβλητή Y = ταχύτητα ανταπόκρισης σε μήνες πρώτη ανεξάρτητη μεταβλητή, ποσοτική X 1 = μέγεθος της εταιρείας (μετριέται από το σύνολο του ενεργητικού σε χιλιάδες δολάρια) δεύτερη ανεξάρτητη μεταβλητή, ποιοτική X 2 = ο τύπος της επιχείρησης με δυο κατηγορίες, μετοχικών και αμοιβαίων Προκειμένου η ποιοτική αυτή μεταβλητή να χρησιμοποιηθεί σε ένα μοντέλο παλινδρόμησης θα χρησιμοποιηθούν ποσοτικοί δείκτες για τις κατηγορίες της. Υπάρχουν αρκετοί τρόποι για τον ποσοτικό προσδιορισμό των κατηγοριών μιας ποιοτικής μεταβλητής. Στην περίπτωση μας θα χρησιμοποιήσουμε μεταβλητή δείκτη (indicator variable) με τιμές 0 ή 1. Η μεταβλητή δείκτης είναι εύκολη στην χρήση και ευρέως διαδεδομένη αλλά δεν είναι ο μοναδικός τρόπος ποσοτικοποίησης μιας ποιοτικής μεταβλητής. Αναμένουμε ότι υπάρχει αλληλεπίδραση μεταξύ του μεγέθους της εταιρίας και του τύπου της οπότε το μοντέλο διαμορφώνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i1 X i2 + ε i με X 1 = μέγεθος της εταιρείας και { 1 μετοχικών X 2 = 0 αμοιβαίων η αναμενόμενη τιμή είναι: E(Y ) = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 1 X 2 Η έννοια των παραμέτρων παλινδρόμησης στην αναμενόμενη τιμή μπορεί να κατανοηθεί καλύτερα με την εξέταση της φύσης της για κάθε τύπο επιχείρησης. Η αναμενόμενη τιμή για καθένα από τους δυο τύπους επιχείρησης θα είναι: 21

22 E(Y ) = β 0 + β 1 X 1 + β 2 + β 3 X 1 = (β 0 + β 2 ) + (β 1 + β 3 )X 1 για μετοχικών E(Y ) = β 0 + β 1 X 1 για αμοιβαίων Y Ταχύτητα ανταπόκρισης σε μήνες E(Y )=( β 0 +β 2 )+(β 1 +β 3 ) X 1 μετοχικών β 2 β 0 E(Y )=β 0 +β 1 X 1 αμοιβαίων β 0 + β 2 Μέγεθος της επιχείρησης X 1 Σχήμα 6: Ταχύτητα ανταπόκρισης μιας επιχείρησης σε μια καινοτομία σε σχέση με το μέγεθος της Στο σχήμα 6 η β 2 δείχνει πόσο ψηλότερα ή χαμηλότερα είναι το σημείο τομής με τον Y για κάθε κατηγορία επιχείρησης και αναλόγως η β 3 δείχνει πόσο μεγαλύτερη ή μικρότερη είναι η κλίση για κάθε κατηγορία επιχείρησης. Επειδή τόσο το σημείο τομής με τον Y όσο και η κλίση διαφέρουν για κάθε κατηγορία επιχείρησης δεν αληθεύει πια ότι η β 2 δείχνει πόσο ψηλότερα ή χαμηλότερα είναι η αναμενόμενη τιμή του Y για οποιαδήποτε τιμή του X 1 μας δίνεται. Στο σχήμα φαίνεται πως η επίδραση του τύπου της επιχείρησης στο μοντέλο εξαρτάται από το μέγεθός της. Οι μικρότερες επιχειρήσεις αμοιβαίων τείνουν να καινοτομούν πιο γρήγορα, αλλά οι μεγαλύτερες επιχειρήσεις μετοχικών τείνουν να καινοτομούν γρηγορότερα. Οταν υπάρχει υπάρχει φαινόμενο αλληλεπίδρασης, η δράση της ποιοτικής μεταβλητής μπορεί να μελετηθεί συγκρίνοντας τις ευθείες παλινδρόμησης για κάθε κατηγορία της ποιοτικής μεταβλητής. Το σχήμα 7 απεικονίζει μια άλλη πιθανή κατάσταση αλληλεπίδρασης όπου οι επιχειρήσεις αμοιβαίων τείνουν να εισάγουν πιο γρήγορα από τις επιχειρήσεις μετοχικών την καινοτομία για όλα τα μεγέθη επιχειρήσεων στο πεδίο εφαρμογής του μοντέλου, αλλά η απόκλιση είναι μικρότερο για μεγαλύτερες επιχειρήσεις από ότι για μικρότερες. Προκειμένου να κάνω έλεγχο για την παρουσία αλληλεπίδρασης θα πραγματοποιήσω το τεστ: 22

23 Y Ταχύτητα ανταπόκρισης σε μήνες μετοχικών αμοιβαίων Μέγεθος της επιχείρησης X 1 Σχήμα 7: Υπαρξη αλληλεπίδρασης μεταξύ του τύπου και του μεγέθους της επιχείρησης H 0 : β 3 = 0 H 1 : β 3 0 ο οποίος μας δείχνει και αν οι γραμμές παλινδρόμησης έχουν ίδια κλίση. Ο έλεγχος αν οι γραμμές παλινδρόμησης ταυτίζονται θα είναι: H 0 : β 2 = β 3 = 0 H 1 : β 2 0 ή β Περισσότερες από μια ποιοτικές ερμηνευτικές μεταβλητές Μπορούν εύκολα να κατασκευαστούν μοντέλα όπου δύο ή περισσότερες από τις ανεξάρτητες μεταβλητές είναι ποιοτικές. Εστω ότι έχω: εξαρτημένη μεταβλητή Y = ποσοτική πρώτη ανεξάρτητη μεταβλητή X 1 = ποσοτική δεύτερη ανεξάρτητη μεταβλητή X 2 = ποιοτική με δυο κατηγορίες, Α και Β τρίτη ανεξάρτητη μεταβλητή X 3 = ποιοτική με δυο κατηγορίες, Γ και Δ Προκειμένου η ποιοτικές μεταβλητές να χρησιμοποιηθούν σε ένα μοντέλο παλινδρόμησης θα γίνει ποσοτικός προσδιορισμός των κατηγοριών τους. Στην περίπτωση μας θα χρησιμοποιήσουμε μεταβλητή δείκτη (indicator variable) με τιμές 0 ή 1. 23

24 { 1 κατηγορία Α X 2 = 0 κατηγορία Β { 1 κατηγορία Γ X 3 = 0 κατηγορία Δ Θεωρώ ότι οι συναρτήσεις παλινδρόμησης για όλους τους συνδυασμούς των ποιοτικών μεταβλητών X 2 και X 3 έχουν την ίδια κλίση β 1 και οι συντελεστές β 2 β 3 υποδηλώνουν τις προσθετικές επιδράσεις της διαφορετικότητας των κατηγοριών Α, Β και Γ, Δ Τότε το γραμμικό μοντέλο διαμορφώνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i3 + ε i Οι συναρτήσεις παλινδρόμησης για τις τέσσερις δυνατές περιπτώσεις θα είναι: E(Y ) = β 0 +β 1 X 1 +β 2 +β 3 για παρατηρήσεις που ανήκουν στις κατηγορίες Α και Γ E(Y ) = β 0 + β 1 X 1 + β 2 για παρατηρήσεις που ανήκουν στις κατηγορίες Α και Δ E(Y ) = β 0 + β 1 X 1 + β 3 για παρατηρήσεις που ανήκουν στις κατηγορίες Β και Γ E(Y ) = β 0 + β 1 X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Β και Δ Οι επιδράσεις όμως των ερμηνευτικών μεταβλητών μπορεί να μην είναι μόνο προσθετικές αλλά να αλληλοσυνδέονται, οπότε δρουν στο μοντέλα και πολλαπλασιαστικά. Τότε προσθέτοντας όρο αλληλεπίδρασης το μοντέλο διαμορφώνεται: Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i3 + β 4 X i1 X i2 + β 5 X i1 X i3 + β 6 X i2 X i3 + ε i Οι συναρτήσεις παλινδρόμησης για τις τέσσερις δυνατές περιπτώσεις θα είναι: E(Y ) = (β 0 + β 2 + β 3 + β 6 ) + (β 1 + β 4 + β 5 )X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Α και Γ E(Y ) = (β 0 + β 2 ) + (β 1 + β 4 )X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Α και Δ E(Y ) = (β 0 + β 3 ) + (β 1 + β 5 )X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Β και Γ E(Y ) = β 0 + β 1 X 1 για παρατηρήσεις που ανήκουν στις κατηγορίες Β και Δ Οχι μόνο οι συναρτήσεις παλινδρόμησης για τους συνδυασμούς των ποιοτικών μεταβλητών X 2 και X 3 διαφέρουν, αλλά τα διαφορετικά αποτελέσματα μιας ποιοτικής μεταβλητής στο σημείο τομής εξαρτώνται από την κατηγορία της άλλης ποιοτικής μεταβλητής. Οταν κινούμαστε από τον συνδυασμό Α - Δ στον Β - Δ το σημείο τομής αλλάζει κατά β 2, ενώ όταν κινούμαστε από τον συνδυασμό Α - Γ στον Β - Γ το σημείο τομής αλλάζει κατά β 2 + β 6. 24

25 2.5 Κατά τμήματα γραμμική παλινδρόμηση Κάποιες φορές η παλινδρόμηση του Y στο X ακολουθεί μια γραμμική σχέση που αλλάζει κλίση μετά από μια συγκεκριμένη τιμή της ερμηνευτικής μεταβλητής. Εστω ότι έχω: εξαρτημένη μεταβλητή Y = ποσοτική ανεξάρτητη μεταβλητή X = ποσοτική X a η συγκεκριμένη τιμή της X που επέρχεται η μεταβολή Στην περίπτωση αυτή η γραμμική παλινδρόμηση του Y στο X θα αποτελείται από δυο τμήματα, γιαυτό και ονομάζεται κατά τμήματα γραμμική παλινδρόμηση (piecewise linear regression). Με την βοήθεια ψευδομεταβλητών ένα μοντέλο κατά τμήματα γραμμικής παλινδρόμησης θα διατυπώνεται ως εξής: όπου Επομένως Y i = β 0 + β 1 X i1 + β 2 (X i1 X a )X i2 + ε i { 1 αν Xi1 > X X 2 = a 0 αλλιώς { β0 β Y i = 2 X a + (β 1 + β 2 )X i1 + ε i αν X i1 > X a β 0 + β 1 X i1 + ε i αλλιώς Y E(Y )=( β 0 β 2 X a )+(β 1 +β 2 ) X 1 β 0 E(Y )=β 0 +β 1 X 1 X a X 1 Σχήμα 8: Κατά τμήματα γραμμική παλινδρόμηση 25

26 Οπως βλέπουμε στο σχήμα 8, ο συντελεστής β 1 είναι η κλίση του πρώτου τμήματος και ο (β 1 + β 2 ) η κλίση του δεύτερου τμήματος. Η μεταβολή της παλινδρόμησης που επέρχεται στην τιμή X a θα είναι σημαντική αν ο συντελεστής β 2 είναι σημαντικός, κάτι που κρίνεται με το στατιστικό t Περισσότερα από δύο τμήματα στην γραμμή παλινδρόμησης Η επέκταση του γραμμικού μοντέλου σε περισσότερα από δύο τμήματα στην γραμμή παλινδρόμησης μπορεί να γίνει ως εξής: Εστω ότι έχω: εξαρτημένη μεταβλητή Y = ποσοτική ανεξάρτητη μεταβλητή X = ποσοτική X a η πρώτη τιμή της X που επέρχεται η μεταβολή X b η δεύτερη τιμή της X που επέρχεται η μεταβολή Με την βοήθεια ψευδομεταβλητών ένα μοντέλο θα διατυπώνεται ως εξής: Y i = β 0 + β 1 X i1 + β 2 (X i1 X a )X i2 + β 3 (X i1 X b )X i3 + ε i Ασυνέχεια στην συνάρτηση παλινδρόμησης Κάποιες φορές η συνάρτηση γραμμικής παλινδρόμησης δεν αλλάζει απλά κλίση για κάποια συγκεκριμένη τιμή X a της ανεξάρτητης μεταβλητής X αλλά παρουσιάζει και μια ασυνέχεια στο σημείο αυτό. Σ αυτήν την περίπτωση μια άλλη μεταβλητή δείκτης πρέπει να εισαχθεί προκειμένου να καλυφθεί η ασυνέχεια. Αν η κλίση της γραμμής παλινδρόμησης αλλάζει για την τιμή X = X a και η γραμμή παλινδρόμησης μπορεί να είναι ασυνεχής εκεί, τότε το μοντέλο θα διατυπώνεται ως εξής: Y i = β 0 + β 1 X i1 + β 2 (X i1 X a )X i2 + β 3 (X i3 ) + ε i όπου: εξαρτημένη μεταβλητή Y = ποσοτική ανεξάρτητη μεταβλητή X 1 = ποσοτική X a η τιμή της X που επέρχεται η μεταβολή { 1 αν Xi1 > X X 2 = a 0 αλλιώς { 1 αν Xi1 > X X 3 = a 0 αλλιώς Η συνάρτηση παλινδρόμησης θα είναι: E(Y ) = β 0 + β 1 X 1 + β 2 (X 1 X a )X 2 + β 3 X 3 Οταν X 1 X a τότε X 2 = X 3 = 0 η συνάρτηση παλινδρόμησης θα είναι: E(Y ) = β 0 + β 1 X 1 Οταν X 1 > X a τότε X 2 = X 3 = 1 η συνάρτηση παλινδρόμησης θα είναι: E(Y ) = (β 0 β 2 X a + β 3 ) + (β 1 + β 2 )X 1 26

27 Y E(Y )=( β 0 β 2 X a +β 3 )+(β 1 +β 2 ) X 1 β 3 β 3 X a β 2 E(Y )=β 0 +β 1 X 1 β 0 X a X 1 Σχήμα 9: Ασυνέχεια στην συνάρτηση παλινδρόμησης Στο σχήμα 9 βλέπουμε ότι β 3 εκφράζει την διαφορά των μέσων αποκλίσεων για τις ευθείες παλινδρόμησης στο σημείο X a. Το β 2 εκφράζει την διαφορά των δύο κλίσεων. Αν ο t έλεγχος μας δώσει ότι β 3 = 0 συμπεραίνουμε ότι η συνάρτηση είναι συνεχής στο σημείο X a οπότε και θα έχω μοντέλο ίδιο με αυτό της κατά τμήματα γραμμικής παλινδρόμησης. 2.6 Εφαρμογή των ψευδομεταβλητών στις χρονοσειρές Οι οικονομολόγοι χρησιμοποιούν συχνά δεδομένα χρονοσειρών στην ανάλυση παλινδρόμησης. Για παράδειγμα η αποταμίευση Y μπορεί να παλινδρομήσει πάνω στο εισόδημα X, όπου τα δεδομένα αφορούν μια σειρά ετών. Το προτεινόμενο μοντέλο είναι: Y t = β 0 + β 1 X t + ε t όπου t = 1,..., n όπου Y t και X t οι αποταμιεύσεις και το εισόδημα αντίστοιχα για την χρονική περίοδο t. Ας υποθέσουμε ότι η περίοδος που καλύπτουν περιλαμβάνει χρονική περίοδο τόσο πολέμου όσο και ειρήνης που παίζει ρόλο αφού η αποταμίευση εν καιρώ πολέμου αναμένεται υψηλότερη. Το προτεινόμενο μοντέλο είναι: 27

28 όπου t = 1,..., n όπου: Y t οι αποταμιεύσεις X t1 το εισόδημα Y t = β 0 + β 1 X t1 + β 2 X t2 + ε t X t2 = { 1 αν t περίοδος ειρήνης 0 αλλιώς Το μοντέλο αυτό υποθέτει πως η οριακή ροπή προς αποταμίευση β 1 είναι σταθερή τόσο εν καιρώ ειρήνης όσο και εν καιρώ πολέμου και μόνο το ύψος της ευθείας παλινδρόμησης επηρεάζεται από αυτήν την ποιοτική μεταβλητή. Μια άλλη χρήση των μεταβλητών δεικτών στις εφαρμογές των χρονοσειρών είναι όταν χρησιμοποιούμε μηνιαία ή τριμηνιαία στοιχεία. Αν υποθέσουμε ότι οι τριμηνιαίες πωλήσεις Y εξαρτώνται από τις τριμηνιαίες διαφημιστικές δαπάνες X 1 και το τριμηνιαίο διαθέσιμο ατομικό εισόδημα X 2. Αν οι εποχιακές επιδράσεις επηρεάζουν επίσης τις τριμηνιαίες πωλήσεις, ένα μοντέλο που ενσωματώνει τις εποχιακές επιδράσεις θα είναι: Y t = β 0 + β 1 X t1 + β 2 X t2 + β 3 X t3 + β 4 X t4 + β 5 X t5 + ε t όπου t = 1,..., n όπου Y t τριμηνιαίες πωλήσεις X t1 τριμηνιαίες διαφημιστικές δαπάνες X t2 τριμηνιαίο διαθέσιμο ατομικό εισόδημα { 1 πρώτο τρίμηνο X t3 = 0 αλλιώς { 1 δεύτερο τρίμηνο X t4 = 0 αλλιώς { 1 τρίτο τρίμηνο X t5 = 0 αλλιώς 2.7 Προβληματισμοί σε σχέση με την χρήση μεταβλητών δεικτών Μεταβλητές δείκτες ενάντια στην χορήγηση κωδικών Μια εναλλακτική της χρήσης μεταβλητών δεικτών για μια ποιοτική ανεξάρτητη μεταβλητή είναι η χορήγηση κωδικών. Εστω η ποιοτική ανεξάρτητη μεταβλητή συχνότητα χρήσης προϊόντος η ο- ποία έχει τρεις κατηγορίες: συχνή, περιστασιακή και καθόλου χρήση. Με την προσέγγιση χορήγησης κωδικών μόνο μία μεταβλητή χρησιμοποιείται και οι τιμές που αποδίδονται στις κατηγορίες της είναι: 3 συχνή χρήση X 1 = 2 περιστασιακή χρήση 1 καθόλου χρήση 28

29 Οι κωδικοί που χορηγούνται είναι φυσικά αυθαίρετοι και θα μπορούσαν να είναι άλλα σύνολα αριθμών. Το μοντέλο μας στην περίπτωση που δεν υπήρχαν άλλες ανεξάρτητες μεταβλητές θα ήταν: Y i = β 0 + β 1 X i1 + ε t Η βασική δυσκολία με την χορήγηση κωδικών είναι ότι ορίζουν ένα μέτρο για τις κατηγορίες της ποιοτικής μεταβλητής που δεν είναι λογικό. Αυτό φαίνεται αν εξετάσουμε τις αναμενόμενες τιμές για τις τρεις κατηγορίες της ποιοτικής μεταβλητής: β 0 + 3β 1 συχνή χρήση E(Y ) = β 0 + 2β 1 περιστασιακή χρήση β 0 + β 1 καθόλου χρήση Το οποίο επιφέρει: E(Y/συχνή χρήση) E(Y/περιστασιακή χρήση) = E(Y/περιστασιακή χρήση) E(Y/καθόλου χρήση) = β 1 Ετσι η κωδικοποίηση 1, 2, 3 συνεπάγεται ίσες αποστάσεις μεταξύ των τριών κατηγοριών χρηστών, κάτι που δεν συμφωνεί απαραίτητα με την πραγματικότητα. Μια άλλη χορήγηση κωδικών θα μπορούσε να συνεπάγεται διαφορετικές αποστάσεις μεταξύ των κατηγοριών της ποιοτικής μεταβλητής αλλά θα εξακολουθούσε να είναι αυθαίρετη. Αντίθετα οι μεταβλητές δείκτες δεν κάνουν υποθέσεις σχετικά με την απόσταση των κατηγοριών και βασίζονται στα δεδομένα για να δείξουν τις επιδράσεις που προκαλούν στην απόσταση. Το ίδιο παράδειγμα με δυο μεταβλητές δείκτες X 1 και X 2 να χρησιμοποιούνται για να ποσοτικοποιήσουν την ποιοτική μεταβλητή συχνότητα χρήσης προϊόντος είναι όπως βλέπουμε στον πίνακα 1: κατηγορίες X 1 X 2 συχνή χρήση 1 0 περιστασιακή χρήση 0 1 καθόλου χρήση 0 0 Πίνακας 1: Συχνότητα χρήσης προϊόντος Στην περίπτωση αυτή το μοντέλο μου θα ήταν: Y i = β 0 + β 1 X i1 + β 2 X i2 + ε t όπου το β 1 μετρά την διαφορά E(Y/συχνή χρήση) E(Y/καθόλου χρήση) και το β 2 μετρά την διαφορά E(Y/περιστασιακή χρήση) E(Y/καθόλου χρήση) και το β 1 β 2 μετρά την διαφορά E(Y/συχνή χρήση E(Y/περιστασιακή χρήση) χωρίς αυθαίρετους περιορισμούς που πρέπει να πληρούνται λόγω της διαφορετικότητας. 29

30 2.7.2 Μεταβλητές δείκτες ενάντια στις ποσοτικές μεταβλητές Οι μεταβλητές δείκτες μπορούν να χρησιμοποιηθούν ακόμα και αν η ερμηνευτική μεταβλητή είναι ποσοτική. Για παράδειγμα η ποσοτική μεταβλητή ηλικία μπορεί να μετασχηματιστεί με ομαδοποίηση των ηλικιών σε κατηγορίες. Στη συνέχεια μεταβλητές δείκτες μπορούν να χρησιμοποιηθούν για τις κατηγορίες της νέας αυτής ανεξάρτητης μεταβλητής. Αυτό αρχικά φαίνεται να είναι μια αμφισβητήσιμη προσέγγιση επειδή οι πληροφορία για τις πραγματικές ηλικίες χάνεται. Επιπλέον οι πρόσθετες παράμετροι που προστίθενται στο μοντέλο οδηγούν σε μείωση των βαθμών ελευθερίας που σχετίζονται με το M SE. Παρ όλα αυτά υπάρχουν περιπτώσεις που η αντικατάσταση μιας ποσοτικής μεταβλητής από μεταβλητή δείκτη μπορεί να είναι κατάλληλη. Αν για παράδειγμα έχουμε μιας μεγάλης κλίμακας έρευνα για την σχέση μεταξύ των ρευστών διαθέσιμων Y και της ηλικίας του επικεφαλής της οικογένειας X η απώλεια μερικών βαθμών ελευθερίας είναι αμελητέα. Η ανάλυση είναι πολύ αμφίβολη ως προς την μορφή της συνάρτησης παλινδρόμησης, η οποία θα μπορούσε να είναι εξαιρετικά πολύπλοκη και γιαυτό θα μπορούσε να προτιμηθεί η προσέγγιση της μεταβλητής δείκτη, προκειμένου να πάρει πληροφορίες από την μορφή της συνάρτησης παλινδρόμησης χωρίς να κάνει υποθέσεις σχετικά με την συναρτησιακή μορφή της. Μια άλλη εναλλακτική επίσης χρησιμοποιώντας μεταβλητές δείκτες είναι διαθέσιμη αν υπάρχει αμφιβολία για την λειτουργικότητα σε μια σύνθετη συνάρτηση παλινδρόμησης. Θα μπορούσε να χρησιμοποιηθεί για την ποσοτική μεταβλητή η- λικία κατά τμήματα γραμμική παλινδρόμηση με μια σειρά από τμήματα. Αυτή η προσέγγιση επίσης χάνει σε βαθμούς ελευθερίας για την εκτίμηση του M SE αλλά αυτό δεν αποτελεί πρόβλημα σε μελέτες μεγάλης κλίμακας. Το όφελος θα είναι ότι οι πληροφορίες σχετικά με την μορφή της συνάρτησης παλινδρόμησης επιτυγχάνεται χωρίς ισχυρές παραδοχές σχετικά με την συναρτησιακή μορφή της Άλλες κωδικοποιήσεις για τις μεταβλητές δείκτες Υπάρχουν πολλές δυνατότητες για την κωδικοποίηση των μεταβλητών δεικτών. Οι δυο εναλλακτικές 0 και 1 κωδικοποιούνται με c 1 μεταβλητές δείκτες για μια ποιοτική μεταβλητή με c κατηγορίες. Επανερχόμαστε στο παράδειγμα όπου ένας οικονομολόγος θέλει να μελετήσει την ταχύτητα ανταπόκρισης μιας επιχείρησης σε μια καινοτομία σε σχέση με το μέγεθος και τον τύπο της. εξαρτημένη μεταβλητή Y = ταχύτητα ανταπόκρισης σε μήνες πρώτη ανεξάρτητη μεταβλητή, ποσοτική X 1 = μέγεθος της εταιρείας (μετριέται από το σύνολο του ενεργητικού σε χιλιάδες δολάρια) δεύτερη ανεξάρτητη μεταβλητή, ποιοτική X 2 = ο τύπος της επιχείρησης με δυο κατηγορίες, μετοχικών και αμοιβαίων Εδώ μια κωδικοποίηση θα μπορούσε να είναι: { 1 μετοχικών X 2 = 1 αμοιβαίων Στην περίπτωση αυτή το μοντέλο θα ήταν: με συνάρτηση παλινδρόμησης: Y i = β 0 + β 1 X i1 + β 2 X i2 + ε t 30

31 E(Y ) = β 0 + β 1 X 1 + β 2 X 2 που για τους δυο τύπους εταιρείας διαμορφώνεται: E(Y ) = (β 0 + β 2 ) + β 1 X 1 για μετοχικών E(Y ) = (β 0 β 2 ) + β 1 X 1 για αμοιβαίων Ετσι το β 0 μπορεί να θεωρηθεί ως μέσος τομής της γραμμής παλινδρόμησης από όπου η εταιρία μετοχικών και αμοιβαίων διαφέρουν κατά β 2 προς αντίθετες κατευθύνσεις. Ενας έλεγχος υποθέσεων για το κατά πόσο οι ευθείες παλινδρόμησης είναι ίδιες για τις δύο κατηγορίες εταιρειών θα είναι: H 0 : β 2 = 0 H 1 : β 2 0 Μια εναλλακτική κωδικοποίηση χρησιμοποιώντας μεταβλητή δείκτη με τιμές 0 και 1 για κάθε μία από τις κατηγορίες της ποιοτικής μεταβλητής δίνει το μοντέλο που διαμορφώνεται: με X 1 = μέγεθος της εταιρείας Y i = β 0 + β 1 X i1 + β 2 X i2 + β 3 X i3 + ε i και X 2 = { 1 μετοχικών 0 αλλιώς X 3 = { 1 αμοιβαίων 0 αλλιώς με συνάρτηση παλινδρόμησης για τους δυο τύπους εταιρείας να διαμορφώνεται: E(Y ) = β 2 + β 1 X 1 για μετοχικών E(Y ) = β 3 + β 1 X 1 για αμοιβαίων Ενας έλεγχος υποθέσεων για το κατά πόσο οι ευθείες παλινδρόμησης είναι ίδιες για τις δύο κατηγορίες εταιρειών θα είναι: H 0 : β 2 = β 3 H 1 : β 2 β 3 31

32 2.8 Εξαρτημένη μεταβλητή δείκτης Σε κάποιες περιπτώσεις, η εξαρτημένη μεταβλητή που μας ενδιαφέρει έχει μόνο δύο δυνατά αποτελέσματα, και συνεπώς μπορεί να παρασταθεί από μια μεταβλητή δείκτη με τιμές 0 και 1. Παράδειγμα: Σε μία ανάλυση για το κατά πόσο οι επιχειρήσεις έχουν τμήμα εργασιακών σχέσεων ανάλογα με το μέγεθος της επιχείρησης, η εξαρτημένη μεταβλητή που ορίζεται έχει δυο δυνατά αποτελέσματα: να έχει ή να μην έχει τμήμα εργασιακών σχέσεων. Αυτά τα αποτελέσματα μπορούν να κωδικοποιηθούν με 0 και 1. Οταν η εξαρτημένη μεταβλητή είναι δίτιμη σε ένα απλό μοντέλο θα ήταν: όπου Y i = 0, 1 Η συνάρτηση παλινδρόμησης Y i = β 0 + β 1 X i1 + ε i E(Y ) = β 0 + β 1 X i1 έχει ιδιαίτερη σημασία στην περίπτωση αυτή. Η κατανομή πιθανοτήτων για το Y i φαίνεται στον πίνακα 2: Y i πιθανότητα 1 P (Y i = 1) = π i 0 P (Y i = 0) = 1 π i Πίνακας 2: Κατανομή πιθανοτήτων Ετσι π i είναι η πιθανότητα το Y i να είναι 1 και 1 π i είναι η πιθανότητα το Y i να είναι 0. Οπότε η αναμενόμενη τιμή θα είναι E(Y i ) = 1(π i ) + 0(1 π i ) = π i και αφού βρίσκουμε: E(Y ) = β 0 + β 1 X i1 E(Y ) = β 0 + β 1 X i1 = π i που αντιπροσωπεύει όταν η εξαρτημένη μεταβλητή είναι μεταβλητή δείκτης με τιμές 0 και 1 την πιθανότητα το Y i να είναι 1 για δεδομένες τιμές των ανεξάρτητων μεταβλητών. 32

33 3 Ελεγχος υποθέσεων Τις περισσότερες φορές δεν είναι εφικτό να παρατηρηθούν από τον ερευνητή όλα τα άτομα σε έναν πληθυσμό. Ο έλεγχος υποθέσεων είναι μια συμπερασματική διαδικασία που χρησιμοποιεί τα δεδομένα ενός δείγματος για να εκτιμήσει την α- ξιοπιστία μιας υπόθεσης που έγινε για τον πληθυσμό. Η διαδικασία του ελέγχου ξεκινάει κάνοντας την υπόθεση για τον πληθυσμό, συνεχίζεται με την λήψη ενός τυχαίου δείγματος και ολοκληρώνεται με την σύγκριση των δεδομένων του δείγματος με την υπόθεση. Σκοπός της διαδικασίας είναι η λήψη απόφασης για το αν οι πραγματικές τιμές των παραμέτρων ικανοποιούν τις υποθέσεις με βάση τα δεδομένα του δείγματος και εμπεριέχει το αντίστοιχο ρίσκο. 3.1 Η μηδενική και η εναλλακτική υπόθεση Υπάρχουν δυο είδη στατιστικών υποθέσεων: οι μηδενικές υποθέσεις H 0 και οι εναλλακτικές υποθέσεις H 1. Αυτή που ελέγχεται είναι η μηδενική υπόθεση και είναι αυτή που συμφωνεί με τις συνθήκες που θεωρούμε ότι αληθεύουν για τον υπό μελέτη πληθυσμό. Η μηδενική υπόθεση διατυπώνεται με σκοπό να αμφισβητηθεί και μπορεί να απορριφθεί ή να μην απορριφθεί. Αν δεν απορριφθεί τότε τα δεδομένα στα οποία στηρίζεται ο έλεγχος δεν επαρκούν για την απόρριψή της. Αν απορριφθεί τότε τα δεδομένα δεν επαληθεύουν την μηδενική υπόθεση, αλλά είναι συμβατά με την εναλλακτική υπόθεση. Η μηδενική υπόθεση H 0 δηλώνει ότι στον πληθυσμό δεν σημειώνεται καμία αλλαγή ή δεν υπάρχει διαφορά και αντίθετη αυτής είναι η εναλλακτική υπόθεση H 1. Η τελική απόφαση στηρίζεται στην σύγκριση των δεδομένων του δείγματος με την H 0. Η μια δυνατότητα είναι να απορριφθεί η μηδενική υπόθεση. Αυτό συμβαίνει όταν τα δεδομένα του δείγματος είναι σημαντικά διαφορετικά από αυτό που προβλέπει η μηδενική υπόθεση. Η άλλη δυνατότητα είναι τα δεδομένα του δείγματος να είναι συνεπή με την μηδενική υπόθεση, οπότε και αποτυγχάνουμε να απορρίψουμε την μηδενική υπόθεση. 3.2 Σφάλματα κατά τον έλεγχο υποθέσεων Τα δεδομένα ενός δείγματος μπορεί να μας οδηγήσουν σε λανθασμένες αποφάσεις, για τις οποίες υπάρχουν δυο δυνατές περιπτώσεις. 1.Να απορρίψουμε την μηδενική υπόθεση ενώ είναι αληθής (σφάλμα τύπου Ι) 2.Να δεχτούμε την μηδενική υπόθεση ενώ είναι ψευδής (σφάλμα τύπου ΙΙ) Στόχος είναι κατά την διαδικασία ελέγχου οι πιθανότητες να γίνουν αυτά τα σφάλματα: Ρ(σφάλμα τύπου Ι)=α Ρ(σφάλμα τύπου ΙΙ)=β να είναι όσο το δυνατό μικρότερες. Στον πίνακα 3 φαίνεται η σχέση μεταξύ απόφασης και πραγματικής κατάστασης της H 0. Τα εφαρμοζόμενα κριτήρια ελέγχου πρέπει να ελαχιστοποιούν τις πιθανότητες και των δυο τύπων σφαλμάτων. Αυτό που αρχικά προσπαθούμε να αποφύγουμε είναι η απόρριψή της H 0 ενώ είναι σωστή. Για αυτό το λόγο επιλέγουμε μια σταθερή τιμή για το α και στη συνέχεια προσπαθούμε να ελαχιστοποιήσουμε την πιθανότητα για σφάλμα τύπου ΙΙ, το β δηλαδή. Η σταθερή τιμή του α λέγεται επίπεδο σημαντικότητας και είναι η πιθανότητα απόρριψης της μηδενικής υπόθεσης που είναι αληθής, υπέρ της εναλλακτικής. Την τιμή της πιθανότητας την καθορίζει ο ερευνητής. Αν έχω καθορίσει α = 0, 05(5%) και απορρίψουμε της H 0, τότε 33

34 Πραγματική κατάσταση της H 0 απόφαση αληθής H 0 ψευδής H 0 Απορρίπτουμε την H 0 σφάλμα τύπου Ι με πιθανότητα α σωστή απόφαση με πιθανότητα 1-β Δεχόμαστε την H 0 σωστή απόφαση με πιθανότητα 1-α σφάλμα τύπου ΙΙ με πιθανότητα β Πίνακας 3: Σχέση μεταξύ απόφασης και πραγματικής κατάστασης της H 0 είμαστε κατά 95% ότι πήραμε την σωστή απόφαση. Οταν λέμε λοιπόν ότι η H 0 απορρίπτεται σε επίπεδο σημαντικότητας 5% εννοούμε ότι η πιθανότητα να έχουμε κάνει λάθος είναι 5%. Οπως φαίνεται στο σχήμα 10, το επίπεδο σημαντικότητας (ή αλλιώς α-επίπεδο) χωρίζει την κατανομή των δειγματικών μέσων σε: 1.Αυτούς που συμφωνούν με την H 0 και βρίσκονται στο κέντρο της κατανομής 2.Αυτούς που είναι σημαντικά διαφορετικοί από την H 0 και βρίσκονται στα άκρα της κατανομής. Οταν η H 0 είναι αληθής, η εμφάνιση ακραίων τιμών έχει πολύ μικρή πιθανότητα(α). Αν όμως εμφανιστούν τότε έχουμε κάνει σφάλμα τύπου Ι με πιθανότητα α. E(Y )=( β 0 β 2 X a +β 3 )+(β 1 +β 2 ) X 1 β 3 Απόρριψη της Η 0 Απόρριψη της Η 0 Πιθανότητα α/2 Πιθανότητα α/2 E(Y )=β 0 +β 1 X 1 Σχήμα 10: Κατανομή των δειγματικών μέσων Οταν μικραίνουμε το α-επίπεδο, μικραίνει αντίστοιχα και το ρίσκο που παίρνουμε για σφάλμα τύπου Ι. Οπότε έχουμε μεταφορά των ορίων της κρίσιμης περιοχής και κατά συνέπεια χρειαζόμαστε πιο πολλές αποδείξεις για την απόρριψη της H 0. Για παράδειγμα, μπορεί σε ένα δείγμα τα δεδομένα να επαρκούν για απόρριψη της 34

35 H 0 με επίπεδο σημαντικότητας α=0,05, αλλά να μην συμβαίνει το ίδιο σε επίπεδο σημαντικότητας α=0, Ελεγχος για την διαφορά των μέσων τιμών δυο πληθυσμών Σε πολλές περιπτώσεις χρειάζεται να συγκρίνουμε τις μέσες τιμές δυο πληθυσμών χρησιμοποιώντας δύο δείγματα αντίστοιχα των πληθυσμών αυτών. Τέτοια περίπτωση είναι το να προσπαθήσουμε να αποφασίσουμε αν υπάρχει πραγματική διαφορά ανάμεσα στην μέση επίδοση των μαθητών που είναι αγόρια(πρώτος πληθυσμός) και στην μέση επίδοση των μαθητών που είναι κορίτσια(δεύτερος πληθυσμός). Εστω λοιπόν µ 1 και µ 2 οι αντίστοιχες μέσες τιμές και ν 1 και ν 2 τα αντίστοιχα μεγέθη των δειγμάτων. Η μηδενική υπόθεση είναι: H 0 : µ 1 = µ 2 έναντι της εναλλακτικής: H 1 : µ 1 µ 2 Παίρνουμε ως κριτήριο ελέγχου το όπου sp 2 t = X 1 X 2 v 1 + sp 2 v 2 s p 2 = (v 1 1)s (v 2 1)s 2 2 v 1 + v 2 2 που ακολουθεί t - κατανομή με v 1 + v 2 2 βαθμούς ελευθερίας για την περίπτωση που οι διακυμάνσεις είναι άγνωστες αλλά ίσες, ενώ αν είναι άνισες βαθμός ελευθερίας λογίζεται ο μικρότερος από τους v 1 1 και v

36 4 Στατιστικός έλεγχος του γραμμικού μοντέλου Για τον στατιστικό έλεγχο του μοντέλου (με T παρατηρήσεις και K ερμηνευτικές μεταβλητές)υποθέτουμε ότι ο τυχαίος παράγοντας ε i ακολουθεί την κανονική κατανομή, δηλαδή ε i N(0, σ 2 ). Ως συναρτήσεις των τυχαίων μεταβλητών ε 1, ε 2,..., ε T, οι εκτιμητές b 0, b 1,..., b K ακολουθούν κανονική κατανομή, και αφού E(b j ) = β j έχουμε: b j β j σ c jj N(0, 1) όπου c jj το j διαγώνιο στοιχείο της μήτρας (X X) 1. Ανεξάρτητη της στατιστικής b j β j σ c jj είναι η στατιστική (T K 1) s2 σ 2 ελευθερίας: που ακολουθεί κατανομή X 2 με (Τ-Κ-1) βαθμούς οπότε (T K 1) s2 σ 2 X2 T K 1 b j β j s c jj t T K Συντελεστής προσδιορισμού Σε ένα γραμμικό μοντέλο με K ερμηνευτικές μεταβλητές και T παρατηρήσεις, ο συντελεστής προσδιορισμού είναι το μέτρο της ικανότητας προσαρμογής του και ορίζεται ως η αναλογία της εξαρτημένης μεταβλητής Y που ερμηνεύεται από την παλινδρόμηση. Ο τύπος του είναι: R 2 = Σŷ2 Σy 2 = Σe2 Σy 2 Με τιμή αναφοράς το μέσο του δείγματος, η μεταβλητότητα της Y ορίζεται ως το άθροισμα των τετραγώνων των αποκλίσεων των παρατηρήσεων της Y από το μέσο τους. Μεταβλητότητα της Y = Σ(Y Y ) 2 όταν η γραμμή παλινδρόμησης είναι Ŷ t = b 0 + b 1 X Η απόκλιση της t παρατήρησης της Y από τον μέσο, όπως βλέπουμε και στο σχήμα 11,είναι ή Y t Y = (Ŷt Y ) + e t 36

37 Y Y t Ŷ t =b 0 +b 1 X t Ȳ... Ŷ t Ȳ... e t. Y t Ȳ. X X t X Σχήμα 11: Γραμμή παλινδρόμησης Ŷt = b 0 + b 1 X y t = ŷ t + e t όπου y t = Y t Y η απόκλιση του δείγματος από τον μέσο ŷ t = Ŷt Y η απόκλιση της υπολογισμένης τιμής από τον μέσο e t = Y t Ŷt η απόκλιση της τιμής του δείγματος από την γραμμή παλινδρόμησης Γνωρίζουμε από τις ιδιότητες της γραμμής παλινδρόμησης ότι το άθροισμα των καταλοίπων είναι μηδέν: Σe i = 0, καθώς επίσης ότι το άθροισμα των γινομένων των καταλοίπων και των Ŷ είναι μηδέν: ΣŶ e i = 0 Με βάση αυτά τα δύο και υψώνοντας την σχέση Y t Y = (Ŷt Y ) + e t στο τετράγωνο και αθροίζοντας για όλες τις τιμές του Y παίρνουμε: ή Σ(Y Y ) 2 = Σ(Ŷ Y )2 + Σe 2 Σy 2 = Σŷ 2 + Σe 2 Ο όρος Σy 2 = Σ(Y Y ) 2 είναι η συνολική μεταβλητότητα του Y ή sum of squares total(sst) Ο όρος Σŷ 2 = Σ(Ŷ Y )2 είναι η μεταβλητότητα του Y που ερμηνεύεται από την παλινδρόμηση ή sum of squares regression(ssr) Ο όρος Σe 2 είναι η μεταβλητότητα που οφείλεται σε τυχαίους παράγοντες ή sum of squares error(sse). Δηλαδή SST = SSR + SSE 37

38 Σε ένα γραμμικό μοντέλο με Κ ερμηνευτικές μεταβλητές και Τ παρατηρήσεις θα έχω: Τους εκτιμητές ελαχίστων τετραγώνων δίνονται από το (K + 1) 1 διάνυσμα b = (X X) 1 X Y Τις παρατηρήσεις της εξαρτημένης μεταβλητής από το T 1 διάνυσμα Y Τον T (K + 1) πίνακα X Ομως SST = Σ(Y Y ) 2 = ΣY 2 T Y 2 = Y Y T Y 2 Οπότε αφού SSR = b X Y T Y 2 παίρνω SSE = SST SSR = Y Y b X Y όπως φαίνονται στον παρακάτω πίνακα 4: πηγή μεταβλητότητας άθροισμα τετραγώνων βαθμοί ελευθερίας μέσο τετράγωνο παλινδρόμηση SSR = b X Y T Y 2 K MSR = SSR K υπόλοιπο SSE = Y Y b X Y T K 1 MSE = SSE T K 1 σύνολο SST = Y Y T Y 2 T 1 Πίνακας 4: Ανάλυση διασποράς F F = MSR MSE F K,T K 1 Συντελεστής προσδιορισμού είναι η αναλογία της μεταβλητότητας του Y που ερμηνεύεται από την παλινδρόμηση και είναι το μέτρο της ικανότητας προσαρμογής του μοντέλου. Ο τύπος υπολογισμού είναι: R 2 = Σŷ2 Σy 2 = 1 Σe2 Σy 2 Διαιρώντας με τους αντίστοιχους βαθμούς ελευθερίας παίρνουμε τον διορθωμένο συντελεστή προσδιορισμού: R 2 = 1 Σe2 /(T K 1) Σy 2 /(T 1) 4.2 Ελεγχος της υπόθεσης β i = 0 = 1 s2 s y 2 Πραγματοποιώντας στο γραμμικό μοντέλο Y i = β 0 + β 1 X i ε i τον έλεγχο: H 0 : β 1 = 0 H 1 : β 1 0 ουσιαστικά ελέγχουμε αν υπάρχει σχέση μεταξύ της εξαρτημένης μεταβλητής Y και της ανεξάρτητης X, αφού ελέγχουμε αν ο συντελεστής β 1 είναι σημαντικά διαφορετικός από το μηδέν. Με χρήση της στατιστικής ελέγχου την t, σε περίπτωση ισχύος της μηδενικής υπόθεσης έχουμε: t = b 1 β 1 s b1 = b 1 s b1 και η μηδενική υπόθεση απορρίπτεται αν: 38

39 t = b 1 s b1 t T 2,α/2 Απόρριψη της μηδενικής υπόθεσης σημαίνει ότι η μεταβλητή X είναι σημαντική για την ερμηνεία της Y. Αν με ανάλογο τρόπο πραγματοποιήσουμε τον έλεγχο: H 0 : β 0 = 0 H 1 : β 0 0 και ισχύει η μηδενική υπόθεση, σημαίνει ότι η ευθεία παλινδρόμησης περνάει από την αρχή των αξόνων. 4.3 Ελεγχος της υπόθεσης β 1 =... = β k = 0 Ο Ελεγχος H 0 : β 1 =... = β k = 0 αναφέρεται στην ικανότητα όλων των Κ ερμηνευτικών μεταβλητών να να διαμορφώσουν τις τιμές της εξαρτημένης μεταβλητής Y. Αν ισχύει η μηδενική υπόθεση, τότε: ή SSR/K SSE/(T K 1) = Σy 2 /K Σe 2 /(T K 1) F (K, T K 1) R 2 /K (1 R 2 )/(T K 1) F (K, T K 1) Αν ισχύει η μηδενική υπόθεση τότε η τιμή της F θα είναι μικρή, αφού το άθροισμα των τετραγώνων της παλινδρόμησης θα είναι μικρότερο από το άθροισμα των τετραγώνων του σφάλματος. Αντίθετα, για μεγάλες τιμές της F η μηδενική υπόθεση απορρίπτεται. 4.4 Ελεγχος της υπόθεσης β h+1 = β h+2 =... = β k = 0 Ο έλεγχος της υπόθεσης H 0 : β h+1 = β h+2 =... = β k = 0 έναντι της εναλλακτικής H 1 : τουλάχιστον ένα εξ αυτών διαφορετικό από το μηδέν σημαίνει ότι οι ερμηνευτικές μεταβλητές X h+1, X h+2,..., X k που αντιστοιχούν στους συντελεστές β h+1, β h+2,..., β k δεν επιδρούν στην διαμόρφωση των τιμών της εξαρτημένης μεταβλητής Y. Το να προσθέσουμε τις k h αυτές μεταβλητές στο μοντέλο δεν αυξάνει την ερμηνευτική του ικανότητα. Συμβολίζουμε: SSR H : το άθροισμα των τετραγώνων της παλινδρόμησης ανάμεσα στην Y και τις Η μεταβλητές. SSR K : το άθροισμα των τετραγώνων της παλινδρόμησης στην παλινδρόμηση ανάμεσα στην Y και τις Κ μεταβλητές όπου K > H. Αν ισχύει η μηδενική υπόθεση, τότε: (SSR K SSR H )/(K H) SSE K /(T K 1) F ( K H, T K 1) Χρησιμοποιώντας λοιπόν το κριτήριο F, αν F > F ( K H, T K 1, α), τότε η μηδενική υπόθεση απορρίπτεται. Για K H = 1 η μηδενική υπόθεση γίνεται H 0 : β i = 0 όπου i = 1,..., k. Στην περίπτωση αυτή ο έλεγχος είναι ισοδύναμος με τον t έλεγχο. 39

40 4.5 Ελεγχος για τον συντελεστή συσχέτισης Ιδιος με τον έλεγχο αν ο συντελεστής β 1 είναι σημαντικά διαφορετικός από το μηδέν, είναι και ο έλεγχος αν ο συντελεστής συσχέτισης ρ είναι μηδέν. Συγκεκριμένα: H 0 : ρ = 0 H 1 : ρ 0 Ουσιαστικά υποθέτουμε ότι δεν υπάρχει γραμμική σχέση μεταξύ του X και του Y. Υπολογίζουμε την στατιστική: t = r T 2 1 r 2 και αν t t a/2,t 2 απορρίπτουμε την H Σύγκριση δυο συντελεστών συσχέτισης Βασιζόμενοι σε ανεξάρτητα δείγματα από δυο πληθυσμούς θέλουμε να δούμε αν οι πληθυσμοί αυτοί έχουν τον ίδιο συντελεστή συσχέτισης. Εστω οι πληθυσμοί Y 1 και Y 2 και οι αντίστοιχοι συντελεστές συσχέτισης των πληθυσμών ρ 1 και ρ 2. Τα αντίστοιχα μεγέθη των δειγμάτων n 1 και n 2 και οι συντελεστές συσχέτισης των δειγμάτων r 1 και r 2. Θα πραγματοποιήσω τον έλεγχο: H 0 : ρ 1 = ρ 2 H 1 : ρ 1 ρ 2 Η στατιστική που χρησιμοποιούμε φτιάχνεται με την χρήση του Fisher z transformation: z = 1 2 log e( 1 + r 1 r ) για καθέναν από τους δυο συντελεστές συσχέτισης στα δείγματα. Η στατιστική που χρησιμοποιούμε είναι: z = z 1 z 2 1 n n 2 3 και για z z(1 α/2) αποδεχόμαστε την μηδενική υπόθεση. 40

41 5 Σχέση του φύλου του μαθητή με τις επιδόσεις του 5.1 Ερευνες για τις διαφορές των φύλων Από τα πρώτα τους χρόνια τα παιδια έρχονται αντιμέτωπα με διαφορετικές προσδοκίες από το περιβάλλον τους εξαρτώμενες από το φύλο τους[6]. Οι προσδοκίες αυτές λειτουργούν ως αυτοεκπληρούμενη προφητεία. Η αναμενόμενη λόγω του φύλου του συμπεριφορά του παιδιού ενθαρρύνεται και αυτό αυξάνει την πιθανότητα συνέχιση της. Τα τελευταία χρόνια παρατηρείται μεταβολή στη μορφή της ανισότητας των φύλων στην εκπαίδευση. Εκτός από την οφειλόμενη στα στερεότυπα ανισότητα, οι διαφορές που υπάρχουν μεταξύ των φύλων στην εκπαίδευση έχουν αρνητικές συνέπειες με οικονομική και κοινωνική διάσταση. Προκύπτει ότι οι γυναίκες εκπροσωπούνται λιγότερο σε σχέση με τους άντρες σε τομείς όπως των μαθηματικών, των επιστημών και της τεχνολογίας, ενώ τα αγόρια έχουν χαμηλότερες επιδόσεις στην ανάγνωση. Αυτά τα δύο μόνο παραδείγματα δείχνουν την αναγκαιότητα βελτίωσης του εκπαιδευτικού συστήματος ώστε να δίνεται η δέουσα προσοχή στις διαφορές των φύλων στον χώρο της εκπαίδευσης. Οι διαφορές των φύλων στην εκπαίδευση είναι ένας από τους τομείς που συχνά αποτελούν αντικείμενο έρευνας. Οι Maccoby και Jacklin [7] επιχείρησαν μια σύνοψη στο βιβλίο τους The Psychology of Sex Differences, όπου εξέτασαν ερευνητικές μελέτες με θέμα τις διαφορές των φύλων. Συμπέραναν ότι ενώ κάποια πρότυπα εμμένουν, όπως η γυναικεία υπεροχή στην ικανότητα προφορικής έκφρασης και η ανωτερότητα των αντρών στις μαθηματικές δεξιότητες, είναι δύσκολο να διασαφηνιστεί η επιρροή των στερεοτύπων στις αντιλήψεις και τις συμπεριφορές των ανθρώπων και να καταστεί ξεκάθαρο εάν και σε ποιον βαθμό οι εγγενείς ή επίκτητες συμπεριφορές ενισχύουν την ανάπτυξη γνωστικών διαφορών μεταξύ των φύλων. Οι Gipps και Murphy [8] επισημαίνουν ότι τα τεστ που παρουσιάζουν διαφορές των φύλων ενδέχεται να μην είναι ακριβή στην πρόβλεψη της επίδοσης ή της μελλοντικής μαθησιακής ικανότητας. Οι διαφορές των φύλων που εξάγονται, ενδεχομένως να οφείλονται στο ίδιο το τεστ ή στις διαφοροποιημένες απαντήσεις που έδωσαν άντρες και γυναίκες, δηλαδή στα στερεότυπα του κοινωνικού φύλου. Τα τεστ μπορεί να μην αντανακλούν ή να προβλέπουν τη μαθησιακή ικανότητα που απαιτείται από το σχολικό αναλυτικό πρόγραμμα, αλλά μάλλον να αντανακλούν αυτό που οι ερευνητές θεωρούν ότι αποτελεί συγκεκριμένη ικανότητα μάθησης. Συνοπτικά, ίσως αυτά τα τεστ να μην έχουν καμία απολύτως χρησιμότητα για να προβλέψουν ποιοι μαθητές είναι πιθανόν να έχουν ιδιαίτερα καλή (ή κακή) επίδοση στο σχολικό πλαίσιο και σημείωσαν ότι το εύρος των διαφορών είναι μικρό σε σύγκριση με τις ομοιότητες των φύλων. Ο Wiliam [9] ισχυρίζεται ότι οι διαφορές των φύλων σε γνωστικό επίπεδο είναι μικρές και τα τελευταία χρόνια έχουν αμβλυνθεί περισσότερο σε κάποια γνωστικά αντικείμενα. Οπως αναφέρει, το πιο σημαντικό εύρημα έγκειται στο γεγονός ότι οι διαφορές των φύλων, ακόμη και σε μαθήματα όπως τα μαθηματικά, είναι μικρές και διαγράφουν σταθερά πτωτική πορεία στη διάρκεια των τελευταίων 20 ετών. Πολύ λίγα τεστ δείχνουν τυπική μέση διαφορά υπέρ των αντρών ή των γυναικών πέραν του 0,4, γεγονός που σημαίνει ότι λιγότερο από το 4% της απόκλισης των βαθμολογιών στα τεστ σχετίζεται με διαφορές των φύλων. 41

42 Σε ότι αφορά πιο συγκεκριμένα τα μαθηματικά, η έρευνα PISA ανέφερε κάποιο πλεονέκτημα για τα αγόρια σε όλους τους γύρους εξετάσεων αν και όχι σε όλες τις χώρες. Η αξιολόγηση PISA 2000 στην περίπτωση εφήβων ηλικίας 15 ετών αποκάλυψε ότι τα αγόρια είχαν καλύτερες βαθμολογίες από τα κορίτσια στις μισές ευρωπαϊκές χώρες, ενώ στις υπόλοιπες δεν καταγράφηκαν διαφορές [10]. Μεγαλύτερο μέρος του πλεονεκτήματος των αγοριών οφειλόταν στο γεγονός ότι περισσότερα αγόρια σημείωσαν εξαιρετικά καλή επίδοση και όχι στη σχετική απουσία αγοριών από τον πληθυσμό όσων είχαν χαμηλή επίδοση. Στους κόλπους των μαθητών με χαμηλή επίδοση (εκείνοι οι μαθητές οι οποίοι τυπικά δεν είναι ικανοί να συμπληρώσουν ένα απλό διαδικαστικό βήμα που αποτελείται από την αναπαράσταση βασικών μαθηματικών γεγονότων ή διαδικασιών ή να εφαρμόσουν απλές υπολογιστικές δεξιότητες), η αναλογία κοριτσιών και αγοριών ήταν περίπου ίση [10]. Τα αποτελέσματα της έρευνας PISA 2003 έδειξαν μάλλον μικρές διαφορές των φύλων στη μαθητική επίδοση, δηλαδή τα αγόρια είχαν σημαντικά καλύτερη επίδοση στα μαθηματικά μόνο στην Ελλάδα, τη Σλοβακία και το Λιχτενστάιν [11]. Μολονότι οι επιδόσεις των κοριτσιών, σε γενικές γραμμές, ήταν παρόμοιες με ε- κείνες των αγοριών, τα κορίτσια είχαν την τάση να αναφέρουν χαμηλότερα επίπεδα ενδιαφέροντος και απόλαυσης για τα μαθηματικά. Κατά μέσον όρο, τα αγόρια είχαν υψηλότερο επίπεδο αυτοπεποίθησης στη διεκπεραίωση συγκεκριμένων εργασιών. Τα αγόρια κατέγραψαν επίσης υψηλότερα επίπεδα αυτοαντίληψης στις μαθηματικές τους δεξιότητες. Αντιστρόφως, τα κορίτσια είχαν υψηλότερα επίπεδα αγωνίας σε σχέση με το συγκεκριμένο γνωστικό αντικείμενο. Η Πολωνία ήταν η μοναδική χώρα που δεν έδειξε σημαντική διαφορά των φύλων στα επίπεδα αυτοαποτελεσματικότητας, αυτοαντίληψης και αγωνίας στα μαθηματικά. Παράλληλα, ούτε η Ιταλία παρουσίασε σημαντικές διαφορές των φύλων όσον αφορά στην αυτοαντίληψη και την αγωνία [11]. Η αξιολόγηση PISA 2006 βρήκε σημαντικό πλεονέκτημα των α- γοριών στο μέσο επίτευγμα στα μαθηματικά σχεδόν στις μισές ευρωπαϊκές χώρες. Δεν σημειώθηκε χάσμα των φύλων στο Βέλγιο, τη Βουλγαρία, τη Δημοκρατία της Τσεχίας, την Εσθονία, την Ελλάδα, τη Γαλλία, τη Λετονία, τη Λιθουανία, τη Σλοβενία, τη Σουηδία, την Ισλανδία, το Λιχτενστάιν και την Τουρκία. 5.2 Περιγραφή Δεδομένων Ο πληθυσμός της έρευνας αυτής αποτελείται από μαθητές γυμνασίου της ορεινής Αχαΐας που άρχισαν και τελείωσαν το γυμνάσιο στο συγκεκριμένο σχολείο. Οι μαθητές αυτοί προέρχονται όχι μόνο από το χωριό όπου βρίσκεται το σχολείο, αλλά και από αρκετά ακόμα μικρότερα χωριά, που βρίσκονται στην ευρύτερη περιοχή και δεν έχουν γυμνάσιο. Η μετακίνηση τους γίνεται καθημερινά με λεωφορείο. Ο πληθυσμός στην ευρύτερη περιοχή του σχολείου είναι κατά κύριο λόγο αγροτικόσ-κτηνοτροφικός. Για κάθε μαθητή που ξεκινάει το γυμνάσιο δημιουργείται μία καρτέλα που τον ακολουθεί έως ότου τελειώσει την φοίτησή του. Στην καρτέλα αυτή υπάρχει, πέρα από τα προσωπικά του στοιχεία, πλήρης καταγραφή των σχολικών του επιδόσεων για κάθε έτος φοίτησής του. Σε κάθε μάθημα που διδάσκεται όλη την σχολική χρονιά αποδίδονται στον μαθητή οι εξής βαθμοί: Βαθμός Α τριμήνου Βαθμός Β τριμήνου Βαθμός Γ τριμήνου 42

43 Βαθμός τελικών γραπτών εξετάσεων Από τους τέσσερις αυτούς βαθμούς εξάγεται ένας μέσος όρος, που είναι και ο τελικός βαθμός για το μάθημα την συγκεκριμένη σχολική χρονιά. Για παράδειγμα ο βαθμός των μαθηματικών για την Α Γυμνασίου θα είναι: Μαθηματικά Α Γυμνασίου = (Βαθμός Α τριμήνου+βαθμός Β τριμήνου+βαθμός Γ τριμήνου+βαθμός τελικών γραπτών εξετάσεων)/4 Προσθέτοντας όλους τους τελικούς βαθμούς των μαθημάτων που διδάχτηκαν την σχολική χρονιά και διαιρώντας με το πλήθος τους έχουμε την συνολική επίδοση για την χρονιά. Η βαθμολογική κλίμακα είναι Για την έρευνα αυτή έχουν χρησιμοποιηθεί οι καρτέλες εβδομήντα μαθητών. Για κάθε μαθητή έχει καταγραφεί από την καρτέλα του για κάθε τάξη η επίδοση στα μαθηματικά, στη γλώσσα και η συνολική επίδοση, καθώς και το φύλο του. Ετσι έχει κατασκευαστεί ένας πίνακάς παρόμοιος με τον πίνακα 5 που φαίνεται παρακάτω: μαθητής μαθητής 1 μαθητής 2... μαθητής 70 φύλο αγόρι κορίτσι... κορίτσι Μαθηματικά Α Γυμνασίου Μαθηματικά Β Γυμνασίου Μαθηματικά Γ Γυμνασίου Γλώσσα Α Γυμνασίου Γλώσσα Β Γυμνασίου Γλώσσα Γ Γυμνασίου Συνολική επίδοση Α Γυμνασίου 15,9 18, ,2 Συνολική επίδοση Β Γυμνασίου 11,7 14, Συνολική επίδοση Γ Γυμνασίου 15 16, ,8 Πίνακας 5: Στοιχεία από τις καρτέλες των μαθητών Η κατανομή των δύο φύλων στο δείγμα δεν διαφέρει πολύ, με τα κορίτσια να υπερέχουν με ποσοστό 54% έναντι των αγοριών που αποτελούν το 46% του δείγματος, όπως φαίνεται και στο κυκλικό διάγραμμα 12. Η μέση τιμή των επιδόσεων στα μαθηματικά του συνόλου των μαθητών για κάθε τάξη φαίνεται στο σχήμα 13, ενώ η αντίστοιχη εικόνα που παρουσιάζουν για το μάθημα της γλώσσας φαίνεται στο σχήμα 14. Η εικόνα της συνολικής επίδοσης των μαθητών για κάθε σχολική χρονιά φαίνεται στο σχήμα 15. Αν τώρα επαναλάβουμε την διαδικασία έχοντας διαχωρίσει το δείγμα σε δύο ομάδες, αγόρια και κορίτσια, θα πάρουμε τις μέσες τιμές για την επίδοση αγοριών - κοριτσιών στα μαθηματικά, την γλώσσα και την συνολική επίδοση όπως φαίνεται στα σχήματα 16, 17 και 18 αντίστοιχα. 43

44 Σχήμα 12: Κατανομή των δύο φύλων στο δείγμα Σχήμα 13: Μέση τιμή της επίδοσης στα μαθηματικά για κάθε τάξη 44

45 Σχήμα 14: Μέση τιμή της επίδοσης στην γλώσσα για κάθε τάξη Σχήμα 15: Μέση τιμή της συνολικής επίδοσης για κάθε τάξη 45

46 Σχήμα 16: Μέση τιμή της επίδοσης στα μαθηματικά για κάθε τάξη αγοριών κοριτσιών Σχήμα 17: Μέση τιμή της επίδοσης στην γλώσσα για κάθε τάξη αγοριών κοριτσιών 46

47 Σχήμα 18: Μέση τιμή της συνολικής επίδοσης για κάθε τάξη αγοριών κοριτσιών 47

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Μοντέλα Παλινδρόμησης Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Εισαγωγή (1) Σε αρκετές περιπτώσεις επίλυσης προβλημάτων ενδιαφέρει η ταυτόχρονη μελέτη δύο ή περισσότερων μεταβλητών, για να προσδιορίσουμε με ποιο

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ B Δημήτρης Κουγιουμτζής e-mal: dkugu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://uer.auth.gr/~dkugu/teach/cvltraport/dex.html Εφαρμοσμένη Στατιστική:

Διαβάστε περισσότερα

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100 Ποσοτικές Μέθοδοι Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR 50100 Απλή Παλινδρόμηση Η διερεύνηση του τρόπου συμπεριφοράς

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

Οικονομετρία Ι. Ενότητα 2: Ανάλυση Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Οικονομετρία Ι. Ενότητα 2: Ανάλυση Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Οικονομετρία Ι Ενότητα 2: Ανάλυση Παλινδρόμησης Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commos. Για εκπαιδευτικό

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

5. Έλεγχοι Υποθέσεων

5. Έλεγχοι Υποθέσεων 5. Έλεγχοι Υποθέσεων Υποθέσεις Η μηδενική υπόθεση Η (ή ΗΑ) εναλλακτική υπόθεση Δεχόμαστε Η Απορρίπτουμε Η Η σωστή Σωστή απόφαση -α Σφάλμα τύπου Ι α Η λάθος Σφάλμα τύπου ΙΙ β Σωστή απόφαση -β ΒΙΟ39-Έλεγχος

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 5: Παλινδρόμηση Συσχέτιση θεωρητική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Θα εξεταστούν μόνο οι περιπτώσεις των ψευδομεταβλητών που χρησιμοποιούνται σαν ανεξάρτητες μεταβλητές

Θα εξεταστούν μόνο οι περιπτώσεις των ψευδομεταβλητών που χρησιμοποιούνται σαν ανεξάρτητες μεταβλητές Όταν ένα μέγεθος είναι αδύνατο να ποσοτικοποιηθεί αλλά πρέπει οπωσδήποτε να χρησιμοποιηθεί σε ένα υπόδειγμα προσεγγίζεται συνήθως με μια μεταβλητή η οποία ονομάζεται ποιοτική μεταβλητή ή ψευδομεταβλητή.

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι Πανεπιστημίου Πειραιώς) Τηλ.: 4..97,,, Fax : 4..634 URL : www.vtal.gr emal: f@vtal.gr Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) 5 H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) Περίληψη Σκοπός του κεφαλαίου είναι η εφαρμογή της ανάλυσης συσχέτισης (Pearson r) μέσω του PASW. H ανάλυση συσχέτισης Pearson r χρησιμοποιείται για να εξεταστεί η

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ 1 ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ 1. Ποιες μεταβλητές λέγονται ποσοτικές; (ΓΕΛ 2005) 2. Πότε μια ποσοτική μεταβλητή ονομάζεται διακριτή και πότε συνεχής; (ΓΕΛ 2005,2014) 3. Τι ονοµάζεται απόλυτη

Διαβάστε περισσότερα

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ Τα μη γραμμικά μοντέλα έχουν την πιο κάτω μορφή: η μορφή αυτή μοιάζει με τη μορφή που έχουμε για τα γραμμικά μοντέλα ( δηλαδή η παρατήρηση Y i είναι το άθροισμα της αναμενόμενης

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ Α εξεταστική περίοδος χειµερινού εξαµήνου 4-5 ιάρκεια εξέτασης ώρες και 45 λεπτά Θέµατα Θέµα (α) Τα υποδείγµατα που χρησιµοποιούνται στην οικονοµική θεωρία ονοµάζονται ντετερµινιστικά ενώ τα οικονοµετρικά

Διαβάστε περισσότερα

ΘΕΜΑ 1o A. Να αποδείξετε ότι για οποιαδήποτε ασυμβίβαστα μεταξύ τους ενδεχόμενα Α και Β ισχύει ότι Ρ(Α»Β)=Ρ(Α)+Ρ(Β) Μονάδες 10

ΘΕΜΑ 1o A. Να αποδείξετε ότι για οποιαδήποτε ασυμβίβαστα μεταξύ τους ενδεχόμενα Α και Β ισχύει ότι Ρ(Α»Β)=Ρ(Α)+Ρ(Β) Μονάδες 10 ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΠΑΝΕΛΛΑ ΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΕΠΑΛ (ΟΜΑ Α Β ) ΕΥΤΕΡΑ 18 MAΪΟΥ 009 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ-ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ ΕΡΓΑΣΤΗΡΙΟ PASW 18 Δρ. Κουνετάς Η Κωνσταντίνος Ακαδημαϊκό Έτος 2011 2012 ΕΠΙΧ

Διαβάστε περισσότερα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 015 Ανάλυση Διακύμανσης Η Ανάλυση Διακύμανσης είναι μία τεχνική που

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Η/Υ ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ 1o ΜΑΘΗΜΑ Ι ΑΣΚΩΝ: ΒΑΣΙΛΕΙΑ ΗΣ ΓΕΩΡΓΙΟΣ Email: gvasil@math.auth.gr Ιστοσελίδες Μαθήματος: users.auth.gr/gvasil

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 4: Στατιστική Ι (4/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 4: Στατιστική Ι (4/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 4: Στατιστική Ι (4/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

P(A ) = 1 P(A). Μονάδες 7

P(A ) = 1 P(A). Μονάδες 7 ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β ) ΠΑΡΑΣΚΕΥΗ 20 ΜΑΪΟΥ 2016 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ:

Διαβάστε περισσότερα

Διάλεξη 5: Τυχαία Μεταβλητή Κατανομές Πιθανότητας

Διάλεξη 5: Τυχαία Μεταβλητή Κατανομές Πιθανότητας Διάλεξη 5: ΑΣΚΗΣΕΙΣ 1. Έστω η ποιότητα ενός προϊόντος που παίρνουμε από ένα σύνολο προϊόντων με απλή τυχαία δειγματοληψία. Ανάλογα με το αν το προϊόν είναι ελαττωματικό, καλο ή άριστο, η παίρνει τις τιμές,

Διαβάστε περισσότερα

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες ΜΑΘΗΜΑ 3ο Βασικές έννοιες Εισαγωγή Βασικές έννοιες Ένας από τους βασικότερους σκοπούς της ανάλυσης των χρονικών σειρών είναι η διενέργεια των προβλέψεων. Στα υποδείγματα αυτά η τρέχουσα τιμή μιας οικονομικής

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΤΕΙ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΓΙΑΝΝΗΣ ΦΑΝΟΥΡΓΙΑΚΗΣ ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΣΥΝΕΡΓΑΤΗΣ ΤΕΙ ΚΡΗΤΗΣ ΔΟΜΗ ΠΑΡΟΥΣΙΑΣΗΣ 1. Εισαγωγή

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης Σφάλματα Μετρήσεων 4.45 Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης Διάστημα εμπιστοσύνης βρίσκονται εκτός του Διαστήματος Εμπιστοσύνης 0.500 X 0.674σ 1 στις 0.800 X 1.8σ 1 στις

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

Γ ε ν ι κ έ ς εξ ε τ ά σ ε ι ς Μαθηματικά και Στοιχεία Στατιστικής Γ λυκείου γ ε ν ι κ ή ς π α ι δ ε ί α ς

Γ ε ν ι κ έ ς εξ ε τ ά σ ε ι ς Μαθηματικά και Στοιχεία Στατιστικής Γ λυκείου γ ε ν ι κ ή ς π α ι δ ε ί α ς Φ ρ ο ν τ ι σ τ ή ρ ι α δ υ α δ ι κ ό 1 ΦΡΟΝΤΙΣΤΗΡΙ δυαδικό Γ ε ν ι κ έ ς εξ ε τ ά σ ε ι ς 2 0 1 6 Μαθηματικά και Στοιχεία Στατιστικής Γ λυκείου γ ε ν ι κ ή ς π α ι δ ε ί α ς Τα θέματα επεξεργάστηκαν οι

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C Επιμέλεια: Κ Μυλωνάκης ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΕΡΩΤΗΣΗ Τι ονομάζεται πραγματική συνάρτηση με πεδίο ορισμού το Α; Έστω Α ένα υποσύνολο του R Ονομάζουμε πραγματική συνάρτηση με πεδίο ορισμού το Α μια διαδικασία

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ 1 ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ 1. Ένα σηµείο Α(χ, ψ) ανήκει στη γραφική παράσταση της f αν f(ψ)=χ. 2. Αν µια συνάρτηση είναι γνησίως αύξουσα σε ένα διάστηµα A,

Διαβάστε περισσότερα

Μέρος IV. Ελεγχοι Υποθέσεων (Hypothesis Testing)

Μέρος IV. Ελεγχοι Υποθέσεων (Hypothesis Testing) Μέρος IV. Ελεγχοι Υποθέσεων (ypothesis Testig) Βασικές έννοιες Γενική μεθοδολογία Σφάλμα τύπου Ι και -vlue Στατιστικοί έλεγχοι υποθέσεων για ειδικές περιπτώσεις Εφαρμοσμένη Στατιστική Μέρος 4 ο - Κ. Μπλέκας

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 5 Έστω για την σύγκριση δειγμάτων συλλέγουμε παρατηρήσεις Υ =,,, από

Διαβάστε περισσότερα

Παραβιάσεις των κλασσικών υποθέσεων. ο εκτιμητής LS είναι: Οι βασικές ιδιότητες του εκτιμητή είναι:

Παραβιάσεις των κλασσικών υποθέσεων. ο εκτιμητής LS είναι: Οι βασικές ιδιότητες του εκτιμητή είναι: Παραιάσεις των κλασσικών υποθέσεων Στο γραμμικό υπόδειγμα y = x+ u, =,,, ο εκτιμητής LS είναι: ˆ x y = = x = Οι ασικές ιδιότητες του εκτιμητή είναι: ˆ ( ) Var =, αμεροληψία, ˆ σ = x = Επιπλέον αν δεν έχουμε

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΟΓΔΟΟ ΕΡΓΑΣΤΗΡΙΟΥ -ΧΡΗΣΗ ΨΕΥΔΟΜΕΤΑΒΛΗΤΩΝ (DUMMY VARIABLES) Ακαδημαϊκό Έτος

ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΟΓΔΟΟ ΕΡΓΑΣΤΗΡΙΟΥ -ΧΡΗΣΗ ΨΕΥΔΟΜΕΤΑΒΛΗΤΩΝ (DUMMY VARIABLES) Ακαδημαϊκό Έτος ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΜΑΘΗΜΑ ΟΓΔΟΟ ΕΡΓΑΣΤΗΡΙΟΥ -ΧΡΗΣΗ ΨΕΥΔΟΜΕΤΑΒΛΗΤΩΝ (DUMMY VARIABLES) Ακαδημαϊκό Έτος 2011-2012 ΕΠΙΧ Οικονομετρικά Πρότυπα Διαφάνεια 1 ΓΕΝΙΚΑ Όπως είναι ήδη γνωστό οι μεταβλητές που χρησιμοποιούνται

Διαβάστε περισσότερα

1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05

1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05 1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05 2. ΜΕΤΑΒΛΗΤΕΣ -ΣΧΕΣΕΙΣ ΜΕΤΑΞΥ ΜΕΤΑΒΛΗΤΩΝ Όλες οι έρευνες αναφέρονται σε μεταβλητές

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3. .. ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3. Ποιες μεταβλητές λέγονται ποσοτικές; 4. Πότε μια ποσοτική μεταβλητή

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Επιχειρήσεων ΙΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #: Επαγωγική Στατιστική - Δειγματοληψία Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες

Διαβάστε περισσότερα

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα Στατιστική είναι ο κλάδος των μαθηματικών που εμβαθύνει σε μεθόδους συλλογής δεδομένων, οργάνωσης, παρουσίασης των δεδομένων και εξαγωγής συμπερασμάτων

Διαβάστε περισσότερα

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση Οι επιδόσεις δέκα μαθητών σε τέσσερα μαθήματα Μαθητής Άλγεβρα Φυσική Νέα Ελληνικά Μουσική Α 65 63 35 61 Β 60 58 38 35 Γ 60 60 40 46

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΛΙΝ ΡΟΜΗΣΗ..Π.Μ.Σ. Μαθηµατικά των Υπολογιστών και των Αποφάσεων. Πάτρα, 27 Ιανουαρίου 2011

ΠΑΛΙΝ ΡΟΜΗΣΗ..Π.Μ.Σ. Μαθηµατικά των Υπολογιστών και των Αποφάσεων. Πάτρα, 27 Ιανουαρίου 2011 Πάτρα, 7 Ιανουαρίου 011 Γενικά Πολλές ϕορές µας ενδιαφέρει να µελετήσουµε τις σχέσεις που υπάρχουν ανάµεσα στις µεταβλητές. Παράδειγµα 1 OZON 300 80 60 40 0 00 180 150 00 50 300 350 400 450 CFC 1 Από το

Διαβάστε περισσότερα

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ). Δισδιάστατη ανάλυση Πίνακες διπλής εισόδου Σε πολλές περιπτώσεις μελετάμε περισσότερες από μία μεταβλητές ταυτόχρονα. Π.χ. μία έρευνα που έγινε σε ένα δείγμα 58 ατόμων περιείχε τις ερωτήσεις «ποια είναι

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΑΣΚΗΣΕΙΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΑΣΚΗΣΕΙΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. Δίνεται η συνάρτηση με τύπο: 7. f ( x) x x x, x α. Να βρείτε τη μονοτονία της συνάρτησης καθώς και τις θέσεις και το είδος των τοπικών ακρότατων που παρουσιάζει.

Διαβάστε περισσότερα

ΘΕΜΑ Α Α1. Αν οι συναρτήσεις f, g είναι παραγωγίσιμες στο, να αποδείξετε ότι ( f (x) + g(x)

ΘΕΜΑ Α Α1. Αν οι συναρτήσεις f, g είναι παραγωγίσιμες στο, να αποδείξετε ότι ( f (x) + g(x) ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ ΠΑΝΕΛΛΗΝΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑ Α Β ) ΤΕΤΑΡΤΗ 3 ΜΑΪΟΥ 01 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ ΣΥΝΟΛΟ

Διαβάστε περισσότερα

f x g x f x g x, x του πεδίου ορισμού της; Μονάδες 4 είναι οι παρατηρήσεις μιας ποσοτικής μεταβλητής Χ ενός δείγματος μεγέθους ν και w

f x g x f x g x, x του πεδίου ορισμού της; Μονάδες 4 είναι οι παρατηρήσεις μιας ποσοτικής μεταβλητής Χ ενός δείγματος μεγέθους ν και w ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β ) ΤΕΤΑΡΤΗ 0 ΜΑΪΟΥ 015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΘΕΜΑ Α Α1 Αν οι συναρτήσεις f,g

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων α) Σημειοεκτιμητική β) Εκτιμήσεις Διαστήματος ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Παράδειγμα

Διαβάστε περισσότερα

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40] Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική 8// (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [4] Τα τελευταία χρόνια παρατηρείται συνεχώς αυξανόμενο ενδιαφέρον για τη μελέτη της συγκέντρωσης

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Έλεγχος διακυμάνσεων Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται

Διαβάστε περισσότερα

ΘΕΜΑ Α Α1. Αν και είναι δύο συμπληρωματικά ενδεχόμενα ενός δειγματικού χώρου να αποδείξετε ότι για τις πιθανότητές τους ισχύει: ( ) 1 ( ).

ΘΕΜΑ Α Α1. Αν και είναι δύο συμπληρωματικά ενδεχόμενα ενός δειγματικού χώρου να αποδείξετε ότι για τις πιθανότητές τους ισχύει: ( ) 1 ( ). ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β ) ΠΑΡΑΣΚΕΥΗ 0 ΜΑΪΟΥ 016 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ: ΤΕΣΣΕΡΙΣ() ΘΕΜΑ

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 6: Συσχέτιση και παλινδρόμηση εμπειρική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΜΕΛΕΤΗΣ ΙΟΥΝΙΟΥ 2016 (version ) είναι: ( ) f =

ΣΗΜΕΙΩΣΕΙΣ ΜΕΛΕΤΗΣ ΙΟΥΝΙΟΥ 2016 (version ) είναι: ( ) f = ΣΗΜΕΙΩΣΕΙΣ ΜΕΛΕΤΗΣ ΙΟΥΝΙΟΥ 16 (version 9-6-16) 1. A Να δώσετε τον ορισμό της παραγώγου μιας συνάρτησης σε ένα σημείο x του πεδίο ορισμού της. Απάντηση: Παράγωγος μιας συνάρτησης σε ένα σημείο x του πεδίο

Διαβάστε περισσότερα

Ηποσοτικήέρευνα. (Θεμελιώδεις έννοιες)

Ηποσοτικήέρευνα. (Θεμελιώδεις έννοιες) Ηποσοτικήέρευνα (Θεμελιώδεις έννοιες) 1 Πειραματική έρευνα Ποσοτική έρευνα Πειραματική Ημι-πειραματική Αντιστροφής Περιγραφική Σύγκρισης Συσχέτισης Διαδοχικων Μ. 2 Μη Ισοδ..Ομ. Αντιστροφής Πειραματική

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ ΘΕΜΑΤΑ ΘΕΜΑ A A. Αν οι συναρτήσεις f, g είναι παραγωγίσιμες στο, να αποδείξετε ότι f g f g,. Μονάδες 7 Α. Σε ένα πείραμα με ισοπίθανα αποτελέσματα

Διαβάστε περισσότερα

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα. ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα. Στα παραπάνω ιστογράμματα, παρατηρούμε, ότι αν και υπάρχει διαφορά στη διασπορά των τιμών

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα