ΜΕΡΙΚΕΣ ΕΙΔΙΚΕΣ ΜΟΡΦΕΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΜΕΡΙΚΕΣ ΕΙΔΙΚΕΣ ΜΟΡΦΕΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ"

Transcript

1 ΜΕΡΙΚΕΣ ΕΙΔΙΚΕΣ ΜΟΡΦΕΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ Εικονικές Μεταβλητές (ή Ψευδομεταβλητές) (Dummy variables) Ο όρος ανάλυση παλινδρόμησης χρησιμοποιείται συνήθως όταν αναφερόμαστε σε περιπτώσεις όπου τόσο το Υ όσο και τα Χ είναι ποσοτικές μεταβλητές. Αυτό αποτελεί ένα από τους σοβαρούς περιορισμούς της γραμμικής παλινδρόμησης. Σε πολλές περιπτώσεις όμως τα προβλήματα που μελετώνται αναφέρονται και σε ποιοτικές μεταβλητές οι οποίες, εκ των πραγμάτων, πρέπει να ποσοτικοποιηθούν προκειμένου να μελετηθούν. Εξάλλου, οι μεταβλητές που χρησιμοποιούνται στις εξισώσεις παλινδρόμησης, είναι, συνήθως, συνεχείς. Σε πολλές όμως περιπτώσεις χρειάζεται να χρησιμοποιήσουμε κάποιο παράγοντα που εμφανίζεται σε δύο ή περισσότερα, διακεκριμένα επίπεδα. Για παράδειγμα, είναι ενδεχόμενο να μας ενδιαφέρει να αναλύσουμε στοιχεία που αναφέρονται στην διαφορετική συμπεριφορά δύο ατόμων ως προς το φύλο τους, στην λειτουργία τριών μηχανών ή δύο βιομηχανιών ή έξι εργαζομένων ή στην κομματική τοποθέτηση ενός πολίτη. Εδώ δεν μπορούμε να χρησιμοποιήσουμε μία συνεχή κλίμακα για τις μεταβλητές "φύλο", "μηχανή", "εργοστάσιο", "εργαζόμενος", ή "κόμμα". Σε τέτοιες περιπτώσεις είναι αναγκαίο να αντιστοιχίσουμε στις μεταβλητές αυτές κάποια επίπεδα που να λαμβάνουν υπόψη τους το γεγονός ότι οι διαφορετικοί άνθρωποι, μηχανές, εργοστάσια, εργαζόμενοι ή ψηφοφόροι, είναι δυνατό να επιδρούν με συγκεκριμένο διαφορετικό τρόπο στην εξαρτημένη μεταβλητή. Ένα άτομο, ή μια κατάσταση, προσδιορίζεται ως ανήκον σε μια από k δυνατές, αμοιβαία ξένες μεταξύ τους, κατηγορίες ή επίπεδα. Προκειμένου να καταστεί δυνατόν να περιληφθούν τέτοιες καταστάσεις σε ένα στατιστικό μοντέλο χρειάζεται να ορισθούν μεταβλητές που θα προσδώσουν αριθμητική έκφραση σε ποιοτικά (κατηγορικά) χαρακτηριστικά. 1

2 Για τις περιπτώσεις αυτές χρησιμοποιούνται οι λεγόμενες εικονικές μεταβλητές ή ψευδομεταβλητές (dummy variables). Οι μεταβλητές αυτές συνήθως χρησιμοποιούνται για να εκφράσουν δύο κατηγορίες (επίπεδα), οπότε είναι δίτιμες. Η συνήθης επιλογή για τον ορισμό μιας δίτιμης ψευδομεταβλητής είναι η χρησιμοποίηση μιας μεταβλητήςδείκτη (0-1) η οποία δείχνει αν μια συγκεκριμένη παρατήρηση ανήκει σε ένα από δύο καθορισμένα επίπεδα, ή κατηγορίες, μιας κατηγορικής εξαρτημένης μεταβλητής. Σε άλλες περιπτώσεις οι ψευδομεταβλητές χρησιμοποιούνται για να εκφράσουν μια ποιοτική μεταβλητή που παίρνει τιμές σε περισσότερες από δύο κατηγορίες (επίπεδα). Συγκεκριμένα, αν χρειάζεται να περιληφθεί σε ένα μοντέλο παλινδρόμησης με σταθερό όρο μια κατηγορική (ποιοτική) μεταβλητή με k επίπεδα (κατηγορίες), χρειάζεται να ορισθούν k-1 ψευδομεταβλητές για να εκφράσουν την κατηγορική μεταβλητή. Για παράδειγμα, αν χρειάζεται να περιλάβουμε το φύλο σε ένα μοντέλο παλινδρόμησης με σταθερό όρο χρειαζόμαστε μια ψευδομεταβλητή. Συνήθως, οι k-1 ψευδομεταβλητές που χρησιμοποιούνται επιλέγονται έτσι ώστε να είναι γραμμικά ανεξάρτητες. Στην περίπτωση των πολυεπίπεδων ανεξάρτητων ποιοτικών μεταβλητών με k-επίπεδα, χρησιμοποιούνται k-1 ψευδομεταβλητές οι οποίες (όπως θα δούμε αργότερα) είναι είτε δίτιμες (συνήθως), είτε, ισοδύναμα, παίρνουν περισσότερες από δύο τιμές. Όταν ορισθούν οι k-1 ψευδομεταβλητές για μια ποιοτική μεταβλητή με k επίπεδα, το επίπεδο (κατηγορία) που μένει ονομάζεται κατηγορία αναφοράς ή κατηγορία βάσης (reference category ή baseline category). Στην περίπτωση της έκφρασης του φύλου η δίτιμη ψευδομεταβλητή μπορεί να οριστεί ως 1 = 0 για άνδρα D i i= 1,2 για γυναίκα όπου η κατηγορία των γυναικών είναι η κατηγορία αναφοράς. Η επιλογή της κατηγορίας (επιπέδου) αναφοράς εξαρτάται συχνά από το υπό μελέτη πρόβλημα γιατί συγκεκριμένες επιλογές μπορεί να οδηγήσουν σε μια καλύτερη ερμηνεία των συντελεστών παλινδρόμησης. Αυτό συμβαίνει συνήθως όταν γίνονται συγκρίσεις με κάποια "ελεγχόμενη" ομάδα (control group). Στην περίπτωση αυτή 2

3 είναι φυσικό να έχουμε την ελεγχόμενη ομάδα ως κατηγορία αναφοράς. Η χρησιμοποίηση μιας ψευδομεταβλητής-δείκτη είναι επίσης χρήσιμη αν πρόκειται να κατασκευασθούν μοντέλα για κάθε επίπεδο μιας κατηγορικής μεταβλητής και να συγκριθούν μεταξύ τους. Όταν χρησιμοποιούνται για να εκφράσουν δύο κατηγορίες (επίπεδα) οι ψευδομεταβλητές ονομάζονται και διχοτομικές (dichotomous). Όταν χρησιμοποιούνται για να εκφράσουν πολλές κατηγορίες (επίπεδα) ονομάζονται και πολυεπίπεδες (polytomous). Ενώ, συνήθως χρησιμοποιούμε την ψευδομεταβλητή-δείκτη (0-1) για να παραστήσουμε μια δίτιμη κατηγορική μεταβλητή είναι δυνατόν να χρησιμοποιηθούν και άλλες εκφράσεις. Π.χ. για την ποσοτικοποίηση του φύλου μπορεί να χρησιμοποιηθεί η ψευδομεταβλητή 1 D = -1 για για άνδρα γυναίκα Το γενικό κίνητρο για να συμπεριληφθεί μια εικονική μεταβλητή σε ένα πρόβλημα παλινδρόμησης είναι, κατ ουσίαν, το ίδιο με εκείνο που οδηγεί στο να συμπεριληφθεί μία ποσοτική ανεξάρτητη μεταβλητή, Δηλαδή, (i) Nα μελετηθεί καλύτερα η εξαρτημένη μεταβλητή με την ελάττωση της επίδρασης του παράγοντα που οφείλεται στα λάθη και (ii) Nα αποτραπεί μια μεροληπτική αποτίμηση της επίδρασης μιας ανεξάρτητης μεταβλητής που είναι απόρροια του ότι έχει παραληφθεί από το μοντέλο μια άλλη ανεξάρτητη μεταβλητή η οποία σχετίζεται με αυτήν. Σε περισσότερο πολύπλοκα προβλήματα χρειάζεται να μελετήσουμε και την αλληλεπίδραση (interaction) των μεγεθών που εκφράζουν κάποιες από τις ανεξάρτητες μεταβλητές οπότε οδηγούμαστε στην ανάγκη να χρησιμοποιήσουμε την αλληλεπίδραση ποιοτικών και ποσοτικών ανεξαρτήτων μεταβλητών δηλαδή μεταβλητών και εικονικών μεταβλητών. Σημείωση 1: Όταν το πρόβλημα απαιτεί χρήση και διτίμων ποιοτικών εξαρτημένων μεταβλητών οδηγούμεθα στην μελέτη των μοντέλων που χαρακτηρίζονται ως logit και probit. π i p ) = p(y = 1X x ) (Yi = i 3

4 επομένως, Ε( Y x i ) = π i (1)+(1-π i )(0)=π i, Οπότε logit(π ) = α + βx i i π i = log 1 π i Σημείωση 2: Παράδειγμα μιας όχι συνηθισμένης εικονικής μεταβλητής είναι η χρησιμοποίηση μιας μεταβλητής Χ 0 (της οποίας η τιμή είναι πάντοτε 1) δίπλα στην παράμετρο α του γραμμικού μοντέλου. Γράφουμε δηλαδή Y = αx 0 +βx + ε όπου Χ 0 είναι πάντοτε 1. Προφανώς, ο όρος Χ 0 δεν χρειάζεται, αλλά είναι υποβοηθητικός στο συμβολισμό, ιδιαίτερα όταν χρειάζεται να χρησιμοποιήσουμε συμβολισμό πινάκων. Σε πολλές άλλες περιπτώσεις οι εικονικές μεταβλητές είναι περισσότερο απαραίτητες, όπως για παράδειγμα στην προσπάθεια σύνδεσης της λογικής της γραμμικής παλινδρόμησης με αυτήν της ανάλυσης διακύμανσης. Όπως προελέχθη, χαρακτηριστικότερη περίπτωση χρησιμοποίησης εικονικής μεταβλητής είναι όταν θέλουμε να μελετήσουμε ποιοτικά δεδομένα που είναι ενδεχόμενο να έχουν ένα από δύο διαφορετικά χαρακτηριστικά. Σε τέτοιες περιπτώσεις χρησιμοποιούμε την μεταβλητή - δείκτη 0-1 ως εικονική μεταβλητή. Όπως είναι προφανές, η ψευδομεταβλητή - δείκτης 0-1 χρησιμοποιείται ανάλογα με το αν υφίσταται ή όχι κάποια συγκεκριμένο χαρακτηριστικό. Ας υποθέσουμε, για παράδειγμα, ότι κάποια επιχείρηση ισχυρίζεται ότι οι μισθοί που δίνει στους εργαζομένους σ αυτήν εξαρτώνται αποκλειστικά από την εμπειρία των εργαζομένων. Έστω ότι μας ενδιαφέρει να εξετάσουμε, αν, μελετώντας την εμπειρία, υπάρχουν σημαντικές διαφορές μεταξύ ανδρών και γυναικών που εργάζονται στη εταιρεία αυτή. Στην περίπτωση αυτή θα μπορούσαμε να επιλέξουμε ένα δείγμα μισθών ανδρών και γυναικών εργαζομένων στην εταιρεία και να εκτιμήσουμε την εξίσωση παλινδρόμησης 4

5 Y =α +β 1 D + β 2 Χ + ε Όπου Y = ετήσιος μισθός Χ = εμπειρία (σε αριθμό ετών) 1 αν ο εργαζοµενος! ειναι! ανδρας! D = 0 αν ειναι! γυναικα! Οι παράμετροι της εξίσωσης αυτής μπορούν να ερμηνευθούν αν θεωρήσει κανείς τις πιθανές τιμές της εικονικής μεταβλητής. Για την περίπτωση των ανδρών εργαζομένων θα έχουμε D =1 και επομένως Y= (α+β 1 ) + β 2 Χ + ε. Για την περίπτωση γυναικών εργαζομένων D = 0 και Y = α + β 2 Χ + ε. Η παράμετρος β 1 αναφέρεται στο πρόσθετο μισθό που λαμβάνουν οι άνδρες εργαζόμενοι σε κάθε δεδομένο επίπεδο εμπειρίας. Ο ισχυρισμός του εργοδότη είναι ότι β 1 =0 (και ενδεχομένως β 2 >0). Η ανωτέρω εξίσωση παλινδρόμησης μπορεί να εκτιμηθεί με τον συνήθη τρόπο και να εξετασθεί ο ισχυρισμός του εργοδότη. Σημείωση: Επειδή οι τιμές της εικονικής μεταβλητής δίνονται, συνήθως αυθαίρετα είναι ενδεχόμενο να αναρωτηθεί κανείς αν τα όποια συμπεράσματα εξάγει από την μελέτη ενός προβλήματος μεταβάλλονται με την ενδεχόμενη χρησιμοποίησης της εικονικής μεταβλητής με διαφορετικό τρόπο. Για παράδειγμα, στην προηγούμενη περίπτωση που εξετάσαμε, αναρωτιέται κανείς αν τα αποτελέσματα θα ήταν διαφορετικά στη περίπτωση που η εικονική μεταβλητή έπαιρνε την τιμή D = 1 αν ο εργαζόμενος ήταν γυναίκα και D = 0 αν ο εργαζόμενος ήταν άνδρας. Εύκολα διαπιστώνεται ότι δεν δημιουργείται πρόβλημα στα αποτελέσματα αρκεί να είναι κανείς προσεκτικός στον τρόπο που τα ερμηνεύει. Ας θεωρήσουμε για παράδειγμα το ίδιο πρόβλημα όπως προηγουμένως χρησιμοποιώντας την εικονική μεταβλητή 1 αν ο εργαζοµενος! ειναι! γυναικα! D = 0 αν ειναι! ανδρας! 5

6 Ας εκτιμήσουμε την εξίσωση παλινδρόμησης Y = á + â 1 D + â 2 Χ + ε Με τους δύο εναλλακτικούς ορισμούς της εικονικής μεταβλητής D και D έχουμε την εξής σχέση D D D + D Άνδρας Γυναίκα Επομένως η σχέση D = 1 D συνεπάγεται ότι Y = α + β 1 (1 - D ) + β 2 Χ + ε = (α + β 1 ) + (-β 1 ) D + β 2 X + ε Επομένως α' = α + β 1, β' 1 = - β 1, β' 2 = β 2. Ο συντελεστής του Χ είναι, προφανώς, ο ίδιος και στις δύο εξισώσεις. Ο συντελεστής του D στην πρώτη διατύπωση του μοντέλου μετρά τον πρόσθετο μισθό που κερδίζει ένα άνδρας σε σχέση με μία γυναίκα που έχει την ίδια εμπειρία. Μια θετική τιμή για τον συντελεστή αυτό αποτελεί μια ένδειξη διάκρισης υπέρ των ανδρών. Ο συντελεστής του D' στη δεύτερη διατύπωση του μοντέλου μετρά τον πρόσθετο μισθό που κερδίζει μία γυναίκα σε σχέση με ένα άνδρα ιδίας εμπειρίας. Αρνητική τιμή για τον συντελεστή αυτό αποτελεί ένδειξη διάκρισης υπέρ των ανδρών. Επομένως, αν είμαστε προσεκτικοί στην ερμηνεία, δεν έχει καμιά σημασία εάν η εικονική μεταβλητή έχει την τιμή 1 για άνδρα και 0 για γυναίκα, ή αντίστροφα. Δίτιμη Ανεξάρτητη Εικονική Μεταβλητή Ξεκινάμε με την υπόθεση ότι οι σχέσεις των ανεξαρτήτων μεταβλητών είναι προσθετικές (additive) δηλαδή ότι η επιμέρους επίδραση (partial effect) κάθε ανεξάρτητης μεταβλητής είναι η ίδια, ανεξάρτητα από τη συγκεκριμένη τιμή (επίπεδο) στην οποία η άλλη ανεξάρτητη μεταβλητή διατηρείται σταθερή. (Την περίπτωση που αυτό δεν συμβαίνει θα την εξετάσουμε αργότερα). Επίσης, κάνουμε τις συνήθεις υποθέσεις της γραμμικής παλινδρόμησης ότι δηλαδή τα λάθη είναι ανεξάρτητα μεταξύ και κατανέμονται κανονικά με μέσο μηδέν και σταθερή διακύμανση. Για να κάνουμε το πρόβλημα πιο συγκεκριμένο θα μελετήσουμε περισσότερο ενδελεχώς ένα πρόβλημα παρόμοιο με το παράδειγμα 6

7 που είδαμε. Ας υποθέσουμε ότι μας ενδιαφέρει να μελετήσουμε τη σχέση μεταξύ του εισοδήματος και του επιπέδου εκπαίδευσης ανδρών και γυναικών. Το σχήμα που ακολουθεί αναφέρεται σε δύο μικρούς ιδεατούς πληθυσμούς. Σχέση εισοδήματος με εκπαίδευση ανδρών και γυναικών ενός πληθυσμού (a) (b) Εισόδημα Εισόδημα Εκπαίδευση Εκπαίδευση Ας υποθέσουμε ότι μας ενδιαφέρει να διερευνήσουμε τη σχέση μεταξύ εκπαίδευσης και εισοδήματος μεταξύ γυναικών και ανδρών του πληθυσμού αυτού. Τα σχήματα (a) και (b) εκφράζουν δύο μικρούς ιδανικούς πληθυσμούς. Και στις δύο περιπτώσεις οι ευθείες παλινδρόμησης ανά φύλο (between sex) εισοδήματος και εκπαίδευσης είναι παράλληλες. Παράλληλες ευθείες παλινδρόμησης συνεπάγονται προσθετικές επιδράσεις (additive effects) της εκπαίδευσης και του φύλου στο εισόδημα: Διατηρώντας σταθερό το επίπεδο εκπαίδευσης η "επίδραση" του φύλου στο εισόδημα εκφράζεται από την διαφορά (απόσταση) μεταξύ των δύο ευθειών παλινδρόμησης η οποία -για παράλληλες ευθείες- είναι παντού η ίδια. Παρομοίως, διατηρώντας το φύλο σταθερό, η "επίδραση" της εκπαίδευσης στο εισόδημα εκφράζεται από την κλίση της ευθείας παλινδρόμησης του εισοδήματος επί της εκπαίδευσης για το συγκεκριμένο φύλο (the within-gender education slope). Η κλίση αυτή -για παράλληλες ευθείες- είναι η ίδια για άνδρες και γυναίκες. (Η παλινδρόμηση με διάκριση ως προς το φύλο (within-group regression) για μη παράλληλες ευθείες εξετάζεται σ' άλλο μέρος). 7

8 Στο σχήμα (a) οι ανεξάρτητες μεταβλητές φύλο και εκπαίδευση είναι ασυσχέτιστες μεταξύ τους. Γυναίκες και άνδρες έχουν τις ίδιες κατανομές χρόνων εκπαίδευσης. Σε μια τέτοια περίπτωση, εάν αγνοήσουμε το φύλο και παλινδρομήσουμε το εισόδημα μόνο στην εκπαίδευση, θα καταλήξουμε στην ίδια κλίση η οποία προκύπτει αν κάνουμε δύο ξεχωριστές παλινδρομήσεις ως προς τι φύλο (within gender). Παρόλα αυτά, επειδή οι γυναίκες έχουν χαμηλότερα εισοδήματα απ' ότι οι άνδρες ίδιας εκπαίδευσης, αγνοώντας το φύλο αυξάνουμε το μέγεθος των λαθών. Η κατάσταση, όπως παρουσιάζεται στο σχήμα (b), είναι σημαντικά διαφορετική. Στην περίπτωση αυτή, το φύλο και η εκπαίδευση σχετίζονται και επομένως, εάν παλινδρομήσουμε το εισόδημα μόνο στην εκπαίδευση, καταλήγουμε σε μια μεροληπτική αποτίμηση της επίδρασης της εκπαίδευσης στο εισόδημα: Επειδή οι γυναίκες έχουν ένα υψηλότερο επίπεδο εκπαίδευσης απ' ότι οι άνδρες και επειδή, για δεδομένο επίπεδο εκπαίδευσης, το εισόδημα των γυναικών είναι χαμηλότερο, κατά μέσο όρο, απ' το αντίστοιχο των ανδρών, η συνολική παλινδρόμηση (the overall regression) του εισοδήματος στην εκπαίδευση έχει μια αρνητική κλίση, παρ' ότι οι παλινδρομήσεις του εισοδήματος κάθε φύλου πάνω στην εκπαίδευση έχουν θετικές κλίσεις 1. Υπό το φως των παραπάνω προβληματισμών θα μπορούσαμε να προχωρήσουμε στον χωρισμό του δείγματός μας με στοιχείο το φύλο και να πραγματοποιήσουμε διαφορετικές παλινδρομήσεις για γυναίκες και άνδρες. Η προσέγγιση αυτή είναι, καταρχήν, λογική αλλά έχει κάποιους περιορισμούς: Η προσαρμογή διαφορετικών ευθειών παλινδρόμησης καθιστά δύσκολη την εκτίμηση και τους ελέγχους για διαφορές εισοδήματος ως προς το φύλο. Επιπλέον, αν είναι δυνατόν να υποθέσουμε παράλληλες ευθείες παλινδρόμησης για γυναίκες και άνδρες, μπορούμε να εκτιμήσουμε πιο αποτελεσματικά την κοινή κλίση της εκπαίδευσης θεωρώντας ως ένα σύνολο τις δειγματικές παρατηρήσεις που έχουν επιλεγεί από τις δύο ομάδες. 1 Το παράδοξο αυτό, ότι δηλαδή η γενική και οι επιμέρους σχέσεις μπορεί να διαφέρουν σε πρόσημο ονομάζεται παράδοξο του Simpson (Simpson's paradox). Στη συγκεκριμένη περίπτωση η γενική (marginal) σχέση μεταξύ εισοδήματος και εκπαίδευσης είναι αρνητική ενώ η επιμέρους σχέση (partial relationship) με έλεγχο ως προς το φύλο, είναι θετική. 8

9 Συγκεκριμένα, θεωρώντας ότι ισχύουν οι συνήθεις υποθέσεις για το μοντέλο παλινδρόμησης, είναι επιθυμητό να προσαρμόσουμε το μοντέλο κοινής κλίσης (common-slope) με τη μέθοδο των ελαχίστων τετραγώνων. Ένας τρόπος για να περιγράψουμε το μοντέλο κοινής κλίσης είναι Υ i = α + βχ i + γd i + ε i όπου D, είναι η εικονική μεταβλητή. Η μεταβλητή αυτή ονομάζεται επίσης ψευδομεταβλητός παλινδρομητής (dummy-variable regression) ή μεταβλητή - δείκτης (indicator variable) που παίρνει τις τιμές 0 και 1 ως εξής: D i = 1 0 για άνδρες για γυναίκες Έτσι, το μοντέλο αυτό για τις γυναίκες, γίνεται Υ i = α + βχ i + γ(0) + ε i = α + βχ i + ε i και για άνδρες Υ i = α + βχ i + γ(1) + ε i = (α + γ) + βχ i + ε i Αυτές οι εξισώσεις παλινδρόμησης εμφανίζονται στο σχήμα που ακολουθεί γ D = 1 β D = 0 α+ γ α γ 1 1 β 0 Χ Το προσθετικό μοντέλο παλινδρόμησης εικονικής μεταβλητής. Η ευθεία D=1 αντιστοιχεί σε άνδρες και η ευθεία D=0 σε γυναίκες. Άσκηση: Ας υποθέσουμε ότι στο τελευταίο παράδειγμα χρησιμοποιούμε τις τιμές -1 και 1 για την ψευδομεταβλητή D, αντί των τιμών 0 και 1. 9

10 (i) (ii) (iii) (iv) Να γραφούν οι εξισώσεις παλινδρόμησης για άνδρες και γυναίκες και να ερμηνευτούν οι παράμετροι του μοντέλου. Αυτή η εναλλακτική κωδικοποίηση της ψευδομεταβλητής αποτυπώνει ικανοποιητικά την επίδραση του φύλου; Θα μπορούσε κανείς να ισχυριστεί ότι το μοντέλο παλινδρόμησης με ψευδομεταβλητές θα είναι αποτελεσματικό με την προϋπόθεση ότι η ψευδομεταβλητή παίρνει δύο διακεκριμένες για κάθε ένα από τα δύο φύλα; Υπάρχει κάποιος συγκεκριμένος λόγος προτίμησης του ενός από τους δύο τρόπους κωδικοποίησης; Ανεξάρτητες Μεταβλητές και Μεταβλητές Παλινδρόμησης Στο σημείο αυτό είναι χρήσιμο να επισημάνουμε τη διαφορά μεταξύ ανεξαρτήτων μεταβλητών (independent variables) και μεταβλητών παλινδρόμησης ή παλινδρομητών (regressors). Στο συγκεκριμένο παράδειγμα, το φύλο είναι μία ποιοτική ανεξάρτητη μεταβλητή με κατηγορίες (δυνατές τιμές) "άνδρας" και "γυναίκα". Η εικονική μεταβλητή D είναι μια μεταβλητή παλινδρόμησης, που εκφράζει την ανεξάρτητη μεταβλητή "φύλο". Αντιθέτως, η ποσοτική ανεξάρτητη μεταβλητή "εισόδημα" και η μεταβλητή παλινδρόμησης Χ είναι ακριβώς το ίδιο πράγμα. Εάν επρόκειτο να μετασχηματίσουμε τις παρατηρήσεις για το εισόδημα, πριν να τις χρησιμοποιήσουμε στην εξίσωση παλινδρόμησης, π.χ με την λήψη λογαρίθμων, τότε θα είχαμε διάκριση μεταξύ της ανεξάρτητης μεταβλητής (εισόδημα) και της μεταβλητής παλινδρόμησης (λογάριθμος εισοδήματος). Είναι προφανές, ότι από μια ανεξάρτητη μεταβλητή μπορεί να προκύψουν πολλές μεταβλητές παλινδρόμησης (παλινδρομητές) και ότι, μερικές μεταβλητές παλινδρόμησης μπορεί να είναι συναρτήσεις περισσοτέρων από μιας ανεξαρτήτων μεταβλητών. Επιστρέφοντας στην εξίσωση Υ i = α + βχ i + γd i +ε i και στα σχήματα (a) και (b) βλέπουμε ότι ο συντελεστής γ για τις εικονικές μεταβλητές παλινδρόμησης, εκφράζει την διαφορά των σημείων τομής για τις δύο ευθείες παλινδρόμησης. Επειδή οι δύο ευθείες παλινδρόμησης είναι παράλληλες, το γ εκφράζει επίσης τη σταθερή απόσταση μεταξύ των δύο ευθειών και μπορεί, επομένως, να ερμηνευθεί ως η αναμενόμενη 10

11 υπεροχή στο εισόδημα για τους άνδρες όταν το επίπεδο εκπαίδευσης διατηρηθεί σταθερό. Αν οι άνδρες, ως προς το εισόδημα, βρίσκονταν σε μειονεκτική θέση σε σχέση με τις γυναίκες, τότε το γ θα ήταν αρνητικό. Ο συντελεστής α δίνει το σημείο τομής για τις γυναίκες για τις οποίες D = 0 ενώ β είναι η κοινή κλίση των ευθειών παλινδρόμησης του εισοδήματος για άνδρες και γυναίκες ως προς την εκπαίδευση. Το σχήμα που ακολουθεί αποκαλύπτει το θεμελιώδες γεωμετρικό "τρυκ" που χαρακτηρίζει την κωδικοποίηση μιας εικονικής μεταβλητής παλινδρόμησης: Γεωμετρική ερμηνεία της παλινδρόμησης με εικονικές μεταβλητές. Το επίπεδο γραμμικής παλινδρόμησης ορίζεται μόνο στα σημεία D=0 και D=1, δημιουργώντας δύο ευθείες παλινδρόμησης με κλίση β και κατακόρυφη απόσταση γ. Στην πραγματικότητα προσαρμόζουμε ένα επίπεδο παλινδρόμησης στα δεδομένα αλλά η εικονική μεταβλητή παλινδρόμησης D ορίζεται μόνο στις τιμές 0 και 1 {Χ,Υ D=0} και {Χ,Υ D=1}. Το επίπεδο παλινδρόμησης τέμνει τα επίπεδα σε δύο γραμμές, κάθε μία από τις οποίες έχει κλίση β. Δοθέντος ότι η διαφορά μεταξύ D=0 και D=1 είναι μία μονάδα, η διαφορά των σημείων τομής στον άξονα Υ των δύο γραμμών είναι η κλίση του επιπέδου στην κατεύθυνση D, δηλαδή γ. Πράγματι, το προηγούμενο σχήμα είναι η προβολή των δύο ευθειών παλινδρόμησης στο επίπεδο {Χ,Υ}. Σημείωση: Οι δύο ευθείες είναι παράλληλες αλλά βρίσκονται σε διαφορετικά επίπεδα. Η πρώτη, βρίσκεται στο επίπεδο {X,Y} και η δεύτερη βρίσκεται σ' ένα επίπεδο μία μονάδα μακριά από το επίπεδο 11

12 {X,Y}. Η δεύτερη απέχει κατά γ από την προβολή της πρώτης στο δεύτερο αυτό επίπεδο. Σε παρόμοια αποτελέσματα καταλήγουμε αν αλλάξουμε τις τιμές της δίτιμης μεταβλητής D και θέσουμε 0 για άνδρες και 1 για γυναίκες. Το πρόσημο της παραμέτρου γ αλλάζει επειδή το γ στην περίπτωση αυτή, σε αντίθεση με ό,τι συνέβαινε προηγουμένως, εκφράζει την διαφορά των σημείων τομής των ευθειών παλινδρόμησης μεταξύ γυναικών και ανδρών, αλλά σε μέγεθος η διαφορά αυτή παραμένει η ίδια. Ο συντελεστής α εκφράζει τώρα το σημείο τομής του εισοδήματος για άνδρες. Είναι επομένως άνευ ουσίας ποιά κατηγορία θα εκφραστεί με 1 και ποιά με 0, με την προϋπόθεση ότι είμαστε προσεκτικοί στις ερμηνείες των συντελεστών του μοντέλου -για παράδειγμα το πρόσημο του γ- με τρόπο που οι ερμηνείες να είναι συνεπείς με την κωδικοποίηση που έχει υιοθετηθεί. Για να εξετάσουμε αν το φύλο επηρεάζει το εισόδημα με έλεγχο του επιπέδου εκπαίδευσης μπορούμε να ελέγξουμε την υπόθεση Η ο : γ=0, είτε με ένα t-test, διαιρώντας την εκτιμήτρια του γ με την εκτιμώμενη τυπική απόκλιση ή, ισοδύναμα, αγνοώντας την εικονική μεταβλητή D από το μοντέλο παλινδρόμησης και χρησιμοποιώντας ένα αυξητικό (incremental) έλεγχο F. Η όποια αριθμητική διαφορά στα δεκαδικά ψηφία των δύο ελεγχοσυναρτήσεων που έχει παρατηρηθεί, οφείλεται σε λάθη στρογγυλοποίησης. Η μέχρι τώρα ανάπτυξη αναφερόταν στη χρησιμοποίηση μιας και μόνο εικονικής μεταβλητής για μια και μόνο ποσοτική μεταβλητή παλινδρόμησης. Η ίδια μέθοδος μπορεί να εφαρμοστεί για οποιονδήποτε αριθμό ποσοτικών μεταβλητών εφόσον μπορούμε να υποθέσουμε ότι οι κλίσεις είναι οι ίδιες για τις δύο κατηγορίες της δίτιμης ανεξάρτητης μεταβλητής, ότι δηλαδή οι επιφάνειες παλινδρόμησης είναι παράλληλες στις δύο κατηγορίες. Εν γένει, εάν εφαρμόσουμε το μοντέλο Y i = α+β 1 Χ i1 + +β k Χ ik +γd i +ε i τότε, για D=0, έχουμε Y i = α+β 1 Χ i1 + +β k Χ ik +ε i Και, για D=1 Y i = (α+γ)+β 1 Χ i1 + +β k Χ ik +ε i. 12

13 Σημείωση: Οι εικονικές μεταβλητές δεν έχουν συνήθως (όχι όμως πάντοτε) σχέση με οποιαδήποτε φυσικά επίπεδα που είναι ενδεχόμενο να υπάρχουν σε αυτούς καθ αυτούς τους παράγοντες. Πολυεπίπεδες Ανεξάρτητες Ψευδομεταβλητές Εκτός από τις κατηγορικές μεταβλητές που παίρνουν τιμές σε δύο επίπεδα (όπως π.χ το φύλο), οι οποίες είναι και οι συνηθέστερες, είναι ενδεχόμενο να έχουμε κατηγορικές μεταβλητές με τιμές σε τρία ή περισσότερα επίπεδα. Για παράδειγμα, ένα πρόβλημα μπορεί να αναφέρεται σε τρεις περιοχές μιας πόλης, την βόρεια, το κέντρο και την νότια περιοχή. Ένας τρόπος για να παρασταθεί η μεταβλητή που αναφέρεται στην περιοχή είναι να ορισθούν δύο ψευδομεταβλητές ως εξής: D 1 D 2 1, = 0, 1, = 0, για την νότια περιοχή για το κέντρο διαφορετικά διαφορετικά Παρατηρούμε ότι η βόρεια περιοχή αποτελεί στην συγκεκριμένη περίπτωση την κατηγορία αναφοράς. Όπως και στην περίπτωση που χρησιμοποιούνται δίτιμες ψευδομεταβλητές για να εκφράσουν μια ποιοτική μεταβλητή με δύο κατηγορίες είναι δυνατόν να ορίσουμε ψευδομεταβλητές με τρεις τιμές για να εκφράσουν μια ποσοτική μεταβλητή που παίρνει τιμές σε τρία επίπεδα. Για παράδειγμα, στην προηγούμενη περίπτωση με τις περιοχές μιας πόλης είναι δυνατόν να οριστούν δύο ψευδομεταβλητές ως εξής: D περ1 και 1 = 0 1 για την νότια περιοχή για το κέντρο για την βόρεια περιοχή 13

14 D περ2 0 = 1 1 για την νότια περιοχή για το κέντρο για την βόρεια περιοχή Γενικοί έλεγχοι που αφορούν την κατηγορική μεταβλητή (δηλαδή έλεγχοι για την υπόθεση ότι όλοι οι συντελεστές παλινδρόμησης που αντιστοιχούν σε ένα σύνολο ψευδομεταβλητών είναι ίσοι με μηδέν) δεν εξαρτώνται από την επιλογή του ορισμού των ψευδομεταβλητών. Δοθέντος ότι στόχος ενός τέτοιου ελέγχου είναι η διερεύνηση της σχέσης μεταξύ μιας απαντητικής μεταβλητής και μιας κατηγορικής μεταβλητής ο μη επηρεασμός του ελέγχου από τον τρόπο ορισμού των ψευδομεταβλητών είναι εξαιρετικά σημαντικός. Βέβαια, η ερμηνεία των συντελεστών για κάθε μια από τις ψευδομεταβλητές εξαρτάται, όπως είναι φυσικό, από την κωδικοποίηση που χρησιμοποιήθηκε για την κατηγορική μεταβλητή. Η κωδικοποίηση για πολυεπίπεδες ψευδομεταβλητές γίνεται, συνήθως, με χρήση μεταβλητών-δεικτών (0-1). Για παράδειγμα, αν μας ενδιαφέρει να μελετήσουμε την επίδραση της εκπαίδευσης και του εισοδήματος στην αίγλη ενός επαγγέλματος είναι ενδεχόμενο να χωρίσουμε τα επαγγέλματα σε τρεις κατηγορίες (i) διοικητικά στελέχη (Α), (ii) υπαλλήλους γραφείου (Β) και (iii) εργάτες (Γ). Τα τρία αυτά επαγγελματικά επίπεδα μπορούν να εκφρασθούν σε μια ευθεία παλινδρόμησης με την χρησιμοποίηση δύο ψευδομεταβλητώνδεικτών D 1 και D 2 με την παρακάτω κωδικοποίηση. Κατηγορία D 1 D 2 Διοικητικά Στελέχη 1 0 Υπάλληλοι Γραφείου 0 1 Εργάτες 0 0 Έτσι, το μοντέλο παλινδρόμησης για το πρόβλημα αυτό θα έχει την μορφή Υ = α + β 1 Χ 1 + β 2 Χ 2 + γ 1 D 1 + γ 2 D 2 + ε Όπου Υ η αίγλη του επαγγέλματος, Χ 1 η εκπαίδευση και Χ 2 το εισόδημα. 14

15 Το μοντέλο αυτό περιγράφει τρία παράλληλα επίπεδα παλινδρόμησης τα οποία διαφέρουν όσο αφορά το σημείο τομής τους με τον άξονα των Υ: Διοικητικά Στελέχη : Υ = (α + γ 1 ) + β 1 Χ 1 + β 2 Χ 2 + ε Υπάλληλοι Γραφείου: Υ = (α + γ 2 ) + β 1 Χ 1 + β 2 Χ 2 + ε Εργάτες : Υ = α + β 1 Χ 1 + β 2 Χ 2 + ε Ο συντελεστής α επομένως, εκφράζει το σημείο τομής του άξονα του Υ με το επίπεδο παλινδρόμησης για τους εργάτες. Το γ 1 αντιπροσωπεύει την σταθερή κατακόρυφη διαφορά μεταξύ των παραλλήλων επιπέδων παλινδρόμησης για τις κατηγορίες διοικητικά στελέχη και εργάτες (με σταθερές τιμές για την εκπαίδευση και το εισόδημα). Ο συντελεστής γ 2 αντιπροσωπεύει την σταθερή κατακόρυφη απόσταση μεταξύ των επιπέδων παλινδρόμησης για υπαλλήλους γραφείου και εργάτες (διατηρώντας πάλι σταθερή την εκπαίδευση και το εισόδημα). Σύμφωνα με την κωδικοποίηση που κάναμε, η απασχόληση που αφορά εργάτες έχει την τιμή μηδέν και για τις δύο ψευδομεταβλητές παλινδρόμησης (dummy regressors). Επομένως, το επάγγελμα "εργάτης" έμμεσα χρησιμοποιείται ως κατηγορία βάσης με την οποία συγκρίνουμε τις δύο άλλες επαγγελματικές κατηγορίες. Στο συγκεκριμένο παράδειγμα, η επιλογή της κατηγορίας βάσης είναι αυθαίρετη αφού θα μπορούσαμε να εφαρμόσουμε τα ίδια τρία επίπεδα παλινδρόμησης ανεξάρτητα από το ποια επαγγελματική τάξη επιλέγαμε ως κατηγορία βάσης. Οι τιμές (και η ερμηνεία) των συντελεστών γ 1 και γ 2 για τις επιμέρους ψευδομεταβλητές εξαρτάται, παρόλα αυτά, από το ποιά κατηγορία χρησιμοποιήθηκε ως κατηγορία βάσης. Σε ορισμένες εφαρμογές, όπως στη Βιοστατιστική, η επιλογή του επιπέδου βάσης είναι το φυσικό επακόλουθο της μορφής του πειράματος, όταν αυτό περιλαμβάνει μία "ομάδα ελέγχου" (control group). Σε τέτοιες περιπτώσεις οι συντελεστές των επιμέρους ψευδομεταβλητών έχουν ενδιαφέρουν γιατί αντανακλούν διαφορές μεταξύ των "πειραματικών ομάδων" (experimental groups) και της ομάδας ελέγχου, διατηρώντας σταθερές τις άλλες ανεξάρτητες μεταβλητές. 15

16 Σημείωση: Όπως προαναφέρθηκε, στις περισσότερες εφαρμογές, η επιλογή του επιπέδου βάσης είναι αυθαίρετη, όπως στο παράδειγμα που προηγήθηκε. Ενδιαφερόμαστε επομένως να ελέγξουμε την μηδενική υπόθεση ότι η κατηγορία του επαγγέλματος δεν επηρεάζει την αίγλη του επαγγέλματος, διατηρώντας σταθερά (ελέγχοντας) την εκπαίδευση και το εισόδημα. Έτσι, έχουμε Η 0 : γ 1 = γ 2 = 0 Οι επιμέρους υποθέσεις Η 0 : γ 1 = 0 και Η 0 : γ 2 = 0 οι οποίες ελέγχουν, αντίστοιχα, διαφορές μεταξύ της απασχόλησης διοικητικών στελεχών και εργατών και μεταξύ υπαλλήλων γραφείου και εργατών έχουν λιγότερο ενδιαφέρον 2. Η μηδενική υπόθεση Η 0 : γ 1 = γ 2 = 0 μπορεί να ελεγχθεί με την προσέγγιση του επαυξητικού αθροίσματος τετραγώνων (έλεγχος F για υποσύνολο μεταβλητών). Σημείωση: Στο παράδειγμά μας για μια ποσοτική ανεξάρτητη μεταβλητή με τιμές σε τρία επίπεδα χρησιμοποιήσαμε κωδικοποίηση με δύο ψευδομεταβλητές-δείκτες. Θα μπορούσε να ισχυριστεί κανείς ότι είναι περισσότερο φυσικό να αντιμετωπίσει τις τρεις επαγγελματικές κατηγορίες συμμετρικά, κωδικοποιώντας τρεις ψευδομεταβλητούς παλινδρομητές αντί να επιλέξει αυθαίρετα μία κατηγορία ως κατηγορία αναφοράς. Κάτι τέτοιο θα μπορούσε να γίνει ως εξής: Κατηγορία D 1 D 2 D 3 Διοικητικά Στελέχη Υπάλληλοι Γραφείου Εργάτες Έτσι, για την j (j=1,2,3) κατηγορία επαγγέλματος θα έχουμε Υ=(α+γ j )+β 1 Χ 1 +β 2 Χ 2 +ε 2 Το επιχείρημα εδώ δεν είναι ότι οι επιμέρους υποθέσεις δεν έχουν ενδιαφέρον αλλά ότι αποτελούν ένα αυθαίρετα επιλεγμένο υποσύνολο των δυνατών ζευγών που μπορούν να κατασκευαστούν από το σύνολο των κατηγοριών. Στο παράδειγμα μας, όπου υπάρχουν τρεις κατηγορίες, οι επιμέρους υποθέσεις αναφέρονται σε δύο από τα τρία δυνατά ζεύγη συγκρίσεων. Το τρίτο ζεύγος σύγκρισης μεταξύ διοικητικών στελεχών και υπαλλήλων γραφείου δεν εκπροσωπείται ευθέως στο μοντέλο, παρότι προκύπτει έμμεσα από την διαφορά γ 1 - γ 2. 16

17 Το πρόβλημα με αυτή την προσέγγιση είναι ότι χρησιμοποιείται υπερβολικά μεγάλος αριθμός παραμέτρων. Χρησιμοποιούμε τέσσερις παραμέτρους (α, γ 1, γ 2, γ 3 ) για να παραστήσουμε τα σημεία τομής με τον άξονα των Y (intercepts) για τρεις ομάδες. Αυτό έχει ως συνέπεια ότι δεν μπορούμε να βρούμε μονοσήμαντες τιμές για τις τέσσερις αυτές παραμέτρους ακόμα και αν γνωρίζαμε τις ευθείες παλινδρόμησης για τους τρεις πληθυσμούς. Παρομοίως, δεν μπορούμε να υπολογίσουμε μονοσήμαντα καθορισμένες εκτιμήσεις ελαχίστων τετραγώνων για το μοντέλο γιατί οι τρεις ψευδομεταβλητές είναι πλήρως συγγραμικές. Για παράδειγμα, είναι προφανές από τον πίνακα ότι D 3 =1- D 1 - D 2. Εν γένει, επομένως, για μια πολυεπίπεδη ανεξάρτητη μεταβλητή με m κατηγορίες χρειάζεται να κωδικοποιήσουμε m-1 εικονικούς παλινδρομητές. Ένας απλός τρόπος για να γίνει αυτό είναι να επιλέξουμε την τελευταία κατηγορία (επίπεδο) ως κατηγορία βάσης και να χρησιμοποιούμε την κωδικοποίηση D ij =1 όταν η παρατήρηση i εμπίπτει στην κατηγορία j και 0 οπουδήποτε αλλού: Κατηγορία D 1 D 2... D m m m Παράδειγμα: (McChesney 3 (1987)) Ένα ερώτημα που απασχολεί τις εφημερίδες μεγάλης κυκλοφορίας σε όλο τον κόσμο είναι αν εντυπωσιακά γεγονότα όπως ένα πόλεμος ή ένα σκάνδαλο, αυξάνουν τα κέρδη της εφημερίδας. Εκ πρώτης όψεως θεωρείται λογικό ότι 3 McChesney FS (1987) «Sensationalism, Newspapers Profits and Marginal Value of Watergate» Economic Inquiry, January 1987,

18 μια εφημερίδα θα αυξήσει τα κέρδη της αν έχει τη δυνατότητα να αυξήσει τον αριθμό των φύλων που πουλά προκαλώντας το ενδιαφέρον των αναγνωστών. Ο καθηγητής του Πανεπιστημίου Emory Fregman McChesney, όμως ισχυρίζεται με επιχειρήματα ότι αυτό δεν συμβαίνει πάντα. Με δεδομένο ότι τα έσοδα μιας εφημερίδας προέρχονται τόσο από την πώλησή της όσο, κυρίως, από τις διαφημίσεις κατέληξε στο συμπέρασμα ότι η αύξηση της κυκλοφορίας δεν αυξάνει υποχρεωτικά τα κέρδη μιας εφημερίδας. Αυτό έχει ιδιαίτερο ενδιαφέρον σε χώρες όπως, οι Ηνωμένες Πολιτείες, όπου κατά μέσο όρο οι διαφημίσεις καταλαμβάνουν περισσότερο από τον μισό χώρο των εφημερίδων και τα έσοδα από διαφημίσεις ανέρχονται στο 60-80% των συνολικών εσόδων μια εφημερίδας. (Αυτός άλλωστε είναι και ο λόγος που οι εφημερίδες με πολλές διαφημίσεις επιτυγχάνουν ενώ οι εφημερίδες που έχουν μόνο ειδήσεις αποτυγχάνουν). Γενικά πιστεύεται ότι η κάλυψη ειδησεογραφικών θεμάτων προκαλεί ζημιά σε μια εφημερίδα δοθέντος ότι το κόστος κάλυψής τους δεν αντιμετωπίζεται από τα έσοδα κυκλοφορίας. Αυτό που συμβαίνει με πολλές εφημερίδες μεγάλης κυκλοφορίας είναι ότι ο χώρος που αφιερώνουν σε ειδησεογραφικά θέματα δεν καθορίζεται από το πλήθος και την σημασία των ειδήσεων αλλά από το μέγεθος του χώρου που απαιτείται για την διαφήμιση. Ο McChesney ισχυρίστηκε ότι μια προσωρινή άνοδος της κυκλοφορίας δεν αυξάνει τα κέρδη μιας εφημερίδας. Αυτό γιατί, βραχυπρόθεσμα, η τιμή της εφημερίδας είναι σταθερή όπως επίσης το ίδιο συμβαίνει και με τα έσοδα από την διαφήμιση. (Για να αυξήσει τα έσοδα από διαφημίσεις, μια εφημερίδα θα πρέπει να πείσει τους πελάτες της ότι έχει σημειωθεί μια σταθερή αύξηση της κυκλοφορίας). Για τις μεγαλύτερες εφημερίδες του εξωτερικού μια αύξηση των πωλήσεων ελαττώνει τα κέρδη της εφημερίδας, δεδομένου ότι η τιμή της εφημερίδας δεν καλύπτει το κόστος έκδοσής της (Αυτό βέβαια δεν συνέβαινε μέχρι πρόσφατα στην Ελλάδα, όπου το χαρτί των εφημερίδων ήταν αδασμολόγητο). Προκειμένου να ελέγξει τις υποθέσεις αυτές ο McChesney εξέτασε την επίδραση που είχε το σκάνδαλο Watergate 4 στην κυκλοφορία και 4 (Tο σκάνδαλο Watergate ξέσπασε τον Οκτώβριο του 1972 όταν η Washington Post αποκάλυψε ότι τον Ιούνιο του 1972 η διάρρηξη των γραφείων του Δημοκρατικού Κόμματος των ΗΠΑ στο 18

19 τα κέρδη των εφημερίδων γενικά και της εφημερίδας Washington Post συγκεκριμένα, η οποία αποκάλυψε το σκάνδαλο και το κάλυψε με μεγαλύτερες λεπτομέρειες από οποιαδήποτε άλλη εφημερίδα. Ο McChesney χρησιμοποίησε μια σειρά εξισώσεων παλινδρόμησης για την μελέτη της κυκλοφορίας τόσο της Washington Post όσο και όλων των άλλων εφημερίδων με χρονικά σημεία αναφοράς τις ημερομηνίες έναρξης και κλεισίματος του σκανδάλου και κατέληξε σε παρόμοια αποτελέσματα που αποτελούσαν ένδειξη ότι τα συμπεράσματά του ήταν αρκετά ισχυρά. Δύο από τις εκτιμηθείσες εξισώσεις είναι αυτές που παρουσιάζονται στη συνέχεια. Ο McChesney χρησιμοποίησε στοιχεία για τις κυκλοφορίες των εφημερίδων συγκρίνοντας τις κυκλοφορίες της Washington Post και της Wall Street Journal η οποία, σε αντίθεση με την Washington Post, κάλυψε ελάχιστα το σκάνδαλο Watergate. (Τα στοιχεία για τις κυκλοφορίες που χρησιμοποιήθηκαν αναφέρονταν σε ετήσιες κυκλοφορίες δεδομένου ότι τέτοια στοιχεία ήταν διαθέσιμα). Στην μεθοδολογία του ο McChesney χρησιμοποίησε μία εικονική μεταβλητή για να περιγράψει το γεγονός ότι η εφημερίδα Washington Star, που ήταν ο ισχυρότερος ανταγωνιστής της Washington Post, έκλεισε τον Αύγουστο του Επίσης, χρησιμοποίησε μια άλλη εικονική μεταβλητή για να αναφερθεί στα χρόνια του Watergate. Η εκτιμώμενη ευθεία παλινδρόμησης στην οποία κατέληξε ήταν η ακόλουθη: "Y = X D D 1 [ 14.3] [ 6.1 ] [ 1.3 ] R 2 = 0.97 όπου Υ = κυκλοφορία της Washington Post X = κυκλοφορία της Wall Street Journal D 1 = ο αριθμός των μηνών, στον συγκεκριμένο χρόνο, όπου η εφημερίδα Washington Star δεν κυκλοφόρησε και κτίριο του Watergate ήταν μέρος μιας μεγάλης συνομωσίας, κατασκοπίας και σαμποτάζ. Το θέμα αυτό έκλεισε τον Αύγουστο του 1973 με τις δημόσιες ακροάσεις της Γερουσίας των ΗΠΑ και την αποκάλυψη ότι ο (ρεπουμπλικάνος) Πρόεδρος των ΗΠΑ Nixon μαγνητοφωνούσε τις συνομιλίες του (Τον Αύγουστο του 1974 ο Nixon παραιτήθηκε από Πρόεδρος)). 2 19

20 D 2 = 1 κατα τα χρονια! του Watergate 0 διαφορετικα! Οι αριθμοί στις αγκύλες κάτω από τους συντελεστές της ευθείας παλινδρόμησης αποτελούν τις τιμές της ελεγχοσυνάρτησης t για κάθε μια από αυτές. (Για τον έλεγχο β i = 0, i =1, 2, 3 κάθε μια από αυτές είναι η τιμή της εκτιμήτριας διαιρεμένη με την τυπική της απόκλιση). Ο θετικός (και στατιστικά σημαντικός) συντελεστής του Χ αποτελεί ένδειξη ότι η κυκλοφορία της Washington Post αυξήθηκε με το χρόνο όπως συνέβη και με την κυκλοφορία της Wall Street Journal (αλλά και άλλων εφημερίδων). Ο θετικός (και στατιστικά σημαντικός) συντελεστής του D 1 αποτελεί ένδειξη, όπως αναμένεται, ότι η αποτυχία της Washington Star είχε ένα ευνοϊκό αποτέλεσμα για την κυκλοφορία της Washington Post. Ο θετικός συντελεστής του D 2 αποτελεί ένδειξη ότι το σκάνδαλο Watergate ενίσχυσε την κυκλοφορία της Washington Post αλλά ο συντελεστής αυτός δεν είναι στατιστικά σημαντικά διαφορετικός από το 0 στο 5% επίπεδο σημαντικότητας. Προκειμένου να μελετήσει την επίδραση της κυκλοφορίας στα κέρδη της Washington Post ο McChesney εξέτασε τις μηνιαίες αποδόσεις (monthly rate of return) των μετοχών της Washington Post σε σύγκριση με τις μηνιαίες αποδόσεις όλων των μετοχών και τις αποδόσεις των μετοχών άλλων εφημερίδων. Η εκτιμώμενη ευθεία παλινδρόμησης για την περίπτωση αυτή προσδιορίστηκε ως: "Y = X X D 1 [ 9.1 ] [ 5.3 ] [ 0.8 ] R² = 0.61 όπου Υ = η απόδοση των μετοχών της Washington Post Χ 1 = η συνολική απόδοση των μετοχών του Χρηματιστηρίου Χ 2 = δείκτης της απόδοσης των μετοχών άλλων εφημερίδων 1 κατα την διαρκεια! των μηνων! του σκανδαλου! Watergate D = 0 διαφορετικα! 2 Οι αριθμοί στις αγκύλες έχουν την ίδια έννοια όπως προηγουμένως. 20

21 Οι θετικοί (και στατιστικά σημαντικοί) συντελεστές των μεταβλητών Χ 1 και Χ 2 αποτελούν ένδειξη, όπως αναμένεται, ότι οι αποδόσεις των μετοχών της Washington Post αυξομειώνονταν ανάλογα με τις αντίστοιχες αυξομειώσεις της αγοράς του Χρηματιστηρίου όπως επίσης και με τις τιμές των μετοχών άλλων εφημερίδων. Ο αρνητικός συντελεστής για την εικονική μεταβλητή αποτελεί ένδειξη ότι το σκάνδαλο Watergate είχε μία αρνητική επίδραση στην μετοχή της Washington Post αλλά ο συντελεστής αυτός δεν είναι στατιστικά σημαντικός στο 5% επίπεδο σημαντικότητας. Με βάση αυτές και άλλες παρόμοιες εξισώσεις παλινδρόμησης ο McChesney οδηγήθηκε στο συμπέρασμα ότι δεν υπάρχουν πειστικές στατιστικές ενδείξεις ότι η κάλυψη του σκανδάλου Watergate ήταν κερδοφόρα για την Washington Post, ή για τις εφημερίδες γενικά. Ιδιαίτερα, η ανάλυση αυτή οδήγησε στο συμπέρασμα ότι το σκάνδαλο αύξησε ίσως προσωρινά την κυκλοφορία των εφημερίδων αλλά ελάττωσε τα κέρδη τους. Παράδειγμα (Το παράδειγμα αυτό αναφέρεται στην χρήση πολυεπίπεδων ψευδομεταβλητών). Στον πίνακα που ακολουθεί δίνονται τα στοιχεία μιας κλασικής μελέτης που έγινε στις ΗΠΑ το Στην μελέτη αυτή ο ερευνητής 5 διερεύνησε την σύνδεση της αίγλης (prestige) επαγγελμάτων (Prs.), του εισοδήματος (Inc.) και της εκπαίδευσης (Ed.) με βάση στοιχεία που συγκεντρώθηκαν το έτος εκείνο. Η αίγλη για κάθε επάγγελμα μετρήθηκε σε κλίμακα Για κάθε επάγγελμα η αίγλη ποσοτικοποιείται από την τιμή ενός δείκτη που εκφράζει το ποσοστό αξιολόγησης του επαγγέλματος με χαρακτηριστικά "καλό" ή "πολύ καλό". Τα στοιχεία για το εισόδημα αναφέρονται στο ποσοστό παρατηρήσεων με ετήσιο εισόδημα $3500 ή περισσότερο. Η μεταβλητή "Εκπαίδευση" αναφέρεται στο ποσοστό παρατηρήσεων με σπουδές τουλάχιστον απόφοιτου λυκείου. Ο συγγραφέας έκανε ένα διαχωρισμό των επαγγελμάτων σε τρία επίπεδα (κατηγορίες). Οι κατηγορίες αυτές ήταν (i) Λειτουργοί και ελεύθεροι επαγγελματίες (Professional and Managerial). Tην κατηγορία αυτή συμβολίζουμε με Α. 5 Duncan, O. D. (1961). A Socioeconomic Index for All Occupations, in Reiss, Jr., A.J., (Editor), Occupations and Social Status, Free Press, New York. 21

22 (ii) Υπάλληλοι γραφείου (White Collar). Την κατηγορία αυτή συμβολίζουμε με Β. (iii) Τεχνίτες, εργάτες και Βιοτέχνες (Blue Collar). Την κατηγορία αυτή συμβολίζουμε με Γ. Τα στοιχεία της έρευνας δίνονται στον πίνακα που ακολουθεί: Στοιχεία της μελέτης για την σχέση της αίγλης του επαγγέλματος με το εισόδημα και την εκπαίδευση στις ΗΠΑ το 1950 (Prs = Prestige (αίγλη επαγγέλματος), Inc = Income (εισόδημα), Ed = Education (Εκπαίδευση)) Επάγγελμα Prs Inc Ed Επάγγελμα Pr Inc Ed s Κατηγορία Α (Professional and Managerial) Γιατρός Ταχυδρομικός Καθηγητής Εμποροϋπάλληλος Τραπεζίτης Κατηγορία Γ (Blue Collar) Αρχιτέκτονας Μηχανικός Σιδηροδρόμων Φαρμακοποιός Χειριστής Μηχανημάτων Οδοντογιατρός Ηλεκτρολόγος Δικηγόρος Αστυνομικός Πολιτικός Μηχανικός Μαραγκός Ιερωμένος Υδραυλικός Πιλότος Μηχανικός Αυτοκινήτων Λογιστής Χειριστής Μηχανημάτων Βιομήχανος Κομμωτής Συγγραφέας Πωλητής Αυτοκινήτων Κατασκευαστής Μάγειρας Δάσκαλος Ανθρακωρύχος Κοινωνικός Λειτουργός Οδηγός Φορτηγού Ιδιοκτήτης Γραφείου Νυχτοφύλακας Τελετών Καταστηματάρχης Βενζινοπώλης Κατηγορία Β Οδηγός ταξί (Blue Collar) Δημοσιογράφος Μπάρμαν Ασφαλιστής Κλητήρας Λογιστής Σερβιτόρος Εισπράκτορας Μικροπωλητής Στιλβωτής H ευθεία πολλαπλής παλινδρόμησης της αίγλης του επαγγέλματος Υ ως προς την εκπαίδευση Χ 1 και το εισόδημα Χ 2 με βάση τα στοιχεία του πίνακα είναι 22

23 Ŷ = X X 2 [4.272] [0.0982] [0.1197] Επίσης έχουμε ότι R 2 = Οι αριθμοί στις αγκύλες κάτω από τις εκτιμήσεις των παραμέτρων υποδηλώνουν τις εκτιμώμενες τυπικές αποκλίσεις για κάθε ένα από τους εκτιμηθέντες συντελεστές. Οι τρεις κατηγορίες επαγγελμάτων διαφέρουν σημαντικά όσον αφορά το μέσο επίπεδο αίγλης: Κατηγορία Αριθμός Μέση Αίγλη Επαγγέλματος Επαγγελμάτων Α Β Γ Όλα τα επαγγέλματα Χρησιμοποιώντας ψευδομεταβλητές για τις τρεις κατηγορίες επαγγελμάτων στην εξίσωση παλινδρόμησης και την κωδικοποίηση στην οποία αναφερθήκαμε προηγουμένως καταλήγουμε στα εξής αποτελέσματα: Ŷ = Χ Χ D D 2 [3.714] [0.1136] [0.0894] [6.99] [6.11] r 2 = Οι τρεις εκτιμώμενες εξισώσεις για τις τρεις κατηγορίες επαγγελμάτων είναι, επομένως, Κατηγορία Α: Y ˆ = X X 2 Κατηγορία Β: Y ˆ = X X 2 Κατηγορία Γ: Y ˆ = X X 2 Από τις εξισώσεις αυτές παρατηρούμε ότι ο συντελεστής για την εκπαίδευση (Χ 1 ), όχι όμως ο συντελεστής για το εισόδημα (Χ 2 ), μικραίνει όταν ελέγχουμε το είδος (επίπεδο) της απασχόλησης. Οι συντελεστές των ψευδομεταβλητών (ή, ισοδύναμα, τα σημεία τομής των τριών κατηγοριών με τον άξονα των Υ) αποκαλύπτουν ότι, όταν 23

24 τα επίπεδα εκπαίδευσης και εισοδήματος ελέγχονται, η διαφορά στην μέση αίγλη μεταξύ της κατηγορίας Α και της κατηγορίας Γ των επαγγελμάτων μειώνεται από =57.68 μονάδες σε μονάδες. Η διαφορά μεταξύ των δύο κατηγοριών επαγγελμάτων Β και Γ είναι αντίστροφη όταν διατηρούνται ελεγχόμενα το εισόδημα και η εκπαίδευση αλλάζοντας από =13.91 μονάδες σε μονάδες. Αυτό σημαίνει ότι η μεγαλύτερη αίγλη των επαγγελμάτων της κατηγορίας Α, όταν αυτά συγκρίνονται με την αίγλη των επαγγελμάτων της κατηγορίας Γ, φαίνεται να οφείλεται κυρίως στις διαφορές σε εκπαίδευση και εισόδημα μεταξύ αυτών των δύο κατηγοριών επαγγελμάτων. Όσοι έχουν επαγγέλματα της κατηγορίας Β έχουν μεγαλύτερη επαγγελματική αίγλη, κατά μέσο όρο από όσους έχουν επαγγέλματα της κατηγορίας Γ, όμως έχουν μικρότερη αίγλη από άτομα που έχουν επαγγέλματα της κατηγορίας Γ του ιδίου επιπέδου εκπαίδευσης και εισοδήματος. Για να ελέγξουμε την γενική υπόθεση ότι δεν υπάρχουν επιμέρους επιδράσεις στην αίγλη από το είδος του επαγγέλματος ο κατάλληλος έλεγχος είναι Η ο : γ 1 =γ 2 =0 με εναλλακτική την υπόθεση ότι τουλάχιστον ένα από τα γ i, i=1,2 είναι διάφορα του μηδενός. Η τιμή της επαυξητικής στατιστικής συνάρτησης F για τον έλεγχο αυτό είναι 2 2 m k 1 r1 r 2 = k q 1 r = = = F0 2 H στατιστική αυτή συνάρτηση F έχει 2 και 40 βαθμούς ελευθερίας. Το παρατηρούμενο επίπεδο σημαντικότητας (p-τιμή) για τον έλεγχο αυτό είναι p< Επομένως το είδος (κατηγορία) του επαγγέλματος έχει έντονα στατιστικά σημαντική επίδραση στην αίγλη του επαγγέλματος που δεν είναι όμως δυνατόν να εκτιμηθεί με ακρίβεια αφού, όπως βλέπουμε οι τυπικές αποκλίσεις των εκτιμητριών των συντελεστών έχουν μεγάλη τυπική απόκλιση. Το 24

25 αυτό συμβαίνει με τους συντελεστές των μεταβλητών που αναφέρονται στην εκπαίδευση και στο εισόδημα. Φυσικά, και στην μελέτη αυτή, όπως και σε πολλές άλλες παρόμοιες, θα μπορούσε κανείς να αμφισβητήσει την ορθότητα των συμπερασμάτων (αφού π.χ. είναι πολύ πιθανόν να υπάρχει πολυσυγγραμικότητα). Μοντέλα που ΠεριλαμβάνουνΑλληλεπιδράσεις Θα λέμε ότι ανεξάρτητες μεταβλητές οι οποίες χρησιμοποιούνται σε ένα μοντέλο παλινδρόμησης αλληλεπιδρούν (interact) στον προσδιορισμό της εξαρτημένης μεταβλητής όταν η επιμέρους επίδραση μιας από αυτές εξαρτάται από την τιμή που παίρνει κάποια άλλη. Τα προσθετικά μοντέλα (additive models) που έχουμε θεωρήσει μέχρι τώρα δεν έχουν λάβει υπόψη τους αλληλεπιδράσεις. Στην ενότητα αυτή θα δούμε πώς το μοντέλο παλινδρόμησης με ψευδομεταβλητές μπορεί να τροποποιηθεί προκειμένου να λάβει υπόψη του αλληλεπιδράσεις μεταξύ ποιοτικών και ποσοτικών ανεξάρτητων μεταβλητών 6. Η παρουσίαση της παλινδρόμησης με εικονικές μεταβλητές μέχρι τώρα στηρίχτηκε στην υπόθεση παραλλήλων ευθειών παλινδρόμησης σ' όλο το φάσμα των διαφόρων κατηγοριών μιας ποιοτικής ανεξάρτητης μεταβλητής. Αν αυτές οι ευθείες παλινδρόμησης δεν είναι παράλληλες τότε η ποιοτική ανεξάρτητη μεταβλητή αλληλεπιδρά με μια, ή περισσότερες, από τις ποσοτικές ανεξάρτητες μεταβλητές. Το μοντέλο παλινδρόμησης με ψευδομεταβλητές μπορεί στην περίπτωση αυτή να τροποποιηθεί για να αντικατοπτρίζει αυτές τις αλληλεπιδράσεις. Για ευκολία επανερχόμαστε στο παράδειγμα της παλινδρόμησης του εισοδήματος ως προς την εκπαίδευση και το φύλο. Θεωρούμε τα ιδεατά υποθετικά δεδομένα που εμφανίζονται στο σχήμα που ακολουθεί 6 Οι αλληλεπιδράσεις μεταξύ ποιοτικών μόνο ανεξάρτητων μεταβλητών εξετάζονται στην ανάλυση διακύμανσης. Αλληλεπιδράσεις μεταξύ ποσοτικών ανεξάρτητων μεταβλητών εξετάζονται στην ενότητα της πολυωνυμικής παλινδρόμησης. 25

26 Ιδεατά δεδομένα που εκφράζουν τη σχέση μεταξύ εισοδήματος και εκπαίδευσης για δύο πληθυσμούς ανδρών (με αστερίσκο) και γυναικών (με μικρούς κύκλους). Στο σχήμα (a) δεν υπάρχει σχέση μεταξύ εκπαίδευσης και φύλου. Στο (b) οι γυναίκες έχουν ένα υψηλότερο μέσο επίπεδο εκπαίδευσης απ' ότι οι άνδρες. Και στις δύο περιπτώσεις οι ευθείες παλινδρόμησης για κάθε φύλο δεν είναι παράλληλες. Η κλίση για τους άνδρες είναι μεγαλύτερη από τη κλίση για τις γυναίκες και επομένως εκπαίδευση και φύλο αλληλεπιδρούν στον επηρεασμό του εισοδήματος. Όπως παρατηρούμε από το σχήμα, το παράδειγμα αυτό αναφέρεται σε μια διαφορετική κατάσταση από την προηγούμενη όπου, τότε, οι επιδράσεις του φύλου και της εκπαίδευσης ήταν προσθετικές. Εδώ, στο σχήμα (a) (όπως και στο αντίστοιχο σχήμα (a) της προηγούμενης περίπτωσης) το φύλο και η εκπαίδευση είναι ανεξάρτητα αφού οι γυναίκες και οι άνδρες έχουν τις ίδιες κατανομές εκπαίδευσης. Στο σχήμα (b) (όπως και στο αντίστοιχο προηγούμενο σχήμα (b)) φύλο και εκπαίδευση σχετίζονται αφού οι γυναίκες, κατά μέσο όρο, έχουν υψηλότερα επίπεδα εκπαίδευσης από τους άνδρες. Είναι όμως φανερό από τα σχήματα (a) και (b) εδώ, ότι οι ευθείες παλινδρόμησης για κάθε φύλο του εισοδήματος στην εκπαίδευση δεν είναι παράλληλες. Και στις δύο περιπτώσεις η κλίση για τους άνδρες είναι μεγαλύτερη από την κλίση για τις γυναίκες. Αυτό οφείλεται στο ότι η επίδραση της εκπαίδευσης είναι διαφορετική σε κάθε φύλο και επομένως εκπαίδευση και φύλο αλληλεπιδρούν στον τρόπο που επηρεάζουν το εισόδημα. Παρατηρούμε επίσης η επίδραση του φύλου στο εισόδημα μεταβάλλεται με την εκπαίδευση. Επειδή οι ευθείες παλινδρόμησης 26

27 δεν είναι παράλληλες, η σχετική υπεροχή εισοδήματος των ανδρών μεταβάλλεται (μάλιστα αυξάνει) με την εκπαίδευση. Η αλληλεπίδραση επομένως είναι μια συμμετρική έννοια. Η επίδραση της εκπαίδευσης μεταβάλλεται με το φύλο και η επίδραση του φύλου μεταβάλλεται με την εκπαίδευση. Τα παραδείγματα που έχουν χρησιμοποιηθεί μέχρι τώρα καταδεικνύουν ένα σημαντικό και συχνά μη κατανοητό σημείο: Αλληλεπίδραση και συσχέτιση (interaction and correlation) ανεξαρτήτων μεταβλητών αποτελούν, τόσο εμπειρικά όσο και λογικά, διακριτά μεταξύ τους φαινόμενα. Δύο ανεξάρτητες μεταβλητές είναι δυνατόν να αλληλεπιδρούν, ανεξάρτητα από το κατά πόσον είναι μεταξύ τους στατιστικά συσχετισμένες. Ο όρος αλληλεπίδραση αναφέρεται στον τρόπο με τον οποίο ανεξάρτητες μεταβλητές συνδυάζονται για να επηρεάσουν (affect) μια εξαρτημένη μεταβλητή και όχι στην σχέση μεταξύ των ανεξαρτήτων μεταβλητών αυτών καθ' αυτών. Παράδειγμα: (Χρησιμοποίηση εικονικών μεταβλητών σε πολλαπλή παλινδρόμηση και χρήση στατιστικών πακέτων). Προκειμένου να εξετασθεί το 1980 αν το φύλο επηρεάζει τις αμοιβές καθηγητών σε ένα Πανεπιστήμιο επελέγη ένα τυχαίο δείγμα από 6 άνδρες και 6 γυναίκες μεταξύ των Επικούρων Καθηγητών ενός Αμερικανικού Πανεπιστημίου. Τα δεδομένα για μισθούς και χρόνια προϋπηρεσίας εμφανίζονται στον πίνακα που ακολουθεί (σημειώνεται ότι και στα δύο δείγματα υπάρχουν δύο καθηγητές με 3 χρόνια προϋπηρεσίας, ενώ δεν υπήρχαν άνδρες καθηγητές με 2 χρόνια προϋπηρεσίας). Μισθοί (σε χιλ. $) και χρόνια προϋπηρεσίας Χρόνια προϋπηρεσίας, Χ Μισθός, Y (άνδρες) Μισθός, Y (γυναίκες)

28 Να εξετασθεί η σχέση των μισθών Υ, με την προϋπηρεσία των καθηγητών και το φύλο τους. Λύση: Όπως είναι φυσικό, περιμένει κανείς να υπάρχει μια σχέση ευθείας παλινδρόμησης μεταξύ του μέσου μισθού και της προϋπηρεσίας τόσο για τους άνδρες όσο και για τις γυναίκες. Με την υπόθεση αυτή θα χρησιμοποιηθούν 2 ανεξάρτητες μεταβλητές: Χ 1 = προϋπηρεσία σε έτη (που είναι ποσοτική μεταβλητή) Χ 2 = φύλο των καθηγητών (που είναι ποιοτική μεταβλητή) Η Χ 2 είναι μια εικονική μεταβλητή με τιμές X 2 = 1 0 για για καθηγητής καθηγήτρια Δεδομένου ότι μας ενδιαφέρει να επιτρέψουμε στις κλίσεις των ευθειών που αναφέρονται στην σχέση μισθών και προϋπηρεσίας ανδρών και γυναικών καθηγητών, να διαφέρουν, συνεπάγεται ότι θα πρέπει να επιτρέψουμε αλληλεπίδραση μεταξύ των δύο επεξηγηματικών μεταβλητών Χ 1 και Χ 2. Θα πρέπει δηλαδή να υποθέσουμε ότι η μεταβολή στο Ε(Y x 1 ), που αντιστοιχεί σε μια μεταβολή της μεταβλητής Χ 1, εξαρτάται από το αν ο καθηγητής είναι άνδρας ή γυναίκα. Προκειμένου να επιτρέψουμε την αλληλεπίδραση αυτή (δηλαδή την διαφορά στις κλίσεις των ευθειών) χρησιμοποιούμε και τον όρο (μεταβλητή) Χ 1 Χ 2 στο μοντέλο. Επομένως, το μοντέλο που μας ενδιαφέρει να μελετήσουμε στην περίπτωση αυτή είναι το Ε(Y x) = α + β 1 Χ 1 + β 2 Χ 2 + β 3 Χ 1 Χ 2 Σημείωση: Η προσθήκη του όρου αλληλεπίδρασης Χ 1 Χ 2 επιτρέπει στο μέγεθος που εκφράζει η μεταβλητή Χ 2 να αλλάζει συμπεριφορά, ανάλογα με τις τιμές της μεταβλητής Χ 1. Στην περίπτωση αυτή έχουμε ένα μοντέλο δεύτερης τάξης (secondorder model). Στην περίπτωση του μοντέλου Υ = α+βχ 1 +γχ 2 +ε μιλάμε για μοντέλο πρώτης τάξης (first-order model). Ο όρος αλληλεπίδρασης Χ 1 Χ 2 στο μοντέλο δεύτερης τάξης όταν οι ανεξάρτητες μεταβλητές είναι ποιοτικές, επιτρέπει στο διδιάστατο επίπεδο παλινδρόμησης να καμπυλώνεται και να γίνεται επιφάνεια. 28

29 Η αλληλεπίδραση των παραμέτρων του μοντέλου μπορεί να γίνει καλύτερα αντιληπτή αν δώσουμε τιμές στην εικονική μεταβλητή Χ 2. Έτσι, για παράδειγμα, όταν μας ενδιαφέρει να κατασκευάσουμε την ευθεία παλινδρόμησης για τις καθηγήτριες, Χ 2 = 0 και επομένως, στην περίπτωση αυτή Ε(Y x) = α + β 1 Χ 1 + β β 3 Χ 1 0 = α + β 1 Χ 1 Επομένως, α είναι το σημείο τομής για το Y στην παλινδρόμηση για τις καθηγήτριες ενώ β 1 είναι η κλίση της ευθείας αυτής που αναφέρεται στην σχέση αναμενόμενων μισθών και χρόνου προϋπηρεσίας για καθηγήτριες και μόνο. Ομοίως, η ευθεία παλινδρόμησης για τους καθηγητές είναι αυτή που προκύπτει από το γενικό μοντέλο, για Χ 2 = 1. Τότε Ε(Y x) = α + β 1 Χ 1 + β β 3 Χ 1 1 = (α + β 2 ) + (β 1 + β 3 )Χ 1 Δηλαδή, το σημείο τομής για την παλινδρόμηση που αναφέρεται στους καθηγητές είναι το α + β 2, ενώ η κλίση του συντελεστή του Χ 1 είναι ίση με β 1 + β 3. Δεδομένου ότι η κλίση της παλινδρόμησης για τους καθηγητές είναι β 1 + β 3 ενώ η αντίστοιχη κλίση για τις γυναίκες είναι β 1, προκύπτει ότι η ποσότητα β 1 + β 3 - β 1 = β 3 αναφέρεται στην διαφορά των κλίσεων των δύο γραμμών. Παρομοίως, το β 2 αναφέρεται στην διαφορά των τομών του άξονα Υ από τις δύο ευθείες παλινδρόμησης. Από τα δεδομένα του προβλήματος προκύπτει ότι η ενδεδειγμένη μεθοδολογία για το πρόβλημα είναι αυτή της πολλαπλής παλινδρόμησης με εικονικές μεταβλητές. Το αποτέλεσμα που δίνει το πρόγραμμα SAS χρησιμοποιώντας την εντολή GLM (General Linear Model) της πολλαπλής παλινδρόμησης δίνεται στον πίνακα που ακολουθεί. 29

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση II

Απλή Γραμμική Παλινδρόμηση II . Ο Συντελεστής Προσδιορισμού Η γραμμή Παλινδρόμησης στο δείγμα, αποτελεί μία εκτίμηση της γραμμής παλινδρόμησης στον πληθυσμό. Αν και από τη μέθοδο των ελαχίστων τετραγώνων προκύπτουν εκτιμητές που έχουν

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Θα εξεταστούν μόνο οι περιπτώσεις των ψευδομεταβλητών που χρησιμοποιούνται σαν ανεξάρτητες μεταβλητές

Θα εξεταστούν μόνο οι περιπτώσεις των ψευδομεταβλητών που χρησιμοποιούνται σαν ανεξάρτητες μεταβλητές Όταν ένα μέγεθος είναι αδύνατο να ποσοτικοποιηθεί αλλά πρέπει οπωσδήποτε να χρησιμοποιηθεί σε ένα υπόδειγμα προσεγγίζεται συνήθως με μια μεταβλητή η οποία ονομάζεται ποιοτική μεταβλητή ή ψευδομεταβλητή.

Διαβάστε περισσότερα

SOURCE DF SUM OF SQUARES MEAN SQUARE F VALUE PR F MODEL (a) 2.882 E04 (e) (g) (h) ERROR (b) (d) (f) TOTAL (c) 4.063 E04 R SQUARE (i) PARAMETER

SOURCE DF SUM OF SQUARES MEAN SQUARE F VALUE PR F MODEL (a) 2.882 E04 (e) (g) (h) ERROR (b) (d) (f) TOTAL (c) 4.063 E04 R SQUARE (i) PARAMETER ΑΣΚΗΣΕΙΣ. Θεωρήστε το παράδειγμα που αναφέρεται στη συσχέτιση του βαθμού ικανοποίησης των εργαζομένων σε ένα εργαστήριο σε σχέση με τις οκτώ μεταβλητές που ορίστηκαν εκεί. (Χ =ηλικία, Χ =φύλο, Χ =εβδομαδιαίος

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 8.1 Η Φύση των Ψευδομεταβλητών Οι μεταβλητές που παίρνουν τιμές 0 και 1 ονομάζονται ψευδομεταβλητές

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20, ΜΕΜ64: Εφαρμοσμένη Στατιστική 1 ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=0, X = 7.5, σ = 16, α = 5%. Πως αλλάζει το διάστημα αν

Διαβάστε περισσότερα

ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis)

ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis) ΚΕΦΑΛΑΙΟ 23 ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis) ΕΙΣΑΓΩΓΗ Έχοντας παρουσιάσει τις βασικές έννοιες των ελέγχων υποθέσεων, θα ήταν, ίσως, χρήσιμο να αναφερθούμε σε μια άλλη περιοχή στατιστικής συμπερασματολογίας

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION)

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) 4. ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) Η μέθοδος της βηματικής παλινδρόμησης (stepwise regression) είναι μιά άλλη μέθοδος επιλογής ενός "καλού" υποσυνόλου ανεξαρτήτων μεταβλητών.

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ Πρόβλημα απουσιών στ)

ΑΣΚΗΣΕΙΣ Πρόβλημα απουσιών στ) ΑΣΚΗΣΕΙΣ. Ο διευθυντής προσωπικού μιας μεγάλης εταιρείας πιστεύει ότι ίσως υφίσταται κάποια σχέση μεταξύ των ημερών απουσίας και της ηλικίας των εργαζομένων. Με βάση την υπόθεση αυτή ενδιαφέρεται να κατασκευάσει

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση I

Απλή Γραμμική Παλινδρόμηση I Απλή Γραμμική Παλινδρόμηση I. Εισαγωγή Έστω ότι θέλουμε να ερευνήσουμε εμπειρικά τη σχέση που υπάρχει ανάμεσα στις δαπάνες κατανάλωσης και στο διαθέσιμο εισόδημα, των οικογενειών. Σύμφωνα με την Κεϋνσιανή

Διαβάστε περισσότερα

5 o Μάθημα Έλεγχοι Υποθέσεων

5 o Μάθημα Έλεγχοι Υποθέσεων 5 o Μάθημα Έλεγχοι Υποθέσεων 5 Το Πρόβλημα του Ελέγχου Υποθέσεων Ας υποθέσουμε ότι σχεδιάζονται κάποιες κυκλοφοριακές ρυθμίσεις με στόχο ο μέσος χρόνος μετακίνησης των εργαζομένων που χρησιμοποιούν το

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100 Ποσοτικές Μέθοδοι Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR 50100 Απλή Παλινδρόμηση Η διερεύνηση του τρόπου συμπεριφοράς

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Εισαγωγή στην Ανάλυση Δεδομένων

Εισαγωγή στην Ανάλυση Δεδομένων ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 09-10-2015 Εισαγωγή στην Ανάλυση Δεδομένων Βασικές έννοιες Αν. Καθ. Μαρί-Νοέλ Ντυκέν ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 30-10-2015 1. Στατιστικοί παράμετροι - Διάστημα εμπιστοσύνης Υπολογισμός

Διαβάστε περισσότερα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα Ορισμός τυχαίας μεταβλητής Τυχαία μεταβλητή λέγεται η συνάρτηση

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

Διάστημα εμπιστοσύνης της μέσης τιμής

Διάστημα εμπιστοσύνης της μέσης τιμής Διάστημα εμπιστοσύνης της μέσης τιμής Συντελεστής εμπιστοσύνης Όταν : x z c s < μ < x +z s c Ν>30 Στον πίνακα δίνονται κρίσιμες τιμές z c και η αντιστοίχισή τους σε διάφορους συντελεστές εμπιστοσύνης:

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ Το ενδιαφέρον επικεντρώνεται πάντα στον πληθυσμό Το δείγμα χρησιμεύει για εξαγωγή συμπερασμάτων για τον πληθυσμό π.χ. το ετήσιο εισόδημα των κατοίκων μιας περιοχής Τα στατιστικά

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling) 3 ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratfed Radom Samplg) Είναι προφανές από τα τυπικά σφάλματα των εκτιμητριών των προηγούμενων παραγράφων, ότι ένας τρόπος να αυξηθεί η ακρίβεια τους είναι να αυξηθεί

Διαβάστε περισσότερα

1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05

1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05 1 Ο ΓΥΜΝΑΣΙΟ ΠΕΥΚΩΝ Γ ΓΥΜΝΑΣΙΟΥ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ ΕΚΠΑΙΔΕΥΤΙΚΟΣ : Τρασανίδης Γεώργιος, διπλ. Ηλεκ/γος Μηχανικός Μsc ΠΕ12 05 2. ΜΕΤΑΒΛΗΤΕΣ -ΣΧΕΣΕΙΣ ΜΕΤΑΞΥ ΜΕΤΑΒΛΗΤΩΝ Όλες οι έρευνες αναφέρονται σε μεταβλητές

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ Συσχέτιση (Correlation) - Copulas Σημασία της μέτρησης της συσχέτισης Έστω μία εταιρεία που είναι εκτεθειμένη σε δύο μεταβλητές της αγοράς. Πιθανή αύξηση των 2 μεταβλητών

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Η εργασία αυτή στοιχειοθετήθηκε με το πρόγραμμα L A TEX. Η συγγραφή έγινε με τη βοήθεια του προγράμματος Kile στο λειτουργικό σύστημα Ubuntu Linux. Γι

Η εργασία αυτή στοιχειοθετήθηκε με το πρόγραμμα L A TEX. Η συγγραφή έγινε με τη βοήθεια του προγράμματος Kile στο λειτουργικό σύστημα Ubuntu Linux. Γι Ανάλυση παλινδρόμησης με χρήση ποιοτικών ερμηνευτικών μεταβλητών: Διευρεύνηση της επίδρασης του φύλου στις επιδόσεις μαθητών του γυμνασίου Ο.Ι. Μαλλή Διατμηματικό Π.Μ.Σ. Μαθηματικά των Υπολογιστών και

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Τα υποδείγματα του απλού γραμμικού υποδείγματος της παλινδρόμησης (simple linear regression

Διαβάστε περισσότερα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1) Σημειώσεις Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου Αθήνα -3-7 Εκτίμηση των Παραμέτρων β & β Απλό γραμμικό υπόδειγμα: Y X () Η αναμενόμενη τιμή του Υ, δηλαδή, μέση τιμή του Υ, δίνεται παρακάτω: EY ( ) X EY

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα Στατιστική είναι ο κλάδος των μαθηματικών που εμβαθύνει σε μεθόδους συλλογής δεδομένων, οργάνωσης, παρουσίασης των δεδομένων και εξαγωγής συμπερασμάτων

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

Από το Γυμνάσιο στο Λύκειο... 7. 3. Δειγματικός χώρος Ενδεχόμενα... 42 Εύρεση δειγματικού χώρου... 46

Από το Γυμνάσιο στο Λύκειο... 7. 3. Δειγματικός χώρος Ενδεχόμενα... 42 Εύρεση δειγματικού χώρου... 46 ΠEΡΙΕΧΟΜΕΝΑ Από το Γυμνάσιο στο Λύκειο................................................ 7 1. Το Λεξιλόγιο της Λογικής.............................................. 11. Σύνολα..............................................................

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Y Y ... y nx1. nx1

Y Y ... y nx1. nx1 6 ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ ΤΗ ΧΡΗΣΗ ΠΙΚΑΚΩΝ Η χρησιμοποίηση και ο συμβολισμός πινάκων απλοποιεί σημαντικά τα αποτελέσματα της γραμμικής παλινδρόμησης, ιδίως στην περίπτωση της πολλαπλής παλινδρόμησης Γενικά,

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Τρίτη Γραπτή Εργασία στη Στατιστική

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Τρίτη Γραπτή Εργασία στη Στατιστική ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Πρόγραμμα Σπουδών: ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ και ΟΡΓΑΝΙΣΜΩΝ Θεματική Ενότητα: ΔΕΟ-13 Ποσοτικές Μέθοδοι Ακαδημαϊκό Έτος: 2012-13 Τρίτη Γραπτή Εργασία στη Στατιστική Γενικές οδηγίες

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. ) Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. ) Πίνακας Περιεχομένων Εργασία η... Θέμα ο :... Θέμα ο :... 4 Θέμα 3 ο :...

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation Σταμάτης Πουλακιδάκος Μερικά εισαγωγικά λόγια Οι έλεγχοι των ερευνητικών υποθέσεων πραγματοποιούνται με διάφορους στατιστικούς ελέγχους,

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 6: Συσχέτιση και παλινδρόμηση εμπειρική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Ο έλεγχος της ενότητας αυτής αποτελεί μία επέκταση του μονόπλευρου ελέγχου Smirnov στην περίπτωση περισσοτέρων από δύο δειγμάτων. Ο έλεγχος αυτός

Διαβάστε περισσότερα

Εναλλακτικά του πειράματος

Εναλλακτικά του πειράματος Θετική και δεοντολογική προσέγγιση Διάλεξη 2 Εργαλεία θετικής ανάλυσης Ή Γιατί είναι τόσο δύσκολο να πούμε τι συμβαίνει; Η θετική ανάλυση εξετάζει τι υπάρχει και ποιες οι συνέπειες μιας πολιτικής, χωρίς

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Α μέρος: Πολυσυγγραμμικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Α μέρος: Πολυσυγγραμμικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 9: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Α μέρος: Πολυσυγγραμμικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων α) Σημειοεκτιμητική β) Εκτιμήσεις Διαστήματος ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Παράδειγμα

Διαβάστε περισσότερα

Στατιστική ανάλυση αποτελεσμάτων

Στατιστική ανάλυση αποτελεσμάτων HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Στατιστική ανάλυση αποτελεσμάτων Βασίλης Αγγελής Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Πανεπιστήμιο Αιγαίου Κατερίνα Δημάκη Αν. Καθηγήτρια

Διαβάστε περισσότερα

Διάλεξη 2. Εργαλεία θετικής ανάλυσης Ή Γιατί είναι τόσο δύσκολο να πούμε τι συμβαίνει; Ράπανος-Καπλάνογλου 2016/7

Διάλεξη 2. Εργαλεία θετικής ανάλυσης Ή Γιατί είναι τόσο δύσκολο να πούμε τι συμβαίνει; Ράπανος-Καπλάνογλου 2016/7 Διάλεξη 2 Εργαλεία θετικής ανάλυσης Ή Γιατί είναι τόσο δύσκολο να πούμε τι συμβαίνει; 1 Ράπανος-Καπλάνογλου 2016/7 Θετική και δεοντολογική προσέγγιση Η θετική ανάλυση εξετάζει τι υπάρχει και ποιες οι συνέπειες

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling) 6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling) Από την θεωρία που αναπτύχθηκε στα προηγούμενα κεφάλαια, φαίνεται ότι μια αλλαγή στον σχεδιασμό της δειγματοληψίας και, κατά συνέπεια, στην μέθοδο εκτίμησης

Διαβάστε περισσότερα

ΘΕΜΑ 5ο (ΜΟΝΑΔΕΣ 0) www.oleclassroom.gr Ένας οικονομικός αναλυτής θέλει να διερευνήσει τη σχέση μεταξύ της τιμής ενός αγαθού με τις σημειούμενες πωλήσεις του σε διαφορετικά καταστήματα μιας αστικής περιοχής.

Διαβάστε περισσότερα

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ Μέτρα Περιγραφικής Στατιστικής Πληθυσμιακοί παράμετροι: τα αριθμητικά μεγέθη που εκφράζουν τις στατιστικές ιδιότητες ενός πληθυσμού (που προσδιορίζουν / περιγράφουν τη φυσιογνωμία και τη δομή του) Στατιστικά

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ 1. Έστω συνάρτηση ζήτησης με τύπο Q = 200 4P. Να βρείτε: α) Την ελαστικότητα ως προς την τιμή όταν η τιμή αυξάνεται από 10 σε 12. 1ος τρόπος Αν P 0 10 τότε Q 0 200 410

Διαβάστε περισσότερα

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46 ΠEΡΙΕΧΟΜΕΝΑ Από το Γυμνάσιο στο Λύκειο................................................ 7 1. Το Λεξιλόγιο της Λογικής.............................................. 11 2. Σύνολα..............................................................

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΤΕΙ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΓΙΑΝΝΗΣ ΦΑΝΟΥΡΓΙΑΚΗΣ ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΣΥΝΕΡΓΑΤΗΣ ΤΕΙ ΚΡΗΤΗΣ ΔΟΜΗ ΠΑΡΟΥΣΙΑΣΗΣ 1. Εισαγωγή

Διαβάστε περισσότερα