ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ Το ενδιαφέρον επικεντρώνεται πάντα στον πληθυσμό Το δείγμα χρησιμεύει για εξαγωγή συμπερασμάτων για τον πληθυσμό π.χ. το ετήσιο εισόδημα των κατοίκων μιας περιοχής Τα στατιστικά του δείγματος (αν και υπόκεινται σε σφάλματα) είναι οι καλύτεροι σημειακοί εκτιμητές των αντίστοιχων πληθυσμιακών παραμέτρων Οι εκτιμητές διαστήματος των παραμέτρων είναι πιο χρήσιμοι και με μεγαλύτερη ακρίβεια διάστημα εμπιστοσύνης για το μ είναι το X t( n1) s / n t( n1) = τιμή του t με (n-1) β.ε., s / n = τυπικό σφάλμα του δειγματικού μέσου X = ο δειγματικός μέσος
ΠΑΡΑΔΕΙΓΜΑ 1 Σε μία μελέτη για το ετήσιο εισόδημα των κατοίκων μιας περιοχής, από ένα δείγμα με 100 απαντήσεις, προέκυψε δειγματικός μέσος 15,000 και δειγματική τυπική απόκλιση 5,000 Ο καλύτερος σημειακός εκτιμητής του πληθυσμιακού μέσου μ είναι 15,000 Ένα 95% διάστημα εμπιστοσύνης για το μ είναι: μ = 15,000 ± 1.96(5,000/ 100) = 15,000 ± 980 έτσι, 14,020 μ 15,980 όπου t = 1.96, η τιμή t με 99 β.ε. και με εμβαδόν κάθε ουράς 0.025
ΔΟΚΙΜΑΣΙΑ ΥΠΟΘΕΣΕΩΝ Προσδιορίζουμε τις δύο υποθέσεις της δοκιμασίας, μηδενική και εναλλακτική Μηδενική υπόθεση H o : μ = μ 0 Εναλλακτική υπόθεση H 1 : μ μ 0 Επιλέγουμε το στατιστικό μαζί με το επίπεδο εμπιστοσύνης: συνήθως 95% για οικονομικές εφαρμογές Επίπεδο σημαντικότητας α = 1 επίπεδο εμπιστοσύνης: συνήθως 5% για οικονομικές εφαρμογές
ΔΟΚΙΜΑΣΙΑ ΥΠΟΘΕΣΕΩΝ (συνέχεια) Σφάλμα I Είδους: Συμβαίνει σε απόρριψη της H o όταν αυτή είναι σωστή Σφάλμα I Είδους: Συμβαίνει σε απόδοχή της H o όταν αυτή είναι εσφαλμένη
ΔΟΚΙΜΑΣΙΑ ΥΠΟΘΕΣΕΩΝ (συνέχεια) Η σχέση μεταξύ των σφαλμάτων I και II είδους είναι: Μειώνοντας την πιθανότητα σφάλματος I είδους αυξάνεται η πιθανότητα σφάλματος II είδους και αντίστροφα Όταν το κόστος από το σφάλμα I είδους είναι μεγάλο, χρησιμοποιούμε μικρό α π.χ. 1% ή μικρότερο Είδη στατιστικών δοκιμασιών Δίπλευρη δοκιμασία. H 0 : μ=μ 0 H 1 : μ μ 0 Μονόπλευρη αριστερά. H 0 : μ μ 0 H 1 : μ<μ 0 Μονόπλευρη δεξιά. H 0 : μ μ 0 H 1 : μ>μ 0 Για κάθε στατιστική δοκιμασία υπολογίζεται η τιμή του t (t calc ) και συγκρίνεται με τις κρίσιμες τιμές της κατανομής t (t c ). Όταν t calc > t c, απορρίπτουμε την μηδενική υπόθεση
ΠΑΡΑΔΕΙΓΜΑ 2 (δίπλευρη δοκιμασία) Σε μία έρευνα για τις μηνιαίες δαπάνες διασκέδασης των κατοίκων μιας περιοχής, από ένα δείγμα 49 ατόμων προέκυψε δειγματικός μέσος 200 και δειγματική τυπική απόκλιση 84. Ο πληθυσμιακός μέσος της χώρας είναι μ = 220. Οι υποθέσεις είναι: H 0 : μ = 220 και H 1 : μ 220 Επίσης, t calc = (200-220)/(84/ 49) = -20/12 = -1.67 Σε επίπεδο σημαντικότητας 95%, α = 0.05, η κρίσιμη τιμή του t είναι ±1.96 Επειδή t calc > -1.96, δεν μπορούμε να απορρίψουμε την H 0. Συνεπώς οι μηνιαίες δαπάνες διασκέδασης των κατοίκων της περιοχής δεν διαφέρουν από την πληθυσμιακή τιμή της χώρας.
ΠΑΡΑΔΕΙΓΜΑ 3 (μονόπλευρη αριστερά) Σε μία έρευνα για την εβδομαδιαία κατανάλωση αλκοόλ των κατοίκων μιας περιοχής, από ένα δείγμα 25 κατοίκων προέκυψε δειγματικός μέσος 1.2 λίτρα και δειγματική τυπική απόκλιση 0.6 λίτρα. Η πληθυσμιακή κατανάλωση για τη χώρα είναι μ = 1.5 λίτρα. Οι υποθέσεις είναι: H 0 : μ 1.5 και H 1 : μ < 1.5 Επίσης, t calc = (1.2-1.5)/(0.6/ 25) = -0.3/0.12 = -2.5 Σε επίπεδο εμπιστοσύνης 95%, α = 0.05, η κρίσιμη τιμή για το t με 24 β.ε. είναι -1.711 Επειδή t calc < - 1.711, δεν μπορούμε να αποδεχθούμε την H 0. Η κατανάλωση αλκοόλ στην περιοχή είναι μικρότερη από την κατανάλωση αλκοόλ στη χώρα
ΠΑΡΑΔΕΙΓΜΑ 4 (μονόπλευρη δεξιά) Σε μία έρευνα για τις ώρες εβδομαδιαίας απασχόλησης των γυναικών μιας περιοχής, από ένα δείγμα 144 γυναικών προέκυψε δειγματικός μέσος 45 ώρες και δειγματική τυπική απόκλιση 29 ώρες. Η πληθυσμιακή απασχόληση των γυναικών της χώρας είναι μ = 40 ώρες. Οι υποθέσεις είναι: H 0 : μ 40 και H 1 : μ > 40 Επίσης, t calc = (45-40)/(29/ 144) = 5/2.42 = 2.07 Σε επίπεδο εμπιστοσύνης 95%, α = 0.05, η κρίσιμη τιμή για το t είναι 1.645 Επειδή t calc > 1.645, δεν μπορούμε να αποδεχθούμε την H 0. Συνεπώς, οι ώρες εβδομαδιαίας απασχόλησης των γυναικών της περιοχής είναι περισσότερες από την πληθυσμιακή τιμή της χώρας.
ΣΥΣΧΕΤΙΣΗ Συσχέτιση είναι η αλληλεξάρτηση μεταξύ δύο μεταβλητών π.χ. πωλήσεις και διαφήμιση, εισόδημα και φόροι κ.λ.π. Ένα μέτρο ποσοτικοποίησης της συσχέτισης είναι ο συντελεστής συσχέτισης (correlation coefficient) του Pearson που συμβολίζεται με ρ για τον πληθυσμό και με r για το δείγμα. Για δύο μεταβλητές X και Y, ο βαθμός της μεταξύ τους γραμμικής εξάρτησης δίνεται από συντελεστή συσχέτισης r = Το ρ υπολογίζεται ανάλογα από τους πληθυσμιακούς μέσους αντί των δειγματικών μέσων Το r παίρνει τιμές μεταξύ -1 και +1 όπου το -1 εκφράζει την τέλεια αρνητική συσχέτιση και το +1 την τέλεια θετική συσχέτιση ( X ( X x) x) 2 2 ( Y ( Y y) 2 y) 2
ΣΥΝΤΕΛΕΣΤΕΣ ΣΥΣΧΕΤΙΣΗΣ
ΣΥΝΤΕΛΕΣΤΕΣ ΣΥΣΧΕΤΙΣΗΣ (συνέχεια)
ΔΟΚΙΜΑΣΙΑ ΓΡΑΜΜΙΚΗΣ ΣΥΣΧΕΤΙΣΗΣ H 0 : ρ = 0 με H 1 : ρ 0 t calc = (1 r r 0 2 ) /( n 2) Σημειώνεται η απώλεια 2 β.ε. κατά την εκτίμηση των στατιστικών του μέσου και του συντελεστής συσχέτισης Για α =0.05, και β.ε. = 3, οι κρίσιμες τιμές του t είναι ±3.182 Για r = -0.85, (διάγραμμα D) έχουμε t calc = -2.795. Επειδή πέφτει στο διάστημα ±3.182, δεν μπορούμε να απορρίψουμε τη μηδενική υπόθεση, παρόλο που η τιμή r = -0.85 καταδεικνύει ισχυρά αρνητική συσχέτιση. Αυτό οφείλεται στο γεγονός ότι το δείγμα είναι μικρό.
ΑΥΤΟΣΥΣΧΕΤΙΣΗ Κατά την αξιολόγηση μιας χρονοσειράς, χρησιμοποιείται ένα μέτρο συσχέτισης που λέγεται αυτοσυσχέτιση (autocorrelation) Ορίζουμε r k = αυτοσυσχέτιση με υστέρηση (lag) k περιόδων Y t = τιμή της χρονοσειράς τη χρονική στιγμή t Y t-k = τιμή της χρονοσειράς τη χρονική στιγμή t-k y = Μέση τιμή της χρονοσειράς Τότε r k = nk t ( Y t n t1 k ( Y t y)( Yt y) 2 y)
ΑΥΤΟΣΥΣΧΕΤΙΣΗ (συνέχεια) Όταν η χρονοσειρά είναι στάσιμη, το r k μηδενίζεται γρήγορα Όταν υπάρχει τάση, το r k μηδενίζεται πιο αργά Όταν υπάρχει εποχικότητα, η τιμή του r k είναι σημαντικά διάφορη από το μηδέν για τιμές: k = 4n για τριμηνιαία δεδομένα και k = 12n για μηνιαία δεδομένα, όπου n = 1,2, Το διάγραμμα της αυτοσυσχέτισης ως προς το k λέγεται συνάρτηση αυτοσυσχέτισης (autocorrelation function) (ACF) ή συσχετισιοδιάγραμμα (correlogram)
ΤΟ ΑΚΑΘΑΡΙΣΤΟ ΕΘΝΙΚΟ ΠΡΟΪΟΝ (GDP) των ΗΝΩΜΕΝΩΝ ΠΟΛΙΤΕΙΩΝ
ΣΥΝΑΡΤΗΣΗ ACF ΤΟΥ GDP
ACF ΤΟΥ GDP
Η ψηφιοποίηση του εκπαιδευτικού υλικού έγινε στο πλαίσιο υλοποίησης της πράξης με τίτλο «ΕΝΙΣΧΥΣΗ ΣΠΟΥΔΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ στο ΤΕΙ ΚΑΒΑΛΑΣ», του Μέτρου 2.2 «Αναμόρφωση Προγραμμάτων Σπουδών - Διεύρυνση Τριτοβάθμιας Εκπαίδευσης» του ΕΠΕΑΕΚ ΙΙ, που συγχρηματοδοτείται από το Ευρωπαϊκό Κοινωνικό Ταμείο (Ε.Κ.Τ.) κατά 80% και Εθνικούς πόρους κατά 20%.