Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:



Σχετικά έγγραφα
Δειγματικές Κατανομές

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

στατιστική θεωρεία της δειγµατοληψίας

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

3. Κατανομές πιθανότητας

Εισαγωγή στην Εκτιμητική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Περιεχόμενα της Ενότητας. Δειγματοληψία. Δειγματοληψίας. Δειγματοληψία. Τυχαία Δειγματοληψία. Χ. Εμμανουηλίδης, 1.

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ιαστήµατα Εµπιστοσύνης

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

n + 1 X(1 + X). ) = X i i=1 i=1

Είδη Μεταβλητών. κλίµακα µέτρησης

Στατιστική Συμπερασματολογία

ειγµατοληπτική κατανοµή

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 3: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (3/4) Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Στατιστική Εισαγωγικές Έννοιες

Στατιστική ΙΙ Ενότητα 2: ειγµατοληψία

Θεωρητικές Κατανομές Πιθανότητας

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

Σηµειώσεις στις σειρές

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Στατιστική. Εκτιμητική

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΤΑΞΙΝΟΜΗΜΕΝΑ Ε ΟΜΕΝΑ

Στατιστική Συμπερασματολογία

ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ: ΠΛΗΡΟΦΟΡΙΚΗ ΘΕ: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ Ι (ΠΛΗ 12) ΛΥΣΕΙΣ ΕΡΓΑΣΙΑΣ 3

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Στατιστική Επιχειρήσεων ΙΙ

Κεφάλαιο 9 Κατανομές Δειγματοληψίας

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

Δειγματοληψία στην Ερευνα. Ετος

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ

cv = κατάλληλη κριτική (κρίσιμη) τιμή από τους πίνακες της Ζ ή t κατανομής

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ. Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Η παρουσίαση που ακολουθεί, αφορά την κανονική κατανομή και σκοπό έχει τη διευκόλυνση των φοιτητών του τμήματος Ηλεκτρολόγων Μηχανικών & Μηχανικών

Πρακτική µε στοιχεία στατιστικής ανάλυσης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αριθµητική Παραγώγιση και Ολοκλήρωση

Στατιστική Επιχειρήσεων ΙΙ

Το Κεντρικό Οριακό Θεώρημα

Τυχαία μεταβλητή (τ.μ.)

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Τ Ε Ι Ιονίων Νήσων Τμήμα Εφαρμογών Πληροφορικής στη Διοίκηση και την Οικονομία. Υπεύθυνος: Δρ. Κολιός Σταύρος

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

x y max(x))

Μάθηµα 11. Κεφάλαιο: Στατιστική

& 4/12/09 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

Εισόδημα Κατανάλωση

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Απλή Γραμμική Παλινδρόμηση II

Εισαγωγή στη Στατιστική

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

ιαγράµµατα Ελέγχου Ιδιοτήτων (Control Charts for Attributes)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Transcript:

Κατανοµές ειγµατοληψίας 1.Εισαγωγή Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: 1. Στατιστικής και 2. Κατανοµής ειγµατοληψίας Ένα δείγµα θα πρέπει να είναι αντιπροσωπευτικό (representative), δηλαδή να αντικατοπτρίζει ικανοποιητικά τη δοµή και τα χαρακτηριστικά του πληθυσµού, από τον οποίο προέρχεται. Για οποιαδήποτε στατιστική ανάλυση, λαµβάνουµε ένα δείγµα n παρατηρήσεων (Χ 1, Χ n ) το οποίο θα πρέπει να είναι αντιπροσωπευτικό. Η παρατήρηση i είναι τυχαία µεταβλητή, εφόσον υπάρχει αβεβαιότητα ως προς το ποια τιµή θα πάρει (τουλάχιστον µέχρι τη στιγµή της λήψης του δείγµατος). Πάντοτε συµβολίζεται µε κεφαλαίο γράµµα. Για παράδειγµα Χ ι ~Ν(µ,σ 2 ). Μετά τη λήψη του δείγµατος η παρατήρηση i είναι ένας αριθµός και για αυτό παριστάνεται µε µικρό γράµµα. Γιατί πρέπει ένα δείγµα να είναι τυχαίο? ιότι η τυχαιότητα του δείγµατος οδηγεί στην αντιπροσωπευτικότητα του και µας επιτρέπει να διατυπώσουµε προτάσεις για τις παραµέτρους του πληθυσµού (Στατιστική συµπερασµατολογία). 2. Στατιστικές και οι κατανοµές πιθανότητάς τους (κατανοµές δειγµατοληψίας). Μια συνάρτηση των n παρατηρήσεων ενός τυχαίου δείγµατος (Χ 1, Χ n ), η οποία δεν περιλαµβάνει άγνωστες παραµέτρους ονοµάζεται στατιστική (statistic). Για παράδειγµα µπορείτε να θεωρήσετε το δειγµατικό µέσο. εδοµένου ότι οι παρατηρήσεις Χ 1, Χ n είναι τυχαίες µεταβλητές, και οι στατιστικές, οι οποίες είναι συναρτήσεις των Χ 1, Χ n, είναι τυχαίες µεταβλητές. Η κατανοµή πιθανότητας µίας στατιστικής ονοµάζεται κατανοµή δειγµατοληψίας (sampling distribution). Θεωρητικά η κατανοµή δειγµατοληψίας προκύπτει αν δηµιουργήσουµε όλα τα δυνατά δείγµατα µεγέθους n από τον πληθυσµό και για κάθε από αυτό υπολογίζουµε τη στατιστική που Τιµόθεος Αγγελίδης 1

µας ενδιαφέρει. Η κατανοµή συχνότητας της στατιστικής αυτής θα αντιπροσωπεύει την κατανοµή δειγµατοληψίας. 3. Η κατανοµή δειγµατοληψίας του δειγµατικού µέσου Έστω ότι επιθυµούµε να εκτιµήσουµε την άγνωστη τιµή του µέσου ενός πληθυσµού, χρησιµοποιώντας ένα δείγµα. Προφανώς θα χρησιµοποιήσουµε την συνάρτηση του δειγµατικού µέσου (estimate) του, ενώ η στατιστική. Η τιµή που θα προκύψει ονοµάζεται εκτίµηση ονοµάζεται εκτιµητής (estimator). Ισχύει ότι:. Ωστόσο, αν έχουµε χρησιµοποιήσει µόνο ένα δείγµα, η µέση του τιµή ( ) είναι σχεδόν βέβαιο ότι θα διαφέρει από τη µέση τιµή του πληθυσµού. Για να προσεγγίσουµε το πραγµατικό µέσο θα πρέπει να αυξήσουµε το µέγεθος του δείγµατος, έτσι ώστε ο µέσος όλων των δειγµατικών να ισούται µε τον πληθυσµιακό (Ιδιότητα αµεροληψίας). 3.1 Αύξηση του µεγέθους του δείγµατος και µείωση του σφάλµατος εκτίµησης. εδοµένου ότι αρκεί και µόνο µία παρατήρηση για να ισχύει ότι, γιατί θα πρέπει να χρησιµοποιούµε δείγµατα µεγαλύτερου µεγέθους? Ο λόγος είναι ότι αν, τότε ο δειγµατικός µέσος εκτιµάει τον πληθυσµιακό ( ) µε µεγαλύτερη ακρίβεια, αφού η διακύµανση του µέσου ( ) είναι µικρότερη από τη διακύµανση του ( ). Απόδειξη: Εφόσον οι παρατηρήσεις είναι ανεξάρτητες, ισχύει ότι: και εποµένως αν. Η τυπική απόκλιση του, η οποία ονοµάζεται και τυπικό σφάλµα (standard error) του και η οποία συµβολίζεται µε Τιµόθεος Αγγελίδης 2

Η παραπάνω ανάλυση αφορούσε την περίπτωση που τα δείγµατα προέρχονταν από ένα άπειρο πληθυσµό. Αν υποθέσουµε ότι τα δείγµατα µεγέθους προέρχονται από ένα πεπερασµένο πληθυσµό, τότε ισχύει (χωρίς απόδειξη): Συµπερασµατικά, το τυπικό σφάλµα του µέσου µικραίνει καθώς το µέγεθος του δείγµατος αυξάνει. Η σχέση αυτή µπορεί να παρουσιαστεί και γραφικά: Ν=1 Ν=100 Ν=1000 Παράδειγµα Έστω ότι το µηνιαίο καθαρό εισόδηµα πέντε επιχειρήσεων (Ν=5), είναι όπως δείχνει ο παρακάτω πίνακας. α) Να βρείτε το µέσο και την διακύµανση του πληθυσµού. β) Να βρείτε το µέσο όλων των δειγµάτων (χωρίς επαναφορά) και την διακύµανση της κατανοµής των µέσων για n=2 και n=3. Οικογένειες Α Β Γ Ε Καθαρό µηνιαίο εισόδηµα (σε χιλιάδες) 100 210 80 90 70 Τιµόθεος Αγγελίδης 3

Λύση α) 100 + 210 + 80 + 90 + 70 µ = = 110 2 σ 2 = 5 i= 1 ( x µ ) i 5 β) Για n=2 έχουµε, είγµατα ΑΒ ΑΓ Α ΑΕ ΒΓ Β ΒΕ Γ ΓΕ Ε 2 = 2599,98 Μέσοι δειγµάτων 155 90 95 85 145 150 140 75 75 80 Άθροισµα 1100 Ο µέσος των µέσων όλων των δειγµάτων είναι, ~ xi x = = 1100/10 = 110 = µ (ο µέσος του 10 πληθυσµού). Η διακύµανση της κατανοµής των µέσων των δειγµάτων είναι, σ 2 x = 1 2 2 2 [(155 110) 10 + (90 110) +... + (80 110) ] = 975. Επίσης µπορούµε να εφαρµόσουµε τον τύπο, 2 2 σ σ x = n N n N 1 2599,98 5 2 = = 975. 2 5 1 Για n=3, έχουµε Τιµόθεος Αγγελίδης 4

είγµατα Μέσοι δειγµάτων ΑΒΓ 130 ΑΒ 133,33 ΑΒΕ 126,66 ΑΓ 90 ΑΓΕ 83,33 Α Ε 86,66 ΒΓ 126,66 ΒΓΕ 120 Β Ε 123,33 Γ Ε 80 Άθροισµα 1100 Ο µέσος των µέσων όλων των δειγµάτων είναι, ~ xi x = = 1100/10 = 110 = µ (ο µέσος του 10 πληθυσµού). Η διακύµανση της κατανοµής των µέσων των δειγµάτων είναι, 2 2 σ σ x = n N n = 433,33. N 1 4. Η κατανοµή δειγµατοληψίας της διακυµάνσεως,. Ο εκτιµητής της διακύµανσης του πληθυσµού,, ορίζεται από την επόµενη σχέση: Στον παρονοµαστή χρησιµοποιούµε αντί για γιατί ο εκτιµητής έχει την επιθυµητή ιδιότητα της αµεροληψίας (που θα δούµε στη συνέχεια), δηλαδή. Θεώρηµα: Αν ο πληθυσµός από τον οποίο προέρχεται το δείγµα είναι κανονικός µε διακύµανση, τότε: Τιµόθεος Αγγελίδης 5

Παράδειγµα: Έστω ότι σε µία µεγάλη πόλη η ετήσια δαπάνη για κρέας µίας τετραµελούς οικογένειας κατανέµεται κανονικά µε τυπική απόκλιση εκατοµµύρια δραχµές. Σε ένα τυχαίο δείγµα οικογενειών, ποια είναι η πιθανότητα η τυπική απόκλιση να υπερβαίνει τα 0.3 εκατ. δραχµές? Λύση: Γνωρίζω ότι. Εποµένως 5. Οι κατανοµές δειγµατοληψίας των στατιστικών και, όταν ο πληθυσµός είναι κανονικός. Στην επαγωγική Στατιστική χρησιµοποιούµε τα ακόλουθα θεωρήµατα: Θεώρηµα: Αν ο πληθυσµός από τον οποίο προέρχεται το δείγµα είναι κανονικός µε µέσο και γνωστή διακύµανση, τότε µπορούµε να συµβολίσουµε και συνεπώς: Θεώρηµα: Αν ο πληθυσµός από τον οποίο προέρχεται το δείγµα είναι κανονικός µε µέσο και άγνωστη διακύµανση την οποία την αντικαθιστούµε µε τη δειγµατική διακύµανση : Σηµείωση: Είναι σηµαντικό να αναφερθεί ότι και αν ακόµη οι µεταβλητές δεν ακολουθούν την κανονική κατανοµή, η µέση τιµή του δείγµατος τείνει προς την κανονική κατανοµή ασυµπτωτικά. ηλαδή, ισχύει η σχέση. Η κατανοµή της προσεγγίζει ικανοποιητικά την κανονική όταν για Τιµόθεος Αγγελίδης 6

ανεξάρτητα από το είδος της κατανοµής του πληθυσµού από τον οποίον προέρχονται τα δείγµα. Αν, η προσέγγιση είναι καλή µόνο αν η κατανοµή του πληθυσµού δεν διαφέρει πολύ από την κανονική κατανοµή. Παράδειγµα: Έστω ότι η ετήσια αποταµίευση (σε εκατ. δρχ. ) µίας κατηγορίας νοικοκυριών είναι µία τυχαία µεταβλητή, Χ, η οποία ακολουθεί την κανονική κατανοµή µε µέσο και τυπική απόκλιση. Αν πάρουµε ένα τυχαίο δείγµα νοικοκυριών από τον πληθυσµό αυτών, ποια είναι η πιθανότητα ο µέσος του δείγµατος να υπερβαίνει τα 6 εκατ. δρχ.? Λύση: Εφόσον το δείγµα προέρχεται από κανονικό πληθυσµό µε γνωστή διακύµανση, ισχύει ότι: Αν δεν γνωρίζαµε την τυπική απόκλιση του πληθυσµού, τότε θα εργαζόµασταν µε την δειγµατική τυπική απόκλιση. Έστω ότι η δειγµατική τυπική απόκλιση ισούται µε : 6. Το Κεντρικό Οριακό Θεώρηµα Έχει αποδειχθεί ότι ανεξάρτητα από τη µορφή του πληθυσµού, η κατανοµή του δειγµατικού µέσου προσεγγίζει την κανονική καθώς το µέγεθος του δείγµατος τείνει στο άπειρο ( ). Στην πρόταση αυτή βασίζεται το Κεντρικό Οριακό Θεώρηµα. Θεώρηµα: Κεντρικό Οριακό Θεώρηµα: Έστω ότι είναι ανεξάρτητες τυχαίες µεταβλητές που έχουν όλες την ίδια κατανοµή, η οποία έχει πεπερασµένο µέσο ( ) και πεπερασµένη διακύµανση ( ) και έστω ότι ο αριθµητικός µέσος των. Καθώς ισχύει ότι Τιµόθεος Αγγελίδης 7

Η σχέση αυτή ουσιαστικά εκφράζεται ως: Αν, η κατανοµή της τυχαίας µεταβλητής συγκλίνει στην τυποποιηµένη κανονική κατανοµή. Η ασυµπτωτική κατανοµή του µέσου είναι η εξής: Συµπερασµατικά, όταν η κατανοµή του µέσου είναι άγνωστη, τότε µπορούµε να την προσεγγίσουµε µε την κατανοµή, µε την προϋπόθεση ότι το µέγεθος του δείγµατος είναι µεγάλο (>30). Κάτω από αυτή την υπόθεση, η κατανοµή της προσεγγίζεται από την και συνεπώς µπορούµε να χρησιµοποιήσουµε τους πίνακες της τυποποιηµένης κατανοµής. Στην περίπτωση η στατιστική συνάρτηση που µας ενδιαφέρει είναι η κατανοµή του αθροίσµατος, ισχύει ότι Παράδειγµα: Το καθαρό βάρος (σε κιλά) 1000 πακέτων ζυµαρικών έχει και. Αν επιλέξουµε τυχαία 100 πακέτα, ποια είναι η πιθανότητα το µέσο βάρος τους να είναι µικρότερο από 4.5 κιλά? Λύση: Έχουµε. Επειδή ο πληθυσµός είναι πεπερασµένος, το τυπικό σφάλµα θα ισούται µε. εδοµένου ότι το µέγεθος του δείγµατος είναι µεγάλο, µπορούµε να χρησιµοποιήσουµε το Κεντρικό Οριακό Θεώρηµα. Συνεπώς Στην περίπτωση που η διακύµανση του πληθυσµού θεωρείται άγνωστη, η αντικαθίσταται µε την δειγµατική τυχαία µεταβλητή. Η τυχαία µεταβλητή, η οποία ακολουθεί την κατανοµή, µπορεί να θεωρηθεί ότι ακολουθεί προσεγγιστικά την, ανεξάρτητα από την µορφή του πληθυσµού, Τιµόθεος Αγγελίδης 8

εφόσον το µέγεθος του δείγµατος είναι µεγάλο (n>30). Κάτω από αυτή τη συνθήκη µπορούµε να χρησιµοποιήσουµε τον πίνακα της αντί της. Παράδειγµα: Στο προηγούµενο παράδειγµα θεωρείστε ότι δεν γνωρίζαµε ότι είχαµε υπολογίσει τη δειγµατική εκτίµηση, αλλά Λύση: και συνεπώς Παράδειγµα: Ο ιευθυντής του αεροδροµίου µελετά τις καθυστερήσεις των αναχωρήσεων. Από τα στατιστικά στοιχεία προκύπτει ότι σχεδόν το 84,1% των πτήσεων έχουν καθυστέρηση µικρότερη των 25 λεπτών ενώ περίπου το ένα πέµπτο των πτήσεων καθυστερούν το πολύ 15,8 λεπτά. Με την υπόθεση ότι ο χρόνος καθυστέρησης κατανέµεται κανονικά ποια είναι η µέση διάρκεια (µ) και η τυπική απόκλιση (σ) των καθυστερήσεων. Λύση: Από τον πίνακα των εµβαδών της κανονικής κατανοµής µε στοιχείο εισόδου τις αθροιστικές πιθανότητες έχουµε: Ρ(Ζ < 1) = 0,841 και Ρ(Ζ < -0,84) = 0,200 και εποµένως (25 - µ)/σ = 1 25= σ + µ και (15,8-µ)/σ = -0,84 15,8= -0,84σ + µ Από τη λύση του συστήµατος έχουµε σ = 5 λεπτά και µ = 20 λεπτά. Παράδειγµα: Μία µεγάλη κατασκευαστική εταιρεία πρόκειται να χρηµατοδοτήσει έναν ποδηλατικό αγώνα που διοργανώνει ο δήµος της πόλης. Αναµένεται να δηλώσουν συµµετοχή περίπου 30.000 άτοµα. Από προηγούµενες εκδηλώσεις είναι γνωστό ότι ο χρόνος κάλυψης της διαδροµής (γύρος της πόλης) κατανέµεται κανονικά µε µέσο 180 λεπτά και Τιµόθεος Αγγελίδης 9

τυπική απόκλιση 20 λεπτά. 1. Πόσα µετάλλια θα χρειαστούν εάν η εταιρία δώσει από ένα σε όσους τερµατίσουν σε χρόνο κάτω από 2 ώρες. 2. Πόσα φούτερ θα χρειαστούν εάν η εταιρία δώσει δωρεάν από ένα σε όσους τερµατίσουν σε χρόνο κάτω από 3,5 ώρες (αλλά πάνω από 2 ώρες). 3. Πόσα µπλουζάκια θα χρειαστούν για όσους τερµατίσουν σε χρόνο περισσότερο από 3,5 ώρες. 4. Τέλος, ποιό είναι το προβλεπόµενο κόστος της εκδήλωσης µε βάση τις εξής τιµές αγοράς των δώρων: µετάλλιο 40, φούτερ 20, και µπλουζάκι 5. Λύση: Η λύση βασίζεται στα εµβαδά της τυποποιηµένης κανονικής κατανοµής, και µε την προϋπόθεση ότι οι χρόνοι τερµατισµού θα εκφράζονται σε λεπτά. Έτσι, 1. Για χρόνο < 2 ώρες, δηλαδή Χ < 2 60 = 120 λεπτά Ζ = (Χ-µ)/σ = (120-180)/20 = -3 Ρ(Ζ<-3) = 0,00135 δηλαδή, (30.000) (0,00135) = 41 µετάλλια 2. Για χρόνο > 2 ώρες και < 3,5 ώρες, δηλαδή 120 <Χ< 210 Ζ 1 =-3 και Ζ 2 = (Χ 2 -µ)/σ = (210-180)/20 = 1,5 Ρ(-3<Ζ<1,5)=Ρ(Ζ<1,5)-Ρ(Ζ<-3)=0,93319-0,00135=0,93184 Τιµόθεος Αγγελίδης 10

δηλαδή, (30.000) (0,93184) = 27.955 φούτερ 3. Για χρόνο > 3,5 ώρες, δηλαδή Χ > 210 λεπτά ή Ζ > 1,5 Ρ(Ζ>1,5) = 1-Ρ(Ζ<1,5) = 1-0,93319 = 0,06681 δηλαδή, (30.000) ( 0,06681) = 2.004 µπλουζάκια 4. Με βάση τα παραπάνω το προβλεπόµενο κόστος είναι: µετάλλια: 41 x 40 = 1.640 φούτερ: 27.955 x 20 = 559.100 µπλουζάκια: 2.004 x 5 = 10.020 Σύνολα 30.000 δώρα 570.760 Παράδειγµα Έστω Χ= αριθµός των ωρών ανά εβδοµάδα που βρίσκονται στο «campus» οι φοιτητές, τότε Χ~Ν(µ,5 2 ). Θέλουµε να βρούµε n ώστε P( X µ < 1) 0,90. Από τα στοιχεία πιο πάνω ξέρουµε ότι X N 2 5, n ~ µ, τότε, X µ 1 1 P( X µ < 1) = P = < P Z < 5 n 5 n 5 n = n P Z < 5 (... παριστά την απόλυτη τιµή). Από το πίνακα της τυποποιηµένης κανονικής κατανοµής πρέπει να βρούµε εκείνο το αριθµό που αφήνει 5% του εµβαδού δεξιά, δηλαδή 1,645. Τότε έχουµε, n 5 = 1,645, λύνουµε και βρίσκουµε n=68. Τιµόθεος Αγγελίδης 11

7. Προσέγγιση της ιωνυµικής και της Poisson κατανοµής µε την Κανονική Έστω είναι µια διωνυµική κατανοµή, όπου είναι ανεξάρτητες Bernoulli µεταβλητές µε, όπου είναι η πιθανότητα επιτυχίας κάθε δοκιµής και είναι ο αριθµός των επιτυχιών. Όταν το µέγεθος του δείγµατος είναι µεγάλο, µπορούµε να χρησιµοποιήσουµε το Κεντρικό Οριακό Θεώρηµα: Εποµένως, µπορούµε να βασισθούµε στην κατανοµή για τον υπολογισµό των διωνυµικών πιθανοτήτων. Τέλος, θα πρέπει να σηµειωθεί ότι ακρίβεια της προσεγγίσεως δεν εξαρτάται µόνο από το, αλλά και από το. Για να είναι ικανοποιητική η προσέγγιση θα πρέπει: και. Για να προσεγγιστεί η Poisson από την κανονική, θα πρέπει αρχικά να ορίσουµε ότι η τυχαία µεταβλητή αριθµός συµβάντων κατά τη χρονική περίοδο έχει Poisson κατανοµή µε είναι «µεγάλο». ιαιρούµε τη χρονική µονάδα σε ίσα υποδιαστήµατα, το καθένα µήκους και ορίζουµε τις µεταβλητές ως τον αριθµό των συµβάντων (0,1) στο πρώτο, δεύτερο, n-στο υποδιάστηµα, αντίστοιχα. Με αυτόν µπορούµε να θεωρήσουµε ότι η τυχαία µεταβλητή, όπου είναι µια Bernoulli µε και συνεπώς. 8. Η κατανοµή δειγµατοληψίας της αναλογίας του δείγµατος Η αναλογία των επιτυχιών, µε βάση µιας ακολουθίας Bernoulli µεταβλητών, ορίζεται Η στατιστική είναι ο εκτιµητής της παραµέτρου. Επειδή η τυχαία µεταβλητή έχει διωνυµική κατανοµή µε µέσο και διακύµανση ισχύει Τιµόθεος Αγγελίδης 12

και Ο παραπάνω τύπος ισχύει όταν το µέγεθος του πληθυσµού είναι πολύ µεγαλύτερο από το µέγεθος του δείγµατος. Σε αντίθετη περίπτωση, όπως και για τη διακύµανση του µέσου, θα πρέπει αυτή η ποσότητα να πολλαπλασιαστεί µε. Συνοψίζοντας, το τυπικό σφάλµα της αναλογίας συµβολίζεται µε και υπολογίζεται ανάλογα µε το µέγεθος του πληθυσµού Ασυµπτωτικά, η κατανοµή της στατιστικής είναι Με βάση το Κεντρικό Οριακό Θεώρηµα και τη σχέση οποία διαιρούµε µε προκύπτει:, την Παράδειγµα: Έστω ότι προκηρύσσεται µία θέση στο δηµόσιο και το σύνολο των υποψηφίων που θα επιθυµούσαν να υποβάλλουν αίτηση είναι 300 άτοµα, από τα οποία τα 90 είναι γυναίκες. Εξαιτίας ανεπαρκούς διαφηµίσεως της θέσης, µόνο 48 υποψήφιοι µαθαίνουν τυχαία για τη θέση και υποβάλλουν τα δικαιολογητικά. Ποια είναι η πιθανότητα το ποσοστό των υποψηφίων γυναικών στο δείγµα να είναι µικρότερο από 20%. Λύση: Τιµόθεος Αγγελίδης 13

Επειδή ο πληθυσµός είναι πεπερασµένος, ο σωστός τύπος του τυπικού σφάλµατος της αναλογίας του δείγµατος είναι, οπότε. Άρα, µε βάση τη σχέση, Παράδειγµα Είναι γνωστό από έρευνα µεταξύ των ιδιοκτητών ακινήτων ότι το 40% συµφωνούν µε την επιβολή του φόρου ακίνητης περιουσίας. Στην τελευταία γενική συνέλευση της ένωσης ιδιοκτητών ακινήτων επιλέγεται µε τυχαίο τρόπο µία 9-µελής επιτροπή. Ποια είναι η ακριβής κατανοµή πιθανοτήτων του αριθµού των µελών της επιτροπής που είναι υπέρ του φόρου ακίνητης περιουσίας, και ποια η προσέγγιση της µε τη χρήση της κανονικής κατανοµής. Λύση: Με την υπόθεση ότι το p είναι σταθερό (π.χ. η επιλογή γίνεται µε επανατοποθέτηση ή ότι ο αριθµός των µελών είναι µεγάλος) η ακριβής κατανοµή ακολουθεί την διωνυµική κατανοµή. Οι ακριβείς πιθανότητες δίνονται από τους Πίνακες της διωνυµικής κατανοµής, ενώ οι προσεγίσεις θα προκύψουν από την κανονική κατανοµή. Για παράδειγµα, µε βάση τους πίνακες, για n=9 και p=0,40, Ρ(Χ=5)=0,1672 ενώ µε βάση την κανονική κατανοµή έχουµε: µ = n p = 9 0,4 = 3,6 και σ = [n p (1-p)] 1/2 = [9 0,4( (1-0,4)] 1/2 = 1,470 και µε βάση τον συντελεστή διόρθωσης της συνέχειας Ρ(Χ=5) = Ρ(4,5<Χ<5,5) = Ρ(Χ<5,5) - Ρ(Χ<4,5)= Ρ[Ζ<(5,5-µ)/σ] - Ρ[Ζ<(4,5-µ)/σ]= Ρ[Ζ<(5,5-3,6)/1,47] - Ρ[Ζ<(4,5-3,6)/1,47]= Ρ[Ζ<1,29] - Ρ[Ζ<0,61] = 0,90147-0,72907 = 0,172 Τιµόθεος Αγγελίδης 14

Ο Πίνακας δίνει τις ακριβείς πιθανότητες της διωνυµικής κατανοµής και τις αντίστοιχες προσεγγίσεις της κανονικής κατανοµής. X Ακριβείς πιθανότητες Προσεγγιστικές πιθανότητες 0 0.010 0.015 1 0.060 0.059 2 0.161 0.151 3 0.251 0.246 4 0.251 0.257 5 0.167 0.172 6 0.074 0.074 7 0.021 0.020 8 0.004 0.004 9 0.000 0.000 Σύνολο 1.000 1 9. Η κατανοµή δειγµατοληψίας της διαφοράς των µέσων δύο ανεξάρτητων δειγµάτων,. Έστω ότι έχουµε δύο πληθυσµούς, τα µεγέθη των οποίων είναι, ενώ οι µέσοι και οι διακυµάνσεις τους είναι. Αν πάρουµε δύο ανεξάρτητα δείγµατα από τους πληθυσµούς αυτούς µεγέθους, τότε η στατιστική χρησιµοποιείται ως εκτιµητής της παραµέτρου. Ο µέσος και το τυπικό σφάλµα της στατιστικής αυτής είναι: Τιµόθεος Αγγελίδης 15

Στην περίπτωση που απαιτείται διόρθωση του τυπικού σφάλµατος, τότε ο σωστός τύπος είναι: Αν οι αρχικοί πληθυσµοί είναι κανονικοί, τότε και συνεπώς Αν οι αρχικοί πληθυσµοί δεν είναι κανονικοί, αλλά και, τότε σύµφωνα µε το Κεντρικό Οριακό Θεώρηµα: Με βάση τη προηγούµενη σχέση προκύπτει η ασυµπτωτική κατανοµή της διαφοράς : Παράδειγµα: Ένας καθηγητής που διδάσκει το ίδιο µάθηµα στα Πανεπιστήµια Α και Β, όπου είναι γραµµένοι και παρακολουθούν 100 και 120 φοιτητές, αντίστοιχα. Για να διαπιστώσει αν υπάρχει διαφορά µεταξύ των δύο τάξεων ως προς την κατανόηση της ύλης, υποβάλλει τις ίδιες περίπου ερωτήσεις στις δύο τάξεις, επιλέγοντας τυχαία το φοιτητή ή τη φοιτήτρια για να απευθύνει µία ερώτηση και βαθµολογώντας τις απαντήσεις µ ένα µη αρνητικό αριθµό. Κατά τη διάρκεια ενός εξαµήνου, ο καθηγητής απευθύνει το πολύ µία ερώτηση σε κάθε φοιτητή ή φοιτήτρια. Έστω ότι οι µέσοι βαθµοί στους δύο πληθυσµούς είναι 600 και 650 και οι διακυµάνσεις 8000 και 9000, αντίστοιχα. Αν υποθέσουµε ότι σ ένα συγκεκριµένο εξάµηνο ο καθηγητής υπέβαλε 45 και 52 ερωτήσεις στις δύο τάξεις αντίστοιχα, ποια είναι η πιθανότητα ο µέσος του δείγµατος της τάξεως Β να υπερβαίνει αυτόν της τάξεως Α τουλάχιστον κατά 80 µονάδες? Λύση: Τιµόθεος Αγγελίδης 16

Θέλουµε να υπολογίσουµε την πιθανότητα. Το τυπικό σφάλµα της διαφοράς, χρησιµοποιώντας τη διόρθωση, ισούται µε Επειδή (µεγάλο δείγµα) υπολογίζουµε 10. Η κατανοµή δειγµατοληψίας της διαφοράς των µέσων δύο εξαρτηµένων δειγµάτων. Έστω ότι οι παρατηρήσεις των δύο δειγµάτων µπορούν να εκληφθούν περισσότερο ως ζεύγη παρατηρήσεων παρά ως δύο ανεξάρτητα δείγµατα, όπως υποθέσαµε στα προηγούµενα παραδείγµατα. Ένα παράδειγµα εξαρτηµένων δειγµάτων είναι η µέτρηση της πίεσης του αίµατος των ίδιων ατόµων πριν και µετά από την λήψη ενός φαρµάκου. Υποθέτουµε ότι και υπολογίζουµε τις τιµές µιας νέας µεταβλητής,, ως τη διαφορά των τιµών των 2 µεταβλητών. Όπου δηλώνουν την παρατήρηση στο πρώτο και δεύτερο δείγµα. Στη συνέχεια υπολογίζουµε το µέσο της µεταβλητής τη διακύµανσή της και το τυπικό σφάλµα,. Συνεπώς Τιµόθεος Αγγελίδης 17

Παράδειγµα: Έστω Χ= παραγωγικότητα ενός εργάτη µίας εταιρείας πριν από την εισαγωγή µίας καινούργιας µεθόδου παραγωγής και Υ = παραγωγικότητα του ίδιου εργάτη µετά την εισαγωγή της µεθόδου. Αν η τυχαία µεταβλητή ακολουθεί την κανονική κατανοµή µε µέσο, ποια είναι η πιθανότητα η διαφορά των µέσων ενός τυχαίου δείγµατος 7 εργατών να υπερβαίνει τη µονάδα αν έχουµε εκτιµήσει ότι? Λύση: 11. Η κατανοµή δειγµατοληψίας της διαφοράς των αναλογιών δύο ανεξάρτητων δειγµάτων,. Έστω ότι έχουµε δύο πληθυσµούς τα µεγέθη των οποίων είναι και και στους οποίους οι πιθανότητες επιτυχίας είναι και, αντίστοιχα. Θεωρείστε ότι παίρνουµε δύο ανεξάρτητα τυχαία δείγµατα από τους πληθυσµούς αυτούς, µεγέθους και. Η διαφορά αναλογιών στα δύο δείγµατα, χρησιµοποιείται ως εκτιµητής της πληθυσµιακής αναλογίας. Ο µέσος και το τυπικό σφάλµα της στατιστικής : µε την προϋπόθεση ότι και είναι µεγάλοι αριθµοί σε σχέση µε τα και. Αν δεν είναι, το τυπικό σφάλµα θα πρέπει να διορθωθεί:, Σύµφωνα µε το Κεντρικό Οριακό Θεώρηµα: Τιµόθεος Αγγελίδης 18

Συνεπώς, για µεγάλα δείγµατα και ισχύει ότι, τότε ασυµπτωτικά ισχύει: Παράδειγµα: Έστω σε δύο µεγάλες πόλεις, Αθήνα και Θεσσαλονίκη, τα ποσοστά των οπαδών ενός κόµµατος είναι 25% και 20%. Αν από τις δύο πόλεις πάρουµε τυχαία δείγµατα των 200 και 100 ψηφοφόρων, ποια είναι η πιθανότητα το ποσοστό στο δείγµα της Αθήνας να υπερβαίνει αυτό της Θεσσαλονίκης τουλάχιστον κατά 10 ποσοστιαίες µονάδες. Λύση:. Επειδή οι δύο πληθυσµοί είναι µεγάλοι, δεν χρειάζεται να υπολογίσουµε το τυπικό σφάλµα µε τη διόρθωση και εποµένως. Επειδή ισχύουν οι κανόνες για τη χρησιµοποίηση της ασυµπτωτικής θεωρίας: 12. Η κατανοµή δειγµατοληψίας της Προφανώς στη στατιστική ανάλυση µας ενδιαφέρει και η διαφορά διακυµάνσεων. Θεώρηµα: Αν δυο ανεξάρτητα τυχαία δείγµατα µεγέθους και που προέρχονται από δύο κανονικούς πληθυσµούς µε διακυµάνσεις, τότε. Παράδειγµα: Σε προηγούµενο παράδειγµα, µας ενδιέφερε η διακύµανση της µεταβλητής =ετήσια δαπάνη για κρέας των τετραµελών οικογενειών µιας πόλης. Είχαµε υποθέσει ότι, και η κατανοµή των ήταν κανονική µε τυπική απόκλιση. Υποθέστε ότι έχετε ένα παρόµοιο δείγµα από µία άλλη πόλη, όπου η κατανοµή της είναι επίσης κανονική µε διακύµανση. Ποια είναι η πιθανότητα η διακύµανση του δευτέρου δείγµατος να είναι τουλάχιστον τετραπλάσια της διακυµάνσεως του πρώτου δείγµατος; Τιµόθεος Αγγελίδης 19

Λύση εδοµένου ότι, µπορούµε να υπολογίσουµε ότι: Από τους πίνακες δεν γνωρίζουµε την τιµή της τυχαίας µεταβλητής, αλλά τις συναρτήσεις και. Εποµένως µπορούµε να κάνουµε µια προσέγγιση θεωρώντας: και και εποµένως Τιµόθεος Αγγελίδης 20