ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Σχετικά έγγραφα
Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

Στατιστική Συμπερασματολογία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Είδη Μεταβλητών. κλίµακα µέτρησης

ΑΣΚΗΣΕΙΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΟΙΚΟΝΟΜΙΚΗΣ ΣΤΑΤΙΣΤΙΚΗΣ

5. Έλεγχοι Υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

X = = 81 9 = 9

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Εισόδημα Κατανάλωση

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

ΘΕΜΑΤΑ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική. Εκτιμητική

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

4.ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ για τη λήψη αποφάσεων

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Επιχειρήσεων ΙΙ

9. Παλινδρόμηση και Συσχέτιση

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

ΑΣΚΗΣΕΙΣ ΣΤΟΥΣ ΕΛΕΓΧΟΥΣ ΥΠΟΘΕΣΕΩΝ

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ

Στατιστική Επιχειρήσεων ΙΙ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Στατιστική Συμπερασματολογία

στατιστική θεωρεία της δειγµατοληψίας

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ


ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

ιαστήµατα Εµπιστοσύνης

Εισαγωγή στην Εκτιμητική

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

Έλεγχος υπόθεσης: διαδικασία αποδοχής ή απόρριψης της υπόθεσης

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Χ. Εμμανουηλίδης, 1

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

3. Κατανομές πιθανότητας

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Γ. Πειραματισμός - Βιομετρία

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΤΑΞΙΝΟΜΗΜΕΝΑ Ε ΟΜΕΝΑ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

F είναι ίσος µε ν. i ÏÅÖÅ ( ) h 3,f 3.

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Λυµένες Ασκήσεις στο Μάθηµα Στατιστικής στο Τµήµα Πολιτικών Μηχανικών

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

Α4. Να χαρακτηρίσετε τις προτάσεις που ακολουθούν, γράφοντας στο τετράδιό σας δίπλα στο γράµµα που αντιστοιχεί σε κάθε πρόταση, τη λέξη Σωστό, αν η

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Περιγραφική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων. της σ 2 είναι επίσης αµερόληπτη. n 1 +n 2

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Transcript:

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ορεστιάδα 7

ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο ο : Παράγωγες κατανοµές 7.. Η κατανοµή Χ... 7.. Η κατανοµή t... 8.3. Η κατανοµή F Κεφάλαιο ο : Κατανοµές στατιστικών δείγµατος.. Κατανοµή µέσης τιµής δείγµατος... Κατανοµή διαφοράς µέσων τιµών δύο δειγµάτων..3. Κατανοµή διακύµανσης δείγµατος. 3.4. Κατανοµή λόγου διακυµάνσεων δύο δειγµάτων 3.5. Κατανοµή ποσοστού (αναλογίας δείγµατος.. 3.6. Κατανοµή διαφοράς ποσοστών (αναλογιών δύο δειγµάτων 4 Κεφάλαιο 3 ο : Εκτιµητική. 5 3.. Σηµειακή εκτίµηση µιας άγνωστης παραµέτρου ενός πληθυσµού ως προς µια µεταβλητή.... 5 3.. Σηµειακές εκτιµήτριες της µέσης τιµής και της διακύµανσης ενός πληθυσµού ως προς µια µεταβλητή.. 6 i. Σηµειακή εκτίµηση της µέσης τιµής ενός πληθυσµού ως προς µια µεταβλητή.. 6 ii. Σηµειακή εκτίµηση της διακύµανσης ενός πληθυσµού ως προς µια µεταβλητή.. 7 3.3. ιάστηµα εµπιστοσύνης της παραµέτρου Θ ενός πληθυσµού.... 7 3.4. Εκτίµηση διαστήµατος εµπιστοσύνης της µέσης τιµής µ πληθυσµού 8 3.5. Εκτίµηση διαστήµατος εµπιστοσύνης της διαφοράς των µέσων τιµών δύο 6 πληθυσµών 3.6. Εκτίµηση διαστήµατος εµπιστοσύνης της διακύµανσης σ πληθυσµού.. 34 3.7. Εκτίµηση διαστήµατος εµπιστοσύνης του λόγου των διακυµάνσεων δύο 35 πληθυσµών..... 3.8. Εκτίµηση διαστήµατος εµπιστοσύνης του ποσοστού (αναλογίας των στοιχείων πληθυσµού.. 36 3.9. Εκτίµηση διαστήµατος εµπιστοσύνης του λόγου των ποσοστών (αναλογιών 38 των στοιχείων δύο πληθυσµών.. Κεφάλαιο 4 ο 4 : Έλεγχοι υποθέσεων 4.. Γενικά... 4 4.. Σφάλµατα στάθµη σηµαντικότητας περιοχή απόρριψης της Η. 4 4.3.. Έλεγχος υπόθεσης για τη µέση τιµή του πληθυσµού. 4

4.3.. Έλεγχος υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών.. 46 4.4. Έλεγχος υπόθεσης για το ποσοστό των στοιχείων ενός πληθυσµού. 56 4.5. Έλεγχος υπόθεσης για τη διαφορά των ποσοστών των στοιχείων δύο 57 πληθυσµών. 4.6. Έλεγχος υπόθεσης για τη διακύµανση ενός πληθυσµού. 6 4.7. Έλεγχος υπόθεσης για το λόγο των διακυµάνσεων δύο πληθυσµών. 6 4.8. Έλεγχος υπόθεσης και διάστηµα εµπιστοσύνης. 64 Κεφάλαιο 5 ο : Ανάλυση κατηγορικών δεδοµένων 65 5.. Γενικά.. 65 5.. Ο έλεγχος ανεξαρτησίας.. 65 5.3. Ο έλεγχος οµογένειας 67 Κεφάλαιο 6 ο : Έλεγχος προσαρµοστικότητας. 7 6.. Έλεγχος προσαρµοστικότητας της υποθετικής κατανοµής 7 6.. Έλεγχος Χ.. 7 6.3. Έλεγχος Kolmogorov-Smirov (K-S 73 Κεφάλαιο 7 ο : Απλή παλινδρόµηση - Γραµµικό µοντέλο. 8 7.. Η Έννοια της συσχέτισης...... 8 7.. Η Μέθοδος των ελαχίστων τετραγώνων..... 83 7.3. Η ευθεία των ελαχίστων τετραγώνων (γραµµική παλινδρόµηση. 83 7.4. Μέσο τετραγωνικό σφάλµα ή Συντελεστής Προσδιορισµού Συντελεστής συσχέτισης...... 86 7.5. Μοντέλα απλής παλινδρόµησης........ 9 7.6 Μοντέλα απλής παλινδρόµησης που ανάγονται σε γραµµικά µοντέλα.. 93 Κεφάλαιο 8 ο : Χρονολογικές σειρές. 96 8.. Εισαγωγή..... 96 8.. Συνιστώσες των χρονολογικών σειρών 97 8.3. Στατικός προσδιορισµός σειρών.... 99 i. Χάραξη µε το χέρι γραφική µέθοδος. ii. Η µέθοδος των µέσων σηµείων iii. Η µέθοδος των κινητών µέσων όρων... iv. Η µέθοδος των ελαχίστων τετραγώνων 8.4. Στατικός προσδιορισµός της εποχικότητας.. 4 i. Η µέθοδος των ποσοστών ως προς το µηνιαίο µέσο ii. Η µέθοδος των ποσοστών ως προς τη µηνιαία τάση iii. Η µέθοδος των ποσοστών ως προς το µηνιαίους κινητούς µέσους.. 8.5. Στατιστικός Προσδιορισµός των κυκλικών κυµάνσεων... 9 Κεφάλαιο 9 ο : Αριθµοδείκτες. 3 9.. Αριθµοδείκτες..... 3 9.. Απλοί Αριθµοδείκτες.. 3 9.3. Σύνθετοι Αριθµοδείκτες..... 7.. 9.3.. Μη σταθµισµένος σύνθετος αριθµοδείκτης.. 7 9.3.. Σταθµισµένος σύνθετος αριθµοδείκτης.... 8 3

9.4. είκτες πληθωρισµού αποπληθωρισµού και αποπληθωρισµός των 33 Χρηµατικών αξιών..... Βιβλιογραφία 36 4

Πρόλογος Σκοπός του παρόντος βοηθήµατος είναι να δώσει στον φοιτητή του τµήµατος της Αγροτικής Ανάπτυξης, µε όσο το δυνατόν µεγαλύτερη απλότητα και πιο ουσιαστικά, τις βασικές γνώσεις της Στατιστικής και να παρουσιάσει κύριους τοµείς εφαρµογής της Στατιστικής στο χώρο της Οικονοµικής διαχείρισης και της διαχείρισης των επιχειρήσεων µε έµφαση στον τοµέα της Αγροτικής Οικονοµίας και Ανάπτυξης. Η εφαρµοσµένη Στατιστική αποτελεί σηµαντικό εργαλείο δουλειάς για ένα µελλοντικό επιστήµονα που θα ασχοληθεί µε θέµατα Αγροτικής Οικονοµίας και Ανάπτυξης. Για τον λόγο αυτό o φοιτητής-α πρέπει να εµπεδώσει τις βασικές έννοιες της Στατιστικής και να ασχοληθεί µε πρακτικά προβλήµατα που αναδεικνύουν τον σπουδαίο ρόλο της Στατιστικής στο πεδίο της εφαρµογής. Το ξεκίνηµα αυτής της προσπάθειας θέλω να πιστεύω ότι θα έχει συνέχεια και ότι λάθη και παραλήψεις στο παρόν εγχείρηµα θα διορθωθούν στην πορεία µε τελικό στόχο να προκύψει ένα βοήθηµα απλό ουσιαστικό και κατανοητό για όλους όσους ενδιαφέρονται και ασχολούνται άµεσα µε τα θέµατα της Αγροτικής Οικονοµίας και Ανάπτυξης. Θ. Χ. Κουτρουµανίδης 5

Εισαγωγή Η Στατιστική πρωτοεµφανίστηκε στην αρχαιότητα ως πρακτική µεθοδολογία καταµέτρησης δεδοµένων και στην πορεία εξελίχθηκε σ ένα κλάδο επιστηµονικό µε την αντίστοιχη θεωρητική υποδοµή κυρίως µε την εισαγωγή της θεωρίας των πιθανοτήτων. Ποτέ όµως δεν έπαψε να αποτελεί εργαλείο δουλειάς και έρευνας για όλους τους επιστηµονικούς κλάδους θεωρητικούς και θετικούς. Σήµερα µε την ραγδαία εξέλιξη της πληροφορικής η Στατιστική έχει ενσωµατωθεί σε πάρα πολλές επιστήµες και αποτελεί αναπόσπαστο τµήµα τους. Παράλληλα επικρατεί η άποψη ότι µειώνεται ο ρόλος του επιστήµονα ερευνητή σ ένα περιβάλλον που κατακλύζεται από στατιστικά προγράµµατα µέσω Η/Υ. Εδώ θα πρέπει να είµαστε σαφείς και κατηγορηµατικοί ο ερευνητής έχει τον πρώτο και τον τελευταίο λόγο στην επεξεργασία των δεδοµένων µέσω στατιστικών πακέτων και θα πρέπει να έχει κατανοήσει καλά τις βασικές έννοιες της Στατιστικής (περιγραφικής και επαγωγικής για να µπορέσει να κάνει σωστά τη δουλειά του. Άρα προέχει η εκπαίδευση του σε θέµατα Στατιστικής και δεν µπορεί κανένα στατιστικό πρόγραµµα να υποκαταστήσει τον ερευνητή. Το παρόν σύγγραµµα κινείται σ αυτήν την αντίληψη, να δώσει δηλαδή απλά και ουσιαστικά τις βασικές γνώσεις της Στατιστικής και να παρουσιάσει εφαρµογές της Στατιστικής στον χώρο της Αγροτικής Οικονοµίας και Ανάπτυξης, ώστε να µπορεί ο µελλοντικός επιστήµονας που θα ασχοληθεί µε τα θέµατα της Αγροτικής Ανάπτυξης να χρησιµοποιεί στατιστικές µεθόδους και τεχνικές για την δουλειά του. Η δοµή του συγγράµµατος περιλαµβάνει τα εξής µέρη: Παράγωγες κατανοµές (Κεφάλαιο ο, Κατανοµές στατιστικών δείγµατος (Κεφάλαιο ο, Εκτιµητική (Κεφάλαιο 3, Έλεγχοι υποθέσεων (Κεφάλαιο 4, Έλεγχο προσαρµοστικότητας (Κεφάλαιο 5, Ανάλυση κατηγορικών µεταβλητών (Κεφάλαιο 6, Απλή Γραµµική Παλινδρόµηση (Κεφάλαιο 7, Χρονολογικές σειρές (Κεφάλαιο 8, Αριθµοδείκτες (Κεφάλαιο 9. 6

Παράγωγες Κατανοµές Κεφάλαιο ο.. Η Χ - Κατανοµή Θεωρούµε τις τυχαίες µεταβλητές Χ, Χ,., Χ v που είναι ανεξάρτητες µεταξύ τους και όπου η κάθε µια µεταβλητή έχει τυπική κανονική κατανοµή Ν(,. ηµιουργούµε την τυχαία µεταβλητή Χ Χ +Χ +..+Χ v. Η τυχαία αυτή µεταβλητή ακολουθεί µια κατανοµή που ονοµάζεται Χ - τετράγωνο κατανοµή, Χ. Η συνάρτηση πυκνότητας πιθανότητας αυτής η f(x έχει v-βαθµούς ελευθερίας: f ( x x v x v / e Γ( v, x >, x < όπου Γ(κ(κ-! Έχουµε Ε [X ] v και Vr[X ] v. f(x ν v3 v v6 v 5 X 7

Όταν v>3 η κατανοµή Χ είναι σχεδόν συµµετρική και λέµε ότι τείνει προς την κανονική. Η αθροιστική συνάρτηση F(x εκφράζει το εµβαδόν τµήµατος. f(x F( X P[ X ] x v,α α F( X + x v, Ο πίνακας δίνει τις τιµές x v,α x της Χ για τις οποίες έχουµε την πιθανότητα P [ X ] α, όπου α η δοσµένη πιθανότητα και v - βαθµοί ελευθερίας γνωστοί. > x v, α f(x -α α x v,α x.. Η t - Κατανοµή. Θεωρούµε δύο ανεξάρτητες µεταξύ τους τυχαίες µεταβλητές Χ και Υ από τις οποίες η Χ έχει κανονική κατανοµή και η Υ ακολουθεί την κατανοµή Χ µε v-βαθµούς ελευθερίας. X Η τυχαία µεταβλητή T Y v ακολουθεί την κατανοµή t µε v-βαθµούς 8

ελευθερίας. Η Συνάρτηση πυκνότητας πιθανότητας της κατανοµής αυτής v+ t f ( t β + v ελευθερίας., < t < +, όπου Γ(( v + / β Γ( v / πν έχει v-βαθµούς v Με Ε[Τ] και Vr [ T]. v limvr [ T ]. v + Όταν ο v (βαθµοί ελευθερίας είναι µεγάλος η κατανοµή t τείνει στην τυπική κανονική κατανοµή Ν (,. N(, v + v f(t v3 v tν,α t Έχουµε : Σε πίνακα δίνονται οι τιµές t v,α της Τ για τις οποίες έχουµε την πιθανότητα P[T<t v,α ] α και v οι βαθµοί ελευθερίας. 9

( f(t P [ t < T < t ] α v, α / v, α / α/ + -t v,α/ t v,α/ t Επίσης (3 f(t [ t ] P T P[ T > tv, F( t v,α α ] + t ν,α t.3. Η F - Κατανοµή Μια τυχαία µεταβλητή που παράγεται ως λόγος δύο άλλων τυχαίων µεταβλητών ακολουθεί την F Κατανοµή η οποία εκφράζεται µε δύο βαθµούς ελευθερίας το ν, που είναι ο βαθµός ελευθερίας του αριθµητή και το ν, που είναι ο βαθµός ελευθερίας του παρανοµαστή. Έτσι συµβολίζεται µε F ν, ν. Υπάρχουν πίνακες που δίνουν τις κριτήριες τιµές F ν, ν ;α οι οποίες ορίζονται από τη σχέση: Ρ(Χ > F ν, ν ;α α Για τις διάφορες τιµές των α, ν, ν.

Κατανοµές στατιστικών δείγµατος Κεφάλαιο ο.. Κατανοµή µέσης τιµής δείγµατος Αν πάρουµε πολλά τυχαία δείγµατα µεγέθους από ένα πληθυσµό τότε προκύπτει η τυχαία µεταβλητή X, από τις τιµές των µέσων τιµών των δειγµάτων. Όταν το δείγµα προέρχεται από κανονικό πληθυσµό Ν(µ, σ ανεξάρτητα από το µέγεθός του έχουµε σ ότι η X ακολουθεί κανονική κατανοµή Ν(µ,, το ίδιο ισχύει και στην περίπτωση που το δείγµα δεν προέρχεται από κανονικό πληθυσµό αλλά το µέγεθός του είναι µεγάλο 3. Τότε η Ζ X µ σ ή Ζ X µ s ακολουθεί τυπική κανονική κατανοµή. Όταν το µέγεθος του δείγµατος είναι µικρό, η διακύµανση του πληθυσµού άγνωστη και ο πληθυσµός, από όπου προέρχεται το δείγµα, κανονικός τότε η ποσότητα: t X µ ακολουθεί την t-κατανοµή µε - βαθµούς ελευθερίας. s.. Κατανοµή διαφοράς µέσων τιµών δύο δειγµάτων Αν πάρουµε δύο δείγµατα µεγάλα µεγέθους ν και κ µε µέσες τιµές x και y και διακυµάνσεις s, s και οι πληθυσµιακές διακυµάνσεις είναι σ, σ αντίστοιχα τότε έχουµε ότι η µεταβλητή: X Y ( µ µ σ σ + ν κ ακολουθεί Ν(,.

Εφόσον οι πληθυσµιακές διακυµάνσεις είναι άγνωστες αντικαθίστανται από τις δειγµατικές διακυµάνσεις s, s και έχουµε ότι η µεταβλητή: κ ν µ µ ( s s Y X + ακολουθεί Ν(,. Αν πάρουµε δύο δείγµατα µικρά ανεξάρτητα µεγέθους ν και κ µε µέσες τιµές και και διακυµάνσεις s, s αντίστοιχα προερχόµενα από κανονικούς πληθυσµούς µε άγνωστες αλλά ίσες διακυµάνσεις σ σ σ τότε έχουµε ότι η µεταβλητή: x y κ ν κ ν κ ν µ µ ( ( ( + + + s s Y X ακολουθεί t-κατανοµή µε ν+κ- βαθµούς ελευθερίας Αν πάρουµε δύο δείγµατα µικρά ανεξάρτητα µεγέθους ν και κ µε µέσες τιµές και και διακυµάνσεις s, s αντίστοιχα προερχόµενα από κανονικούς πληθυσµούς µε άγνωστες και διαφορετικές διακυµάνσεις σ x y σ τότε έχουµε ότι η µεταβλητή: κ ν µ µ ( s s Y X + ακολουθεί t κατανοµή µε βαθµούς ελευθερίας λ (ν- όταν ν κ

και λ s s ( + ν κ s s ( ( ν + κ ν κ (στρογγυλεµένο στον πλησιέστερο ακέραιο όταν ν κ.3. Κατανοµή διακύµανσης δείγµατος Η ποσότητα: ( s X σ ακολουθεί την X κατανοµή µε - βαθµούς ελευθερίας. Ο πληθυσµός από όπου πάρθηκε το δείγµα µεγέθους θεωρείται κανονικός µε σ και s είναι η δειγµατική διακύµανση..4. Κατανοµή λόγου διακυµάνσεων δύο δειγµάτων Σύµφωνα µε την θεωρία αν πάρουµε δύο δείγµατα ανεξάρτητα µεγέθους και m αντίστοιχα µε s, s τις δειγµατικές διακυµάνσεις τους από δύο κανονικούς πληθυσµούς µε σ, σ τις πληθυσµιακές διακυµάνσεις, τότε ισχύει ότι η ποσότητα: s s σ σ ακολουθεί την F κατανοµή µε - και m- βαθµούς ελευθερίας.5. Κατανοµή ποσοστού (αναλογίας δείγµατος Αν εκτιµήσουµε το ποσοστό (αναλογία p x των στοιχείων στο µεγάλο δείγµα µεγέθους που έχουν κάποιο συγκεκριµένο χαρακτηριστικό, τότε σύµφωνα µε την θεωρία το δειγµατικό ποσοστό κατανέµεται κανονικά: ηλαδή η δειγµατική µεταβλητή P, που παράγεται από τις τιµές p, ακολουθεί την κανονική κατανοµή: Ν(P, πληθ p πληθ ( Pπληθ 3

Όπου P πληθ το πραγµατικό ποσοστό στον πληθυσµό. Συνεπώς έχουµε ότι η µεταβλητή: P P P P πληθ ( πληθ πληθ ακολουθεί την Ν(,..6. Κατανοµή διαφοράς ποσοστών (αναλογιών δύο δειγµάτων x y Έστω p και p είναι οι δειγµατικές αναλογίες των στοιχείων, που έχουν l κάποιο συγκεκριµένο χαρακτηριστικό, δύο δειγµάτων µεγέθους, l από δύο πληθυσµούς, όπου οι πραγµατικές αναλογίες είναι αντίστοιχα P πληθ, P πληθ. Τότε έχουµε ότι οι διαφορές των δειγµατικών µεταβλητών P - P ακολουθούν κανονική κατανοµή: Ν(P πληθ - P πληθ, P πληθ ( P πληθ P πληθ ( P πληθ + l 4

Κεφάλαιο 3 ο Εκτιµητική 3.. Σηµειακή εκτίµηση µιας άγνωστης παραµέτρου ενός πληθυσµού ως προς µια µεταβλητή. Όπως έχει αναφερθεί µέχρι τώρα για να µελετήσουµε ένα µεγάλο πληθυσµό ως προς κάποια µεταβλητή Χ καταφεύγουµε στην δειγµατοληψία. Λαµβάνουµε ένα δείγµα - στοιχείων του πληθυσµού και µελετάµε αυτό ως προς την µεταβλητή Χ. Τα συµπεράσµατα που προκύπτουν χαρακτηρίζουν, µέσω της επαγωγικής σκέψης, και το πληθυσµό. Αυτό άλλωστε αποτελεί και τη βασική σκέψη της Επαγωγικής Στατιστικής της οποίας ένα από τα σπουδαιότερα κεφάλαια είναι αυτό της Εκτιµητικής. Σε κάθε δείγµα προσδιορίζονται οι στατιστικές παράµετροι αυτού, όπως είναι η µέση τιµή x, η διακύµανση s, η τυπική απόκλιση s κλπ. Η τιµή µιας από αυτές τις παραµέτρους ονοµάζεται σηµειακή εκτιµήτρια της αντίστοιχης παραµέτρου του πληθυσµού. Γενικά αν ονοµάσουµε Θ την σηµειακή εκτιµήτρια της αντίστοιχης παραµέτρου Θ του πληθυσµού αυτή θα πρέπει να ικανοποιεί κάποιες βασικές ιδιότητες. Κατ αρχήν επειδή µπορούµε να πάρουµε πολλά δείγµατα ίσου µεγέθους από τον πληθυσµό θα έχουµε και τις αντίστοιχες σηµειακές εκτιµήτριες των δειγµάτων αυτών για την άγνωστη παράµετρο του πληθυσµού. ηλαδή αν πάρουµε ν δείγµατα ίσου µεγέθους από τον πληθυσµό θα έχουµε και τις αντίστοιχες Θ εκτιµήτριες της Θ. v Γίνεται λοιπόν φανερό ότι η εκτιµήτρια Θ είναι και αυτή τυχαία µεταβλητή. Η τιµή της τυχαίας µεταβλητής Θ σε ένα συγκεκριµένο i-δείγµα Θ i i,,3,4,,ν λέγεται σηµειακή εκτίµηση της παραµέτρου Θ. Οι βασικές ιδιότητες που πρέπει να πληρούνται από την σηµειακή εκτιµήτρια Θ είναι: i. Η Αµεροληψία: θα πρέπει δηλαδή η µέση τιµή της τυχαίας µεταβλητής Θ να είναι η άγνωστη παράµετρος Θ : Ε ( Θ Θ. Αν E( Θ Θ τότε η εκτιµήτρια είναι µεροληπτική και έχουµε το σφάλµα µεροληψίας ή σφάλµα εκτίµησης: E ( Θ Θ. 5

ii. Η Αποτελεσµατικότητα: Θα πρέπει η διακύµανση της αµερόληπτης εκτιµήτριας Θ, η Vr ( Θ, και είναι µικρότερη ή ίση από την διακύµανση οποιαδήποτε άλλης αµερόληπτης εκτιµήτριας ( Θ : iii. Η συνέπεια: Vr ( Θ Vr( Θ Μια σηµειακή εκτιµήτρια Θ είναι συνεπής όταν το σφάλµα µεροληψίας και η διακύµανσή της τείνουν στο µηδέν καθώς το µέγεθος του δείγµατος τείνει στο άπειρο: lim E ( Θ Θ και limvr( Θ. +. + 3.. Σηµειακές εκτιµήτριες της µέσης τιµής και της διακύµανσης ενός πληθυσµού ως προς µια µεταβλητή. i. Σηµειακή εκτίµηση της µέσης τιµής ενός πληθυσµού ως προς µια µεταβλητή. Έστω x,x,..x οι παρατηρήσεις της µεταβλητής Χ και µ η άγνωστη µέση τιµή του πληθυσµού. Έχουµε προσδιορίσει την δειγµατική µέση τιµή x, την σηµειακή εκτιµήτρια της µ του πληθυσµού, από τον τύπο: x v i xi Αν πάρουµε πολλά δείγµατα ίσου µεγέθους µπορούµε να ορίσουµε την τυχαία µεταβλητή X : X v i όπου Χ,Χ,..Χ τυχαίες µεταβλητές µε κατανοµή την ίδια µε αυτή της Χ. Xi 6

Η µέση τιµή E(X είναι µια αµερόληπτη σηµειακή εκτιµήτρια της πραγµατικής µέσης τιµής µ του πληθυσµού και ισχύει: E ( X, Vr( X σ µ και τυπική απόκλιση σ. Στις συµµετρικές κατανοµές ως σηµειακή εκτιµήτρια µπορεί να ληφθεί και η διάµεσος Μ, διότι έχουµε: E ( M µ. ii. Σηµειακή εκτίµηση της διακύµανσης ενός πληθυσµού ως προς µια µεταβλητή. Οµοίως η άγνωστη διακύµανση ενός πληθυσµού σ εκτιµάται από την διακύµανση ενός δείγµατος x, x,..x τιµών ως προς την µεταβλητή Χ του πληθυσµού. Η δειγµατική διακύµανση συµβολίζεται µε s και είναι σύµφωνα µε όσα αναφέρθησαν: s v i ( xi x Η δειγµατική αυτή διακύµανση είναι τυχαία µεταβλητή S, επειδή µπορούµε να λάβουµε πολλά δείγµατα ίσου µεγέθους του πληθυσµού και να ορίσουµε έτσι τις αντίστοιχες διακυµάνσεις. S v i ( Xi X όπου Χi οι προαναφερόµενες τυχαίες µεταβλητές και X η µέση τιµή αυτών. Αποδεικνύεται ότι E( S σ,δηλαδή η διακύµανση του δείγµατος s είναι µια τιµή της τυχαίας µεταβλητής S που έχει µέση τιµή E( S τη διακύµανση σ του πληθυσµού. 3.3. ιάστηµα εµπιστοσύνης της παραµέτρου Θ ενός πληθυσµού. Επειδή η δειγµατική σηµειακή εκτιµήτρια Θ της πραγµατικής τιµής Θ του πληθυσµού δεν µας δίνει πληροφορίες περί του βαθµού ακρίβειάς της, δηλαδή πόσο 7

κοντά στην τιµή Θ βρίσκεται, καταφεύγουµε στο να υπολογίσουµε ένα διάστηµα που µε κάποια προκαθορισµένη πιθανότητα θα περιέχει την άγνωστη τιµή του πληθυσµού. Το διάστηµα αυτό το ονοµάζουµε «διάστηµα εµπιστοσύνης» της τιµής Θ. Το διάστηµα αυτό (β, γ είναι το διάστηµα στο οποίο εκτιµούµε ότι θα βρίσκεται η τιµή Θ του πληθυσµού µε ορισµένη πιθανότητα ή επίπεδο εµπιστοσύνης -α. P ( β Θ γ α µε α. Τα β, γ ονοµάζονται όρια εµπιστοσύνης και η πιθανότητα α καλείται επίπεδο σηµαντικότητας. 3.4. Εκτίµηση διαστήµατος εµπιστοσύνης της µέσης τιµής µ πληθυσµού. i. Κανονικός πληθυσµός (γνωστή η διακύµανση σ. Είναι δεκτό ότι εφόσον ο πληθυσµός που αντιστοιχεί στην τυχαία µεταβλητή Χ είναι κανονικής κατανοµής τότε και η δειγµατική εκτιµήτρια x είναι κανονικής κατανοµής. ηλαδή ισχύει ότι η τυχαία µεταβλητή X, που παίρνει τιµές τις x, ακολουθεί την σ κανονική κατανοµή N( µ,. Εποµένως η τυχαία µεταβλητή κανονική κατανοµή. X µ σ / µε τιµές x µ σ / ακολουθεί µια τυπική X µ Η πιθανότητα η τιµή να βρίσκεται µέσα σ ένα δοσµένο διάστηµα για σ / παράδειγµα το +,96 δίδεται από τη σχέση: x µ P,96,96 φ(,96 φ(,96,95. σ / Από την σχέση αυτή αν είναι γνωστή η σ µπορούµε να πούµε ότι: x,96σ / µ x+.96σ /, δηλαδή η µέση τιµή µ του πληθυσµού µε τιµή x. πιθανότητα 95% βρίσκεται σε απόσταση ±,96σ / από την δειγµατική µέση 8

Παρατήρηση: Μια άλλη ερµηνεία της σχέσεως αυτής είναι ότι «αν χρησιµοποιηθούν διάφορα δείγµατα µεγέθους για τον προσδιορισµό «διαστηµάτων πιθανότητας 95%» τότε κατά µέσο όρο το 95% από τα διαστήµατα αυτά θα περιέχουν την αληθινή τιµή µ.. Σύµφωνα µε τα ανωτέρω αν συµβολίσουµε µε -α το προκαθορισµένο «επίπεδο εµπιστοσύνης» και µε + z α / τις τιµές της τυπικής κανονικής µεταβλητής µε αντίστοιχες τιµές της Αθροιστικής Συνάρτησης κατανοµής α/ και -α/, όπως φαίνεται στο παρακάτω σχήµα: f(x πυκνότητα Εµβαδόν Εµβαδόν Εµβαδόν α/ -α α/ - z α/ z α/ x µ /( σ / Τότε έχουµε την πιθανότητα: P z α / x µ z σ / α / α. σ σ ή P x zα / µ x + zα / α. Μπορούµε να πούµε ότι υπάρχει εµπιστοσύνη επιπέδου -α ότι το διάστηµα που εκτιµήθηκε περιέχει την άγνωστη τιµή της µ. Το διάστηµα αυτό ονοµάζεται «διάστηµα εµπιστοσύνης της µ σε επίπεδο -α» και δίδεται από τη σχέση: σ σ (Ι < µ > α ( x zα /,( x + zα /, µε σ γνωστή. Παρατήρηση: 9

Η ανωτέρω σχέση ισχύει για κανονικές τυχαίες µεταβλητές που γνωρίζουµε τη σ. Για µη κανονικούς πληθυσµούς ισχύει προσεγγιστικά και ο βαθµός προσέγγισης αυξάνει όσο µεγαλώνει το µέγεθος του δείγµατος. Σχόλιο Η διαδικασία προσδιορισµού διαστηµάτων εµπιστοσύνης της µ, όταν η σ είναι γνωστή ακολουθεί τα εξής βήµατα: ο : Επιλέγουµε το επίπεδο εµπιστοσύνης -α. ο : Υπολογίζουµε την τιµή z α/ από τον πίνακα της τυπικής κανονικής κατανοµής. z α α φ. 3 ο : Χρησιµοποιούµε τη σχέση (Ι θέτοντας στη θέση του x τη δειγµατική µέση τιµή των - παρατηρήσεων. Παραδείγµατα.. Η ηµερήσια συγκέντρωση διαλυµένου οξυγόνου σ ένα σταθµό µέτρησης ενός ποταµού έχει µετρηθεί για 3 ηµέρες. Από προηγούµενες εµπειρίες είναι γνωστό ότι η διασπορά της ηµερήσιας συγκέντρωσης είναι 4, (mg/l. Για τις 3 µετρήσεις η µέση δειγµατική τιµή x,5mg / l. Να υπολογισθεί το διάστηµα εµπιστοσύνης επιπέδου 99% για τη µέση ηµερήσια συγκέντρωση διαλυµένου οξυγόνου. Θεωρούµε ότι ο πληθυσµός των µετρήσεων της ηµερήσιας συγκέντρωσης διαλυµένου οξυγόνου κατανέµεται κανονικά. α,99 α,5 z φ (,995,5,58 σ z α 4,,58,965. 3 < µ >.99 ( x,965, x +,965 (,56, 3,49 mg / l. Αυτό είναι το διάστηµα εµπιστοσύνης της µ σε επίπεδο 99%.

. Σε ένα δείγµα κουτιών παστεριωµένου γάλακτος που παράγει µια βιοµηχανία γάλακτος το µέσο βάρος των κουτιών είναι 5 γραµµάρια. Από προηγούµενες µετρήσεις είναι γνωστή η διακύµανση που παρατηρείται και ίση, µε 6 γραµµάρια. Να προσδιοριστεί το διάστηµα εµπιστοσύνης στο οποίο θα βρίσκεται το µέσο βάρος του συνόλου των κουτιών γάλακτος που παράγονται µε πιθανότητα 99,6%. Θεωρούµε ότι ο πληθυσµός των βαρών των κουτιών κατανέµεται κανονικά. Έχουµε α,996 α,. Άρα, α z α z φ φ (,998,88. Επίσης σ 6 zα,88 7,5. Το διάστηµα εµπιστοσύνης: < > x z σ µ α α, x + zα σ ( x 7,5, + 7,5 (5 7,5,5 + 7,5 < µ >.996 x ( 4,95, 57,5 < µ >.996 γραµµάρια. Το διάστηµα εµπιστοσύνης της µ µε πιθανότητα ή επίπεδο εµπιστοσύνης 99,6%. Αν ο πληθυσµός της ηµερήσιας συγκέντρωσης είναι κανονικός τότε το παραπάνω διάστηµα είναι ακριβές αν όχι τότε το δεχόµαστε προσεγγιστικά. ii. είγµα µεγάλο άγνωστή η διακύµανση σ. Όταν το δείγµα είναι µεγάλο σύµφωνα µε το κεντρικό οριακό θεώρηµα η X µ x µ τυχαία µεταβλητή µε τιµές ακολουθεί µια τυπική κανονική κατανοµή. σ / σ / Συνεπώς το «διάστηµα εµπιστοσύνης της µ σε επίπεδο -α» δίδεται επίσης από τη σχέση:

σ σ (Ι < µ > α ( x zα /,( x + zα /, εφόσον η διακύµανση σ είναι άγνωστη αντικαθίσταται από την s οπότε καταλήγουµε στη σχέση: s s < µ > α ( x zα /,( x + zα / Παράδειγµα: Η ηµερήσια συγκέντρωση διαλυµένου οξυγόνου σ ένα σταθµό µέτρησης ενός ποταµού έχει µετρηθεί για 9 ηµέρες και είχαµε x,5 mg/l και s 4, (mg/l (άγνωστη η σ. Να υπολογισθεί το διάστηµα εµπιστοσύνης επιπέδου 99% για τη µέση ηµερήσια συγκέντρωση διαλυµένου οξυγόνου. Το διάστηµα εµπιστοσύνης για τη µέση ηµερήσια συγκέντρωση διαλυµένου οξυγόνου είναι: -α,99 α/,5. ν 9-8. Άρα t v t, 763 (παράρτηµα. Οπότε:,,5, 8 < µ >.99,5,763 (,47, 3,57 mg / l. 4,,,5 +,763 9 4, 9 ii. είγµα µικρό άγνωστή η διακύµανση σ. Για µικρό πολύ π.χ. < τα διαστήµατα εµπιστοσύνης της µ από την (Ι µε s στη θέση του σ είναι αρκετά ανακριβή (όταν δεν είναι γνωστή η διασπορά σ. Όταν η κατανοµή του πληθυσµού της Χ είναι κανονική τότε και αν ακόµα ή σ δεν είναι γνωστή µπορούν να προσδιοριστούν ακριβή διαστήµατα εµπιστοσύνης για τη x µ µ. Έχει αποδειχθεί ότι η τυχαία µεταβλητή T µε τιµ ές έχει κατανοµή t µε - s βαθµούς ελευθερίας και µε συνάρτηση πυκνότητας f(t.

f(t N(, 6 x µ T τ.µ. µε τιµ ές s X: κανονική µεταβλητή t x µ s Η κατανοµή t είναι συµµετρική ως προς το µηδέν και έχει σχήµα παρόµοιο της κανονικής κατανοµής, όταν το µεγαλώνει (ν - βαθµοί ελευθερίας τότε η κατανοµή t προσεγγίζει την κανονική κατανοµή. Έχουµε λοιπόν: x µ P tα /, v tα /, v α. s Το t είναι η τιµή της τυχαίας µεταβλητής Τ που αντιστοιχεί σε τιµή της α, v Αθροιστικής συνάρτησης κατανοµής ίση µε -α/, για v - βαθµούς ελευθερίας. Οι τιµές του t α/,v δίδονται από πίνακα (παράρτηµα. f(t Η πιθανότητα s s P x tα /, v µ x + tα /, v α. α/ εµβαδού α/ -α t α /,v t α /, v 3

µας οδηγεί στη σχέση όπου s s < µ > α ( x tα /, v,( x + tα /, v x: δειγµατική µέση τιµή s: δειγµατική τυπική απόκλιση. Αυτό είναι το διάστηµα εµπιστοσύνης της µ, µε άγνωστη τη σ, σε επίπεδο -α. Παρατήρηση: Όταν ο αριθµός των βαθµών ελευθερίας είναι πολύ µεγάλος τότε t v διότι η κατανοµή t τείνει τότε στην τυπική κανονική κατανοµή. z α, α Παράδειγµα: Σε ένα δείγµα κουτιών παστεριωµένου γάλακτος που παράγει µια βιοµηχανία γάλακτος το µέσο βάρος των κουτιών είναι 5 γραµµάρια και η δειγµατική διακύµανση s 56,5. Να προσδιοριστεί το διάστηµα εµπιστοσύνης στο οποίο θα βρίσκεται το µέσο βάρος του συνόλου των κουτιών γάλακτος που παράγονται µε πιθανότητα 99,6%. Γνωρίζουµε ότι: s s < µ > α ( x tα /, v, x + tα /, v α α,998, v 9 t α, v t,,9 3,883. (παράρτηµα. t α, v s 3,883 7,5 6,5. Άρα < µ > ( 5 6,5, 5 + 6,5 kgr,998 < µ >,998 ( 43,488, 56,5 kgr, το διάστηµα εµπιστοσύνης. 4

Μονόπλευρα όρια εµπιστοσύνης για τη µέση τιµή µ. i. Η διακύµανση σ γνωστή: Χρησιµοποιείται η τ.µ. µε τιµές κατανοµής. x µ κανονικής σ σ < µ > α x zα zα φ ( α. Αυτό δηλώνει ότι η µέση τιµή του πληθυσµού θα είναι µεγαλύτερη από το όριο αυτό µε πιθανότητα -α. * Αυτό προκύπτει από το ότι πρέπει η: x µ σ P zα α., άρα P µ x zα α. σ µε z φ ( α. α Ανώτατο όριο εµπιστοσύνης της µ επιπέδου -α. ( σ > α x zα, z φ ( α. v µ α i Η διακύµανση σ άγνωστη (µικρό δείγµα: χρησιµοποιείται η t - κατανοµή για τον προσδιορισµό ανώτατου και κατώτατου ορίου εµπιστοσύνης. Κατώτατο όριο εµπιστοσύνης της µ, επιπέδου -α. s < µ α x tα, v, tα, v από πίνακα. Ανώτατο όριο εµπιστοσύνης της µ, επιπέδου -α. s > από πίνακα ( µ α x tα, v, tα, v 5

Παράδειγµα. Τα εργαστηριακά αποτελέσµατα δοκιµίων χάλυβα Α36 που διαλέχτηκαν τυχαία δείχνουν για την τάση ροής µια µέση τιµή x kp / cm και µια τυπική απόκλιση kp / cm. Να προσδιορισθεί το κατώτατο όριο εµπιστοσύνης της µέσης τιµής µ της τάσης ροής του χάλυβα αυτού σε επίπεδο 95%. Λόγω µεγάλου µεγέθους σ ~ s. α,95 α,5 z φ (,5 φ (,95,65.,5 παράρτηµα οπότε κατώτατο όριο: σ > α x z,65 64 kgr. < µ α Γενική παρατήρηση: Οι αποφάσεις ή εκτιµήσεις στη Στατιστική έχουν στοχαστικό χαρακτήρα. εν αποτελούν αποδείξεις. Έτσι εκτιµούµε ότι ο µέσος ενός πληθυσµού < µ > α ( α, β. ηλαδή ότι ο µέσος µ βρίσκεται στο διάστηµα ( α, β δίνοντας συγχρόνως την πιθανότητα σφάλµατος αυτής της εκτίµησης. Έτσι λέµε ότι σε επίπεδο εµπιστοσύνης 95% -α η µέση τιµή (µ του πληθυσµού ανήκει στο διάστηµα: (,36,,8. 3.5. Εκτίµηση διαστήµατος εµπιστοσύνης της διαφοράς των µέσων τιµών δύο πληθυσµών. Θεωρώ την διαφορά των µέσων τιµών δύο δειγµάτων x x από δύο πληθυσµούς. Η διαφορά αυτή είναι µια τυχαία µεταβλητή:. Αν πάρουµε δύο δείγµατα ανεξάρτητα µεγάλα µεγέθους ν και κ µε µέσες τιµές και, διακυµάνσεις s y, s και οι πληθυσµιακές διακυµάνσεις είναι γνωστές σ, σ αντίστοιχα, τότε έχουµε ότι η µεταβλητή: x 6

X Y ( µ µ σ σ + ν κ ακολουθεί Ν(,. Τότε ένα (-α% διάστηµα εµπιστοσύνης για την διαφορά µ - µ των δύο πληθυσµών όταν οι διακυµάνσεις τους είναι γνωστές είναι: x - y - Ζ σ σ + µ - µ x - y + Ζ ν κ σ ν + σ κ Εάν οι πληθυσµιακές διακυµάνσεις είναι άγνωστες αντικαθίστανται από τις δειγµατικές διακυµάνσεις s, s και έχουµε ότι η µεταβλητή: X Y ( µ µ s s + ν κ ακολουθεί Ν(,. Τότε ένα (-α% διάστηµα εµπιστοσύνης για την διαφορά µ - µ των δύο πληθυσµών όταν οι διακυµάνσεις τους είναι άγνωστες είναι: x - y - Ζ s s + µ - µ x - y + Ζ ν κ s s + ν κ. Αν πάρουµε δύο δείγµατα µικρά ανεξάρτητα µεγέθους ν και κ µε µέσες τιµές και y και διακυµάνσεις s, s αντίστοιχα προερχόµενα από κανονικούς πληθυσµούς µε άγνωστες αλλά ίσες διακυµάνσεις σ σ σ έχουµε ότι η µεταβλητή: x X Y ( µ µ ( ν s + ( κ s ν + κ + ν κ ακολουθεί t-κατανοµή µε ν+κ- βαθµούς ελευθερίας Τότε ένα (-α% διάστηµα εµπιστοσύνης για την διαφορά µ - µ των δύο πληθυσµών όταν οι διακυµάνσεις τους είναι άγνωστες αλλά ίσες είναι: 7

x - - t y ; α κ ν + s κ ν + µ - µ - + t x y ; α κ ν + s κ ν + όπου s ( ( + + κ ν κ ν s s 3. Αν πάρουµε δύο δείγµατα µικρά ανεξάρτητα µεγέθους ν και κ µε µέσες τιµές και και διακυµάνσεις s, s αντίστοιχα προερχόµενα από κανονικούς πληθυσµούς µε άγνωστες και διαφορετικές διακυµάνσεις σ x y σ έχουµε ότι η µεταβλητή: κ ν µ µ ( s s Y X + ακολουθεί t κατανοµή µε βαθµούς ελευθερίας λ (ν- όταν ν κ και λ ( ( ( + + κ κ ν ν κ ν s s s s (στρογγυλεµένο στον πλησιέστερο ακέραιο όταν ν κ Ένα (-α% διάστηµα εµπιστοσύνης για την διαφορά µ - µ των δύο πληθυσµών όταν οι διακυµάνσεις τους είναι άγνωστες και διαφορετικές σ σ είναι: x - - t y ; α λ ν ν s s + µ - µ - + t x y ; α λ ν ν s s + για ν κ ή 8

x - y - t λ; α s s + µ - µ x - y + t ν κ λ; α s s + για ν κ ν κ Παραδείγµατα:. ύο εργοστάσια κατασκευάζουν το ίδιο εξάρτηµα για µια µηχανή. Παίρνουµε ένα δείγµα 3 εξαρτηµάτων από το πρώτο εργοστάσιο και διαπιστώνουµε ότι το µέσο βάρος τους είναι 7 kgr και έχουν δειγµατική διακύµανση 4 kgr. Λαµβάνουµε επίσης ένα δείγµα 4 εξαρτηµάτων από το δεύτερο εργοστάσιο και βρίσκουµε ότι έχει µέσο βάρος 7 kgr µε δειγµατική διακύµανση 45 kgr. Να βρεθεί το διάστηµα εµπιστοσύνης της διαφοράς µ - µ των πραγµατικών µέσων των πληθυσµών µε πιθανότητα 99%. Ποιου εργοστασίου το εξάρτηµα είναι βαρύτερο κατά µέσο όρο; Έχουµε x 7 x 7 s 4, s 45 3, 4. α,99, α,5 α α z φ φ (,995,58. s x x s s + 4 3 + 45 4 4,5833 s x x 4,958 x x,58 4,958 < µ µ < +,58 4,958 3,79 < µ µ < 7, ή 3,79 > µ µ > 7,. Το εξάρτηµα του δεύτερου εργοστασίου είναι βαρύτερο κατά µέσο όρο. 9

. Αν στο πιο πάνω παράδειγµα γνωρίζουµε ότι ύστερα από µετρήσεις οι διακυµάνσεις των πληθυσµών είναι σ 4καισ 48 τότε το διάστηµα εµπιστοσύνης της διαφοράς µ -µ, µε πιθανότητα 99%, θα είναι: z α,58 σ σ 4 48 σ x + + 6 x σ x 5, 99 x 3 4,58 5,99 < µ µ < +,58 5,99 33,6 < µ µ < 6,84 33,6 > µ µ > 6,84. 3. Παίρνουµε ένα δείγµα κονσερβών από ένα εργοστάσιο κονσερβοποιίας και διαπιστώνουµε ότι το µέσο βάρος είναι 7 γρ. µε διακύµανση 4 γρ. Λαµβάνουµε επίσης ένα δεύτερο δείγµα 8 κονσερβών από ένα δεύτερο εργοστάσιο κονσερβοποιίας και διαπιστώνουµε ότι το µέσο βάρος είναι 7 γρ. µε διακύµανση 45 γρ. Να βρεθεί το διάστηµα εµπιστοσύνης της διαφοράς µ -µ των πραγµατικών µέσων βαρών των κονσερβών που παράγονται στα δύο εργοστάσια µε πιθανότητα 99%. Θεωρούµε ότι οι πληθυσµοί των βαρών των κονσερβών των δύο εργοστασίων είναι κανονικοί και ότι οι διακυµάνσεις των βαρών των κονσερβών στα δύο εργοστάσια είναι άγνωστες αλλά ίσες. Ένα (-α% διάστηµα εµπιστοσύνης για την διαφορά µ - µ των δύο πληθυσµών όταν οι διακυµάνσεις τους είναι άγνωστες αλλά ίσες είναι: x - y - t ν + κ ; α s + µ - µ x - y + t ν κ ν + κ ; α s + ν κ όπου s ( ν s + ( κ s ν + κ Έχουµε x 7, y 7 s 4, s 45,, 8., + - 6, α α,99,,,5 και t,779 ν + κ α ; 3

s ( 4 + (8 45 6,6 s +,6 *,39 8,54 ν κ x x,779 8,54 < µ µ < +,779 8,54 43,73 < µ µ < 4. Παίρνουµε ένα δείγµα κονσερβών από ένα εργοστάσιο κονσερβοποιίας και διαπιστώνουµε ότι το µέσο βάρος είναι 7 γρ. µε διακύµανση 4 γρ. Λαµβάνουµε επίσης ένα δεύτερο δείγµα κονσερβών από ένα δεύτερο εργοστάσιο κονσερβοποιίας και διαπιστώνουµε ότι το µέσο βάρος είναι 7 γρ. µε διακύµανση 45 γρ. Να βρεθεί το διάστηµα εµπιστοσύνης της διαφοράς µ -µ των πραγµατικών µέσων βαρών των κονσερβών που παράγονται στα δύο εργοστάσια µε πιθανότητα 99%. Θεωρούµε ότι οι πληθυσµοί των βαρών των κονσερβών των δύο εργοστασίων είναι κανονικοί και ότι οι διακυµάνσεις των βαρών των κονσερβών στα δύο εργοστάσια είναι άγνωστες και διαφορετικές. Ένα (-α% διάστηµα εµπιστοσύνης για την διαφορά µ - µ των δύο πληθυσµών 3,73 όταν οι διακυµάνσεις τους είναι άγνωστες και διαφορετικές σ σ είναι: x - y - t λ; α s s + µ - µ x - y + t ν ν λ; α s s + για ν κ ν ν Έχουµε x 7, y 7 s 4, s 45,,, α α,99,,,5, λ (- 8 και t,878 λ; α 3

4 45 + 9,,878 9, < µ µ < +,878 9, ή - 46,54 < µ - µ < 6,54 5. Παίρνουµε ένα δείγµα κονσερβών από ένα εργοστάσιο κονσερβοποιίας και διαπιστώνουµε ότι το µέσο βάρος είναι 7 γρ. µε διακύµανση 4 γρ. Λαµβάνουµε επίσης ένα δεύτερο δείγµα 6 κονσερβών από ένα δεύτερο εργοστάσιο κονσερβοποιίας και διαπιστώνουµε ότι το µέσο βάρος είναι 7 γρ. µε διακύµανση 45 γρ. Να βρεθεί το διάστηµα εµπιστοσύνης της διαφοράς µ -µ των πραγµατικών µέσων βαρών των κονσερβών που παράγονται στα δύο εργοστάσια µε πιθανότητα 99%. Θεωρούµε ότι οι πληθυσµοί των βαρών των κονσερβών των δύο εργοστασίων είναι κανονικοί και ότι οι διακυµάνσεις των βαρών των κονσερβών στα δύο εργοστάσια είναι άγνωστες και διαφορετικές. Ένα (-α% διάστηµα εµπιστοσύνης για την διαφορά µ - µ των δύο πληθυσµών όταν οι διακυµάνσεις τους είναι άγνωστες και διαφορετικές σ σ είναι: x - y - t λ; α s s + µ - µ x - y + t ν ν λ; α s s + για ν κ ν ν Έχουµε x 7, y 7 s 4, s 45,, 6 α α,99,,,5, λ 4 45 ( + 6 4 45 ( ( + 6 6 3

και t,845 λ; α 4 45 + 9,,845 9, < µ µ < +,845 9, ή - 46,3 < µ - µ < 6,3 4. Για δείγµατα µικρά εξαρτηµένα (ζευγαρωτές παρατηρήσεις που προέρχονται από µετρήσεις της ίδιας οµάδας σε δυο διαφορετικές χρονικές στιγµές (ζευγαρωτές παρατηρήσεις ορίσουµε x i και y i, i,,., τις παρατηρήσεις στα δύο δείγµατα και δηµιουργούµε τις αντίστοιχες διαφορές z i x i - y i, i,,., που τις θεωρούµε διαφορετικές. Ο πληθυσµός από όπου πήραµε τα ζεύγη θεωρείται κανονικός. Οι παρατηρήσεις z i ακολουθούν την t κατανοµή µε - βαθµούς ελευθερίας. Z s Z που ακολουθεί t κατανοµή µε - βαθµούς ελευθερίας Ένα (-α% διάστηµα εµπιστοσύνης πληθυσµών είναι: για τη διαφορά µ -µ µ των δύο Z Z - t ; s z µ - µ µ Z Z - t ; s z Όταν το δείγµα είναι µικρό τότε έχουµε : t Ζ Παράδειγµα: Έχουµε τις παρακάτω ζευγαρωτές παρατηρήσεις: ; Χ: 4 5 6 4, 5, 5,3 6,4 4,8 5,3 5 33

Y: 4,9 4,8 5,7 5 6 5. 6,5 5,9 4,8 5,7 Να βρεθεί ένα 9% διάστηµα εµπιστοσύνης για την πραγµατική διαφορά µ - µ. Έχουµε Ζ: -,9,,3 -,8 -,8, -, -,,5 -,7 Και Z -,33, S Z,7, t 9;, 5,833 Εποµένως ένα 9% διάστηµα εµπιστοσύνης για την πραγµατική διαφορά µ - µ είναι: Z - t 9 ;,5 S Z / µ - µ µ Z Z + t 9,5 S / ; Z ή -,33 -,833 x,7/ 3,6 µ - µ µ Z -,33 +,833 x,7/ 3,6 ή -,75 µ - µ µ Z,9 3.6. Εκτίµηση διαστήµατος εµπιστοσύνης για την διακύµανση του πληθυσµού Στην θεωρία διατυπώθηκε ότι η ποσότητα: X ( s σ ακολουθεί την X κατανοµή µε - βαθµούς. Ο πληθυσµός από όπου πάρθηκε το δείγµα θεωρείται κανονικός µε σ και s η δειγµατική διακύµανση. Ένα (-α% διάστηµα εµπιστοσύνης για την διακύµανση σ του πληθυσµού είναι: ( s X ; ( s σ X ; 34

Παράδειγµα: Ένα δείγµα από 5 αγρότες παρουσιάζει διακύµανση των ετήσιων εισοδηµάτων τους s 56 ευρώ. Να βρεθεί ένα 95% διάστηµα εµπιστοσύνης για την διακύµανση σ των ετήσιων εισοδηµάτων του πληθυσµού των αγροτών. Έχουµε ότι: ( s X ; ( s σ X ή ; ( 556 7,4 [Χ 5 7,4, Χ 3,36] ;,5 5;,975 σ ή ( 556 3,36 9, σ 4,4 3.7. Εκτίµηση διαστήµατος εµπιστοσύνης για τον λόγο των διακυµάνσεων δύο πληθυσµών Σύµφωνα µε την θεωρία αν πάρουµε δύο δείγµατα ανεξάρτητα µεγέθους και m αντίστοιχα µε s, s τις δειγµατικές διακυµάνσεις από δύο κανονικούς πληθυσµούς αντίστοιχα µε σ, σ τις πληθυσµιακές διακυµάνσεις τότε ισχύει ότι η ποσότητα: s s σ σ ακολουθεί την F κατανοµή µε - και m- βαθµούς ελευθερίας Οι πληθυσµοί είναι κανονικοί. Ένα (-α% διάστηµα εµπιστοσύνης για τον λόγο των διακυµάνσεων σ,σ των δύο πληθυσµών είναι: 35

s s F, m; σ σ s s F m, ; Παράδειγµα: Πήραµε δύο δείγµατα αγροτών από δύο διοικητικές περιφέρειες της Ελλάδας και εξετάσαµε τα ετήσια εισοδήµατά τους. Είχαµε τα ακόλουθα δεδοµένα: 3, S ευρώ και m 4, S ευρώ Να βρεθεί ένα 98% διάστηµα εµπιστοσύνης για τον λόγο των πραγµατικών διακυµάνσεων σ, σ των ετήσιων εισοδηµάτων των αγροτικών πληθυσµών στις δύο διοικητικές περιφέρειες της Ελλάδας. Έχουµε ότι: s s F, m; σ σ s s F m, ; F 3, F,3, 4;, 4,3;,, σ σ ή,3 σ,4 σ,9 3.8. Εκτίµηση διαστήµατος εµπιστοσύνης αναλογίας σε πληθυσµό. Αν εκτιµήσουµε το ποσοστό (αναλογία p x των στοιχείων στο µεγάλο δείγµα µεγέθους που έχουν κάποιο συγκεκριµένο χαρακτηριστικό, τότε σύµφωνα µε την θεωρία το δειγµατικό ποσοστό κατανέµεται κανονικά: ηλαδή η δειγµατική µεταβλητή P, που παράγεται από τις τιµές p, ακολουθεί την κανονική κατανοµή: 36

Ν(P, πληθ p πληθ ( Pπληθ Όπου P πληθ το πραγµατικό ποσοστό στον πληθυσµό. Συνεπώς έχουµε ότι η µεταβλητή: Συνεπώς έχουµε ότι η µεταβλητή: P P P P πληθ ( πληθ πληθ ακολουθεί την Ν(,. Ένα (-α% διάστηµα εµπιστοσύνης για το ποσοστό (αναλογία του πληθυσµού είναι: ρ z α ρ ( ρ P πληθ ρ + z α ρ ( ρ Παράδειγµα: Ο αριθµός των ελαττωµατικών προϊόντων µιας µεταποιητικής βιοµηχανίας αγροτικών προϊόντων που εντοπίσθηκαν σ ένα δείγµα 3 προϊόντων είναι 4 προϊόντα. Να βρεθούν τα όρια µέσα στα οποία θα βρίσκεται το πραγµατικό ποσοστό Π των ελαττωµατικών προϊόντων της συνολικής παραγωγής µε πιθανότητα 98%. Έχουµε 3, m 4 4 ρ 8%,8. 3 Οπότε q,9. α,98, α, z α φ φ (,99,33. ρ q Sρ ρ z,8,9,57 3 Sρ < Ρ < ρ + z Sρ 37

,8,57,33 < P <,8 +,57,33,434 < P <,65 4,34% < P <,6%. 3.9. Εκτίµηση διαστήµατος εµπιστοσύνης για τη διαφορά των αναλογιών στοιχείων δύο πληθυσµών. x y Έστω ρ και ρ είναι οι δειγµατικές αναλογίες των στοιχείων, που l έχουν κάποιο συγκεκριµένο χαρακτηριστικό, δύο µεγάλων δειγµάτων µεγέθους, l από δύο πληθυσµούς, όπου οι πραγµατικές αναλογίες είναι αντίστοιχα P πληθ, P πληθ. Τότε έχουµε ότι οι διαφορές των δειγµατικών µεταβλητών P - P ακολουθούν κανονική κατανοµή: Ν(P πληθ - P πληθ, P πληθ ( P πληθ P πληθ ( P πληθ + l Ένα (-α% διάστηµα εµπιστοσύνης για τη διαφορά των ποσοστών (αναλογιών των δύο πληθυσµών P πληθ, P πληθ είναι: ρ - ρ - Ζ ρ ( ρ P - P ρ - ρ + Ζ πληθ πληθ Παράδειγµα: ρ ( ρ + l ρ ( ρ ρ ( ρ + l Παίρνουµε δύο µεγάλα δείγµατα µιας ποικιλίας ενός φυτού από δύο διαφορετικούς πληθυσµούς και εξετάζουµε πόσα από αυτά ασθένησαν µέσα σε ένα συγκεκριµένο χρονικό διάστηµα. Τα δεδοµένα που προέκυψαν ήταν: Από τα του πρώτου δείγµατος ασθένησαν τα και από τα m3 του δεύτερου δείγµατος ασθένησαν τα 8. Να βρεθεί ένα 95% διάστηµα εµπιστοσύνης για τη διαφορά των πραγµατικών ποσοστών (αναλογιών των ασθενούντων φυτών των δύο πληθυσµών P πληθ, P πληθ. Έχουµε ότι: p - p - Ζ ρ ( ρ ρ ( ρ + l 38

P - P p -p + Ζ πληθ πληθ ρ ( ρ ρ ( ρ + l ρ /,, ρ 8/3,4 Έχουµε: ρ - ρ -,4 Ζ,96,5,x,9,4x,86 +,4 3 Άρα ένα 95% διάστηµα εµπιστοσύνης για τη διαφορά των πραγµατικών ποσοστών (αναλογιών των ασθενούντων φυτών των δύο πληθυσµών P πληθ, P πληθ είναι: -,4,96 x,4 P - P πληθ πληθ -,4 +,96 x,4 ή -,8 P - P πληθ πληθ,38 39

Κεφάλαιο 4 ο Έλεγχοι υποθέσεων 4.. Γενικά Εκτός του προσδιορισµού του διαστήµατος εµπιστοσύνης µιας αγνώστου παραµέτρου Θ του πληθυσµού πολλές φορές απαιτείται να κάνουµε υποθέσεις για την τιµή που µπορεί να πάρει η Θ, τις οποίες και ελέγχουµε. Σηµαντικό ρόλο στον έλεγχο της υπόθεσης που κάνουµε για την άγνωστη παράµετρο Θ του πληθυσµού παίζει η εκτιµήτρια θ και το στατιστικό του ελέγχου από το δείγµα. Καταρχήν η υπόθεση που διατυπώνουµε για την άγνωστη παράµετρο Θ του πληθυσµού καλείται Η και είναι ης µορφής: Η : Θ θ * όπου θ * είναι µια συγκεκριµένη τιµή που υποθέτουµε ότι µπορεί να ην πάρει η Θ. Η υπόθεση αυτή ελέγχεται αν ισχύει η όχι και καλείται µηδενική υπόθεση. Οι εναλλακτικές υποθέσεις είναι τις µορφής Η : Θ θ *, Η : Θ > θ *, Η : Θ < θ * Έτσι διαµορφώνονται οι ακόλουθες υποθέσεις προς έλεγχο: * Η : Θ θ Η : Θ θ * έχουµε τότε δίπλευρο έλεγχο. * Η : Θ θ * Η : Θ > θ έχουµε τότε µονόπλευρο έλεγχο (δεξιά * Η : Θ θ * Η : Θ < θ έχουµε τότε µονόπλευρο έλεγχο (αριστερά Για τον έλεγχο υπολογίζεται η απορριπτική περιοχή R της Η,δηλαδή η περιοχή στα σηµεία τη οποίας η Η απορρίπτεται. Αυτή προσδιορίζεται από την κατανοµή που ακολουθεί το στατιστικό του ελέγχου και το σφάλµα α που λαµβάνεται υπόψη. Συνεπώς τα στοιχεία ενός ελέγχου µηδενικής υπόθεσης είναι τα ακόλουθα: 4

. Ορισµός της µηδενικής υπόθεσης. Ορισµός της εναλλακτικής υπόθεσης 3. Ορισµός του στατιστικού του ελέγχου από το δείγµα 4. Ορισµός της απορριπτικής περιοχής R της Η 5. Εξαγωγή συµπερασµάτων. 4.. Σφάλµατα στάθµη σηµαντικότητας περιοχή απόρριψης της Η Το α είναι η πιθανότητα να απορρίψουµε την Η α Ρ(απόρριψη της Η / Η σωστή Το α καλείται και σφάλµα τύπου Ι. Το β είναι η πιθανότητα να δεχτούµε την Η ενώ είναι σωστή: ενώ είναι λάθος: β Ρ(αποδοχή της Η / Η λάθος Το β καλείται και σφάλµα τύπου ΙΙ. Το γ β και εκφράζει την πιθανότητα απόρριψης της Η όταν η Η είναι πράγµατι λάθος. Το γ καλείται και ισχύς του στατιστικού του ελέγχου. Η απορριπτική περιοχή της R της Η ορίζεται βάσει του σφάλµατος α που καλείται στάθµη σηµαντικότητας ή επίπεδο σηµαντικότητας (σ.σ. Συγκεκριµένα επίπεδο σηµαντικότητας α ενός ελέγχου µηδενικής υπόθεσης Η ονοµάζουµε την πιθανότητα να παρατηρηθεί µια τιµή του στατιστικού του ελέγχου µεγαλύτερη από αυτή που έδωσε το δείγµα. ηλαδή η πιθανότητα Ρ(Υ> y / Η σωστή, όπου Υ η τ.µ που αντιστοιχεί στο στατιστικό και y η τιµή του στατιστικού από το συγκεκριµένο δείγµα. Η πιθανότητα αυτή αναφέρεται σε µονόπλευρους ελέγχους ενώ σε δίπλευρους ελέγχους η πιθανότητα διπλασιάζεται. Η υπόθεση Η απορρίπτεται εάν η παρατηρούµενη πιθανότητα α Ρ(απόρριψη της Η / Η σωστή είναι µικρότερη µιας ορισµένης στάθµης σηµαντικότητας που επιλέγεται από αυτόν που βγάζει τα στατιστικά συµπεράσµατα. Πως ορίζεται το στατιστικό και η απορριπτική περιοχή R; Εάν η εκτιµήτρια θ ακολουθεί κανονική κατανοµή ή προσεγγιστικά κανονική κατανοµή τότε βάσει της θεωρίας η µεταβλητή: * θ θ τ ακολουθεί τυπική κανονική κατανοµή. Όπου τ το τυπικό σφάλµα (τυπική απόκλιση της κατανοµής της εκτιµήτριας θ. 4

* θ θ Η υπόθεση Η απορρίπτεται όταν > Ζ α µε α το επίπεδο σηµαντικότητας του τ ελέγχου. Γενικά όταν το δείγµα προέρχεται από κανονικό πληθυσµό µε την προϋπόθεση ότι * θ θ ισχύει η Η η ποσότητα ακολουθεί γνωστή κατανοµή και η περιοχή απόρριψης τ της Η είναι εκεί όπου: * θ θ τ > Φ, α * θ θ τ < - Φ ή α * θ θ τ > Φ α όταν οι εναλλακτικές υποθέσεις είναι αντίστοιχα: * * Η : Θ > θ, Η : Θ < θ ή Η : Θ * θ Οι Φ, Φ α α είναι τιµές της κατανοµής που ακολουθεί η ποσότητα * θ θ τ * θ θ ώστε Ρ( τ >Φ α, Ρ( α * θ θ τ * θ θ <-Φ α α και Ρ( τ >Φ α α 4.3. Έλεγχοι υποθέσεων 4.3.. Έλεγχος υπόθεσης για τη µέση τιµή του πληθυσµού Ι. Έλεγχος υπόθεσης για τη µέση τιµή του πληθυσµού (όταν 3 και η διακύµανση του πληθυσµού να είναι γνωστή ή άγνωστη. Οι έλεγχοι υποθέσεων στην προκειµένη περίπτωση παίρνουν τις ακόλουθες µορφές: * Η : µ µ Η : µ µ * δίπλευρος έλεγχος. * Η : µ µ Η : µ > µ * µονόπλευρος έλεγχος (δεξιά 4

* Η : µ µ Η : µ < µ * µονόπλευρος έλεγχος (αριστερά Ο σηµειακός εκτιµητής του µ είναι το x. Όταν το δείγµα προέρχεται από κανονικό πληθυσµό Ν(µ, σ ανεξάρτητα από το µέγεθός του έχουµε ότι η X ακολουθεί κανονική σ κατανοµή Ν(µ,, το ίδιο ισχύει και στην περίπτωση που το δείγµα δεν προέρχεται από κανονικό πληθυσµό αλλά το µέγεθός του είναι 3. Το στατιστικό για τον έλεγχο είναι το: X µ σ ή X µ s Στην πράξη παίρνουµε: X µ * σ ή * X µ s Οι απορριπτικές περιοχές για τους προαναφερόµενους ελέγχους είναι αντίστοιχα: Για τον δίπλευρο έλεγχο R { z > z }και για τον µονόπλευρο έλεγχο (αριστερά R {z < - z } z }, για τον µονόπλευρο έλεγχο (δεξιά R {z > ΙΙ. Έλεγχος υπόθεσης για τη µέση τιµή του πληθυσµού (όταν <3 και η διακύµανση του πληθυσµού να είναι άγνωστη. Όταν το µέγεθος του δείγµατος είναι µικρό, η διακύµανση του δείγµατος άγνωστη και ο πληθυσµός από όπου προέρχεται το δείγµα κανονικός τότε η ποσότητα: X µ ακολουθεί την t κατανοµή µε - βαθµούς ελευθερίας. s 43

Η µεταβλητή αυτή παίρνεται ως το στατιστικό ελέγχου. Οι έλεγχοι υποθέσεων: * Η : µ µ Η : µ µ * δίπλευρος έλεγχος. * Η : µ µ Η : µ > µ * µονόπλευρος έλεγχος (δεξιά * Η : µ µ Η : µ < µ * µονόπλευρος έλεγχος (αριστερά έχουν ως απορριπτικές περιοχές αντίστοιχα: o δίπλευρος έλεγχος R { t > t ; }, ο µονόπλευρος έλεγχος (δεξιά R {t > t }και ο µονόπλευρος έλεγχος (αριστερά R {t < - t } Παραδείγµατα: ; ;. Παίρνουµε ένα δείγµα ηµερήσιων αµοιβών 4 εργατών µε µέση ηµερήσια αµοιβή x 8 ευρώ. Θεωρούµε ότι οι ηµερήσιες αµοιβές των εργατών κατανέµονται κανονικώς Ν(9, 4. Μπορούµε να πούµε ότι η µέση ηµερήσια αµοιβή στον πληθυσµό είναι µικρότερη του 9. Έχουµε τον έλεγχο της µηδενικής υπόθεσης: (α,5 Η : µ 9 Η : µ < 9 µονόπλευρος έλεγχος (αριστερά Η απορριπτική περιοχή είναι: 44

R {z < - z } µε Ζ z z, 5,64 X µ σ 8 9 -,58 4 4 Συνεπώς δεν απορρίπτουµε την Η. Παίρνουµε ένα δείγµα ηµερήσιων αµοιβών 5 εργατών µε µέση ηµερήσια αµοιβή x 38 ευρώ και δειγµατική διακύµανση 6. Μπορούµε να πούµε ότι η µέση ηµερήσια αµοιβή στον πληθυσµό είναι µεγαλύτερη του 39. Έχουµε τον έλεγχο της µηδενικής υπόθεσης: (α,5 Η : µ 39 Η : µ > 39 µονόπλευρος έλεγχος (δεξιά Η απορριπτική περιοχή είναι: R {z > z } µε Ζ z z, 5,64 X µ σ Συνεπώς δεν απορρίπτουµε την Η 38 39 -,8 6 5 3. Παίρνουµε ένα δείγµα ηµερήσιων αµοιβών εργατών µε µέση ηµερήσια αµοιβή x 33 ευρώ και δειγµατική διακύµανση 6. Μπορούµε να πούµε ότι η µέση ηµερήσια αµοιβή στον πληθυσµό διαφέρει του 3. Έχουµε τον έλεγχο της µηδενικής υπόθεσης: (α,5 Η : µ 3 Η : µ 3 δίπλευρος έλεγχος Η απορριπτική περιοχή είναι: 45

R { t > t t ; ; }, µε t t 9 ;,5,93 X µ σ Συνεπώς απορρίπτουµε την Η 33 3,4 6 4.3.. Έλεγχος υπόθεσης για τη διαφορά των µέσων τιµών µ, µ δύο πληθυσµών Ι. Έλεγχος υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών (δείγµατα µεγάλα ανεξάρτητα, διακυµάνσεις γνωστές ή άγνωστες Από τις κατανοµές των στατιστικών ενός δείγµατος γνωρίζουµε ότι: Αν πάρουµε δύο δείγµατα µεγάλα µεγέθους ν και κ µε µέσες τιµές x και y και διακυµάνσεις s, s αντίστοιχα τότε έχουµε ότι η µεταβλητή: X Y ( µ µ σ σ + ν κ ακολουθεί Ν(,. Εφόσον οι διακυµάνσεις είναι άγνωστες αντικαθίστανται από τις δειγµατικές διακυµάνσεις s, s και έχουµε ότι η µεταβλητή: X Y ( µ µ s s + ν κ ακολουθεί Ν(,. Οι έλεγχοι υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών (δείγµατα µεγάλα ανεξάρτητα, διακυµάνσεις γνωστές ή άγνωστες είναι οι ακόλουθοι: Η : µ µ Η : µ µ δίπλευρος έλεγχος. Η : µ µ Η : µ > µ µονόπλευρος έλεγχος (δεξιά 46

Η : µ µ Η : µ < µ µονόπλευρος έλεγχος (αριστερά Χρησιµοποιείται ως στατιστικό ελέγχου το: x y σ ν + σ κ ή x y s s + ν κ και έχουµε ως απορριπτικές περιοχές αντίστοιχα: Για τον δίπλευρο έλεγχο R { z > z }, για τον µονόπλευρο έλεγχο (δεξιά R {z > z }και για τον µονόπλευρο έλεγχο (αριστερά R {z < - z } Παραδείγµατα:. Από ένα πληθυσµό ηµερήσιων αµοιβών εργατών παίρνουµε ένα δείγµα 4 ηµερήσιων αµοιβών εργατών µε µέση ηµερήσια αµοιβή x 33 ευρώ και δειγµατική διακύµανση 6 και από ένα δεύτερο πληθυσµό ηµερήσιων αµοιβών εργατών παίρνουµε ένα δεύτερο δείγµα 5 ηµερήσιων αµοιβών εργατών µε µέση ηµερήσια αµοιβή y 3 ευρώ και δειγµατική διακύµανση 5. Μπορούµε να πούµε ότι η µέση ηµερήσια αµοιβή µ στον πρώτο πληθυσµό διαφέρει της µέσης ηµερήσιας αµοιβής µ στον δεύτερο πληθυσµό σε επίπεδο σηµαντικότητας (α,5 Ο έλεγχος µηδενικής υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών είναι ο ακόλουθος: Η : µ µ Η : µ µ δίπλευρος έλεγχος. Η απορριπτική περιοχή είναι: R { z > z }, Για τον έλεγχο της µηδενικής υπόθεσης χρησιµοποιούµε το στατιστικό 47

Ζ x y s s + ν κ 33 3 36 4 + 5 5,54 Έχουµε ότι: z,96 Επειδή Ζ > z απορρίπτεται η Η. Άρα σε επίπεδο σηµαντικότητας α5% δεν δεχόµαστε ότι µ µ.. Από ένα πληθυσµό ηµερήσιων αµοιβών εργατών παίρνουµε ένα δείγµα 38 ηµερήσιων αµοιβών εργατών µε µέση ηµερήσια αµοιβή x 37 ευρώ. Από ένα δεύτερο πληθυσµό ηµερήσιων αµοιβών εργατών παίρνουµε ένα δεύτερο δείγµα 45 ηµερήσιων αµοιβών εργατών µε µέση ηµερήσια αµοιβή y 34 ευρώ. Γνωρίζουµε τις πληθυσµιακές διακυµάνσεις των ηµερήσιων αµοιβών ότι είναι 4 και 5 αντίστοιχα. Μπορούµε να πούµε ότι η µέση ηµερήσια αµοιβή µ στον πρώτο πληθυσµό διαφέρει της µέσης ηµερήσιας αµοιβής µ στον δεύτερο πληθυσµό σε επίπεδο σηµαντικότητας (α,5 Ο έλεγχος µηδενικής υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών είναι ο ακόλουθος: Η : µ µ Η : µ µ δίπλευρος έλεγχος. Η απορριπτική περιοχή είναι: R { z > z }, Για τον έλεγχο της µηδενικής υπόθεσης χρησιµοποιούµε το στατιστικό Ζ x y σ ν + σ κ 37 34 6 38 + 5 45 3,3 Έχουµε ότι: z,96 48

Επειδή Ζ> z απορρίπτεται η Η. Άρα σε επίπεδο σηµαντικότητας α5% δεν δεχόµαστε ότι µ µ. ΙΙ. Έλεγχος υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών (δείγµατα µικρά ανεξάρτητα, διακυµάνσεις άγνωστες και ίσες Από τις κατανοµές των στατιστικών ενός δείγµατος γνωρίζουµε ότι: Αν πάρουµε δύο δείγµατα µικρά ανεξάρτητα µεγέθους ν και κ µε µέσες τιµές y και διακυµάνσεις s, s αντίστοιχα προερχόµενα από κανονικούς πληθυσµούς µε άγνωστες αλλά ίσες διακυµάνσεις σ σ σ τότε έχουµε ότι η µεταβλητή: x και X Y ( µ µ ( ν s + ( κ s ν + κ + ν κ ακολουθεί t-κατανοµή µε ν+κ- βαθµούς ελευθερίας Οι έλεγχοι υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών (δείγµατα µικρά ανεξάρτητα, διακυµάνσεις άγνωστες και ίσες είναι οι ακόλουθοι: Η : µ µ Η : µ µ δίπλευρος έλεγχος. Η : µ µ Η : µ > µ µονόπλευρος έλεγχος (δεξιά Η : µ µ Η : µ < µ µονόπλευρος έλεγχος (αριστερά Χρησιµοποιείται ως στατιστικό ελέγχου το: 49

x ( ν s + ( κ s + ν + κ ν κ και έχουµε ως απορριπτικές περιοχές αντίστοιχα: o δίπλευρος έλεγχος R { t > t +κ ν ; y }, ο µονόπλευρος έλεγχος (δεξιά R {t > t }και ο µονόπλευρος έλεγχος (αριστερά R {t < - t } ν +κ ; ν +κ ; Παράδειγµα: Από ένα πληθυσµό στρεµµατικών αποδόσεων µιας καλλιέργειας σε µια περιοχή παίρνουµε ένα δείγµα ν 6 στρεµµατικών αποδόσεων µε µέση τιµή x 37κιλά/στρεµ. Από ένα δεύτερο πληθυσµό στρεµµατικών αποδόσεων της ίδιας καλλιέργειας σε µια άλλη περιοχή παίρνουµε ένα δεύτερο δείγµα κ 5 στρεµµατικών αποδόσεων µε µέση τιµή y 34 κιλά/στρεµ. Οι δειγµατικές διακυµάνσεις είναι αντίστοιχα 4 και 5. Μπορούµε να πούµε ότι η µέση στρεµµατική απόδοση µ στον πρώτο πληθυσµό διαφέρει της µέσης στρεµµατική απόδοση µ στον δεύτερο πληθυσµό σε επίπεδο σηµαντικότητας (α,5. Θεωρούµε ότι οι πληθυσµιακές διακυµάνσεις είναι άγνωστες και ίσες. Ο έλεγχος µηδενικής υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών είναι ο ακόλουθος: Η : µ µ Η : µ µ δίπλευρος έλεγχος. Χρησιµοποιείται το στατιστικό: t x y ( ν s + ( κ s + ν + κ ν κ 37 34 (6 68+ (5 74 9 6 + 5,34 η απορριπτική περιοχή είναι: 5

R { t > t +κ ν ; Εφόσον t < tν +κ ; }, tν +κ ; t 9 ;, 5,45 δεν απορρίπτεται η Η. Άρα σε επίπεδο σηµαντικότητας α 5% δεχόµαστε ότι µ µ και δεν µπορούµε να ισχυριστούµε ότι διαφέρουν µεταξύ τους. ΙΙΙ. Έλεγχος υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών (δείγµατα µικρά ανεξάρτητα, διακυµάνσεις άγνωστες και διαφορετικές y Από τις κατανοµές των στατιστικών ενός δείγµατος γνωρίζουµε ότι: Αν πάρουµε δύο δείγµατα µικρά ανεξάρτητα µεγέθους ν και κ µε µέσες τιµές και διακυµάνσεις s, s αντίστοιχα προερχόµενα από κανονικούς πληθυσµούς µε άγνωστες και διαφορετικές διακυµάνσεις σ X Y ( µ µ s s + ν κ σ τότε έχουµε ότι η µεταβλητή: ακολουθεί t κατανοµή µε βαθµούς ελευθερίας λ (ν- όταν ν κ x και και λ s s ( + ν κ s s ( ( ν + κ ν κ (στρογγυλεµένο στον πλησιέστερο ακέραιο όταν ν κ Οι έλεγχοι υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών (δείγµατα µικρά ανεξάρτητα, διακυµάνσεις άγνωστες και διαφορετικές είναι οι ακόλουθοι: Η : µ µ Η : µ µ δίπλευρος έλεγχος. Η : µ µ Η : µ > µ µονόπλευρος έλεγχος (δεξιά 5

Η : µ µ Η : µ < µ µονόπλευρος έλεγχος (αριστερά χρησιµοποιούν ως στατιστικό ελέγχου το: x y s s + ν κ και έχουν ως απορριπτικές περιοχές αντίστοιχα: o δίπλευρος έλεγχος R { t > t λ ; }, ο µονόπλευρος έλεγχος (δεξιά R {t > t ο µονόπλευρος έλεγχος (αριστερά R {t < - t } Παραδείγµατα:. Από ένα πληθυσµό στρεµµατικών αποδόσεων µιας καλλιέργειας σε µια περιοχή παίρνουµε ένα δείγµα ν6 στρεµµατικών αποδόσεων µε µέση τιµή x 37κιλά/στρεµ. Από ένα δεύτερο πληθυσµό στρεµµατικών αποδόσεων της ίδιας καλλιέργειας σε µια άλλη περιοχή παίρνουµε ένα δεύτερο δείγµα κ6 στρεµµατικών αποδόσεων µε µέση τιµή y 34 κιλά/στρεµ. Οι δειγµατικές διακυµάνσεις είναι αντίστοιχα 4 και 5. Μπορούµε να πούµε ότι η µέση στρεµµατική απόδοση µ στον πρώτο πληθυσµό διαφέρει της µέσης στρεµµατική απόδοση µ στον δεύτερο πληθυσµό σε επίπεδο σηµαντικότητας (α,5. Θεωρούµε ότι οι πληθυσµιακές διακυµάνσεις είναι άγνωστες και διαφορετικές. Ο έλεγχος µηδενικής υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών είναι ο ακόλουθος: Η : µ µ Η : µ µ δίπλευρος έλεγχος. Χρησιµοποιείται το στατιστικό: λ; λ; }και 5

t x y s s + ν κ 37 34 4 5 + 6 6,8 η απορριπτική περιοχή είναι: R { t > t λ ; }, t λ ; t 3 ;, 5,4 λ (ν- 3 Εφόσον t < t λ ; δεν απορρίπτεται η Η. Άρα σε επίπεδο σηµαντικότητας α5% δεχόµαστε ότι µ µ και δεν µπορούµε να ισχυριστούµε ότι διαφέρουν µεταξύ τους.. Από ένα πληθυσµό στρεµµατικών αποδόσεων µιας καλλιέργειας σε µια περιοχή παίρνουµε ένα δείγµα ν στρεµµατικών αποδόσεων µε µέση τιµή x 37κιλά/στρεµ. Από ένα δεύτερο πληθυσµό στρεµµατικών αποδόσεων της ίδιας καλλιέργειας σε µια άλλη περιοχή παίρνουµε ένα δεύτερο δείγµα κ6 στρεµµατικών αποδόσεων µε µέση τιµή y 34 κιλά/στρεµ. Οι δειγµατικές διακυµάνσεις είναι αντίστοιχα 4 και 5. Μπορούµε να πούµε ότι η µέση στρεµµατική απόδοση µ στον πρώτο πληθυσµό διαφέρει της µέσης στρεµµατική απόδοση µ στον δεύτερο πληθυσµό σε επίπεδο σηµαντικότητας (α,5. Θεωρούµε ότι οι πληθυσµιακές διακυµάνσεις είναι άγνωστες και διαφορετικές. Ο έλεγχος µηδενικής υπόθεσης για τη διαφορά των µέσων τιµών δύο πληθυσµών είναι ο ακόλουθος: Η : µ µ Η : µ µ δίπλευρος έλεγχος. Χρησιµοποιείται το στατιστικό: t x y s s + ν κ 37 34 4 5 + 6,63 53