Κεφάλαιο 5 Συστηματική Δειγματοληψία (ΣυΔ)

Σχετικά έγγραφα
5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling)

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Κεφάλαιο 9. Έλεγχοι υποθέσεων

X = = 81 9 = 9

Αριθμητική Ανάλυση και Εφαρμογές

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Μαθηματικά Γ Γυμνασίου

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ ΕΠΙΜΕΛΕΙΑ : ΑΥΓΕΡΙΝΟΣ ΒΑΣΙΛΗΣ

Στατιστική. Εκτιμητική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΡΙΘΜΗΤΙΚΗ ΠΡΟΟΔΟΣ. Σύμφωνα με τα παραπάνω, για μια αριθμητική πρόοδο που έχει πρώτο όρο τον ...

Στατιστική Συμπερασματολογία

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αριθμητική Ανάλυση & Εφαρμογές

Κεφάλαιο 2. Συστήματα Αρίθμησης και Αναπαράσταση Πληροφορίας. Περιεχόμενα. 2.1 Αριθμητικά Συστήματα. Εισαγωγή

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΜΕΘΟΔΟΛΟΓΙΕΣ & ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΗΝ ΑΛΓΕΒΡΑ ΤΗΣ Α ΛΥΚΕΙΟΥ

12. ΑΝΙΣΩΣΕΙΣ Α ΒΑΘΜΟΥ. είναι δύο παραστάσεις μιας μεταβλητής x πού παίρνει τιμές στο

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

Κεφάλαιο 4 ο Δειγματοληψία κατά Συστάδες (ΔκΣ)

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Αριθμητική Ανάλυση και Εφαρμογές

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

( ) ( ) Τοα R σημαίνει ότι οι συντελεστές δεν περιέχουν την μεταβλητή x. αντικ σταση στο που = α. [ ο αριθµ ός πουτο µηδεν ίζει

3. Κατανομές πιθανότητας

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

4.2 ΕΥΚΛΕΙΔΕΙΑ ΔΙΑΙΡΕΣΗ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Άλγεβρα Α Λυκείου Κεφάλαιο 2ο. οι πράξεις και οι ιδιότητές τους

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

11. Ποιες είναι οι άμεσες συνέπειες της διαίρεσης;

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Ορισμένες σελίδες του βιβλίου

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΚΕΦΑΛΑΙΟ 3 ΤΟ ΔΙΩΝΥΜΙΚΟ ΘΕΩΡΗΜΑ

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Θέματα ενδοσχολικών εξετάσεων Άλγεβρας Α Λυκείου Σχ. έτος , Ν. Δωδεκανήσου ΘΕΜΑΤΑ ΕΝΔΟΣΧΟΛΙΚΩΝ ΕΞΕΤΑΣΕΩΝ ΤΑΞΗ: Α ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΑΛΓΕΒΡΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ - ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ. Εισαγωγικές εξετάσεις για το Μεταπτυχιακό Πρόγραμμα - Μέρος 2ο

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

0x2 = 2. = = δηλαδή η f δεν. = 2. Άρα η συνάρτηση f δεν είναι συνεχής στο [0,3]. Συνεπώς δεν. x 2. lim f (x) = lim (2x 1) = 3 και x 2 x 2

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

9 Πολυώνυμα Διαίρεση πολυωνύμων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

7.Αριθμητική παράσταση καλείται σειρά αριθμών που συνδέονται με πράξεις μεταξύ τους. Το αποτέλεσμα της αριθμητικής παράστασης ονομάζεται τιμή της.

ΚΕΦΑΛΑΙΟ 4 ο : ΑΝΙΣΩΣΕΙΣ ΤΟ 2 Ο ΘΕΜΑ

ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΟ ΜΑΘΗΜΑ ΜΑΘΗΜΑΤΙΚΑ Ι.Ι (τεύχος-1-)

ΘΕΜΑ 2. βρείτε. (Μονάδες 15) με διαφορά ω.

ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ B ΤΑΞΗΣ. χρησιμοποιήσουμε καθημερινά φαινόμενα όπως το θερμόμετρο, Θετικοί-Αρνητικοί αριθμοί.

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις και σημειακή εκτίμηση παραμέτρων Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή συμπερασμάτων για το σ

7. Αν υψώσουμε και τα δύο μέλη μιας εξίσωσης στον κύβο (και γενικά σε οποιαδήποτε περιττή δύναμη), τότε προκύπτει

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Μερικές φορές δεν μπορούμε να αποφανθούμε για την τιμή του άπειρου αθροίσματος.

Ασκήσεις3 Διαγωνισιμότητα Βασικά σημεία Διαγωνίσιμοι πίνακες: o Ορισμός και παραδείγματα.

Δειγματοληψία στην Ερευνα. Ετος

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Το Κεντρικό Οριακό Θεώρημα

με Τέλος πάντων, έστω ότι ξεκινάει ένα άλλο υποθετικό σενάριο που απλά δεν διευκρινίζεται. Για το i) θα έχουμε , 2

ΚΕΦΑΛΑΙΟ 1ο: ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΝΟΤΗΤΑ 3: ΟΡΙΑ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ

Το Κεντρικό Οριακό Θεώρημα

ΚΕΦΑΛΑΙΟ 5 ΑΚΟΛΟΥΘΙΕΣ ΑΡΙΘΜΗΤΙΚΗ ΓΕΩΜΕΤΡΙΚΗ ΠΡΟΟΔΟΣ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΑΛΓΕΒΡΑ Α ΛΥΚΕΙΟΥ. 118 ερωτήσεις θεωρίας με απάντηση ασκήσεις για λύση. 20 συνδυαστικά θέματα εξετάσεων

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Σημερινό μάθημα: Εκτιμήτριες συναρτήσεις, σημειακή εκτίμηση παραμέτρων και γραμμική παλινδρόμηση Στατιστική συμπερασματολογία (ή εκτιμητική ): εξαγωγή

Δειγματικές Κατανομές

2.1 ΠΡΑΞΕΙΣ ΚΑΙ ΟΙ ΙΔΙΟΤΗΤΕΣ ΤΟΥΣ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

Κεφάλαιο 3 ο Στρωματοποιημένη Δειγματοληψία (ΣτΔ)

Transcript:

Κεφάλαιο 5 Συστηματική Δειγματοληψία (ΣυΔ) Σύνοψη Η Συστηματική Δειγματοληψία (ΣυΔ) είναι το είδος της δειγματοληψίας που μπορεί να διεξαχθεί ευκολότερα σε σύγκριση με άλλα είδη δειγματοληψίας και μάλιστα το προσωπικό που θα συγκεντρώσει τα δεδομένα της έρευνας δεν απαιτείται να έχει και πολύ καλή κατάρτιση Αρκεί μια σύντομη ενημέρωση Η μέθοδος εν συντομία είναι η εξής: Τα άτομα του πληθυσμού αριθμούνται και θα επιλεγούν με βάση τον αύξοντα αριθμό Το μέγεθος του πληθυσμού είναι Ν και θα επιλεγεί δείγμα μεγέθους n< Για να γίνει αυτό υπολογίζουμε το ακέραιο μέρος του πηλίκου [/n] και με κλήρωση επιλέγεται ο δείκτης εκκίνησης (της δειγματοληψίας), ο ακέραιος, που ανήκει στο σύνολο {,,3,,} Το δείγμα θα αποτελέσουν πλέον τα n άτομα με δείκτες τους ακέραιους, +, +,,+(n-) Η πιο εύχρηστη περίπτωση είναι, όταν το μέγεθος του δείγματος n διαιρεί ακριβώς το μέγεθος του πληθυσμού Ν Όταν δεν είναι ακριβής η διαίρεση, τότε αναφύεται και πρόβλημα αμεροληψίας των εκτιμητριών, που μπορεί να αντιμετωπιστεί με τη ΣυΔ με βάση τον κυκλικό νόμο που εξετάζεται σε χωριστή παράγραφο στο κεφάλαιο αυτό Σε άλλη παράγραφο παρουσιάζονται τα σχετικά με τις εκτιμήτριες της μέσης τιμής και της διασποράς και με τη συμπεριφορά τους Εδώ φαίνεται από το κείμενο η όλη συμπεριφορά της ΣυΔ της οποίας τα αποτελέσματα τείνουν οριακά να εξισωθούν με τα αποτελέσματα της απλής τυχαίας δειγματοληψίας (ΑΤΔ) Σε μερικές μάλιστα περιπτώσεις είναι προτιμητέα η ΣυΔ σε σχέση και με την ΑΤΔ Σε μία ιδιαίτερη παράγραφο εξετάζονται οι τυχαίες μεταβλητές (τμ) με τιμές που παρουσιάζουν γραμμική τάση ή εκθετική τάση συναρτήσει του δείκτη- αύξοντα αριθμού Τέτοιες τμ παρουσιάζουν ιδιαίτερο ενδιαφέρον, γιατί τα συμπεράσματα της παραγράφου αυτής δίνουν διέξοδο στο να μειωθεί το κόστος της δειγματοληπτικής έρευνας μέσα από τη μείωση του μεγέθους του δείγματος ή μέσω της ειδικής επιλογής του Αυτό ουσιαστικά οδηγεί σε είδος δειγματοληψίας σκοπιμότητας (ΔΣκ), το οποίο όμως είναι αντικείμενο της επόμενης παραγράφου Την όλη εικόνα φωτίζουν τα λυμένα παραδείγματα, που αναλαμβάνουν να αναδείξουν περιπτώσεις όπου η ΣυΔ μπορεί να εφαρμοστεί με αποτελέσματα πολύ καλά έως εντυπωσιακά και αξίζει τον κόπο να εφαρμόζεται Προαπαιτούμενη γνώση Δεν χρειάζονται ειδικές γνώσεις για το 5 ο κεφάλαιο και αρκούν οι βασικές γνώσεις Στατιστικής και Πιθανοτήτων καθώς και οι γνώσεις των προηγουμένων κεφαλαίων αυτού του συγγράμματος 5 Ορισμοί εννοιών - Συμβολισμοί Η συστηματική δειγματοληψία (ΣυΔ, stematic sampling) είναι μία μέθοδος δειγματοληψίας που διακρίνεται για την ευκολία διενέργειάς της και άρα για το χαμηλό κόστος της Η ΣυΔ έχει τη φήμη ότι μπορεί να διενεργηθεί και από προσωπικό χαμηλού εκπαιδευτικού επιπέδου, πράγμα που είναι αρκετά αληθινό Εκτός από τα παραπάνω ένα άλλο πλεονέκτημα της μεθόδου αυτής είναι ότι δίνει αποτελέσματα και εκτιμήσεις που, οριακά τουλάχιστον, είναι εφάμιλλα, αν όχι και ίδια, με τα αντίστοιχα που προκύπτουν χρησιμοποιώντας ΑΤΔ Αρκετές φορές, όμως, προκύπτουν και παρεκκλίσεις Θα δούμε παρακάτω την περιγραφή της τεχνικής της ΣυΔ και θα επεξηγήσουμε τον τρόπο διενέργειάς της Βασικά υποτίθεται εδώ ότι έχουμε έναν πληθυσμό Π που έχει Ν αντικείμενα, που αποκαλούνται και άτομα, τα: u, u, u Όλα τα άτομα αυτά του πληθυσμού έχουν μία χαρακτηριστική ιδιότητα που περιγράφεται με την τυχαία μεταβλητή Χ (τμ Χ) Άρα, παράλληλα με τον πληθυσμό Π υπάρχει και το σύνολο των τιμών της τμ Χ, το σύνολο {Χ, Χ, Χ 3, Χ Ν } Από τον πληθυσμό Π πρόκειται να εξαχθεί ένα δείγμα μεγέθους n Το μέγεθος n του δείγματος μπορεί να είναι το πολύ ίσο με την ποσότητα [Ν/], όπου [x]ο μεγαλύτερος ακέραιος που δεν ξεπερνάει τον πραγματικό αριθμό x και αποκαλείται ακέραιο μέρος του x Έχουμε, δηλαδή, την ισχύ της σχέσης n [ / ] Αν, δηλαδή, έχουμε έναν πληθυσμό Π με μέγεθος Ν43 άτομα, τότε μπορούμε να πάρουμε δείγμα μεγέθους [43/]7 ατόμων το πολύ Διακρίνουμε ήδη δύο διαφορετικές περιπτώσεις δειγματοληψίας: (α) Το μέγεθος του πληθυσμού να είναι ακέραιο πολλαπλάσιο του μεγέθους του δείγματος, δηλαδή Ν n

(β) Το μέγεθος του πληθυσμού δεν είναι ακέραιο πολλαπλάσιο του μεγέθους του δείγματος, δηλαδή δεν υπάρχει ακέραιος ώστε να ισχύει: Ν n Ο είναι ακέραιος και στις δύο περιπτώσεις (α) και (β) Κατά την περίπτωση (α) μπορούμε να γράψουμε τις τιμές της τμ Χ σε n γραμμές που να περιέχουν από τιμές και έτσι όλα τα στοιχεία του πληθυσμού θα αντιπροσωπεύονται από τις τιμές της τμ Χ γραμμένες σε n γραμμές μήκους, δηλαδή μπορούν να θεωρηθούν οι τιμές του πληθυσμού ως στοιχεία ενός n πίνακα (matrix) Κάθε στήλη του πίνακα αυτού είναι και ένα δείγμα και έχουμε έτσι δείγματα, όλα μεγέθους n ακριβώς Αντίστοιχα, κατά την περίπτωση (β) έχουμε την ισχύ της σχέσης Ν n ή αλλιώς ισχύει γενικά η σχέση n + υ με τιμές του υπολοίπου 0 υ < n Η περίπτωση υ0 είναι η περίπτωση (α) Όλες οι άλλες τιμές του υπολοίπου, διαφορετικές από το μηδέν, σημαίνουν ότι οι τιμές της τμ Χ θα γραφούν σε έναν πίνακα διάστασης n+ ( ) αλλά με την τελευταία γραμμή του πίνακα να μην είναι πλήρης Πιο συγκεκριμένα, έχει κάποια στοιχεία (το λιγότερο και το πολύ - στο πλήθος) και τις τελευταίες θέσεις της κενές (τουλάχιστον μία) Ξεκινάμε δηλαδή με την επιλογή μας να πάρουμε δείγματα n-μελή και μας προκύπτουν υ δείγματα-στήλες με μέγεθος (n+) και -υ δείγματα-στήλες με μέγεθος n, όπως αρχικά σχεδιάσαμε Οποιαδήποτε όμως περίπτωση και αν ισχύει, τα άτομα (μονάδες) του πληθυσμού Π μετά την παραπάνω θεώρηση θα γραφούν (για τις πρώτες n γραμμές του πίνακα) με τη μορφή u( i ) +, i,,, n,,,,, (5) ενώ στην (n+)-οστή και τελευταία γραμμή, όποτε αυτή υπάρχει, θα έχουμε τα άτομα γραμμένα με το συμβολισμό un +,,,,υ (5) και το m-οστό δείγμα θα έχει ως στοιχεία τις μονάδες u( i ) + m, i,,, n, ή i,,,( n + ) (53) Τα παραπάνω σημαίνουν ότι, για να πάρουμε ένα δείγμα με ΣυΔ, προβαίνουμε στις εξής ενέργειες: Επιλέγουμε και αποφασίζουμε σχετικά με το μέγεθος του δείγματος, το n Προσδιορίζεται άμεσα και το μήκος γραμμής, το Τόσα δείγματα θα πάρουμε 3 Μεταξύ των στοιχείων του συνόλου {,,3,,} γίνεται κλήρωση και προκύπτει ο αύξων αριθμός του δείγματος που θα προκύψει και θα χρησιμοποιηθεί για την έρευνά μας 4 Το δείγμα που θα έχουμε είναι αυτό που προβλέπεται ήδη στη σχέση (53) Μπορούμε να φανταστούμε έναν πληθυσμό Π με Ν45 στοιχεία από τον οποίο και θέλουμε να πάρουμε ένα συστηματικό δείγμα μεγέθους n8 Άρα μέγεθος γραμμής είναι το [45/8]30, οπότε από τα 45 (αριθμημένα φυσικά) στοιχεία του πληθυσμού τα πρώτα 40(30x8) τα θεωρούμε γραμμένα στις 8 πρώτες διαδοχικές γραμμές μήκους 30 στοιχείων Τα υπόλοιπα 5 στοιχεία θα μπουν στη μη πλήρη 9 η γραμμή και έτσι τακτοποιήθηκαν όλα τα στοιχεία (άτομα) του πληθυσμού Π, 45 συνολικά Μεταξύ των 30 διαδοχικών φυσικών αριθμών {,,3,,30} κάνουμε κλήρωση και προκύπτει πχ το m7 Άρα από τα 30 δυνατά δείγματα επιλέγεται και θα χρησιμοποιήσουμε στη μελέτη μας το 7 ο δείγμα που περιέχει τα επόμενα άτομα του πληθυσμού u u 30 ( i ) + 7 30 i 3, i,,,8, ήτοι τα 8 άτομα με δείκτη 7, 37, 67, 97, 7, 57, 87, 7 Αντίθετα, αν είχε εκλεγεί το m4, τότε θα είχαμε τα 9 άτομα του πληθυσμού με δείκτη 4, 34, 64, 94, 4, 54, 84, 4, 44, που υλοποιούν τον αντίστοιχο τύπο

u30 (i ) + 4 u 30 i 6,i,,, 9 Τα τέσσερα βήματα ενεργειών που περιγράφονται παραπάνω μπορούν να αποδοθούν σχηματικά με τη βοήθεια ενός πίνακα με στήλες, που αποδίδει τη διαδικασία θεωρητικά και μπορεί να υλοποιηθεί με συγκεκριμένα παραδείγματα παρακάτω Υποτίθεται ότι το μέγεθος n του δείγματος είναι διαιρέτης του μεγέθους Ν του πληθυσμού Π και άρα το πλήθος των στηλών του πίνακα είναι το ακριβές πηλίκο /n Ακολουθεί ο αντίστοιχος Πίνακας 5, που στις θέσεις των ατόμων του πληθυσμού έχει τις αντίστοιχες τιμές της τμ Χ Κάθε στήλη του πίνακα αυτού είναι και ένα δείγμα με ΣυΔ αα γραμμής ο δείγμα ο δείγμα 3 ο δείγμα -οστό δειγμα η γραμμή X X Χ 3 Χ η γραμμή X + X + Χ +3 X 3 η γραμμή X + X + Χ +3 X 3 γραμμή n η γραμμή X (n-)+ X (n-)+ Χ (n-)+3 X n Μέσες τιμές x x x 3 x Πίνακας 5 5 Εκτιμήσεις Οι εκτιμήτριες βασικών παραμέτρων Θεωρούμε τον πληθυσμό Π με μέγεθος Ν ατόμων τα οποία έχουν αριθμηθεί με αύξοντα αριθμό (αα) από το έως το Ν Η μελέτη γίνεται μέσα από τη χρήση της τμ Χ, που παίρνει τιμές Χ, Χ, Χ 3,,Χ Ν Σε σχέση με την τμ Χ είναι προφανές ότι η μέση τιμή για τον πληθυσμό Π είναι η ποσότητα X Xi i και η ποσότητα X X X i i είναι το άθροισμα του πληθυσμού Επιπλέον η διασπορά για τον πληθυσμό είναι επίσης η ποσότητα S ( Xi X) i και η τυπική απόκλιση είναι η τετραγωνική της ρίζα, S S Οι έννοιες αυτές είναι ήδη γνωστές και από τα προηγούμενα κεφάλαια, όπως επίσης είναι γνωστές διαφόρων ειδών εκτιμήτριες (συναρτήσεις) τους Στην παρούσα παράγραφο θα μελετηθούν οι εκτιμήτριες και οι εκτιμήσεις μέσα από τη ΣυΔ Η εκτίμηση όλων των παραμέτρων γίνεται μέσα από τη δειγματοληψία Ειδικά στη ΣυΔ, όπως περιγράφεται στην προηγούμενη παράγραφο, υπάρχουν [ /n] δείγματα, όπου n είναι το επιδιωκόμενο μέγεθος του συστηματικού δείγματος και το σύμβολο [x] είναι το ακέραιο μέρος του πραγματικού αριθμού x Θα δοθούν τα σύμβολα και οι εκφράσεις των διαφόρων εκτιμητριών των παραμέτρων του πληθυσμού υποθέτοντας ότι είναι 0 mod n και άρα ισχύει ότι n με τον ακέραιο Αρχικά ορίζουμε ότι το άτομο του πληθυσμού u i είναι το άτομο που συμμετέχει στο -οστό δείγμα και κατέχει την i-οστή κατά σειρά θέση μέσα στο δείγμα αυτό Ισχύει, δηλαδή, ότι το άτομο

u i είναι το ίδιο με το άτομο u(i ) + του πληθυσμού (συμπίπτουν) στην ενιαία αρίθμηση των ατόμων του πληθυσμού από το μέχρι το Ν Επειδή μάλιστα ενδιαφέρει η τμ Χ, στο άτομο u i του πληθυσμού αντιστοιχεί η τιμή X i της τμ Χ που, όταν την βλέπουμε ως τιμή σχετική με το δείγμα, τη συμβολίζουμε με το μικρό γράμμα x i Σύμβολα για τα δείγματα στην ΣυΔ φαίνονται στον αμέσως επόμενο Πίνακα 5: n: Μέγεθος του δείγματος x, : x, : Άθροισμα του -οστού δείγματος,,,3,, Μέση τιμή του -οστού δείγματος,,,3,, s, : Διασπορά του -οστού δείγματος,,,3,, s : Τυπική απόκλιση του -οστού δείγματος,,,3,,, Sw : Η μέση τιμή των δειγματικών διασπορών Πίνακας 5 s, :,,3,, Με βάση τους ανωτέρω καθορισμούς των συμβόλων στο δείγμα, έχουμε τις παρακάτω σχέσεις ορισμού των αντίστοιχων εννοιών, με την υποσημείωση μόνο ότι ο πληθυσμός Π περιλαμβάνει n στοιχεία ακριβώς και μπορούν να προκύψουν από αυτόν δείγματα μεγέθους n ακριβώς το καθένα Άθροισμα στο -οστό δείγμα: n x x,,,3,,, Μέση τιμή της τμ Χ στο -οστό δείγμα: Διασπορά στο -οστό δείγμα: i i n x x,,,3,,, Τυπική απόκλιση στο -οστό δείγμα: n i i ( ) n, i, n i (5) (5) s x x,,,3,, (53) n s ( ), s, xi x,,,,3,, n i (54) Η μέση τιμή των δειγματικών διασπορών S x x s n n ( ) ( ) i (55) w i,, Η μέση τιμή των δειγματικών διασπορών κατά τον Cochran (977) είναι η διασπορά ανάμεσα σε μονάδες που βρίσκονται ταξινομημένες σε συστηματικά δείγματα Οι μονάδες, δηλαδή, δεν συνεισφέρουν στον υπολογισμό της διασπορά κατά μόνας, οπότε θα είχαμε Ν-n- βαθμούς ελευθερίας, αλλά συμπεριφέρονται και «ενεργούν» ομαδικά ανήκοντας σε n-μελή δείγματα, άρα έχουμε φορές n- βαθμούς ελευθερίας, ήτοι (n-) βε Η παράμετρος S w είναι αρκετά σημαντική για τη στατιστική ανάλυση στη ΣυΔ, όπως θα φανεί παρακάτω σε σχετικά θεωρήματα Ονομάζεται «διασπορά μέσα από τα δείγματα» ή «διασπορά από τα δείγματα» Η παράθεση μερικών θεωρημάτων παρακάτω θα δείξει τον τρόπο σύνδεσης αλλά και λειτουργίας των εννοιών των παραμέτρων που ορίστηκαν ως εδώ:

Θεώρημα 5: Όταν ισχύει 0modn,, η μέση τιμή συστηματικού δείγματος (δηλαδή η μέση τιμή που θα προκύψει από δείγμα που θα επιλεγεί με ΣυΔ) η x είναι μία εκτιμήτρια της πληθυσμιακής μέσης τιμής X Xi i και είναι αμερόληπτη εκτιμήτρια αυτής της μέσης τιμής Απόδειξη: Σημειώνουμε αρχικά ότι το σύμβολο x είναι το σύμβολο που αναφέρεται σε όλες τις μέσες τιμές που προκύπτουν από δείγματα που επιλέχτηκαν με ΣυΔ Παίρνει όλες τις τιμές της σχέσης (5) με την ίδια πιθανότητα / Αυτή η παρατήρηση θα διευκολύνει στην απόδειξη του θεωρήματος Είναι ήδη προφανές ότι αρκεί να αποδειχτεί το Ex X Προφανές είναι ότι ισχύει η σειρά των πράξεων Ex P( x, )x, x, λόγω του ισοπιθάνου των μέσων τιμών από τα συστηματικά δείγματα Οπότε n n Ex xi Xi X n i i και το θεώρημα αποδείχτηκε Η αμεροληψία μιας εκτιμήτριας είναι πάντα μια σημαντική «καλή» ιδιότητα της εκτιμήτριας Η ποιότητα της εκτιμήτριας, όμως, εξαρτάται σημαντικά και από τη διασπορά της εκτιμήτριας, καθώς διατρέχονται όλα τα δυνατά δείγματα και το καθένα μετέχει στη διαδικασία ανάλογα με τη βαρύτητά του Όταν ισχύει ότι 0mod n, τότε έχουμε συστηματικά δείγματα από n ακριβώς στοιχεία το καθένα Άρα έχουν την ίδια βαρύτητα όλα Θα αποδείξουμε σχετικά με τη διασπορά της εκτιμήτριας της μέσης τιμής του πληθυσμού: Θεώρημα 5: Όταν ισχύει 0modn, τότε η διασπορά της εκτιμήτριας της μέσης τιμής δίνεται από τη σχέση: ( n ) Varx V ( x ) S Sw (56) Απόδειξη: Είναι προφανές ότι ισχύουν τα εξής: n n S xi X i i xi x, + x, X ( ο ) ( ) ( ) ( ), ήτοι ( ) i και n ( ) S ( xi x, ) + ( x, X) + ( xi x, )( x, X) ( ) ( ) ( ) S n x X + x x + x X x x n n ( ) ( ) ( ), i,, i, i i n και επειδή είναι ( xi x, ) i 0, προκύπτει τελικά

(, ) ( i, ) n ( ) ( ) i S n x X + x x, ενώ παράλληλα και αφού οι πιθανοί και ισοπίθανοι μέσοι όροι είναι το πλήθος, ισχύει ότι: ( ο ) Var( x ) V ( x ) ( x, X ) Ο συνδυασμός των ανωτέρω αποτελεσμάτων ( ο ) και ( ο ) και η σχέση (55) δίνουν το αποτέλεσμα: ( ) ( ) S n Varx + n S w Η τελευταία σχέση επιλύεται ως προς Varx και σε συνδυασμό με την αρχική υπόθεση 0 mod n (άρα n ) προκύπτει άμεσα η σχέση ( n ) Varx V ( x ) S Sw και το θεώρημα αποδείχτηκε Το αποτέλεσμα του Θεωρήματος 5 μπορεί να χρησιμοποιηθεί σε αρκετές σημαντικές περιπτώσεις Μία τέτοια περίπτωση εφαρμογής είναι η προσπάθεια διαπίστωσης του πότε η ΣυΔ δίνει ακριβέστερη εκτίμηση για την τιμή της μέσης τιμής του πληθυσμού από κάποια άλλη μέθοδο δειγματοληψίας Συγκεκριμένα εδώ θα διαπιστώσουμε κάτω από ποιες συνθήκες η ΣυΔ είναι ακριβέστερη στην εκτίμηση της μέσης τιμής του πληθυσμού σε σχέση με την απλή τυχαία δειγματοληψία (ΑΤΔ) Σημειώνεται ότι η ΑΤΔ παρέχει αμερόληπτη εκτιμήτρια για την μέση τιμή της τμ Χ στον πληθυσμό και η διασπορά της μέσης δειγματικής τιμής, η Varx, AT θεωρείται ως μέτρο σύγκρισης για την αξιοπιστία και την ακρίβεια των εκτιμήσεων της μέσης τιμής του πληθυσμού που προκύπτουν από άλλες μεθόδους και τεχνικές δειγματοληψίας, όπως είναι η ΣυΔ Η ΑΤΔ λόγω και της απλότητάς της και λόγω των «καλών» ιδιοτήτων των εκτιμητριών μέσης τιμής και διασποράς του πληθυσμού Π θεωρείται ιδανική και ως σημείο αναφοράς γενικά Σχετικό είναι το επόμενο θεώρημα: Varx < Varx S <S AT w (57) Θεώρημα 53: Όταν ισχύει 0modn, τότε για τη διασπορά της εκτιμήτριας της μέσης τιμής του πληθυσμού της ΣυΔ σε σχέση με την ΑΤΔ ισχύει η εξής ισοδυναμία: Απόδειξη: Είναι γνωστό ήδη (Κεφάλαιο ο ) ότι Από τις σχέσεις (56) και (57) προκύπτει f n VarxAT S S n n ( ) AT S n Varx Varx S f w S V n και ( n ) ( ) f ( n ) V S S S n n n S w w δηλαδή προκύπτει η επόμενη ισοδυναμία ανισοτήτων, με την προϋπόθεση ότι 0 mod n : Varx < Varx S <S AT w, (58) και το θεώρημα αποδείχτηκε Το βαθύτερο νόημα του Θεωρήματος 53 είναι ότι: «Η ΣυΔ είναι πιο αξιόπιστη (ακριβέστερη) στην εκτίμηση της μέσης τιμής του πληθυσμού από την ΑΤΔ, αν και μόνο αν η διασπορά μέσα από τα δείγματα-στήλες είναι μεγαλύτερη από τη διασπορά όλου του πληθυσμού, αν τον θεωρήσουμε ως μια ενότητα» Αυτό το συμπέρασμα μας ωθεί να προτιμήσουμε την ΣυΔ από την ΑΤΔ, αν με οποιονδήποτε τρόπο αντιληφθούμε ότι

υπάρχει ανομοιογένεια στο δείγμα (ή στα δείγματα, αν έχουμε περισσότερα) ως προς την εξεταζόμενη τμ Χ Αυτήν την ανομοιογένεια μπορούμε να τη διαπιστώσουμε στο δείγμα βασιζόμενοι στην όποια γνώση έχουμε για την τμ Χ (διαίσθηση, πείρα, αξιοποίηση άλλης παράλληλης πληροφόρησης κλπ) Μπορούμε όμως να την διαπιστώσουμε και με άλλες μεθόδους πιο ασφαλείς και πιο αντικειμενικά τεκμηριωμένες Μία τέτοια μέθοδος είναι αυτή που βασίζεται σε έναν δείκτη δ ο οποίος σχετίζεται και περιγράφει τη συσχέτιση ανάμεσα σε ζεύγη τιμών της τμ Χ με μέτρο σύγκρισης τη διασπορά της Υπάρχουν πολλές εκδοχές του δείκτη αυτού Μία από τις ευρύτερα γνωστές εκδοχές του δ, (Cochran, 977), είναι η ακόλουθη ( i u ) E δ, i x i X, u xu X,,,,, i<u S ( ) /, (59) όπου η μέση τιμή του αριθμητή είναι έχει n ( n ) / βαθμούς ελευθερίας (τόσοι προσθετέοι υπάρχουν στον αριθμητή και το άθροισμά τους διαιρείται με τον αριθμό αυτό), ενώ ο παρονομαστής είναι η διασπορά σ EX ( EX ) S ( ) / Μετά όλα τα παραπάνω θα έχουμε για το δείκτη δ την έκφραση και κρατάμε την μορφή της ως ( ) ( ) ( ) ( ) ( ) xi X xu X i u i<u i<u δ n n S / n S ( ) ( ) ( i u ) ( n ) S ( ) δ, r xr X, r i,u i<u Επίσης από τον ορισμό της διασπορά της εκτιμήτριας της μέσης τιμής του πληθυσμού Var( x ) V ( x ) x X ( ), προκύπτει άμεσα ότι ( x, X) V( x ) (50) Πολλαπλασιάζουμε και τα δύο μέλη της τελευταίας σχέσης επί n και αναπτύσσομε το α μέλος για να πάρουμε τη σχέση ( ), ή nx nx n Vx ( ) ( ), x nx n Vx ( ) και n ( xi X) n V ( x ) i Αναπτύσσουμε το α μέλος περισσότερο και έχουμε ( ) S + ( i u ) n Vx ( ), i<u που σε συνδυασμό με τη δεύτερη μορφή της σχέσης (50) δίνει ενδιάμεσο αποτέλεσμα

( ) ( ) ( ) S + n S δ n Vx ( ) Τελικά, προκύπτει μια σημαντική σχέση προσδιορισμού της διασποράς της εκτιμήτριας της μέσης τιμής του πληθυσμού, άρα και προσδιορισμού της ποιότητας της εκτιμήτριας Η σχέση αυτή είναι: σ V( x ) { + ( n ) δ} σ + δ n n (5) Η σχέση (5) θεωρητικά φαίνεται να είναι μια σημαντική σχέση που για την τμ Χ, προσδιορίζει τη διασπορά (ποιότητα και αξιοπιστία) της εκτιμήτριας x της μέσης τιμής του πληθυσμού Π Μια προσεκτικότερη θεώρηση, όμως, δείχνει να υπάρχει πρόβλημα στην άμεση εφαρμογή της Αυτό επειδή η V( x ) είναι συνάρτηση της διασποράς σ και του δείκτη συσχέτισης δ Οι δύο αυτές ποσότητες είναι συναρτήσεις της μέσης τιμής του πληθυσμού, η οποία και είναι τελικός στόχος της μελέτης Έχουμε πρωθύστερο σχήμα προσδιορίζοντας τα άγνωστα σ και δ με την άγνωστη τιμή X Προς αποφυγήν αυτού του αδιεξόδου, στην (5) αντί των σ και δ χρησιμοποιούμε εκτιμήτριές τους και έτσι έχουμε εκτίμηση για τη διασπορά V( x ) της μέσης τιμής του πληθυσμού κατά το σχήμα: { ( n ) } ˆ ˆ ˆ ˆ σ V( x ) + ˆ δ σ + δ n n (5) Για την εξυπηρέτηση αυτού του σκοπού εφαρμόζουμε την εξής σειρά ενεργειών: η ενέργεια: Προσδιορισμός του μεγέθους του δείγματος n η ενέργεια: Προσδιορισμός του μεγέθους, δηλαδή του πλήθους των συστηματικών δειγμάτων συνολικά 3 η ενέργεια: Προσδιορισμός του πλήθους ν (<) των συστηματικών δειγμάτων που θα χρειαστούν για τον προσδιορισμό των εκτιμητριών σ και ˆδ των σ και δ 4 η ενέργεια: Προσδιορισμός της διασπορά της εκτιμήτριας της μέσης τιμής του πληθυσμού (τελικός στόχος) Σημείωση 5: Υπάρχουν πολλά είδη εκτιμητριών ˆσ και ˆδ Θεωρούμε πχ τα ν δείγματα ως πληθυσμό και ενεργούμε ανάλογα σύμφωνα με όσα εκτίθενται παραπάνω Σημείωση 5: Αν στα δείγματα που θα πάρουμε πιλοτικά δεν εμφανιστεί ανομοιογένεια, τότε δεν θα προτιμήσουμε τη ΣυΔ και θα προσαρμόσουμε τη μελέτη μας στη χρήση άλλης ή άλλων μεθόδων Υπάρχουν περιπτώσεις που η ανομοιογένεια είναι ανύπαρκτη στο δείγμα ή στα δείγματα, όταν πχ υπάρχει περιοδικότητα και έχουμε επιλέξει το να είναι ίσο με την περίοδο Τ ή πολλαπλάσιο του Τ Παράδειγμα 5: Δίνεται πληθυσμός Π μεγέθους Ν4 ατόμων και μελετούμε την τμ Χ με τιμές τα στοιχεία του συνόλου Α Χ {7, 4,,,, 4, 3, 5,, 0, 9,, 6, 9, 0, 6, 3, 3, 3, 7, 5, 5,, 4} που είναι γραμμένα με τη αύξουσα σειρά τους Είναι πχ Χ 3, Χ 6 4, Χ 4 4 κλπ Στη δειγματοληψία με δείγμα μεγέθους n3 να διαπιστωθεί αν είναι προτιμότερη η ΣυΔ από την ΑΤΔ Λύση Τριμελή συστηματικά δείγματα θα πάρουμε, αν γράψουμε όλα τα στοιχεία του πληθυσμού Π σε n3 γραμμές με /n4/38 στοιχεία η καθεμία γραμμή Η διαπίστωση αν είναι προτιμότερη ή όχι η ΣυΔ από την ΑΤΔ μπορεί να γίνει με δύο, τουλάχιστον, τρόπους: (α) Με το δείκτη συσχέτισης (β) Με την ισοδυναμία του θεωρήματος 53 [βλ σχέση (57)] Θα τα εφαρμόσουμε και τα δύο κριτήρια (α) Με το δείκτη συσχέτισης δ Όλα τα δυνατά συστηματικά δείγματα είναι 8 Για εξοικονόμηση χρόνου και κόπου θα πάρουμε μερικά από αυτά και αυτά θα αποτελέσουν το σύνολο στο οποίο θα βασιστούμε, για να κάνουμε τους υπολογισμούς μας Θα πάρουμε συγκεκριμένα 3 σύνολα Με τη χρήση γεννήτριας (ψευδο)-τυχαίων αριθμών που έχει ο υπολογιστής τσέπης CASIO fx-350ms κληρώθηκαν από τα 8 τριμελή συστηματικά δείγματα τα εξής 3 του συνόλου Β3{ ο, 3 ο, 5 ο } Θα αποτελέσουν τη βάση υπολογισμών Όπως είναι ήδη γνωστό, τα στοιχεία του πληθυσμού που θα μετέχουν των δειγμάτων είναι:

ο δείγμα: μετέχουν τα στοιχεία του πληθυσμού ο, 0 ο και 8 ο 3 ο δείγμα: μετέχουν τα στοιχεία του πληθυσμού 3 ο, ο και 9 ο 5 ο δείγμα: μετέχουν τα στοιχεία του πληθυσμού 5 ο, 3 ο και ο Τα τρία δείγματα με τα στοιχεία τους θα εισαχθούν στον παρακάτω Πίνακα 5, όπου θα εισαχθούν και διάφορα ενδιάμεσα αποτελέσματα υπολογισμών που θα βοηθήσουν να έχουμε τη σωστή απόφαση για το ποια μέθοδος είναι προτιμότερη από τις δύο, η ΣυΔ ή η ΑΤΔ Στιγμιαία θα μπορούν να θεωρηθούν ο «πληθυσμός» της δοκιμασίας ο Δείγμα 3 ο Δείγμα 5 ο Δείγμα «Πληθυσμός» κλπ Τα τρία δείγ ατα ε τα στοιχεία 4 τους θα εισαχθούν στον παρακάτω Πίνακα 5, όπου θα εισαχθούν και διάφορα ενδιά εσα αποτελέσ ατα υπολογισ ών που θα βοηθήσουν να έχου ε τη σωστή απόφαση για το 0 ποια έθοδος 9 είναι προτι ότερη 6 από τις δύο, η Συ ή η ΑΤ Στιγ ιαία θα πορούν να θεωρηθούν 3 ο «πληθυσ ός» 3 της δοκι ασίας 5 Αθροίσματα x ο είγ α 7 3 ο είγ α 3 5 ο είγ α «Πληθυσ ός», Χ7 κλπ 4 Μέσες τιμές x 9 3/3767 /3733 Χ 7 8 Ex 0 9 6 9 3 3 5 Αθροίσ ατα Es 36 / 9 36 Διασπορές x s 7 3 /33733 5/35033 Χ7 S 775 & σ 467 Μέσες τι ές x 9 3/3767 /3733 Χ 7 7 8 9 Ex x X -4-7 -7 /33733 5/35033 ιασπορές s Es 36 / 9 36 S 775 & σ 467 x X + + - x X 4 7 7 x x X 3 X + +5 + +5 +7 x3 X +5 +5 +7 E( xi X) ( xu X) -6-37/3-49/3-04/9-56 E( xi X) ( xu X) 6 37/3 49/3 04/9 56 Πίνακας Πίνακας 5 5 πίνακα 5 οι υπολογισμοί και τα αποτελέσματα που προέκυψαν και είναι στο τελευταίο κελί της 7 ης γραμμής Στον πίνακα είναι: 5 οι υπολογισ οί και τα αποτελέσ ατα που προέκυψαν και είναι στο τελευταίο κελί της 5 7 ης ης γρα ής είναι: Es 36 36 5 Es + + 36 / 9 36 3 3 3 με μέση τιμή και η διασπορά 7 αναφέρεται σε σχέση ε τη έση τι ή Χ 7 7 8 9 Ex και υπολογίζεται με ε τη χρήση όλων των τιμών τι ών των τριών δειγμάτων, δειγ άτων είτε είναι η S 775 με ε Ν- βε είτε είναι Ν η σ βε 467 είτε είναι με Ν9 η σ βε 467 ε Ν9 βε Επίσης τα στοιχεία της τελευταίας γραμμής γρα ής είναι οι οι μέσες έσες τιμές τι ές των των γινομένων γινο ένων διαφορών που που είναι ακριβώς από είναι πάνω ακριβώς τους στην από ίδια πάνω στήλη τους Ο στην πρώτος ίδια στήλη από τους Ο τρείς πρώτος αριθμούς από τους είναι τρείς ο αριθ ούς είναι ο 4 + 5 4 5 6 3 Ο δεύτερος και ο τρίτος αριθμός αριθ ός της τελευταίας γραμμής γρα ής είναι αντίστοιχα οι 37 7 + 5 7 5 3 3 και 49 7 ( ) 7 7 7 3 3 Οι τρείς αυτοί αριθμοί αριθ οί έχουν μέση έση τιμή τι ή την την ποσότητα -04/9-56 04/9 56 που που εμφανίζεται ε φανίζεται στο στο τελευταίο κελί της τελευταίο τελευταίας κελί γραμμής της τελευταίας του Πίνακα γρα ής του πίνακα Επομένως Επο ένως ο δείκτης συσχέτισης εκτιμάται εκτι άται ως E ( xi X ) ( xu X ) 56 ˆδ 0 4686 σ 4 67 και η διασπορά της εκτι ήτριας της έσης τι ής του πληθυσ ού κατά τη Συ είναι ίση ε ˆ σ 4 67 ˆV ( x ) ( + ( n ) ˆ δ ) ( + ( 0 4686) ) 0 564 n 3 Μια εκτί ηση εξάλλου για τη διασπορά της εκτι ήτριας της έσης τι ής του πληθυσ ού κατά την ΑΤ είναι

και η διασπορά της εκτιμήτριας της μέσης τιμής του πληθυσμού κατά τη ΣυΔ είναι ίση με ˆ σ 4 67 ˆV ( x ) ( + ( n ) ˆ δ ) ( + ( 0 4686) ) 0 564 n 3 Μια εκτίμηση εξάλλου για τη διασπορά της εκτιμήτριας της μέσης τιμής του πληθυσμού κατά την ΑΤΔ είναι n S ˆ 4 9 7 75 ˆV ( x AT ) 97 n 4 9 Έχουμε δηλαδή την ανισότητα Vˆ ( x ) <Vˆ ( xat ), που υποδεικνύει ότι προτιμητέα είναι η ΣυΔ για τον συγκεκριμένο πληθυσμό και τη συγκεκριμένη τμ Χ αλλά και το συγκεκριμένο μέγεθος δείγματος n3, σύμφωνα με το θεώρημα 53 (β) Με την ισοδυναμία του θεωρήματος 53, δηλαδή της σχέσης (57) Πρέπει να υπολογίσουμε τις δύο διασπορές S και S, αλλά τώρα με σύνολο αναφοράς όλο τον πληθυσμό w Π και όχι μερικά ( ή 3) δείγματα από τα οκτώ συνολικά που υπάρχουν Ο Πίνακας 53 που ακολουθεί έχει όλα τα δείγματα και μερικά αποτελέσματα των υπολογισμών ο ο 3 ο 4 ο 5 ο 6 ο 7 ο 8 ο Π 7 4 4 3 5 0 9 6 9 0 6 3 3 3 7 5 5 4 x 7 3 8 5 5 X9 x 7 9 3/3 7 /3 8/3 5/3 5/3 X8 s 36 /3 5 5/3 9/3 67/3 73/3 Πίνακας 53 S w 85 6 Εξάλλου η διασπορά, καθώς βλέπουμε τον πληθυσμό ως μία ενότητα (Ν-3 βαθμοί ελευθερίας), ισούται με 50 85 73 S 7 < 3083 36 + + + S w 3 6 8 3 Vˆ x <Vˆ x Η τελευταία σχέση και το θεώρημα 53 μας βοηθούν να συμπεράνουμε ότι ( ) ( ) Άρα, ακριβέστερη και πιο αξιόπιστη είναι η ΣυΔ για τον συγκεκριμένο πληθυσμό και την συγκεκριμένη τμ Χ αλλά και το συγκεκριμένο μέγεθος δείγματος n3 Γενική παρατήρηση: Αμφότερες οι διαδικασίες έδωσαν το ίδιο συμπέρασμα Σημείωση 53: Στο ανωτέρω παράδειγμα 5 επιλέξαμε τα τρία δείγματα από τα 8, με απλή τυχαία δειγματοληψία, ώστε να είναι δυνατό για τη σύγκριση των διασπορών να χρησιμοποιηθεί η σχέση n Sˆ ˆV ( xat ) n Παράδειγμα 5: Δίνεται πληθυσμός Π μεγέθους Ν4 ατόμων και μελετούμε την τμ Χ με τιμές τα στοιχεία του συνόλου Α Χ {4,,7,0,4,0,8,8,5,,7,,4,,9,0,4,,8,0,3,,,} που είναι γραμμένα κατά αύξουσα σειρά Είναι πχ Χ 3 7, Χ 6 0, Χ 3 κλπ (α) Στη δειγματοληψία με δείγμα μεγέθους n3 να διαπιστωθεί αν είναι προτιμότερη η ΣυΔ από την ΑΤΔ (β) Στη δειγματοληψία με δείγμα μεγέθους n4 να διαπιστωθεί επίσης αν είναι προτιμότερη η ΣυΔ από την ΑΤΔ AT

Λύση (α) Τριμελή συστηματικά δείγματα θα πάρουμε, αν γράψουμε όλα τα στοιχεία του πληθυσμού Π σε n3 γραμμές με /n4/38 στοιχεία η καθεμία γραμμή Η διαπίστωση αν είναι προτιμότερη ή όχι η ΣυΔ από την ΑΤΔ μπορεί να γίνει με δύο, τουλάχιστον, τρόπους: (α) με τον δείκτη συσχέτισης (β) με την ισοδυναμία του Θεωρήματος 53 [βλ σχέση (57)] Θα εφαρμόσουμε Η διαπίστωση το δεύτερο αν κριτήριο είναι προτι ότερη Για τον σκοπό ή αυτό όχι η πρέπει Συ από να υπολογίσουμε την ΑΤ πορεί τις δύο να διασπορές γίνει ε δύο S (τουλάχιστον) τρόπους: και (α) Με το δείκτη συσχέτισης S (β) Με την ισοδυνα ία του Θεωρή ατος 53, βλέπε σχέση (57) w Θα εφαρ όσου ε το δεύτερο κριτήριο Για το σκοπό αυτό πρέπει να υπολογίσου ε τις δύο αλλά με σύνολο διασπορές αναφοράς όλον τον πληθυσμό Π και όχι μερικά ( ή 3) δείγματα από τα οκτώ συνολικά που υπάρχουν S Ο Πίνακας 54 και που ακολουθεί έχει όλα τα δείγματα και μερικά αποτελέσματα των υπολογισμών S w αλλά ο ε σύνολο ο αναφοράς 3 ο όλο 4 ο τον πληθυσ ό 5 ο Π 6 ο και όχι ερικά 7 ο ( 8 ή ο 3) δείγ ατα Π από τα οκτώ συνολικά 4 που υπάρχουν 7 0 4 0 8 8 Ο Πίνακας 53 που ακολουθεί έχει όλα τα δείγ ατα και ερικά αποτελέσ ατα των υπολογισ ών 5 7 4 9 0 4 ο 7 ο 0 3 ο 3 4 ο 5 ο 6 ο 7 ο 8 ο Π x 3 4 6 7 0 4 9 0 60 8 8 X0 5 7 4 9 0 x 3/3 4/3 4 7 6/3 7 /3 0 /3 3 9/3 0 X8375 x 3 4 6 9 60 X0 s /3 x /3 0 /3 /3 3/3 4 S w 5 3/3 4/3 7 6/3 /3 /3 9/3 0 X8375 s /3 /3 0 Πίνακας /354 /3 /3 3/3 4 S w 5 Πίνακας 53 Εξάλλου, η διασπορά, καθώς βλέπουμε τον πληθυσμό ως μία ενότητα (Ν-3 βαθμοί ελευθερίας), ισούται με Εξάλλου η διασπορά καθώς βλέπου ε τον πληθυσ ό ως ία ενότητα (Ν 3 βαθ οί S 5685 > ελευθερίας) 5 S w ισούται ε Η τελευταία σχέση S 5685 και το > Θεώρημα 5 S53 w μας βοηθούν να συμπεράνουμε ότι Vˆ ( x ) >Vˆ ( xat ) Η τελευταία σχέση και το Θεώρη α 53 ας βοηθούν να συ περάνου ε ότι και άρα θα προτιμηθεί Vˆ η ΑΤΔ και όχι η ΣυΔ (εδώ στην περίπτωση που εξετάζουμε) ( x ) >Vˆ ( xat (β) Στη δεύτερη περίπτωση ισχύει ) ότι /n4/46, άρα θα έχουμε 6 το πλήθος δείγματα-στήλες Πρέπει να υπολογίσουμε και άρα θα προτι ηθεί τις δύο διασπορές η ΑΤ και S και όχι S η Συ φυσικά (εδώ και στην πάλι περίπτωση με σύνολο που αναφοράς εξετάζου ε) όλο τον πληθυσμό Π Ο Πίνακας (β) Στη 55 δεύτερη που ακολουθεί περίπτωση έχει ισχύει όλα τα ότι δείγματα /n4/46, και μερικά άρα αποτελέσματα θα έχου ε 6 το των πλήθος υπολογισμών δείγ ατα w στήλες Πρέπει να ο υπολογίσου ε ο τις 3 ο δύο διασπορές 4 ο S5 ο και S w6 ο φυσικά και Π πάλι ε σύνολο αναφοράς όλο τον πληθυσ ό Π Ο Πίνακας 54 που ακολουθεί έχει όλα τα δείγ ατα και ερικά 4 7 0 4 0 αποτελέσ ατα των υπολογισ ών 8 8 5 7 ο ο 3 ο 4 ο 5 ο 6 ο Π 4 7 9 0 0 4 0 87 8 0 53 7 4 9 0 4 x 73 0 40 34 4 7 45 X0 x 3 40 4 4 7 45 X0 x 3/4 0 6 4/4 7/4 45/4 X8375 X8375 s 45 45 0867 0867 667 667 033 033 45 45 409 409 S w 6585 Πίνακας 54 Εξάλλου η διασπορά της τ Χ Πίνακας καθώς βλέπου ε 55 τον πληθυσ ό ως ία ενότητα ισούται ε Εξάλλου, η Sδιασπορά 5685 της < 6585 τμ Χ, Sκαθώς w βλέπουμε τον πληθυσμό ως μία ενότητα, ισούται με Η τελευταία σχέση και το Θεώρη α 53 ας βοηθούν να συ περάνου ε ότι V ˆ x <V ˆ x ( ) ( AT )

S 5685 < 6585 S w Η τελευταία σχέση και το Θεώρημα 53 μας βοηθούν να συμπεράνουμε ότι ˆ ( ) ˆ ( ) V x <V x και άρα θα προτιμηθεί η ΣυΔ αντί της ΑΤΔ, όταν είναι n4επομένως προκύπτει ότι εξαρτάται από το μέγεθος του δείγματος το αν θα χρησιμοποιήσουμε την ΣυΔ ως προτιμότερη της ΑΤΔ ή το αντίθετο Σημείωση 53: Μια προσεκτική ματιά στον Πίνακα 54, ειδικά στη γραμμή των αθροισμάτων των δειγμάτων (5 η γραμμή), μας αποκαλύπτει ότι υπάρχει μία περιοδικότητα στα δεδομένα της τμ Χ η οποία γίνεται εμφανέστερη, επειδή την παρατηρούμε στο άθροισμα των τιμών Η περίοδος φαίνεται να είναι Τ4 Απλά αντί της ισότητας ακριβώς ισχύει η προσεγγιστική σχέση X r X r+ T, r,,3, Αυτή η περιοδικότητα, ενώ υπάρχει, δεν είναι φανερή στον Πίνακα 54 επειδή το πλήθος των στηλών του Πίνακα είναι 6 και η περίοδος Τ4 δεν διαιρεί το 6 AT 53 Κυκλικός Νόμος Στη ΣυΔ έχουμε έναν πληθυσμό Π με Ν άτομα u i, i,,3,, διατεταγμένα σύμφωνα με τον δείκτη τους και μελετούμε την τμ Χ (ίσως και άλλες παράλληλα) με αντίστοιχες τιμές Χ i, i,,3,, Η διάταξη των τιμών της τμ Χ είναι άμεση και με βάση το δείκτη i,,3,, Η μελέτη της τμ Χ και των αντικειμένων ή εννοιών γενικά που απεικονίζει γίνεται με δειγματοληψία, όπου το δείγμα έχει μέγεθος n< Όταν το n διαιρεί το Ν, τότε όλα τα στοιχεία ή καλύτερα όλες οι (αντίστοιχες) τιμές της τμ Χ τοποθετούνται σε ισομήκεις γραμμές με /n στοιχεία η καθεμία και ο όλος πληθυσμός Π έχει τοποθετημένες τις Ν τιμές της υπό μελέτη τμ Χ σε έναν nx πίνακα (matrix) Κάθε στήλη του πίνακα είναι ένα δείγμα παρμένο με ΣυΔ από τον πίνακα αναγραφής των τιμών της τμ Χ Ήδη με το Θεώρημα 5 αποδείχτηκε ότι όταν το n διαιρεί το Ν, δηλαδή όταν ισχύει η σχέση διαιρετότητας 0modn, τότε η μέση τιμή του δείγματος είναι αμερόληπτη (unbiased) εκτιμήτρια της μέσης τιμής του πληθυσμού Με τα δύο θεωρήματα 5 και 53 που ακολούθησαν τακτοποιήθηκαν τα θέματα περί του μεγέθους της διασποράς της εκτιμήτριας της μέσης τιμής του πληθυσμού Επίσης, γίνεται και η διερεύνηση για το πότε είναι προσφορότερη η χρήση της ΣυΔ αντί της ΑΤΔ με βάση τη διασπορά (ποιότητα, αξιοπιστία) της εκτιμήτριας της μέσης τιμής του πληθυσμού Όλα τα παραπάνω είναι εύχρηστα και φυσικά έχουν θεωρητικό αλλά και πρακτικό ενδιαφέρον Το μειονέκτημα τους είναι ότι όλα ισχύουν υπό την προϋπόθεση ότι ισχύει η 0modn Οι πιθανότητες να ισχύει 0modn είναι όμως πολύ περιορισμένες Το πιο συνηθισμένο είναι να ισχύει amodn, a 0 Στην περίπτωση αυτή αποφασίζοντας να έχουμε δείγμα μεγέθους n μπορεί στην πράξη να έχουμε δείγμα μεγέθους n ή n+ Διαφωτιστικό είναι το παρακάτω παράδειγμα Παράδειγμα 53: Η τμ Χ περιγράφει μία χαρακτηριστική ιδιότητα των ατόμων του πληθυσμού Π μεγέθους Ν38 ατόμων Θέλουμε να πάρουμε δείγμα μεγέθους n7 από τον Π για τη μελέτη της τμ Χ και της ιδιότητας που απεικονίζει Να γίνει ο αντίστοιχος Πίνακας των συστηματικών δειγμάτων (Συστηματικός Πίνακας) Λύση Τοποθετούμε τις τιμές της Χ σε διαδοχικές γραμμές που να περιλαμβάνουν από 38 5 n 7 άτομα η καθεμία και όπου το σύμβολο [x] σημαίνει το ακέραιο μέρος του πραγματικού αριθμού x, δηλαδή τον μεγαλύτερο ακέραιο που δεν ξεπερνάει τον πραγματικό αριθμό x Για διευκόλυνσή μας και για οικονομία χώρου η τιμή Χ i της τμ Χ θα παριστάνεται στον Πίνακα 53 με το δείκτη της i και μόνο, i,,3,,38

ο δείγμα ο δείγμα 3 ο δείγμα 4 ο δείγμα 5 ο δείγμα Ομάδα A 3 4 5 Ομάδα B 6 7 8 9 0 Ομάδα Γ 3 4 5 Ομάδα Δ 6 7 8 9 0 Ομάδα Ε 3 4 5 Ομάδα ΣΤ 6 7 8 9 30 Ομάδα Ζ 3 3 33 34 35 Ομάδα Η 36 37 38 Πίνακας 53 Το ποιο δείγμα θα επιλεγεί από τα 5 διαθέσιμα του Πίνακα είναι αποτέλεσμα κλήρωσης ανάμεσα στους αριθμούς (στοιχεία) του συνόλου {,,3,4,5} Αν κληρωθεί, ή 3 θα έχουμε 8-μελές δείγμα, ενώ σκοπεύαμε να έχουμε 7-μελές Αν κληρωθεί 4 ή 5 θα έχουμε πράγματι 7-μελές δείγμα Αυτό το γεγονός διασαλεύει λίγο τον κανόνα της αμεροληψίας Δεν ισχύει, δηλαδή, ακριβώς ο κανόνας αμεροληψίας που αποδίδεται με τη σχέση Ex X και ισχύει η προσεγγιστική σχέση Ex X + b, b 0 και η ποσότητα b είναι η μεροληψία της εκτιμήτριας της μέσης τιμής του πληθυσμού και μπορούμε να τη γράψουμε με τη μορφή: b Ex X Με αφορμή το παράδειγμα 53 έχουμε σχετικά με τη ΣυΔ τα εξής: Στη γενική περίπτωση και για τον πληθυσμό Π, μεγέθους Ν, ο Πίνακας των συστηματικών δειγμάτων ή Συστηματικός Πίνακας έχει στήλες και ισχύει η σχέση n + υ, 0 υ < και (α) όταν είναι υ0, τότε έχουμε το ισοδύναμο του 0modn που εξετάστηκε ήδη σε προηγούμενη παράγραφο και αντιστοιχεί σε πίνακα n γραμμών και στηλών ακριβώς (β) όταν είναι 0<υ<, έχουμε το ισοδύναμό του υmodn, υ 0, υ 3,,,, και η μορφή του Πίνακα έχει ως εξής: Οι πρώτες υ στήλες έχουν από n+ στοιχεία (γραμμές) η καθεμία και οι επόμενες -υ στήλες έχουν από n στοιχεία (γραμμές) η καθεμία τους Όλα τα παραπάνω σημαίνουν ότι στον Συστηματικό Πίνακα θα έχουμε δύο ειδών δείγματα και δύο ειδών μέσες τιμές δείγματος: (Α) Στα πρώτα υ δείγματα (στήλες) οι μέσες τιμές θα έχουν παρονομαστή (βαθμοί ελευθερίας) το n+ και μορφή n+ x,a, x( i ),,,, n + + υ i (53) (Β) Στα επόμενα -υ δείγματα (στήλες) οι μέσες τιμές θα έχουν παρονομαστή (βαθμοί ελευθερίας) το n και μορφή n x,b, x( i ) +, υ +,, n i (53)

Προφανές είναι ότι η μέση τιμή των δειγματικών μέσων που θα χρησιμοποιηθεί για τη διαπίστωση της μεροληψίας ή αμεροληψίας είναι η ποσότητα υ Ex x,a, + x,b, υ+ (533) Η μέση τιμή των δειγματικών μέσων τιμών είναι δυνατόν να εκφραστεί και με βήματα διαδοχικά να μετασχηματιστεί ως εξής: υ n+ n Ex x( i ) + x + ( i ) + n+ i n υ+ i και υ n+ n Ex ( ) ( i ) ( i ) ( ) n x + n x + + + n n+ i υ+ i ήτοι ( ) ( ) ( ) + + + + υ+ και τελικά είναι n Ex ( ) ( ) X m + X i + n m n ( n ) + + υ+ i Με δεδομένη και τη γνωστή μορφή για τη μέση τιμή του πληθυσμού X Xm m καταλήγουμε στην έκφραση της μέσης τιμής των δειγματικών μέσων συναρτήσει και της πληθυσμιακής μέσης τιμής της τμ Χ n X Ex + X ( i ) ( n ) n ( n ) + + + υ+ i (534) Η μεροληψία εκφράζεται πλέον με βάση και την (534) ως εξής: ( n ) X n b Ex X + X( i ) + ( n ) n ( n ) + + υ+ i, ήτοι ( υ ) X n b Ex X + Xi + n+ n n+ υ+ i ( ) ( ) ( ) και τελικά έχουμε τη μορφή της μεροληψίας n b Ex X X ( i ) n ( υ) X + n ( n ) + υ+ i (535) Όλα τα παραπάνω, από το σημείο όπου ορίζεται η μεροληψία της εκτιμήτριας της μέσης τιμής του πληθυσμού με τη μορφή b Ex X και μετά, αποτελούν την απόδειξη του επομένου θεωρήματος: Θεώρημα 53: Δίνεται πληθυσμός Π μεγέθους και ο Πίνακας των συστηματικών δειγμάτων-στηλών μεγέθους n τα υ από αυτά και μεγέθους n+ τα υπόλοιπα -υ, όπου n[/] και υν-n Στον πληθυσμό Π μελετούμε την τμ Χ Η μεροληψία (bias) της εκτιμήτριας της μέσης τιμής του πληθυσμού δίνεται από τη σχέση (535) Ισχύει, δηλαδή, η ισότητα n b Ex X X ( i ) n ( υ) X + n ( n ) + υ+ i Διερεύνηση: Η σχέση (535) για την τιμή υ0 δίνει αποτέλεσμα b0, πράγμα συνεπές με το θεώρημα 5 περί αμεροληψίας, όταν

0modn Για όλες τις υπόλοιπες τιμές του υπολοίπου υ η μεροληψία είναι διάφορη του μηδενός, γενικά Για να αποφεύγεται η μεροληψία στην περίπτωση μεγεθών πληθυσμού και δείγματος τέτοιων, ώστε να έχουμε υmodn, υ 0, υ 3,,,,, εφαρμόζεται μία παραλλαγή της μεθόδου της ΣυΔ, όπως την περιγράψαμε έως τώρα, που αποκαλείται «Κυκλικός Νόμος» Ο Κυκλικός Νόμος δεν δίνει μόνο [/n] δείγματα, αλλά δίνει τελικά Ν διαφορετικά δείγματα που έχουν τις εξής δύο ιδιότητες: η ιδιότητα: Είναι όλα μεγέθους n η ιδιότητα: Η εκτιμήτρια της μέσης τιμής του πληθυσμού που προκύπτει από αυτά είναι αμερόληπτη εκτιμήτρια (μεροληψία b0) Για να εφαρμόσουμε τον Κυκλικό Νόμο, ακολουθούμε τα εξής βήματα της μεθόδου αυτής: ο βήμα: Ορίζουμε το μέγεθος n του δείγματος ο βήμα: Ορίζουμε την απόσταση (διαφορά δεικτών) μεταξύ των οποιωνδήποτε δύο διαδοχικών τιμών του δείγματος Αυτή είναι το γνωστό ως τώρα [/n] 3 ο βήμα: Κάνουμε κλήρωση μεταξύ των στοιχείων του συνόλου {,,3,,Ν} και προκύπτει το στοιχείο r 4 ο βήμα: Με πρώτο στοιχείο του δείγματος το στοιχείο Χr συμπεριλαμβάνουμε στο δείγμα όλα τα στοιχεία με δείκτη r+ λ i i, λ 0,,,,n r + λ i >, (536) ώστε να συμπληρωθεί ένα δείγμα μεγέθους n, όπως προκύπτει από τις τιμές λ0,,,,n- Το δείγμα που δημιουργείται από τη διαδικασία των 4 βημάτων (ανωτέρω) μπορεί να παραχθεί με πρώτο στοιχείο οποιοδήποτε στοιχείο του συνόλου {,,3,,Ν} Άρα, με τη μέθοδο αυτή έχουμε τη δυνατότητα να έχουμε Ν διαφορετικά συστηματικά δείγματα αντί των [/n] που μας παρέχει η κλασική διαδικασία Εννοείται ότι τα στοιχεία του συνόλου {,,3,,Ν} είναι οι δείκτες των Ν τιμών της τμ Χ που μελετούμε Χρειάζονται n στοιχεία για το καθένα από τα Ν δείγματα, άρα n στοιχεία συνολικά με δείκτες από τους αριθμούς {,,3,,Ν} Σημειώνεται ότι το τελευταίο δείγμα θα είναι με δείκτες τους (r), +, +, +3,, +(n-) εκφρασμένους με τη μορφή του υπόλοιπου διαίρεσης με διαιρέτη το Ν, δηλαδή οι δείκτες αυτοί θα μετατραπούν σε Ν,,, 3,, (n-) Ο πρώτος δείκτης παραμένει Ν, επειδή δεν υπάρχει το 0 ως δείκτης, Θα βοηθούσε πολύ στο να προχωρήσουμε στην ανάλυση για τη μορφή των δειγμάτων και να γίνουν κατανοητά μερικά πράγματα σχετικά και με τις ιδιότητες των εκτιμητριών της μέσης τιμής του πληθυσμού (αμεροληψία), αν περιγράφουμε τα δείγματα με τους δείκτες των τιμών της τμ Χ που μετέχουν σ αυτά (τα δείγματα) και που περιέχονται στο σύνολο {,,3,,Ν} Θα δώσουμε με τη μορφή αυτή μερικά «πρώτα» δείγματα, δηλαδή με πρώτο δείκτη r,,3,4 Μετά θα δώσουμε μερικά από τα «τελευταία», δηλαδή με πρώτο δείκτη rν-3, Ν-, Ν-, Ν Όλες αυτές οι απεικονίσεις των δειγμάτων περιέχονται στον παρακάτω Πίνακα 53: ο δείγμα + + 3+ (n-)+ ο δείγμα + + 3+ (n-)+ 3 ο δείγμα 3 +3 +3 3+3 (n-)+3 4 ο δείγμα 4 +4 +4 3+4 (n-)+4 Ν-3 δείγμα -3-3 -3 3-3 (n-)-3 Ν- δείγμα - - - 3- (n-)- Ν- δείγμα - - - 3- (n-)- Ν δείγμα Ν 3 (n-) Πίνακας 53

Τα τελευταία 4 δείγματα κανονικά είχαν δείκτες που δίνονται από τα επόμενα 4 σύνολα δεικτών, αλλά τους εκφράσαμε στον Πίνακα 53 ως υπόλοιπα διαίρεσής τους με το μέγεθος του πληθυσμού Ν Εργαζόμαστε, δηλαδή, με τη λογική της ισοδυναμίας xmod και με σύνολο αναφοράς το σύνολο των δεικτών {,,3,,Ν} Οι κανονικοί δείκτες των 4 τελευταίων δειγμάτων ήταν λοιπόν: {-3 +-3 +-3 (n-)+-3} {- +- +- (n-)+-} {- +- +- (n-)+-} { + + (n-)+} Κατόπιν όλων αυτών, αν θεωρήσουμε τις στήλες του Πίνακα 53, θα δούμε ότι σε όλες τους υπάρχουν όλα τα στοιχεία του συνόλου {,,3,,Ν} και διατεταγμένα, αλλά μόνο στην πρώτη στήλη είναι στη φυσική τους μορφή Στις υπόλοιπες στήλες υπάρχουν όλα πάλι και διατεταγμένα, αλλά η εμφάνισή τους ξεκινάει από ένα άλλο στοιχείο του συνόλου {,,3,,Ν} και μόλις φτάσουμε στο Ν, συνεχίζεται από την αρχή η παράθεση των δεικτών,, 3, κλπ Η δεύτερη πχ στήλη αρχίζει από το +, προχωράει κανονικά η παράθεση των δεικτών κατά τη φυσική διαδοχή των ακεραίων ως το Ν και συνεχίζει από το ως το Τα ίδια γίνονται και με την τρίτη στήλη κλπ Γενικά μία στήλη τέτοιων δεικτών έχει τη μορφή {α, α+, α+, Ν,,,3,,α-} για κάθε α στοιχείο του συνόλου {, +, +, 3+,, (n-)+} με [/n] Έχοντας το κάθε δείγμα n στοιχεία έχουμε n στήλες Άρα συνολικά το κάθε στοιχείο του συνόλου των δεικτών {,,3,,Ν} εμφανίζεται σε όλα τα δείγματα από n φορές Αυτό σημαίνει ότι αν θεωρήσουμε τη μέση τιμή της τμ Χ στο κάθε δείγμα ως την τιμή της μεταβλητής x, τότε η μέση τιμή αυτής της μεταβλητής θα είναι η n Ex x m x X m + ( i ) m m i Όλα τα παραπάνω περί της δομής των συστηματικών δειγμάτων του Κυκλικού Νόμου μπορούν να θεωρηθούν ως η απόδειξη του παρακάτω θεωρήματος: Θεώρημα 53: Η εκτιμήτρια της μέσης τιμής του πληθυσμού που προκύπτει από τα δείγματα του κυκλικού νόμου είναι αμερόληπτη Το Θεώρημα 53 εξασφαλίζει ότι για οποιεσδήποτε τιμές των μεγεθών του πληθυσμού και του δείγματος έχουμε αμερόληπτη εκτιμήτρια για τη μέση τιμή του πληθυσμού Με τον Κυκλικό Νόμο έχουμε τη δυνατότητα να ισχύει η σχέση υmodn, υ 0, υ 3,,,, και συγχρόνως να έχουμε την αμεροληψία της εκτιμήτριας της μέσης τιμής του πληθυσμού Παράδειγμα 53: Τα τιμολόγια που εκδόθηκαν το πρωΐ μιας ημέρας ήταν Ν3, αριθμημένα με χρονική σειρά έκδοσης τους Τα ποσά σε στα τιμολόγια κατά αύξοντα αριθμό είναι τα εξής (ακρίβεια ακεραίας μονάδας):, 8, 89, 76, 3,, 59, 98, 30, 69, 9, 6, 44, 55, 34, 86, 66, 78, 87, 49, 65,, 0, 9, 59, 43, 56, 7, 6, 57, 9, 03 (α) Να δημιουργηθούν όλα τα δυνατά δείγματα με μέγεθος n6 με τον Κυκλικό Νόμο (β) Πόσα τέτοια δείγματα μπορούμε να πάρουμε; (γ) Ποια η τιμή του για τα 6-μελή δείγματα; (δ) Να ευρεθεί η μέση τιμή του πληθυσμού X για την τμ Χ «αναγραφόμενο ποσό στο τιμολόγιο» Να συγκριθεί με τη μέση τιμή των δειγματικών μέσων τιμών, την Ex (ε) Να υπολογιστεί απευθείας η διασπορά της εκτιμήτριας x της μέσης τιμής του πληθυσμού X (στ) Να ευρεθεί η διασπορά του πληθυσμού S Λύση (α) Όλα τα δυνατά 6-μελή δείγματα είναι στον παρακάτω Πίνακα 533 ο 9 86 65 43 0,83 ο 8 59 6 66 56 39,50

3 ο 89 98 44 78 0 7 80,7 4 ο 76 30 55 87 9 6 95,67 5 ο 3 69 34 49 59 57 48,50 6 ο 9 86 65 43 9 98,00 7 ο 59 6 66 56 03 70,33 8 ο 98 44 78 0 7 85,50 9 ο 30 55 87 9 6 8 86,00 0 ο 69 34 49 59 57 89 59,50 ο 9 86 65 43 9 76 9,7 ο 6 66 56 03 3 64,33 3 ο 44 78 0 7 87,67 4 ο 55 87 9 6 8 59 45,67 5 ο 34 49 59 57 89 98 64,33 6 ο 86 65 43 9 76 30 7,7 7 ο 66 56 03 3 69 7,50 8 ο 78 0 7 9 95,50 9 ο 87 9 6 8 59 6 40,83 0 ο 49 59 57 89 98 44 66,00 ο 65 43 9 76 30 55,00 ο 56 03 3 69 34 66,7 3 ο 0 7 9 86 96,83 4 ο 9 6 8 59 6 66 37,33 5 ο 59 57 89 98 44 78 70,83 6 ο 43 9 76 30 55 87 09,00 7 ο 56 03 3 69 34 49 7,33 8 ο 7 9 86 65 07,50 9 ο 6 8 59 6 66 34,50 30 ο 57 89 98 44 78 0 77,83 3 ο 9 76 30 55 87 9 06,67 3 ο 03 3 69 34 49 59 7,83 Πίνακας 533 Κάθε γραμμή περιέχει και από ένα συστηματικό δείγμα στα έξι κελιά της από το ο μέχρι και το 7 ο Στο τελευταίο (8 ο ) κελί κάθε γραμμής εμφανίζεται η μέση τιμή του αντίστοιχου συστηματικού δείγματος με βάση τον Κυκλικό Νόμο του οποίου τα στοιχεία είναι στα προηγούμενα 6 κελιά Η πρώτη στήλη έχει τους αύξοντες αριθμούς των 3 δειγμάτων που προκύπτουν από την εφαρμογή του Κυκλικό Νόμου (β) και (γ) Μπορούμε να πάρουμε Ν3 δείγματα 6-μελή (βλέπε η στήλη του πίνακα) αρχίζοντας από ένα στοιχείο του πληθυσμού κάθε φορά και εφαρμόζοντας τον Κυκλικό Νόμο με βήμα [/n][3/6]5 Πχ το 4ο δείγμα θα έχει τα στοιχεία 4 ο, 9 ο, 4 ο, 9 ο, 4 ο και 9 ο, ήτοι τις τιμές 76, 30, 55, 87, 9, 6 (δ) Η μέση τιμή του πληθυσμού είναι το πηλίκο των 3 δεδομένων του πληθυσμού με το πλήθος τους 3 Είναι, δηλαδή, X ( + 8 + 89 + + 9 + 03) 77 97 3

με ακρίβεια δεκαδικών κλασματικών ψηφίων ( δκψ) Σημειώνεται ότι η μέση τιμή για το κάθε δείγμα βρίσκεται στο τελευταίο κελί της αντίστοιχης γραμμής του Πίνακα 533 με την ίδια ακρίβεια των δκψ Η μέση τιμή των 3 αυτών μέσων τιμών είναι Ex Ex 77 97 X,c σε πλήρη συμφωνία με το Θεώρημα 53 περί αμεροληψίας της εκτιμήτριας x,c της μέσης τιμής του πληθυσμού, με χρήση του Κυκλικό Νόμου (ε) Η διασπορά της εκτιμήτριας x,c της μέσης τιμής του πληθυσμού μπορεί να υπολογιστεί απευθείας από τις μέσες τιμές των 3 δειγμάτων, αφού γνωρίζουμε τη μέση τιμή τους Ex,c 77 97 X Ισούται με 3 3 Varx,c ( x c,i X ) ( x,c,i 77 97) 59 4 n i 3 i (στ) Η διασπορά του πληθυσμού είναι 3 3 S ( Xi X) ( X i 77 97) 3349 3 3 i i Αν είχαμε ΑΤΔ και παίρναμε 6-μελές δείγμα από 3-μελή πληθυσμό Π, η διασπορά της εκτιμήτριας, ως γνωστόν, είναι n 3 VarxAT S 3349 3 453 53 < 59 4 Varx,c n 96 Έχουμε, δηλαδή, μία ένδειξη ότι η ΑΤΔ θα ήταν προτιμότερη από τη ΣυΔ μέσω κυκλικού νόμου στην παρούσα περίπτωση Σημειώνεται ότι το συμπέρασμα αυτό δεν μπορεί να γενικευτεί 54 Γραμμική και Εκθετική τάση τιμών της τυχαίας μεταβλητής Στη ΣυΔ η μελέτη των φαινομένων που αναφέρονται στον πληθυσμό Π μεγέθους βασίζεται στο λεγόμενο συστηματικό n-μελές δείγμα, όπου η δειγματοληψία γίνεται με βάση το βήμα [Ν/n], που ισούται με τη διαφορά των δεικτών των διαδοχικών τιμών της υπό μελέτη τμ Χ Οι δείκτες των τιμών της τμ Χ που εισέρχονται διαδοχικά στο δείγμα αποτελούν αρχικό απόκομμα αριθμητικής προόδου με πρώτο στοιχείο έναν δείκτη τυχαία εκλεγμένο μέσα από το σύνολο {,,3,,} και βήμα το Αυτή η συνθήκη της αριθμητικής προόδου ισχύει σε κάθε περίπτωση εφαρμογής της ΣυΔ Στην παράγραφο αυτή θα ασχοληθούμε με περιπτώσεις όπου όχι μόνο οι δείκτες έχουν μία αλληλουχία ενδιαφέρουσα, όπως η παραπάνω, αλλά και οι ίδιες οι τιμές της τμ Χ σε ολόκληρο τον πληθυσμό έχουν μία αξιοσημείωτη και αξιοποιήσιμη αλληλουχία Τέτοια αλληλουχία περιγράφεται σχηματικά συνήθως από μια αναδρομική σχέση, όπως η επόμενη X i+ f( X;β i ) (54) με διάφορες μορφές υλοποίησης αλλά και παραλλαγές τους Μορφές που υλοποιούν την (54) είναι η γραμμική (ή αριθμητική) τάση, που περιγράφεται από τη μορφή της παραπάνω συνάρτησης ως X i f( X; i β) X + + i β, X α (54) και η εκθετική (ή γεωμετρική) τάση, που περιγράφεται από τη μορφή της ίδιας συνάρτησης ως X i f( X; i β) X i β, X γ + 0, β { 0,} (543) Η ΣυΔ σε πληθυσμούς, όπου η τμ Χ ακολουθεί τάσεις όπως οι παραπάνω, αναδεικνύει διάφορα ευρήματα αλλά και ακολουθεί κανόνες που μειώνουν το κόστος ή/και τον χρόνο της μελέτης Θα εξετάσουμε χωριστά τη γραμμική τάση και τη γεωμετρική τάση με λεπτομέρεια

(A) Γραμμική τάση στις τιμές της τυχαίας μεταβλητής Έστω ότι μία τμ Χ που αναφέρεται σε χαρακτηριστική ιδιότητα των ατόμων του πληθυσμού Π, μεγέθους Ν, έχει τιμές που παρουσιάζουν γραμμική τάση Ισχύει, δηλαδή, για την Χ η σχέση (54) Μεταβαίνοντας από την αναδρομική εξίσωση ορισμού της τμ Χ στην αναλυτική έχουμε την έκφραση Xm α + ( m ) β,m, (544) όπου το σύνολο Ν είναι το σύνολο των φυσικών αριθμών Η σχέση (544) είναι πολύ χρήσιμη στην απόδοση των βασικών στατιστικών παραμέτρων της Χ συναρτήσει των συντελεστών α και β Τα άθροισμα του πληθυσμού της τμ Χ δίνεται από τη σχέση ( α ( ) β) α β ( ) X X + m + m m m m m και τελικά έχουμε το συμπέρασμα X a+ β, (545) που οδηγεί αυτόματα στη σχέση για τη μέση τιμή της τμ Χ X X a+ β (546) και ανοίγει το δρόμο για τον προσδιορισμό της διασποράς του πληθυσμού μετά από μια σύντομη σειρά πράξεων, ήτοι S Xm X ( α + ( m ) β) a+ β m m και μετά τις πράξεις στην παρένθεση και την απλοποίηση του Ν- προκύπτει ή σχέση β S ( + ), (547) που δεν περιέχει μάλιστα τη σταθερά α(χ ) Στη ΣυΔ υποθέτουμε πάντα ότι θέλουμε να πάρουμε ένα δείγμα μεγέθους n Θα καταγράψουμε τα στοιχεία του πληθυσμού σε γραμμές ανά [/n] στοιχεία και θα προκύψουν n διαδοχικές πλήρεις γραμμές και μία, ίσως ακόμη γραμμή με τόσα στοιχεία όσο είναι το υπόλοιπο υ της διαίρεσης του Ν δια ή και γενικότερα υν-n Το στοιχείο u m θα αντιστοιχεί στην τιμή Χ m που, καθώς θα βρίσκεται στην i γραμμή και στην στήλη, θα είναι δυνατό να γραφεί και ως Χ m X i, όπου οι δύο δείκτες (συντεταγμένες) είναι: (α) i[m/] αν το διαιρεί τον m ακριβώς και i[m/]+ αν όχι και (β) m-(i-) Στα επόμενα αυτής της παραγράφου θα υποτίθεται ότι το μέγεθος του δείγματος n διαιρεί το μέγεθος Ν του πληθυσμού, εκτός αν τονίζεται ρητά κάτι άλλο Αυτό σημαίνει ότι όλα τα δείγματα είναι n-μελή Η τιμή X α + i + β i (( ) ) και η μέση τιμή του -δείγματος είναι ίση με n n β x ( α + (( i ) + ) β) α + ( i ) + n i n i ή β x α + (( n ) + ) και οι τιμές του ίδιου δείγματος είναι ίσες με xi α + (( i ) + ) β, i,,,n, οπότε και η διαφορά προκύπτει ίση με ( ) (548)

β β xi x β ( ( i ) + ) (( n ) + ) ( ( i ) ( n ) ) Επομένως, η διασπορά της τμ Χ στο -δείγμα προκύπτει n β β s ( ( i ) ( n ) ) n ( n ) n ( n ) n 4 i 4 3 και μετά το πέρας μερικών ακόμη απλοποιήσεων στην παρένθεση καταλήγουμε στο β s, n ( n + ),,,,, (549) που πιστοποιεί και το ότι η δειγματική διασπορά σε όλα τα δείγματα (σε πλήθος ) είναι ίδια, διότι δεν εξαρτάται από το δείκτη,,3,, Το συμπέρασμα αυτό διευκολύνει πολύ στην απόδειξη του επόμενου θεωρήματος Θεώρημα 54: Όταν οι τιμές της τμ Χ έχουν γραμμική τάση, τότε η διασπορά μέσα από τα δείγματα δίνεται από τη σχέση β Sw ( n+ ) s, Απόδειξη: Ισχύει βασικά η σχέση (55) για τη διασπορά μέσα από τα δείγματα, S w, που λέει ότι η διασπορά αυτή είναι η μέση τιμή όλων των δειγματικών διασπορών, δηλαδή w, S s Αυτή η συνθήκη και το επίσης βασικό συμπέρασμα (549) μας εξασφαλίζουν την ισχύ της S s w, και άρα β β Sw s, n ( n+ ) ( n+ ) Θέλουμε να εκτιμήσουμε την αξιοπιστία της εκτιμήτριας της μέσης τιμής του πληθυσμού και θα αποδείξουμε το επόμενο θεώρημα: Θεώρημα 54: Όταν οι τιμές της τμ Χ έχουν γραμμική τάση, τότε η διασπορά της εκτιμήτριας της μέσης τιμής του πληθυσμού είναι β Varx ( ) Απόδειξη: Ισχύει βασικά η σχέση (56) για τη διασπορά εκτιμήτριας της μέσης τιμής του πληθυσμού συναρτήσει και της διασποράς μέσα από τα δείγματα, ήτοι Varx V x ( n ) ( ) S Sw Συνδυασμός της σχέσης (547) παραπάνω και του Θεωρήματος 54 μας δίνει ( ) β ( n ) β Varx V ( x ) ( + ) ( n + ), ήτοι β ( ( )) ( ) β Varx V ( x ) n και το θεώρημα αποδείχθηκε Σχολιάζοντας το αποτέλεσμα διαπιστώνουμε ότι το βέλτιστο αποτέλεσμα (ελάχιστη διασπορά της εκτιμήτριας) το δίνει η ελάχιστη τιμή του πλήθους των δειγμάτων της ΣυΔ, το Αυτή είναι η τιμή Αυτό σημαίνει ότι την καλύτερη εκτίμηση την έχουμε, όταν πάρουμε συστηματικό δείγμα ίσο με τον μισό πληθυσμό,

δηλαδή μέγιστο κόστος Μια καλύτερη αξιοποίηση των παραπάνω αποτελεσμάτων και των διαφόρων ποσοτήτων μπορεί να γίνει αν συγκρίνουμε τις ποσότητες β S ( + ) και β Sw s, ( n+ ), από όπου προκύπτει άμεσα ότι S < S w, οπότε ισχύει και η Varx < VarxAT με βάση τη σχέση (57) στο θεώρημα 53 Άρα καταλήγουμε στο συμπέρασμα: «Όταν οι τιμές της τμ Χ παρουσιάζουν γραμμική τάση, η ΣυΔ είναι προτιμότερη από την ΑΤΔ» Προσπαθώντας να δούμε τα πράγματα με μεγαλύτερη λεπτομέρεια καταγράφουμε τις δυο διασπορές της εκτιμήτριας της μέσης τιμής του πληθυσμού και κάνουμε συγκρίσεις με τη βοήθεια της διαφοράς τους Είναι n n β + n n VarxAT S και Varx β ( ) Άρα, η διαφορά τους είναι ( ) β n β β Varx VarxAT ( ) n ή ( ) ( + ) (( + ) + ) β Varx VarxAT (( + ) ( ) + ), ήτοι η διαφορά των δύο διασπορών είναι δευτεροβάθμιο τριώνυμο με ρίζες και και αρνητική τιμή στο πεδίο μεταβολής του που είναι το [, Ν/] θεωρητικά Τελική μορφή είναι η β Varx VarxAT ( ) ( ) < 0 Η δε βέλτιστη τιμή για τη διαφορά επιτυγχάνεται, όταν έχουμε τιμή της παραμέτρου ίση με το ημιάθροισμα των ριζών +, όπου ακέραιος και σε συνδυασμό με το γεγονός ότι max η βέλτιστη λύση συμπίπτει με τιμή της παραμέτρου που πρέπει ) να είναι ακέραιος, ) να διαιρεί τον Ν και 3) να είναι όσο μπορεί περισσότερο κοντά στον αριθμό + Τα παραπάνω στηρίζονται φυσικά στο γεγονός που προαναφέρθηκε, ότι η διαφορά

β Varx VarxAT ( ) ( ) < 0 είναι δευτεροβάθμιο τριώνυμο ως προς την παράμετρο και ότι με τον όρο βέλτιστη τιμή εννοείται η απόλυτα μικρότερη διαφορά των δύο διασπορών (μέγιστο αλλά αρνητικό αποτέλεσμα μεταξύ αρνητικών αποτελεσμάτων) Παράδειγμα 54: Ένας πληθυσμός έχει μέγεθος Ν68 άτομα Η τμ Χ που περιγράφει μια χαρακτηριστική ιδιότητα των ατόμων του παρουσιάζει γραμμική τάση με βήμα β και Χ α48, δηλαδή οι τιμές της τμ έχουν προσεγγιστικά μέγεθος X m ( m ) 48 +, είναι πχ Χ 35 43, Χ 69 795, Χ 58 κλπ Να εκτιμηθούν οι παράμετροι (α) Μέση τιμή (β) Διασπορά και τυπική απόκλιση (γ) Άθροισμα πληθυσμού (δ) Συντελεστής μεταβλητότητας (ε) Να βρεθεί το που βελτιστοποιεί τη διαφορά των διασπορών ΣυΔ και ΑΤΔ, δηλ τη διαφορά β Varx VarxAT ( )( ) < 0 (στ) Να βρεθεί με ποιο δείγμα μεγέθους n8 προσεγγίζεται καλύτερα η μέση τιμή του πληθυσμού Λύση (α) Η μέση τιμή της τμ Χ της οποίας οι τιμές παρουσιάζουν γραμμική τάση δίνεται από τη σχέση (546) Στην περίπτωση του παρόντος πληθυσμού προκύπτει: 68 X X a + β 48 + 966 5 (β) Η διασπορά υπολογίζεται από τη σχέση (547) και η τιμή της είναι: β S ( + ) 68 69 8686 Η τυπική απόκλιση δίνεται από την τετραγωνική ρίζα της διασποράς, ήτοι β S ( + ) 8686 535 057 (γ) Το άθροισμα του πληθυσμού βασισμένο στη σχέση (545) είναι X a+ β X 68 966 5 637 (δ) Ο Συντελεστής μεταβλητότητας είναι ο λόγος S 535 057 0 5536 X 966 5 (ε) Για να βρεθεί το που βελτιστοποιεί τη διαφορά των διασπορών ΣυΔ και ΑΤΔ, ακολουθούμε τα βήματα: ) Βρίσκουμε το + 68 + 84 5 ) Προσπαθούμε να βρούμε τον κοντινότερο ακέραιο που δεν ξεπερνάει το Ν/84 και διαιρεί το Ν68 Αυτό είναι το 84 που συνδυάζει αυτές τις τρεις ιδιότητες (στ) Η τιμή του [68/8] μας παρέχει δυνατότητες υπολογισμού της εκτίμησης της μέσης τιμής του πληθυσμού Ποια τιμή του δείκτη δίνει την καλύτερη εκτίμηση (ταύτιση ει δυνατόν) για το X 966 5; Εξισώνουμε τα δεύτερα μέλη των σχέσεων (546) και (548) και έχουμε προς λύση ως προς το δείκτη την εξίσωση