16 ΚΕΦΑΛΑΙΟ 1Ο 1.4.2.2 Στάδιο Εκτέλεσης Το στάδιο της εκτέλεσης μίας έρευνας αποτελεί αυτό ακριβώς που υπονοεί η ονομασία του. Δηλαδή, περιλαμβάνει όλες εκείνες τις ενέργειες από τη στιγμή που η έρευνα αρχίζει να υλοποιείται, μέχρι το τέλος της. Κατά το στάδιο αυτό, ουσιαστικά υλοποιούνται όλα όσα μελετήθηκαν και καθορίστηκαν προηγουμένως, στο στάδιο του προγραμματισμού της έρευνας. Αν θεωρήσουμε ότι το στάδιο του προγραμματισμού αποτελεί ένα πιο θεωρητικό στάδιο, το στάδιο της εκτέλεσης συνιστά το πρακτικό μέρος της έρευνας, το οποίο είναι ευρύτερα γνωστό όταν γίνεται αναφορά στην έννοια της στατιστικής έρευνας. Κάθε απόκλιση από τα όσα προβλέφτηκαν και σχεδιάστηκαν κατά το στάδιο του προγραμματισμού, με αυτά που εφαρμόζονται στο στάδιο της εκτέλεσης, αποτελούν προβλήματα που ανακύπτουν κατά το στάδιο της εκτέλεσης της έρευνας και πρέπει να επιλυθούν από τους ερευνητές, ενώ η διαδικασία της εκτέλεσής της είναι σε εξέλιξη. Το δεύτερο στάδιο της έρευνας, το στάδιο της εκτέλεσης, περιλαμβάνει τέσσερις φάσεις, οι οποίες θα αναπτυχθούν επιγραμματικά παρακάτω: 1. Υλοποίηση της έρευνας Περιλαμβάνει την επίβλεψη των ερευνητών, τη συμπλήρωση ερωτηματολογίων, κ.λπ. 2. Ανίχνευση των ερωτηματολογίων. Συνιστά την επιλογή του τρόπου επεξεργασίας. Μπορεί να είναι χειρωνακτική ή να πραγματοποιείται με κάποιο πρόγραμμα στατιστικής για Η/Υ. 3. Παρουσίαση στοιχείων έρευνας Αφορά την ταξινόμηση και την οργάνωση των στοιχείων σε Στατιστικούς Πίνακες καθώς και την απεικόνιση αυτών με Στατιστικά Διαγράμματα. Η παρουσίαση
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ 17 των στοιχείων είναι επιβεβλημένη για την άμεση εξαγωγή συμπερασμάτων, ακόμη και από άτομα με περιορισμένες γνώσεις. 4. Ανάλυση & Ερμηνεία Δεδομένων Τόσο οι πίνακες, όσο και τα διαγράμματα μας δίνουν μια γενική εικόνα του υπό μελέτη θέματος. Για το λόγο αυτό είναι αναγκαία η περαιτέρω ανάλυση των στοιχείων με τη βοήθεια Στατιστικών Μέτρων και Τεχνικών που θα εξετάσουμε σε άλλα κεφάλαια. Έτσι θα έχουμε τη δυνατότητα να παρατηρήσουμε πιο αναλυτικά τη συμπεριφορά των κοινωνικών, οικονομικών και άλλων φαινομένων. Όλα τα προηγούμενα στάδια σκοπό έχουν να βοηθήσουν την ορθή εξαγωγή συμπερασμάτων. Τα αποτελέσματα που θα προκύψουν θα ερμηνευθούν ανάλογα με το σκοπό της έρευνας και είναι η βάση για την εξαγωγή σωστών συμπερασμάτων και τη λήψη κατάλληλων αποφάσεων. Μετά τις τέσσερις φάσεις του δεύτερου σταδίου, θα μπορούσαμε να δεχτούμε ότι υπάρχουν και άλλες δύο, οι οποίες ακολουθούν τις προηγούμενες. Αναφορικά, οι δυο αυτές φάσεις είναι: 1. Η εφαρμογή των αποτελεσμάτων της έρευνας Εφαρμόζουμε διάφορες μεθόδους για καλύτερη λύση του προβλήματος, έχοντας ερμηνεύσει τα αποτελέσματα της έρευνας, καθώς και 2. Η αξιολόγηση των αποτελεσμάτων Αξιολογούμε τα αποτελέσματα από την εφαρμογή των προτεινόμενων λύσεων. Ακολουθεί απεικόνιση με συνοπτικό διάγραμμα, των σταδίων και των φάσεων που περιλαμβάνει η Στατιστική έρευνα.
18 ΚΕΦΑΛΑΙΟ 1Ο ΣΧΕΔΙΑΓΡΑΜΜΑ ΣΤΑΔΙΑ ΕΡΕΥΝΑΣ ΜΕ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ Α ΣΤΑΔΙΟ: ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΡΕΥΝΑΣ Β ΣΤΑΔΙΟ: ΕΚΤΕΛΕΣΗ ΕΡΕΥΝΑΣ ΦΑΣΕΙΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ: ΦΑΣΕΙΣ ΕΚΤΕΛΕΣΗΣ: 1. ΠΡΟΣΔΙΟΡΙΣΜΟΣ ΑΝΤΙΚΕΙΜΕΝΟΥ ΕΡΕΥΝΑΣ 2. ΕΠΙΛΟΓΗ ΥΛΙΚΩΝ ΜΕΣΩΝ 1. ΥΛΟΠΟΙΗΣΗ ΕΡΕΥΝΑΣ 2. ΑΝΙΧΝΕΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ 3. ΠΡΟΗΓΟΥΜΕΝΕΣ ΕΡΕΥΝΕΣ 3. ΠΑΡΟΥΣΙΑΣΗ ΣΤΟΙΧΕΙΩΝ 4. ΚΑΘΟΡΙΣΜΟΣ ΑΝΤΙΚΕΙΜΕΝΙΚΟΥ ΣΚΟΠΟΥ ΕΡΕΥΝΑΣ 5. ΚΑΘΟΡΙΣΜΟΣ ΠΛΗΘΥΣΜΟΥ Ή ΠΕΔΙΟΥ ΕΡΕΥΝΑΣ 6. ΚΑΤΑΣΚΕΥΗ ΔΕΙΓΜΑΤΟΣ 4. ΑΝΑΛΥΣΗ & ΕΡΜΗΝΕΙΑ ΔΕΔΟΜΕΝΩΝ 5. ΕΦΑΡΜΟΓΗ ΕΡΕΥΝΑΣ 6. ΑΞΙΟΛΟΓΗΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΕΦΑΡΜΟΓΗΣ 7. ΚΑΘΟΡΙΣΜΟΣ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ 7.1. ΣΥΝΤΑΞΗ ΠΛΑΝΟΥ ΕΡΩΤ/ΛΟΓΙΟΥ 7.2. ΔΟΚΙΜΗ ΠΛΑΝΟΥ ΕΡΩΤ/ΛΟΓΙΟΥ 7.3. ΣΥΝΤΑΞΗ ΟΡΙΣΤΙΚΟΥ ΕΡΩΤ/ΛΟΓΙΟΥ 7.4. ΚΩΔΙΚΟΠΟΙΗΣΗ ΕΡΩΤ/ΛΟΓΙΟΥ
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ 19 1.4.3 Ταυτότητα Έρευνας Η παρουσίαση, η ανάλυση και η ερμηνεία των αποτελεσμάτων μίας έρευνας πρέπει απαραιτήτως να συνοδεύεται από την «ταυτότητα της έρευνας». Δηλαδή πρέπει να αναφέρονται: 1. Το όνομα της εταιρίας 2. Η μέθοδος (Απογραφή ή Δειγματοληψία) 3. Το μέγεθος του πληθυσμού ή του δείγματος 4. Η μέθοδος επιλογής του δείγματος 5. Ο τρόπος συλλογής των πληροφοριών 6. Ο τόπος πραγματοποίησης της έρευνας και 7. Ο χρόνος πραγματοποίησης της έρευνας και 8. Κάθε πληροφορία σχετική: με το σχεδιασμό τη διεξαγωγή και την ανάλυση των στοιχείων της έρευνας, η οποία θα ενδιέφερε το κοινό.
20 ΚΕΦΑΛΑΙΟ 1Ο 1.5 Μέθοδοι Διενέργειας Στατιστικής Έρευνας Για τη διενέργεια μίας Στατιστικής έρευνας μπορούμε να επιλέξουμε μία από τις παρακάτω μεθόδους: Απογραφή-Census Δειγματοληψία-Sampling Συνεχή Καταγραφή-Continuous registration Ο συνήθης τρόπος για τη συλλογή στοιχείων είτε με απογραφή είτε με δειγματοληψία είναι το ερωτηματολόγιο με προσωπική συνέντευξη ή με τηλεφωνική συνέντευξη ή ακόμη και με αποστολή αυτού με το ταχυδρομείο. Πολλές φορές βέβαια η συλλογή στοιχείων γίνεται και με απευθείας παρατήρηση. Τα τελευταία χρόνια, με την εξάπλωση των Η/Υ και την ευρεία χρήση του Διαδικτύου (Internet), είναι εύκολη η πρόσβαση και η άντληση πληροφοριών μέσω των διαφόρων μηχανών αναζήτησης (Yahoo, Lycos, Alta vista, Euroseek κ.λπ). 1.5.1 Απογραφή-Census Απογραφή είναι η συλλογή στοιχείων από όλα τα άτομα του πληθυσμού και προφανώς μπορεί να χρησιμοποιηθεί όταν ο πληθυσμός είναι πεπερασμένος. Υπάρχουν βέβαια και περιπτώσεις στις οποίες είναι πρακτικά αδύνατη ή και περιττή. Στην πράξη κάνουμε απογραφή όταν τα άτομα του πληθυσμού δεν είναι πάρα πολλά. Το βασικό πλεονέκτημα της απογραφής είναι η απόλυτη εγκυρότητα των αποτελεσμάτων μια και δεν υπάρχουν δειγματοληπτικά σφάλματα. Αντίθετα, η απογραφή παρουσιάζει τα παρακάτω μειονεκτήματα: Τη μεγάλη χρονική διάρκεια που απαιτείται για τη συλλογή και την επεξεργασία των παρατηρήσεων ενός μεγάλου πληθυσμού. Τα σφάλματα μέτρησης και επεξεργασίας συνήθως αυξάνουν με το πλήθος τους.
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ 21 Την αδυναμία διεξαγωγής απογραφής όταν η παρατήρηση συνεπάγεται και την καταστροφή των μονάδων και τέλος Το κόστος της παρατήρησης των επιπλέον μονάδων είναι πολύ μεγάλο σε σχέση με τα διαθέσιμα μέσα ή τα αναμενόμενα αποτελέσματα. 1.5.2 Δειγματοληψία-Sampling Δειγματοληψία είναι η συλλογή παρατηρήσεων από ένα δείγμα, δηλαδή ένα μέρος των ατόμων του πληθυσμού. Η δειγματοληπτική μέθοδος την οποία θα ακολουθήσουμε σε μία έρευνα αποτελεί την βάση της αξιοπιστίας την οποία θα παρουσιάσουν τα τελικά αποτελέσματα. Στην πράξη τα στατιστικά δεδομένα που χρησιμοποιούνται προέρχονται σχεδόν πάντα από δειγματοληψίες. Η δειγματοληψία μάς επιτρέπει τη συλλογή πληροφοριών με: Μεγαλύτερη ταχύτητα Μικρότερο κόστος Μεγαλύτερη ακρίβεια και Μεγαλύτερη ευχέρεια εφαρμογής αρκεί το δείγμα να επιλεγεί με σωστό τρόπο έτσι ώστε να είναι: Αντιπροσωπευτικό Αξιόπιστο Αντικειμενικό και Συγκρίσιμο δηλαδή να αποτελεί μια μικρογραφία του πληθυσμού. Το σημαντικότερο μειονέκτημα της δειγματοληψίας έγκειται στο ότι δημιουργεί τα λεγόμενα δειγματοληπτικά σφάλματα (sampling errors), τα οποία είναι αριθμητικά σφάλματα και οφείλονται στις τυχαίες κυμάνσεις της δειγματοληψίας. Τα σφάλματα αυτά τείνουν να μηδενιστούν όσο το μέγεθος του
22 ΚΕΦΑΛΑΙΟ 1Ο δείγματος μεγαλώνει και φυσικά μηδενίζονται όταν η έρευνα γίνεται με απογραφή. Δειγματοληπτικό σφάλμα είναι η διαφορά μεταξύ μιας στατιστικής παραμέτρου που προκύπτει από ένα δείγμα και της αντίστοιχης παραμέτρου που προκύπτει με απογραφή. Έστω π.χ. ότι το μέσο ανάστημα 2.000 στρατιωτών, που προέκυψε με απογραφή είναι 178 εκατοστά. Από τους 2.000 στρατιώτες παίρνουμε δείγμα 50 στρατιωτών και προκύπτει μέσο ανάστημα 174 εκατοστά. Η διαφορά των 4 εκατοστών είναι δειγματοληπτική. Εξάλλου, τόσο η απογραφή όσο και η δειγματοληψία, υπόκεινται σε αριθμητικά σφάλματα που προέρχονται από λαθεμένες ή αναληθείς απαντήσεις, από λαθεμένες καταγραφές ή λόγω διαφοράς ορισμών. Ορισμός είναι ο καθορισμός της στατιστικής μονάδας. Αν π.χ. ένας χρησιμοποιεί ως μονάδα το άτομο και άλλος την οικογένεια, τότε τα αποτελέσματα είναι λαθεμένα. Τα σφάλματα αυτά ονομάζονται μη δειγματοληπτικά σφάλματα (no sampling errors). 1.5.2.1 Τεχνικές δειγματοληψίας- Sampling Techniques Υπάρχουν διάφορες μέθοδοι κατασκευής δείγματος. Ανεξαρτήτως μεθόδου ο επιδιωκόμενος αντικειμενικός σκοπός παραμένει πάντα ο ίδιος: «Η αντιπροσωπευτικότητα του δείγματος». Το πόσο καλά ένα δείγμα αντιπροσωπεύει τον πληθυσμό εξαρτάται από το δειγματολητπικό πλαίσιο (sample frame), το μέγεθος του δείγματος (sample size) και το σχεδιασμό της διαδικασίας συλλογής (selection procedure). Οι διαθέσιμες τεχνικές δειγματοληψίας μπορούν να διαιρεθούν σε δύο κατηγορίες: Ι. Την τυχαία δειγματοληψία (Random or probability sampling). Στην τυχαία δειγματοληψία οποία όλα τα στοιχεία του πληθυσμού έχουν δεδομένη πιθανότητα να επιλεγούν στο δείγμα και συχνά με την ίδια πιθανότητα. Το δείγμα λοιπόν θα κατασκευαστεί σύμφωνα με τους νόμους των πιθανοτήτων. Αν
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ 23 ενεργήσουμε με τρόπο ώστε κάθε μονάδα του πληθυσμού να έχει την ίδια πιθανότητα να συμπεριλαμβάνεται στο δείγμα και να δώσουμε στο δείγμα το μέγιστο δυνατό μέγεθος, το οποίο καθορίσαμε, μπορούμε να είμαστε βέβαιοι ότι η εφαρμογή του νόμου των μεγάλων αριθμών θα δώσει, όποια και αν είναι η χρησιμοποιούμενη τεχνική, ένα αντιπροσωπευτικό δείγμα, με τη στατιστική έννοια του όρου. Επομένως, ένα δείγμα στατιστικά αντιπροσωπευτικό θα είναι πάντα ένα δείγμα πιθανοτήτων. Στην πρακτική, παρ όλα αυτά, συμβαίνει ενίοτε να μην ακολουθούνται εντελώς οι προϋποθέσεις εφαρμογής του νόμου των πιθανοτήτων. Οι γνώμες μεταξύ των διαφόρων συγγραφέων/ ερευνητών διίστανται αρκετά ως προς τις δειγματοληπτικές μεθόδους. Η καταγραφή αυτή λοιπόν θα είναι αρκετά αμφισβητήσιμη. Υπάρχουν πέντε βασικές τεχνικές για την επιλογή τυχαίου δείγματος: I.a Απλή Τυχαία Δειγματοληψία- Simple Random Sampling I.b Συστηματική δειγματοληψία -Systematic sampling I.c Δειγματοληψία κατά στρώματα-stratified sampling I.d Δειγματοληψία κατά ομάδες- Cluster sampling και I.e Δειγματοληψία πολλαπλών φάσεων- Multi stage sampling. Στη συνέχεια θα περιγραφούν αναλυτικά οι παραπάνω τεχνικές. I.a.a Απλή Τυχαία Δειγματοληψία (πεπερασμένος πληθυσμός) Simple Random Sampling (finite population) Απλό τυχαίο δείγμα μεγέθους n από ένα πεπερασμένο πληθυσμό μεγέθους Ν είναι ένα δείγμα το οποίο επιλέχτηκε έτσι ώστε κάθε δυνατό δείγμα μεγέθους n να έχει την ίδια πιθανότητα να επιλεγεί. Τα n άτομα του δείγματος επιλέγονται, από τον πληθυσμό μεγέθους Ν, ένα προς ένα. Η επιλογή τους γίνεται στην τύχη (με τη στατιστική έννοια τον όρου) και πραγματοποιείται με μια μόνον ενέργεια. Είναι δυνατό να προβούμε σ αυτήν την επιλογή με επανατοποθέτηση ή και χωρίς επανατοποθέτηση. Βέβαια, αν το πλήθος των μονάδων του πληθυσμού είναι πολύ μεγάλο οι δύο τρόποι συμπίπτουν. Στην περίπτωση της επανατοποθέτησης είναι δυνατόν ένα στοιχείο να επιλεγεί
24 ΚΕΦΑΛΑΙΟ 1Ο περισσότερες από μία φορές. Η δειγματοληψία με επανατοποθέτηση είναι σωστή διαδικασία για τη δημιουργία ενός απλού τυχαίου δείγματος αλλά η διαδικασία χωρίς επανατοποθέτηση είναι αυτή που χρησιμοποιείται συχνότερα. Παράδειγμα: Έστω ένα δείγμα 50 ατόμων, τα οποία πρέπει να επιλέξουμε από ένα πληθυσμού 2.000 ατόμων. Ο απλούστερος τρόπος για τη δημιουργία αυτού του δείγματος είναι η αναγραφή των ονομάτων όλων των ατόμων σε μία λίστα και η αρίθμηση αυτών από το 1 μέχρι το 2000. Στη συνέχεια δημιουργούμε 2000 κλήρους και αφού τους τοποθετήσουμε σε μία κληρωτίδα τραβάμε διαδοχικά 50 από αυτούς. Καθένας αντιστοιχεί σε ένα άτομο και το σύνολο των 50 κλήρων θα αποτελέσει το απλό τυχαίο δείγμα. Η διαδικασία δημιουργίας του απλού τυχαίου δείγματος του προηγούμενου παραδείγματος, μπορεί να ολοκληρωθεί και με τη χρήση του πίνακα των τυχαίων αριθμών (random numbers). Ένα παράδειγμα πίνακα τυχαίων αριθμών, από τον οποίον παρατίθεται εδώ ένα μέρος, είναι ο επόμενος: 79409 67790 10133 36885 34317 44264 62994 23179 86523 40624 97378 15643 87183 08818 44776 41489 12313 88860 47740 49996 90997 40690 73062 99417 84362 36977 56369 26062 24841 77021 90894 16615 13830 51094 31691 97311 85552 39430 08275 29116 76237 94306 02098 86244 47511 78952 34598 74125 64585 41257 84123 56785 42113 21456 76542. Επιλέγουμε μία οποιαδήποτε γραμμή και δημιουργούμε τετραψήφια νούμερα, γιατί το πλήθος των ατόμων του πληθυσμού είναι τετραψήφιο (2.000 άτομα). Έστω για παράδειγμα ότι επιλέξαμε τη δεύτερη γραμμή. Οι αριθμοί που υπάρχουν σε αυτή είναι: 15643 87183 08818 44776 41489 12313 88860 47740 49996 90997 40690. Οι τετραψήφιοι οι οποίοι θα προκύψουν από αυτούς είναι οι επόμενοι: 1564 3871 8308 8184 4776 4148 9123 1388 8604 7740 4999 6909 9740. Από αυτούς μέρος του δείγματος θα αποτελέσουν μόνο όσοι είναι μικρότεροι ή ίσοι του 2000. Στην προηγούμενη γραμμή βλέπουμε μόνο δύο να ικανοποιούν τη συνθήκη.
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ 25 Συνεχίζουμε με τον ίδιο τρόπο τη διαδικασία μέχρι να ολοκληρωθεί το μέγεθος του δείγματος. I.a.b Απλή Τυχαία Δειγματοληψία (άπειρος πληθυσμός) Simple Random Sampling (infinite population) Συνήθως οι πληθυσμοί από τους οποίους παίρνουμε τα δείγματα είναι πεπερασμένοι. Σε κάποιες όμως περιπτώσεις οι πληθυσμοί είναι άπειροι ή τόσο μεγάλοι ώστε να θεωρούνται άπειροι. Στη δειγματοληψία από άπειρους πληθυσμούς πρέπει να χρησιμοποιήσουμε νέο ορισμό για τον απλό τυχαίο δείγμα. Επιπλέον επειδή τα στοιχεία του άπειρου πληθυσμού δεν μπορούν να αριθμηθούν θα πρέπει να ακολουθήσουμε και διαφορετική διαδικασία για την επιλογή των στοιχείων του δείγματος. Απλό τυχαίο δείγμα από ένα άπειρο πληθυσμό είναι αυτό που επιλέγεται με τρόπο ώστε να ικανοποιούνται οι επόμενες συνθήκες: Κάθε επιλεγμένο στοιχείο προέρχεται από τον ίδιο πληθυσμό και Κάθε στοιχείο επιλέχθηκε ανεξάρτητα από οποιοδήποτε άλλο. I.b Συστηματική δειγματοληψία -Systematic sampling. Σε περιπτώσεις που ο πληθυσμός είναι μεγάλος θεωρείται χάσιμο χρόνου η επιλογή ενός απλού τυχαίου δείγματος με τη διαδικασία που αναπτύξαμε στην παράγραφο 1.a.a. Είναι προτιμότερο να χρησιμοποιήσουμε μία εναλλακτική διαδικασία, γνωστή ως συστηματική δειγματοληψία. Η συστηματική δειγματοληψία διαφέρει από την απλή τυχαία δειγματοληψία στο ότι κάθε στοιχείο έχει την ίδια πιθανότητα να επιλεγεί ενώ κάθε δείγμα δεν έχει την ίδια πιθανότητα να επιλεγεί. Στη συστηματική δειγματοληψία, τα στοιχεία επιλέγονται από τον πληθυσμό κατά ομοιόμορφα διαστήματα τα οποίο μετράνε χρόνο, σειρά ή απόσταση. Παράδειγμα: Έστω ότι θέλουμε να κατασκευάσουμε ένα δείγμα 50 φοιτητών από ένα σύνολο 2.000 φοιτητών. Τα στοιχεία -φοιτητές- μπορούν να ταξινομηθούν με