ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης
ΣΥΛΛΟΓΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Τα εργαλεία αυτά, πρέπει όχι μόνο να ανταποκρίνονται στον έλεγχο της τεράστιας ποσότητας πληροφορίας που υπάρχει σήμερα για κάθε θέμα, αλλά πρέπει να είναι έγκυρα, αξιόπιστα και εύχρηστα από τον κάθε χρήστη. Η πιο απλή μορφή ενός τέτοιου εργαλείου είναι το ερωτηματολόγιο. Αλλά ενώ «η λύση» φαίνεται απλή, δηλαδή το εργαλείο που χρειαζόμαστε είναι το ερωτηματολόγιο, η κατασκευή του δεν είναι καθόλου εύκολη υπόθεση. Άρθρα σχετικά με την κατασκευή ερωτηματολογίων έχουν γραφτεί πάρα πολλά. Φυσικά επειδή κάθε ερωτηματολόγιο αναφέρεται σε διαφορετικό γνωστικό πεδίο και πολλές φορές η χρήση του έχει διαφορετικούς στόχους, χρειάζονται σύνθετες γνώσεις για την κατασκευή του ( και όχι μόνο καθαρά επιστημονικές) Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 2
ΑΡΧΕΣ ΣΧΕΔΙΑΣΜΟΥ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ Το ερωτηματολόγιο δεν είναι παρά ένα έντυπο που περιλαμβάνει τις ερωτήσεις για την συλλογή των στοιχείων που μας ενδιαφέρουν. Η σύνταξή του είναι ένας από τους σημαντικότερους παράγοντες για την ποιότητα των στοιχείων που θα συλλέξουν. Στην κατασκευή του θα πρέπει να ακολουθούνται συγκεκριμένα στάδια (δεν είναι διαδοχικά αλλά αλληλοεξαρτώνται) που θα πρέπει να ληφθούν ως προς: Προκαταρκτικές αποφάσεις Αποφάσεις σχετικές με το περιεχόμενο της κάθε ερώτησης Αποφάσεις για τον τρόπο διατύπωσης των ερωτήσεων Αποφάσεις για τον τύπο των ερωτήσεων Αποφάσεις για την σειρά των ερωτήσεων Αποφάσεις για την διάταξη και εμφάνιση του ερωτηματολογίου Αποφάσεις για τον προέλεγχο και αναθεώρηση του ερωτηματολογίου Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 3
Η έννοια της στάσης - γνώμης Μια από τις πιο βασικές έννοιες της κοινωνικής ψυχολογίας: οι αποφάσεις που παίρνουμε βασίζονται αποκλειστικά στην γνώμη που έχουμε. Η στάση είναι διανοητική κατάσταση, επηρεάζεται από το ευρύτερο περιβάλλον, υποδηλώνει στενή σχέση με μελλοντική ενέργεια και αφορά σχεδόν τα πάντα. Τα στελέχη του marketing καταβάλλουν προσπάθειες για να επηρεάσουν την στάση/γνώμη των καταναλωτών. Έχουν προταθεί διάφορα είδη κλιμάκων για να μετρήσουμε τη στάση των ερωτώμενων ως προς το αντικείμενο ή το φαινόμενο που ενδιαφερόμαστε: Κλίμακα Likert. Κλίμακα του σημαντικού διαφορικού. Άλλες κλίμακες (σπουδαιότητας, σταθερού αθροίσματος, κατάταξης, γραφική). Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 4
Κλίμακα του Likert Με την κλίμακα αυτή ο ερωτώμενος καλείται να δηλώσει τον βαθμό συμφωνίας ή διαφωνίας με μια σειρά προτάσεων σχετικά με το αντικείμενο του ενδιαφέροντος Οδηγίες: Παρακαλούμε δηλώστε, σημειώνοντας με Χ το βαθμό συμφωνίας ή διαφωνίας σας με κάθε μια από τις παρακάτω προτάσεις που αφορούν το προϊόν Α Διαφωνώ Απόλυτα Διαφωνώ Ούτε Διαφωνώ Ούτε Συμφωνώ Συμφωνώ Συμφωνώ Απόλυτα Το προϊόν Α είναι καλής ποιότητας Το προϊόν Α χαμηλή τιμή Το προϊόν Α καθαρίζει τα πάντα Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 5
Συχνότερα απαντημένα ζητήματα Αριθμός κατηγοριών απαντήσεων Μπορεί να χρησιμοποιηθεί οποιοσδήποτε αριθμός (συνήθως 5-10). Ισορροπημένη Μη ισορροπημένη κλίμακα Μια κλίμακα μέτρησης θεωρείται ισορροπημένη όταν ο αριθμός των ευνοϊκών απαντήσεων είναι ίσος με τον αριθμό των δυσμενών. Μονός-ζυγός αριθμός κατηγοριών Στην περίπτωση της ισορροπημένης κλίμακας προκύπτει θέμα μονού ή ζυγού αριθμού ερωτήσεων.μονός αριθμός Μεσαίο ουδέτερο σημείο. Αναγκαστική μη αναγκαστική επιλογή Μια αναγκαστική κλίμακα απαιτεί να εκφέρουμε γνώμη ακόμα και όταν δεν έχουμε. Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 6
Παραδείγματα Κλιμάκων Παράδειγμα 1. Κλίμακά ισορροπημένη, μονή, αναγκαστική Ποιά είναι η γνώμη σας για την γεύση του προϊόντος Α Πολύ καλή Καλή Ούτε καλή ούτε κακή Κακή Πολύ κακή Παράδειγμα 2. Κλίμακα ισορροπημένη, ζυγή, αναγκαστική. Ποιά είναι η γνώμη σας για την γεύση του προϊόντος Α Πολύ καλή Αρκετά Καλή Καλή Κακή Αρκετά κακή Πολύ κακή Παράδειγμα 3. Κλίμακα μη ισορροπημένη, μονή, αναγκαστική Ποιά είναι η γνώμη σας για την γεύση του προϊόντος Α Πολύ καλή Αρκετά Καλή Καλή Ούτε καλή ούτε κακή Κακή Παράδειγμα 4. Κλίμακα ισορροπημένη, ζυγή, μη αναγκαστική Ποιά είναι η γνώμη σας για την γεύση του προϊόντος Α Πολύ καλή Καλή Ούτε καλή ούτε κακή Κακή Πολύ κακή Δεν έχω γνώμη Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 7
Σχεδιασμός ερωτηματολογίων Προκαταρκτικές αποφάσεις Είδος πληροφοριών που είναι αναγκαίο να συλλεχθούν. Σωστά ορισμένο πρόβλημα, σκοποί της έρευνας Από ποιους θα συλλεχθούν οι πληροφορίες. Ορισμός του πληθυσμού (target group) Με ποιο τρόπο θα συλλεχθούν οι πληροφορίες. Ταχυδρομικά ( μικρό κόστος, ανωνυμία, όχι επιρροή, όχι πίεση απώλεια, επιστροφή, έλλειψη επεξηγήσεων, χρονοβόρο ) Τηλεφωνικά ( μικρό κόστος, εποπτεία, ταχύτητα επιρροή, πίεση ) Με προσωπική συνέντευξη ( κόστος, επιρροή ) Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 8
Σχεδιασμός ερωτηματολογίων Περιεχόμενο ερωτήσεων Αφορά τις πληροφορίες που θα συλλεγούν παρά το ύφος της κάθε ερώτησης ξεχωριστά. Είναι η ερώτηση απαραίτητη; Κάθε ερώτηση πρέπει να δίνει πληροφορίες που θα μας οδηγήσουν κάπου. Είναι η ερώτηση επαρκής/ικανοποιητική; Η συγκεκριμένη ερώτηση δίνει τη συγκεκριμένη πληροφορία ή θα πρέπει να χρησιμοποιηθούν κι άλλες; Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 9
Σχεδιασμός ερωτηματολογίων: ΙΙΙ. Τύπος ερωτήσεων Αφορά τον τύπο της κάθε ερώτησης Ανοιχτές ερωτήσεις: Τι είδους αναψυκτικά πίνετε; Κλειστές ερωτήσεις (πολλαπλής επιλογής): Τι είδους αναψυκτικά πίνετε; Coca cola Pepsi cola Fanta Άλλο Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 10
Σχεδιασμός ερωτηματολογίων: ΙV. Σειρά των ερωτήσεων Τοποθέτηση απλών ερωτήσεων που προκαλούν το ενδιαφέρον στην αρχή. Λογική σειρά των ερωτήσεων. Διαδοχική σειρά αλληλοεξαρτώμενων ερωτήσεων. Τοποθέτηση των δύσκολων ερωτήσεων στο τέλος Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 11
Συνήθη λάθη Ι (στο είδος της ερώτησης) Η διπλή ερώτηση: Τι γνώμη έχετε για τις τιμές και το επίπεδο εξυπηρέτησης που προσφέρει το super market X; Ο ερωτώμενος δεν γνωρίζει την απάντηση: Πόσα χρήματα ξοδεύει η οικογένειά σας για τρόφιμα μέσα σε μια εβδομάδα; Ο ερωτώμενος δεν θυμάται: Ποια τηλεοπτικά προγράμματα παρακολουθήσατε την προηγούμενη Πέμπτη; Ο ερωτώμενος δεν θέλει να απαντήσει: Έχετε κάνει χρήση ναρκωτικών ουσιών; Επιρροή από εξωτερικά γεγονότα: Πόση ώρα κάνατε χθες για να πάτε στη δουλειά σας; Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 12
Συνήθη λάθη ΙΙ (στη φρασεολογία της ερώτησης) Χρήση δυσνόητων λέξεων: Από ποια καταστήματα κάνετε τις εμβόλιμες αγορές σας; Χρήση λέξεων με αμφίβολη και ασαφή έννοια: Πόσο συχνά πηγαίνετε στον κινηματογράφο; Ποτέ Περιστασιακά Μερικές φορές Συχνά Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 13
Συνήθη λάθη ΙΙΙ Αποφυγή ερωτήσεων που οδηγούν στην επιθυμητή απάντηση. Πιστεύετε ότι είναι δίκαιο να πληρώνουν οι φορολογούμενοι τα ελλείμματα του δημόσιου τομέα από την τσέπη τους; ναι όχι δεν ξέρω Αποφυγή υποθέσεων. Είναι καλή ιδέα η ύπαρξη νόμου που να επιβάλλει την χρήση των ζωνών ασφαλείας στα αυτοκίνητα; Αποφυγή ερωτήσεων που η μια προϋποθέτει απάντηση της άλλης 1. Πίνετε γάλα εβαπορέ; 2. Αν ναι, τότε πόσες φορές την μέρα πίνετε; Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 14
Παράδειγμα έρευνας Τίτλος: Δημιουργία διαφημιστικού σποτ για το φρέσκο γάλα. Στόχος της έρευνας Στόχος της έρευνας είναι να διαπιστωθούν οι τάσεις που παρουσιάζουν οι ενήλικες καταναλωτές του πολεοδομικού συγκροτήματος Θεσσαλονίκης στην κατανάλωση φρέσκου γάλακτος, η συχνότητα αγοράς και κατανάλωσης, να εντοπιστούν οι χώροι προμήθειάς του, να διερευνηθεί ο ρόλος του γάλακτος στην καθημερινή τους ζωή, η μάρκα που προτιμούν περισσότερο, οι παράγοντες που τους επηρεάζουν στην αγορά της συγκεκριμένης μάρκας. Συγκέντρωση πρωτογενών στοιχείων Μονάδα πληθυσμού: Άνδρες Γυναίκες ενήλικες Μονάδα Δειγματοληψίας: 50 κάτοικοι του πολεοδομικού συγκροτήματος Θεσσαλονίκης Χρόνος διεξαγωγής έρευνας: Απρίλιος Μάϊος 2000 Μέθοδος Δειγματοληψίας: Δειγματοληψία ευκολίας Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 15
Ερωτηματολόγιο 1.Φύλο α. Άνδρας β. Γυναίκα 2. Με πόσα λιπαρά προτιμάτε το φρέσκο γάλα; α. Λίγα / Μέτρια β. Πολλά 3.Ποιά συσκευασία αγοράζετε συνήθως; α. Μικρή (1/2l) β. Μεγάλη (1l) 4.Πόσες φορές την ημέρα πίνετε φρέσκο γάλα; α.1-2 β.3 και πάνω 5.Πόσο συχνά αγοράζετε φρέσκο γάλα; α. Κάθε εβδομάδα β. Κάθε δεκαπενθήμερο γ. Κάθε μήνα Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 16
6. Πόσο σας επηρεάζει η προέλευση του γάλακτος; α. Πολύ β. Λίγο γ. Καθόλου 7. Από πού αγοράζετε φρέσκο γάλα; α. Super-Market β. Παντοπωλείο γ. Ζαχαροπλαστείο 8. Ποιά από τις παρακάτω μάρκες φρέσκου γάλακτος προτιμάτε περισσότερο; α. ΦΑΓΕ β. ΑΓΝΟ γ. ΟΛΥΜΠΟΣ δ. ΔΕΛΤΑ ε. ΜΕΒΓΑΛ 9. Ποιοί παράγοντες σας επηρεάζουν για την επιλογή της μάρκας φρέσκου γάλακτος που αγοράζετε; α. Γεύση β. Ποιότητα γ. Τιμή Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 17
Οι μεταβλητές της ανάλυσης Το ερωτηματολόγιο έχει κωδικοποιηθεί ως εξής: Η πρώτη ερώτηση (Φύλο) αντιστοιχεί σε μία ποιοτική μεταβλητή με δύο διαβαθμίσεις. Της δόθηκε η ένδειξη FYL. Η δεύτερη ερώτηση (Λιπαρά) αντιστοιχεί σε μία ποιοτική μεταβλητή με δύο διαβαθμίσεις. Της δόθηκε η ένδειξη LIP. Η τρίτη ερώτηση (Συσκευασία) αντιστοιχεί σε μία ποιοτική μεταβλητή με δύο διαβαθμίσεις. Της δόθηκε η ένδειξη SYS. Η τέταρτη ερώτηση (Συχνότητα κατανάλωσης) αντιστοιχεί σε μία ποιοτική μεταβλητή με δύο διαβαθμίσεις. Της δόθηκε η ένδειξη KAT. Η πέμπτη ερώτηση (Συχνότητα αγοράς) αντιστοιχεί σε μία ποιοτική μεταβλητή με τρεις διαβαθμίσεις. Της δόθηκε η ένδειξη AGR. Η έκτη ερώτηση (Προέλευση) αντιστοιχεί σε μία ποιοτική μεταβλητή με τρεις διαβαθμίσεις. Της δόθηκε η ένδειξη PRO. Η έβδομη ερώτηση (Σημείο Αγοράς) αντιστοιχεί σε μια ποιοτική μεταβλητή με τρεις διαβαθμίσεις. Της δόθηκε η ένδειξη SPO. Η όγδοη ερώτηση (Μάρκα) αντιστοιχεί σε μία ποιοτική μεταβλητή με πέντε διαβαθμίσεις. Της δόθηκε η ένδειξη MAR. Η ένατη ερώτηση (Παράγοντες) είναι ποιοτικού χαρακτήρα και πολλαπλής απάντησης. Κάθε απάντηση αντιστοιχεί σε μια νέα μεταβλητή με δύο διαβαθμίσεις Ναι / Όχι. Της δόθηκαν οι ενδείξεις PAR1, PAR2, PAR3. Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 18
Κωδικοποίηση των μεταβλητών Μεταβλητές Κωδικοί FYL 1,2 LIP 1,2 SYS 1,2 KAT 1,2, AGR 1,2,3 PRO 1,2,3 SPO 1,2,3 MAR 1,2,3,4,5 PAR1 1,2 (Ν/Ο) PAR2 1,2 (Ν/Ο) PAR3 1,2 (Ν/Ο) Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 19
Ο πίνακας των αρχικών δεδομένων για τα 10 πρώτα αντικείμενα της έρευνας θα έχει την παρακάτω μορφή: IND FYL LIP SYS KAT AGR PRO SPO MAR PAR1 PAR2 PAR3 1 1 2 2 1 1 1 1 5 1 1 2 2 2 2 1 1 2 2 2 1 1 1 1 3 1 1 1 2 1 3 3 1 2 2 1 4 2 2 2 1 1 1 1 2 2 2 1 5 2 1 2 2 3 1 3 1 1 1 1 6 2 2 1 2 2 1 2 3 2 1 2 7 2 1 2 1 1 2 2 2 2 2 1 8 1 1 1 1 2 1 1 1 1 1 1 9 1 1 1 1 3 3 1 4 1 1 1 10 2 2 2 2 1 1 2 2 1 2 1 Δρ. Βασίλης Π. Αγγελίδης Βάσεις Δεδομένων (Θεωρεία) Διαφάνεια 20