Α ΚΕΦΑΛΑΙΟ 2 ΣΤΑΤΙΣΤΙΚΗ Σκπός Σκπός τυ κεφαλαίυ είναι η κατανόηση των βασικών στιχείων μιας στατιστικής έρευνας. Πρσδκώμενα απτελέσματα Όταν θα έχετε λκληρώσει τη μελέτη αυτύ τυ κεφαλαίυ θα πρέπει να μπρείτε: Να ρίζετε τν πληθυσμό και τις μεταβλητές μιας στατιστικής έρευνας. Να διαβάζετε και να κατασκευάζετε στατιστικύς πίνακες Να κατασκευάζετε πίνακες συχντήτων, σχετικών συχντήτων και των αντιστίχων αθριστικών, όπυ αυτό είναι απαραίτητ. Να παρυσιάζετε με διάφρα διαγράμματα τα στατιστικά δεδμένα. Να βρίσκετε τα μέτρα θέσης τα μέτρα διασπράς και τν συντελεστή μεταβλής πστικών χαρακτηριστικών. Να κάνετε εκτιμήσεις σε κατανμές πυ πρσεγγίζυν την καννική κατανμή.
Έννιες κλειδιά. Πληθυσμός Δείγμα Μεταβλητή Κατανμή συχντήτων Κατανμή σχετικών συχντήτων Πίνακες συχντήτων και σχετικών συχντήτων Διάγραμμα συχντήτων Ιστόγραμμα Ραβδόγραμμα Σημειόγραμμα Χρνόγραμμα Κυκλικό διάγραμμα Πλύγωνα συχντήτων Καμπύλες συχντήτων Μέση τιμή Διάμεσς Διακύμανση Τυπική απόκλιση Συντελεστής μεταβλής ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 130
ΕΝΟΤΗΤΑ 2.1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Σκπός Σκπός της ενότητας είναι η εξικείωση με την ρλγία της στατιστικής. Πρσδκώμενα απτελέσματα Όταν θα έχετε λκληρώσει τη μελέτη αυτής της ενότητας, θα πρέπει: Να μπρείτε: α. Να ρίζετε τν πληθυσμό μιας στατιστικής έρευνας. β. Μα ρίζετε τις μεταβλητές τις έρευνας και να τις ξεχωρίζετε σε πιτικές και πστικές. Να γνωρίζετε τις μεθόδυς με τις πίες γίνεται μια στατιστική έρευνα. 1. Βασικές έννιες Τι νμάζυμε στατιστική; Στατιστική είναι ένα σύνλ αρχών και μεθόδων πυ αφρύν: α. Στ σχεδιασμό της διαδικασίας συλλγής δεδμένων. β. Στη συνπτική και απτελεσματική παρυσίας τυς. γ. Στην ανάλυση των δεδμένων και εξαγωγής συμπερασμάτων. ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 131
Παρατήρηση: Οι κλάδι της στατιστικής πυ ασχλύνται με τυς παραπάνω στόχυς, είναι: α. Σχεδιασμύ πειραμάτων β. Περιγραφική στατιστική ή στατιστική συμπερασματλγία Τι λέγεται πληθυσμός; Πληθυσμός λέγεται ένα σύνλ, τυ πίυ τα στιχεία θέλυμε να εξετάσυμε ως πρς ένα ή περισσότερα χαρακτηριστικά. Παρατήρηση: Τα στιχεία τυ πληθυσμύ, λέγνται άτμα ή μνάδες Τι λέγεται μεταβλητή; Τι λέγνται τιμές της μεταβλητής; Μεταβλητή λέγεται τ χαρακτηριστικό ως πρς τ πί εξετάζυμε τν πληθυσμό. Τιμές της μεταβλητής, λέγνται ι δυνατές τιμές πυ μπρεί να πάρει μια μεταβλητή. Πια είναι τα είδη των μεταβλητών και τι τιμές παίρνυν; Οι τιμές διακρίννται σε πιτικές και πστικές. Οι πιτικές (ή κατηγρικές) μεταβλητές παίρνυν τιμές πυ δεν είναι αριθμί. Οι πστικές μεταβλητές παίρνυν τιμές πυ είναι αριθμί. Διακρίννται σε διακριτές και συνεχείς. Διακριτές νμάζνται ι μεταβλητές πυ παίρνυν μεμνωμένες τιμές. Συνεχείς νμάζνται ι μεταβλητές πυ μπρεί να πάρυν πιαδήπτε τιμή ενός διαστήματς πραγματικών αριθμών. ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 132
Να αναφέρετε και να περιγράψετε τυς τρόπυς με τυς πίυς γίνεται η συλλγή των στατιστικών δεδμένων. Η απαγραφή των στατιστικών δεδμένων γίνεται με απγραφή ή με επιλγή δείγματς (δειγματληψία). Απγραφή λέγεται η μέθδς συλλγής δεδμένων, κατά την πία για να πάρυμε τις απαραίτητες πληρφρίες πυ χρειαζόμαστε, για κάπι πληθυσμό, εξετάζυμε όλα τα άτμα τυ πληθυσμύ ως πρς τ χαρακτηριστικό πυ μας ενδιαφέρει. Όπυ η απγραφή είναι αδύνατη ή δύσκλή, γιατί είναι ικνμικά και χρνικά ασύμφρη, η συλλγή των πληρφριών γίνεται από μια μικρότερη μάδα τυ πληθυσμύ πυ λέγεται δείγμα. Η επιλγή τυ δείγματς γίνεται με πλύ αυστηρά κριτήρια ώστε τ δείγμα να είναι αντιπρσωπευτικό. Ένα δείγμα είναι αντιπρσωπευτικό αν επιλεγεί με τέτι τρόπ ώστε κάθε μνάδα τυ πληθυσμύ να έχει την ίδια δυνατότητα να επιλεγεί. Μετά την επιλγή τυ δείγματς συλλέγνται τα δεδμένα πυ μας ενδιαφέρυν και τα συμπεράσματα πυ εξάγνται, γενικεύνται για τ σύνλ τυ πληθυσμύ. Παρατηρήσεις: 1. Μια πρσεκτική επιλγή μικρότερυ δείγματς μπρεί να δώσει καλύτερα απτελέσματα από ένα μεγαλύτερ δείγμα πυ δεν έχει επιλεγεί κατάλληλα. 2. Οι αρχές και ι μέθδι για τη συλλγή και ανάλυση δεδμένων από πεπερασμένυς πληθυσμύς είναι αντικείμεν της δειγματληψίας πυ απτελεί τη βάση της στατιστικής. ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 133
2.2. ΕΝΟΤΗΤΑ ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Σκπός Σκπός της ενότητας αυτής είναι να παρυσιάσει σύντμα αλλά περιεκτικά τυς τρόπυς με τυς πίυς παρυσιάζνται τα στατιστικά δεδμένα. Πρσδκώμενα απτελέσματα Όταν έχετε μελετήσει την ενότητα αυτή θα πρέπει να μπρείτε: Να εντπίζετε σε κάθε πίνακα τν τίτλ, τις επικεφαλίδες και τ κύρι σώμα. Να μελετάτε τυς πίνακες στατιστικών δεδμένων Να κατασκευάζετε πίνακες στατιστικών δεδμένων. ΠΙΝΑΚΕΣ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Τι περιέχυν ι γενικί πίνακες στατιστικών δεδμένων και τι ι ειδικί; Οι γενικί πίνακες περιέχυν όλες τις πληρφρίες πυ πρκύπτυν από μια στατιστική έρευνα και απτελύν πηγές στατιστικών πληρφριών στη διάθεση των επιστημόνων ερευνητών για παραπέρα ανάλυση και εξαγωγή συμπερασμάτων. Οι ειδικί πίνακες περιέχυν και αυτί πληρφρίες από μια στατιστική έρευνα, αλλά είναι πι συνπτικί και σαφείς. Τα στιχεία τυς συνήθως λαμβάννται από τυς γενικύς πίνακες. ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 138
Τι πρέπει να περιέχει ένας πίνακας στατιστικών δεδμένων ώστε να είναι σωστά κατασκευασμένς; Κάθε πίνακας πυ έχει κατασκευαστεί σωστά περιέχει: α. Τν τίτλ πυ γράφεται στ πάνω μέρς και δηλώνει με σαφήνεια και συνπτικά τ περιεχόμεν τυ πίνακα. β. Τις επικεφαλίδες των γραμμών και των στηλών, πυ δείχνυν συνπτικά τη φύση και τις μνάδες μέτρησης των δεδμένων. γ, Τ κύρι σώμα, πυ περιέχει διαχωρισμένα μέσα στις γραμμές και στις στήλες τα στατιστικά δεδμένα. δ. Την πηγή, πυ γράφεται στ κάτω μέρς τυ πίνακα και δείχνει την πρέλευση των στατιστικών στιχείων, έτσι ώστε αναγνώστης να ανατρέχει σ αυτήν για επαλήθευση στιχείων ή για λήψη περισσότερων πληρφριών. ΚΑΤΑΝΟΜΕΣ ΣΥΧΝΟΤΗΤΩΝ Οι παρακάτω ερωτήσεις (α ως η) αφρύν ένα δείγμα μεγέθυς ν, τυ πίυ εξετάζυμε μια μεταβλητή Χ η πία παίρνει τιμές x, x,...x, κ ν. 1 2 κ α. Τι νμάζεται (απόλυτη) συχνότητα ν της τιμής Συχνότητα ν της τιμής πόσες φρές εμφανίζεται η τιμή σύνλ των παρατηρήσεων. x ( 1, 2,..., ) = κ ; x είναι ένας φυσικός αριθμός πυ δείχνει x της εξεταζόμενης μεταβλητής Χ στ β. Με τι ισύται τ άθρισμα όλων των συχντήτων; Τ άθρισμα όλων των συχντήτων ν, = 1,2,..., κ ισύται με τ μέγεθς τυ δείγματς. Δηλαδή: ν +ν + +ν =ν 1 2... κ ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 139
Παρατήρηση: Τ άθρισμα ν 1+ν 2 +... +ν κ γράφεται συνπτικά: κ κ ν άρα = 1 = 1 ν =ν γ. Τι νμάζεται αθριστική συχνότητα Ν της τιμής Η αθριστική συχνότητα της τιμής παρατηρήσεων πυ είναι μικρότερες ή ίσες της τιμής Παρατηρήσεις: x x είναι ίση με τ πλήθς των x. Δηλαδή: Αν x1 < x 2 <... < x κ τότε Ν =ν 1+ν 2 +... +ν 1. Η αθριστική συχνότητα αφρά μόν πστικές μεταβλές, διότι στις πιτικές μεταβλητές δεν υπάρχει διάταξη τιμών. 2. Ισχύυν: Ν 1 =ν1, Ν 2 =ν 1+ν 2 =Ν 1+ν 2,..., Ν =ν 1+ν 2 +... +ν =Ν 1+ν, = 1,2,..., κ Πρφανώς ισχύει Ν = V. Από τα παραπάνω πρκύπτει ότι: κ Ν Ν 1 =ν δ. Τι νμάζεται σχετική συχνότητα f της τιμής Σχετική συχνότητα συχνότητας ν της τιμής x; f της τιμής x x πρς τ μέγεθς τυ δείγματς. Άρα: λέγεται τ πηλίκ της f ν = ν Παρατήρηση: Συνήθως ι σχετικές συχνότητες f εκφράζνται επί τις εκατό και συμβλίζνται με f 0 0. Δηλαδή ισχύει: f 0 0 = 100 f ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 140
ε. Να δείξετε ότι:. 0 f 1 για = 1,2,..., κ. f1+ f 2 +... + fκ = 1 Απόδειξη:. Επειδή ν 0 και ν > 0, έχυμε: ν f = 0 ν Όμως ν ν, άρα ν f = 1 με συνέπεια: ν. 0 f 1 ν1 ν2 νκ ν 1+ν 2 +... +νκ ν f1+ f 2 +... + f ν = + +... + = = ν ν ν ν ν f + f +... + f = 1 1 2 ν Παρατηρήσεις: 1. Συνπτικά: κ = 1 f = 1 2. Αν ι σχετικές συχνότητες εκφράζνται επί τις εκατό, ισχύει: Συνπτικά: f + f +... + f = 100 0 0 0 1 0 2 0 κ 0 κ = 1 f = 100 0 0 στ. Τι νμάζεται αθριστική σχετική συχνότητα F της τιμής Η αθριστική σχετική συχνότητα F της τιμής x; x, με τ πσστό των παρατηρήσεων πυ είναι μικρότερες ή ίσες της τιμής x. Αν x1 < x 2 <... < x κ τότε F = f1+ f 2 +... + f, = 1,2,..., ν ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 141
Παρατηρήσεις: 1. Η αθριστική σχετική συχνότητα F αφρά μόν πστικές μεταβλητές. 2. Ισχύυν: F = f, F = f + f = F + f,..., F = f + f +... + f = F + f με = 1,2,..., κ. Πρφανώς έχυμε: Fκ = 1 Από τα παραπάνω, εξάγεται ότι: F F = f 1 1 2 1 2 1 2 1 2 1 1 1 3. Αν ι σχετικές συχνότητες εκφράζνται επί τις εκατό, ισχύυν: F = f + f +... + f, F F = f, F = 100 0 0 0 0 0 0 0 0 0 1 0 2 0 0 0 1 0 0 κ 0 ζ. Τι είναι πίνακας κατανμής συχντήτων μιας μεταβλητής Χ ; Οι πσότητες x, ν,f για ένα δείγμα συγκεντρώννται σ ένα συνπτικό πίνακα πυ νμάζεται πίνακας κατανμής συχντήτων ή απλά πίνακας συχντήτων. η. Τι νμάζεται κατανμή συχντήτων και τι κατανμή σχετικών συχντήτων; Κατανμή συχντήτων μιας μεταβλητής Χ, λέγεται τ σύνλ των ζευγών: x, ν, = 1, 2,..., κ ( ) Κατανμή σχετικών συχντήτων λέγεται τ σύνλ των ζευγών: ( ) 0 ( ) x,f ή x,f, = 1,2,..., κ 0 ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 142
ΔΙΑΓΡΑΜΜΑΤΑ Τι είναι τ ραβδόγραμμα και πότε αυτό χρησιμπιείται; Απάντησή Τ ραβδόγραμμα χρησιμπιείται για τη γραφική παράσταση των τιμών μιας πιτικής μεταβλητής. Απτελείται από ρθγώνιες στήλες πυ ι βάσεις τυς βρίσκνται πάνω στν ριζόντι ή τν κατακόρυφ άξνα. Σε κάθε τιμή της μεταβλητής Χ αντιστιχεί μια ρθγώνια στήλη με ύψς ίσ με την αντίστιχη συχνότητα, αν πρόκειται για ραβδόγραμμα συχντήτων. Στ ραβδόγραμμα σχετικών συχντήτων τ ύψς της ρθγώνιας στήλης είναι ίσ με την αντίστιχη σχετική συχνότητα. Τι είναι τ διάγραμμα συχντήτων και πότε αυτό χρησιμπιείται; Τ διάγραμμα συχντήτων χρησιμπιείται για τη γραφική παράσταση των τιμών μιας πστικής διακριτής μεταβλητής. Στν ριζόντι άξνα τπθετύμε τις τιμές της μεταβλητής Χ σε αύξυσα σειρά ( x1 < x 2 <... < x κ ) και σε κάθε τιμή φέρνυμε μια γραμμή παράλληλη στν κατακόρυφ άξνα με ύψς ίσ με τη συχνότητα της μεταβλητής. Παρατηρήσεις: 1. Ενώνντας τα σημεία ( ) x,ν (δηλαδή τις κρυφές των κατακόρυφων γραμμών πυ φέραμε) έχυμε τ πλύγων συχντήτων 2. Ανάλγα κατασκευάζυμε διάγραμμα σχετικών συχντήτων και πλύγων σχετικών συχντήτων. Στ διάγραμμα σχετικών συχντήτων τ ύψς των γραμμών είναι ίσ με f, ενώ για να κατασκευάσυμε τ πλύγων σχετικών συχντήτων ενώνυμε τα x,f σημεία ( ) Παράδειγμα: Σε μια έρευνα, για τν αριθμό των παιδιών σε 50 ικγένειες, τα απτελέσματα ήταν τα εξής: 0 παιδιά είχαν 12 ικγένειες 1 παιδί είχαν 26 ικγένειες 2 παιδιά είχαν 10 ικγένειες 3 παιδιά είχαν 2 ικγένειες ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 143
Τι είναι τ κυκλικό διάγραμμα και πότε αυτό χρησιμπιείται; Τ κυκλικό διάγραμμα χρησιμπιείται για τη γραφική παράσταση τόσ πιτικών όσ και πστικών μεταβλών. Τ κυκλικό διάγραμμα είναι ένας κυκλικός δίσκς χωρισμένς σε κυκλικύς τμείς τα τόξα των πίων (άρα και τα εμβαδά) είναι ανάλγα πρς τις συχνότητες ν ή τις σχετικές συχνότητες f των τιμών x της μεταβλητής. Αν συμβλίσυμε με αντιστιχεί στην τιμή x, τότε: α την τιμή τυ τόξυ, σε μίρες, πυ 360 ν α =ν = 360 = f 360, = 1,2,..., κ V V Παράδειγμα: Από τις 50 παραβάσεις πυ κατέγραψε κλιμάκι της τρχαίας σε συγκεκριμέν σημεί ι 10 αφρύσαν σε παραβίαση ερυθρύ σηματδότη, ι 20 δεν φρύσαν ζώνη ασφαλείας, 7 δεν φρύσαν κράνς και ι υπόλιπες αφρύσαν στην υπερβλική ταχύτητα. Ο πληθυσμός είναι ι δηγί αυτκινήτων και μτσικλετών. Τ χαρακτηριστικό (μεταβλητή) πυ εξετάζυμε είναι ι παραβάσεις, επμένως είναι πιτική μεταβλητή και ι τιμές πυ παίρνει είναι: ε.σ. Ερυθρός σηματδότης 10 παραβάσεις ζ.α. Ζώνη ασφαλείας 20 παραβάσεις κρ. Κράνς 7 παραβάσεις υ.τ. Υπερβλική ταχύτητα 13 παραβάσεις ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 144
Τ ραβδόγραμμα συχντήτων φαίνεται στ σχήμα 1. Τα ύψη των ρθγωνίων είναι ίσα με τις συχνότητες των τιμών της μεταβλητής. Τ ραβδόγραμμα των σχετικών συχντήτων φαίνεται στ σχήμα 3. Τα ύψη των ρθγωνίων είναι ίσα με τα ύψη των αντίστιχων σχετικών συχντήτων. Στ σχήμα 4 φαίνεται τ κυκλικό διάγραμμα, όπυ έχυμε: 10 α1 ( εσ..) 360 = 72 50 20 α2 ( ζα..) 360 = 144 50 ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 145
7 3 ( ) 360 α κρ = 50, 4 50 13 α4 ( υτ..) 360 = 93,6 50 Τι είναι τ σημειόγραμμα και πότε αυτό χρησιμπιείται; Τ σημειόγραμμα χρησιμπιείται όταν αριθμός των παρατηρήσεων είναι μικρός. Σ αυτό ι τιμές παριστάννται με σημεία πάνω από τν ριζόντι άξνα των τιμών της μεταβλητής. Παράδειγμα: Οι βαθμί 10 μαθητών στ μάθημα της αστρνμίας, ήταν: Τ αντίστιχ σημειόγραμμα είναι: 16, 18, 16, 15, 16, 17, 17, 18, 16, 15 Τι είναι χρνόγραμμα ή χρνλγικό διάγραμμα και πότε αυτό χρησιμπιείται; Απάντηση Τ χρνόγραμμα χρησιμπιείται για τη γραφική απεικόνιση της διαχρνικής εξέλιξης ενός μεγέθυς (ικνμικύ, δημγραφικύ κ.α.). Συνήθως ριζόντις άξνας είναι άξνας μέτρησης τυ χρόνυ ενώ κάθετς είναι άξνας μέτρησης της τιμής τυ μεγέθυς πυ εξετάζυμε. Παράδειγμα: Η τιμή της μετχής της εταιρείας ΦΟΥΣΚΑ Α.Ε. από τ Ιανυάρι ως τν Ιύλι τυ 2007 ήταν: Ιαν. φεβ. Μαρ. Απρ. Μαϊ Ιυν. Ιυλ. τυ 2007 2,3 2,6 2,5 2, 4 1,9 2,1 2,3 σε Euro Τ αντίστιχ χρνόγραμμα πυ απεικνίζει την εξέλιξη της μετχής είναι: ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 146
ΣΟΛΩΜΟΥ 29 ΑΘΗΝΑ 210.38.22.157 495 147