ΣΤΑΤΙΣΤΙΚΗ Στατιστιή λέγεται ο λάδος τω Μαθηματιώ ο οποίος συγετρώει στοιχεία που ααφέροται σε έα σύολο ατιειμέω, τα ταξιομεί, αι τα παρουσιάζει σε ατάλληλη μορφή ώστε α μπορού α ααλυθού αι α ερμηευθού. Πληθυσμός μιας έρευας λέγεται το σύολο τω ατιειμέω που εξετάζουμε ως προς έα ή περισσότερα χαρατηριστιά. Κάθε στοιχείο του πληθυσμού οομάζεται άτομο ή μοάδα του πληθυσμού. Το πλήθος τω ατόμω εός πληθυσμού, οομάζεται μέγεθος του πληθυσμού. Έα χαρατηριστιό, ως προς το οποίο εξετάζεται έας πληθυσμός, οομάζεται μεταβλητή. Οι μεταβλητές μπορεί α είαι : ή ποσοτιές, τα οποία μπορού α μετρηθού (π.χ. αριθμός παιδιώ μιας οιογέειας, ύψος ή βάρος εός ατόμου, ηλιία λπ) ποιοτιές ( ή ατηγοριές), τα οποία δε μπορού α μετρηθού αλλά περιγράφου τα άτομα του πληθυσμού, π.χ. χρώμα ματιώ, φύλο, ατάσταση υγείας λπ. Οι ποσοτιές μεταβλητές ειδιότερα διαρίοται σε: Διαριτές μεταβλητές, στις οποίες άθε άτομο μπορεί α πάρει μόο μεμοωμέες τιμές. (π.χ. αριθμός παιδιώ, αριθμός βιβλίω που διάβασε άποιος σε έα διάστημα λπ) Συεχείς μεταβλητές, στις οποίες άθε άτομο μπορεί α πάρει οποιαδήποτε πραγματιή τιμή που αήει σε άποιο διάστημα ή έωση διαστημάτω τω πραγματιώ αριθμώ. (π.χ. βάρος, ύψος, ημερομίσθιο λπ) Σχηματιά έχουμε : Μεταβλητές Ποσοτιές Ποιοτιές Διαριτές Συεχείς Απογραφή πληθυσμού λέγεται η αταγραφή αι η μελέτη όλω τω ατόμω του πληθυσμού ως προς μια ή περισσότερες μεταβλητές. Επειδή η απογραφή είαι πολύ δύσολη για τεχιούς λόγους αλλά αι δαπαηρή, επιλέγουμε α εξετάσουμε έα μέρος του πληθυσμού το οποίο όμως πρέπει α είαι ατιπροσωπευτιό του πληθυσμού, δηλαδή α αποτελεί μιρογραφία του. Το μέρος αυτό του πληθυσμού οομάζεται δείγμα, αι η διαδιασία αυτή δειγματοληψία. Α το δείγμα δε επιλεγεί σωστά, δε θα είαι αξιόπιστο αι η έρευά μας μπορεί α μη οδηγήσει σε σωστά αποτελέσματα Ο αριθμός τω ατόμω του δείγματος λέγεται μέγεθος του δείγματος αι συμβολίζεται με.
ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΜΕ ΠΙΝΑΚΕΣ Έστω x, x,, x οι διαφορετιές τιμές μιας μεταβλητής Χ που αφορά έα δείγμα μεγέθους, με. Α όλες οι τιμές εμφαίζοται μία φορά, τότε =. Α <, προφαώς άποιες ή όλες οι τιμές εμφαίζοται περισσότερες από μία φορά. Ο φυσιός αριθμός που δείχει πόσες φορές εμφαίζεται η τιμή x της μεταβλητής Χ στο σύολο τω παρατηρήσεω λέγεται συχότητα της παρατήρησης x. Το άθροισμα τω συχοτήτω είαι ίσο με το μέγεθος του δείγματος Δηλαδή ισχύει + +... + = Το πηλίο της συχότητας μιας παρατήρησης προς το μέγεθος του δείγματος λέγεται σχετιή συχότητα της παρατήρησης x αι συμβολίζεται με f. Δηλαδή f = =,, 3,, Για τη σχετιή συχότητα f της τιμής x ισχύει. 0 f για =,, 3,,. f + f +... + f = Η σχετιή συχότητα f της τιμής x εφράζει τι μέρος του συόλου τω παρατηρήσεω αποτελού οι παρατηρήσεις που είαι ίσες με x. Γι αυτό, είαι χρήσιμο α τη εφράζουμε σε ποσοστό επί τοις εατό αι ισχύει αι f 0 0 = 00 f f % + f % +... + f % = 00 Για τις ποσοτιές μεταβλητές ορίζοται επίσης οι έοιες : Αθροιστιή συχότητα N της τιμής x, λέγεται το πλήθος τω παρατηρήσεω που είαι μιρότερες ή ίσες της τιμής x. Είαι : Ν = αι N = N- + ή Ν= + + +
Ατίστοιχα έχουμε Σχετιή αθροιστιή συχότητα F της τιμής x, λέγεται το ποσοστό τω παρατηρήσεω που είαι μιρότερες ή ίσες της τιμής x. Ισχύει : F = f αι F = F- + f ή F=f+f+ +f Στις ποιοτιές μεταβλητές δε έχουμε αθροιστιές συχότητες. Ο πίαας στο οποίο συγετρώοται όλα τα στοιχεία μιας αταομής, λέγεται πίαας συχοτήτω της αταομής. Το σύολο τω ζευγώ ( x, ) αποτελεί τη αταομή συχοτήτω της μεταβλητής. Το σύολο τω ζευγώ ( x, f ) ή ( x, f %) αποτελεί τη αταομή σχετιώ συχοτήτω της μεταβλητής. ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ Ότα έχουμε συεχή μεταβλητή ή διαριτή αλλά με πολύ μεγάλο πλήθος παρατηρήσεω, τότε ομαδοποιούμε τις παρατηρήσεις σε λάσεις ίσου πλάτους. Εύρος R τω παρατηρήσεω λέγεται η διαφορά της μιρότερης από τη μεγαλύτερη παρατήρηση. αριθμός k τω λάσεω εξαρτάται από το μέγεθος του δείγματος Μέγεθος δείγματος Αριθμός λάσεω Μέγεθος δείγματος Αριθμός λάσεω <0 5 00-400 9 0-50 6 400-700 0 50-00 7 700-000 00-00 8 000 Το πλάτος τω λάσεω c είαι αμέσως μεγαλύτερο αέραιο. Η ετριή τιμή ή έτρο μιας λάσης [α,β) είαι c R k = στρογγυλοποιημέο α χρειάζεται στο x α + β = Για άθε λάση [α,β) ισχύει c = β α Τα έτρα δυο διαδοχιώ λάσεω διαφέρου ατά το πλάτος c τω λάσεω. Καμία παρατήρηση δε θα μείει έξω από άποια λάση Μια τιμή που συμπίπτει με το άω όριο μιας λάσης, μπαίει στη επόμεη. 3
ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ Α. Ποιοτιές Μεταβλητές Ραβδογράμματα Κυλιό διάγραμμα Σημειόγραμμα Το ραβδόγραμμα συχοτήτω αποτελείται από ορθογώιες στήλες (ράβδους), με βάση είτε στο οριζότιο είτε στο άθετο άξοα, που αθεμία ατιστοιχεί σε μία τιμή της μεταβλητής Χ αι έχει ύψος ίσο με τη ατίστοιχη συχότητα. Το ραβδόγραμμα αι μπορεί α αφορά συχότητες, σχετιές συχότητες f, ή σχετιές συχότητες f%. Σε έα υλιό διάγραμμα, στη παρατήρηση x ατιστοιχεί υλιός τομέας με μέτρο a = 360 f = a 360 Επομέως ισχύει άρα αι a = 360 Οι τύποι αυτοί ισχύου για το υλιό διάγραμμα σε όλα τα είδη τω μεταβλητώ Β. Ποσοτιές Διαριτές Μεταβλητές Διαγράμματα Κυλιό διάγραμμα - ειοογράμματα Το διάγραμμα συχοτήτω μιας μεταβλητής Χ που οι τιμές της έχου διαταχθεί σε αύξουσα σειρά στο οριζότιο άξοα, αποτελείται από αταόρυφες γραμμές που αθεμιά ατιστοιχεί σε μια τιμή x αι έχει ύψος ίσο με τη ατίστοιχη συχότητα. Α εώσουμε τις ορυφές τω γραμμώ, δηλαδή τα σημεία ( x, ) προύπτει το πολύγωο συχοτήτω. Το διάγραμμα αι το πολύγωο μπορεί α αφορού συχότητες, αθροιστιές συχότητες Ν,σχετιές συχότητες f ή f%, ή αι σχετιές αθροιστιές συχότητες F ή F%. 4
Γ. Ομαδοποιημέες Καταομές Ιστογράμματα Κυλιό διάγραμμα Για α άουμε το ιστόγραμμα συχοτήτω, στο οριζότιο άξοα του συστήματος τω αξόω τοποθετούμε με ατάλληλη λίμαα τα όρια τω λάσεω. Στη συέχεια ατασευάζουμε διαδοχιά ορθογώια, αθέα από τα οποία έχει βάση ίση με το πλάτος της λάσης αι ύψος ίσο με τη ατίστοιχη συχότητα. Θεωρώτας το πλάτος c ως μοάδα στο οριζότιο άξοα, το εμβαδό άθε ορθογωίου είαι ίσο με τη συχότητα της λάσης. Πολύγωο συχοτήτω λέγεται το πολύγωο που προύπτει α εώσουμε τα μέσα τω άω βάσεω τω ορθογωίω του ιστογράμματος συχοτήτω θεωρώτας αι δυο υποθετιές λάσεις στη αρχή αι το τέλος με μηδειή συχότητα (μηδειό ύψος). Το εμβαδό που ορίζεται από το πολύγωο συχοτήτω αι το οριζότιο άξοα είαι ίσο με. Όμοια ορίζεται το πολύγωο σχετιώ συχοτήτω στο ιστόγραμμα σχετιώ συχοτήτω. Το εμβαδό που ορίζεται από το πολύγωο σχετιώ συχοτήτω αι το οριζότιο άξοα είαι ίσο με. Το εμβαδό που ορίζεται από το πολύγωο σχετιώ συχοτήτω f% αι το οριζότιο άξοα είαι ίσο με 00. Το ιστόγραμμα αι το πολύγωο μπορεί α αφορού συχότητες, αθροιστιές συχότητες Ν,σχετιές συχότητες f ή f%, ή αι σχετιές αθροιστιές συχότητες F ή F%. Πολύγωο αθροιστιώ συχοτήτω λέγεται το πολύγωο που προύπτει α εώσουμε τα δεξιά άρα τω άω βάσεω τω ορθογωίω του ιστογράμματος συχοτήτω αρχίζοτας από το αριστερό άρο της άτω βάσης του πρώτου ορθογωίου αι τελειώοτας στο δεξιό άρο της άω βάσης του τελευταίου. Όμοια ορίζεται το πολύγωο αθροιστιώ σχετιώ συχοτήτω στο ιστόγραμμα αθροιστιώ σχετιώ συχοτήτω. Χροόγραμμα ή χροολογιό διάγραμμα Χρησιμοποιείται για τη γραφιή απειόιση της διαχροιής εξέλιξης εός οιοομιού, δημογραφιού ή άλλου μεγέθους. Στο οριζότιο άξοα ο χρόος, στο άθετο η μεταβλητή. 5
Καμπύλες συχοτήτω Α ο αριθμός τω λάσεω σε μια συεχή μεταβλητή γίει πολύ μεγάλος, αι το πλάτος τω λάσεω πολύ μιρό, τότε το πολύγωο συχοτήτω τείει α πάρει τη μορφή μιας ομαλής αμπύλης, η οποία λέγεται αμπύλη συχοτήτω. Η μορφή της εξαρτάται από το πώς αταέμοται οι παρατηρήσεις. Χαρατηριστιές μορφές είαι Καοιή αταομή Ομοιόμορφη αταομή Ασύμμετρη με θετιή ασυμμετρία Ασύμμετρη με αρητιή ασυμμετρία ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ Ετός από τους πίαες αι τα διαγράμματα, υπάρχου αι άποια αριθμητιά μέτρα με τα οποία μπορούμε α περιγράψουμε μια αταομή. Αυτά διαρίοται σε Μέτρα θέσης, τα οποία δείχου τη θέση του έτρου τω παρατηρήσεω πάω στο οριζότιο άξοα Μέτρα διασποράς (ή μεταβλητότητας) που εφράζου τις απολίσεις τω τιμώ της μεταβλητής γύρω από τα μέτρα ετριής τάσης όπως είαι η μέση τιμή. (Πρατιά το πόσο οι παρατηρήσεις ετείοται από το έτρο.) Μέτρα ασυμμετρίας που αθορίζου τη μορφή της αμπύλης συχοτήτω αι το α αυτή παρουσιάζει συμμετρία. (δες τις παραπάω αμπύλες συχοτήτω) 6
ΜΕΤΡΑ ΘΕΣΗΣ Μέση τιμή x Μέση τιμή (ή αριθμητιός μέσος) Σταθμιός μέσος (ή σταθμισμέος αριθμητιός μέσος) Διάμεσος Μέση τιμή εός συόλου δεδομέω είαι το άθροισμα τω παρατηρήσεω διά το πλήθος τους. Α σε έα δείγμα μεγέθους, οι παρατηρήσεις μιας μεταβλητής Χ είαι t, t,,t, ( όλες διαφορετιές) τότε η μέση τιμή είαι: t t + t +... + t = x = = ή x = t = Στις ασήσεις συήθως χρησιμοποιούμε το συμβολισμό x αι όχι t για τις παρατηρήσεις μας. Α έχουμε αταομή συχοτήτω αι η μεταβλητή Χ παίρει τις διαφορετιές τιμές x, x, x, με ατίστοιχες συχότητες,, τότε η μέση τιμή είαι: x x + x +... + x x = = = = + +... + = = x Α γωρίζουμε τις σχετιές συχότητες f, τότε x = = x f Σε ομαδοποιημέες αταομές η μέση τιμή δίεται από τους ίδιους τύπους. Ως x παίρουμε το έτρο της λάσης. a + β ( Θυμίζουμε ότι το έτρο μιας λάσης [α, β) είαι x = ) ** Η μέση τιμή επηρεάζεται από τις αραίες τιμές αι εξαρτάται από όλες τις τιμές της μεταβλητής. 7
Σταθμιός μέσος x Α οι παρατηρήσεις x, x,, x εός συόλου δεδομέω έχου διαφορετιούς συτελεστές βαρύτητας (ή στάθμισης), τότε ο σταθμιός μέσος δίεται από το τύπο x x w + x w +... + x w = = = w + w +... + w = x w w Διάμεσος (δ) Η διάμεσος είαι η τιμή για τη οποία το πολύ το 50% τω παρατηρήσεω είαι μιρότερες από αυτή αι το πολύ το 50% τω παρατηρήσεω είαι μεγαλύτερες από αυτή. Διάμεσος δ εός δείγματος παρατηρήσεω που έχου διαταχθεί σε αύξουσα σειρά, οομάζεται: Η μεσαία παρατήρηση α το πλήθος τω παρατηρήσεω είαι περιττό. (μοός αριθμός) Ο μέσος όρος, δηλαδή το ημιάθροισμα, τω δύο μεσαίω παρατηρήσεω α το πλήθος τω παρατηρήσεω είαι άρτιο. (ζυγός αριθμός) ** Η διάμεσος δε επηρεάζεται από τις αραίες τιμές. 8
ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ Εύρος (ή ύμαση) R Διαύμαση (ή διασπορά) s Τυπιή απόλιση s Συτελεστής Μεταβολής (ή Μεταβλητότητας) Εύρος (R) Εύρος R εός συόλου παρατηρήσεω οομάζουμε τη διαφορά της μιρότερης τιμής από τη μεγαλύτερη.. R = x x max mn Το εύρος βασίζεται μόο από στις δυο αραίες παρατηρήσεις αι γι αυτό δε θεωρείται αξιόπιστο μέτρο διασποράς. Διαύμαση (s ) Διαύμαση s εός συόλου παρατηρήσεω t, t, t, οομάζουμε τη μέση τιμή τω τετραγώω τω απολίσεω τω t από τη μέση τιμή x. Α η μεταβλητή μας παίρει τις διαφορετιές τιμές t, t, t οι οποίες έχου μέση τιμή x, τότε s t x = ( ) = Α έχουμε πίαα συχοτήτω τω παρατηρήσεω αι οι παρατηρήσεις μας παίρου τις διαφορετιές τιμές x, x, x με ατίστοιχες συχότητες,,, τότε η διαύμαση είαι s x x = ( ) = Προσοχή! Στις ομαδοποιημέες αταομές ισχύου οι ίδιοι τύποι. Ως x λαμβάοται τα μέσα x τω λάσεω. *** Το μειοέτημα της διαύμασης είαι ότι οι μοάδες στις οποίες υπολογίζεται είαι το τετράγωο της μοάδας της ατίστοιχης μεταβλητής. Γι αυτό, ατί για τη διαύμαση, χρησιμοποιούμε ως μέτρο διασποράς τη τετραγωιή της ρίζα 9
Τυπιή απόλιση (s) Τυπιή απόλιση s εός συόλου παρατηρήσεω λέγεται η θετιή τετραγωιή ρίζα της διαύμασης τω παρατηρήσεω, δηλ s = s *** Η τυπιή απόλιση εφράζεται στις ίδιες μοάδες με τη μεταβλητή! Συτελεστής Μεταβολής CV (ή Μεταβλητότητας) Ότα θέλουμε α συγρίουμε ως προς τη ομοιογέεια δείγματα που είτε έχου διαφορετιή μέση τιμή αι τυπιή απόλιση, είτε μετριούται ως προς το ίδιο χαρατηριστιό σε διαφορετιές μοάδες ή λίμαες, τα μέτρα που έχουμε ααφέρει δε επαρού. Για α ξεπεράσουμε αυτό το πρόβλημα ορίζουμε έα αόμη μέτρο διασποράς: το συτελεστή μεταβολής Α έα δείγμα εξεταζόμεο ως προς μια ποσοτιή μεταβλητή του, παρουσιάζει μέση τιμή x 0 αι τυπιή απόλιση s, συτελεστής μεταβολής (ή συτελεστής μεταβλητότητας) οομάζεται το πηλίο: CV τυπιη απολιση = = µεση τιµη s x Α η μέση τιμή είαι αρητιός αριθμός τότε CV = s x Ο συτελεστής μεταβολής είαι έα μέτρο σχετιής διασποράς, δείχει τη διασπορά απαλλαγμέη από τη επίδραση της μέσης τιμής. είαι αθαρός αριθμός δηλαδή αεξάρτητος από τις μοάδες μέτρησης. Ο συτελεστής μεταβολής μετρά τη ομοιογέεια του δείγματος. Α CV < 0%, τότε ο πληθυσμός του δείγματος θεωρείται ομοιογεής. Α Α αι Β δύο δείγματα με συτελεστές μεταβολής CVA αι CVΒ τότε α CVA < CVΒ το δείγμα Α παρουσιάζει μεγαλύτερη ομοιογέεια από το δείγμα Β 0
ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ Α οι παρατηρήσεις x, x, x, με μέση τιμή x, διάμεσο δ αι τυπιή απόλιση s, αολουθού αταομή αοιή ή περίπου αοιή, τότε Το 68% τω παρατηρήσεω βρίσεται στο διάστημα ( x s, x + s) Το 95% τω παρατηρήσεω βρίσεται στο διάστημα ( x s, x + s) Το 99,7% τω παρατηρήσεω βρίσεται στο διάστημα ( x 3 s, x + 3 s) Το εύρος R είαι ίσο με περίπου 6 τυπιές απολίσεις R 6s δ = x x 3s x s x s x x + s x + s x + 3s 68% 95% 99,7%