Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ. π.χ. Βαθμολογία διαγωνίσματος σε τμήματα: Α : 7, 11,16, 16,,. Β : 11, 13, 16, 16, 17, 17. Παρατήρηση : Για τέτοιους λόγους χρειάζεται και η εξέταση κάποιων μέτρων διασποράς (ή μεταβλητότητας), δηλαδή μέτρων που εκφράζουν τις αποκλίσεις των τιμών μιάς μεταβλητής γύρω από τα μέτρα κεντρικής θέσης. Α. Ε ύ ρ ο ς ( R ). ( ή κ ύ μ α ν σ η r a n g e ) Η διαφορά της ελάχιστης παρατήρησης από τη μέγιστη παρατήρηση. Στο παραπάνω π.χ. : Στα ομαδοποιημένα δεδομένα, είναι η διαφορά του κατώτερου ορίου της 1ης κλάσης από το ανώτερο όριο της τελευταίας κλάσης. π.χ. fi% 3 Πλήθος σελίδων δείγματος βιβλίων. 3 1 1 1 3 4 6 σελ 1
Σ χ ό λ ι α. i) Το εύρος είναι το απλούστερο μέτρο διασποράς. (εύκολα υπολογίσιμο) ii) Δεν θεωρείται αξιόπιστο μέτρο διασποράς γιατί βασίζεται μόνο στις δύο ακραίες παρατηρήσεις. π.χ. Ραβδόγραμμα δύο τμημάτων (βαθμοί στη Στατιστική). Α Β 4 4 3 3 1 1 11 1 13 14 1 16 17 18 19 11 1 13 14 1 16 17 18 19 B. Δ ι α κ ύ μ α ν σ η ( s ). ( ή δ ι α σ π ο ρ ά v a r i a n c e ) Στο παραπάνω π.χ. μεγαλύτερη διασπορά από το Α. ενώ φαίνεται ότι το τμήμα Β παρουσιάζει Με άλλα λόγια, οι αποστάσεις των παρατηρήσεων του Β από το x B είναι συνολικά μεγαλύτερες από τις αντίστοιχες αποστάσεις του Α. Επομένως, Όσο πιό μεγάλες είναι συνολικά οι διαφορές των παρατηρήσεων από τη μέση τιμή τους, τόσο πιό μεγάλη θα είναι η διασπορά του δείγματος. ( λογικό είναι να ορίσουμε ένα μέτρο διασποράς ως το μέσο όρο των διαφορών αυτών.) Επειδή άλλες διαφορές είναι αρνητικές και άλλες θετικές, χρησιμοποιούμε το μέσο όρο των τετραγώνων αυτών ώστε να εξασφαλίσουμε ότι υπολογίζουμε το μέσο όρο θετικών ποσοτήτων. Στο π.χ.
Γενικά : Διακύμανση (s ), ονομάζεται ο μέσος όρος των τετραγώνων των διαφορών των παρατηρήσεων από τη μέση τιμή τους. Τύποι. Για απλές παρατηρήσεις (συχνότητα=1). Αν x είναι η μέση τιμή των παρατηρήσεων t 1, t,, t ν τότε, Παρατήρηση. Αν δεν βάζαμε τετράγωνα θα είχαμε : Όταν έχουμε κάνει κατανομή συχνότητων ή έχουμε ομαδοποιημένα δεδομένα. Αν x 1, x,, x κ οι τιμές της μεταβλητής (ή τα κέντρα των κλάσεων) και ν 1, ν,, ν κ οι αντίστοιχες συχνότητες, τότε : Παρατηρήσεις. i) Στην ομαδοποίηση, πίνακας : x i ν i x i x i ν i x i ν i Σ Σ Σ ii) H διακύμανση δεν εκφράζεται με τις μονάδες με τις οποίες εκφράζονται οι παρατηρήσεις. Αν οι παρατηρήσεις εκφράζονται σε μονάδες (μ), η διασπορά εκφράζεται σε μονάδες (μ ). 3
Γ. Τυπική απόκλιση (s). (standard deviation) Ορίζεται ως η θετική ρίζα της διακύμανσης. ( Τη χρησιμοποιούμε λόγω των διαφορετικών μονάδων της s από τις μονάδες των x i ) στο π.χ. Δ. Συντελεστής Μεταβολής (CV). (coefficient of variation) (ή συντελεστής μεταβλητότητας) π.χ. 1 Τιμές πώλησης δύο προïόντων Α και Β σε καταστήματα. 3 Προιόν Α (σε ευρώ) 3 Προιόν Β (σε ευρώ) 1 1 3 3 1 1 Δηλαδή, ΟΜΩΣ λογικό να κατασκευάσουμε ένα μέτρο διασποράς που να συσχετίζει την τυπική απόκλιση με το μέγεθος των παρατηρήσεων. στο π.χ. Αυτό δηλώνει πως : 4
π.χ. Μέσος μισθός υπαλλήλων στην Ελλάδα : =14 ευρώ και s E =14 ευρώ. Μέσος μισθός υπαλλήλων στις ΗΠΑ : =3 $ και s Α =69 $. x A Οι διασπορές δεν είναι άμεσα συγκρίσιμες λόγω Όμως Δηλαδή, οι μισθοί στην απ ότι οι παρουσιάζουν μεγαλύτερη διασπορά σε σχέση με το μέγεθός τους μισθοί. Γενικά : Σε πολλές περιπτώσεις μας ενδιαφέρει περισσότερο η σχετική διασπορά (δηλαδή η διασπορά σε σχέση με τη μέση τιμή x ) και όχι η απόλυτη διασπορά. οπότε Ο συντελεστής μεταβολής ορίζεται ως ο λόγος της τυπικής απόκλισης προς τη μέση τιμή x. Παρατηρήσεις. i) Με το συντελεστή μεταβολής μπορούμε να συγκρίνουμε δείγματα είτε με διαφορετικές μονάδες μέτρησης (π.χ.), είτε με τις ίδιες μονάδες μέτρησης αλλά με σημαντική διαφορά στη μέση τιμή τους (π.χ.1). ii) Ο συντελεστής μεταβολής είναι καθαρός αριθμός (δεν έχει μονάδες) και εκφράζει τη μεταβλητότητα των δεδομένων ανά μονάδα μέσης τιμής. (επειδή πρόκειται για κλάσμα με παρονομαστή τη μέση τιμή). Είναι δηλαδή μέτρο σχετικής διασποράς και όχι απόλυτης διασποράς. iii) Ενα δείγμα θα λέμε ότι είναι ομοιογενές όταν ο συντελεστής μεταβολής είναι το πολύ 1%. (CV 1%)
3 Κανονική Κατανομή. (normal distribution) 3 1 1 1 3 4 6 7 8 9 1 11 1 13 14 1 x 3s x s x s x x s x s x 3s Αν οι παρατηρήσεις ακολουθούν την κανονική κατανομή (ή περίπου αυτή), τότε : i) H μέση τιμή, η διάμεσος και η επικρατούσα τιμή συμπίπτουν : (όπου Μ : η τιμή με τη μέγιστη συχνότητα) x M ii) Το 68% περίπου των παρατηρήσεων βρίσκεται στο διάστημα (x s,x s). iii) Το 9% περίπου των παρατηρήσεων βρίσκεται στο διάστημα (x s,x s). iv) Το 99,7% περίπου των παρατηρήσεων βρίσκεται στο διάστημα (x 3s,x 3s). v) Το εύρος ισούται περίπου με 6s. (R 6 s) 6
Α σ κ ή σ ε ι ς. A 1 4. Καθεμιά από τις παρακάτω λίστες δεδομένων έχουν μέση τιμή. α) Σε ποιά λίστα υπάρχει (i) μεγαλύτερη (ii) μικρότερη διασπορά παρατηρήσεων ; β) Μπορεί να χρησιμοποιηθεί για σύγκριση των δεδομένων αυτών το εύρος ; (1),, 4,, 6, 8, 1 (), 48, 49,, 1,, 1 (3), 1,,, 98, 99, 1 A 1. Η βαθμολογία δέκα μαθητών σε ένα διαγώνισμα ήταν : 7, 11, 1, 13, 1, 3, 1, 11, 4, 14. Να υπολογίσετε α) τη μέση τιμή και τη διάμεσο. β) το εύρος, την τυπική απόκλιση και τον συντελεστή μεταβολής. Είναι η τάξη ομοιογενής; A 1 6. Ο παρακάτω πίνακας δίνει τον αριθμό των επισκέψεων 4 μαθητών σε διάφορα μουσεία της χώρας κατά τη διάρκεια ενός έτους. Να υπολογιστεί η τυπική απόκλιση. Επισκέψεις ν i [, ) 8 [, 4) 1 [4, 6) 1 [6, 8) 6 [8, 1) 4 Σύνολο 7
3 3 1 1 1 3 4 6 7 8 9 1 11 1 13 14 1 A 1 7. Ο μέσος χρόνος που χρειάζονται οι μαθητές ενός σχολείου να πάνε το πρωί από το σπίτι τους μέχρι το σχολείο είναι 1 λεπτά με τυπική απόκλιση λεπτά. Υποθέτοντας ότι έχουμε περίπου κανονική κατανομή, να βρείτε κατά προσέγγιση το ποσοστό των μαθητών που χρειάζονται : α) κάτω από 8 λεπτά γ) το πολύ 1 λεπτά β) πάνω από 14 λεπτά δ) από 6 έως 1 λεπτά A 1 9. Να υπολογίσετε τη διακύμανση και την τυπική απόκλιση για καθεμιά από τις παρακάτω λίστες δεδομένων. Συγκρίνοντας τα δεδομένα και τα αποτελέσματα τι συμπέρασμα βγάζετε ; α) 1, 3, 4,, 7 γ) 6, 8, 9, 1, 1 β) 3, 9, 1, 1, 1 δ) -1, -3, -4, -, -7. 8
A. Οι μαθητές του Γ ξόδεψαν σε μια μέρα κατά μέσο όρο 6 ευρώ αγοράζοντας διάφορα τρόφιμα από το κυλικείο του σχολείου. Εαν ο συντελεστής μεταβολής είναι 7,%, να βρείτε την τυπική απόκλιση. Εαν επιπλέον γνωρίζετε ότι το x 11.746.7, πόσοι είναι οι μαθητές του Γ ; i Β. Η μέση τιμή και η διακύμανση των τιμών ενός δείγματος είναι x =4 και s =1, αντίστοιχα. Εαν, για τις τέσσερις τιμές ισχύει 4 (x x) 14 i i1, να βρεθεί η πέμπτη τιμή. Β 4. Να δείξετε ότι εαν από όλες τις τιμές,, 4, 6, 8, 1 και 1 ενός δείγματος αφαιρέσουμε τη μέση τιμή τους και διαιρέσουμε με την τυπική τους απόκλιση, τότε οι τιμές που θα προκύψουν θα έχουν μέση τιμή και διασπορά 1. 9
αριθμός πωλητών 4 6 8 1 1 Β. Στο παρακάτω σχήμα φαίνονται οι πωλήσεις σε χιλιάδες ευρώ που έγιναν από τους πωλητές μιας εταιρείας κατα τη διάρκεια ενός έτους. α) Πόσοι είναι οι πωλητές ; β) Πόσοι πωλητές έκαναν πωλήσεις πάνω από χιλιάδες ευρώ ; γ) Να κατασκευάσετε τον πίνακα συχνοτήτων και να υπολογίσετε τη μέση τιμή, τη διάμεσο και τη διακύμανση. 14 1 1 8 6 4 4 6 8 1 1 14 πωλήσεις σε χιλ. ευρώ Κλάσεις x i ν i x i ν ι x i ν ι Ν i f i % F i % Σύνολο 1
Β 6. Στον παρακάτω πίνακα δίνεται η κατανομή της ηλικίας των ατόμων μιάς πόλης. Να υπολογίσετε την τυπική απόκλιση και τον συντελεστή μεταβολής. Ηλικία (σε έτη) Συχνότητα (σε χιλιάδες) - 1-4 14 4-6 6-8 1 8-1 4 Κλάσεις x i ν i x i ν ι x i ν ι Ν i f i % F i % Σύνολο Εφαρμογή 3. Εστω x 1, x,,x ν ν παρατηρήσεις με μέση τιμή x και τυπική απόκλιση s x. α) Αν y 1, y,,y ν είναι οι παρατηρήσεις που προκύπτουν αν προσθέσουμε σε καθεμιά από τις x 1, x,,x ν μια σταθερά c, να δειχτεί ότι : i) y x c ii) s s y x β) Αν y 1, y,,y ν είναι οι παρατηρήσεις που προκύπτουν αν πολλαπλασιάσουμε τις x 1, x,,x ν επί μια σταθερά c, να δειχτεί ότι : i) y c x ii) s c s y x 11