9/10/009 ΤΕΙ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Η/Υ ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ 3o ΜΑΘΗΜΑ Ι ΑΣΚΩΝ ΒΑΣΙΛΕΙΑ ΗΣ ΓΕΩΡΓΙΟΣ Emal: gasl@math.auth.gr Ιστοσελίδα Μαθήματος: users.auth.gr/gasl kastora.tekoz.gr/elearn 1 Διαγράμματα Συνεχών Μεταβλητών Για να παραστήσουμε γραφικά μια συνεχή μεταβλητή κάνουμε ιστόγραμμα συχνοτήτων και πολύγωνο συχνοτήτων είτε των και f είτε των αθροιστικών N και F. Τα ιστογράμματα είναι χρήσιμα γιατί μας βοηθούν να έχουμε μία πρώτη εικόνα για την κατανομή της μεταβλητής. 1
9/10/009 Τρόπος Κατασκευής Ιστογράμματος και Πολυγώνου συχνοτήτων Για να κάνουμε το ιστόγραμμα συχνοτήτων του Ύψους των μαθητών ακολουθούμε τα παρακάτω βήματα: Στον οριζόντιο άξονα ενός συστήματος ορθογωνίων αξόνων βάζουμε τα κέντρα των κλάσεων ή τις κλάσεις και στον κάθετο άξονα τις συχνότητες ή f ανάλογα με το ιστόγραμμα που θέλουμε να κάνουμε. Στη συνέχεια κατασκευάζουμε ορθογώνια με ίσο πλάτος και ύψος ίσο με την συχνότητα ή f. Αν επιπλέον θέλουμε να κάνουμε το πολύγωνο συχνοτήτων τότε ενώνουμε τα μέσα των άνω βάσεων των ορθογωνίων. 3 Τρόπος Κατασκευής Ιστογράμματος και Πολύγωνου Αθροιστικών Συχνοτήτων. Για να κατασκευάσουμε το ιστόγραμμα και το πολύγωνο Αθροιστικών συχνοτήτων ακολουθούμε όλη την παραπάνω διαδικασία με την διάφορα ότι στην κατασκευή του πολύγωνου ενώνουμε τα δεξιά άκρα των ορθογωνίων και όχι τα μέσα όπως προηγουμένως. 4
9/10/009 Ιστόγραμμα Συχνοτήτων Μεταβλητής Ύψος Μαθητών 14 1 10 Συχνότητες 8 6 4 0 (0-156) [156-16) [16-168) [168-174) [174-180) [180-186) [186-19] Κλάσεις 5 Ιστόγραμμα & Πολύγωνο Συχνοτήτων Μεταβλητής Ύψος Μαθητών 14 1 10 8 6 4 0 (0-156) [156-16) [16-168) [168-174) [174-180) [180-186) [186-19] [19-00] 6 3
9/10/009 Ιστόγραμμα Αθροιστικών Σχετικών % Συχνοτήτων 100 90 80 70 60 50 40 30 0 10 0 (0-156) [156-16) [16-168) [168-174) [174-180) [180-186) [186-19] 7 100 Ιστόγραμμα & Πολύγωνο Αθροιστικών Σχετικών % Συχνοτήτων Ζ Η 90 80 Ε 70 60 50 40 30 Γ 0 10 0 Β Α (0-156) [156-16) [16-168) [168-174) [174-180) [180-186) [186-19] 8 4
9/10/009 Άσκηση: Οι χρόνοι (σε λεπτά) που χρειάστηκαν 55 σπουδαστές για να λύσουν μία άσκηση δίνονται στον παρακάτω πίνακα: 3,4 13, 6,7 1,4 1,3 3,8 3,9,9 13,8 3,9,7 4,4 3,6 1,4,4 3,6 3,1 7,5 6,9 7,8 1,7 3,9 3,3 9,7,0 4,4 3,3 8,7 3,9 11,6 5,6 9,0 3,4 1,4 3,5,8 10,4 11,9 1,3,9,8 1,5 4,1 5,9 3,1 8,7,8 3,8 13,0 3,0 6,4 3, 5,9 7,0 8, α) Να ομαδοποιήσετε τα δεδομένα σε κατάλληλο αριθμό κλάσεων β) Να κατασκευάσετε τον πίνακα συχνοτήτων γ) Να κατασκευάσετε το πολύγωνο σχετικών συχνοτήτων και αθροιστικών σχετικών συχνοτήτων. 9 Αριθμητικά περιγραφικά μέτρα στατιστικών δεδομένων Η βαθμολογία δύο τμημάτων μαθητών στο μάθημα της Στατιστικής δίνεται στους παρακάτω πίνακες: 8 11 13 14 15 16 17 16 18 19 Τμήμα Α 9 11 14 15 15 17 16 17 18 0 10 1 13 16 17 15 17 14 16 18 8 15 16 17 14 17 13 16 18 16 Τμήμα Β 1 13 11 14 18 13 16 19 17 15 8 15 17 13 0 16 0 11 19 16 10 5
9/10/009 Πίνακες Συχνοτήτων Βαθμο Τμήμα Α Τμήμα Β x ί Συχνότητες Συχνότητες 8 1 9 1 0 10 1 0 11 1 1 1 13 4 14 3 15 4 3 16 5 6 17 5 4 18 3 19 1 0 1 Σύνολο 30 30 Αν θέλουμε να συγκρίνουμε τα δύο τμήματα δεν μπορούμε να βγάλουμε κάποιο συμπέρασμα από τους πίνακες συχνοτήτων. 11 Διαγράμματα Συχνοτήτων ιάγραμμα Συχνοτήτων Βαθμολογίας για το τμήμα Α ιάγραμμα Συχνοτήτων Βαθμολογίας για το τμήμα Β 6 6 5 5 4 4 3 3 1 1 0 8 9 10 11 1 13 14 15 16 17 18 19 0 0 8 9 10 11 1 13 14 15 16 17 18 19 0 Παρατηρούμε ότι η βαθμολογία είναι συγκεντρωμένη γύρω από το 16 και ότι το τμήμα Β παρουσιάζει διαφορετική διασπορά σε αντίθεση με το τμήμα Α. 1 6
9/10/009 Ο πίνακας συχνότητας καθώς επίσης και τα γραφήματα αποτελούν μορφές συνοπτικής παρουσίασης των δεδομένων για να μελετήσουμε την κατανομή τους. Στη συνέχεια έ θ υπολογίσουμε θα λ ί ποσοτικά ά μεγέθη έθ που περιγράφουν με περιληπτικό τρόπο τα βασικά χαρακτηριστικά των δεδομένων και λέγονται αριθμητικά περιγραφικά μέτρα. Κάθε τέτοιο αριθμητικό μέτρο υπολογίζεται από το δείγμα και αποτελεί εκτίμηση της παραμέτρου ( αριθμητικό μέτρο που υπολογίζεται από τον πληθυσμό ) 13 Θα δούμε τους παρακάτω τύπους αριθμητικών περιγραφικών μέτρων: τα μέτρα θέσης ή μέτρα κεντρικής τάσης που προσδιορίζουν χαρακτηριστικές θέσεις των δεδομένων ¾ τα μέτρα μεταβλητότητας που δίνουν περιληπτικά τη διασκόρπιση και μεταβλητότητα των δεδομένων ¾ τα μέτρα ασυμμετρίας που ελέγχουν κατά πόσο είναι συμμετρική ή ασύμμετρη η κατανομή των δεδομένων. ¾ 14 7
9/10/009 Μέτρα θέσης ή κεντρικής τάσης Τα κυριότερα μέτρα θέσης είναι τα παρακάτω: 1) Δειγματική μέση τιμή ή αριθμητικός μέσος ) Δειγματική διάμεσος 3) Δειγματική επικρατούσα τιμή 4) Εκατοστιαία σημεία ή p-ποσοστιαία σημεία 15 1) Δειγματική μέση τιμή (aerage) Έστω x1, x,, xn οι τιμές των παρατηρήσεων του δείγματος για μια μεταβλητή Χ που μελετάμε. Η δειγματική μέση τιμή συμβολίζεται με x και ορίζεται ως x = x1 + x +L + x = x =1 16 8
9/10/009 Αν τα δεδομένα είναι ταξινομημένα σε πίνακα συχνοτήτων τότε x 1 + x + + L + x + L + k 1 k k = 1 x ή = 1 k = x x = x 1f1 + x f + L + x k f k = x f k = 1 17 Παράδειγμα: ίνεται η βαθμολογία 10 σπουδαστών στο μάθημα της Στατιστικής. Ποια είναι η μέση επίδοση των σπουδαστών. Βαθμοί: 5, 6, 6, 8, 4, 1, 9, 3, 10, 5. 5+ 6+ 6+ 8+ 4+ 1+ 9+ 3+ 10+ 5 x= = 5.7 10 18 9
9/10/009 ) Δειγματική διάμεσος (medan) Αν οι τιμές του δείγματος έχουν διαταχθεί σε αύξουσα σειρά η διάμεσος δ ορίζεται ως η μεσαία παρατήρηση αν το πλήθος των τιμών είναι περιττός αριθμός, ή ως το ημιάθροισμα των δύο μεσαίων τιμών αν το πλήθος είναι άρτιος αριθμός. Χ +1, δ= 1 Χ + Χ +, αν περιττός αν άρτιος 19 Ιδιότητες της Διαμέσου. α) Αν το πλήθος των δεδομένων είναι μεγάλο και αν οι τιμές δεν επαναλαμβάνονται τακτικά, τότε περίπου οι μισές τιμές είναι μικρότερες της διαμέσου και οι άλλες μισές μεγαλύτερες της διαμέσου. β) Η διάμεσος δεν επηρεάζεται από τις ακραίες τιμές. μ ς 0 10
9/10/009 Παράδειγμα: Έστω οι τιμές μίας μεταβλητής είναι: 1, 19, 16, 0, 17,, 13, 19. Ποια είναι η διάμεσος; ιατάσουμε σε αύξουσα σειρά 1, 13, 16, 17, 19, 19, 0, Η διάμεσος είναι δ = (17+19)/ = 18 1 Παράδειγμα: Έστω οι τιμές μίας μεταβλητής είναι: 4, 7, 8, 0, 5, 3, 8, 3, 9. Ποια είναι η διάμεσος; ιατάσουμε σε αύξουσα σειρά 3, 3, 4, 5, 7, 8, 8, 9, 0 Η διάμεσος είναι δ = 7 11
9/10/009 Για συνεχή ποσοτικά δεδομένα που είναι ομαδοποιημένα σε πίνακα συχνοτήτων για να βρούμε την διάμεσο χρησιμοποιούμε τη σχέση: δ = a + N 1 c a N 1 : κατώτερο όριο της κλάσης που περιέχει τη διάμεσο, : συχνότητα της κλάσης που περιέχει τη διάμεσο, : αθροιστική συχνότητα της προηγούμενης της κλάσης που περιέχει τη διάμεσο, c : πλάτος κλάσης. 3 Παράδειγμα: ίνεται ο πίνακας συχνοτήτων για το χρόνο που χρειάστηκαν 35 ποντίκια για να τρέξουν ένα λαβύρινθο. Να βρεθεί η διάμεσος. Χρόνος Συχνότητα Αθρ. Συχνότητα [368,380) 1 1 [380,39) 3 4 [39,404) 8 1 [404,416) 416) 1 4 [416,48) 8 3 [48,440) 3 35 4 1
9/10/009 Λύση: Η διάμεσος ανήκει στην κλάση [404,416). Άρα α = 404 = 1 N-1 = 1 c = 1 Έτσι αντικαθιστώντας βρίσκουμε δ = 409,5 5 3) Δειγματική επικρατούσα τιμή Αν x1, x,, xn οι τιμές του δείγματος τότε η επικρατούσα τιμή είναι η τιμή της μεταβλητής με τη μεγαλύτερη συχνότητα. Αν όλες οι τιμές έχουν την ίδια συχνότητα δεν ορίζεται επικρατούσα τιμή. Αν δύο ή περισσότερες τιμές έχουν την ίδια συχνότητα τότε υπάρχουν περισσότερες από μία επικρατούσες τιμές. 6 13
9/10/009 Παράδειγμα. Αν οι τιμές της μεταβλητής είναι: 1, 19, 16, 0, 17,, 13, 19 τότε η επικρατούσα τιμή είναι η 19. Παράδειγμα. Αν οι τιμές της μεταβλητής είναι: 4, 7, 8, 0, 5, 3, 8, 3, 9 τότε υπάρχουν δύο επικρατούσες τιμές, η 3 και η 8. Σημείωση. Αν μία μεταβλητή έχει δύο (ή περισσότερες) επικρατούσες τιμές ονομάζεται δίκορφη (η πολύκορφη, αντίστοιχα). 7 Παρατηρήσεις: 1) Η επικρατούσα τιμή σε δεδομένα που είναι ομαδοποιημένα σε πίνακα συχνοτήτων είναι η κεντρική τιμή της κλάσης που έχει τη μεγαλύτερη συχνότητα. ) Η επικρατούσα τιμή ορίζεται και για ποιοτικά δεδομένα. 8 14
9/10/009 4) Εκατοστιαία σημεία ή p-ποσοστιαία σημεία (percentles) Μία παρατήρηση είναι το p-εκατοστιαίο σημείο (p ποσοστιαίο σημείο) αν ποσοστό (p-ποσοστιαίο παρατηρήσεων το πολύ p% είναι μικρότερες απ αυτήν την παρατήρηση. Συμβολίζουμε με Pp. ¾ Το τριακοστό εκατοστημόριο P30 ορίζεται ως η τιμή της μεταβλητής κάτω από την οποία βρίσκεται το 30% των τιμών της μεταβλητής β ¾ Το πεντηκοστό εκατοστημόριο P50 ορίζεται ως η τιμή της μεταβλητής κάτω από την οποία βρίσκεται το 50% των τιμών της μεταβλητής, δηλαδή η διάμεσος 9 Τρόπος εύρεσης των Pp Μη ταξινομημένα δεδομένα: 1) ιατάσσουμε τις τιμές της μεταβλητής σε αύξουσα σειρά. Βρίσκουμε τη θέση των Pp χρησιμοποιώντας τον τύπο: θέση του Pp = p(+1)/100. Αν προκύπτει ρ ωςς θέση η του Pp δεκαδικόςς αριθμός της μορφής a,b τότε ) Pp = X(a) + 0, b (X(a+1) X(a) ) 30 15
9/10/009 Παράδειγμα: Υποθέτουμε ότι έχουμε τις ακόλουθες 14 παρατηρήσεις, κατ αύξουσα σειρά μεγέθους: 3,5,8,10,11,14,18,0,,5,31,48,67,9. Θέλουμε το τριακοστό ποσοστιαίο σημείο. Λύση: Θέση του P 30 : 30(14+1)/100 = 4,5 Άρα P 30 = Χ (4) + 0,5( Χ (5) - Χ (4) ) = 10 + 0,5(11-10) = 10,5 31 Ταξινομημένα δεδομένα: P p = a + c p 100 N 1 a : κατώτερο όριο της κλάσης που περιέχει το p-ποσοστιαίο σημείο, : συχνότητα της κλάσης που περιέχει το p-ποσοστιαίο σημείο, 1 : αθροιστική συχνότητα της προηγούμενης ης της κλάσης που περιέχει το p-ποσοστιαίο σημείο, N c : πλάτος κλάσης. : μέγεθος του δείγματος 3 16
9/10/009 Σύγκριση Μέσης Τιμής, ιαμέσου & Επικρατούσης Τιμής. Μέση Τιμή Διάμεσος Επικρατούσα Τιμή Μεγάλη Εφαρμογή στη Καθόλου εφαρμογή σε Καθόλου εφαρμογή σε στατιστική ανάλυση περαιτέρω στατιστική περαιτέρω στατιστική ανάλυση ανάλυση Εύκολα Κατανοητή Εύκολα Κατανοητή Εύκολα Κατανοητή Επηρεάζεται από ακραίες τιμές εν υπολογίζεται σε ποιοτικά δεδομένα εν επηρεάζεται από ακραίες τιμές εν υπολογίζεται σε ποιοτικά δεδομένα εν επηρεάζεται από ακραίες τιμές Εφαρμόζεται σε ποιοτική μεταβλητή Μοναδική Μοναδική Δεν ορίζεται μονοσήμαντα 33 Ασκήσεις Άσκηση 1. Ο παρακάτω πίνακας δίνει τον αριθμό των επισκέψεων 40 μαθητών σε διάφορα μουσεία της χώρας κατά την διάρκεια ενός έτους. Επισκέψεις Συχνότητα [0,) 8 [,4) 1 [4,6) 10 [6,8) 6 [8,10) 4 Να υπολογιστούν: α) η μέση τιμή β) η διάμεσος γ) η επικρατούσα τιμή δ) το 40ο ποσοστιαίο σημείο 34 17
9/10/009 Άσκηση. Τα δεδομένα του παρακάτω πίνακα είναι οι τιμές μιας ραδιενεργού ουσίας που βρέθηκε στον οργανισμό 60 μικρών ζώων μετά την έκθεση τους σε μία ραδιενεργό πηγή, η οποία γενικώς θεωρείται επικίνδυνη. 3 7 8 6 7 4 9 8 9 10 10 1 10 10 9 11 9 7 10 8 5 10 9 7 5 11 11 8 8 4 9 8 10 9 8 8 1 9 9 9 8 9 6 9 8 10 10 7 9 9 7 11 7 6 9 8 9 9 10 6 Να υπολογιστούν α) η μέση τιμή β) η διάμεσος γ) η επικρατούσα τιμή και δ) το 30ο ποσοστιαίο σημείο. 35 Άσκηση 3. Η κατανομή των ημερήσιων αποδοχών των υπαλλήλων μιας επιχείρησης έχει ως εξής: Ημερήσιες αποδοχές σε ευρώ Άτομα [30,40) 4 [40,50) 6 [50,60) 8 [60,70) 1 [70,80) 9 [80,90) 7 [90,100) 4 Ζητούνται να βρεθούν: α) η μέση τιμή β) η διάμεσος γ) η επικρατούσα τιμή και δ) το 0ο ποσοστιαίο σημείο. 36 18
9/10/009 ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ Γενικά, σε μία κατανομή συχνοτήτων, εκτός από τη γνώση των μέτρων θέσης ενδιαφέρει να γνωρίζουμε και πώς διασκορπίζονται οι τιμές της μεταβλητής γύρω από τη μέση τιμή ή και μεταξύ τους. Επομένως είναι απαραίτητη η χρησιμοποίηση στατιστικών μέτρων που μετρούν τον βαθμό της διασποράς των τιμών μιας μεταβλητής. Τα μέτρα αυτά ονομάζονται μέτρα διασποράς. 37 Τα κυριότερα μέτρα διασποράς είναι: 1) Εύρος δείγματος ) Δειγματική διακύμανση ή δειγματική διασπορά 3) Δειγματική τυπική απόκλιση 4) Ενδοτεταρτημοριακό εύρος 38 19
9/10/009 Εύρος δείγματος Εύρος δείγματος ονομάζεται η διαφορά ανάμεσα στη μεγαλύτερη και τη μικρότερη τιμή του. του Συμβολίζουμε με R και είναι R = Xmax - Xmn 39 Δειγματική διακύμανση ή διασπορά Η διακύμανση ή διασπορά μετρά τη μεταβλητότητα των παρατηρήσεων γύρω από τη μέση τιμή. Αν ορίσουμε την απόκλιση μιας παρατήρησης x από τη μέση τιμή x ως α φανερό φα ερό ό ο άθρο σμα όλων ό ω αυτών αυ ώ των ω x x, εείναι ότι το άθροισμα αποκλίσεων είναι ίσο με 0. Γι αυτό διαλέγουμε να αθροίσουμε όχι τις αποκλίσεις αλλά τα τετράγωνα των αποκλίσεων. Επίσης για να πάρουμε ένα μέτρο της μέσης απόκλισης θα πρέπει να διαιρέσουμε με το πλήθος ν των παρατηρήσεων. Για τεχνικούς λόγους, οι οποίοι δεν θα μας απασχολήσουν, διαιρούμε με ν 1 αντί για ν και η δειγματική διασπορά s δίνεται ως: (x - x ) ( x - x) + (x - x) +L+ (x - x) = = s 1-1 =1-1 40 0
9/10/009 Σε περίπτωση που τα δεδομένα είναι ταξινομημένα τότε: x : κέντρα των κλάσεων : συχν. των κλάσεων s = k = 1 ( x - x ) Σημείωση: οι μονάδες στις οποίες εκφράζεται η διακύμανση δα είναι τα τετράγωνα των μονάδων των τιμών της μεταβλητής. Για αυτό ορίζουμε: - 1 41 Δειγματική τυπική απόκλιση Δειγματική τυπική απόκλιση s ονομάζεται η θετική τετραγωνική ρίζα της δειγματικής διασποράς s, δηλαδή: s = s Η τυπική απόκλιση μετριέται στην ίδια μονάδα μέτρησης με τα δεδομένα και εκφράζει την τυπική απόκλιση των δεδομένων από τη δειγματική μέση τιμή, δηλαδή μέχρι πόσο περιμένουμε μια τυπική τιμή της μεταβλητής να απέχει από τη μέση τιμή. 4 1
9/10/009 Παράδειγμα: Να βρεθεί η διακύμανση και η τυπική απόκλιση των τιμών: 100,105,115,10,15,135,140 Λύση: Η μέση τιμή είναι x 100+ 105+ 115+ 10+ 15+ 135+ 140 x = = = 10 7 43 x 100 105 115 10 15 135 140 x -0-15 -5 0 5 15 0 x ( ) x x 400 5 5 0 5 5 400 Σύνολο 1300 Οπότε θα έχουμε: s ( x x) 1300 = = = 1 6 16,66 s = s = 14,7 44
9/10/009 Ενδοτεταρτημοριακό εύρος Το 5 ποσοστιαίο σημείο ( ο ορισμός του ποσοστιαίου σημείου υπάρχει σε προηγούμενη διαφάνεια) ονομάζεται πρώτο τεταρτημόριο και το συμβολίζουμε Q1, το 50 ποσοστιαίο σημείο ονομάζεται δεύτερο τεταρτημόριο και το συμβολίζουμε Q ενώ το 75 ποσοστιαίο σημείο ονομάζεται τρίτο τεταρτημόριο και το συμβολίζουμε Q3. Η διαφορά Q3 - Q1 λέγεται ενδοτεταρτημορικό εύρος και δίνει το εύρος που καλύπτουν τα μισά από τα δεδομένα που είναι ποιο κοντά στην κεντρική τιμή ( διάμεσο ). 45 Συντελεστής Μεταβλητότητας (coeffcent of araton) Οι παράμετροι Θέσης & ιασποράς δεν επαρκούν για να μας δώσουν πληροφορίες όταν θέλουμε να συγκρίνουμε ομάδες τιμών οι οποίες είτε εκφράζονται στην ίδια μονάδα μέτρησης είτε σε διαφορετικές μονάδες μέτρησης. Παράδειγμα. Θέλουμε να συγκρίνουμε τις κατανομές των μηνιαίων μισθών στην Αμερική & στην Ευρώπη, αν είναι γνωστό ότι x A = 1500$ με s A = 400$ ενώ x Ε = 1000 Ε με s Ε = 350Ε. Παράδειγμα. Σε δύο τμήματα μαθητών παρατηρήσαμε ότι ο βαθμός τους στο μάθημα της Στατιστικής είχε: x A = 15 με s A = 4 ενώ x B = 16 με s B = 4. Τα δύο τμήματα παρουσιάζουν την ίδια διακύμανση? 46 3
9/10/009 Για να αποφύγουμε τις παραπάνω δυσκολίες ορίζουμε ως συντελεστή μεταβολής τον καθαρό αριθμό (βαθμός s διασποράς) για τον οποίο ισχύει ότι: CV = 100 %. x Εκφράζεται επί τοις εκατό και παριστάνει ένα μέτρο σχετικής διασποράς. Εκφράζει δηλαδή τη μεταβλητότητα των δεδομένων απαλλαγμένη από την επίδραση της μέσης τιμής. Σημείωση: Όσο μικρότερος είναι ο συντελεστής μεταβλητότητας τόσο μεγαλύτερη ομοιογένεια υπάρχει στις τιμές της μεταβλητής. Αν CV 10% τότε το δείγμα μας ονομάζεται ομοιογενές. 47 Παράτυπα Σημεία ¾ ¾ Μία τιμή πολύ μεγάλη ή πολύ μικρή σε σχέση με τις μ ςμ β η ής Χ ονομάζεται μ ζ υπόλοιπεςς τιμές μίαςς μ μεταβλητής παράτυπο σημείο (outler). Ονομάζουμε z-score μίας τιμής x ενός συνόλου δεδομένων την απόσταση της τιμής αυτής από τη μέση τιμή, μετρούμενη σε μονάδες τυπικής απόκλισης, δηλαδή: z= x x s Θετικά z-scores έχουν οι τιμές δεξιά της μέσης τιμής, ενώ αρνητικά οι τιμές αριστερά της μέσης τιμής. Οι τιμές που έχουν z-scores μεγαλύτερα του 3 ή μικρότερα του -3 είναι πιθανά παράτυπα σημεία. 48 4