Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό. Συμβολίζονται με κεφαλαία γράμματα : Χ,Υ,Ζ,Β Τιμές της μεταβλητής είναι οι δυνατές τιμές που μπορεί να πάρει μια μεταβλητή. ΜΕΤΑΒΛΗΤΕΣ ΠΟΙΟΤΙΚΕΣ ή ΚΑΤΗΓΟΡΙΚΕΣ ΠΟΣΟΤΙΚΕΣ ΔΙΑΚΡΙΤΕΣ ΣΥΝΕΧΕΙΣ ΠΟΙΟΤΙΚΕΣ ή ΚΑΤΗΓΟΡΙΚΕΣ ονομάζονται οι μεταβλητές των οποίων οι τιμές τους δεν είναι αριθμοί. ΠΟΣΟΤΙΚΕΣ ονομάζονται οι μεταβλητές των οποίων οι τιμές είναι αριθμοί ΔΙΑΚΡΙΤΕΣ ονομάζονται οι ποσοτικές μεταβλητές που παίρνουν μεμονωμένες τιμές (όχι αναγκαστικά ακέραιες τιμές). ΣΥΝΕΧΕΙΣ ονομάζονται οι ποσοτικές μεταβλητές που μπορούν να πάρουν οποιοδήποτε τιμή μέσα σε ένα διάστημα πραγματικών αριθμών (α,β). ΑΠΟΓΡΑΦΗ καλείται η μέθοδος συλλογής δεδομένων από όλα τα άτομα του πληθυσμού ως προς το χαρακτηριστικό που μας ενδιαφέρει. ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ μέγεθος του δείγματος ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) f. ΔΕΙΓΜΑ ονομάζεται κάθε υποσύνολο του πληθυσμού. (ΑΠΟΛΥΤΗ) ΣΥΧΝΟΤΗΤΑ ν (frequency) είναι ο φυσικός αριθμός που δείχνει πόσες φορές εμφανίζεται η τιμή χ της εξεταζόμενης μεταβλητής Χ στο σύνολ ο των παρατηρήσεων (δείγμα). ΣΧΕΤΙΚΗ ΣΥΧΝΟΤΗΤΑ f (relatve frequency) της τιμής χ ονομάζεται το πηλίκο της συχνότητας προς το
Ιδιότητες 0 1 για =1,,,κ f ΑΠΟΔΕΙ ΞΗ: ισχύει 0 για =1,,,κ άρα και 0 αφού ν>0 συνεπώς 0 1 ΑΠΟΔΕΙΞΗ: Έχουμε f f 1 +f +.+f k =1... f +f +.+f = 1 1 1 k... 1 Πίνακας κατανομής συχνοτήτων ή απλά πίνακας συχνοτήτων είναι ο πίνακας που περιέχει τις ποσότητες χ, ν, f. Κατανομή συχνοτήτων είναι το σύνολο των ζευγών (χ, ν ) ενός δείγματος. Κατανομή σχετικών συχνοτήτων είναι το σύνολο των ζευγών (χ, f ) ή (χ, f%) ενός δείγματος. Αθροιστικές συχνότητες (απόλυτες και σχετικές) ορίζονται ΜΟΝΟ στην περίπτωση των ποσοτικών μεταβλητών (ΔΕΝ ΕΧΟΥΝ ΝΟΗΜΑ ΓΙΑ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ). Η αθροιστική συχνότητα (συμβολίζεται Ν ) εκφράζει το πλήθος των παρατηρήσεων που είναι μικρότερες ή ίσες της τιμής χ. Η αθροιστική σχετική συχνότητα (συμβολίζεται F ) εκφράζει το ποσοστό των παρατηρήσεων που είναι μικρότερες ή ίσες της τιμής χ. Αθροιστική σχετική συχνότητα % (συμβολίζεται F %) : Πολλαπλασιάζοντας την F επί 100 δηλ F %= 100. F εκφράζουμε την αθροιστική σχετική συχνότητα σε ποσοστό επί τοις εκατό. ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ Ραβδόγραμμα: (χρησιμοποιείται για ΠΟΙΟΤΙΚΗ ΜΕΤΑΒΛΗΤΗ) αποτελείται από ορθογώνιες στήλες που ο ι βάσεις του βρίσκονται στον οριζόντιο ή τον κατακόρυφο άξονα. Το ύψος της στήλης είναι ίσο με την αντίστοιχη συχνότητα (ραβδόγραμμα συχνοτήτων) ή με την αντίστοιχη σχετική συχνότητα (ραβδόγραμμα σχετικών συχνοτήτων). Η απόσταση μεταξύ των στηλών και το
πλάτος των βάσεων καθορίζεται αυθαίρετα (είναι όμως για όλες τις ράβδους το ίδιο) Το αντίστοιχο του ραβδογράμματος Διάγραμμα συχνοτήτων (για ΠΟΣΟΤΙΚΗ ΜΕΤΑΒΛΗΤΗ): υψώνουμε σε κάθε χ μια κάθετη γραμμή με ύψος ίσο με την αντίστοιχη συχνότητα. Διάγραμμα σχετικών συχνοτήτων: ομοίως με το διάγραμμα συχνοτήτων απλώς στον κάθετο άξονα βάζουμε τις σχετικές συχνότητες συνεπώς το ύψος της κάθε γραμμής ισούται με την αντίστοιχη σχετική συχνότητα. Πολύγωνο συχνοτήτων ή σχετικών συχνοτήτων είναι το πολύγωνο που σχηματίζεται αν ενώσουμε τα σημεία (χ, ν ) ή (χ, f ) αντίστοιχα και κλείσουμε την πολυγωνική γραμμή φέρνοντας κάθετες γραμμές από το πρώτο και το τελευταίο σημείο προ τον άξονα των χ. Κυκλικό διάγραμμα (για ποιοτικές και ποσοτικές μεταβλητές) χρησιμοποιείται στην περίπτωση που οι διαφορετικές τιμές της μεταβλητής είναι σχετικά λίγες. Η επίκεντρη γωνία 360 a 360 f κάθε κυκλικού τμήματος θα υπολογίζεται από τον τύπο Σημειόγραμμα (για ποιοτικές και ποσοτικές ) χρησιμοποιείται όταν έχουμε λίγες παρατηρήσεις ( μικρό δείγμα ). Χρονόγραμμα ή χρονολογικό διάγραμμα χρησιμοποιείται για την γραφική απεικόνιση της εξέλιξης ενός μεγέθους στην διάρκεια ενός χρονικού διαστήματος.
ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ Εκτός από τους στατιστικούς πίνακες και τα διαγράμματα υπάρχουν και αριθμητικά μεγέθη με τα οποία μπορούμε να περιγράψουμε με συντομία μια κατανομή συχνοτήτων. Αυτά χωρίζονται σε τρείς κατηγορίες : Μέτρα θέσης: είναι κάποια αριθμητικά μεγέθη που μας δίνουν τη θέση του κέντρου των παρατηρήσεων στον οριζόντιο άξονα. Μέτρα διασποράς ή μέτρα μεταβλητότητας: μας δίνουν την διασπορά των παρατηρήσεων, δηλαδή πόσο αυτές εκτείνονται γύρω από το κέντρο τους. Μέτρα ασυμμετρίας: καλούνται τα μέτρα που καθορίζουν την μορφή της κατανομής (κατά πόσο είναι συμμετρική η καμπύλη κ.λ.π.) και συνήθως εκφράζονται σε συνάρτηση με τα μέτρα θέσης και διασποράς. Μέτρα θέσης ΑΡΙΘΜΗΤΙΚΟΣ ΜΕΣΟΣ ή Μέση Τιμή X Διάμεσος δ Κορυφή ή Επικρατούσα τιμή Μ 0 Σταθμικός Μέσος Μέση τιμή (ή ΑΡΙΘΜΗΤΙΚΟΣ ΜΕΣΟΣ) είναι το άθροισμα των παρατηρήσεων δια του πλήθους των παρατηρήσεων. Τυπολόγιο X X t t... t t 1 1 1 1 x x11x... xk 1 1 1... 1 1 X x x x f 1 1 1 t 1 Σταθμικός Μέσος(ή σταθμισμένος αριθμητικός μέσος) εφαρμόζεται αντί του αριθμητικού μέσου στις περιπτώσεις που δίνεται διαφορετική βαρύτητα στις τιμές χ 1,χ,.,χ ν. x
xw xw 1 1xw... xw k k 1 Τυπολόγιο X w1w... w w Διάμεσος ενός δείγματος ν παρατηρήσεων οι οποίες έχουν διαταχθεί σε ΑΥΞΟΥΣΑ σειρά ορίζεται η μεσαία παρατήρηση 1, όταν το ν είναι 1 περιττός αριθμός, ή ο μέσος όρος ( το ημιάθροισμα ) των δύο παρατηρήσεων 1 όταν το ν είναι άρτιος αριθμός. ΕΠΙΣΗΜΑΝΣΗ η διάμεσος είναι η τιμή για την οποία το πολύ 50% των παρατηρήσεων είναι μικρότερες από αυτήν και το πολύ το 50% των παρατηρήσεων είναι μεγαλύτερες από αυτήν. ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ ή ΜΕΤΡΑ ΜΕΤΑΒΛΗΤΟΤΗΤΑΣ ΜΕΤΡΑ ΑΠΟΛΥΤΗΣ ΔΙΑΣΠΟΡΑΣ ΜΕΤΡΑ ΣΧΕΤΙΚΗΣ ΔΙΑΣΠΟΡΑΣ ΕΥΡΟΣ ή ΚΥΜΑΝΣΗ (συμβ. R) ΣΥΝΤΕΛΕΣΤΗΣ ΜΕΤΑΒΛΗΤΟΤΗΤΑΣ ή ΣΥΝΤΕΛΕΣΤΗΣ ΜΕΤΑΒΟΛΗΣ (συμβ. CV) ΔΙΑΚΥΜΑΝΣΗ ή ΔΙΑΣΠΟΡΑ (συμβ. ) ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ (συμβ. ) ΕΥΡΟΣ ή ΚΥΜΑΝΣΗ: R=μεγαλύτερη παρατήρηση - μικρότερη παρατήρηση
Όταν έχουμε ομαδοποιημένα δεδομένα, το εύρος δίνεται από την διαφορά του κατώτερου ορίου της πρώτης κλάσης από το ανώτερο όριο της τελευταίας κλάσης. Το εύρος σε ομαδοποιημένα δεδομένα μπορεί να διαφέρει ελαφρώς από τα αντίστοιχα δεδομένα πριν αυτά ομαδοποιηθούν. Το εύρος ΔΕΝ θεωρείται αξιόπιστο μέτρο διασποράς, γιατί βασίζεται μόνο στις δύο ακραίες παρατηρήσεις. ΔΙΑΚΥΜΑΝΣΗ ή ΔΙΑΣΠΟΡΑ είναι ο μέσος όρος των τετραγώνων των αποκλίσεων των t από τη μέση τιμή. δούμε πως παράγεται ο τύπος Οι τύποι σε περίπτωση άσκησης θα δοθούν. Αξίζει όμως να ( ) ( ) 1 x x x x x x 1 1 1 1 1 1 1 s x X x 1 s X ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ: Αν η καμπύλη συχνοτήτων για το χαρακτηριστικό που εξετάζουμε είναι κανονική ή περίπου κανονική τότε σε καθένα από τα παρακάτω διαστήματα έχουμε τα ποσοστά των παρατηρήσεων που βρίσκονται σε κάθε διάστημα είναι όπως τα παρακάτω:
34% 34% 13,5 % 13,5%,35%,35% 0,15% 0,15% x 3s x s x s x x s x s x 3s ΣΥΝΤΕΛΕΣΤΗΣ ΜΕΤΑΒΛΗΤΟΤΗΤΑΣ ή ΣΥΝΤΕΛΕΣΤΗΣ ΜΕΤΑΒΟΛΗΣ: CV X ή CV X X 0 Ένα δείγμα θα είναι ομοιογενές αν ο συντελεστής μεταβλητότητας είνα μικρότερος ή ίσος με 10% Μεταξύ δυο κατανομών αυτή που έχει μικρότερο CV λέμε ότι εμφανίζει μεγαλύτερη ομοιογένεια ενώ αυτή με το μεγαλύτερο CV έχει μεγαλύτερη σχετική διασπορά.