Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics) 1. Οργάνωση και Γραφική παράσταση στατιστικών δεδομένων 2. Αριθμητικά περιγραφικά μέτρα Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (1/13)
στατιστικών δεδομένων Τυχαίες μεταβλητές Ποσοτικές (quantative) Διακριτές Συνεχείς Ποιοτικές ή κατηγορικές (categorical) οι τιμές τους μπορούν να ταξινομηθούν σε κατηγορίες (classes or categories) π.χ. χρώμα ματιών, κατάσταση υγείας, επάγγελμα, κλπ.) Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (2/13)
στατιστικών δεδομένων Πίνακες συχνοτήτων Έστω τ.μ. X που περιγράφει τα άτομα ενός πληθυσμού με {x 1, x 2, x n } ένα τυχαίο δείγμα μεγέθους n. Εστω σύνολο k τιμών της μεταβλητής {a 1, a 2,, a k } (π.χ. κατηγορίες ή διαστήματα τιμών). Συχνότητα n i της τιμής a i το πλήθος των δειγμάτων με τιμή a i ni Σχετική συχνότητα f i 1, k i, n Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (3/13)
Ένας πίνακας συχνοτήτων είναι ένας πίνακας που παρουσιάζει τις κατηγορίες (ή τα διαστήματα τιμών) των δεδομένων με τις αντίστοιχες συχνότητές τους, δηλ. την αναλογία με την οποία εμφανίζονται στο δείγμα. a i n i f i ασπρο 6 6/11 μαύρο 3 3/11 μπλε 2 2/11 a i n i f i 1-4 4 4/12 5-8 5 5/12 9-12 3 3/12 Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (4/13)
Γραφικές μέθοδοι παρουσίασης Ραβδογράμματα (bar charts) Οι κατηγορίες παρουσιάζονται στον x-άξονα ως ισομήκη διαστήματα ενώ οι αντίστοιχες συχνότητες (ή σχετικές συχνότητες) στο y-άξονα Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (5/13)
Κυκλικά διαγράμματα (pie charts) Οι κατηγορίες παρουσιάζονται σε κύκλο χωρισμένο σε φέτες ανάλογα με την σχετική συχνότητά τους στο δείγμα. Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (6/13)
3 διαφορετικοί τρόποι παρουσίασης a i n i F i 1 73 28.9 % 2 52 20.6 3 36 14.2 4 64 25.3 5 28 11.1 Σύνολο 253 100 Δείχνουν την ίδια πληροφορία (βασίζονται στα ίδια δεδομένα) απλά διαφέρει ο τρόπος παρουσίασης Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (7/13)
Ιστογράμματα (Histograms) Παράγει μια κατανομή των συχνοτήτων των δεδομένων. Χρησιμοποιώντας τις σχετικές συχνότητες στο ιστόγραμμα τότε κατασκευάζουμε μία κατανομή των δεδομένων Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (8/13)
Φυλλογράμματα (stem-leaf notes) Διατηρεί τις πληροφορίες σχετικά με τις ατομικές παρατηρήσεις (χάνονται με τα ιστογράμματα) Κάθε παρατήρηση διασπάται σε 2 μέρη: ένα στέλεχος (stem) και ένα φύλλο (leaf). Υπάρχουν διάφοροι τρόποι διάσπασης (αυθαίρετα) ανάλογα με τον τύπο δεδομένων Βήματα κατασκευής φυλλογραμμάτων Επιλέγουμε πρώτα τα στελέχη (ή οδηγούντα ψηφία) και τα φύλλα Καταγράφουμε τα στελέχη και τα φύλλα Διατάσσουμε τα στελέχη κατά αύξουσα Γράφουμε τα φύλλα στην ίδια γραμμή των αντίστοιχων στελεχών Ελέγχουμε εάν έχουν καταγραφεί όλα τα φύλλα (αριθμός τους ίσος με το συνολικό πλήθος παρατηρήσεων) Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (9/13)
Παράδειγμα Σύνολο δεδομένων Χ={136, 111, 120, 105, 113, 116, 99, 110} Θεωρώντας δεκάδες ως στελέχη και μονάδες ως φύλλα τότε κατασκευάζουμε το παρακάτω φυλλόγραμμα Stem 9 9 10 5 11 0 1 3 6 12 0 13 6 Leaf Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (10/13)
Άλλα είδη γραφικής αναπαράστασης Καμπύλη S: είναι ένα γράφημα των αθροιστικών σχετικών συχνοτήτων (σαν την συνάρτηση κατανομής πιθανότητας) Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (11/13)
Γραφική αναπαράσταση σχέσης δύο μεταβλητών Πίνακας συνάφειας Καταγράφει την συχνότητα για κάθε παρατήρηση των τιμών των δύο μεταβλητών Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (12/13)
Διάγραμμα διασποράς (scatter plot) Χρησιμοποιείται για να δείξουμε την σχέση ανάμεσα σε 2 μεταβλητές. Η ανεξάρτητη μεταβλητή συμβολίζεται με X και συνήθως τοποθετείται στον οριζόντιο άξονα, ενώ η άλλη μεταβλητή καλείται εξαρτημένη και παριστάνεται με Y στον κάθετο άξονα. Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (13/13)