ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Περιγραφική Στατιστική Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.
Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics) 1. Οργάνωση και Γραφική παράσταση στατιστικών δεδομένων 2. Αριθμητικά περιγραφικά μέτρα Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (1/13)
στατιστικών δεδομένων Τυχαίες μεταβλητές Ποσοτικές (quantative) Διακριτές Συνεχείς Ποιοτικές ή κατηγορικές (categorical) οι τιμές τους μπορούν να ταξινομηθούν σε κατηγορίες (classes or categories) π.χ. χρώμα ματιών, κατάσταση υγείας, επάγγελμα, κλπ.) Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (2/13)
στατιστικών δεδομένων Πίνακες συχνοτήτων Έστω τ.μ. X που περιγράφει τα άτομα ενός πληθυσμού με {x 1, x 2, x n } ένα τυχαίο δείγμα μεγέθους n. Εστω σύνολο k τιμών της μεταβλητής {a 1, a 2,, a k } (π.χ. κατηγορίες ή διαστήματα τιμών). Συχνότητα n i της τιμής a i το πλήθος των δειγμάτων με τιμή a i ni Σχετική συχνότητα f i 1, k i, n Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (3/13)
στατιστικών δεδομένων (συν.) Ένας πίνακας συχνοτήτων είναι ένας πίνακας που παρουσιάζει τις κατηγορίες (ή τα διαστήματα τιμών) των δεδομένων με τις αντίστοιχες συχνότητές τους, δηλ. την αναλογία με την οποία εμφανίζονται στο δείγμα. a i n i f i ασπρο 6 6/11 μαύρο 3 3/11 μπλε 2 2/11 a i n i f i 1-4 4 4/12 5-8 5 5/12 9-12 3 3/12 Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (4/13)
στατιστικών δεδομένων (συν.) Γραφικές μέθοδοι παρουσίασης Ραβδογράμματα (bar charts) Οι κατηγορίες παρουσιάζονται στον x-άξονα ως ισομήκη διαστήματα ενώ οι αντίστοιχες συχνότητες (ή σχετικές συχνότητες) στο y-άξονα Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (5/13)
στατιστικών δεδομένων (συν.) Κυκλικά διαγράμματα (pie charts) Οι κατηγορίες παρουσιάζονται σε κύκλο χωρισμένο σε φέτες ανάλογα με την σχετική συχνότητά τους στο δείγμα. Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (6/13)
στατιστικών δεδομένων (συν.) 3 διαφορετικοί τρόποι παρουσίασης a i n i F i 1 73 28.9 % 2 52 20.6 3 36 14.2 4 64 25.3 5 28 11.1 Σύνολο 253 100 Δείχνουν την ίδια πληροφορία (βασίζονται στα ίδια δεδομένα) απλά διαφέρει ο τρόπος παρουσίασης Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (7/13)
στατιστικών δεδομένων (συν.) Ιστογράμματα (Histograms) Παράγει μια κατανομή των συχνοτήτων των δεδομένων. Χρησιμοποιώντας τις σχετικές συχνότητες στο ιστόγραμμα τότε κατασκευάζουμε μία κατανομή των δεδομένων Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (8/13)
στατιστικών δεδομένων (συν.) Φυλλογράμματα (stem-leaf notes) Διατηρεί τις πληροφορίες σχετικά με τις ατομικές παρατηρήσεις (χάνονται με τα ιστογράμματα) Κάθε παρατήρηση διασπάται σε 2 μέρη: ένα στέλεχος (stem) και ένα φύλλο (leaf). Υπάρχουν διάφοροι τρόποι διάσπασης (αυθαίρετα) ανάλογα με τον τύπο δεδομένων Βήματα κατασκευής φυλλογραμμάτων Επιλέγουμε πρώτα τα στελέχη (ή οδηγούντα ψηφία) και τα φύλλα Καταγράφουμε τα στελέχη και τα φύλλα Διατάσσουμε τα στελέχη κατά αύξουσα Γράφουμε τα φύλλα στην ίδια γραμμή των αντίστοιχων στελεχών Ελέγχουμε εάν έχουν καταγραφεί όλα τα φύλλα (αριθμός τους ίσος με το συνολικό πλήθος παρατηρήσεων) Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (9/13)
στατιστικών δεδομένων (συν.) Παράδειγμα Σύνολο δεδομένων Χ={136, 111, 120, 105, 113, 116, 99, 110} Θεωρώντας δεκάδες ως στελέχη και μονάδες ως φύλλα τότε κατασκευάζουμε το παρακάτω φυλλόγραμμα Stem 9 9 10 5 11 0 1 3 6 12 0 13 6 Leaf Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (10/13)
στατιστικών δεδομένων (συν.) Άλλα είδη γραφικής αναπαράστασης Καμπύλη S: είναι ένα γράφημα των αθροιστικών σχετικών συχνοτήτων (σαν την συνάρτηση κατανομής πιθανότητας) Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (11/13)
στατιστικών δεδομένων (συν.) Γραφική αναπαράσταση σχέσης δύο μεταβλητών Πίνακας συνάφειας Καταγράφει την συχνότητα για κάθε παρατήρηση των τιμών των δύο μεταβλητών Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (12/13)
στατιστικών δεδομένων (συν.) Διάγραμμα διασποράς (scatter plot) Χρησιμοποιείται για να δείξουμε την σχέση ανάμεσα σε 2 μεταβλητές. Η ανεξάρτητη μεταβλητή συμβολίζεται με X και συνήθως τοποθετείται στον οριζόντιο άξονα, ενώ η άλλη μεταβλητή καλείται εξαρτημένη και παριστάνεται με Y στον κάθετο άξονα. Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (13/13)
Τέλος Ενότητας
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Ιωαννίνων» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους.
Σημειώματα
Σημείωμα Ιστορικού Εκδόσεων Έργου Το παρόν έργο αποτελεί την έκδοση 1.0. Έχουν προηγηθεί οι κάτωθι εκδόσεις: Έκδοση 1.0 διαθέσιμη εδώ. http://ecourse.uoi.gr/course/view.php?id=1052.
Σημείωμα Αναφοράς Copyright Πανεπιστήμιο Ιωαννίνων, Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας. «Εφαρμοσμένη Στατιστική. Περιγραφική Στατιστική». Έκδοση: 1.0. Ιωάννινα 2014. Διαθέσιμο από τη δικτυακή διεύθυνση: http://ecourse.uoi.gr/course/view.php?id=1052.
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά Δημιουργού - Παρόμοια Διανομή, Διεθνής Έκδοση 4.0 [1] ή μεταγενέστερη. [1] https://creativecommons.org/licenses/by-sa/4.0/.