Περιγραφική στατιστική



Σχετικά έγγραφα
Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Ιατρικά Μαθηματικά & Βιοστατιστική

ΘΕΜΑΤΑ Α : ΕΚΦΩΝΗΣΕΙΣ - ΛΥΣΕΙΣ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Στατιστικοί έλεγχοι για διακριτά δεδομένα

3. Κατανομές πιθανότητας

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Μοντέλα στην Επιστήμη Τροφίμων 532Ε

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Εισαγωγή στην Εκτιμητική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Στατιστική Ι (ΨΥΧ-1202) ΑΣΚΗΣΕΙΣ

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Εισαγωγή. Αντικείμενο της Στατιστικής

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Εισαγωγή στη Βιοστατιστική Βασικές έννοιες Στατιστικής. Μαρία Γκριζιώτη Μsc Ιατρικής Ερευνητικής Μεθοδολογίας

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

επ. Κωνσταντίνος Π. Χρήστου

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Είδη Μεταβλητών. κλίµακα µέτρησης

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ. Για την Γ Τάξη Γενικού Λυκείου Μάθημα Επιλογής ΟΡΓΑΝΙΣΜΟΣ ΕΚΔΟΣΕΩΣ ΔΙΔΑΚΤΙΚΩΝ ΒΙΒΛΙΩΝ ΑΘΗΝΑ

ΑΝΑΛΥΣΗ ΣΥΧΝΟΤΗΤΑΣ ΥΔΡΟΛΟΓΙΚΩΝ ΦΑΙΝΟΜΕΝΩΝ

Δειγματοληπτικές κατανομές

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Γιατί μετράμε την διασπορά;

Βιοστατιστική ΒΙΟ-309

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 12. Εκτίμηση των παραμέτρων ενός πληθυσμού

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

Γ. Πειραματισμός - Βιομετρία

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

1. Τα έσοδα σε εκατομμύρια 100 επιχειρήσεων ενός ομίλου για μια ορισμένη χρονική

Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 3: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (3/4) Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Περιγραφική Στατιστική

ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΝΟΤΗΤΑ: Πιθανότητες - Κατανομές ΟΝΟΜΑ ΚΑΘΗΓΗΤΗ: ΦΡ. ΚΟΥΤΕΛΙΕΡΗΣ ΤΜΗΜΑ: Τμήμα Διαχείρισης Περιβάλλοντος και Φυσικών

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική

Κεφάλαιο 5. Οι δείκτες διασποράς

Βιοστατιστική ΒΙΟ-309

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 5 Δείκτες Διασποράς

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ για τη λήψη αποφάσεων

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Βιοστατιστική ΒΙΟ-309

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Εφαρμοσμένη Στατιστική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Διαστήματα Εμπιστοσύνης

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΚΕΦΑΛΑΙΟ ΕΙΣΑΓΩΓΗ... 25

Τάση συγκέντρωσης. Μέτρα Κεντρικής Τάσης και Θέσης. Μέτρα Διασποράς. Τάση διασποράς. Σχήμα της κατανομής

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Στατιστική Συμπερασματολογία

Διάλεξη 1 Βασικές έννοιες

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

Transcript:

Περιγραφική στατιστική Ιστογράμματα Mέτρα θέσης και διασποράς Κατανομές δεδομένων Γεωργία Σαλαντή Επικ. Καθηγήτρια Εργαστήριο Υγιεινής και Επιδημιολογίας

Στατιστική 1. Εκτιμήσεις Μεγέθη και διαστήματα εμπιστοσύνης 2. Έλεγχοι υποθέσεων Τεστ, P-values

Project Υπολογίστε το μέσο ύψος για τους Έλληνες μ Ε

Η στατιστική βασίζεται στην εκτίμηση Εκτίμηση του μέσου ύψους αληθινό μέσο ύψους του πληθυσμού Εκτίμηση (από ένα δείγμα)

Εκτίμηση m Αλήθεια m Εκτίμηση μέγιστης πιθανοφάνειας Παράμετρος (π.χ. μέσος μ Ε ) Μελέτη 1 Μελέτη 2 Μελέτη 3 Μελέτη 4

Εκτίμηση Πάρετε ένα δείγμα από 10 Έλληνες και μετρήστε το μέσο όρο τού ύψους τους Φυσικά, αυτό δεν είναι το μέσο ύψος όλων των Ελλήνων αλλά ελπίζουμε να είναι κάτι πολύ κοντά του μ Ε =194 cm!!

206 202 198 194 Εκτίμηση 1= 194 cm (10 μετρήσεις) 190 186 182 178 174 Εκτίμηση 2= 180 cm (100 μετρήσεις) Αληθινό μ Ε = 178 cm (10.66 εκατομμύρια) Εκτίμηση 3= 177 cm (1000 μετρήσεις) 170 166

206 202 198 194 190 10 μετρήσεις Όσο πιο πολλούς ανθρώπους μετράμε, τόσο βεβαιότεροι είμαστε για την εκτίμηση του αληθινού ύψος του πληθυσμού 186 182 178 174 170 166 100 μετρήσεις 1000 μετρήσεις Ο βαθμός της βεβαιότητας μας εκφράζεται στο διάστημα εμπιστοσύνης ΔΕ Confidence Interval

Η στατιστική ασχολείται Όχι με τις μετρήσεις μόνο, αλλά κυρίως με την αβεβαιότητα στις μετρήσεις!!!!!

Μέτρα διασποράς Τυπική απόκληση τ.α. (standard deviation=sd) Διασπορά ή διακύμανση (variance) Τυπικό σφάλμα τ.σ.(standard error, SE)

Εμπιστοσύνη και διασπορά Πόσο διασκορπισμένες είναι οι παρατηρήσεις; Διασπορά παρατηρήσεων = (τυπική απόκλιση) 2 215 201 187 173 159 145

Τυπική απόκλιση.. i 1,... N x i N i 1 ( x m) N 1 παρατήρηση μ μέσος όρος διασπορά.. i 2 2 παρατηρήσεις

Παράδειγμα Μετρήσαμε 5 άτομα 180,160,165,155,195 cm Μέσος= Τυπική απόκλιση= Διασπορά=

Παράδειγμα Μετρήσαμε 5 άτομα 180,160,165,155,195 cm Μέσος=171 Τυπική απόκλιση=16.36 Διασπορά=267.5

Εμπιστοσύνη και διασπορά Πόσο αβέβαιος είναι ο μέσος; Τυπικό σφάλμα μέσου Διασπορά μέσου=τ.σ 2 =τ.α 2 /N 215 201 187 173 159 145

SOS Για τον μέσο όρο Τυπικό σφάλμα μέσου τ.σ = τ.α/ N Διασπορά μέσου = τ.σ 2 Διασπορά μέσου = Διασπορά παρατηρήσεων/ν

Παράδειγμα Μετρήσαμε 5 άτομα 180,160,165,155,195 cm Μέσος=171 Διασπορά=267.5 Τυπικό σφάλμα μέσου=

Παράδειγμα Μετρήσαμε 5 άτομα 180,160,165,155,195 cm Μέσος=171 Διασπορά=267.5 Τυπικό σφάλμα μέσου=7.3

Διαστήματα εμπιστοσύνης

Ο χρυσός κανόνας για διαστήματα εμπιστοσύνης Για μεγέθη που ακολουθούν την κανονική κατανομή, το 95% διάστημα εμπιστοσύνης (95% Confidence Interval) για το κατι κατι ± 1.96 τ.σ.(κατι)

Παράδειγμα Μέτρηση 100 νεογέννητων μωρών από μητέρες που κάπνιζαν. Μέσο βάρος=2.7kgr και τ.α=1.1 Μέτρηση 90 νεογέννητων μωρών από μητέρες που δεν κάπνιζαν. Μέσο βάρος=3.1kgr και τ.α=1.2 Σχετίζεται το κάπνισμα με χαμηλότερο βάρος;

Παράδειγμα : διαστήματα εμπιστοσύνης Καπνιστές: τ.σ.=1.1/10=0.11 95% ΔΕ: (2.7-1.96 0.11, 2.7+1.96 0.11) 95% ΔΕ: (2.48, 2.92) Μη καπνιστές: τ.σ.=1.2/9.49=0.13 95% ΔΕ: (3.1-1.96 0.13, 3.1+1.96 0.13) 95% ΔΕ: (2.85, 3.35) Δεν υπάρχει διαφορά

Διάστημα εμπιστοσύνης Εκφράζει διακύμανση και μέγεθος δείγματος = το πιθανό διάστημα της αλήθειας (μ Ε ) -Πόσο πιθανό; -95% πιθανό Το δεδομένο διάστημα έχει πιθανότητα 95% να περιέχει την αλήθεια

Πάμε πίσω στο Project Μετά από 1000 μετρήσεις: Έλληνες: μ Ε =177cm, 95% ΔΕ = [176,178] Σουηδοί: μ Σ =183cm, 95% ΔΕ = [182,184] Ποιοι είναι πιο ψηλοί;

Διάστημα εμπιστοσύνης μέσου (184cm,186cm) 95% των Ελλήνων έχουν ύψος μεταξύ (184,186) Ο μέσος Έλληνας έχει ύψος μεταξύ (184,186) Κατά μέσο όρο ο ελληνικός πληθυσμός έχει μέσο ύψος μεταξύ (184,186)

Διάστημα εμπιστοσύνης και μέγεθος δείγματος Διάστημα εμπιστοσύνης και εμπιστοσύνη μέσος σ.α. δείγμα εμπιστοσύνη Δ.Ε. 180 20 100 99% 175 185 180 20 100 95% 176 184 180 20 100 90% 177 183 Διάστημα εμπιστοσύνης και μέγεθος δείγματος μέσος σ.α. δείγμα εμπιστοσύνη Δ.Ε. 180 20 10 95% 168 192 180 20 100 95% 176 184 180 20 1000 95% 179 181

Ιστογράμματα Διάγραμμα τιμών συχνότητας (=πιθανότητας) Histogram

Ιστόγραμμα συχνοτήτων του βάρους των ατόμων σε ένα χωριό

Συχνότητες Διάστημα τιμών Τιμή Απόλυτη συχνότητα Σχετική συχνότητα Απόλυτη αθροιστική συχνότητα Σχετική αθροιστική συχνότητα 0.00-9.99 5 1 0.01 1 0.01 10.00-19.99 15 3 0.03 4 0.04 20.00-29.99 25 8 0.08 12 0.12 30.00-39.99 35 18 0.18 30 0.30 40.00-49.99 45 24 0.24 54 0.54 50.00-59.99 55 22 0.22 76 0.76 60.00-69.99 65 15 0.15 91 0.91 70.00-79.99 75 8 0.08 99 0.99 80.00-89.99 85 0 0.00 99 0.99 90.00-99.99 95 1 0.01 100

Ιστόγραμμα συχνοτήτων του βάρους των ατόμων σε ένα χωριό

Κατανομές Το ιστόγραμμα ίσως να μοιάζει με κάποια από τις θεωρητικές κατανομές Συνεχείς κατανομές: Κανονική t student

Κανονική κατανομή Ν(μ,σ 2 ) : μέσος, διασπορά Όσο πιο μεγάλο το σ 2, τόσο πιο απλωτή είναι η κατανομή Η τυπική κανονική κατανομή είναι Ν(0,1) Πολλά μεγέθη ακολουθούν την κανονική κατανομή (βάρος, ύψος, πίεση )

Κανονική κατανομή

Το διάστημα μ±σ περιλαμβάνει το 68.2% των παρατηρήσεων Το διάστημα μ±2σ περιλαμβάνει το 95.4% των παρατηρήσεων Το διάστημα μ±1.96σ περιλαμβάνει το 95 % των παρατηρήσεων

t κατανομή (student) Για μεγάλο μέγεθος δείγματος η κατανομή t είναι ίδια με την κανονική Μέσος = 0 Όσο πιο πολλοί βαθμοί ελευθερίας, τόσο πιο «ψιλόλιγνη» είναι

Περιγραφική στατιστική δεδομένων Για δεδομένα που ακολουθούν συμμετρική κατανομή (κανονική, t) για να τα περιγράψουμε χρησιμοποιούμε Θέση: Μέσος Αβεβαιότητα: διασπορά τυπική απόκλιση

Μέσος=48.4 τ.α=16.2 0.020 0.015 0.010 0.005 0.000-20 0 20 40 60 80 100 120 Βάρος

Μέσος=48.4 τ.α=16.2 Για τις παρατηρήσεις 0.020 95% CI: μέσος+/- 1.96τ.α 0.015 0.010 0.005 95% των παρατηρήσεων 0.000 16.7 80.2-20 0 20 40 60 80 100 120 Βάρος

Μέσος=48.4 τ.α=16.2 Για τον μέσο (πραγματικό) 0.020 0.015 0.010 0.005 95% ΔΕ του μέσου 0.000 45.2 51.6-20 0 20 40 60 80 100 120 Βάρος

Μη συμμετρική κατανομή δεδομένων Μπορεί να δημιουργηθεί από ακραίες παρατηρήσεις Έστω ότι υπάρχει και ένας παχύσαρκος 150 kgr Η κατανομή θα αποκτήσει ασυμμετρία Ο μέσος επηρεάζεται από ακραίες τιμές και δεν αντιπροσωπεύει καλά τα δεδομένα

Μέσος = 48 τ.α = 16 Διάμεσος =45 0.020 0.015 Μέσος = 49 τ.α = 19 Διάμεσος =45 0.010 Μέσος = 52 τ.α = 32 Διάμεσος =45 0.005 0.000 0 50 100 150 200 250 300 Βάρος

Διάμεσος Η παρατήρηση για την οποία 50% των τιμών είναι μικρότερες της, και 50% είναι μεγαλύτερες της Για συμμετρικές κατανομές μέσος=διάμεσος

Ασύμμετρες κατανομές Τις περιγράφουμε με την διάμεσο και το ενδοτεταρτημοριακό εύρος

0.020 Ενδ. Εύρος (35, 62) Διάμεσος 0.015 0.010 Μέσος = 52 τ.α = 32 Διάμεσος =45 0.005 0.000 0 50 100 150 200 250 300 Βάρος

Box-plot 155 160 165 170 175 180 185

Συμμετρικά δεδομένα: πως τα κρίνουμε; Ο μέσος και ο διάμεσος συμπίπτουν Το ιστόγραμμα και το box-plot είναι συμμετρικά

Συμμετρικά/κανονικά δεδομένα: Για θετικά μεγέθη πως τα κρίνουμε; μέσος < τ.α 1.64 ΑΣΥΜΜΕΤΡΙΑ Για μεγέθη που έχουν ελάχιστο ή μέγιστο αντίστοιχα μέσος ελάχιστο < τ.α 2 ΑΣΥΜΜΕΤΡΙΑ

Μέτρα θέσης Συμμετρικά δεδομένα: Μέσος Ασύμμετρα δεδομένα: Διάμεσος

Μέτρα διασποράς Συμμετρικά δεδομένα: Τυπική απόκλιση, Διασπορά (=διακύμανση), τυπικό σφάλμα μέσου, διαστήματα εμπιστοσύνης Ασύμμετρα δεδομένα: Ενδοτεταρτημοριακό εύρος

Ο χρυσός κανόνας για διαστήματα εμπιστοσύνης Για μεγέθη που ακολουθούν την κανονική κατανομή, το 95% διάστημα εμπιστοσύνης (95% Confidence Interval) για το κατι κατι ± 1.96 τ.σ.(κατι)

Κατανομή Χ 2 Χ 2 με κ βαθμούς ελευθερίας (degrees of freedom) Όσο πιο πολλοί βαθμοί ελευθερίας, τόσο πιο «κοντή» η κατανομή

t κατανομή (student) Για μεγάλο μέγεθος δείγματος η κατανομή t είναι ίδια με την κανονική Μέσος = 0 Όσο πιο πολλοί βαθμοί ελευθερίας, τόσο πιο «ψιλόλιγνη» είναι

F κατανομή Έχει ένα ζευγάρι βαθμών ελευθερίας d1, d2