Μάθημα: Θεωρία Πιθανοτήτων & Στατιστική 3 ο Εξάμηνο Σπουδών

Σχετικά έγγραφα
Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Βιοστατιστική ΒΙΟ-309

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Στατιστική Επιχειρήσεων Ι

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

Περιγραφική Στατιστική

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Εισαγωγή στη Στατιστική

Εφαρμοσμένη Στατιστική

Μάθηµα 3 ο. Περιγραφική Στατιστική

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Είδη Μεταβλητών. κλίµακα µέτρησης

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Ενότητα 2: Μέθοδοι δειγματοληψίας & Εισαγωγή στην Περιγραφική Στατιστική

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ


ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ & ΕΚΠΑΙΔΕΥΣΗ

Περιγραφική Στατιστική

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

Σ ΤΑΤ Ι Σ Τ Ι Κ Η MBA I

Στατιστική Ι Ασκήσεις 3

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Υπολογισμοί Παραμέτρων Πληθυσμού και Στατιστικών Δείγματος

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Mέτρα (παράμετροι) θέσεως

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Οι δείκτες διασποράς. Ένα παράδειγµα εργασίας

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

Εισαγωγή στη Στατιστική

ΘΕΜΑΤΑ Α : ΕΚΦΩΝΗΣΕΙΣ - ΛΥΣΕΙΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΔΕΟ 13 ΤΟΜΟΣ Δ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Εισαγωγή στη Στατιστική Μάθημα του Β Εξαμήνου

Έτος : Διάλεξη 2 η Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Ενότητα: Περιγραφική Στατιστική 2: Αριθμητικά Μεγέθη

Περιεχόμενα. Πρόλογος... 15

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΟΥ ΕΠΑ.Λ. Δ. Ε. ΚΟΝΤΟΚΩΣΤΑΣ ΜΑΘΗΜΑΤΙΚΟΣ

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Ενότητα 1: Πληθυσμός και δείγμα Είδη Μεταβλητών - Περιγραφική στατιστική

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

Transcript:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΑΣ ΤΜΗΜΑ ΣΥΣΤΗΜΑΤΩΝ ΕΝΕΡΓΕΙΑΣ Μάθημα: Θεωρία Πιθανοτήτων & Στατιστική 3 ο Εξάμηνο Σπουδών Διάλεξη 01 Δρ. Γεώργιος Χρ. Μακρής

Διαδικαστικά Παράδοση: Δευτέρα 18:00 20:00 & Τρίτη 15:00 17:00 e-mail: makris@uth.gr 05 & 06 Οκτωβρίου 2020 23 & 24 Νοεμβρίου 2020 12 & 13 Οκτωβρίου 2020 30 Νοεμβρίου & 01 Δεκεμβρίου 2020 19 & 20 Οκτωβρίου 2020 07 & 08 Δεκεμβρίου 2020 26 & 27 Οκτωβρίου 2020 14 & 15 Δεκεμβρίου 2020 02 & 03 Νοεμβρίου 2020 21 & 22 Δεκεμβρίου 2020 09 & 10 Νοεμβρίου 2020??? 16 & 17 Νοεμβρίου 2020 Εξεταστική Ιαν. Φεβ. 2021

https://eclass.uth.gr/courses/energy_u_115/

Προτεινόμενη Βιβλιογραφία του Μαθήματος Eudoxus

https://gmakris.wordpress.com/

Περιγραφή του Μαθήματος Επιμέρους ενότητες που εξετάζονται: Περιγραφική Στατιστική Στοιχεία Πιθανοτήτων Στοιχεία συνδυαστικής Δεσμευμένη πιθανότητα Κατανομές διακριτών τυχαίων μεταβλητών Κατανομές συνεχών τυχαίων μεταβλητών Διαστήματα Εμπιστοσύνης Δειγματοληψία Έλεγχοι υποθέσεων Γραμμική συσχέτιση Γραμμική παλινδρόμηση

Στατιστική Πεδίο των μαθηματικών που επικεντρώνεται στη μετατροπή δεδομένων σε πληροφορία για τη λήψη αποφάσεων, μέσω συστηματικών διαδικασιών συλλογής, επεξεργασίας, ανάλυσης, ερμηνείας και οπτικοποίησης Κύρια πεδία: Περιγραφική στατιστική (descriptive statistics): συλλογή, περιγραφή και παρουσίαση δεδομένων Επαγωγική στατιστική (inferential statistics): εξαγωγή γενικών συμπερασμάτων από διαθέσιμα δείγματα

Περιγραφική στατιστική Κάθε δείκτης και ποσότητα που εξάγεται από ένα δείγμα, αφορά μόνο το συγκεκριμένο δείγμα και ονομάζεται Στατιστικό του δείγματος. Η εξαγωγή και ο υπολογισμός στατιστικών, και των γραφικών παραστάσεων που τα αφορούν, είναι το αντικείμενο της Περιγραφικής Στατιστικής. Περιγραφική στατιστική: θέλουμε να περιγράψουμε ένα δείγμα, γνωρίζοντας ότι τα στατιστικά του αφορούν το συγκεκριμένο μόνο δείγμα, ούτε και τον πληθυσμό από τον οποίο προέρχονται. Ή έχουμε στη διάθεσή μας ολόκληρο τον Πληθυσμό. Περιγράφουμε στατιστικά έναν πληθυσμό, οι δείκτες που εξάγουμε ονομάζονται Παράμετροι και είναι μοναδικές γιατί προφανώς ο πληθυσμός είναι ένας και μοναδικός, όχι όπως στην περίπτωση των δειγμάτων τα οποία είναι πολλά.

Εκτιμητική Δείγμα (στατιστικά) Πληθυσμός (παράμετροι) p, δειγματικό ποσοστό ρ, αναλογία στον πληθυσμό തx, μέσος όρος μ, μέση τιμή s 2, δειγματική διασπορά σ 2, διασπορά του πληθυσμού s, δειγματική τυπική απόκλιση σ, τυπική απόκλιση του πληθυσμού

Ορολογία Μεταβλητές (variables) Χαρακτηρισμός / περιγραφή των αντικειμένων μιας έρευνας Δεδομένα (data) Μια συλλογή στοιχείων για τις μεταβλητές Πληθυσμός (population) Το σύνολο όλων των αντικειμένων επί του οποίου πρέπει να εξαχθούν συμπεράσματα Δείγμα (sample) Ένα μέρος του πληθυσμού που χρησιμοποιείται στην ανάλυση

Μεταβλητές Μεταβλητή: μία ερώτηση (ας πούμε σε ένα ερωτηματολόγιο), η οποία επιδέχεται μία μοναδική απάντηση από κάθε ερωτώμενο. Οι μεταβλητές έχουν τιμές. Ως τιμές ορίζονται οι δυνατές απαντήσεις μιας ερώτησης-μεταβλητής. Παρατηρήσεις Παρατηρήσεις είναι οι απαντήσεις των ερωτώμενων. Κάθε ερωτώμενος επιλέγει από το σύνολο των τιμών μιας μεταβλητής και αυτή αποτελεί την απάντησή του, είναι η παρατήρηση για τον συγκεκριμένο ερωτώμενο.

Συλλογή δεδομένων Πρωτογενή δεδομένα Δεδομένα που συλλέγονται για πρώτη φορά Παραδείγματα: έρευνες αγοράς, πειράματα, παρατήρηση Δευτερογενή δεδομένα Δεδομένα που έχουν ήδη συλλεχθεί για άλλο σκοπό Παράδειγμα: δεδομένα από έτοιμες βάσεις Πηγές δεδομένων Δεδομένα που παρέχονται σε βάσεις και από οργανισμούς Σχεδιασμός πειραμάτων Έρευνες αγοράς Έρευνες παρατήρησης/καταγραφής

Κατηγορίες μεταβλητών Ποιοτικές (qualitative) Ποιοτική περιγραφή χωρίς αριθμητική κλίμακα (φύλο, χρώμα, χώρα, ) Ποσοτικές (quantitative ) Διακριτές (discrete): μεταβλητές που ορίζονται σε ένα πεπερασμένο σύνολο τιμών (ηλικία, πλήθος, ) Συνεχής (continuous): μεταβλητές που μπορούν να λάβουν οποιαδήποτε αριθμητική τιμή εντός ενός εύρους (ύψος, βάρος, απόσταση, χρόνος, )

Πίνακες συχνοτήτων

Πίνακες συχνοτήτων

Πίνακες συχνοτήτων

Πίνακες συχνοτήτων

Πίνακες συχνοτήτων Ηλικίες 20 ατόμων: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Πίνακας συχνοτήτων Ηλικιακές ομάδες Κεντρικός όρος Συχνότητα Σχετική συχνότητα (%) Σχετική αθροιστική συχνότητα (%) [10, 20) 15 3 15 15 [20, 30) 25 6 30 45 [30, 40) 35 5 25 70 [40, 50) 45 4 20 90 [50, 60] 55 2 10 100 Σύνολο 20 100 100

Διαγράμματα

Ιστογράμματα Τα ιστογράμματα είναι κατασκευές αντίστοιχες των ραβδογραμμάτων, μόνο που η χρήση τους επιβάλλεται σε περιπτώσεις κατανομών συχνοτήτων ποσοτικών μεταβλητών (διακριτών, συνεχών) Ο αριθμός των διαστημάτων θα πρέπει να είναι μεταξύ 5 και 20, εξαρτώμενος κάθε φορά από το πλήθος των παρατηρήσεων. Τύπος Sturges: k = 1 + 3, 322 log 10 n n=πλήθος των παρατηρήσεων

Σχυνότητα Παρουσίαση δεδομένων - Ιστόγραμμα Παρουσίαση συχνοτήτων με τη μορφή ενός ραβδογράμματος Παράδειγμα: ηλικία 20 συμμετεχόντων σε μια έρευνα Ηλικία Συχνότητα Σχετική συχνότητα (%) [10, 20) 3 15 [20, 30) 6 30 [30, 40) 5 25 [40, 50) 4 20 [50, 60) 2 10 Σύνολο 20 100 7 6 5 4 3 2 1 0 [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) Ηλικία

Αριθμητικά μεγέθη σύνοψης δεδομένων Κεντρική τάση Μια χαρακτηριστική τιμή γύρω από την οποία «κινούνται» τα δεδομένα Διασπορά Μέγεθος που περιγράφει τη μεταβλητότητα των δεδομένων

Μέση τιμή (αριθμητικός μέσος, mean/average) Το πλέον διαδεδομένο μέτρο κεντρικής τάσης Μέση τιμή πληθυσμού (μ) μεγέθους Ν N μ = 1 N i=1 Δειγματική μέση τιμή x x i = x 1 + x 2 + + x N N Εκτίμηση της μέσης τιμής του πληθυσμού από δείγμα n παρατηρήσεων n x = 1 n i=1 x i = x 1 + x 2 + + x n n

Αριθμητικό παράδειγμα (1) Δείγμα πέντε παρατηρήσεων (n = 5) Μέση τιμή x = x 1 + x 2 + + x n n 6,2 7,1 4,8 9,0 3,3 = 6,2 + 7,1 + 4,8 + 9 + 3,3 5 = 6,08

Αριθμητικό παράδειγμα (2) Ας υποθέσουμε ότι έχουμε ένα δείγμα μεγέθους 7, δηλαδή έχουμε 7 παρατηρήσεις της μεταβλητής Χ «βαθμός στο μάθημα της στατιστικής»: 6, 7, 3, 9, 7, 9, 8. Ο μέσος όρος είναι 7 തx = 1 7 i=1 x i = 1 7 6 + 7 + 3 + 9 + 7 + 9 + 8 = 49 7 = 7

Παράδειγμα με ομαδοποιημένες παρατηρήσεις Οι παρατηρήσεις μπορούν επίσης να ομαδοποιηθούν και σ αυτήν την περίπτωση δημιουργούμε έναν πίνακα που περιλαμβάνει τις τιμές της μεταβλητής και τις συχνότητες των τιμών, δηλαδή το πόσες φορές εμφανίζεται η κάθε τιμή στις παρατηρήσεις: തx = σ k i=1 x i f i n

Παράδειγμα με ομαδοποιημένες παρατηρήσεις Τιμή της Χ Συχνότητα fi 3 1 6 1 7 2 8 1 9 2 തx = σ k i=1 x i f i n തx = 3 1 + 6 1 + 7 2 + 8 1 + 9 2 7 = 7

Μέση τιμή ομαδοποιημένων δεδομένων

Μέση τιμή ομαδοποιημένων δεδομένων Ηλικιακές ομάδες x f 1m 1 + f 2 m 2 + n Κεντρικός όρος (m i ) Συχνότητα (f i ) x 660 20 = 33 f i m i Αθροιστική συχνότητα (F i ) [10, 20) 15 3 45 15 [20, 30) 25 6 150 45 [30, 40) 35 5 175 70 [40, 50) 45 4 180 90 [50, 60] 55 2 110 100 Σύνολο 20 660 100

Ιδιότητες της μέσης τιμής

Διάμεσος (median) Στατιστικό μέτρο που χωρίζει τα διατεταγμένα δεδομένα σε δύο ίσα μέρη 11 12 13 14 15 11 12 13 14.. 100 Διάμεσος = 13 Διάμεσος = 13 Υπολογισμός Κατάταξη των αριθμητικών δεδομένων σε αύξουσα σειρά Για μονό αριθμό παρατηρήσεων, η διάμεσος είναι η αριθμητική τιμή στη θέση (n + 1)/2 των δεδομένων Για ζυγό αριθμό παρατηρήσεων, η διάμεσος είναι η μέση τιμή των δύο ενδιάμεσων τιμών

Αριθμητικά παραδείγματα Παράδειγμα 1: Δείγμα με n = 7: Δείγμα σε αύξουσα σειρά: 15 45,3 10 12 21 19 22,5 10 12 15 19 21 22,5 45,3 Διάμεσος = 19 Παράδειγμα 2: Δείγμα με n = 6: Δείγμα σε αύξουσα σειρά: 15 45,3 10 12 21 19 10 12 15 19 21 45,3 Διάμεσος = (15+19)/2 =17

Διάμεσος-Μέσος όρος 1 ο δείγμα 2 ο δείγμα 3 3 6 6 7 7 7 7 8 8 9 9 9 9999 തx =7 തx =1434,143 M = 7 M = 7

Διάμεσος ομαδοποιημένων δεδομένων Εντοπισμός της ομάδας (τάξης) M που περιλαμβάνει την n/2 παρατήρηση (η πρώτη τάξη με αθροιστική συχνότητα n/2) L M = κάτω όριο της τάξης f M = συχνότητα της τάξης F M 1 = αθροιστική συχνότητα της προηγούμενης τάξης δ = εύρος τάξεων Διάμεσος L M + δ f M n 2 F M 1

Διάμεσος ομαδοποιημένων δεδομένων Ηλικιακές ομάδες Κεντρικός όρος (m i ) Συχνότητα (f i ) [10, 20) 15 3 3000 [20, 30) 25 6 9000 [30, 40) 35 5 14000 [40, 50) 45 4 18000 [50, 60] 55 2 20000 F i δ = 10, n = 20 n 2 = 10 H παρατήρηση 10 είναι στην 3 η ηλικιακή ομάδα (τάξη), γιατί F 2 = 9 και F 3 = 14, οπότε L M = 30, f M = 5, F M 1 = 9 Διάμεσος L M + δ n f M 2 F M 1 = 30 + 10 10 9 = 32 5

Επικρατούσα τιμή (mode) H τιμή τ 0 που παρατηρείται πιο συχνά 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 2 ΕΤ: 1, 5 τ 0 = 9 Δεν επηρεάζεται από ακραίες τιμές Μπορεί να υπάρχουν πολλαπλές επικρατούσες τιμές ή και καμία Μέτρο κεντρικής τάσης κατάλληλο για ποιοτικές ή διακριτές μεταβλητές

Επικρατούσα τιμή ομαδοποιημένων δεδομένων Εντοπισμός της τάξης με την υψηλότερη συχνότητα L τ0 = κάτω όριο της τάξης Δ 1 = διαφορά μεταξύ της μέγιστης συχνότητας και της συχνότητας της προηγούμενης τάξης Δ 2 = διαφορά μεταξύ της μέγιστης συχνότητας και της συχνότητας της επόμενης τάξης δ = εύρος τάξεων Δ 1 τ 0 L τ0 + δ Δ 1 + Δ 2

Επικρατούσα τιμή ομαδοποιημένων δεδομένων Ηλικιακές ομάδες Κεντρικός όρος (m i ) δ = 10 Συχνότητα (f i ) [10, 20) 15 3 3000 [20, 30) 25 6 9000 [30, 40) 35 5 14000 [40, 50) 45 4 18000 [50, 60] 55 2 20000 Υψηλότερη συχνότητα στη 2 η τάξη (f 2 = 6), άρα L τ0 = 20, Δ 1 = 6 3 = 3, Δ 2 = 6 5 = 1 Δ 1 Επικρατούσα τιμή τ 0 L τ0 + δ = 20 + 10 3 Δ 1 + Δ 2 3 + 1 = 27,5 F i

Σύνοψη μέτρων κεντρικής τάσης Παράδειγμα Δείγμα τιμών 5 ακινήτων Mέση τιμή: 600 000 2 000 000 Διάμεσος: 300 000 500 000 Επικρατούσα τιμή: 100 000 300 000 100 000 100 000 Υπολογισμοί στο Excel

Μέτρα διασποράς Εύρος (range) Διακύμανση ή διασπορά (variance) (διασπορά= το φαινόμενο της μεταβολής της τιμής λόγω τυχαιότητας, διακύμανση, τυπική απόκλιση = μέτρα διασποράς) Τυπική απόκλιση (standard deviation) Συντελεστής μεταβλητότητας (coefficient of variation) Ίδια κεντρική τιμή, διαφορετική διασπορά

Εύρος Διαφορά μεταξύ της μικρότερης και της μεγαλύτερης τιμής 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Εύρος = 13-1 = 12 Απλό μέγεθος, αλλά ευαίσθητο σε ακραίες τιμές και στον τρόπο με τον οποίο κατανέμονται τα δεδομένα 7 8 9 10 11 12 Εύρος = 12-7 = 5 7 8 9 10 11 12 Εύρος = 12-7 = 5

Διακύμανση Μέση τιμή των τετραγώνων των αποκλίσεων από τη μέση τιμή Διακύμανση πληθυσμού μεγέθους N σ 2 = 1 N x i μ 2 i=1 Δειγματική διακύμανση για δείγμα μεγέθους n s 2 = 1 n 1 x i x 2 i=1 Γιατί η διαφορά στον τρόπο υπολογισμού; N Οι διαφορές x i xҧ 2 είναι συνήθως μικρότερες από τις διαφορές x i μ 2, οπότε η δειγματική διακύμανση s 2 χρειάζεται μια «διόρθωση» ώστε να αντικατοπτρίζει καλύτερα την πραγματική διακύμανση σ 2 n

Αριθμητικό παράδειγμα Δείγμα 8 παρατηρήσεων (n = 8) Μέση τιμή x = 10 Διακύμανση 4 6 8 9 11 12 12 18 s 2 = σ n i=1 x i x 2 n 1 = 4 10 2 + 6 10 2 + + 18 10 2 8 1 = 18,571 To μέγεθος της διακύμανσης δεν έχει φυσική ερμηνεία

Τυπική απόκλιση Η τυπική απόκλιση είναι η ρίζα της διακύμανσης και εκφράζεται στις μονάδες μέτρησης της εξεταζόμενης μεταβλητής Τυπική απόκλιση πληθυσμού: N σ = σ 2 = 1 N i=1 x i μ 2 Δειγματική τυπική απόκλιση: s = s 2 = 1 n 1 i=1 n x i x 2

Αριθμητικό παράδειγμα Δείγμα 8 παρατηρήσεων (n = 8) Μέση τιμή x = 10 Τυπική απόκλιση 4 6 8 9 11 12 12 18 s = σ n i=1 x i x 2 n 1 = 18,571 = 4,3095 To μέγεθος της τυπικής απόκλισης είναι συγκρίσιμο με τη μέση τιμή

Υπολογισμοί στο Excel Εκδόσεις έως 2010 Διακύμανση: var (δείγμα) & varp (πληθυσμός) Τυπική απόκλιση: stdev (δείγμα) & stdevp (πληθυσμός) Εκδόσεις 2013-16 Διακύμανση: var.s (δείγμα) & var.p (πληθυσμός) Τυπική απόκλιση: stdev.s (δείγμα) & stdev.p (πληθυσμός)

Διακύμανση ομαδοποιημένων δεδομένων Διακύμανση πληθυσμού: σ 2 1 N σ i f i m i μ 2 Δειγματική διακύμανση: s 2 1 n 1 σ i f i m i x 2 Ηλικιακές ομάδες Κεντρικός όρος (m i ) Συχνότητα (f i ) m i x m i x 2 f i m i x 2 [10, 20) 15 3-18 324 972 [20, 30) 25 6-8 64 384 [30, 40) 35 5 2 4 20 [40, 50) 45 4 12 144 576 [50, 60] 55 2 22 484 968 Σύνολο 2920 s 2 σ i f i m i x 2 n 1 = 2920 19 = 153,68

Συντελεστής μεταβλητότητας Αξιολόγηση της τυπικής απόκλισης σε σχέση με τη μέση τιμή CV = σ μ πληθυσμός CV = s x (δείγμα) Υψηλός συντελεστής μεταβλητότητας υποδεικνύει μεγάλη διασπορά τιμών αναλογικά με την μέση τιμή Παράδειγμα Η μέση ετήσια κατά κεφαλήν κατανάλωση μπύρας στην Ελλάδα είναι 31lt με τυπική απόκλιση 7lt, δηλαδή CV = 0,23 Η μέση ετήσια κατά κεφαλήν κατανάλωση μπύρας στη Γερμανία είναι 105lt με τυπική απόκλιση 15lt, δηλαδή CV = 0,14 H κατανάλωση μπύρας παρουσιάζει μεγαλύτερη ομοιογένεια στο γερμανικό πληθυσμό

Η μορφή μιας κατανομής Αναλυτικότερη περιγραφή της κατανομής των δεδομένων Ασυμμετρία (skewness) Περιγραφή της συμμετρικότητας της διασποράς γύρω από τη μέση τιμή Κύρτωση (kurtosis) Περιγραφή της κεντρικής συγκέντρωσης σε σχέση με τα άκρα

Ασυμμετρία 1 ος συντελεστής ασυμμετρίας του Pearson (σε σχέση με την επικρατούσα τιμή) β 1 = (x τ 0 )/s 3 ος συντελεστής ασυμμετρίας του Pearson Μέση τιμή Διάμεσος Επικρ. τιμή Αριστερή (αρνητική) ασυμμετρία β 3 = 1 n σ n i=1 s 3 Συμμετρία x i x 3 Συνάρτηση Excel: skew.p Δεξιά (θετική) ασυμμετρία

Κύρτωση Συγκέντρωση στο κέντρο σε σχέση με τα άκρα Συντελεστής κύρτωσης του Pearson: β 4 = 1 n σ n i=1 s 4 x i x 4 Λεπτόκυρτη κατανομή: β 4 > 3 Μεσόκυρτη κατανομή: β 4 = 3 Πλατύκυρτη κατανομή: β 4 < 3 Συνάρτηση Excel: kurt (παραλλαγή του β 4 )

Ασυμμετρία και κύρτωση ομαδοποιημένων δεδομένων Ασυμμετρία 1 ος συντελεστής ασυμμετρίας του Pearson: όπως προηγούμενα 3 ος συντελεστής ασυμμετρίας του Pearson 1 β 3 n σ i=1 n f i m i x 3 s 3 Κύρτωση β 4 = 1 n σ i=1 n f i m i x 4 s 4

Μέτρα σχετικής θέσης - Τεταρτημόρια Τα τεταρτημόρια Q 1, Q 2, Q 3 χωρίζουν ένα ταξινομημένο σύνολο παρατηρήσεων (από τη μικρότερη στη μεγαλύτερη τιμή) σε 4 μέρη με (περίπου) ίδιο αριθμό παρατηρήσεων στο καθένα Περίπου το 25% των παρατηρήσεων είναι μικρότερες από την τιμή Q 1 To Q 2 είναι η διάμεσος Περίπου το 25% των παρατηρήσεων είναι μεγαλύτερες από την τιμή Q 3 Η τιμή του τεταρτημόριου Q i (i = 1, 2, 3) υπολογίζεται ως Q i = x Α + Δ(x Α+1 x Α ) Α: το ακέραιο μέρος του i(n + 1)/4 Δ: το δεκαδικό μέρος του i(n + 1)/4

Τεταρτημόρια - Παράδειγμα 14 φοιτητές έλαβαν τις ακόλουθες βαθμολογίες στις εξετάσεις ενός μαθήματος (με άριστα το 100) 47, 48, 56, 57, 59, 67, 67, 78, 80, 89, 89, 89, 89, 94 Για το Q 1 i n + 1 = 1 14 + 1 = 3,75, Α = 3, Δ = 0,75 4 4 Q 1 = x 3 + Δ x 4 x 3 = 56 + 0,75 57 56 = 56,75 Για το Q 3 i n + 1 = 3 14 + 1 = 11,25, Α = 11, Δ = 0,25 4 4 Q 3 = x 11 + Δ x 12 x 11 = 89 + 0,25 89 89 = 89

Τεταρτημόρια ομαδοποιημένων δεδομένων Για το Q i εντοπίζεται η τάξη που περιέχει την ni/4 παρατήρηση (η πρώτη τάξη με αθροιστική συχνότητα ni/4) L Qi = κάτω όριο της τάξης f Qi = συχνότητα της τάξης F Qi 1 = αθροιστική συχνότητα προηγούμενης τάξης δ = εύρος τάξεων Q i L Qi + δ f Qi ni 4 F Q i 1

Τεταρτημόρια ομαδοποιημένων δεδομένων Ηλικιακές ομάδες Κεντρικός όρος (m i ) Συχνότητα (f i ) [10, 20) 15 3 3000 [20, 30) 25 6 9000 [30, 40) 35 5 14000 [40, 50) 45 4 18000 [50, 60] 55 3 21000 F i Για το Q 1 H παρατήρηση ni/4 = (21)(1)/4 = 5,25 ανήκει στη 2 η τάξη (F 2 = 9), άρα L Q1 = 20, f Q1 = 6, F Q1 1 = 3 Q 1 L Q1 + δ 21(1) F f Q1 4 Q1 1 = 20 + 10 5,25 3 = 23,75 6

Θηκόγραμμα (box plot) Αναπαράσταση τεταρτημορίων και εύρους Εύρος τιμών x min x max Q1 Q2 Q3

Παράδειγμα Δείγμα δεδομένων Ελάχιστο Μέγιστο 0 2 2 2 3 3 4 5 5 9 27 0 2 3 5 27 Τα δεδομένα χαρακτηρίζονται από δεξιά ασυμμετρία

Συμμετρίες

Συμμετρίες

Λυμένη άσκηση

Λυμένη άσκηση

Λυμένη άσκηση

Λυμένη άσκηση

Λυμένη άσκηση

Λυμένη άσκηση

Λυμένη άσκηση

Aσκήσεις

Aσκήσεις

Aσκήσεις

Aσκήσεις