I2. Αριθμητικά περιγραφικά μέτρα

Σχετικά έγγραφα
Εφαρμοσμένη Στατιστική

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Τάση συγκέντρωσης. Μέτρα Κεντρικής Τάσης και Θέσης. Μέτρα Διασποράς. Τάση διασποράς. Σχήμα της κατανομής

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Περιγραφική Στατιστική

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis


ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εισαγωγή στη Στατιστική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Αριθμητικά περιγραφικά μέτρα II. Μέτρα κεντρικής θέσης

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Εισαγωγή στη Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

Πίνακας-1 Επίπεδο εκπαίδευσης πατέρα 2

Παράδειγμα. Χρονολογικά δεδομένα. Οι πωλήσεις μιας εταιρείας ανά έτος για το διάστημα (σε χιλιάδες $)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Γιατί μετράμε την διασπορά;

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ε Π Ι Χ Ε Ι Ρ Η Σ Ε Ω Ν ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ & ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Περιγραφική Στατιστική

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Περιγραφή ποιοτικών δεδομένων. Περιγραφή ποιοτικών δεδομένων. Περιγραφή ποιοτικών δεδομένων. Περιγραφή ποιοτικών δεδομένων.

ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΤΟΥ ΔΙΔΑΚΤΙΚΟΥ ΕΡΓΟΥ ΤΩΝ ΥΠΟΧΡΕΩΤΙΚΩΝ ΜΑΘΗΜΑΤΩΝ ΧΕΙΜΕΡΙΝΟΥ ΕΞΑΜΗΝΟΥ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Βιοστατιστική ΒΙΟ-309

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Πίνακας-1 Επίπεδο εκπαίδευσης πατέρα 2

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Υπολογισμοί Παραμέτρων Πληθυσμού και Στατιστικών Δείγματος

2) Περιγραφή ιακριτών Ποσοτικών εδοµένων

Μάθηµα 3 ο. Περιγραφική Στατιστική

Κεφάλαιο 5 Δείκτες Διασποράς

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΔΕΟ 13 ΤΟΜΟΣ Δ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

επ. Κωνσταντίνος Π. Χρήστου

ΚΕΦΑΛΑΙΟ 6 ΚΟΙΝΟΙ ΥΠΟΨΗΦΙΟΙ

1 x-μ - 2 σ. e σ 2π. f(x) =

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

Στατιστικές Έννοιες (Υπολογισμός Χρηματοοικονομικού κινδύνου και απόδοσης, διαχρονική αξία του Χρήματος)

Στατιστικές Έννοιες (Υπολογισμός Χρηματοοικονομικού κινδύνου και απόδοσης, διαχρονική αξία του Χρήματος)

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

Χ. Εμμανουηλίδης, 1

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

ν ν = 6. όταν είναι πραγµατικός αριθµός.

Transcript:

I. Αριθμητικά περιγραφικά μέτρα Μέτρα θέσης ή κεντρικής τάσης (cetral tedecy) Χρήσιμα για την περιγραφή της θέσης της κατανομής από την οποία προέρχονται. Δημοφιλέστερα: Μέση τιμή, κορυφή και διάμεσος. Η δειγματική μέση τιμή (mea) είναι ο μέσος όρος των παρατηρήσεων Συμβολισμοί: αριθμός παρατηρήσεων ενός πληθυσμού, N αριθμός παρατηρήσεων ενός δείγματος, μέση τιμή του πληθυσμού, μ μέση τιμή του δείγματος, k i ja j k Υπολογισμός δειγματικού μέσου i 1 j1 ή j1 f j a j Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (1)

Η κορυφή (mode) είναι η επικρατέστερη τιμή του δείγματος, δηλ. αυτή με την μέγιστη συχνότητα Η διάμεσος (media) δ είναι η τιμή που βρίσκεται στην μέση των δεδομένων αν διατάξουμε τα δεδομένα. Όταν το σύνολο δεδομένων έχει άρτιο αριθμό παρατηρήσεων τότε η κορυφή είναι ο μέσος των δύο μεσαίων δεδομένων. Διατάσσουμε τα δεδομένα { 1,,, } και συμβολίζουμε το διατεταγμένο σύνολο ως { (1), (),, () }. Τότε ( r) ( r) ( r1) r 1 Παρατήρηση: Αν η κατανομή είναι συμμετρική, τότε ο μέσος, η κορυφή και η διάμεσος συμπίπτουν. r Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας ()

Ποσοστημόριο (quatiles): μέτρο σχετικής θέσης το a-οστό ποσοστημόριο είναι η τιμή από την οποία το a% των τιμών είναι μικρότερο από την τιμή αυτή και (100- a)% είναι μεγαλύτερο από την τιμή αυτή Όταν a={5, 50, 75} τότε έχουμε τεταρτημόρια (quartiles) a=5 : Q 1 πρώτο τεταρτημόριο a=75 : Q 3 τρίτο τεταρτημόριο a=50 : Q = δ, δηλ. το δεύτερο τεταρτημόριο είναι η διάμεσος Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (3)

Μέτρα διασποράς Εκφράζουν αποκλίσεις των τιμών μιας μεταβλητής γύρω από τα μέτρα κεντρικής τάσης Εύρος (rage) ή κύμανση = ma τιμή mi τιμή Ενδοτεταρτημοριακή απόκλιση = Q 3 Q 1 Μετράει το άπλωμα του 50% των μεσαίων παρατηρήσεων. Μεγάλες τιμές αυτής της στατιστικής σημαίνουν ότι το 1ο και 3ο τεταρτημόριο απέχουν υποδεικνύοντας υψηλό επίπεδο μεταβλητότητας. Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (4)

Μέση απόκλιση (mea deviatio) Το μέσο της απόκλισης των τιμών από το μέσο τους Δειγματική διασπορά ή διακύμανση (variace) Τυπική απόκλιση (stadard deviatio) Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (5) MO i i 1 1 1 s i i 1 1 s i i

Αν το ιστόγραμμα είναι προσεγγιστικά σαν τη σ.π.π. της κανονικής κατανομής, τότε ισχύουν οι εμπειρικοί κανόνες To 68% των τιμών βρίσκονται στο διάστημα s Το 95% των τιμών βρίσκονται στο διάστημα s Το 99% των τιμών βρίσκονται στο διάστημα 99% 3s 95% Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (6)

Για μη-συμμετρικές κατανομές ισχύει η ανισότητα του Chebyshev: P 1 k 1 k δηλ. το ποσοστό των δεδομένων που βρίσκονται με απόκλιση k φορές γύρω από το μέσο είναι τουλάχιστον 1-1/k Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (7)

Θηκογράμματα (bo plots) Βήματα κατασκευής Βρίσκουμε τα δύο τεταρτημόρια Q1, Q3 και την διάμεσο δ. Κατασκευάζουμε ένα ορθογώνιο με την κάτω πλευρά στο Q1, την πάνω πλευρά στο Q3 και τη διάμεσος να παριστάνεται ως ευθύγραμμο τμήμα μέσα στο ορθογώνιο παράλληλο με τις βάσεις. Φέρουμε γραμμές από τα μέσα των βάσεων του ορθογωνίου μέχρι τις οριακές (adjacet) τιμές που προκύπτουν: Άνω οριακή: η μεγαλύτερη παρατήρηση που είναι του Q3+1.5(Q3-Q1)=Q3+3Q Κάτω οριακή: η μικρότερη παρατήρηση που είναι του Q1-1.5(Q3-Q1)=Q1-3Q Οι προεκτεινόμενες γραμμές ονομάζονται μύστακες (whiskers). Κάθε σημείο που πέφτει έξω από τους μύστακες καλείται ακραία τιμή (outlier) Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (8)

Θηκογράμματα (bo plots) Τα θηκογράμματα μας δίνουν το κεντρικό διάστημα με το 50% των παρατηρήσεων μεταξύ του 1 ου και 3 ου τεταρτημορίου. Οι επεκτεινόμενες γραμμές και η θέση της διαμέσου μας δίνουν μια εικόνα της συμμετρικότητας της κατανομής. Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (9)

Συντελεστής μεταβλητότητας (coefficiet of variatio) v s τυπική απόκλιση μέση ττιμ Μέτρο σχετικής μεταβλητότητας τιμών, για συγκρίσεις συνόλων τιμών. Δεχόμαστε ότι δύο δείγματα τιμών θα είναι ομοιογενή αν ο συντελεστής μεταβλητότητας τους διαφέρει το πολύ 10%. 100% Z-score z Ο αριθμός των τυπικών αποκλίσεων που μια τιμή διαφέρει από το μέσον της, μ Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (10)

Μέτρα συσχέτισης δύο μεταβλητών Συνδιακύμανση (covariace): μέτρο κατευθυντικότητας δύο μεταβλητών Αν οι τ.μ. κινούνται προς την ίδια κατεύθυνση τότε συνδιακύμανση μεγάλη θετική Αν κατεύθυνση αντίθετη τότε μεγάλη αρνητική, ενώ αν όχι σχέση τείνει στο μηδέν. Συντελεστής συσχέτισης (correlatio coefficiet): μέτρο γραμμικότητας μεταξύ των δύο μεταβλητών [-1, 1] r -> 1 r -> 0 r -> -1 Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (11)

Μέτρα ασυμμετρίας M 0 Συμμετρική κατανομή Η κορυφή, ο μέσος και η διάμεσος συμπίπτουν Συντελεστής ασυμμετρίας Pearso Συντελεστής του Bowley M Λοξή προς τα δεξιά Οι περισσότερες παρατηρήσεις είναι δεξιά της κορυφής (M0). Συντελεστής ασυμμετρίας με βάση τις ροπές S A M 0 0 Λοξή προς τα αριστερά Οι περισσότερες παρατηρήσεις είναι αριστερά της κορυφής (M0). M 0 Y1 Y 3 s s Q1 Q3 Q3 Q1 1, 1 Q3 Q1 Q3 Q1 m3 3η ροπή στο ττετραγων 1 m η ροπή στο ττετραγων Εφαρμοσμένη Στατιστική Μέρος 1 ο Κ. Μπλέκας (1)