Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Σχετικά έγγραφα
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 : Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Αριθμητικά περιγραφικά μέτρα II. Μέτρα κεντρικής θέσης

Τάση συγκέντρωσης. Μέτρα Κεντρικής Τάσης και Θέσης. Μέτρα Διασποράς. Τάση διασποράς. Σχήμα της κατανομής

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΣΤΑΤΙΣΤΙΚΑ ΜΕΤΡΑ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ

Περιγραφική Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Εισαγωγή στη Στατιστική

Έστω 3 πενταμελείς ομάδες φοιτητών με βαθμολογίες: Ομάδα 1: 6,7,5,8,4 Ομάδα 2: 7,5,6,5,7 Ομάδα 3: 8,6,2,4,10 Παρατηρούμε ότι και οι τρεις πενταμελείς

Εφαρμοσμένη Στατιστική

I2. Αριθμητικά περιγραφικά μέτρα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

1) ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ - ΑΤΑΞΙΝΟΜΗΤΑ ΔΕΔΟΜΕΝΑ

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Ενώ αυτό το ιστόγραμμα δίνει κάποια νέα πληροφόρηση, άλλα ενδιαφέροντα ερωτήματα (π.χ. ποιος είναι ο μέσος όρος της τάξης;) δεν απαντιέται.

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΚΕΦΑΛΑΙΟ 2 Γ ΙΕΥΘΥΝΣΗ ΑΘΗΝΑΣ - 5 Ο ΓΡΑΦΕΙΟ ΣΧΟΛΙΚΟ ΕΤΟΣ ΠΕΡΙΓΡΑΦΗ ΤΩΝ Ε ΟΜΕΝΩΝ ΜΕ ΑΡΙΘΜΗΤΙΚΕΣ ΚΑΙ ΓΡΑΦΙΚΕΣ ΜΕΘΟ ΟΥΣ

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

Στατιστικές Έννοιες (Υπολογισμός Χρηματοοικονομικού κινδύνου και απόδοσης, διαχρονική αξία του Χρήματος)

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Στατιστικές Έννοιες (Υπολογισμός Χρηματοοικονομικού κινδύνου και απόδοσης, διαχρονική αξία του Χρήματος)

Κεφάλαιο Δύο Γραφήματα και Πίνακες Περιγραφικές Τεχνικές

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΔΕΟ 13 ΤΟΜΟΣ Δ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Στατιστική Επιχειρήσεων 1 Μάθημα του A Εξαμήνου

Βιοστατιστική ΒΙΟ-309

Μέτρα θέσης και διασποράς

i Σύνολα w = = = i v v i=

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Περιγραφική Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Θέμα: Ενδεικτικό Θέμα εξετάσεων: Μέτρα θέσης Παλινδρόμηση

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Υπολογισμοί Παραμέτρων Πληθυσμού και Στατιστικών Δείγματος

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

Βιοστατιστική ΒΙΟ-309

Μέρος V. Στατιστική. Εισαγωγή: Βασικές έννοιες και ορισμοί. Περιγραφική Στατιστική (Descriptive Statistics)

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Βιοστατιστική ΒΙΟ-309

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΕΠΑΝΑΛΗΠΤΙΚΟ ΒΙΝΤΕΟ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Θηκόγραμμα - Boxplot. Παράδειγμα 1: Δίνονται οι παρακάτω 20 παρατηρήσεις μιας μεταβλητής x:

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

Εισαγωγή στη Στατιστική

Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

ΔΗΜΟΠΑΘΟΛΟΓΙΑ ΤΗΣ ΔΙΑΤΡΟΦΗΣ

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Πίνακας-1 Επίπεδο εκπαίδευσης πατέρα 2

Εισαγωγή στη Στατιστική Μάθημα του Β Εξαμήνου

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΘΕΜΑΤΑ Α : ΕΚΦΩΝΗΣΕΙΣ - ΛΥΣΕΙΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE

Ο Ι ΚΟ Ν Ο Μ Ι Κ Α / Σ ΤΑΤ Ι Σ Τ Ι Κ Η

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

Kruskal-Wallis H

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

επ. Κωνσταντίνος Π. Χρήστου

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη


Mέτρα (παράμετροι) θέσεως

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Είδη Μεταβλητών. κλίµακα µέτρησης

Στατιστική Επιχειρήσεων Ι. Περιγραφική Στατιστική 1

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

3 η ΕΡΓΑΣΙΑ , , , , , , , , , , , ,189

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

Transcript:

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Copyright 2009 Cengage Learning 4.1

Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Δείκτες Κεντρικής Θέσης [Αριθμητικός] Μέσος, Διάμεσος, Επικρατούσα Τιμή Δείκτες Μεταβλητότητας Εύρος Τιμών, Τυπική Απόκλιση, Διασπορά, Συντελεστής Μεταβλητότητας Δείκτες Σχετικής Θέσης Εκατοστημόρια, Τεταρτημόρια Δείκτες Γραμμικής Σχέσης Συμμεταβλητότητα, Συσχέτιση, Προσδιορισμός, Ευθεία Ελαχίστων Τετραγώνων Copyright 2009 Cengage Learning 4.2

Δείκτες Κεντρικής Θέσης Ο αριθμητικός μέσος, επίσης γνωστός ως μέσος όρος, εν συντομία μέσος, είναι ο πιο δημοφιλής και χρήσιμος δείκτης κεντρικής θέσης. Υπολογίζεται αθροίζοντας απλώς όλα τα δεδομένα και διαιρώντας δια τον αριθμό τους: Άθροισμα δεδομένων Μέσος = Αριθμός δεδομένων Copyright 2009 Cengage Learning 4.3

Συμβολισμός Όταν αναφερόμαστε στον αριθμό δεδομένων σε ένα πληθυσμό, χρησιμοποιούμε το κεφαλαίο γράμμα N Όταν αναφερόμαστε στον αριθμό δεδομένων σε ένα δείγμα, χρησιμοποιούμε το μικρό γράμμα n Ο αριθμητικός μέσος για ένα πληθυσμό συμβολίζεται με το ελληνικό γράμμα «μι»: Ο αριθμητικός μέσος για ένα δείγμα συμβολίζεται ως Copyright 2009 Cengage Learning 4.4

Αριθμητικός Μέσος Πληθυσμού Δείγματος Copyright 2009 Cengage Learning 4.5

Ο Αριθμητικός Μέσος είναι κατάλληλος για την περιγραφή δεδομένων μέτρησης, πχ. Ύψος ανθρώπων, βαθμοί φοιτητών, κλπ. επηρεάζεται σημαντικά από ακραίες τιμές που ονομάζονται «εσφαλμένα αποτελέσματα». Π.χ., από τη στιγμή που ένας δισεκατομμυριούχος μετακομίζει σε μια γειτονιά, το μέσο εισόδημα των νοικοκυριών αυξάνει πολύ πέραν αυτού που ήταν στο παρελθόν! Copyright 2009 Cengage Learning 4.6

Δείκτες Κεντρικής Θέσης Η διάμεσος υπολογίζεται τοποθετώντας όλα τα δεδομένα σε σειρά. Το δεδομένο που βρίσκεται στη μέση είναι η διάμεσος. Δεδομένα: {0, 7, 12, 5, 14, 8, 0, 9, 22} N=9 (μονός) Ταξινομείστε τα σε αύξουσα τάξη, βρείτε τη μέση: 0 0 5 7 8 9 12 14 22 Δεδομένα: {0, 7, 12, 5, 14, 8, 0, 9, 22, 33} N=10 (ζυγός) Ταξινομείστε τα σε αύξουσα τάξη, η μέση είναι ο απλός μέσος όρος μεταξύ 8 και 9: 0 0 5 7 8 9 12 14 22 33 διάμεσος = (8+9) 2 = 8.5 Η διάμεσος υπολογίζεται με τον ίδιο τρόπο είτε πρόκειται για δείγμα είτε για το σύνολο του πληθυσμού. Copyright 2009 Cengage Learning 4.7

Δείκτες Κεντρικής Θέσης Η επικρατούσα τιμή ενός συνόλου δεδομένων είναι η τιμή που εμφανίζεται με τη μεγαλύτερη συχνότητα. Ένα σύνολο δεδομένων μπορεί να έχει μία επικρατούσα τιμή (ή επικρατούσα κλάση), ή δύο, ή περισσότερες επικρατούσες τιμές. Η επικρατούσα τιμή είναι χρήσιμη για όλους τους τύπους δεδομένων, αν και κυρίως χρησιμοποιείται για ονομαστικά δεδομένα. Για μεγάλα σύνολα δεδομένων, η επικρατούσα κλάση είναι πολύ πιο πρόσφορη από την μεμονωμένη επικρατούσα τιμή. Η επικρατούσα τιμή υπολογίζεται με τον ίδιο τρόπο είτε πρόκειται για δείγμα είτε για το σύνολο του πληθυσμού. Copyright 2009 Cengage Learning 4.8

Συχνότητα Επικρατούσα Τιμή Δεδομένα: {0, 7, 12, 5, 14, 8, 0, 9, 22, 33} N=10 Ποιο δεδομένο εμφανίζεται συχνότερα; Η επικρατούσα τιμή γι αυτό το σύνολο δεδομένων είναι 0. Πώς αυτή είναι ένας δείκτης «κεντρικής» θέσης; Επικρατούσα κλάση Μεταβλητή Copyright 2009 Cengage Learning 4.9

Αριθμητικός Μέσος, Διάμεσος, Επικρατούσα Τιμή Εάν μια κατανομή είναι συμμετρική, ο μέσος, η διάμεσος και η επικρατούσα τιμή ενδέχεται να συμπίπτουν.. επικρατούσα τιμή διάμεσος μέσος Copyright 2009 Cengage Learning 4.10

Αριθμητικός Μέσος, Διάμεσος, Επικρατούσα Τιμή Εάν μια κατανομή είναι ασύμμετρη, ας πούμε ότι κλίνει προς τα αριστερά ή προς τα δεξιά, οι τρεις δείκτες μπορεί να διαφέρουν. Π.χ.: επικρατούσα τιμή διάμεσος μέσος Copyright 2009 Cengage Learning 4.11

Μέσος, Διάμεσος, Επικρατούσα Τιμή: Ποιος Είναι ο Καλύτερος Δείκτης; Εάν ήταν να επιλέξουμε από τους τρεις δείκτες ποιον θα έπρεπε να χρησιμοποιήσουμε; Ο αριθμητικός μέσος είναι γενικώς η πρώτη επιλογή μας. Ωστόσο, υπάρχουν πολλές περιπτώσεις που η διάμεσος είναι καλύτερος δείκτης. Η επικρατούσα τιμή σπανίως αποτελεί τον καλύτερο δείκτη κεντρικής θέσης. Ένα πλεονέκτημα της διαμέσου είναι ότι δεν είναι ευαίσθητη σε ακραίες τιμές, ενώ ο μέσος είναι. Copyright 2009 Cengage Learning 4.12

Μέσος, Διάμεσος, Επικρατούσα Τιμή: Ποιος Είναι ο Καλύτερος Δείκτης; Για να το περιγράψουμε, πάρτε τα δεδομένα του Παραδείγματος 4.1. Ο μέσος ήταν 11.0 και η διάμεσος 8.5. Έστω, τώρα, ότι ο ερωτηθείς που απάντησε 33 ώρες απαντούσε στην πραγματικότητα 133 ώρες (προφανώς εθισμένος στο Διαδίκτυο). Ο μέσος γίνεται x n i 1 n x i 0 7 12 5 133 14 8 0 22 10 210 10 21.0 Copyright 2009 Cengage Learning 4.13

Μέσος, Διάμεσος, Επικρατούσες Τιμές για Διατακτικά και Ονομαστικά Δεδομένα Για διατακτικά και ονομαστικά δεδομένα ο υπολογισμός του αριθμητικού μέσου δεν είναι έγκυρος. Η διάμεσος είναι πρόσφορη σε διατακτικά δεδομένα. Σε ονομαστικά δεδομένα, ένας υπολογισμός επικρατούσας τιμής είναι χρήσιμος στον καθορισμό της μέγιστης συχνότητας αλλά όχι της «κεντρικής θέσης». Copyright 2009 Cengage Learning 4.14

Δείκτες Κεντρικής Θέσης Σύνοψη Υπολογίστε τον Αριθμητικό Μέσο για να Περιγράψετε την κεντρική θέση ενός ενιαίου συνόλου συνεχών [ποσοτικών] δεδομένων Υπολογίστε τη Διάμεσο για να Περιγράψετε την κεντρική θέση ενός ενιαίου συνόλου συνεχών ή διατακτικών δεδομένων Υπολογίστε την Επικρατούσα Τιμή για να Περιγράψετε ένα ενιαίο σύνολο ονομαστικών δεδομένων Copyright 2009 Cengage Learning 4.15

Δείκτες Μεταβλητότητας Οι δείκτες κεντρικής θέσης αδυνατούν να καλύψουν όλο το φάσμα της κατανομής, δηλαδή, πόσα από τα δεδομένα διασπείρονται γύρω από την μέση τιμή. Έχουμε για παράδειγμα δύο σύνολα βαθμών σχολικής τάξης. Ο μέσος (=50) είναι ο ίδιος σε κάθε μία των περιπτώσεων. Όμως, η κόκκινη τάξη έχει μεγαλύτερη μεταβλητότητα από την μπλε τάξη. Copyright 2009 Cengage Learning 4.16

Εύρος Τιμών Το εύρος τιμών είναι ο απλούστερος δείκτης μεταβλητότητας, και υπολογίζεται ως: Εύρος = Μέγιστη Τιμή Ελάχιστη Τιμή Π.χ. Δεδομένα: {4, 4, 4, 4, 50} Εύρος = 46 Δεδομένα: {4, 8, 15, 24, 39, 50} Εύρος = 46 Το εύρος είναι ίδιο και στις δύο περιπτώσεις, όμως τα σύνολα δεδομένων έχουν πολύ διαφορετικές κατανομές. Copyright 2009 Cengage Learning 4.17

Εύρος Τιμών Το βασικό πλεονέκτημά του είναι η ευκολία υπολογισμού του. Το βασικό μειονέκτημά του είναι η αδυναμία παροχής πληροφοριών σχετικά με τη διασπορά των δεδομένων μεταξύ των δύο ακραίων σημείων. Επομένως χρειαζόμαστε ένα δείκτη μεταβλητότητας που ενσωματώνει όλα τα δεδομένα και όχι μόνο δύο. Άρα. Copyright 2009 Cengage Learning 4.18

Διασπορά Η διασπορά, μαζί με την τυπική απόκλιση, είναι αναμφισβήτητα τα πιο σημαντικά στατιστικά στοιχεία. Χρησιμοποιούνται στη μέτρηση της μεταβλητότητας, και παίζουν επίσης ζωτικό ρόλο σε σχεδόν όλες τις διαδικασίες στατιστικής συμπερασματολογίας. Η διασπορά πληθυσμού συμβολίζεται με (το ελληνικό μικρό γράμμα «σίγμα» στο τετράγωνο) Η διασπορά δείγματος συμβολίζεται με (μικρό γράμμα «s» στο τετράγωνο) Copyright 2009 Cengage Learning 4.19

Διασπορά μέσος πληθυσμού Η διασπορά πληθυσμού είναι: μέγεθος πληθυσμού μέσος δείγματος Η διασπορά δείγματος είναι: Σημείωση: Ο παρονομαστής είναι το μέγεθος δείγματος (n) μείον ένα! Copyright 2009 Cengage Learning 4.20

Διασπορά Όπως μπορείτε να δείτε, πρέπει να υπολογίσετε τον μέσο δείγματος (x-bar) για να μπορέσετε να υπολογίσετε τη διασπορά δείγματος. Εναλλακτικά, υπάρχει μια απλοποιημένη διατύπωση για τον υπολογισμό της διασποράς δείγματος απευθείας από τα δεδομένα χωρίς το ενδιάμεσο στάδιο υπολογισμού του μέσου. Δίδεται από τη σχέση Copyright 2009 Cengage Learning 4.21

Εφαρμογή Παράδειγμα 4.7. Ένα δείγμα έξι φοιτητών έκανε τον παρακάτω αριθμό αιτήσεων για απασχόληση: 17, 15, 23, 7, 9, 13. Υπολογίστε τον αριθμητικό μέσο και τη διασπορά του δείγματος. Τι ζητάμε να υπολογίσουμε; Το παρακάτω δείγμα αποτελείται από τον αριθμό αιτήσεων απασχόλησης έξι φοιτητών: 17, 15, 23, 7, 9, 13. Βρείτε τον αριθμητικό μέσο και την διασπορά. σε αντίθεση με ή 2 Copyright 2009 Cengage Learning 4.22

Αριθμητικός Μέσος & Διασπορά Δείγματος Αριθμητικός Μέσος Δείγματος Διασπορά Δείγματος Διασπορά Δείγματος (απλοποιημένη μέθοδος) Copyright 2009 Cengage Learning 4.23

Τυπική Απόκλιση Η τυπική απόκλιση είναι απλώς η τετραγωνική ρίζα της διασποράς, επομένως: Τυπική απόκλιση πληθυσμού: Τυπική απόκλιση δείγματος: Copyright 2009 Cengage Learning 4.24

Τυπική Απόκλιση Έστω ότι ένας κατασκευαστής μπαστουνιών γκολφ σχεδίασε ένα νέο μπαστούνι και θέλει να μάθει εάν τα χτυπήματα με το νέο μπαστούνι είναι πιο συνεπή (δηλαδή, με λιγότερη μεταβλητότητα) απ ότι με το παλιό μπαστούνι. Χρησιμοποιώντας τα Δεδομένα > Ανάλυση Δεδομένων > Περιγραφική Στατιστική σε Excel, δημιουργούμε τους παρακάτω πίνακες προς ερμηνεία Έχετε μεγαλύτερη συνέπεια στις αποστάσεις με το νέο μπαστούνι Copyright 2009 Cengage Learning 4.25

Ερμηνεία Τυπικής Απόκλισης Η τυπική απόκλιση μπορεί να χρησιμοποιείται στη σύγκριση της μεταβλητότητας διαφόρων κατανομών και δηλώνει κάτι για τη γενική μορφή μιας κατανομής. Εάν το ιστόγραμμα είναι καμπάνα, μπορούμε να χρησιμοποιήσουμε τον Εμπειρικό Κανόνα, σύμφωνα με τον οποίο: 1) Περίπου το 68% όλων των δεδομένων εμπίπτουν σε μία τυπική απόκλιση του αριθμητικού μέσου. 2) Περίπου το 95% όλων των δεδομένων εμπίπτουν σε δύο τυπικές αποκλίσεις του αριθμητικού μέσου. 3) Περίπου το 99.7% όλων των δεδομένων εμπίπτουν σε τρεις τυπικές αποκλίσεις του αριθμητικού μέσου. Copyright 2009 Cengage Learning 4.26

Εμπειρικός Κανόνας Περίπου το 68% όλων των δεδομένων εμπίπτουν σε μία τυπική απόκλιση του αριθμητικού μέσου. Περίπου το 95% όλων των δεδομένων εμπίπτουν σε δύο τυπικές αποκλίσεις του αριθμητικού μέσου. Περίπου το 99.7% όλων των δεδομένων εμπίπτουν σε τρεις τυπικές αποκλίσεις του αριθμητικού μέσου. Copyright 2009 Cengage Learning 4.27

Ερμηνεία Τυπικής Απόκλισης Έστω ότι ο αριθμητικός μέσος και η τυπική απόκλιση των βαθμών στις ενδιάμεσες εξετάσεις του περασμένου έτους είναι 7 και 0.5 αντιστοίχως. Εάν το ιστόγραμμα είναι σχήματος καμπάνας γνωρίζουμε ότι περίπου το 68% των βαθμών βρίσκονται μεταξύ 6.5 και 7.5, περίπου το 95% των βαθμών μεταξύ 6 και 8, και περίπου το 99.7% των βαθμών μεταξύ 5.5 και 8.5. Copyright 2009 Cengage Learning 4.28

Συντελεστής Μεταβλητότητας Συντελεστής μεταβλητότητας ενός συνόλου δεδομένων είναι η τυπική απόκλιση των δεδομένων διαιρούμενη με τον αριθμητικό μέσο τους, δηλαδή: Συντελεστής μεταβλητότητας πληθυσμού= υ = Συντελεστής μεταβλητότητας δείγματος = cv = Copyright 2009 Cengage Learning 4.29

Συντελεστής Μεταβλητότητας Ο συντελεστής αυτός παρέχει ένα αναλογικό μέτρο μεταβλητότητας, π.χ. Μια τυπική απόκλιση της τάξης του 10 μπορεί να εκληφθεί ως μεγάλη όταν η μέση τιμή είναι 100, αλλά απλώς μετρίως μεγάλη όταν η μέση τιμή είναι 500. Copyright 2009 Cengage Learning 4.30

Δείκτες Σχετικής Θέσης και Θηκόγραμμα Οι δείκτες σχετικής θέσης δίνουν πληροφορίες για τη θέση συγκεκριμένων τιμών σε σχέση με το σύνολο των δεδομένων. Εκατοστημόριο: το P στό εκατοστημόριο είναι η τιμή για την οποία το Ρ% είναι μικρότερο από την τιμή αυτή και το (100- P)% είναι μεγαλύτερο από την τιμή αυτή. Έστω ότι βαθμολογικά βρίσκεστε στο 60στό εκατοστημόριο της GMAT, που σημαίνει ότι το 60% του συνόλου των εξεταζομένων πέτυχαν βαθμό μικρότερο του δικού σας, ενώ το 40% των εξεταζομένων πέτυχαν βαθμό μεγαλύτερο του δικού σας. Copyright 2009 Cengage Learning 4.31

Τεταρτημόρια Έχουμε ειδικές ονομασίες για το 25ο, 50ο, και 75ο εκατοστημόριο, τα ονομάζουμε τεταρτημόρια. Το πρώτο ή κάτω τεταρτημόριο συμβολίζεται με Q 1 = 25ο εκατοστημόριο. Το δεύτερο τεταρτημόριο, Q 2 = 50ο εκατοστημόριο (που είναι και η διάμεσος). Το τρίτο ή άνω τεταρτημόριο, Q 3 = 75ο εκατοστημόριο. Μπορούμε επίσης να μετατρέψουμε τα εκατοστημόρια σε πεμπτημόρια (πέμπτα) και δεκατημόρια (δέκατα). Copyright 2009 Cengage Learning 4.32

Συνήθως Χρησιμοποιούμενα Εκατοστημόρια Πρώτο (κάτω) δεκατημόριο Πρώτο (κάτω) τεταρτημόριο, Q 1, Τρίτο τεταρτημόριο, Q 3, Ένατο (άνω) δεκατημόριο = 10ο εκατοστημόριο = 25ο εκατοστημόριο = 75ο εκατοστημόριο = 90ο εκατοστημόριο Σημείωση: Εάν η βαθμολογία σας τοποθετεί στο 80ο εκατοστημόριο, αυτό δεν σημαίνει ότι πετύχατε βαθμό 80% στις εξετάσεις σημαίνει ότι το 80% των συμφοιτητών σας πέτυχαν χαμηλότερη βαθμολογία από εσάς στις εξετάσεις. Έχει να κάνει με τη θέση σας σε σχέση με άλλους. Copyright 2009 Cengage Learning 4.33

Ενδοτεταρτημοριακό Εύρος Τα τεταρτημόρια μπορούν να χρησιμοποιηθούν στη δημιουργία ενός άλλου δείκτη μεταβλητότητας, του ενδοτεταρτημορικού εύρους, το οποίο ορίζεται ως εξής: Ενδοτεταρτημοριακό εύρος = Q 3 Q 1 Το ενδοτεταρτημοριακό εύρος μετρά το εύρος του μεσαίου 50% των δεδομένων. Μεγάλες τιμές αυτού του στατιστικού στοιχείου σημαίνουν ότι το 1ο και το 3ο τεταρτημόριο βρίσκονται σε μεγάλη απόσταση, κάτι που δείχνει υψηλά επίπεδα μεταβλητότητας. Copyright 2009 Cengage Learning 4.34

Θηκόγραμμα Το θηκόγραμμα είναι μια διαγραμματική μέθοδος πέντε στατιστικών στοιχείων: της ελάχιστης και μέγιστης τιμής, και Μουστάκια» «Μουστάκια» (1.5*(Q 3 Q 1 )) του πρώτου, δεύτερου και τρίτου τεταρτημόριου. Οι οριζόντιες γραμμές που εκτείνονται αριστερά και δεξιά ονομάζονται «μουστάκια» (whiskers). Τα σημεία που βρίσκονται έξω από τα «μουστάκια» ονομάζονται ακραίες τιμές (εσφαλμένα αποτελέσματα). Τα «μουστάκια» εκτείνονται μέχρι την ελάχιστη/μέγιστη τιμή των δεδομένων αλλά δεν πρέπει να υπερβαίνουν σε μήκος 1.5 φορές το ενδοτεταρτημοριακό εύρος. Copyright 2009 Cengage Learning 4.35

Παράδειγμα Ένας μεγάλος αριθμός εστιατορίων ταχυφαγίας προσφέρει στους πελάτες τα πλεονεκτήματα μιας ταχείας εξυπηρέτησης. Για να μετρήσει πόσο καλή είναι η εξυπηρέτηση, μία εταιρεία σχεδίασε μια έρευνα σχετικά με τους χρόνους εξυπηρέτησης σε πέντε διαφορετικά εστιατόρια. Συγκρίνετε τα πέντε σύνολα δεδομένων χρησιμοποιώντας ένα θηκόγραμμα και ερμηνεύστε τα αποτελέσματα. Copyright 2009 Cengage Learning 4.36

Θηκογράμματα Αυτά τα θηκογράμματα βασίζονται σε δεδομένα που βρίσκονται στο αρχείο Xm04-15. Οι χρόνοι εξυπηρέτησης του εστιατορίου Wendy s είναι μικρότεροι και με ελάχιστη μεταβλητότητα. Οι χρόνοι εξυπηρέτησης του εστιατορίου Hardee s παρουσιάζουν μεγαλύτερη μεταβλητότητας, ενώ τους μεγαλύτερους χρόνους εξυπηρέτησης εμφανίζει το εστιατόριο Jack-in-the-Box Copyright 2009 Cengage Learning 4.37

Δείκτες Γραμμικής Συσχέτισης Τώρα παρουσιάζουμε τρεις αριθμητικούς δείκτες γραμμικής συσχέτισης που παρέχουν πληροφορίες για την ισχύ και κατεύθυνση μιας γραμμικής σχέσης μεταξύ δύο μεταβλητών. Αυτές είναι η συμμεταβλητότητα, ο συντελεστής συσχέτισης, και ο συντελεστής προσδιορισμού που θα μελετήσουμε στη Στατιστική ΙΙ. Copyright 2009 Cengage Learning 4.38

Συμμεταβλητότητα μέσος πληθυσμού μεταβλητής X, μεταβλητής Y μέσος δείγματος μεταβλητής X, μεταβλητής Y Σημείωση: ο διαιρέτης είναι n-1, όχι n, όπως ίσως θα αναμένατε. Copyright 2009 Cengage Learning 4.39

Συμμεταβλητότητα Όταν δύο μεταβλητές κινούνται στην ίδια κατεύθυνση (και οι δύο αυξάνουν ή και οι δύο μειώνονται), η συμμεταβλητότητα θα είναι ένας μεγάλος θετικός αριθμός. Όταν δύο μεταβλητές κινούνται σε αντίθετες κατευθύνσεις, η συμμεταβλητότητα είναι ένας μεγάλος αρνητικός αριθμός. Όταν δεν υπάρχει ιδιαίτερο μοτίβο, η συμμεταβλητότητα είναι ένας μικρός αριθμός. Ωστόσο, συχνά είναι δύσκολος ο καθορισμός του εάν μια συγκεκριμένη συμμεταβλητότητα είναι μεγάλη ή μικρή. Η επόμενη παράμετρος/στατιστικό στοιχείο αντιμετωπίζει το πρόβλημα αυτό. Copyright 2009 Cengage Learning 4.40

Συντελεστής Συσχέτισης Ως συντελεστής συσχέτισης ορίζεται η συμμεταβλητότητα διαιρούμενη με τις τυπικές αποκλίσεις των μεταβλητών: Ελληνικό γράμμα «ρο» Ο συντελεστής αυτός απαντά στο ερώτημα: Πόσο ισχυρή είναι η συσχέτιση μεταξύ Χ και Υ; Copyright 2009 Cengage Learning 4.41

Συντελεστής Συσχέτισης Το πλεονέκτημα του συντελεστή συσχέτισης έναντι της συμμεταβλητότητας είναι ότι έχει σταθερό εύρος από -1 έως +1, επομένως: Εάν οι δύο μεταβλητές είναι πολύ ισχυρά θετικά συσχετισμένες, η τιμή του συντελεστή είναι πλησίον του +1 (ισχυρή θετική γραμμική σχέση). Εάν οι δύο μεταβλητές είναι πολύ ισχυρά αρνητικά συσχετισμένες, η τιμή του συντελεστή είναι κοντά στο -1 (ισχυρή αρνητική γραμμική σχέση). Με τιμή συντελεστή κοντά στο μηδέν δεν καταδεικνύεται ευθεία σχέση. Copyright 2009 Cengage Learning 4.42

Συντελεστής Συσχέτισης +1 Ισχυρή θετική γραμμική σχέση r ή r = 0 Καμία ευθεία σχέση -1 Ισχυρή αρνητική γραμμική σχέση Copyright 2009 Cengage Learning 4.43

Παράμετροι και Στατιστικά Στοιχεία Πληθυσμός Δείγμα Μέγεθος N n Μέσος Διασπορά S 2 Τυπική Απόκλιση S Συντελεστής Μεταβλητότητας υ cv Συμμεταβλητότητα Συντελεστής Συσχέτισης S xy r Copyright 2009 Cengage Learning 4.44