ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανε ιστήµιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΙΑΛΕΞΗ 03 ΠΕΡΙΓΡΑΦΙΚΗ ΑΝΑΛΥΣΗ Βόλος, 2014-2015 1
1. Μέτρα Κεντρικής Τάσης
Ποιοτική µεταβλητή (τακτική) Ποσοτική µεταβλητή Επικρατούσα τιµή ιάµεσος Τεταρτηµόρια Επικρατούσα τιµή ιάµεσος Τεταρτηµόρια Μέση τιµή BOX-PLOT
1.1. Ποιοτική µεταβλητή: Likert scale Για την εκτίµηση της οιότητας ενός ροϊόντος, ρωτήσαµε σε 300 καταναλωτές να αξιολογήσουν την οιότητα ενός ροϊόντος σε µια κλίµακα α ό 1 έως 7, χρησιµο οιώντας την γνωστή Κλίµακα Αθροιστικής Βαθµολόγησης (Likert scale). Ποιότητα Αριθµός Χ προϊόντος i καταναλωτών (n i ) Απαράδεκτη 1 12 Πολύ κακή 2 27 Κακή 3 48 Μέτρια 4 66 Καλή 5 84 Πολύ καλή 6 45 Τέλεια 7 18 Σύνολο 300 Η µεταβλητή ου εξετάζουµε είναι οιοτική όµως έχουµε κωδικο οιήσει τις 7 κατηγορίες δεδοµένου ότι, υ άρχει µια λογική ιεράρχηση ως ρος την οιότητα του ροϊόντος. Πρόκειται για τακτική µεταβλητή µε 7 κατηγορίες.
1.1. Ποιοτική µεταβλητή: Likert scale Εφόσον έχουµε αρκετές κατηγορίες (τιµές) οι ο οίες αντανακλούν ένα βαθµό ροτιµήσεων, µ ορεί να γίνει διευρυµένη στατιστική ανάλυση η ο οία εριλαµβάνει: i. τον υ ολογισµό των συχνοτήτων, βασική ροϋ όθεση για την εραιτέρω ανάλυση, ii. την αναζήτηση της ε ικρατούσας τιµής(κατηγορίας), iii. τον υ ολογισµό της διάµεσου(md = Q2), iv. Τον υ ολογισµό του ρώτου τεταρτηµόριου (Q1) και του τρίτου τεταρτηµόριου(q3). v. την γραφική ανα αράσταση: το Θηκόγραµµα (Box-Plot) για την αναζήτηση«ακραίων τιµών».
1.1. Ποιοτική µεταβλητή: Likert scale (i) Υπολογισµός σχετικών συχνοτήτων (ii) Eπικρατούσα τιµή Αριθµός καταναλωτών: Σχετικές Ποιότητα Χi Απόλυτες συχνότητες συχνότητες προϊόντος n i N i f i F i Απαράδεκτη 1 12 12 4,0 4,0 Πολύ κακή 2 27 39 9,0 13,0 Κακή 3 48 87 16,0 29,0 Μέτρια 4 66 153 22,0 51,0 Καλή 5 84 237 28,0 79,0 Πολύ καλή 6 45 282 15,0 94,0 Τέλεια 7 18 300 6,0 100,0 Σύνολο 300 100,0 Η ε ικρατούσα τιµήαντιστοιχεί στην κατηγορία µε την µέγιστη συχνότητα, δηλαδή στον χαρακτηρισµό: Καλή οιότητα. εν ροσφέρει σηµαντική ληροφορία, ειδικά όταν αντιστοιχεί σε εριορισµένο %.
ΙΑΜΕΣΟΣ ΜΙΑΣ ΤΑΚΤΙΚΗΣ ΜΕΤΑΒΛΗΤΗΣ: Μd= Q 2 Η διάµεσος = Μd = Q 2 είναι η τιµή της µεταβλητής για την ο οία, το 50% των αρατηρήσεων βρίσκεται ριν τη συγκεκριµένη τιµή και το υ όλοι ο 50% µετά τη συγκεκριµένη τιµή, εφόσον οι τιµές της µεταβλητής Χ είναι σε αύξουσα σειρά. Όταν έχουµε n άτοµα, η διάµεσος υ ολογίζεται ως έξης: Για n µονός, ηθέσητηςδιάµεσοςδίνεταια ό: ητιµήτηςδιάµεσος = Για n ζυγός, η θέση της διάµεσος βρίσκεται µεταξύ : ητιµήτηςδιάµεσος = M d = X( n +1)/2 1.( X n + X 2 n+1 2 = n + 1 2 2 Πλεονεκτήµατα Έχει ολύ συγκεκριµένος ορισµός εν ε ηρεάζεται σηµαντικά α ό τις ακραίες ή άτυ ες τιµές. Α οτελεί α αραίτητη συµ ληρωµατική ληροφορία για τον έλεγχο της αξιο ιστίας της µέσης τιµής όταν ο υ ολογισµός της µέσης τιµής έχει νόηµα. Md ) n 2 & n+1 2 Μειονεκτήµατα Ελάχιστη χρησιµότητα µε τακτικές µεταβλητές ου χαρακτηρίζονται α ό µικρό αριθµό κατηγοριών.
1.1. Ποιοτική µεταβλητή: Likert scale (iii) Αναζήτηση της ιάµεσου Αριθµός καταναλωτών: Σχετικές Ποιότητα Χi Απόλυτες συχνότητες συχνότητες προϊόντος n i N i f i F i Απαράδεκτη 1 12 12 4,0 4,0 Πολύ κακή 2 27 39 9,0 13,0 Κακή 3 48 87 16,0 29,0 Μέτρια 4 66 153 22,0 51,0 Καλή 5 84 237 28,0 79,0 Πολύ καλή 6 45 282 15,0 94,0 Τέλεια 7 18 300 6,0 100,0 Σύνολο 300 100,0 29% δηλώσαν έως και Κακή (3) ενώ 51% δηλώσαν έως και Μέτρια (4) n = 300 η διάµεσος βρίσκεται µεταξύ n/2και(n+2)/1: 150 και 151 Με βάση τα Ν i, η διάµεσος βρίσκεται στην κατηγορία «Μέτρια» Μ d =Q 2 = 4
1.1. Ποιοτική µεταβλητή: Likert scale (iv) Αναζήτηση Τεταρτηµόριων Q 1 και Q 2 Ηθέσητουςεξαρτάταια ότοµέγεθοςτουδείγµατος n. Το1 ο τεταρτηµόριοq 1 είναιεκείνηητιµήτηςµεταβλητήςγιατηνο οίατο 25% των ατόµων δηλώνουν τιµή µικρότερη α ό το Q1 (ε οµένως το 75% των αρατηρήσεων βρίσκεται άνω α ό Q1). Με αρόµοιο τρό ο, ορίζεται το 3 ο τεταρτηµόριο Q3. Πρόκειται για τη τιµή της µεταβλητής για την ο οία το 75% των ατόµων δηλώνουν τιµή µικρότερη α ό το Q3 (ε οµένως το 25% των αρατηρήσεων βρίσκεται άνωα ότοq3). 9
1.1. Ποιοτική µεταβλητή: Likert scale (iv) Αναζήτηση Τεταρτηµόριων Q 1 και Q 2 Τυ ολόγιο 10
1.1. Ποιοτική µεταβλητή: Likert scale (iv) Αναζήτηση Τεταρτηµόριων Q 1 και Q 2 Αριθµός καταναλωτών: Σχετικές Ποιότητα Χi Απόλυτες συχνότητες συχνότητες προϊόντος n i N i f i F i Απαράδεκτη 1 12 12 4,0 4,0 Πολύ κακή 2 27 39 9,0 13,0 Κακή 3 48 87 16,0 29,0 Μέτρια 4 66 153 22,0 51,0 Καλή 5 84 237 28,0 79,0 Πολύ καλή 6 45 282 15,0 94,0 Τέλεια 7 18 300 6,0 100,0 Σύνολο 300 100,0 n = 300 n =n/2= 150 n ζυγός 4 η στήλη στον ίνακα Q 1 = 3 & Q 3 = 5
1.1. Ποιοτική µεταβλητή: Likert scale (v) ηµιουργία Θηκόγραµµα BOX-PLOT Α οτελείται α ό: (α) ένα ορθογώνιο κουτί η βάση του ο οίου αντιστοιχεί στο 1 ο τεταρτηµόριο και η κορυφή στο 3 ο τεταρτηµόριο: το ύψος του κουτιού = d F. (β) µέσα στο κουτί, σηµειώνεται µια κάθετος ου αντιστοιχεί στη διάµεσο. (γ) υ ολογίζουµε τους εσωτερικούς και εξωτερικούς φράχτες. Κάτω και Άνω Εσωτερικοί φράχτες: Κάτω: W 1 = Q 1 1.5 x (Q 3 -Q 1 ) = Q 1-1.5 x d F Άνω : W 3 = Q 3 +1.5 x (Q 3 -Q 1 ) = Q 1 +1.5 x d F Κάτω και Άνω Εξωτερικοί φράχτες: Κάτω: WW 1 = Q 1 3x (Q 3 -Q 1 ) = Q 1-3x d F Άνω : WW 3 = Q 3 +3x (Q 3 -Q 1 ) = Q 1 +3x d F
1.1. Ποιοτική µεταβλητή: Likert scale (v) ηµιουργία Θηκόγραµµα : Ακραίες τιµές Με βάση τις τιµές ου βρήκαµε για τη διάµεσο και τα τεταρτηµόρια, έχουµε: Q 1 = 3, Q 2 = 4, Q 3 = 5 Q 3 Q 1 = d F = 2 W 1 =Q 1-1,5.[Q 3 -Q 1 ]=Q 1-1,5.d F =3 1,5x2=0 W 3 =Q 3 +1,5.[Q 3 -Q 1 ]=Q 3 +1,5.d F =5+1,5x2=8 εδοµένου ότι: Ηελάχιστητιµήστις ροτιµήσειςτωνκαταναλωτών=1min>w 1 (=0) δεν υ άρχει ακραία τιµή Ηµέγιστητιµήστις ροτιµήσειςτωνκαταναλωτών=7max<w 3 (=8) δεν υ άρχει ακραία τιµή Έχουµε µια οµαλή κατανοµή των ροτιµήσεων. εν µ ορούµε να θεωρήσουµε ότι, ορισµένοι καταναλωτές έχουν«ακραία» γνώµη για την οιότητα του ροϊόντος.
1.2. Ποσοτική µεταβλητή: Πυκνότητα Πυκνότητα πληθυσµού ανά Περιφέρεια, 2001-2011 ΠΕΡΙΦΕΡΕΙΕΣ Ε ιφάνεια Πληθυσµός Πυκνότητα (τ.χµ.) 2001 2011 2001 2011 ΑΝΑΤ ΜΑΚΕ ΟΝΙΑ & ΘΡΑΚΗ 14.063,1 607.162 608.182 43,2 43,2 ΚΕΝΤΡΙΚΗ ΜΑΚΕ ΟΝΙΑ 18.885,0 1.876.558 1.882.108 99,4 99,7 ΥΤΙΚΗ ΜΑΚΕ ΟΝΙΑ 9.258,0 294.317 283.689 31,8 30,6 ΗΠΕΙΡΟΣ 9.084,1 336.392 336.856 37,0 37,1 ΘΕΣΣΑΛΙΑ 14.003,5 740.115 732.762 52,9 52,3 ΣΤΕΡΕΑ ΕΛΛΑΣ 15.435,0 558.144 547.390 36,2 35,5 ΙΟΝΙΟΙ ΝΗΣΟΙ 2.299,1 209.608 207.855 91,2 90,4 ΥΤΙΚΗ ΕΛΛΑ Α 11.067,0 721.541 679.796 65,2 61,4 ΠΕΛΟΠΟΝΝΗΣΟΣ 15.475,0 597.622 577.903 38,6 37,3 ΑΤΤΙΚΗ 3.805,6 3.894.573 3.828.434 1023,4 1006,0 ΒΟΡΕΙΟ ΑΙΓΑΙΟ 3.823,0 205.235 199.231 53,7 52,1 ΝΟΤΙΟΥ ΑΙΓΑΙΟΥ 5.286,0 298.462 309.015 56,5 58,5 ΚΡΗΤΗ 8.335,3 594.368 623.065 71,3 74,8 ΕΛΛΑ Α 130.819,7 10.934.097 10.816.286 83,6 82,7 608.162 = 14063,1 43,2 3.828.434 = 1006,0 3805,6 Η υκνότητα ληθυσµού δίνει τον αριθµό µονίµων κατοίκων ανά τ.χλµ. Ο συγκεκριµένος δείκτης αντανακλά το βαθµό συγκέντρωσης του ληθυσµού και α οτελεί καλή ένδειξη του βαθµού αστικο οίησης των εριοχών. Πηγή: Ελ.Στατ, Α όγραφες ληθυσµού 14
1.2. Ποσοτική µεταβλητή: Πυκνότητα Εξετάζοντας τον ίνακα, αρατηρούµε ότι, έχουµε δεδοµένα για την µεταβλητή «υκνότητα» για δυο διαφορετικά έτη. Κατά συνέ εια µ ορούµε να εξετάζουµε την µεταβλητή σε δύο διαφορετικές εριόδους ( ρακτικά σηµαίνει ότι, έχουµε 2 µεταβλητές). Α ό την ανάλυση του ίνακα, είναι φανερό ότι, η αναζήτηση της ε ικρατούσας τιµής δεν έχει νόηµα: για κάθε έτος ξεχωριστά, όλες οι Περιφέρειες έχουν διαφορετικές τιµές µεταξύ τους. Η ανάλυση των µέτρων κεντρικής τάσης εριλαµβάνει ε οµένως: (i) τον υ ολογισµό της διάµεσου (ii) τον υ ολογισµό των Τεταρτηµόριων (iii) την αραγωγή του θηκογράµµατος Για τους υ ολογισµούς, θα ρέ ει τα δεδοµένα να είναι ταξινοµηµένα µε αύξουσα σειρά. (iv) τον υ ολογισµό της µέσης τιµής για τις 13 εριφέρειες 15
1.2. Ποσοτική µεταβλητή: Πυκνότητα (i) Υ ολογισµός της διάµεσου: n=13 (µόνος) Πυκνότητα Πυκνότητα ΠΕΡΙΦΕΡΕΙΕΣ ΠΕΡΙΦΕΡΕΙΕΣ i 2001 i 2011 1 ΥΤΙΚΗ ΜΑΚΕ ΟΝΙΑ 31,8 1 ΥΤΙΚΗ ΜΑΚΕ ΟΝΙΑ 30,6 2 ΣΤΕΡΕΑ ΕΛΛΑΣ 36,2 2 ΣΤΕΡΕΑ ΕΛΛΑΣ 35,5 3 ΗΠΕΙΡΟΣ 37,0 3 ΗΠΕΙΡΟΣ 37,1 4 ΠΕΛΟΠΟΝΝΗΣΟΣ 38,6 4 ΠΕΛΟΠΟΝΝΗΣΟΣ 37,3 ΑΝΑΤ ΜΑΚΕ ΟΝΙΑ & 5 ΘΡΑΚΗ ΑΝΑΤ ΜΑΚΕ ΟΝΙΑ & 43,2 5 ΘΡΑΚΗ 43,2 6 ΘΕΣΣΑΛΙΑ 52,9 6 ΒΟΡΕΙΟ ΑΙΓΑΙΟ 52,1 7 ΒΟΡΕΙΟ ΑΙΓΑΙΟ 53,7 7 ΘΕΣΣΑΛΙΑ 52,3 8 ΝΟΤΙΟΥ ΑΙΓΑΙΟΥ 56,5 8 ΝΟΤΙΟΥ ΑΙΓΑΙΟΥ 58,5 9 ΥΤΙΚΗ ΕΛΛΑ Α 65,2 9 ΥΤΙΚΗ ΕΛΛΑ Α 61,4 10 ΚΡΗΤΗ 71,3 10 ΚΡΗΤΗ 74,8 11 ΙΟΝΙΟΙ ΝΗΣΟΙ 91,2 11 ΙΟΝΙΟΙ ΝΗΣΟΙ 90,4 ΚΕΝΤΡΙΚΗ 12ΜΑΚΕ ΟΝΙΑ ΚΕΝΤΡΙΚΗ 99,4 12 ΜΑΚΕ ΟΝΙΑ 99,7 13 ΑΤΤΙΚΗ 1023,4 13 ΑΤΤΙΚΗ 1006,0 ΕΛΛΑ Α 83,6 ΕΛΛΑ Α 82,7 Προσοχή: η κατάταξη άλλαξε µεταξύ Θεσσαλίας και Β. Αιγαίου Τυ ολόγιο: n=13 η θέση δίνεται α ό (n+1)/2 = 7 Md = 53,7 (2001) & Md = 52,3 (2011) 16
1.2. Ποσοτική µεταβλητή: Πυκνότητα (ii)υ ολογισµός των Τεταρτηµόριων: n=13 (µόνος), Πυκνότητα Πυκνότητα ΠΕΡΙΦΕΡΕΙΕΣ ΠΕΡΙΦΕΡΕΙΕΣ i 2001 i 2011 1 ΥΤΙΚΗ ΜΑΚΕ ΟΝΙΑ 31,8 1 ΥΤΙΚΗ ΜΑΚΕ ΟΝΙΑ 30,6 2 ΣΤΕΡΕΑ ΕΛΛΑΣ 36,2 2 ΣΤΕΡΕΑ ΕΛΛΑΣ 35,5 3 ΗΠΕΙΡΟΣ 37,0 3 ΗΠΕΙΡΟΣ 37,1 4 ΠΕΛΟΠΟΝΝΗΣΟΣ 38,6 4 ΠΕΛΟΠΟΝΝΗΣΟΣ 37,3 ΑΝΑΤ ΜΑΚΕ ΟΝΙΑ & 5 ΘΡΑΚΗ ΑΝΑΤ ΜΑΚΕ ΟΝΙΑ & 43,2 5 ΘΡΑΚΗ 43,2 6 ΘΕΣΣΑΛΙΑ 52,9 6 ΒΟΡΕΙΟ ΑΙΓΑΙΟ 52,1 7 ΒΟΡΕΙΟ ΑΙΓΑΙΟ 53,7 7 ΘΕΣΣΑΛΙΑ 52,3 8 ΝΟΤΙΟΥ ΑΙΓΑΙΟΥ 56,5 8 ΝΟΤΙΟΥ ΑΙΓΑΙΟΥ 58,5 9 ΥΤΙΚΗ ΕΛΛΑ Α 65,2 9 ΥΤΙΚΗ ΕΛΛΑ Α 61,4 10 ΚΡΗΤΗ 71,3 10 ΚΡΗΤΗ 74,8 11 ΙΟΝΙΟΙ ΝΗΣΟΙ 91,2 11 ΙΟΝΙΟΙ ΝΗΣΟΙ 90,4 ΚΕΝΤΡΙΚΗ 12ΜΑΚΕ ΟΝΙΑ ΚΕΝΤΡΙΚΗ 99,4 12 ΜΑΚΕ ΟΝΙΑ 99,7 13 ΑΤΤΙΚΗ 1023,4 13 ΑΤΤΙΚΗ 1006,0 ΕΛΛΑ Α 83,6 ΕΛΛΑ Α 82,7 n=13 n =(n+1)/2 n = 7 n µόνος Βλέ ε 1 η στήλη του ίνακα (Τυ ολόγιο) Θέση για Q 1 : (n +1)/2 = 4 Θέση για Q 3 : (3n +1)/2 = 11 Q 1 : (θέση i = 4) Q 1 = X 4 = 38,6 (2001) & Q 1 = X 4 = 37,3 (2011) Q 3 : (θέση i = 11) Q 3 = X 11 = 91,2 (2001) & Q 3 = X 11 = 90,7 (2011) 17
1.2. Ποσοτική µεταβλητή: Πυκνότητα (iii) Θηκογράµµατα Μέτρα 2001 2011 Min Ελάχιστη τιµή 31,8 30,6 Max Μέγιστη τιµή 1023,4 1006,0 M d ιάµεσος 53,7 52,3 Q 1 1 ο Τεταρτηµόριο 38,6 37,3 Q 3 3 ο Τεταρτηµόριο 91,2 90,7 D F Ενδοτεταρτηµοριακό διάστηµα (Q3-Q1) 52,6 53,4 W1 Κάτω Εσωτερικό φράχτη -40,3-42,8 W3 Άνω Εσωτερικό φράχτη 170,1 170,8 WW1 Κάτω Εξωτερικό φράχτη WW3 Άνω Εξωτερικό φράχτη 249,0 250,9 W1 = 0 Η υκνότητα δεν µ ορεί να έχει αρνητικές τιµές W3 < Max Πρέπει να υπολογίσουµε το WW3 18
1.2. Ποσοτική µεταβλητή: Πυκνότητα (iii) Θηκογράµµατα Η Αττική α οτελεί «άτυ η» ερί τωση, ακραία τιµή σε σχέση µε τις άλλες 12 εριφέρειες, δεδοµένου ότι, η υκνότητα της Αττικής είναι µεγαλύτερη όχι µόνο α ό τον εσωτερικό φράχτη άλλα και α ό τον εξωτερικό. 19
1.2. Ποσοτική µεταβλητή: Πυκνότητα (iv) Μέση τιµή, αριθµητικός µέσος Όταν τα δεδοµένα είναι ατοµικά, η µέση τιµή (αριθµητικός µέσος) δίνεται από: µ 2001: 2011: n i= = 1 n µ = X i 1700,4 13 = 130,8 1678,9 µ = = 129,1 13 Ο αριθµητικός µέσος του δείκτη είναι ολύ διαφορετικός α ό την ραγµατική υκνότητα της χώρας! ΠΕΡΙΦΕΡΕΙΕΣ Πυκνότητα 2001 2011 ΑΝΑΤ ΜΑΚΕ ΟΝΙΑ & ΘΡΑΚΗ 43,2 43,2 ΚΕΝΤΡΙΚΗ ΜΑΚΕ ΟΝΙΑ 99,4 99,7 ΥΤΙΚΗ ΜΑΚΕ ΟΝΙΑ 31,8 30,6 ΗΠΕΙΡΟΣ 37,0 37,1 ΘΕΣΣΑΛΙΑ 52,9 52,3 ΣΤΕΡΕΑ ΕΛΛΑΣ 36,2 35,5 ΙΟΝΙΟΙ ΝΗΣΟΙ 91,2 90,4 ΥΤΙΚΗ ΕΛΛΑ Α 65,2 61,4 ΠΕΛΟΠΟΝΝΗΣΟΣ 38,6 37,3 ΑΤΤΙΚΗ 1023,4 1006,0 ΒΟΡΕΙΟ ΑΙΓΑΙΟ 53,7 52,1 ΝΟΤΙΟΥ ΑΙΓΑΙΟΥ 56,5 58,5 ΚΡΗΤΗ 71,3 74,8 ΣΥΝΟΛΟ 1700,4 1678,9 Η πραγματική πυκνότητα σε επίπεδο Ελλάδας = 83,6 (2001) & 82,7 (2011) 20