ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 06 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 206-207
2. Διερευνητική Ανάλυση Μέτρα Θέσης Μέτρα Διασποράς Ασυμμετρία 2
Χωρικές ανισότητες: Απλός συντελεστής μεταβλητότητας (CV) έναντι Σταθμισμένος συντελεστής μεταβλητότητας (wcv) 3
ΣΥΝΤΕΛΕΣΤΕΣ ΜΕΤΑΒΛΗΤΟΤΗΤΑΣ: ΧΩΡΙΚΕΣ ΑΝΙΣΟΤΗΤΕΣ Ο απλός συντελεστής μεταβλητότητας αποτελεί το ο δείκτη μέτρησης των χωρικών ανισοτήτων, όμως δίνει σε κάθε χωρική ενότητα, το ίδιο βάρος (/). s CV 2 2 ) ( ) ( Δεν λαμβάνει υπόψη ότι, συχνά οι εξεταζόμενες χωρικές ενότητες δεν έχουν το ίδιο μέγεθος και επομένως την ίδια βαρύτητα. Σε αυτή την περίπτωση, είναι προτιμότερο να χρησιμοποιούμε εναλλακτικό συντελεστή μεταβλητότητας (σταθμισμένο). w wcv 2 ) ( Όπου το βάρος κάθε χωρικής ενότητας δίνεται από: P P w P = Πληθυσμός της χωρικής ενότητας P. = Πληθυσμός όλων των χωρικών ενοτήτων 4
ΧΩΡΙΚΕΣ ΑΝΙΣΟΤΗΤΕΣ : ΠΑΡΑΔΕΙΓΜΑ Οι δαπάνες στην έρευνα στα Πανεπιστήμια (ως % του ΑΕΠ) για 8 χώρες της Νότιας Ευρώπης δίνονται στον ακόλουθο πίνακα. ΧΩΡΕΣ Πληθυσμός Δαπάνες w (σε χιλιάδες ) στην έρευνα Βουλγαρία 7.78 0,05 0,05 2 Ελλάδα.056 0,072 0,27 3 Ισπανία 42.922 0,28 0,3 4 Ιταλία 57.685 0,378 0,36 5 Κύπρος 728 0,005 0,3 6 Μάλτα 40 0,003 0,6 7 Πορτογαλία 0.484 0,069 0,27 8 Ρουμανία 2.452 0,4 0,04 Σύνολο 52.509,000 w w P 49.922 52.509 3 3 P P Μεταβλητή προς διερεύνηση 40 52.509 6 6 P 0,28(28%) 0,003(0,3%) Υπό-σύνολο της Ε.Ε. (Δείγμα) Πρέπει να υπολογίσετε τους δύο συντελεστές μεταβλητότητας για την μεταβλητή «Δαπάνες στην έρευνα». Ποια τα συμπεράσματα σας; 5
ΧΩΡΙΚΕΣ ΑΝΙΣΟΤΗΤΕΣ : ΠΑΡΑΔΕΙΓΜΑ Προετοιμασία του Πίνακα Υπολογισμού ΧΩΡΕΣ Πληθυσμός (σε χιλιάδες ) w Δαπάνες στην έρευνα?? Βουλγαρία 7.78 0,05 0,05 2 Ελλάδα.056 0,072 0,27 3 Ισπανία 42.922 0,28 0,3 4 Ιταλία 57.685 0,378 0,36 5 Κύπρος 728 0,005 0,3 6 Μάλτα 40 0,003 0,6 7 Πορτογαλία 0.484 0,069 0,27 8 Ρουμανία 2.452 0,4 0,04 Σύνολο 52.509,000??? 6
ΧΩΡΙΚΕΣ ΑΝΙΣΟΤΗΤΕΣ : ΠΑΡΑΔΕΙΓΜΑ 7
2. Διερευνητική Ανάλυση Μέτρα Θέσης Μέτρα Διασποράς Ασυμμετρία 8
2.δ. Διερευνητική Ανάλυση Μέτρα Ασυμμετρίας 9
4. ΑΣΥΜΜΕΤΡΙΑ ΤΗΣ ΚΑΤΑΝΟΜΗΣ [/4] Τα μέτρα ασυμμετρίας μας επιτρέπουν να εξετάζουμε: (α) κατά πόσο η κατανομή συχνοτήτων είναι συμμετρική ή ασύμμετρη και, (β) όταν δεν είναι συμμετρική, να διερευνήσουμε εάν το μεγαλύτερο μέρος της κατανομής βρίσκεται προς τα δεξιά ή προς τα αριστερά. Στόχος: να εξετάζουμε σε ποιο βαθμό, η κατανομή προσεγγίζει την Κανονική Κατανομή. Αν η κατανομή του πληθυσμού που εξετάζουμε είναι συμμετρική, τότε η μέση τιμή, η διάμεσος και η κορυφή της κατανομής συμπίπτουν. Δύο είναι οι βασικοί συντελεστές: 3 = Συντελεστής Λοξότητας (coeffcet of Skewess) 4 = Συντελεστής Κύρτωσης (coeffcet of Kurtoss) Τύπος κορυφής 0
3 Οι συντελεστές αυτοί ορίζονται με τη βοήθεια των κεντρικών ροπών τάξης r που υπολογίζονται ως εξής: ή ακόμα Παρατηρούμε ότι, m = 0 και m 2 = s 2 = Συντελεστής Λοξότητας (coeffcet of Skewess) = = Συντελεστής Κύρτωσης (coeffcet of Kurtoss) = r r x x m ) ( k r r x x m ) ( 4 3 3 3 s m 4 4 4 s m 4. ΑΣΥΜΜΕΤΡΙΑ ΤΗΣ ΚΑΤΑΝΟΜΗΣ [2/4]
4. ΑΣΥΜΜΕΤΡΙΑ ΤΗΣ ΚΑΤΑΝΟΜΗΣ [3/4] M o < M d < M o > M d > Οι περισσότερες παρατηρήσεις βρίσκονται δεξιά της κορυφής Οι περισσότερες παρατηρήσεις βρίσκονται αριστερά της κορυφής 2
4. ΑΣΥΜΜΕΤΡΙΑ ΤΗΣ ΚΑΤΑΝΟΜΗΣ [4/4] 3
ΑΝΑΛΥΣΗ ΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ ΑΣΚΗΣΗ 4
Ζητήσαμε σε 70 καταναλωτές να αξιολογούν την ποιότητα τριών διαφορετικών προϊόντων, χρησιμοποιώντας μια κλίμακα από = ιδιαίτερα κακή ποιότητα έως 7 = ιδιαίτερα καλή ποιότητα. Τα αποτελέσματα της έρευνας συνοψίζονται στον ακόλουθο πίνακα. Σύνολο απαντήσεων ανά προϊόν Ποιότητα Προϊόντος Προϊόν Προϊόν 2 Προϊόν 3 5 8 25 2 0 22 43 3 40 30 37 4 70 36 32 5 35 30 26 6 8 20 5 7 2 4 2. Να εξετάζετε σε ποιο βαθμό η κατανομή για το καθένα από τα 3 προϊόντα είναι συμμετρική ή ασύμμετρη; 2. Να γίνει γραφική αναπαράσταση. 3. Ποια τα συμπεράσματα σας; Σύνολο απαντήσεων 70 70 70 5
ΥΠΟΛΟΓΙΣΜΟΣ ΤΩΝ ΠΑΡΑΜΕΤΡΩΝ ΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ ΓΙΑ ΤΟ Ο ΠΡΟΙΟΝ Προετοιμασία του Πίνακα Υπολογισμού Ποιότητα Προϊόντος 5 2 0 3 40 4 70 5 35 6 8 7 2 Προϊόν???? Σύνολο 70???? m r k ( x = 70 = 5 2 = 0 7 = 2 k 7 x) 70 r 6
ΥΠΟΛΟΓΙΣΜΟΣ ΤΩΝ ΠΑΡΑΜΕΤΡΩΝ ΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ ΓΙΑ ΤΟ Ο ΠΡΟΙΟΝ Ποιότητα Προϊόντος Προϊόν 2 3 ( ) ( ) ( ) 4 5 5 4,88-2,20 350,78 2 0 20 35,88-67,95 28,7 3 40 20 3,98-28,59 25,56 4 70 280 0,78 0,08 0,0 5 35 75 42,80 47,34 52,35 6 8 48 35,48 74,7 57,34 7 2 4 9,29 59,92 86, Σύνολο 70 662 208,09-35,70 900,86 662 3,89 s 2 70 208,09,224 s,06 CV 70,06 0,287 (28,7%) 3,89 35,70 3 3 m3 0,20 m3 0,20 s,06,353 3 0,55 0 3 70 s,353 900,86 4 4 m4 5,299 m4 5,299 s,06,498 4 3,537 3 4 70 s,498 Περιορισμένη μεταβλητότητα Πολύ μικρή αρνητική λοξότητα Λεπτόκυρτη 7
ΓΡΑΦΙΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ ΤΗΣ ΚΑΤΑΝΟΜΗΣ ΓΙΑ ΤΟ Ο ΠΡΟΙΟΝ Η κατανομή είναι πραγματικά Λεπτόκυρτη ενώ υπάρχει ελαχίστη ασυμμετρία. Ποιότητα f (%) 5 2,9% 2 0 5,9% 3 40 23,5% 4 70 4,2% 5 35 20,6% 6 8 4,7% 7 2,2% Σύνολο 70 00,0% 8
ΑΝΑΛΥΣΗ ΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ ΓΙΑ ΤΟ 2 Ο ΚΑΙ 3 Ο ΠΡΟΙΟΝ Όπως και για το ο προϊόν, η ανάλυση της ασυμμετρίας βασίζεται στον υπολογισμό των συντελεστών α 3 και α 4. Σύμφωνα με τον ορισμό αυτών των συντελεστών, έχουμε τα ακόλουθα αποτελέσματα: 7 7 7 7 ( ( ( ) ) ) 3 4 2 2 ο Προϊόν 3 ο Προϊόν 664 524 54,49 354,85 2,4 72,24 3304,70 736,82 Με βάση τα ενδιάμεσα αποτελέσματα όπως προκύπτουν στο Πίνακα, ποια τα συμπεράσματα σχετικά με την ασυμμετρία των απαντήσεων των καταναλωτών για το 2 ο και 3 ο προϊόν; (*) =70 > 20 μεγάλο δείγμα 9
ΑΝΑΛΥΣΗ ΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ ΓΙΑ ΤΟ 2 Ο ΚΑΙ 3 Ο ΠΡΟΙΟΝ 7 7 7 7 ( ( ( ) ) ) 3 4 2 2 ο Προϊόν 3 ο Προϊόν 664 524 54,49 354,85 2,4 72,24 3304,70 736,82 664/70 = 3,9 524/70=3, s 2 (*) 54,49/70 =3,02 354,85/70=2,09 s,74,45 m 3 2,4/70=0,3 72,24/70=,0 a 3 0,3/(,74) 3 = 0,025,0/(,45) 3 = 0,33 m 4 3304,7/70=9,44 736,82/70=0,22 a 4 9,44/(3,02) 2 = 2,3 0,22/(2,09) 2 = 2,34 Συμπεράσματα: (*) =70 > 20 μεγάλο δείγμα 20
ΑΣΚΗΣΗ ΓΡΑΦΙΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ ΤΗΣ ΚΑΤΑΝΟΜΗΣ ΓΙΑ ΤΟ 2 Ο ΚΑΙ 3 ο ΠΡΟΙΟΝ α 3 = 0,025 0 συμμετρική α 4 = 2,3 < 3 πλατύκυρτη α 3 = 0,33 > 0 ασυμμετρική α 4 = 2,3 < 3 πλατύκυρτη Προσοχή: τα διαγράμματα πρέπει να έχουν την ίδια κλίμακα στον κάθετο άξονα για να γίνει σωστή σύγκριση 2