Περιγραφική Στατιστική Κώστας Γλυκός Ασκήσεις για ΑΕΙ και ΤΕΙ σε Περιγραφική Στατιστική τεχνικές 3 ασκήσεις Ι δ ι α ί τ ε ρ α μ α θ ή μ α τ α 6 9 7. 3 0 0. 8 8. 8 8 Kglykos.gr 3 / 0 / 0 6 εκδόσεις Καλό πήξιμο
τηλ. Οικίας : 0-60.78 κινητό : 697-300.88.88 Τα πάντα για την Περιγραφική Στατ. Αριθμός κλάσεων : τύπος Sturges k 3.3log το οποίο στρογγυλοποιείται προς τα άνω Εύρος d x x Συμμετρική κατανομή : Σε ιστόγραμμα αν φέρεις κάθετη στο κέντρο γραμμή τα δύο χωρισμένα κομμάτια είναι ακριβώς τα ίδια σε μορφή και μέγεθος.σε πίνακα όλα τα v είναι συμμετρικά ως προς τη μεσαία max κλάση m x Αριθμητικός μέσος : x f Σταθμικός μέσος : x Γεωμετρικός μέσος :... G x x ή G x f... x f f l x όπου με χρήση λογαρίθμων l G Αρμονικός μέσος : h f x Πλεονεκτήματα Μειονεκτήματα Χρησιμοποιούνται όλες οι τιμές Επηρεάζεται πολύ από τις ακραίες τιμές Είναι μοναδική Μπορεί να μην αντιστοιχεί σε δυνατή τιμή Εύκολα κατανοητή Δεν υπολογίζεται σε ποιοτικές μεταβλητές Εύκολο να υπολογισθεί Δύσκολα υπολογίζεται σε κλάσεις με ανοικτά άκρα Αξιοποιήσιμη στη στατιστική Διάμεσος : Μ ή Q, M θέση ενώ σε κλάσεις M L F f ταξινομεί όλες τις τιμές σε αύξουσα σειρά και βρίσκεις τη μεσαία τιμή
τηλ. Οικίας : 0-60.78 κινητό : 697-300.88.88 Πλεονεκτήματα Μειονεκτήματα Δεν επηρεάζεται από άκρα Δε χρησιμοποιεί όλες τις τιμές Είναι μοναδική Δύσκολα αξιοποιείται στη στατιστική Εύκολα κατανοητή Εύκολο να υπολογισθεί Υπολογίζεται αν οι ακραίες κλάσεις είναι ανοικτές ο τεταρτημόριο : Q θέση ενώ σε κλάσεις : Q L F 4 f 4 Εκατοστημόρια : η αντίστοιχη τιμή που αφήνει το 5% των τιμών αριστερά και το 75% δεξιά 3( ) 3 ο 3 τεταρτημόριο : Q3 θέση ενώ σε κλάσεις : Q3 L F 4 f 4 Δεκατημόρια : η αντίστοιχη τιμή αφήνει το 75% των τιμών αριστερά και 5% δεξιά Q Q Ημίενδοτεταρτημοριακό εύρος : dq Ενδοτεταρτημοριακό εύρος : QD Q3 Q D k 3 k θέση ενώ σε κλάσεις : Dk L k F 0 f 0 η αντίστοιχη τιμή αφήνει το κ*0% των τιμών αριστερά και 00-κ*0% δεξιά Pk k θέση ενώ σε κλάσεις : Pk L k F 00 f 00 η αντίστοιχη τιμή αφήνει το κ% των τιμών αριστερά και 00-κ% δεξιά Επικρατούσα : το x με το μεγαλύτερο f, ενώ σε κλάσεις : M L f f f f o,, Πλεονεκτήματα Μειονεκτήματα Εύκολο να υπολογισθεί Δε χρησιμοποιεί όλες τις τιμές Εύκολα κατανοητή Δε δίνει απαραίτητα λύση ή μία λύση Υπολογίζεται και από ελλιπή δεδομένα Δύσκολα αξιοποιείται στη στατιστική Δεν επηρεάζεται από ακραίες τιμές Υπολογίζεται σε ποιοτικές μεταβλητές Το νου σου : Υπολογισμός θέσης : σε κάποια ΑΕΙ το αποτέλεσμα 4, στρογγυλοποιείται σε 4 η θέση, το 4,8 γίνεται 5 η θέση ενώ το 4,5 γίνεται 4 5. Αυστηρά μαθηματικά το 4, θα έπρεπε να υπολογίζεται ως ο αριθμός που βρίσκεται στην 4 0.* 5 4 θέση
τηλ. Οικίας : 0-60.78 κινητό : 697-300.88.88 Υπολογισμός θέσης σε κλάσεις : η κλάση στην οποία αντιστοιχεί η θέση που ψάχνεις σε κάθε περίπτωση. L το αριστερό άκρο της κλάσης. το πλάτος της κλάσης. κλάσης. F αθροιστική συχνότητα της κλάσης f η συχνότητα της Σχετική θέση μέσης τιμής, κορυφής και διαμέσου Συμμετρική κατανομή τότε : x Αρνητική ασυμμετρία : x Θετική ασυμμετρία : x Εύρος (rage) Ορίζεται η διαφορά της μικρότερης από τη μεγαλύτερη παρατήρηση Πλεονεκτήματα Μειονεκτήματα Εύκολο να υπολογισθεί Δε χρησιμοποιεί όλες τις τιμές Χρησιμοποιείται αρκετά σε έλεγχο ποιότητας Δε θεωρείται αξιόπιστο μέτρο βασίζεται μόνο στα άκρα Υπολογίζεται για την εκτίμηση τυπικής απόκλισης Δύσκολα αξιοποιείται στη στατιστική Δεν επηρεάζεται από ακραίες τιμές Υπολογίζεται σε ποιοτικές μεταβλητές Τυπική αποκλιση(stadard devato) & Διασπορά(varace) ά : S ά : S x x ό x x ί Προσοχή: για τον υπολογισμό της τυπικής απόκλισης σε πληθυσμό, ο τύπος είναι ίδιος και το μόνο που αλλάζει είναι ότι διαιρώ με το πλήθος και όχι με το - Η τυπική απόκλιση δείχνει πόσο μακριά από τη μέση τιμή βρίσκονται οι παρατηρήσεις. Οπότε όσο πιο μικρή η τιμή της τόσο πιο κοντά οι τιμές στη μέση τιμη (δε διασκορπίζονται) 3
τηλ. Οικίας : 0-60.78 κινητό : 697-300.88.88 Πλεονεκτήματα διασποράς Μειονεκτήματα διασποράς Χρησιμοποιεί όλες τις τιμές Δύσκολος υπολογισμός Αξιοποιείται στη στατιστική Δεν εκφράζεται στις ίδιες μονάδες με μεταβλητή Υπολογίζει διαστήματα στα οποία βρίσκεται γνωστό ποσοστό παρατηρήσεων Πλεονεκτήματα τυπικής απόκλισης Μειονεκτήματα τυπικής απόκλισης Χρησιμοποιεί όλες τις τιμές Δύσκολος υπολογισμός Αξιοποιείται στη στατιστική Υπολογίζει διαστήματα στα οποία βρίσκεται γνωστό ποσοστό παρατηρήσεων Συντελεστή μεταβολής S CV 00% x Εκφράζει την τυπική απόκλιση των παρατηρήσεων ως ποσοστό της μέσης τιμής τους. Όσο μικρότερο CV μεταξύ δειγμάτων τόσο μεγαλύτερη ομοιογένεια επιτυγχάνεται. Αν CV 0% έ Συντελεστής ασυμμετρίας : Συντελεστής κύρτωσης : Ροπές περί την αρχή : Ροπές περί το μέσο : 3 b 3. k k x f mk x Αν το αποτέλεσμα =0 τότε κανονική κατανομή, αν >0 τότε κατανομή ουρά προς τα δεξιά, αν <0 τότε ουρά προς τα αριστερά. 4 b 4 Αν το αποτέλεσμα =3 μεσόκυρτη, >3 λεπτόκυρτη, <3 πλατύκυρτη k Οι καμπύλες συχνοτήτων ανάλογα με το βαθμό συγκέντρωσης των παρατηρήσεων στο μέσο και στα άκρα της κατανομής διακρίνονται σε : μεσόκυρτες, λεπτόκυρτες, πλατύκυρτες x M o Δείκτης ασυμμετρίας Pearso ως προς επικρατούσα και διάμεσο : S M S M p o p 3 x M 4
τηλ. Οικίας : 0-60.78 κινητό : 697-300.88.88 Δείκτης ασυμμετρίας Bowley : S b Q3 Q M Q Q 3 Στη συμμετρική κατανομή Q Q, 6,, Q M x R Q Q Q 3 3 3 Θηκόγραμμα Σχεδιάζω ένα ευθύγραμμο τμήμα με άκρα την ελάχιστη και μέγιστη παρατήρηση και πάνω στο τμήμα τοποποθετώ Q, Q 3,. Σχεδιάζω ένα ορθογώνιο, όπου η κάτω βάση του ορθογωνίου βρίσκεται στο Q και η πάνω βάση στο Q 3.Στη διάμεσο φέρνω τμήμα παράλληλο στις βάσεις. Καμπύλη Lorez συντελεστής G : Δημιουργώ πίνακα και σχεδιάζω σε οριζόντιο άξονα το F % στον κατακόρυφο άξονα το Αθροιστικό ποσοστό. Το εμβαδό που περικλείεται από την διχοτόμο πρώτου τεταρτημορίου και της καμπύλης E g. Όσο πιο μικρό το εμβαδό τόσο πιο κοντά είναι η καμπύλη στην ευθεία ισοκατανομής. Ο συντελεστής G : g N F F N x κέντρο x f F f % % F f x f x % Αθρποσοστό N F ενώ N 60 40-80 00 00 50 50 000 34% 34% 00 40000 00 80-0 0 30 30 80 000 34% 68% 80 5600 40 0-60 80 400 0 00 00 3% 00% 0 0 Σύνολο Ν=400 00 3500 65600 F F ΑΣΚΗΣΕΙΣ. Δίνονται οι τιμές :,3,,4,,3,6. Να υπολογίσεις αριθμητικό μέσο, διάμεσο, ο τεταρτημόριο, 3 ο τεταρτημόριο, 7 ο δεκατημόριο, 69 ο εκατοστημόριο, ημιενδοτεταρτημοριακό εύρος, επικρατούσα, εύρος, 5
τηλ. Οικίας : 0-60.78 κινητό : 697-300.88.88 διασπορά, τυπική απόκλιση, συντελεστή μεταβλητότητας, η ροπή περί την αρχή, η ροπή περί το μέσο, ο και ο συντελεστή Pearso, ο και ο συντελεστή Fsher. Να υπολογίσεις τα παραπάνω όταν δίνεται ο πίνακας : χι νι 3 5 3 7 9 3. Να υπολογίσεις τα ζητούμενα της άσκησης όταν δίνεται ο πίνακας : 4. Να βρεις M, Q, Q3, M o των τιμών 0,30,70,90,40,60,40,00 5. Δίνεται η κατανομή των εβδομαδιαίων δαπανών, να βρεις M, Q, Q3, M o, x : Δαπάνες Αριθμός Νοικοκυριών 4-6 6-8 8-0 7 0-6. Σε συμμετρική κατανομή με x 6, 3, Q3 8, να βρεις το ποσοστό των τιμών μεταξύ 3 και 8 χι νι -4 4 4-7 6 7-0 6 0-3 4 7. Δίνονται οι τιμές -,7,0,5,-,7, να βρεις x, M,, V, M, M, S 8. Σε συμμετρική κατανομή με x 00, Q 96, να βρεις το ποσοστό των εργαζομένων από 06 μέχρι 9. Σε μία κατανομή μισθών με x M βρεις το ποσοστό με μισθό άνω των 00 o p 80, 80.5, 400, ν.δ.ο. μπορεί να θεωρηθεί συμμετρική και να 5000, 6400, 3 300, να 0. Από την κατανομή 00 προιόντων με f x k f k k x x f x x βρεις την ασυμμετρία της κατανομής. Να βρεις συντελεστή ασυμμετρίας κατά Pearso(με διάμεσο) έκταση Αριθμός 0-30 85 30-50 0 50-70 5 σύνολο 00 Δαπάνες Αρ. νοικοκυριών 5-5 4 5-5 0 5-35 4 6
τηλ. Οικίας : 0-60.78 κινητό : 697-300.88.88 35-45. Να βρεις συντελεστή ασυμμετρίας κατά Pearso&Bowley 3. Να βρεις την καμπύλη Lorez των μισθών και συντελεστή G 4. Μισθοί Αριθμός υπαλλήλων 40-80 00 80-0 60 0-60 40 7
τηλ. Οικίας : 0-60.78 κινητό : 697-300.88.88 8