Κεφάλαιο Ένα Τι είναι η Στατιστική; Copyright 2009 Cengage Learning 1.1
Τι είναι η Στατιστική; «Στατιστική είναι ένας τρόπος για την αναζήτηση πληροφοριών μέσα σε δεδομένα» Copyright 2009 Cengage Learning 1.2
Τι είναι η Στατιστική; «Στατιστική είναι ένας τρόπος για την αναζήτηση πληροφοριών μέσα σε δεδομένα» Στατιστική Δεδομένα Πληροφορίες Η στατιστική είναι ένα εργαλείο για τη δημιουργία νέας κατανόησης από μια ομάδα αριθμών. Definitions: Oxford English Dictionary Copyright 2009 Cengage Learning 1.3
Παράδειγμα 2.6 Το Άγχος της Στατιστικής Ένας φοιτητής διοίκησης επιχειρήσεων παρακολουθεί τα πρώτα του μαθήματα στο προαπαιτούμενο μάθημα της στατιστικής. Ο φοιτητής είναι κάπως ανήσυχος επειδή πιστεύει στο μύθο ότι η στατιστική είναι δύσκολη. Για να διασκεδάσει τους φόβους του ο φοιτητής ρωτά τον καθηγητή για τους βαθμούς του προηγούμενου έτους. Ο καθηγητής είναι φιλικός και πρόθυμος να βοηθήσει και δίνει αμέσως στο φοιτητή μια κατάσταση με όλους τους βαθμούς των εργασιών και των τελικών εξετάσεων του προηγούμενου έτους. Ποιες πληροφορίες μπορεί να εξάγει ο φοιτητής από αυτή την κατάσταση; Copyright 2009 Cengage Learning 1.4
Παράδειγμα 2.6 Το Άγχος της Στατιστικής 65 81 72 59 71 53 85 66 66 70 72 71 79 76 77 68 65 73 64 72 82 73 77 75 80 85 89 74 86 83 87 77 67 80 78 69 64 67 79 60 62 78 59 92 74 68 63 69 67 67 84 69 72 62 74 73 68 83 74 65 Copyright 2009 Cengage Learning 1.5
Παράδειγμα 2.6 Το Άγχος της Στατιστικής «Τυπικός βαθμός» Μέσος (βαθμός κατά μέσο όρο) Διάμεσος (βαθμός έτσι ώστε 50% μεγαλύτεροι και 50% μικρότεροι) Μέσος = 72.67 Διάμεσος = 72 Είναι αυτές οι πληροφορίες αρκετές; Copyright 2009 Cengage Learning 1.6
Παράδειγμα 2.6 Το Άγχος της Στατιστικής Είναι οι περισσότεροι βαθμοί συγκεντρωμένοι γύρω από τον μέσο βαθμό ή είναι διασκορπισμένοι; Εύρος = Μέγιστο ελάχιστο = 92-53 = 39 Διασπορά Τυπική απόκλιση Copyright 2009 Cengage Learning 1.7
Παράδειγμα 2.6 Το Άγχος της Στατιστικής Υπάρχουν πολλοί βαθμοί κάτω από το 60 ή πάνω από το 80; Ένα γράφημα ιστόγραμμα μπορεί να μας δώσει αυτή την πληροφορία καθώς και άλλες. Copyright 2009 Cengage Learning 1.8
Παράδειγμα 2.6 Το Άγχος της Στατιστικής Histogram Frequency 30 20 10 0 50 60 70 80 90 100 Marks Copyright 2009 Cengage Learning 1.9
Περιγραφική Στατιστική Η περιγραφική στατιστική ασχολείται με τις μεθόδους οργάνωσης, σύνοψης, και παρουσίασης των δεδομένων με τρόπο εύχρηστο και κατανοητό. Μια μορφή περιγραφικής στατιστικής χρησιμοποιεί γραφήματα που επιτρέπουν στους στατιστικούς να παρουσιάζουν στοιχεία με τρόπους που διευκολύνουν τον αναγνώστη να εξάγει χρήσιμες πληροφορίες. Στο κεφάλαιο 2 θα γνωρίσουμε μια μεγάλη ποικιλία γραφημάτων. Copyright 2009 Cengage Learning 1.10
Περιγραφική Στατιστική Μια άλλη μορφή περιγραφικής στατιστικής χρησιμοποιεί αριθμητικές τεχνικές για να συνοψίσει δεδομένα. Ο μέσος και η διάμεσος είναι δημοφιλείς αριθμητικές τεχνικές που περιγράφουν τη θέση των δεδομένων. Το εύρος, η διασπορά και η τυπική απόκλιση μετρούν τη μεταβλητότητα των δεδομένων. Στο κεφάλαιο 4 εισάγουμε πολλές αριθμητικές στατιστικές μετρήσεις που περιγράφουν διαφορετικά χαρακτηριστικά των δεδομένων. Copyright 2009 Cengage Learning 1.11
Συμφωνία Αποκλειστικής Διάθεσης της Pepsi Ένα μεγάλο πανεπιστήμιο με συνολικά 50,000 εγγεγραμμένους φοιτητές προσέφερε στην Pepsi-Cola μια συμφωνία αποκλειστικής διάθεσης που θα παρείχε στην Pepsi αποκλειστικά δικαιώματα πώλησης των προϊόντων της σε όλες τις εγκαταστάσεις του πανεπιστημίου για το επόμενο έτος και με δυνατότητα ανανέωσης της συμφωνίας για περαιτέρω έτη. Σε αντάλλαγμα, το πανεπιστήμιο θα εισέπραττε το 35% των εσόδων και ένα εφάπαξ ποσό $200,000 ανά έτος. Στην Pepsi δόθηκε χρόνος 2 εβδομάδων για να απαντήσει. Copyright 2009 Cengage Learning 1.12
Συμφωνία Αποκλειστικής Διάθεσης της Pepsi Οι πωλήσεις των αναψυκτικών υπολογίζονται σε μεταλλικά κουτιά των 330 ml. Οι τρέχουσες πωλήσεις της Pepsi είναι κατά μέσο όρο 22,000 κουτιά ανά εβδομάδα (υπολογίζοντας το ακαδημαϊκό έτος σε 40 εβδομάδες). Τα κουτιά πωλούνται κατά μέσο όρο 75 σεντς το ένα. Το κόστος παραγωγής συμπεριλαμβανομένης της εργασίας ανέρχεται σε 20 σεντς ανά κουτί. Η Pepsi δεν είναι βέβαιη για το μερίδιό της στην αγορά αλλά υπολογίζει ότι είναι μικρότερο του 50%. Copyright 2009 Cengage Learning 1.13
Συμφωνία Αποκλειστικής Διάθεσης της Pepsi Μια γρήγορη ανάλυση αποκαλύπτει ότι εάν το τρέχον μερίδιο αγοράς ήταν 25%, τότε, με μια συμφωνία αποκλειστικής διάθεσης, η Pepsi θα πουλούσε 88,000 (22.000 είναι το 25% των 88,000) κουτιά την εβδομάδα ή 3,520,000 κουτιά ανά έτος. Το κέρδος ή η ζημία μπορούν να υπολογιστούν. Το μόνο πρόβλημα είναι ότι δεν γνωρίζουμε πόσα αναψυκτικά πωλούνται εβδομαδιαίως στο πανεπιστήμιο. Copyright 2009 Cengage Learning 1.14
Συμφωνία Αποκλειστικής Διάθεσης της Pepsi Η Pepsi ανέθεσε σε ένα πρόσφατα τελειόφοιτο του πανεπιστημίου να κάνει μια έρευνα στους φοιτητές του πανεπιστημίου και να τις δώσει την πληροφορία που της λείπει. Κατά συνέπεια, οργανώνει μια έρευνα ζητώντας από 500 φοιτητές να παρακολουθούν τον αριθμό των αναψυκτικών που αγοράζουν στις επόμενες 7 ημέρες. Copyright 2009 Cengage Learning 1.15
Επαγωγική Στατιστική Η πληροφορία που θέλουμε να έχουμε είναι μια εκτίμηση των ετήσιων κερδών που θα προκύψουν από τη συμφωνία αποκλειστικής διάθεσης. Τα δεδομένα είναι ο αριθμός των κουτιών αναψυκτικών που καταναλώθηκαν σε 7 ημέρες από τους 500 φοιτητές του δείγματος. Θέλουμε να γνωρίζουμε τον μέσο αριθμό αναψυκτικών που καταναλώνονται και από τους 50,000 φοιτητές του πανεπιστημίου. Για να πετύχουμε αυτό το στόχο χρειαζόμαστε κι έναν άλλο κλάδο της στατιστικής την επαγωγική στατιστική. Copyright 2009 Cengage Learning 1.16
Επαγωγική Στατιστική Επαγωγική στατιστική είναι ένα σύνολο μεθόδων που χρησιμοποιούνται στην εξαγωγή συμπερασμάτων ή συναγωγών γύρω από χαρακτηριστικά πληθυσμών με βάση στοιχεία δειγμάτων. Ο πληθυσμός στην προκειμένη περίπτωση είναι η κατανάλωση αναψυκτικών των 50,000 φοιτητών του πανεπιστημίου. Το κόστος συνέντευξης εκάστου φοιτητή θα ήταν απαγορευτικό και εξαιρετικά χρονοβόρο. Οι στατιστικές τεχνικές καθιστούν περιττές τέτοιες προσπάθειες. Αντί για το σύνολο του πληθυσμού μπορούμε να χρησιμοποιήσουμε ένα πολύ μικρότερο αριθμό φοιτητών (μέγεθος δείγματος 500 φοιτητές) και να συνάγουμε από τα δεδομένα τον αριθμό των αναψυκτικών που καταναλώνονται και από τους 50,000 φοιτητές. Στη συνέχεια μπορούμε να υπολογίσουμε τα ετήσια κέρδη της Pepsi. Copyright 2009 Cengage Learning 1.17
Παράδειγμα Όταν γίνονται εκλογές, τα τηλεοπτικά δίκτυα στις Η.Π.Α. ακυρώνουν το κανονικό τους πρόγραμμα και καλύπτουν τις εκλογές. Όταν καταμετρώνται οι ψήφοι τα αποτελέσματα μεταδίδονται. Ωστόσο, σε περιπτώσεις σημαντικών εκλογών όπως για την εκλογή προέδρου ή γερουσιαστών σε μεγάλες πολιτείες, τα δίκτυα ανταγωνίζονται μεταξύ τους ποιο θα είναι το πρώτο που θα προβλέψει τον νικητή. Copyright 2009 Cengage Learning 1.18
Παράδειγμα Αυτό γίνεται μέσω των δημοσκοπήσεων εξόδου [exit polls], όπου ένα τυχαίο δείγμα ψηφοφόρων ρωτάται μετά την έξοδό τους ποιον ψήφισαν. Από τα δεδομένα υπολογίζεται το ποσοστό του δείγματος που υποστηρίζει τους υποψηφίους. Εφαρμόζεται μια στατιστική τεχνική για να προσδιορίσει εάν υπάρχουν αρκετά στοιχεία για να συμπεράνουμε ότι ο κύριος υποψήφιος θα συγκεντρώσει αρκετές ψήφους για να κερδίσει τις εκλογές. Copyright 2009 Cengage Learning 1.19
Παράδειγμα Καταγράφηκαν τα αποτελέσματα των δημοσκοπήσεων εξόδου [exit poll] στην πολιτεία της Φλόριντα κατά τις εκλογές του 2000 (μόνο οι ψήφοι του Ρεπουμπλικάνου υποψηφίου George W. Bush και του Δημοκρατικού Albert Gore). Έστω ότι είναι γνωστά τα αποτελέσματα από 765 άτομα που ψήφισαν είτε υπέρ του Bush είτε υπέρ του Gore. Οι αναλυτές των τηλεοπτικών δικτύων θέλουν να ξέρουν εάν μπορούν να καταλήξουν στο συμπέρασμα ότι ο George W. Bush θα κερδίσει την πολιτεία της Φλόριντα. Copyright 2009 Cengage Learning 1.20
Παράδειγμα Το παράδειγμα περιγράφει μια πολύ συνηθισμένη εφαρμογή στατιστικής επαγωγής. Ο πληθυσμός για τον οποίο τα τηλεοπτικά δίκτυα ήθελαν να εξάγουν συμπεράσματα είναι περίπου 5 εκατομμύρια κάτοικοι της Φλόριντα που ψήφισαν είτε υπέρ του Bush είτε υπέρ του Gore για πρόεδρο. Το δείγμα αποτελούνταν από 765 ανθρώπους τυχαία επιλεγμένους από την εταιρεία δημοσκοπήσεων, οι οποίοι ψήφισαν υπέρ είτε του ενός είτε του άλλου υποψηφίου. Copyright 2009 Cengage Learning 1.21
Το χαρακτηριστικό του πληθυσμού που θα θέλαμε να γνωρίζουμε είναι το ποσοστό του συνόλου του εκλογικού σώματος που ψήφισε υπέρ του Bush. Ειδικότερα, θα θέλαμε να γνωρίζουμε εάν περισσότερο του 50% ψήφισε υπέρ του Bush (υπολογίζοντας μόνο εκείνους που ψήφισαν υπέρ είτε του Ρεπουμπλικάνου είτε του Δημοκρατικού υποψηφίου). Copyright 2009 Cengage Learning 1.22
Παράδειγμα Επειδή δεν θα ρωτήσουμε κάθε έναν ξεχωριστά από τους 5 εκατομμύρια ψηφοφόρους τι ψήφισαν, δεν μπορούμε να προβλέψουμε το αποτέλεσμα με βεβαιότητα 100%. Ένα δείγμα που είναι μόνο ένα μικρό κλάσμα του μεγέθους του πληθυσμού μπορεί να οδηγήσει σε σωστά συμπεράσματα μόνο ένα ορισμένο ποσοστό. Θα διαπιστώσετε ότι οι επαγγελματίες της στατιστικής μπορούν να ελέγχουν αυτό το ποσοστό και συνήθως να το τοποθετούν μεταξύ 90% και 99%. Copyright 2009 Cengage Learning 1.23
Βασικές Έννοιες της Στατιστικής Πληθυσμός πληθυσμός είναι το σύνολο των στοιχείων που ενδιαφέρουν τον επαγγελματία της στατιστικής. Δείγμα συχνά πολύ μεγάλος, μερικές φορές απροσδιόριστος. Π.χ. Το σύνολο των 5 εκατομμυρίων ψηφοφόρων της Φλόριντα. Δείγμα είναι το σύνολο των δεδομένων που συλλέγονται από τον πληθυσμό. Δυνητικά πολύ μεγάλο, αλλά μικρότερο από τον πληθυσμό. Π.χ. ένα δείγμα 765 ψηφοφόρων σε δημοσκόπηση εξόδου την ημέρα των εκλογών. Copyright 2009 Cengage Learning 1.24
Βασικές Έννοιες της Στατιστικής Παράμετρος Περιγραφικό μέτρο ενός πληθυσμού. Στατιστικό μέγεθος Περιγραφικό μέτρο ενός δείγματος. Copyright 2009 Cengage Learning 1.25
Βασικές Έννοιες της Στατιστικής Πληθυσμός Δείγμα Υποσύνολο Παράμετρος Οι πληθυσμοί έχουν παραμέτρους, Στατιστικό μέγεθος Τα δείγματα έχουν στατιστικά μεγέθη. Copyright 2009 Cengage Learning 1.26
Περιγραφική Στατιστική είναι μέθοδοι οργάνωσης, σύνοψης, και παρουσίασης δεδομένων με ένα εύχρηστο και κατανοητό τρόπο. Οι μέθοδοι αυτοί περιλαμβάνουν: Γραφήματα (Κεφάλαιο 2), και Αριθμητικές Τεχνικές (Κεφάλαιο 4). Η μέθοδος που χρησιμοποιείται εξαρτάται από το ποια πληροφορία θέλουμε να εξάγουμε. Ενδιαφερόμαστε για μετρήσεις κεντρικής θέσης; ή/και μετρήσεις μεταβλητότητας (διασποράς); Η Περιγραφική Στατιστική βοηθά να απαντήσουμε σε τέτοιες ερωτήσεις.. Copyright 2009 Cengage Learning 1.27
Επαγωγική Στατιστική Η Περιγραφική Στατιστική περιγράφει το σύνολο των δεδομένων που αναλύονται, αλλά δεν μας επιτρέπει να εξάγουμε συμπεράσματα σχετικά με τα δεδομένα. Επομένως χρειαζόμαστε έναν άλλο κλάδο της στατιστικής: την επαγωγική στατιστική. Η επαγωγική στατιστική είναι επίσης ένα σύνολο μεθόδων, ωστόσο χρησιμοποιείται στην εξαγωγή συμπερασμάτων ή συναγωγών γύρω από χαρακτηριστικά πληθυσμών με βάση τα δεδομένα ενός δείγματος. Copyright 2009 Cengage Learning 1.28
Στατιστική Επαγωγή Στατιστική επαγωγή είναι η διαδικασία της εκτίμησης ή πρόβλεψης μιας παραμέτρου του πληθυσμού με βάση τα δεδομένα ενός δείγματος. Πληθυσμός Δείγμα Επαγωγή Παράμετρος Στατιστικό Τι μπορούμε να συνάγουμε για τις Παραμέτρους ενός Πληθυσμού με βάση τη Στατιστική Ανάλυση ενός Δείγματος; Copyright 2009 Cengage Learning 1.29
Στατιστική Επαγωγή Χρησιμοποιούμε τη στατιστική για να εξάγουμε επαγωγές γύρω από παραμέτρους. Ως εκ τούτου, μπορούμε να κάνουμε μια εκτίμηση, πρόβλεψη, ή να λάβουμε μια απόφαση γύρω από ένα πληθυσμό βασιζόμενοι σε δεδομένα ενός δείγματος. Επομένως, ό,τι γνωρίζουμε για ένα δείγμα μπορούμε να το εφαρμόσουμε στον μεγαλύτερο πληθυσμό από τον οποίο αυτό έχει εξαχθεί! Copyright 2009 Cengage Learning 1.30
Στατιστική Επαγωγή Σκεπτικό: Οι μεγάλοι πληθυσμοί καθιστούν την έρευνα κάθε μέλους ανέφικτη και δαπανηρή. Είναι ευκολότερο και φθηνότερο να λάβει κάποιος ένα δείγμα και να κάνει εκτιμήσεις για τον πληθυσμό από το δείγμα. Ωστόσο: Τα συμπεράσματα και οι εκτιμήσεις αυτές δεν είναι πάντα ακριβείς. Για το λόγο αυτό ενσωματώνουμε στη στατιστική επαγωγή «μέτρα αξιοπιστίας», δηλαδή τη στάθμη εμπιστοσύνης και τη στάθμη σημαντικότητας. Copyright 2009 Cengage Learning 1.31
Στάθμη Εμπιστοσύνης και Στάθμη Σημαντικότητας Στάθμη εμπιστοσύνης είναι το ποσοστό επιβεβαίωσης των προβλέψεων στην πράξη. Π.χ.. στάθμη εμπιστοσύνης 95% σημαίνει ότι, εκτιμήσεις που βασίζονται σε αυτή τη μορφή στατιστικής επαγωγής θα δώσουν 95% το σωστό αποτέλεσμα. Όταν στόχος της στατιστικής επαγωγής είναι να εξάγει κάποιο συμπέρασμα για ένα πληθυσμό, η στάθμη σημαντικότητας μετρά τη συχνότητα που το συμπέρασμα θα αποδειχθεί λανθασμένο μακροπρόθεσμα. Π.χ.. Στάθμη σημαντικότητας 5% σημαίνει ότι, μακροπρόθεσμα, το 5% των εκτιμήσεων θα αποδειχθούν λανθασμένες. Copyright 2009 Cengage Learning 1.32
Στάθμη Εμπιστοσύνης και Στάθμη Σημαντικότητας Εάν χρησιμοποιήσουμε το α (το ελληνικό γράμμα «άλφα») για να συμβολίσουμε τη σημαντικότητα, τότε η στάθμη εμπιστοσύνης είναι 1 - α. Η σχέση αυτή μπορεί να διατυπωθεί και ως εξής: Στάθμη Εμπιστοσύνης + Στάθμη Σημαντικότητας = 1 Copyright 2009 Cengage Learning 1.33
Στάθμη Εμπιστοσύνης και Στάθμη Σημαντικότητας Πάρτε για παράδειγμα μια δήλωση από στοιχεία δημοσκόπησης που ίσως ακούσετε στις ειδήσεις: «Η δημοσκόπηση αυτή θεωρείται σωστή εντός 3,4 εκατοστιαίων μονάδων, 19 φορές στις 20.» Στην προκειμένη περίπτωση, η στάθμη εμπιστοσύνης είναι 95% (19/20 = 0.95), ενώ η στάθμη σημαντικότητας είναι 5%. Copyright 2009 Cengage Learning 1.34
Εφαρμογές της Στατιστικής στις Επιχειρήσεις Η στατιστική ανάλυση παίζει σημαντικό ρόλο σε όλες σχεδόν τις πτυχές της επιχείρησης και των οικονομικών (στη λογιστική, στα οικονομικά, τα χρηματοοικονομικά, στη διαχείριση ανθρώπινων πόρων, στο μάρκετινγκ, και στις λειτουργίες του μάνατζμεντ). Copyright 2009 Cengage Learning 1.35