Τι είναι η Στατιστική? Η ΣΤΑΤΙΣΤΙΚΗ ορίζεται σήµερα ως η επιστήµη που σχετίζεται µε τις επιστηµονικές µεθόδους συλλογής, παρουσίασης, αξιολόγησης και γενίκευσης (: εξαγωγής συµπερασµάτων) της πληροφορίας. Οι µέθοδοι της περιγραφικής στατιστικής αποτελούν το επιστηµονικό εργαλείο για τη συγκέντρωση, ταξινόµηση και παρουσίαση των πρωτογενών δεδοµένων σε εύληπτη µορφή. Η στατιστική συµπερασµατολογία περιλαµβάνει τις µεθόδους µε τις οποίες καθίσταται δυνατή η προσέγγιση των χαρακτηριστικών του συνόλου των δεδοµένων (πληθυσµός) δια της µελέτης των χαρακτηριστικών αυτών επί ενός (µικρού) υποσυνόλου των δεδοµένων (δείγµα). Με άλλα λόγια τα εργαλεία της στατιστικής συµπερασµατολογίας επάγουν συµπεράσµατα από το δείγµα στον πληθυσµό. Βασικές έννοιες Στατιστικός Πληθυσµός Το σύνολο όλων των προσώπων, αντικειµένων και παρατηρήσεων µε ένα ιδιαίτερο χαρακτηριστικό ονοµάζεται στατιστικός πληθυσµός ή απλώς πληθυσµός. Παραδείγµατα: Το σύνολο των φοιτητών που είναι εγγεγραµµένοι στο Α.Π.Θ.. Το σύνολο των υπαλλήλων µιας επιχείρησης. Το σύνολο των καταναλωτών ενός προϊόντος.
είγµα Όταν δεν είναι εφικτή η καταγραφή ολόκληρου του πληθυσµού καταφεύγουµε σ ένα µέρος αυτού (σ ένα υποσύνολο αυτού) που το λέµε δείγµα. Παραδείγµατα: φοιτητές που εκλέγονται τυχαία από το σύνολο των φοιτητών του Α.Π.Θ.. καταναλωτές ενός προϊόντος που εκλέγονται τυχαία. Αν το υποσύνολο/δείγµα που µελετήσαµε είναι αντιπροσωπευτικό του συνόλου/πληθυσµού τότε έχουµε το δικαίωµα να αποφανθούµε πως όσα παρατηρήσαµε στο υποσύνολο αυτό ισχύουν για όλο το σύνολο. Τρόποι σχηµατισµού αντιπροσωπευτικών δειγµάτων: Απλή τυχαία δειγµατοληψία Στρωµατοποιηµένη δειγµατοληψία ειγµατοληψία κατά οµάδες
Πληθυσµός (Ν υποκείµενα) ειγµατοληψία είγµα (n υποκείµενα,n<n) Συµπεράσµατα Παρατήρηση Αποτελέσµατα Ανάλυση Τιµές ( είγµα n τιµών) Είδη Μεταβλητών Τα χαρακτηρίστηκα ως προς τα οποία εξετάζουµε έναν πληθυσµό λέγονται µεταβλητές. Οι µεταβλητές διακρίνονται σε δύο κατηγορίες:. Ποιοτικές Μεταβλητές: Είναι οι µεταβλητές των οποίων οι τιµές δεν εκφράζονται µε αριθµούς αλλά µε λέξεις. Παραδείγµατα: Το φύλο, η οικογενειακή κατάσταση, το επάγγελµα.
Οι ποιοτικές µεταβλητές διακρίνονται στις εξής κατηγορίες: a) Κατηγορικές: Είναι οι µεταβλητές των οποίων οι τιµές είναι κατηγορίες των οποίων η σειρά δεν έχει καµία σηµασία. Χρώµα µατιών, φύλο. b) ιαβαθµισµένες ή ιατακτικές: Είναι οι µεταβλητές που για το σύνολο τιµών τους µπορούµε να ορίσουµε µία διάταξη. Σειρά κατάταξης σ ένα αγώνισµα, γνώµη ως προς κάποιο µέτρο. 7. Ποσοτικές Μεταβλητές: Είναι οι µεταβλητές των οποίων οι τιµές έχουν αριθµητικές ιδιότητες και εκφράζονται µε µία µονάδα µέτρησης. Το βάρος, το ύψος, το εισόδηµα, ο αριθµός των παιδιών µιας οικογένειας. Οι ποσοτικές µεταβλητές διακρίνονται στις εξής κατηγορίες: 8
a) Συνεχής: Είναι οι µεταβλητές οι οποίες µπορούν να πάρουν οποιαδήποτε τιµή µέσα σ ένα συνεχές διάστηµα. Το βάρος, το ύψος. b) Ασυνεχής ή ιακριτές: Είναι οι µεταβλητές οι οποίες µπορούν να πάρουν µόνο διακεκριµένες τιµές. Ο αριθµός παιδιών µιας οικογένειας, ο αριθµός των υπαλλήλων µιας επιχείρησης. 9 Μεταβλητές Ποιοτικές Μεταβλητές Ποσοτικές Μεταβλητές Κατηγορικές ιαβαθµισµένες Συνεχής Ασυνεχής ή ιακριτές
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Περιγραφή στατιστικών δεδοµένων Κοιτάζοντας µία λίστα δεδοµένων είναι δύσκολο να σχηµατίσουµε µια πρώτη εντύπωση για τα χαρακτηριστικά των δεδοµένων που µας ενδιαφέρουν. Οι στατιστικοί πίνακες, οι γραφικές παραστάσεις και τα στατιστικά µέτρα αποτελούν χρήσιµα µέσα για να παρουσιάσουµε τα δεδοµένα καθαρά, σύντοµα και µε σαφήνεια. Στατιστικοί πίνακες οµαδοποίηση των δεδοµένων. Γραφικές παραστάσεις µια εικόνα αντί για χίλιες λέξεις. Στατιστικά µέτρα µε τα µέτρα κεντρικής τάσης προσπαθούµε να προσδιορίσουµε το τυπικό, το πιο συνηθισµένο στα δεδοµένα. τα µέτρα µεταβλητότητας βοηθούν στον εντοπισµό των διαφορών στα δεδοµένα (χωρίς µεταβλητότητα δεν υπάρχει Στατιστική!)
7 Χαρακτηριστικά µαθητών Γ Τάξης Λυκείου. 7 78 8 Α 9 7 78 7 7 8 7 8 7 7 9 7 8 7 8 77 8 7 7 8 7 Άλλο 7= 7 7 9 ιάβασµα = 7 7 8 Τηλεόραση = 8 7 7 Μουσική = 8 ιασκέδαση = 7 Αθλητισµός = 7 8 Υπολογιστές = 78 8 8 7 7 ΒΡΟΣ ΥΨΟΣ ΒΘΜΟΣ ΜΘ/ΩΝ ΡΙΘΜΟΣ ΕΛΦΩΝ ΑΠΑΣΧΟΛΗΣΗ ΦΥΛΟ /
ΗΕΠΙΛΟΓΗ ΤΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΤΕΧΝΙΚΗΣ ΠΟΥ ΘΑ ΧΡΗΣΙΜΟΠΟΙΟΥΜΕ ΓΙΑ ΤΗΝ ΠΕΡΙΓΡΑΦΗ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ ΕΞΑΡΤΑΤΑΙ ΑΠΟ ΤΟΝ ΤΥΠΟ ΤΗΣ ΜΕΤΑΒΛΗΤΗΣ. ) Περιγραφή Ποιοτικών εδοµένων Πίνακας συχνοτήτων Ραβδόγραµµα, Κυκλικό διάγραµµα Πίνακας συχνοτήτων Μεταβλητή Χ v i f i Κατηγορία v f Κατηγορία v f Κατηγορία k v k f k Σύνολα v f i % f % f % f k % Συχνότητα: Συχνότητα µίας κατηγορίας της µεταβλητής Χ λέγεται ο φυσικός αριθµός v i ο οποίος φανερώνει πόσες φορές παρουσιάζεται στο δείγµα η συγκεκριµένη κατηγορία. Σχετική Συχνότητα: Σχετική συχνότητα µίας κατηγορίας της µεταβλητής Χ λέγεται το πηλίκο της διαίρεσης της συχνότητας προς το πλήθος των vi παρατηρήσεων, δηλαδή: f i = v Σχετική Συχνότητα επί τοις εκατό : f i % = f i 8
Παρατηρήσεις: ) Το άθροισµα των συχνοτήτων κάθε κατηγορίας δίνει το συνολικό πλήθος παρατηρήσεων k i = v i = v + v + + v k = ) Το άθροισµα των σχετικών συχνοτήτων κάθε κατηγορίας ισούται µε τη µονάδα και fi. ) Το άθροισµα των σχετικών συχνοτήτων % κάθε κατηγορίας ισούται και fi%. v 7 Παράδειγµα: Να γίνει ο πίνακας συχνοτήτων για τη µεταβλητή Απασχόληση Μαθητών Απασχόληση Κωδικός v i f i f i % Υπολογιστές Αθλητισµός ιασκέδαση Μουσική Τηλεόραση ιάβασµα Άλλο 7 ΣΥΝΟΛΑ 8 9
Απασχόληση Υπολογιστές Κωδικός v i f i f i % v = = v f =, Αθλητισµός ιασκέδαση f = =, Μουσική Τηλεόραση f = =, ιάβασµα Άλλο 7 ΣΥΝΟΛΑ Όµοια υπολογίζουµε και τα υπόλοιπα f i 9 Πίνακας συχνοτήτων της µεταβλητής Απασχόληση Μαθητών Απασχόληση Κωδικός v i f i f i % Υπολογιστές Αθλητισµός ιασκέδαση Μουσική Τηλεόραση ιάβασµα Άλλο 7,,,,,,, ΣΥΝΟΛΑ,
Ραβδόγραµµα Ραβδόγραµµα Συχνοτήτων Μεταβλητής Απασχόληση Μαθητών Συχνότητες Υπολογιστές Αθλητισµός ιασκέδαση Μουσική Τηλεόραση ιάβασµα Άλλο Απασχόληση Ραβδόγραµµα Συχνοτήτων Μεταβλητής Απασχόληση Μαθητών Άλλο ιάβασµα Απασχόληση Τηλεόραση Μουσική ιασκέδαση Αθλητισµός Υπολογιστές Συχνότητες
Ραβδόγραµµα Σχετικών % Συχνοτήτων της Μεταβλητής Απασχόληση Μαθητών Σχετικές % Συχνότητες Υπολογιστές Αθλητισµός ιασκέδαση Μουσική Τηλεόραση ιάβασµα Άλλο Απασχόληση Κυκλικό διάγραµµα Κυκλικό ιάγραµµα Συχνοτήτων Μεταβλητής Απασχόληση Μαθητών ιάβασµα Άλλο α o Υπολογιστές α io = o f i Π.χ. α o = o f = o,= ο Τηλεόραση Αθλητισµός ιασκέδαση Μουσική
Ταυτόχρονη παρουσίαση δύο ποιοτικών µεταβλητών Γίνεται µε τη βοήθεια ενός πίνακα διπλής εισόδου Παράδειγµα: Φύλο - Απασχόληση Φύλο Απασχόληση Υπολογιστές Αθλητισµός ιασκέδαση Μουσική Τηλεόραση ιάβασµα Άλλο Αγόρι Κορίτσι Συχνότητα Κελιού άτοµα του δείγµατος µας είναι αγόρια και έχουν ως απασχόληση τους υπολογιστές
Γραφική Παρουσίαση Οµαδοποιηµένο Ραβδόγραµµα Απασχόληση Μαθητών ανά Φύλο Συχνότητες ΑΓΟΡΙΑ ΚΟΡΙΤΣΙΑ Υπολογιστές Αθλητισµός ιασκέδαση Μουσική Τηλεόραση ιάβασµα Άλλο 7 Συσσωρευµένο Ραβδόγραµµα Αγόρι Κορίτσι Υπολογιστές Αθλητισµός ιασκέδαση Μουσική Τηλεόραση ιάβασµα Άλλο 8