ΣΤΟΙΧΕΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ Αρχικά, με τη έοια στατιστική θεωρούσαμε τη απαρίθμηση και καταγραφή τω μετρήσεω. Οι παρατηρήσεις αυτές ή οι μετρήσεις ααφέροται σε συγκεκριμέο ατικείμεο ή γεγοός. Η στατιστική σήμερα αποτελεί έα κλάδο που απαρτίζεται από τρείς παραμέτρους: τα μαθηματικά τω πιθαοτήτω, τις γεικές αρχές του σχεδιασμού τω ερευώ και τις γεικές αρχές της αάλυσης και ερμηείας τω ερευώ.. Τα μαθηματικά τω πιθαοτήτω Στη καθημεριή μας ζωή, παρατηρούμε ότι χρησιμοποιούμε συχά λέξεις όπως: τυχαία, πιθαό, ααμεόμεο, αβέβαιο που είαι γωστό οτι οι όροι αυτοί σχετίζοται με τις πιθαότητες. H εφαρμογή τω στοχαστικώ μοτέλω είαι ευρύτατη και καλύπτει τομείς από τη γεετική, επιδημιολογία και μαθηματική βιολογία, μέχρι τη στατιστική φυσική και τις επιχειρησιακές έρευες. Οι γεικές αρχές του σχεδιασμού τω ερευώ Στο σχεδιασμό εός πειραματικού μοτέλου ή στη παρατήρηση κάποιω μεταβλητώ κύρια εξετάζοται το ποιά άτομα θα μελετηθού, ποιές ιδιότητές τους θα μετρηθού και ποιές συγκρίσεις θα εξεταστού. Γι αυτό το λόγο οι γεικές αρχές του σχεδιασμού τω ερευώ αποτελού εα σηματικό μέρος της στατιστικής επιστήμης. Οι γεικές αρχές της αάλυσης και ερμηείας τω ερευώ Η αάλυση τω στοιχείω μιας έρευας γίεται με περιγραφικούς τρόπους και με άλλες ααλύσεις όπου κυρίως διερευάται το πώς και το γιατί της υπόθεσης. Eδεχόμεα-Δειγματικός χώρος Ορισμοί : ΠΙΘΑΝΟΤΗΤΕΣ Γεγοός ή εδεχόμεο ( Ε ) λέγεται το κάθε δυατό αποτέλεσμα εός πειράματος. Δειγματικός χώρος λέγεται το σύολο τω δυατώ αποτελεσμάτω εός πειράματος και θα το συμβολίζουμε με Ω. Οι δειγματικοί χώροι που έχου αριθμήσιμο πλήθος στοιχείω λέγοται διακριτοί ή απαριθμητοί. Υπάρχου και δειγματικοί χώροι με άπειρο πλήθος στοιχείω. Παραδείγματα. Ρίχουμε έα ζάρι και ορίζουμε με Ε όλα τα πιθαά αποτελέσματα τω διαφόρω ρίψεω.
Ο δειγματικός χώρος είαι Ω={,,3,4,5,6} Μπορούμε όμως α ορίσουμε το δειγματικό χώρο ως : Ω={χ/χ είαι ακέραιος και < χ < 6}.Ρίχουμε έα όμισμα.ο δειγματικός χώρος είαι Ω=(Κ,Γ) 3. Τα αγόρια της Ε τάξης του Δημοτικού που είαι ψηλότερα από 50 εκ. Ο δειγματικός χώρος είαι Ω={ Πέτρος, Γιάης, Γιώργος, Βασίλης} 4. Ο χρόος που διαρκεί η ζωή μιας ηλεκτρικής συσκευής. Ο δειγματικός χώρος είαι Ω={ κάθε μή αρητικός πραγματικός αριθμός}. Πιθαότητα είαι έας αριθμός που ατιστοιχεί σε έα εδεχόμεο. Ορισμός: Α Ν, είαι έας πεπερασμέος αριθμός, και συμβολίζει το πλήθος τω δυατώ, το ίδιο πιθαώ αποτελεσμάτω μιας διαδικασίας και m από αυτά ευοού τη πραγματοποίηση εός χαρακτηριστικού, μιας κατάστασης Ε, η πιθαότητα πραγματοποίησης του Ε ορίζεται α είαι ίση με m/ν.α με Ρ (Ε) συμβολιστεί η πιθαότητα πραγματοποίησης του Ε τότε ο κλασικός ορισμός της πιθαότητας συοψίζεται στο τύπο: Ρ(Ε)=m/n, όπου m είαι ο αριθμός αποτελεσμάτω που ευοού τη πραγματοποίηση του Ε και Ν ο ολικός αριθμός τω ισοπίθαω αποτελεσμάτω. Παραδείγματα Η πιθαότητα α εμφαιστεί η όψη του ζαριού με το αριθμό έα είαι /6 και το ίδιο ισχύει για τη εμφάιση οποιασδήποτε όψης. Α από μια τράπουλα τω 5 χαρτιώ εκλεγεί έα στη τύχη, η πιθαότητα α εκλεγεί σπαθί είαι 3/5 αφού στη τράπουλα υπάρχου 3 σπαθιά, και το ίδιο ισχύει και για τα υπόλοιπα σχέδια της τράπουλας. Μαθηματική πιθαότητα Για κάθε γεγοός Ε εός πειράματος ορίζουμε έα αριθμό Ρ(Ε) που το οομάζουμε πιθαότητα του Ε και 0< Ρ(Ε)<,το οποίο σημαίει ότι η πιθαότητα οποιουδήποτε εδεχομέου Ε είαι μεγαλύτερη ή ίση από το μηδέ και μικρότερη ή ίση από τη μοάδα. Θεώρημα : Εά Σ = {χ,χ,χ 3,χ 4 } εδεχόμεα, τότε Ρ (Σ) = Ρ(χ )+Ρ(χ )+Ρ(χ 3 )+Ρ(χ 4 ). Θεώρημα : Ρ( )=0 δηλ. η πιθαότητα του αδύατου γεγοότος είαι μηδέ. Θεώρημα 3: Α Α=Α Α... Αn είαι αά δυο ασυμβίβαστα, τότε:
3 Ρ(Α)=Ρ(Α)+Ρ(Α)+Ρ(Αn) Σύολα Σύολο λέγεται μια καλώς ορισμέη συλλογή από διάφορα διακεκριμέα ατικείμεα. Κάθε ατικείμεο που αήκει σ αυτό το σύολο λέγεται στοιχείο του συόλου. Συήθως έα σύολο παριστάεται με κεφαλαίο γράμμα, όπως A,B,C. Έα στοιχείο του συόλου παριστάεται με έα μικρό γράμμα. Α έα στοιχείο α αήκει σε έα σύολο Α γράφουμε α Α. Α το α δε αήκει στο Α γράφουμε α Α. Μπορούμε α ορίσουμε έα σύολο. Μπορούμε α ορίσουμε έα σύολο ή ααφέροτας έα - έα όλα τα στοιχεία του ή από μια ιδιότητα που ικαοποιείται από κάθε στοιχείο του και μόο. Η πρώτη μέθοδος καλείται μέθοδος της ααγραφής και η δεύτερη μέθοδος της περιγραφής. Πράξεις στα σύολα Συμβολισμοί: = έωση π.χ. Α Β, = τομή π.χ. Α Β = Αήκει π.χ. α Α =δε αήκει π.χ. α Α = Κεό σύολο = Υποσύολο π.χ. Α Β Συμβολισμός: Χρησιμοποιούμε μικρά γράμματα για α συμβολίσουμε τα στοιχεία εός συόλου και κεφαλαία γράμματα για α συμβολίσουμε τα ίδια τα σύολα. Παραδείγματα:. Το Α={,} και το Β ={4,5} τότε : Α Β={,,4,5} Α Β= Α. Το Α={,,3} και το Β ={3, 4,5} τότε : Α Β={,,3,4,5} Α Β= {3}
4 Θεώρημα : Σε έα πεπερασμέο σύολο από η στοιχεία έχουμε η υποσύολα. Θεώρημα : Ρ(Α Β )=Ρ( Α) +Ρ(Β )-Ρ(Α Β ) Ασκήσεις. Ποιά είαι η τομή τω συόλω Α={,,34,3} και Β={,3,4,5,6}. Ποιά είαι η έωση τω συόλω Α={ όλα τα πράσια τρίγωα} και Β={ όλοι οι κίτριοι κύκλοι} 3. Ποιά είαι η τομή τω συόλω Α={ όλες οι κόκκιες μπάλλες } και Β={όλες οι άσπρες μπάλλες} ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΟΙΕΣ Α υποθέσουμε ότι μελετούμε μία ομάδα ατικειμέω, προσώπω ή οτιδήποτε άλλο θέλουμε, ως προς κάποια χαρακτηριστικά της, τότε: Το σύολο τω μελώ ή στοιχείω της ομάδας αυτής θα το οομάζουμε πληθυσμό Τα χαρακτηριστικά, ως προς τα οποία μελετούμε τη ομάδα, θα τα οομάζουμε μεταβλητές Οι δυατές τιμές, που μπορεί α πάρει μία μεταβλητή, θα οομάζοται τιμές της μεταβλητής Για παράδειγμα, α μελετούμε το σύολο τω μαθητώ της Γ τάξης ως προς τη προφορική βαθμολογία τους στα μαθηματικά Γεικής Παιδείας τότε: Όλοι οι μαθητές της Γ τάξης θα αποτελού το πληθυσμό Ο βαθμός του κάθε μαθητή στα Μαθηματικά είαι η μεταβλητή Οι αριθμοί 0,,, 0 είαι οι δυατές τιμές της μεταβλητής
5 Τις μεταβλητές τις διακρίουμε: Μεταβλητές Ποιοτικές ή κατηγορικές Οι τιμές τους δε είαι αριθμοί, αλλά χαρακτηρισμοί Διακριτές Οι δυατές τους τιμές είαι μεμοωμέοι αριθμοί Ποσοτικές Συεχείς Οι δυατές τους τιμές αήκου σε έα διάστημα (α,β) πραγματικώ αριθμώ Ότα μελετούμε όλα τα στοιχεία ή μέλη μιας ομάδας ως προς κάποια χαρακτηριστικά της τότε λέμε ότι κάουμε απογραφή Επειδή όμως η απογραφή είαι δύσκολο α γίει σε πολυμελείς ομάδες, γιαυτό εξετάζεται έα γήσιο υποσύολο της ομάδας, ως προς τα χαρακτηριστικά που εδιαφέρου, το οποίο οομάζεται δείγμα Βασική προϋπόθεση, για τη εγκυρότητα οιασδήποτε Στατιστικής μελέτης που γίεται με τη μέθοδο της δειγματολειψίας, α είαι το δείγμα ατιπροσωπευτικό του πληθυσμού. ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Για τη μελέτη και αξιοποίηση τω στατιστικώ δεδομέω είαι απαραίτητη η κατασκευή συοπτικώ πιάκω ή γραφικώ παραστάσεω. Αυτοί είαι είτε γεικοί πίακες, που περιέχου όλες τις πληροφορίες με λεπτομέρειες από μία στατιστική έρευα και αποτελού συήθως τις πηγές από τις οποίες ατλού οι ερευητές
6 στοιχεία για παραπέρα ααλύσεις και εξαγωγή συμπερασμάτω, είτε ειδικοί πίακες, που είαι συοπτικοί, ειδικού θέματος και έχου ληφθεί από έα γεικό πίακα. ΠΙΝΑΚΑΣ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ Στη πρώτη στήλη γράφουμε τις διαφορετικές τιμές που δέχεται η μεταβλητή χ Στη δεύτερη στήλη (συχότητα ) γράφουμε το αριθμό που δηλώει πόσες φορές εμφαίστηκε η τιμή χ (=,,3,,k) Στη τρίτη στήλη (σχετική συχότητα f ) γράφουμε το πηλίκο f ( το πλήθος τω στοιχείω του δείγματος) Στη τέταρτη στήλη (σχετική % συχότητα ) γράφουμε το αριθμό f% 00 f Στη πέμπτη στήλη (Αθροιστική συχότητα Ν ) γράφουμε : στη πρώτη γραμμή το αριθμό και από τη δεύτερη γραμμή και μετά N N, =,3,..k ή αλλιώς N 3... Στη έκτη στήλη (Αθροιστική σχετική συχότητα F ) γράφουμε : στη πρώτη γραμμή το αριθμό f και από τη δεύτερη γραμμή και μετά F f F, =,3,..k ή αλλιώς F f f f3... f Στη έβδομη στήλη (Αθροιστική σχετική συχότητα F %) γράφουμε : F % 00 F
7 Από το ορισμό τω παραπάω ισχύου οι παρακάτω σχέσεις:..... f f 3. 0 f 3 4. f f f... f 3 k k Απόδειξη: 3 k 3... k ( f f f3... fk... ) 5. f% 00 f και f % f % f %... f % 00 6. F % 00 F 3 k Για παράδειγμα: ΠΙΝΑΚΑΣ Καταομή συχοτήτω της μεταβλητής «επίδοση μαθητώ στη σφαιροβολία» X μέτρα f f I % N F F % 5 4 4 0, 0 4 0,0 0 0 6 3 3 0,5 5 7 0,35 35 0 8 6 6 0,3 30 3 0,65 65 0 0 0, 0 5 0,75 75 0 5 5 0,5 5 0 00 0 Αθροίσματα 0 00
8 Τα στατιστικά δεδομέα εός πίακα καταομής συχοτήτω παρουσιάζοται πολλές φορές υπό μορφή γραφικώ παραστάσεω και ειδικότερα ως : α) Ραβδόγραμμα (χρησιμοποιείται για τη γραφική παράσταση τω τιμώ ποιοτικώ μεταβλητώ Ρ α β δ ό γ ρ α μ μ α σ υ χ ο τ ή τ ω γ ια τ η ε θ ικ ό τ η τ α τ ο υ ρ ισ τ ώ π ο υ ε π ισ κ ε ύ τ η κ α έ α α ρ χ α ιο λ ο γ ικ ό χ ώ ρ ο μ ια σ υ γ κ ε κ ρ ιμ έ η η μ έ ρ α 4 0 8 6 4 0 Σ ε ιρ ά Έλληες Γερμαοί Γάλλοι Ισπαοί Γιουγκοσλαβοι Ιταλοί β) Διάγραμμα συχοτήτω (Για ποσοτικές μεταβλητές )
9 γ) Κυκλικό διάγραμμα (Χρησιμοποιείται για τη γραφική παράσταση τω τιμώ τόσο τω ποιοτικώ, όσο και ποσοτικώ μεταβλητώ, ότα οι διαφορετικές τιμές τω μεταβλητώ είαι σχετικά λίγες.) ΚΥΚΛΙΚΟ ΔΙΑΓΡΑΜΜΑ Για τη Εθικότητα τω τουριστώ ΕΛΛΗΝΕΣ ΓΕΡΜΑΝΟΙ ΓΑΛΛΟΙ ΙΣΠΑΝΟΙ ΓΙΟΥΓΚΟΣΛΑΒΟΙ ΙΤΑΛΟΙ Η γωία του κυκλικού τομέα, που ατιστοιχεί σε κάθε Εθικότητα o o τουριστώ είαι: 360 44 για τους Έλληες 30 5 o o 360 60 για τους Γερμαούς 30 3 o o 360 36 για τους Γάλλους 30 o o 360 4 για τους Ισπαούς 30 4 o o 360 48 για τους Γιουγκοσλάβους 30 4 o o 360 48 για τους Ιταλούς 30
0 ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ Ότα το πλήθος τω τιμώ μιας μεταβλητής είαι αρκετά μεγάλο, τότε τα δεδομέα ταξιομούται σε μικρό πλήθος ομάδω, που οομάζοται κλάσεις Τα άκρα τω κλάσεω οομάζοται όρια τω κλάσεω Η κάθε κλάση περιέχει το κάτω άκρο της, αλλά όχι το άω άκρο της, δηλαδή οι κλάσεις είαι της μορφής [α, β ) με α το κάτω και β το άω άκρο της κλάσης. α β Κετρική τιμή ή κέτρο της κάθε κλάσης οομάζεται ο αριθμός Το πλήθος τω κλάσεω τις οποίες χρησιμοποιούμε ότα κάουμε ομαδοποίηση τω παρατηρήσεώ μας είαι συήθως: Μέγεθος δείγματος ΠΙΝΑΚΑΣ (Α) Αριθμός Κλάσεω κ ΠΛΗΘΟΣ ΟΜΑΔΩΝ Μέγεθος δείγματος Αριθμός Κλάσεω <0 5 00-400 9 0-50 6 400-700 0 50-00 7 700-000 00-00 8 >000 κ Πλάτος μιας κλάσης είαι η διαφορά β-α Για α υπολογίσουμε το πλάτος που πρέπει α έχει η κάθε κλάση (σε κλάσεις με το ίδιο πλάτος) βρίσκουμε το πηλίκο του εύρους του δείγματος (μεγαλύτερη τιμή τω παρατηρήσεω μικρότερη τιμή τω παρατηρήσεω) με το πλήθος τω κλάσεω που χρησιμοποιούμε στρογγυλεύοτας, α χρειαστεί, πάτα προς τα πάω. Για παράδειγμα, α σε μία καταγραφή τω ηλικιώ 40 αθρώπω μιας πόλης που πέρασα σε ορισμέο χροικό διάστημα από έα πολυσύχαστο δρόμο έδωσε τα παρακάτω αποτελέσματα:,8,,34,5,70,68,,3,6,9,36,56,6,4,,7,58,5,,0,8,6,8,46,49,,70,34,68,7,, 6,39,40,5,50,43,44,45,6 Οι παρατηρήσεις είαι 4, άρα θα έχω 6 ομάδες σύμφωα με το ΠΙΝΑΚΑ (Α) Το εύρος τω παρατηρήσεω είαι 8-=79, οπότε το πλάτος της κάθε κλάσης θα είαι 79:6=3,7 ή στρογγυλοποιώτας 4 Έτσι δημιουργούται οι παρακάτω κλάσεις:
Κλάσεις [ - ) Κετρικές τιμές χ Συχ. Σχετική συχ. f I % Αθρ. Συχ. Ν Αθρ. Σχ. Συχ. F I % [-6) 9 5 35,7 5 35,7 [6-30) 3 7 6,7 5,4 [30-44) 37 6 4,3 8 66,7 [44,58) 5 8 9,0 36 85,7 [58-7) 65 5,0 4 97,7 [7,86) 79 0,3 4 00 ΣΥΝΟΛΟ 4 00,00 ΙΣΤΟΓΡΑΜΜΑ ΣΥΧΝΟΤΗΤΩΝ Η ατίστοιχη γραφική παράσταση εός πίακα συχοτήτω με ομαδοποιημέα δεδομέα γίεται με το ιστόγραμμα Α πάρουμε δύο ακόμη υποθετικές κλάσεις μία στη αρχή και μία στο τέλος-με συχότητα μηδέ και εώσουμε τα μέσα τω άω βάσεω τω ορθογωίω που
σχηματίζοται με ευθύγραμμα τμήματα, τότε σχηματίζεται το πολύγωο συχοτήτω ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ Τα αριθμητικά μεγέθη που χρησιμοποιούμε για α προσδιορίσουμε που βρίσκεται η κετρική τιμή τω παρατηρήσεώ μας στο οριζότιο άξοα τα οομάζουμε μέτρα θέσης της καταομής, εώ τα αριθμητικά μεγέθη που δείχου τη διασπορά τω παρατηρήσεώ μας γύρω από τη κετρική τιμή τα οομάζουμε μέτρα διασποράς ΜΕΤΡΑ ΘΕΣΗΣ α) Μέση τιμή ( x) Α t,t,..,t είαι οι παρατηρήσεις (πιθαό κάποιες α έχου τη ίδια τιμή) μιας μεταβλητής Χ, τότε : x t t... t t t Α x, x,... x k είαι οι κ διαφορετικές τιμές της μεταβλητής Χ με συχότητες ατίστοιχα,,... k, τότε είαι: x x x... k x k κ x κ x Για παράδειγμα, α μέση επίδοση τω μαθητώ στη σφαιροβολία είαι: x 4 5 3 6 6 8 0 5 66 8, 3 μέτρα. 0 0 Λαμβάοτας υπόψι ότι f μπορούμε α γράψουμε ακόμη: x k f x
3 Για τις ομαδοποιημέες παρατηρήσεις χρησιμοποιούμε ως τιμές της μεταβλητής τις κετρικές τιμές της κάθε κλάσης και εργαζόμαστε με το ίδιο τρόπο. γ) Διάμεσος (δ) Α τις διαφορετικές παρατηρήσεις τότε : t,t,..,t τις βάλουμε σε αύξουσα σειρά, Α ο αριθμός είαι περιττός διάμεσο οομάζουμε τη μεσαία παρατήρηση (α =κ-, κ=,,. διάμεσος είαι η t k παρατήρηση) Α ο αριθμός είαι άρτιος η διάμεσος είαι το ημιάθροισμα τω δύο μεσαίω παρατηρήσεω. t k t k (α =κ είαι δ ) Για παράδειγμα ααφερόμεοι στο πίακα της 4 ης σελίδας, επειδή οι μαθητές είαι 0, η 8 8 διάμεσος είαι το ημιάθροισμα της 0 ης και ης παρατήρησης, δηλ. δ 8 μέτρα. (από το πίακα παρατηρούμε ότι από τη 8 η έως 3 η παρατήρηση οι τιμές τους είαι 8 δ) Επικρατούσα τιμή Επικρατούσα τιμή ορίζεται η παρατήρηση με τη μεγαλύτερη συχότητα. Α οι επικρατούσες τιμές είαι δύο η ατίστοιχη καταομή λέγεται δικόρυφη, εώ ότα έχουμε πολλές κορυφές λέγεται πολυκόρυφη. Ότα όλες οι παρατηρήσεις είαι διαφορετικές, τότε δε υπάρχει επικρατούσα τιμή. Για α βρούμε τη επικρατούσα τιμή σε ομαδοποιημέα δεδομέα βρίσκουμε πρώτα τη επικρατούσα κλάση και εργαζόμαστε όπως φαίεται στο παρακάτω σχήμα: (Εώουμε τη πάω δεξιά κορυφή του προηγούμεου παραλληλόγραμμου με τη πάω δεξιά κορυφή του παραλληλογράμμου που ατιστοιχεί στη επικρατούσα κλάση και τη πάω αριστερά κορυφή του παραλληλογράμμου αυτού με τη πάω αριστερά κορυφή του επόμεου παραλληλογράμμου.) Η προβολή της τομής αυτώ τω δύο ευθ. τμημάτω στο οριζότιο άξοα προσδιορίζει τη επικρατούσα τιμή.
4 ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ α) Εύρος (R) Εύρος ορίζεται ως η διαφορά της μεγαλύτερης από τη μικρότερη παρατήρηση. β) Διακύμαση (s ) k s (t x) ή s (x x) γ) Τυπική απόκλιση s s Η διακύμαση είαι μια αξιόπιστη παράμετρος διασποράς, αλλά δε εκφράζεται με τις μοάδες με τις οποίες εκφράζοται οι παρατηρήσεις. Η τυπική απόκλιση εκφράζεται με τις ίδιες μοάδες που εκφράζοται οι παρατηρήσεις. Σε μια καοική ή περίπου καοική καταομή ( η καμπύλη συχοτήτω είαι περίπου σε σχήμα καμπάας), α x είαι η μέση τιμή και s η τυπική απόκλιση τότε: Το 68% περίπου τω παρατηρήσεω βρίσκεται στο διάστημα ( x -s, x +s) To 95% περίπου τω παρατηρήσεω βρίσκεται στο διάστημα ( x -s, x +s) To 99,7% περίπου τω παρατηρήσεω βρίσκεται στο διάστημα ( x -3s, x +3s) R 6s
5 Τυχαίες μεταβλητές Με το όρο μεταβλητή εοούμε κάθε γώρισμα ή ιδιότητα που χρησιμοποιείται για α περιγράψει κάποιο μέλος εός πληθυσμού και που μπορεί α μετρηθεί ή α ταξιομηθεί. Οι μεταβλητές διακρίοται σε ποσοτικές και ποιοτικές. Οι ποσοτικές μεταβλητές διακρίοται σε διακριτές και συεχείς. Οι ποιοτικές μεταβλητές διακρίοται σε οοματικές και διατάξιμες. Παραδείγματα:. Ποσοτικές μεταβλητές: Βάρος, ύψος, ηλικία, αριθμός παιδιώ αά οικογέεια, κλπ. o διακριτές: αριθμός παιδιώ αά οικογέεια. o συεχείς: Βάρος, ύψος, ηλικία.. Ποιοτικές μεταβλητές: Το φύλο, η οικογεειακή κατάσταση. Οτα οι διάφορες τιμές που παίρει μία τυχαία μεταβλητή εξαρτώται και από μία άλλη μεταβλητή τότε η πρώτη μεταβλητή λέγεται εξαρτημέη. Στη περίπτωση όμως που οι τιμές της πρώτης μεταβλητής μέου αεπηρέαστες από τη δεύτερη τότε αυτή λέγεται αεξάρτητη μεταβλητή. Παράδειγμα αυτώ τω μεταβλητώ είαι ο κύκλος (εξαρτημέη μεταβλητή ) και η ακτία του κύκλου (αεξάρτητη μεταβλητή). Εγκυρότητα-αξιοπιστία-αμεροληψία στις μετρήσεις τω μεταβλητώ Με το όρο εγκυρότητα εοούμε ότι η μέτρηση που κάουμε σε κάποια μεταβλητή έχει όημα. Για παράδειγμα δε μπορούμε α μετρήσουμε το πόσο είαι κάποιος ευτυχισμέος, με μέτρο το δείκτη εφυίας του. Προκειμέου λοιπό α έχουμε μια έγκυρη μέτρηση, πρέπει κατ αρχάς α γωρίζουμε καλά το τι ακριβώς θα μετρήσουμε. Ότα ααφερόμαστε σε κάτι και το θεωρούμε αξιόπιστο, αυτό άμεσα σημαίει ότι μπορούμε α βασιζόμαστε σ αυτό διαχροικά. Όπως θεωρούμε έα φίλο αξιόπιστο επειδή έχει κάποιες σταθερές απόψεις, με το ίδιο τρόπο θεωρούμε και μια μέτρηση αξιόπιστη ότα δε αλλάζει σηματικά σε διαδοχικές μετρήσεις μέσα στο χρόο. Μια μέτρηση είαι αμερόληπτη ότα δε τείει συστηματικά προς κάποια κατεύθυση. Για παράδειγμα α μία ζυγαριά δείχει πάτα περισσότερο από το καοικό βάρος τότε α ζυγίσουμε οτιδήποτε πράγματα θα πάρουμε μετρήσεις που δε θα είαι αμερόληπτες. Ασκήσεις. Δώστε παραδείγματα μετρήσεω που είαι αξιόπιστες αμερόληπτες. Ποιές από τις παρακάτω μεταβλητές είαι συεχείς και ποιές διακριτές
6 ο αριθμός τω λέξεω σε μία εότητα εός βιβλίου το βάρος τω παιδιώ ο αριθμός τω αυτοκιήτω σε μία έκθεση αυτοκιήτου ο αριθμός τω μαθητώ εός Νηπιαγωγείου 3. Δώστε παραδείγματα ποιοτικώ μεταβλητώ. 4. Δώστε παραδείγματα αεξάρτητω και εξαρτημέω μεταβλητώ. Δειγματοληψία Σε έα πληθυσμό που έχει κ στοιχεία και θέλουμε α εξετάσουμε κάποια χαρακτηριστικά του τότε είτε εξετάζουμε όλα τα στοιχεία του πληθυσμού είτε εξετάζουμε έα δείγμα από το πληθυσμό και αυτό λέγεται δειγματοληψία. Δείγμα είαι έα μέρος του στατιστικού πληθυσμού που εξετάζουμε με σκοπό τη συλλογή κάποιω παρατηρήσεω. Για α πάρουμε έα δείγμα μπορούμε: Να παίρουμε έα-έα στοιχείο από το πληθυσμό και α το εξετάζουμε χωρίς όμως α το ξαατοποθετούμε στο ίδιο το πληθυσμό. (Δειγματοληψία χωρίς επαάθεση). Να παίρουμε έα-έα στοιχείο από το πληθυσμό α το εξετάζουμε και α το ξαατοποθετούμε στο ίδιο το πληθυσμό. (Δειγματοληψία με επαάθεση). Να παίρουμε κ στοιχεία από το πληθυσμό μας και α τα εξετάζουμε. Στη στατιστική έχει μεγάλη σημασία η δειγματοληψία και οι πληροφορίες που παίρουμε από το δείγμα. Το δείγμα μπορεί είτε α είαι μικρό, είτε α αποτελείται από έα μεγάλο αριθμό στατιστικώ στοιχείω. Υπάρχει βέβαια και η ακραία περίπτωση όπου το δείγμα είαι όλος ο πληθυσμός και στη περίπτωση αυτή δείγμα και πληθυσμός συμπίπτου. Προκειμέου α γεικεύσουμε τα συμπεράσματα της έρευάς μας από το δείγμα στο πληθυσμό, ( από όπου αυτό προέρχεται), είαι απαραίτητο το δείγμα α είαι ατιπροσωπευτικό. Για α είαι έα δείγμα ατιπροσωπευτικό σημαίει οτι δίεται η ίδια ευκαιρία σε κάθε μοάδα του πληθυσμού α είαι μοάδα του δείγματος. Ο απλούστερος τρόπος για α το επιτύχει καείς αυτό είαι α σχηματίσει έα απλό τυχαίο δείγμα. Η επιλογή τω μελώ του δείγματος αυτού γίεται κυρίως με τη χρήση τω τυχαίω αριθμώ που τους παίρουμε από τους πίακες τω τυχαίω αριθμώ. Αλλος τρόπος σχηματισμού εός στατιστικού δείγματος είαι η εστρωμάτωση (stratfed random samplng) όπου γίεται η καταομή του πληθυσμού σε ομάδες ιδίω χαρακτηριστικώ τω στρωμάτω (strata). Για παράδειγμα σα στρώματα μπορούμε α θεωρήσουμε σε έα πληθυσμό το φύλο, τις γεωγραφικές περιοχές, τη ηλικία κλπ..
7 Στη δειγματοληψία θα πρέπει α έχουμε υπ όψι μας και κάποιες δυσκολίες που προέρχοται: από τη δυσκολία που έχουμε κάποιες φορές στο α βρούμε τα άτομα που έχουμε επιλέξει, από τις ελλιπείς απατήσεις και από τη δημιουργία εός δείγματος που εμάς μας εξυπηρετεί -" βολεύει" στη έρευά μας. Για παράδειγμα πολλές έρευες που γίοται μέσω τηλεοράσεως δε είαι ακριβείς γιατί επαφίεται κυρίως στη διάθεση του κάθε ατόμου α τηλεφωήσει στο σταθμό της τηλεόρασης και α πεί τη άποψή του ή όχι. Στη περίπτωση αυτή τα αποτελέσματα λέμε οτι είαι μεροληπτικά (based). Περιγραφική Στατιστική Πολλές φορές στη Στατιστική χρησιμοποιούμε τα ιστογράμματα, τα ραβδογράμματα ή τα κυκλικά διαγράμματα για τη γραφική παράσταση εός συόλου στοιχείω. Οι παραστάσεις γίοται εύκολα καταοητές και βοηθού στις συγκρίσεις τω στοιχείω μεταξύ τους, γι αυτό και η περιγραφική στατιστική βοηθά τους ααλυτές στο α έχου μια ταχύτερη, πληρέστερη και πιο σαφή εικόα τω δεδομέω τους. Πιο κάτω παρουσιάζοται τα ραβδογράμματα και τα κυκλικά διαγράμματα κάποιω δεδομέω. Ραβδόγραμμα του αριθμού τω σχολείω αά περιοχή. Μέση τιμή και διακύμαση
8 Ο μέσος όρος είαι έα μέγεθος που το χρησιμοποιούμε στη στατιστική για α περιγράψουμε τα δεδομέα. Υπάρχου διάφοροι μέσοι όροι αλλά ο σηματικότερος είαι ο αριθμητικός μέσος όρος. Ο αριθμητικός μέσος όρος είαι το πηλίκο της διαιρέσεως του αθροίσματος τω παρατηρήσεω δια του πλήθους τω παρατηρήσεω : 'Oτα χρησιμοποιούμε στατιστικά δείγματα και όχι ολόκληρο το πληθυσμό, τότε ατί για μ χρησιμοποιούμε το και ατί για Ν που είαι ολόκληρος ο πληθυσμός χρησιμοποιούμε το η που είαι ο αριθμός τω παρατηρήσεω του δείγματος. Παράδειγμα: Στο παρακάτω πίακα είαι οι βαθμοί στη ιστορία, γεωγραφία, γλώσσα και μαθηματικά τριώ μαθητώ. Ποιός είαι ο μέσος όρος (Μ.Ο.) της βαθμολογίας τους; ΙΣΤΟΡΙΑ ΓΕΩΓΡΑΦΙΑ ΓΛΩΣΣΑ ΜΑΘΗΜΑΤΙΚΑ Μ.Ο. ΘΕΜΗΣ 8 0 8 0 9 ΑΣΠΑ 9 9 9 9 9 ΥΠΑΤΙΑ 8 9 9 0 9 Στο παράδειγμα αυτό βλέπουμε ότι και οι τρείς οι μαθητές α και δε είχα τη ίδια βαθμολογία στο τέλος είχα το ίδιο μέσο όρο. Ποιός όμως είαι πιο σταθερός από τους τρείς; Τη απάτηση θα δώσει η διακύμαση της βαθμολογίας τω μαθητώ. Η διακύμαση είαι έα μέτρο διασποράς τω τιμώ του δείγματος. Ότα χρησιμοποιούμε όλο το στατιστικό πληθυσμό, τότε συμβολίζουμε τη διακύμαση με σ εώ ότα ααφερόμαστε σε δείγμα τη συμβολίζουμε με s και ισούται: σ = Σ(χ ι -μ) Ν και s = Σ(χ ι -μ) η- Παράδειγμα: Στο παραπάω παράδειγμα ποιά είαι η διακύμαση της βαθμολογίας του Θέμη και ποιά της Άσπας και της Υπατίας;
9 Η διακύμαση του Θέμη είαι : [(8-9) +(0-9) + (8-9) +(0-9) ]/4 = (+++)/4 = της Άσπας είαι: [(9-9) +(9-9) + (9-9) +(9-9) ]/4 = 0/4 = 0 και της Υπατίας είαι : [(8-9) +(9-9) + (9-9) +(0-9) ]/4 = (+0+0+)/4 = /4 =0.5 Ασκήσεις. Να βρεθεί ο μέσος όρος του βάρους τω παιδιώ του πίακα: ΟΝΟΜΑ ΒΑΡΟΣ ΣΕ ΚΙΛΑ ΑΝΝΑ 5 ΜΑΡΙΑ 4 ΠΕΠΗ 5 ΑΣΠΑ 6 ΑΛΙΚΗ 3 ΓΙΩΡΓΟΣ 7 ΠΕΡΙΚΛΗΣ 8 ΣΠΥΡΟΣ 5. Στη παραπάω άσκηση: Ποιός είαι ο μέσος όρος του βάρους τω αγοριώ Ποιά είαι η διακύμαση του βάρους τω κοριτσιώ Ποιός είαι ο μέσος όρος του βάρους τω κοριτσιώ Συσχέτιση Πολύ συχά θέλουμε α μάθουμε το πως συδέοται οι διάφορες μεταβλητές σε μιά ομάδα παρατηρήσεω. Στη περίπτωση που έχουμε αεξάρτητες μεταξύ τους μεταβλητές τότε εξετάζουμε τη στατιστική συσχέτιση που έχου μεταξύ τους. Απλό καθημεριό παράδειγμα είαι η σχέση βάρους και ύψους τω μαθητώ. Στη γραφική παράσταση της συσχέτισης χρησιμοποιούμε έα διάγραμμα που στο κάθετο και στο οριζότιο άξοα βάζουμε τις τιμές τω μεταβλητώ χ και ψ Ο βαθμός συσχετίσεως είαι έας δείκτης που έχει μια αριθμητική έκφραση και συμβολίζεται με r. Η τιμή του r κυμαίεται πάτοτε μεταξύ - και +.
0 Έλεγχος υποθέσεω Μέθοδοι Συσχέτισης Πολλές φορές. στις κοιωικές,και οικοομικές επιστήμες εδιαφέροται α προσδιορίσου το μέγεθος της σχέσης μεταξύ Μεταβλητώ. Ειδικότερα θέλου α γωρίζου α μια ψηλή τιμή μιας μεταβλητής `σχετίζεται με μια ψηλή ή χαμηλή τιμή μιας άλλης μεταβλητής. Για παράδειγμα, μπορεί α θέλουμε α εξετάσουμε το μέγεθος της συσχέτισης μεταξύ εισοδήματος και μόρφωσης, καταάλωση προϊότος σε σχέση με τη τιμή του προϊότος, δαπάες διαφήμισης και ποιότητας προϊότος. Οι ρόλοι τω μεταβλητώ που συμμετέχου είαι δυο ειδώ. Αεξάρτητες και Εξαρτημέες. Προυποθέσεις διερεύησης συσχέτισης. Σταθμισμέο δείγμα. Καοικές καταομές τω συεχώ μεταβλητώ 3. Ικαό δείγμα > 0*αρ.μεταβλητώ Εδιαφερόμαστε α μετρήσουμε τη σχέση τω δυο μεταβλητώ Οι μέθοδοι προσδιορισμού είαι ααλογη με το είδος τω μεταβλητω (συεχήςκατηγορική) (κατηγορική κατηγορική): (συεχής- συεχής). κατηγορική κατηγορική: μέθοδος: χ - έλεγχος, συτελεστής συσχέτισης, Με το πίακα διπλής εισόδου διασταυρώουμε με ποιο τρόπο δίου απατήσεις σε κατηγορίες μιας μεταβλητής (Χ) οι ερωτώμεοι κάποιας συγκεκριμέης κατηγορίας μιας άλλης μεταβλητής (Y). Με το τρόπο αυτό εξετάζουμε τη σχέση
μεταξύ τω μεταβλητώ. Η ύπαρξη ή όχι στατιστικά σχέσης σε μια διασταυρωμέη προσδιορίζεται με το υπολογισμό της τιμής χ.. Η τιμή του χ δείχει κατά πόσο η αεξαρτησία τω δυο μεταβλητώ είαι στατιστικά σηματική ή όχι.. Ο υπολογισμός της χ στηρίζεται στη μέτρηση της διαφοράς μεταξύ Παρατηρούμεω τιμώ και Ααμεόμεω, (Π-Α) /Α. Ειδικότερα Α πχ έχουμε το επόμεο πίακα όπου η μεταβλητή (Υ)έχει 4 κατηγορίες Β,., Β εώ η Χ δυο Γ, Γ. Έχουμε δηλ., Β_ Β_ Β_3 Β_4 Γ_ 3 4 Γ_ 3 4. συεχής- συεχής μέθοδος: Συτελεστής Pearson H ότα p τιμή <. Δε απορρίπτουμε τη 0 Για α είμαστε σε θέση α αξιολογήσουμε πόσο αξιόπιστη είαι η p-τιμή που θα βρούμε, πρώτα πρέπει α ελέγξουμε α ο πληθυσμός μας είαι καοικός. Σε περίπτωση που δε είαι, θα πρέπει α αξιολογήσουμε α απέχει πολύ ή όχι. Επίσης, θα λάβουμε υπ όψι και το μέγεθος του δείγματος. Έλεγχοι καοικότητας για συολική βαθμολογία
Συγχρόως εξετάζουμε τα γραφικά. Τα γραφικά, σε συδυασμό με τις τιμές τω συτελεστώ ασυμμετρίας και κύρτωσης δείχου ότι ο πληθυσμός μας δε πρέπει α απέχει ιδιαίτερα από τη καοική καταομή. Πιθαό οι έκτοπες τιμές που φαίοται στο θηκόγραμμα α είαι υπεύθυες για τη απόρριψη της καοικότητας. Σ αυτό παίζει ρόλο και το μέγεθος του δείγματος. 0 Hstogram 00 80 60 40 Frequency 0 0 Std. Dev = 5.8 Mean = 8.6 N = 470.00.5 7.5.5 7.5.5 7.5 3.5 37.5 5.0 0.0 5.0 0.0 5.0 30.0 35.0 SINOLIKI BATHMOLOGIA Ιστόγραμμα για συολική βαθμολογία 40 49 43 43 434 433 430 30 0 0 0 93-0 N = 470 SINOLIKI BATHMOLOGIA Θηκόγραμμα για συολική βαθμολογία Απομακρύοτας μερικές ακραίες τιμές, μπορούμε α πλησιάσουμε περισσότερο στη καοικότητα. 3. συεχής-κατηγορική μέθοδος : Compare Means, ndepentent-sample T Test,: Α p-τιμή<0.05 σημαίει πως πρέπει α απορρίψουμε τη μηδεική υπόθεση Εφ όσο η Ηο πέφτει έξω από το 95% διάστημα εμπιστοσύης για το μέσο του πληθυσμού,, απορρίπτουμε τη H 0. Έλεγχος για ισότητα μέτρω θέσεως Πχ Θέλουμε α ελέγξουμε α η μέση (συολική) επίδοση τω αγοριώ είαι ίση με αυτή τω κοριτσιώ,
3 H 0 : 0 έατι Παραμετρικός έλεγχος για τη διαφορά μέσω H : 0. H : έ 0 0 0 0 H :, ή 0 0 0 Υποθέσεις. Οι πληθυσμοί είαι καοικά καταεμημέοι.. Τα δείγματα είαι αεξάρτητα.
4
5