την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ"

Transcript

1 Ανάλυση Διασποράς Ανάλυση Διασποράς (Analysis of Variance, ANOVA) είναι μέθοδος στατιστικού ελέγχου υποθέσεων που αναφέρονται σε περισσότερους από δύο πληθυσμούς. Στην προηγούμενη ενότητα αναφερθήκαμε σε στατιστικούς ελέγχους υποθέσεων για την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ και μ, ή των διασπορών, σ και σ, δύο πληθυσμών, αντίστοιχα. Εύλογα γεννάται το ερώτημα: πώς μπορούμε να συγκρίνουμε, για παράδειγμα, τις μέσες τιμές μ, μ,..., μ k, k πληθυσμών όταν k > ; Μια απάντηση θα μπορούσε να είναι η εξής: να γίνει η σύγκριση των k μέσων τιμών k k ( k ) ανά δύο. Δηλαδή, να κάνουμε όλους τους, c = =, ελέγχους: : μi = μ, με i. : μ μ. i Είναι φανερό, ότι μια τέτοια διαδικασία είναι χρονοβόρα ακόμη και όταν το k είναι μικρό. Για παράδειγμα, αν θέλουμε να συγκρίνουμε k = 4 μέσες τιμές, πρέπει να κάνουμε c = 6, συνολικά, ελέγχους. Αν k = 5 πρέπει να κάνουμε c = ελέγχους, αν k = 6 πρέπει να κάνουμε c = 5 ελέγχους, ενώ αν k =, απαιτούνται c = 45 έλεγχοι! Όμως, αυτό το πρόβλημα θα μπορούσε να αντιμετωπισθεί (μάλιστα, με χρήση κατάλληλου λογισμικού, πολύ εύκολα). Το πραγματικό πρόβλημα που δημιουργείται είναι άλλο και σοβαρό. Αν ενδιαφερόμαστε να κάνουμε c ανεξάρτητους ελέγχους, σε επίπεδο σημαντικότητας α Pc τον καθένα (πιθανότητα σφάλματος τύπου Ι κατά σύγκριση/per comparison error rate), τότε η πιθανότητα λανθασμένης απόρριψης της μηδενικής υπόθεσης σε έναν τουλάχιστον από αυτούς, δηλαδή, η πιθανότητα, στους c ελέγχους, να συμβεί τουλάχιστον μια φορά σφάλμα Τύπου Ι (πιθανότητα σφάλματος τύπου Ι κατά c πείραμα/per experiment error rate), είναι: α = ( α. PE PC ) Για παράδειγμα, αν κάνουμε c = 6,, 5, 45 ανεξάρτητους ελέγχους σε επίπεδο σημαντικότητας α =. 5 τον καθένα, τότε, η πιθανότητα, α PE, είναι, αντίστοιχα: PC c α PE Είναι φανερό ότι το α PE αυξάνεται ραγδαία με τον αριθμό των ελέγχων, c. Ανάλογο πρόβλημα δημιουργείται και στην περίπτωση μη ανεξάρτητων ελέγχων, όπου, ισχύει, α PE c α PC (υποπροσθετική ιδιότητα). Για την αντιμετώπιση, επομένως, αυτού του προβλήματος, το οποίο στη βιβλιογραφία αναφέρεται ως πρόβλημα πολλαπλών συγκρίσεων (multiple comparisons problem), απαιτούνται άλλες προσεγγίσεις. Στην ενότητα αυτή θα δούμε πώς απαντάει στο πρόβλημα της σύγκρισης περισσότερων των δύο μέσων, η ανάλυση διασποράς. Ειδικότερα, θα δούμε πώς και με ποιες προϋποθέσεις μπορούμε να κάνουμε, σε επίπεδο σημαντικότητας α %, έλεγχο ανάλυσης διασποράς για να ελέγξουμε τη μηδενική υπόθεση, Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 9

2 : μ = μ =... = μ k, έναντι της εναλλακτικής, : μi μ, για ένα τουλάχιστον ζεύγος (i, ). Δηλαδή, θα δούμε, πώς μπορούμε να συγκρίνουμε τις μέσες τιμές μ, μ,..., μk, k > πληθυσμών, με έναν μόνο, αντί με πολλαπλούς ελέγχους. Όμως, παρότι φαίνεται ότι με τον έλεγχο ανάλυσης διασποράς το πρόβλημα των πολλαπλών ελέγχων παρακάμπτεται, εντούτοις, όπως θα δούμε αργότερα, τελικά δεν το αποφεύγουμε. Και αυτό, γιατί αν με τον έλεγχο ανάλυσης διασποράς, η μηδενική υπόθεση : μ = μ =... = μk, απορριφθεί, πρέπει να μπορούμε να πούμε κάτι για το ποιες από τις διαφορές μi μ είναι στατιστικά σημαντικές. Όμως, τώρα, ας δούμε τον έλεγχο ανάλυσης διασποράς. Η ανάλυση διασποράς προτάθηκε από τον Sir Ronald A. Fisher το 98. Ευρέως έγινε γνωστή μετά το 95 όταν εκδόθηκε το κλασικό πλέον βιβλίο του R. A. Fisher, Statistical Methods for Research Workers, στο οποίο είχε συμπεριλάβει και την ανάλυση διασποράς. ανάλυση διασποράς «γεννήθηκε»/προέκυψε κατά την ενασχόληση του Fisher με δύσκολα προβλήματα στατιστικής συμπερασματολογίας που εμφανίζονται στο γεωργικό πειραματισμό (πολλές πηγές μεταβλητότητας και συχνά εμφανιζόμενες ετερογένειες, και μάλιστα, προς διάφορες κατευθύνσεις του πειραματικού αγρού π.χ. ως προς τη γονιμότητα, την κλίση και την υγρασία των εδαφών, τις προηγούμενες καλλιέργειες, κ.τλ.). Η προσέγγιση της λύσης τέτοιου είδους προβλημάτων που πρότεινε ο Fisher, βασίζεται στην τυχαιοποίηση και στην επανάληψη και ως μαθηματικό εργαλείο για την υποστήριξη αυτής της προσέγγισης πρότεινε την ανάλυση διασποράς. Γι αυτό, όπως θα δούμε στη συνέχεια, στην ανάλυση διασποράς έχει επικρατήσει να χρησιμοποιείται ορολογία (και όχι μόνο) που χρησιμοποιείται στο γεωργικό πειραματισμό και γενικότερα στον πειραματισμό, παρότι δεν εφαρμόζεται μόνο στην ανάλυση πειραματικών δεδομένων. Ας δούμε τέσσερα προβλήματα στατιστικού ελέγχου υποθέσεων που αντιμετωπίζονται με έλεγχο ανάλυσης διασποράς. Πρόβλημα-: Ένας φοιτητής, στο πλαίσιο της πτυχιακής του εργασίας, προκειμένου να συγκρίνει τέσσερα είδη (Α, Α, Α και Α4, αντίστοιχα) πρόσθετης ύλης ζωοτροφών για αύξηση του βάρους νεογέννητων χοίρων, σχεδίασε και εκτέλεσε το εξής πείραμα. Επέλεξε νεογέννητους χοίρους και με μια τυχαία διαδικασία αντιστοίχισε σε 5 από αυτούς την πρόσθετη ύλη Α, σε 5 άλλους την Α, σε 5 άλλους την Α και σε 5 άλλους την Α4 (δες το σχήμα που ακολουθεί). Δημιούργησε έτσι, 4 ομάδες των 5 χοίρων η κάθε μια. Αφού χορήγησε στους χοίρους κάθε ομάδας τροφή με την αντίστοιχη πρόσθετη ύλη για τρεις μήνες, κατέγραψε την αύξηση του βάρους κάθε χοίρου (σε pounds). Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα πειραματικά δεδομένα ότι υπάρχουν στατιστικά σημαντικές διαφορές στη μέση αύξηση του βάρους των νεογέννητων χοίρων που να οφείλονται στα τέσσερα είδη πρόσθετης ύλης ζωοτροφών; Α Α Α Α Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 9

3 Πρόβλημα-: Ο επιβλέπων καθηγητής του φοιτητή του Προβλήματος-, μετά τη στατιστική ανάλυση των πειραματικών δεδομένων, του πρότεινε να εκτελέσει ένα ακόμη πείραμα. Έτσι, ο φοιτητής εκτέλεσε και το εξής πείραμα: Από πέντε διαφορετικές γέννες επέλεξε τυχαία 4 χοίρους από την κάθε μία. Δημιούργησε έτσι, 5 τετράδες χοίρων (Γ, Γ, Γ, Γ4 και Γ5, αντίστοιχα) όπου οι χοίροι της ίδιας τετράδας προέρχονταν από την ίδια γέννα, και στους χοίρους κάθε τετράδας αντιστοίχησε, με μια τυχαία διαδικασία, από μία πρόσθετη ύλη ζωοτροφών (δες το σχήμα που ακολουθεί). Αφού χορήγησε στους χοίρους κάθε ομάδας τροφή με την αντίστοιχη πρόσθετη ύλη στον καθένα για τρεις μήνες, κατέγραψε την αύξηση του βάρους κάθε χοίρου (σε pounds). Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα πειραματικά δεδομένα ότι υπάρχουν στατιστικά σημαντικές διαφορές στη μέση αύξηση του βάρους των νεογέννητων χοίρων που να οφείλονται στα τέσσερα είδη πρόσθετης ύλης ζωοτροφών; Γ Γ Γ Γ4 Γ5 Α (78) Α4 (7) Α (7) Α (66) Α (6) Α (78) Α (64) Α4 (8) Α (76) Α (69) Α (69) Α (68) Α (7) Α4 (74) Α (66) Α4 (8) Α (7) Α (76) Α (77) Α4 (7) Πρόβλημα-: Ένας φοιτητής του Τμήματος Επιστήμης και Τεχνολογίας Τροφίμων του Γ.Π.Α., στο πλαίσιο της πτυχιακής του εργασίας, συνέκρινε τις ποσότητες χοληστερίνης που περιέχουν τρία διαφορετικά είδη τροφίμων διαίτης, Α, Α και Α, αντίστοιχα. Από κάθε είδος πήρε ένα τυχαίο δείγμα μεγέθους 8 και μέτρησε την ποσότητα χοληστερίνης (σε milligrams ανά gr). Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν οι παρατηρήσεις που πήρε ο φοιτητής ότι υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των μέσων ποσοτήτων χοληστερίνης στα τρία είδη τροφίμων; Πρόβλημα-4: Ένας ερευνητής ενδιαφέρεται να μελετήσει την επίδραση της έντασης του φωτισμού και του επιπέδου της θερμοκρασίας στην ανάπτυξη ενός είδους χλωρόφυτων (φύκη). Μάλιστα, ενδιαφέρεται ιδιαίτερα, να διερευνήσει αν οι δύο αυτοί παράγοντες επιδρούν στην ανάπτυξη του συγκεκριμένου είδους χλωρόφυτου ανεξάρτητα ή η επίδραση του ενός διαφοροποιείται ανάλογα με τη στάθμη του άλλου. Για το σκοπό αυτό, σχεδίασε και εκτέλεσε στο εργαστήριο το εξής πείραμα. Καθόρισε τρία επίπεδα έντασης φωτισμού (Β, Β και Β) και τρία επίπεδα θερμοκρασίας ( ο C, ο C και ο C). Για κάθε συνδυασμό, έντασης φωτισμού και επιπέδου θερμοκρασίας, καλλιέργησε χλωρόφυτα του συγκεκριμένου είδους και μετά από μια εβδομάδα τα ζύγισε και κατέγραψε τα βάρη τους (σε gr). Τα δεδομένα που συγκέντρωσε φαίνονται στον πίνακα που ακολουθεί. Επίπεδο θερμοκρασίας ο C ο C ο C Β Ένταση Β φωτισμού Β Με βάση αυτά τα πειραματικά δεδομένα και σε επίπεδο σημαντικότητας 5%, τι μπορούμε να πούμε για το αν και πώς το επίπεδο θερμοκρασίας και η ένταση φωτισμού επιδρούν στην ανάπτυξη του συγκεκριμένου είδους χλωρόφυτων; Είναι προφανές ότι και τα τέσσερα προβλήματα είναι προβλήματα στατιστικού ελέγχου υποθέσεων που αφορούν περισσότερες από δύο μέσες τιμές (αντίστοιχων πληθυσμών). Στο Πρόβλημα-, τα δεδομένα προκύπτουν από δειγματοληψίες, ενώ στα Προβλήματα-, και 4 από εκτέλεση πειραμάτων και μάλιστα με διαφορετικό Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 94

4 πειραματικό σχέδιο το καθένα. Παρατηρείστε ότι στα Προβλήματα- και, ενώ το ερευνητικό ερώτημα είναι ακριβώς το ίδιο, ο τρόπος συγκέντρωσης των πειραματικών δεδομένων, δηλαδή το πειραματικό σχέδιο, διαφέρει. Παρατηρείστε, επίσης, ότι το σχέδιο δειγματοληψίας στο Πρόβλημα- και το πειραματικό σχέδιο στο Πρόβλημα- είναι ίδια. Για να απαντήσουμε στο Πρόβλημα-, πρέπει να κάνουμε, σε επίπεδο σημαντικότητας 5%, στατιστικό έλεγχο της μηδενικής υπόθεσης, : μ = μ = μ = μ 4, έναντι της εναλλακτικής, : μi μ, για ένα τουλάχιστον ζεύγος (i, ), όπου, μ, =,,, 4 η μέση τιμή της τυχαίας μεταβλητής που εκφράζει την αύξηση του βάρους νεογέννητων χοίρων μετά τη χορήγηση τροφής που περιέχει πρόσθετη ύλη, =,,,4, για τρεις μήνες μετά τη γέννησή τους. Ουσιαστικά, και με ορολογία A πειραματισμού, πρέπει να ελέγξουμε, αν επηρεάζονται οι τιμές μιας ποσοτικής μεταβλητής, έστω Υ, (αύξηση του βάρους νεογέννητων χοίρων όταν χρησιμοποιείται πρόσθετη ύλη στην τροφή τους για τρεις μήνες μετά τη γέννησή τους), από τις τιμές (Α, Α, Α, Α4) μιας ποιοτικής μεταβλητής (το είδος της πρόσθετης ύλης). Στην ορολογία του πειραματισμού, η ποιοτική μεταβλητή ονομάζεται παράγοντας (factor) και οι τιμές της ονομάζονται στάθμες ή επίπεδα (levels) του παράγοντα. Η εξαρτημένη μεταβλητή Υ ονομάζεται μεταβλητή απόκρισης (response variable) γιατί στις τιμές της αντανακλώνται οι αλλαγές στις τιμές του παράγοντα. Σε ένα πείραμα, ο ερευνητής μπορεί να ενδιαφέρεται για συγκεκριμένες τιμές του παράγοντα οπότε ως στάθμες ορίζει αυτές τις τιμές και τα συμπεράσματα θα αφορούν μόνον αυτές (πρότυπο Ι/πρότυπο καθορισμένων επιδράσεων/fixed effects model). Για παράδειγμα, ενδιαφέρεται να μελετήσει την αποτελεσματικότητα τεσσάρων συγκεκριμένων ειδών πρόσθετης ύλης ζωοτροφών. Αν τις τιμές του παράγοντα (στάθμες) τις επιλέξει τυχαία από ένα σύνολο δυνατών τιμών του παράγοντα (άπειρο ή πεπερασμένο) τότε τα συμπεράσματά του θα αφορούν όλο τον πληθυσμό των δυνατών τιμών του παράγοντα (πρότυπο ΙΙ/πρότυπο τυχαίων επιδράσεων/random effects model). Για παράδειγμα, ενδιαφέρεται να μελετήσει την αποτελεσματικότητα δέκα ειδών ζωοτροφών που υπάρχουν και ως στάθμες ορίζει τέσσερα από αυτά τα είδη που τα επέλεξε τυχαία από τα δέκα που υπάρχουν ή επιλέγει τυχαία πέντε περιοχές της χώρας για να καλλιεργήσει μια ποικιλία καλαμποκιού γιατί ενδιαφέρεται τα συμπεράσματα του να αφορούν όλη τη χώρα. Στο Πρόβλημα- όπως και στο Πρόβλημα-, ο φοιτητής ενδιαφέρεται να μελετήσει την επίδραση του παράγοντα «είδος πρόσθετης ύλης» (για τις ίδιες στάθμες όπως στο Πρόβλημα-) στην «αύξηση του βάρους νεογέννητων χοίρων όταν χρησιμοποιείται πρόσθετη ύλη στην τροφή τους για τρεις μήνες μετά τη γέννησή τους». Δηλαδή, τα δύο προβλήματα, διαφοροποιούνται μόνο στο πειραματικό σχέδιο που εφαρμόσθηκε. Στο Πρόβλημα- η μεταβλητή απόκρισης εκφράζει τις «τιμές χοληστερίνης στα τρόφιμα διαίτης», και ο παράγοντας είναι το «είδος τροφίμου διαίτης» με τρεις στάθμες. Στο Πρόβλημα-4 η μεταβλητή απόκρισης εκφράζει την «ανάπτυξη του συγκεκριμένου είδους χλωρόφυτων» και ο ερευνητής ενδιαφέρεται να μελετήσει την επίδραση δύο παραγόντων: του παράγοντα «επίπεδο θερμοκρασίας» με τρεις στάθμες και του παράγοντα «επίπεδο φωτισμού» με τρεις επίσης στάθμες. Κάθε συνδυασμός από δύο Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 95

5 στάθμες (μία από κάθε παράγοντα) ονομάζεται επέμβαση/αγωγή/μεταχείριση (treatment). Στο συγκεκριμένο πρόβλημα οι διαφορετικές επεμβάσεις (οι διαφορετικοί συνδυασμοί επιπέδου θερμοκρασίας-έντασης φωτισμού) είναι 9 και για κάθε επέμβαση ελήφθησαν παρατηρήσεις. Στην περίπτωση που μελετάμε την επίδραση ενός μόνο παράγοντα, οι επεμβάσεις είναι οι στάθμες του παράγοντα. Για παράδειγμα, στο Πρόβλημα-, οι επεμβάσεις είναι τα τρία είδη των τροφίμων διαίτης Α, Α και Α. Ας δούμε τώρα ποια είναι η βασική, η κεντρική, ιδέα της ανάλυσης διασποράς, το νόημά της και πώς εφαρμόζεται. Παρότι, η βασική ιδέα και το νόημα της ανάλυσης διασποράς είναι το ίδιο, ανεξάρτητα από το πειραματικό σχέδιο ή το σχέδιο δειγματοληψίας που χρησιμοποιούμε για τη συγκέντρωση των δεδομένων, εντούτοις, κατά περίπτωση, απαιτούνται κατάλληλες προσαρμογές στην εφαρμογή της μεθόδου (και είναι λογικό). Γι αυτό, στη συνέχεια θα παρουσιάσουμε τη μέθοδο ανά πειραματικό σχέδιο. Ειδικότερα, θα δούμε με ποιες προϋποθέσεις και πώς, μπορούμε να κάνουμε έλεγχο/ελέγχους ανάλυσης διασποράς στο Εντελώς Τυχαιοποιημένο Σχέδιο (Completely Randomized Design) και στο Σχέδιο Τυχαιοποιημένων Πλήρων Ομάδων (Randomized Complete Block Design) καθώς και στα παραγοντικά πειράματα και ειδικότερα στο α x b Παραγοντικό Πείραμα (α x b Factorial Experiment). Πριν προχωρήσουμε στην παρουσίαση της μεθόδου, αναφέρουμε και υπογραμμίζουμε τις υποθέσεις, ή αλλιώς, τις παραδοχές, που κάνουμε και πρέπει να ελέγχουμε αν ισχύουν/ικανοποιούνται όταν επιλέγουμε να εφαρμόσουμε ελέγχους ανάλυσης διασποράς. Υποθέσεις για την εφαρμογή ελέγχων ανάλυσης διασποράς. Οι πληθυσμοί από τους οποίους προέρχονται τα δείγματα είναι κανονικοί με κοινή διασπορά.. Οι υποθέσεις, κατά περίπτωση, που αφορούν τον τρόπο λήψης των παρατηρήσεων, δηλαδή, το πειραματικό σχέδιο. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 96

6 Εντελώς Τυχαιοποιημένο Σχέδιο (Completely Randomized Design) Πρόκειται για το πιο απλό πειραματικό σχέδιο, σύμφωνα με το οποίο, εργαζόμαστε με k ανεξάρτητα τυχαία δείγματα, ένα από κάθε πληθυσμό (ή αλλιώς, ένα από κάθε στάθμη του παράγοντα ή ένα από κάθε επέμβαση) και αποτελεί ευθεία γενίκευση του σχεδίου που γνωρίσαμε στα προηγούμενα όταν μιλήσαμε για τον έλεγχο των μέσων, μ και μ, δύο κανονικών πληθυσμών με δύο ανεξάρτητα τυχαία δείγματα. Τέτοια σχέδια είναι αυτά των Προβλημάτων και. Προτείνεται για περιπτώσεις όπου θεωρούμε ότι μόνο ένας παράγοντας ξεχωρίζει ως αξιοσημείωτη πηγή μεταβλητότητας της μεταβλητής απόκρισης και κάθε άλλη μεταβλητότητα στις τιμές της μεταβλητής απόκρισης, πέραν αυτής που οφείλεται σε αυτόν τον παράγοντα (επεμβάσεις), θεωρείται τυχαία μεταβλητότητα/πειραματικό σφάλμα. Δηλαδή, θεωρούμε ότι οι πειραματικές μονάδες δεν προσθέτουν μεταβλητότητα στις τιμές της μεταβλητής απόκρισης. Για παράδειγμα, στο Πρόβλημα-, ο φοιτητής, ως πηγή μεταβλητότητας των τιμών της χοληστερίνης, ξεχώρισε (για να μελετήσει) μόνο τον παράγοντα είδος τροφίμου διαίτης και όχι και κάποιον άλλο (π.χ. παραγωγός του τροφίμου διαίτης) και στο Πρόβλημα-, ο φοιτητής ξεχώρισε μόνο τον παράγοντα είδος πρόσθετης ύλης ως πηγή μεταβλητότητας της αύξησης του βάρους των νεογέννητων χοίρων. Άλλους παράγοντες που πιθανόν επηρεάζουν τη μεταβλητότητα της αύξησης του βάρους των νεογέννητων χοίρων (π.χ. ατομικότητα του ζώου, φυλή, γένος, συνθήκες ενσταυλισμού) δεν τους έλαβε υπόψη του στο σχεδιασμό. Ας θεωρήσουμε, ότι από καθέναν από k ( > ) κανονικούς πληθυσμούς με κοινή διασπορά, σ, και μέσες τιμές, αντίστοιχα, μ, μ,..., μk, παίρνουμε ένα τυχαίο δείγμα μεγέθους, αντίστοιχα, n, n,..., nk για να κάνουμε, με βάση αυτά τα k δείγματα, τον έλεγχο, της μηδενικής υπόθεσης, μ = μ =... = μ k : : μi μ για ένα τουλάχιστον ζεύγος (i, ) έναντι της εναλλακτικής, Πριν συνεχίσουμε την παρουσίαση της μεθόδου, επισημαίνουμε ότι, επειδή θεωρούμε ότι οι k πληθυσμοί είναι κανονικοί με κοινή διασπορά, σ, τότε, αν η μηδενική υπόθεση είναι αληθής, αυτό σημαίνει ότι τα k δείγματα προέρχονται από τον ίδιο πληθυσμό με κατανομή N ( μ, σ ), όπου, μ = μ = μ =... = μ k. Σημειώνουμε, επίσης, ότι ο συγκεκριμένος στατιστικός έλεγχος ανάλυσης διασποράς, εφαρμόζεται και για k = και μάλιστα, είναι ισοδύναμος, δηλαδή οδηγεί σε ταυτόσημα αποτελέσματα, με τον έλεγχο δύο μέσων με δύο ανεξάρτητα τυχαία δείγματα που γνωρίσαμε στα προηγούμενα. Η βασική ιδέα της μεθόδου είναι η εξής: όλες οι διαφορές στους δειγματικούς μέσους (στους μέσους των επεμβάσεων), y, y,..., yk, κρίνονται στατιστικά σημαντικές ή όχι, σε σχέση με τις μεταβλητότητες (διασπορές) εντός των δειγμάτων. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 97

7 Έτσι, παρότι στις δύο περιπτώσεις που φαίνονται στο Σχήμα-, οι αντίστοιχοι δειγματικοί μέσοι είναι ίσοι, στην πρώτη περίπτωση οι διαφορές που παρατηρούνται στους τρεις δειγματικούς μέσους κρίνονται στατιστικά σημαντικές και η μηδενική υπόθεση απορρίπτεται γιατί οι μεταβλητότητες εντός των δειγμάτων είναι μικρές, ενώ στη δεύτερη περίπτωση, ίδιες διαφορές στους δειγματικούς μέσους, δεν κρίνονται στατιστικά σημαντικές και η μηδενική υπόθεση δεν απορρίπτεται, γιατί οι μεταβλητότητες εντός των δειγμάτων είναι μεγάλες. μ = = απορρίπτεται : μ μ μ = = δεν απορρίπτεται : μ μ Σχήμα- Αυτή η ιδέα, «τεχνικά», υλοποιείται ως εξής: Εκτιμάμε την κοινή διασπορά, σ, των k κανονικών πληθυσμών (είναι άγνωστη συνήθως), με δύο τρόπους: ος τρόπος. Με το σταθμισμένο μέσο s w των k δειγματικών διασπορών, s, s,..., sk, δηλαδή, με το σταθμισμένο μέσο των διασπορών εντός των δειγμάτων (όπως κάναμε στον έλεγχο δύο μέσων με δύο ανεξάρτητα τυχαία δείγματα): ( n ) s + ( n ) s... + ( nk ) sk sw =, ν k όπου, ν = n + n n. k Αυτή η εκτίμηση είναι μια «λογική και καλή» εκτίμηση της από κοινού διασποράς, σ, ανεξάρτητα αν οι k μέσοι, μ, μ,..., μ k, είναι ίσοι ή όχι, δηλαδή, ανεξάρτητα αν η μηδενική υπόθεση είναι ή όχι αληθής. k = n ( y y) ος τρόπος. Με την sb =, όπου, y ο γενικός μέσος (ο μέσος όλων k των ν = n + n nk παρατηρήσεων) και y ο μέσος του δείγματος. Με αυτό τον τρόπο αξιοποιούμε τη σχέση που συνδέει τη διασπορά του πληθυσμού, σ, με τη διασπορά του δειγματικού μέσου, σ, δηλαδή, αξιοποιούμε τη σχέση, σ = nσ Y Y, που συνδέει τη διασπορά του πληθυσμού με τη διασπορά μεταξύ των δειγμάτων που παίρνουμε από αυτόν. Βέβαια, αυτή η εκτίμηση, είναι «λογική» και περιμένουμε να είναι περίπου ίση με την s w, μόνο αν η μηδενική υπόθεση είναι αληθής, δηλαδή, μόνο αν μ = μ =... = μ k = μ, γιατί στην περίπτωση αυτή τα k δείγματα θα προέρχονται από τον ίδιο κανονικό πληθυσμό, N ( μ, σ ), και επομένως μπορούμε τότε να αξιοποιήσουμε τη σχέση σ = nσ Y. sb Αν επομένως, η μηδενική υπόθεση είναι αληθής, αναμένουμε ο λόγος να είναι sw κοντά στο ένα, ενώ αν δεν είναι αληθής, περιμένουμε να αυξάνεται γιατί θα αυξάνεται ο αριθμητής που εμπεριέχει/ενσωματώνει και τη μεταβλητότητα στους δειγματικούς μέσους. Έτσι, ως κριτήριο/στατιστική συνάρτηση ελέγχου μπορούμε να χρησιμοποιήσουμε το λόγο: Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 98

8 μεταβλητό τητα μεταξύ των δειγμάτων μεταβλητότητα εντός των δειγμάτων Ανάλυση Διασποράς Ας συμβολίσουμε αυτόν το λόγο με F Tr. Προφανώς, με βάση τα προηγούμενα, ο SSTr ( k ) MSTr λόγος αυτός, μπορεί να εκφρασθεί ως, F tr = =, όπου, SSE ( ν k) MSE SSTr = n ( y y), ονομάζεται άθροισμα τετραγώνων των επεμβάσεων (ή αλλιώς, μεταξύ των δειγμάτων) και εκφράζει τη μεταβλητότητα μεταξύ των μέσων των k επεμβάσεων (ή αλλιώς, μεταξύ των μέσων των δειγμάτων) και έχει k βαθμούς ελευθερίας, SSE = ( y i y ), ονομάζεται άθροισμα τετραγώνων του σφάλματος και εκφράζει i τη μεταβλητότητα εντός των δειγμάτων (ή αλλιώς εντός των επεμβάσεων) και έχει ν k βαθμούς ελευθερίας, SSTr SSE MSTr = και MSE = ονομάζονται, αντίστοιχα, μέσο άθροισμα k ν k τετραγώνων των επεμβάσεων και μέσο άθροισμα τετραγώνων του σφάλματος και προφανώς είναι οι δύο εκτιμήτριες της κοινής διασποράς σ (που εξηγήσαμε προηγουμένως). Μάλιστα, (εύκολα) αποδεικνύεται ότι, n ( y y) + ( y y ) = ( y y), i i όπου, το διπλό άθροισμα ( y i y), συμβολίζεται με SSTot, ονομάζεται ολικό i άθροισμα τετραγώνων, έχει ν βαθμούς ελευθερίας και προφανώς εκφράζει την ολική μεταβλητότητα των παρατηρήσεων, ή αλλιώς, τη μεταβλητότητα όλων των παρατηρήσεων γύρω από το γενικό δειγματικό μέσο y. Δηλαδή, η ολική μεταβλητότητα, SSTot = ( y i y), αναλύεται σε δύο συνιστώσες: στη μεταβλητότητα μεταξύ των δειγμάτων: SSTr = n ( y y) και στη μεταβλητότητα εντός των δειγμάτων: SSE = ( y i y ). Δηλαδή, SSTr + SSE = SSTot. Αποδεικνύεται ότι, με την υπόθεση ότι η μηδενική υπόθεση, i i i i : μ = μ =... = μ k, είναι αληθής, η τυχαία μεταβλητή F Tr ακολουθεί την κατανομή F με k και ν k βαθμούς ελευθερίας, δηλαδή, MSTr Ftr = ~ F k ; ν k. MSE Επομένως, σε επίπεδο σημαντικότητας α %, η απορριπτική περιοχή του ελέγχου είναι: MSTr F tr = > Fk ; ν -k;α. MSE Για διευκόλυνση στον υπολογισμό των SSTot, SSTr και SSE, δίνουμε τους παρακάτω τύπους (αποδεικνύονται πολύ εύκολα). k G T G SSTot = yi, SSTr = και SSE = SSTot SSTr, όπου, ν n ν i = Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 99

9 G = i k y i = T = Ανάλυση Διασποράς, το γενικό άθροισμα (Grand total) των παρατηρήσεων, δηλαδή το άθροισμα όλων των ν = n + n nk, παρατηρήσεων και T, άθροισμα όλων των παρατηρήσεων του δείγματος. =,,..., k, το Για διευκόλυνσή μας, όλες τις πληροφορίες που είναι απαραίτητες για τον έλεγχο ανάλυσης διασποράς (αθροίσματα τετραγώνων, βαθμοί ελευθερίας, μέσα αθροίσματα τετραγώνων, τιμή του κριτηρίου) τις συγκεντρώνουμε σε έναν πίνακα που ονομάζεται Πίνακας Ανάλυσης Διασποράς (ANOVA Table). Πηγή μεταβλητότητας Επεμβάσεις (Treatments) ή Παράγοντας (factor) ή μεταξύ των δειγμάτων Σφάλμα (Error) ή εντός των δειγμάτων Β.Ε. Πίνακας Ανάλυσης Διασποράς (για το εντελώς τυχαιοποιημένο σχέδιο) Μέσο Άθροισμα άθροισμα τετραγώνων Κριτήριο F τετραγώνων SS MS k SSTr ν k SSE Ολική ν SSTot SSTr MSTr = k SSE MSE = ν k Περιοχή απόρριψης MSTr F Tr = FTr > F k ;ν k; α MSE Σημείωση: Στην περίπτωση που η κοινή διασπορά, σ, των k κανονικών πληθυσμών είναι γνωστή (κάτι το οποίο βέβαια δεν είναι σύνηθες σε πραγματικά προβλήματα), ως SSTr στατιστική συνάρτηση ελέγχου χρησιμοποιούμε το λόγο,. Με την υπόθεση ότι η σ SSTr μηδενική υπόθεση είναι αληθής, αποδεικνύεται ότι ~ χ k και επομένως, σε σ SSTr επίπεδο σημαντικότητας α %, η απορριπτική περιοχή του ελέγχου είναι, > χ k ; α. σ Ας δούμε, ως ένα παράδειγμα, πώς εφαρμόζουμε τα προηγούμενα για να απαντήσουμε στο ερώτημα που τίθεται στο Πρόβλημα-. Παράδειγμα-(αναφέρεται στο Πρόβλημα-): Προφανώς, το πείραμα σχεδιάσθηκε με βάση το εντελώς τυχαιοποιημένο σχέδιο. Έχουμε στη διάθεσή μας k = 4, ανεξάρτητα τυχαία δείγματα και κάνοντας τις παραδοχές ότι καθένα από αυτά προέρχεται από κανονικό πληθυσμό με διασπορά, σ, κοινή και για τους τέσσερις πληθυσμούς, θα εφαρμόσουμε τη μέθοδο ανάλυσης διασποράς για να ελέγξουμε, σε επίπεδο σημαντικότητας 5%, αν οι μέσες τιμές, μ, μ, μ, μ4, αντίστοιχα, των τεσσάρων πληθυσμών είναι ίσες ή όχι. Δηλαδή, θα ελέγξουμε αν τα συγκεκριμένα τέσσερα ανεξάρτητα τυχαία δείγματα υποστηρίζουν ή όχι, ότι η αύξηση του βάρους νεογέννητων χοίρων κατά τους τρεις πρώτους μήνες από τη γέννησή τους, επηρεάζεται από το είδος πρόσθετης ύλης (αν διαφοροποιείται από είδος σε είδος πρόσθετης ύλης). Συγκεκριμένα, σε επίπεδο σημαντικότητας 5%, θα κάνουμε τον έλεγχο της μηδενικής υπόθεσης, Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

10 : μ = μ = μ = μ4, έναντι της εναλλακτικής, : μi μ, για ένα τουλάχιστον ζευγάρι ( i, ), i, =,,, 4. Ανάλυση Διασποράς Τα τέσσερα δείγματα έχουν ίδιο μέγεθος, 5, δηλαδή, n = n = n = n4 = 5 και επομένως συνολικά έχουμε στη διάθεσή μας, ν = n + n + n + n4 = παρατηρήσεις. Για να κατασκευάσουμε τον πίνακα ανάλυσης διασποράς, κατ αρχάς, θα υπολογίσουμε τα αθροίσματα τετραγώνων SSTr, SSE και SSTot. Α Α Α Α T = 6 T = 4 T 66 T = 4 8 Το γενικό άθροισμα των ν = παρατηρήσεων είναι, G = y i = T = 45 και επομένως: G 45 SSTot = yi = ( ) = 88.55, i ν με ν = 9 βαθμούς ελευθερίας. = i 4 = T SSTr = 4 G = n ν βαθμούς ελευθερίας. 6 = = 54.5, με k = SSE = SSTot SSTr = = 684.4, με ν k = 6 βαθμούς ελευθερίας. Μπορούμε πλέον να κατασκευάσουμε τον πίνακα ανάλυσης διασποράς: Πίνακας Ανάλυσης Διασποράς Άθροισμα Μέσο άθροισμα Β.Ε. τετραγώνων τετραγώνων Κριτήριο F SS MS MSTr = = 5. 8 F Tr = = Σφάλμα MSE = = Πηγή μεταβλητότητας Παράγοντας (ή επεμβάσεις) (είδος πρόσθετης ύλης) Ολική Επειδή η τιμή F Tr =. δε βρίσκεται στην περιοχή απόρριψης της μηδενικής υπόθεσης αφού, F ;6;.5 =. 4, συμπεραίνουμε ότι, σε επίπεδο σημαντικότητας 5%, τα πειραματικά δεδομένα δεν υποστηρίζουν ότι το είδος πρόσθετης ύλης, επηρεάζει την αύξηση του βάρους νεογέννητων χοίρων κατά τους τρεις πρώτους μήνες από τη γέννησή τους. Για προβληματισμό: γιατί άραγε, ο επιβλέπων καθηγητής, μετά από αυτό το συμπέρασμα, πρότεινε στο φοιτητή (δες Πρόβλημα-) να εκτελέσει ένα ακόμη πείραμα, και μάλιστα, με διαφορετικό πειραματικό σχέδιο; Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

11 Ας δούμε ένα ακόμη παράδειγμα. Παράδειγμα-: Ένας μεταπτυχιακός φοιτητής του Τμήματος Γεωπονικής Βιοτεχνολογίας του Γ.Π.Α., στο πλαίσιο μιας εργαστηριακής άσκησης, διερεύνησε την περιεκτικότητα σε σωματιδιακές προσμείξεις ενός υγρού φαρμακευτικού σκευάσματος που χορηγείται ενδοφλεβίως σε ταύρους και παράγεται από τρεις διαφορετικές εταιρείες Α, Α και Α. Συγκεκριμένα, έλεγξε 6 σκευάσματα από κάθε εταιρεία (τυχαία επιλεγμένα) και κατέγραψε τον αριθμό σωματιδίων με διάμετρο μεγαλύτερη των 5 microns ανά λίτρο. Οι μετρήσεις που πήρε δίνονται στον πίνακα που ακολουθεί. Εταιρεία παραγωγής Αριθμός σωματιδίων (ανά λίτρο) Α Α Α Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα δεδομένα ότι υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των σκευασμάτων των τριών εταιρειών ως προς τη μέση περιεκτικότητά τους σε σωματιδιακές προσμείξεις; Ο φοιτητής έχει στη διάθεσή του 8 παρατηρήσεις, που συγκέντρωσε παίρνοντας k =, ανεξάρτητα τυχαία δείγματα. Με τις παραδοχές ότι καθένα από αυτά προέρχεται από κανονικό πληθυσμό με διασπορά, σ, κοινή και για τους τρεις πληθυσμούς, εφάρμοσε τη μέθοδο ανάλυσης διασποράς για να ελέγξει, σε επίπεδο σημαντικότητας 5%, αν οι μέσες τιμές, μ, μ, μ, αντίστοιχα, των τριών πληθυσμών είναι ίσες ή όχι. Δηλαδή, για να ελέγξει τη μηδενική υπόθεση, : μ = μ = μ, έναντι της εναλλακτικής, : μi μ, για ένα τουλάχιστον ζευγάρι ( i, ), i, =,,. Ο φοιτητής χρησιμοποίησε, για τους αναγκαίους υπολογισμούς, το στατιστικό πακέτο Statgraphics από το οποίο πήρε τον ακόλουθο πίνακα ανάλυσης διασποράς. ANOVA Table for αριθμός-σωματιδίων by εταιρεία-παραγωγής Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Between groups Within groups Total Επειδή P Value =.6 <. 5 (ή επειδή F Tr = 5.8 > F ;5;. 5 =. 68 ), η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 5% απορρίπτεται. Δηλαδή, τα δεδομένα από τα τρία συγκεκριμένα ανεξάρτητα και τυχαία δείγματα, δίνουν στατιστικά σημαντικές αποδείξεις ότι ο μέσος αριθμός σωματιδιακών προσμείξεων δεν είναι ίδιος στα τρία φαρμακευτικά σκευάσματα. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ.5 (μάλιστα, επειδή το στατιστικό πακέτο υπολόγισε την P-Value, μπορούμε να πούμε ότι αυτή η πιθανότητα είναι το πολύ.6). Βέβαια, το επόμενο (εύλογο) ερώτημα είναι: εφόσον η μηδενική υπόθεση απορρίπτεται, τι μπορούμε να πούμε για τις διαφορές των τριών μέσων; Διαφέρουν όλοι μεταξύ τους ή μόνο ένας (και ποιος είναι αυτός); Φυσικά, αυτό το ερώτημα, προκύπτει κάθε φορά που σε έναν έλεγχο ανάλυσης διασποράς, απορρίπτεται η μηδενική υπόθεση. Η απάντηση δεν είναι απλή, και ουσιαστικά, το ερώτημα αυτό, θέτει και πάλι το πρόβλημα πολλαπλών συγκρίσεων. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

12 Στη συνέχεια, θα δούμε κάποιες από τις απαντήσεις που δίνει σε αυτό το πρόβλημα η στατιστική συμπερασματολογία. (- α)% Διαστήματα Εμπιστοσύνης για τη μέση τιμή ενός πληθυσμού (ή αλλιώς, μιας επέμβασης) και για τη διαφορά των μέσων τιμών δύο πληθυσμών (ή αλλιώς, δύο επεμβάσεων) στο εντελώς τυχαιοποιημένο σχέδιο Ο φοιτητής (του προηγούμενου παραδείγματος), πιστεύει/υποψιάζεται, ότι από τα τρία φαρμακευτικά σκευάσματα, μεγαλύτερο αριθμό σωματιδιακών προσμείξεων περιέχει το σκεύασμα της εταιρείας Α και επίσης, ότι τα σκευάσματα των εταιρειών Α και Α μάλλον δε διαφέρουν (ως προς τον αριθμό σωματιδιακών προσμείξεων). Σε περιπτώσεις που υπάρχει ειδικό/προσχεδιασμένο ενδιαφέρον για κάποια k συγκεκριμένη, από τις k >, μέσες τιμές ή για κάποια, από τις, διαφορές μi μ, μια λύση είναι να κατασκευάσουμε ένα ( α ) % διάστημα εμπιστοσύνης, για τη συγκεκριμένη μέση τιμή που μας ενδιαφέρει και ένα ( α ) % διάστημα εμπιστοσύνης, για τη συγκεκριμένη διαφορά που μας ενδιαφέρει, χρησιμοποιώντας την κατανομή t. Μάλιστα, το απαιτούμενο για την κατασκευή των διαστημάτων s, μπορούμε να το υπολογίζουμε ως την τετραγωνική ρίζα του MSE αφού το MSE είναι αμερόληπτη εκτιμήτρια της άγνωστης διασποράς σ και μάλιστα υπολογίζεται από όλες τις παρατηρήσεις. Βέβαια, στην περίπτωση αυτή, για την κριτική τιμή χρησιμοποιούμε ν k βαθμούς ελευθερίας. (- α)% διάστημα εμπιστοσύνης για ένα μέσο μ i s y ± t ν k; n α (- α)% διάστημα εμπιστοσύνης για τη διαφορά μi μ δύο μέσων ( yi y ) ± s + tν k; α n i n Όπου, s = MSE και ν = n + n nk. Έτσι, στο παράδειγμά μας, έχουμε s = MSE = = 98. 9, y = 7. 8, y = 4.5, 67 y = 96. και επομένως, ένα 95% διάστημα εμπιστοσύνης για το μέσο αριθμό, μ, σωματιδιακών προσμείξεων στο φαρμακευτικό σκεύασμα της εταιρείας Α, είναι, s y ± t ν k ; α ή ± t5;. 5 ή ±. ή ± 86. n 6 6 και ένα 95% διάστημα εμπιστοσύνης για τη διαφορά μ μ των μέσων των σωματιδιακών προσμείξεων των σκευασμάτων των εταιρειών Α και Α είναι, ( y y) ± s + t ν k; α ή ( ) ± 98.9 t5;. 5 ή n n ±.69 ή [ 9., 5.6]. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

13 Παρατηρούμε ότι το 95% διάστημα εμπιστοσύνης, [ 9., 5.6], για τη διαφορά μ μ, περιέχει το και επομένως, σε επίπεδο σημαντικότητας 5%, τα δεδομένα από τα δείγματα δεν δείχνουν στατιστικά σημαντική διαφορά των μέσων των σωματιδιακών προσμείξεων των σκευασμάτων των εταιρειών Α και Α, δηλαδή, φαίνεται ότι ήταν βάσιμη η υποψία του ερευνητή. Στο Σχήμα- φαίνονται οι μέσοι των τριών δειγμάτων και τα αντίστοιχα 95% διαστήματα εμπιστοσύνης που κατασκευάσθηκαν όπως περιγράψαμε προηγουμένως. Το διάγραμμα αυτό έγινε με το στατιστικό πακέτο Statgraphics. Σχήμα- Παρατηρείστε, ότι υπάρχει επικάλυψη των διαστημάτων που αντιστοιχούν στα σκευάσματα των εταιρειών Α και Α αλλά και μεταξύ των Α και Α ενώ δεν υπάρχει μεταξύ των Α και Α. Όμως, αν ο φοιτητής δεν έχει προσχεδιάσει, δεν έχει εκ των προτέρων (a priori) ειδικό ενδιαφέρον, για κάποια διαφορά (π.χ, για την μ μ όπως είδαμε) και εκ των υστέρων (a posteriori) θέλει να διερευνήσει τη σημαντικότητα όλων των c = διαφορών, δηλαδή, και των διαφορών μ μ και μ μ, τότε απαιτείται άλλη προσέγγιση γιατί, όπως έχουμε εξηγήσει, αυξάνεται ραγδαία η πιθανότητα να αναδείξει τουλάχιστον μια από τις c διαφορές στατιστικά σημαντική ενώ δεν είναι (δηλαδή, η πιθανότητα να συμβεί τουλάχιστον μια φορά σφάλμα τύπου Ι ή αλλιώς, η πιθανότητα να συμβεί κατά πείραμα σφάλμα τύπου Ι). Ας δούμε πώς μπορούμε να κάνουμε πολλαπλές συγκρίσεις χωρίς να μας «ξεφεύγει» η πιθανότητα να κάνουμε σφάλμα τύπου Ι σε τουλάχιστον μια από αυτές, δηλαδή, η πιθανότητα σφάλματος τύπου Ι κατά πείραμα που συμβολίσαμε με α. Έλεγχοι πολλαπλών συγκρίσεων (multiple comparisons tests) Η πιο απλή (γιατί δεν υπάρχει μόνο μια) εκδοχή του προβλήματος των πολλαπλών συγκρίσεων, είναι αυτή στην οποία ήδη έχουμε αναφερθεί, δηλαδή, ο έλεγχος της : μ i = μ, έναντι της εναλλακτικής : μi μ, για όλα τα i, με i. Από τους πιο γνωστούς ελέγχους πολλαπλών συγκρίσεων αυτής της μορφής, είναι η διαδικασία/μέθοδος Tukey (95) (Tukey s method for paired comparisons), γνωστή και ως SD test (onestly Significant Difference test). Στη διαδικασία Tukey, όχι απλώς δεν μας «ξεφεύγει» το κατά πείραμα σφάλμα τύπου Ι, δηλαδή, η πιθανότητα να k κάνουμε σφάλμα τύπου Ι σε τουλάχιστον έναν από τους c = ελέγχους, αλλά το θέτουμε υπό τον έλεγχό μας, προκαθορίζοντάς το!! Δηλαδή, η διαδικασία Tukey, επιτυγχάνει το εξής: η πιθανότητα, μια τουλάχιστον διαφορά μ μ να αναδειχθεί, Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 4 i PE

14 ενώ δεν είναι, στατιστικά σημαντική, να είναι ίση με α %, που εμείς καθορίσαμε και επομένως προσφέρει μεγάλη προστασία από σφάλματα τύπου Ι αλλά γι αυτό θεωρείται (και είναι) συντηρητικός έλεγχος στην ανάδειξη στατιστικά σημαντικών διαφορών. Η διατήρηση της πιθανότητας σφάλματος τύπου Ι κατά πείραμα, σε προκαθορισμένο επίπεδο, επιτυγχάνεται με έναν απλό και έξυπνο τρόπο. Κατασκευάζουμε για όλες τις διαφορές μi μ, ( α)% ταυτόχρονα διαστήματα εμπιστοσύνης χρησιμοποιώντας την κατανομή studentized range Qk ; nk k και οι έλεγχοι της σημαντικότητάς τους γίνονται με αυτά τα διαστήματα. ( studentized range κατανομή Q είναι η κατανομή της τυχαίας μεταβλητής, S R όπου, R είναι το εύρος k κανονικών τυχαίων μεταβλητών και S μια εκτιμήτρια της τυπικής απόκλισής τους με υ βαθμούς ελευθερίας.) Αποδεικνύεται (δεν είναι δύσκολο) ότι, αν Y, =,,..., k είναι οι k δειγματικοί μέσοι σε ένα εντελώς τυχαιοποιημένο σχέδιο με k στάθμες, όπου για κάθε k στάθμη έχουμε ίδιο αριθμό παρατηρήσεων n = n = n =... = nk, τότε, τα ταυτόχρονα ( α)% διαστήματα εμπιστοσύνης για τις διαφορές μi μ είναι, MSE MSE Yi Y Qk; nk k; α, Yi Y + Qk; nk k; α, n n όπου, Qk; nk k; α το άνω α% ποσοστιαίο σημείο της Qk ; nk k κατανομής (υπάρχουν σχετικοί πίνακες). Ας δούμε πώς, κατασκευάζοντας 95% διαστήματα εμπιστοσύνης Tukey, μπορούμε να συγκρίνουμε, ανά δύο, τους μέσους, μ, μ, μ, του Παραδείγματος-. Παράδειγμα- (συνέχεια): Έχουμε, y = 7. 8, y = 4. 5, 67 y = 96., k =, MSE n = 6 και άρα, Q ; nk k; = Q;5;.5 = = 48. n 6 Έτσι, έχουμε: μi μ Yi Y k α. Q k; nk k; α MSE (όρια +/-) n 95% Δ.Ε. Tukey Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 5 k; υ Συμπέρασμα για τον έλεγχο: : μ = μ i : μ μ μ μ ( 78.9, 7.5) Δεν απορρίπτεται η μ μ ( 7., 5.4) Δεν απορρίπτεται η. μ μ Απορρίπτεται η ( 4.4, 44.) Επομένως, στατιστικά σημαντική αναδείχθηκε μόνο η διαφορά μ μ. Η πιθανότητα να κάνουμε ένα τουλάχιστον σφάλμα τύπου Ι στους τρεις ελέγχους, είναι το πολύ 5%. Στον πίνακα που ακολουθεί φαίνονται τα αποτελέσματα που παίρνουμε από το στατιστικό πακέτο Statgraphics, για τη διαδικασία Tukey που μόλις εφαρμόσαμε. i

15 Παρατηρείστε τη στήλη με τους δειγματικούς μέσους. Έχουν γραφεί σε αύξουσα σειρά και στην πρώτη στήλη έχουν γραφεί οι αντίστοιχες στάθμες (Α, Α, Α) του παράγοντα (εταιρεία παραγωγής). Παρατηρείστε, επίσης, τη στήλη με τα σύμβολα «Χ». Αυτά, «διαβάζονται» ως εξής: Στους μέσους που αντιστοιχούν σε «Χ» που βρίσκονται στην ίδια στήλη, δεν διαπιστώθηκε στατιστικά σημαντική διαφορά. Multiple Range Tests for αριθμός_σωματιδίων by εταιρεία-παραγωγής Method: 95, percent Tukey SD Εταιρεία-παραγωγής Count Mean omogeneous Groups X XX X Contrast Difference +/- Limits * *denotes a statistically significant difference. Η διαδικασία Tukey μπορεί να εφαρμοσθεί και ως εξής: Διατάσσουμε τους τρεις δειγματικούς μέσους σε αύξουσα σειρά, y = 4. 5, y = 7. 8, 67 y = 96. και Yi Y κάνουμε όλους τους ανά δύο ελέγχους με απορριπτική περιοχή, > Qk; nk k; α MSE n ή Yi Y > Qk; nk k; α MSE n, και αρχίζοντας με τη σύγκριση των μέσων που οι αντίστοιχοι δειγματικοί μέσοι είναι ο μεγαλύτερος και ο μικρότερος, συνεχίζουμε με την ίδια λογική. Αν η μηδενική υπόθεση δεν απορριφθεί για ένα ζευγάρι μέσων, τότε, οι έλεγχοι για τους μέσους που οι αντίστοιχοι δειγματικοί βρίσκονται εντός του εύρους των δειγματικών μέσων των δύο συγκρινόμενων μέσων, δε χρειάζεται να γίνουν. Δηλαδή, αν στο παράδειγμά μας, δεν απορριφθεί η : μ = μ, τότε δε χρειάζεται να γίνει και ο έλεγχος της : μ = μ (γιατί;). Στον πίνακα που ακολουθεί φαίνεται αυτός ο τρόπος εφαρμογής της διαδικασίας Tukey. Σύγκριση μ i i vs μ Y Y MSE n q Y Y i = Q ;5;. 5 MSE n Συμπέρασμα για τον έλεγχο: : μ = μ i : μ μ μ vs μ Απορρίπτεται η μ vs μ Δεν απορρίπτεται η μ vs Δεν απορρίπτεται η μ Στο Σχήμα- που ακολουθεί φαίνεται το διάγραμμα μέσων με τα αντίστοιχα 95% διαστήματα εμπιστοσύνης Tukey. i Σχήμα- Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 6

16 Παρατηρήσεις:. Αρκετά συχνά, όπως συμβαίνει και στο προηγούμενο παράδειγμα, τα αποτελέσματα ενός ελέγχου πολλαπλών συγκρίσεων, μπορεί να φαίνονται διφορούμενα/ασαφή. Παρατηρώντας τη στήλη με τα σύμβολα «Χ», φαίνεται το δείγμα και το δείγμα να προέρχονται από έναν πληθυσμό και το δείγμα και το δείγμα από έναν άλλο πληθυσμό. Και, φυσικά, γεννάται η απορία: τελικά από ποιον από τους δύο αυτούς πληθυσμούς προέρχεται το δείγμα; Η απάντηση είναι εξής: προφανώς η μέθοδος δε μπόρεσε να ταξινομήσει με σαφήνεια το δείγμα (συνέβη τουλάχιστον ένα σφάλμα τύπου ΙΙ). Επομένως, στο παράδειγμά μας, το συμπέρασμα από τις τρεις ανά δύο συγκρίσεις με τη διαδικασία Tukey, είναι ότι μ μ και όχι μ = μ μ = μ. Μια λύση στο πρόβλημα αυτό μπορεί να είναι η επανάληψη της δειγματοληψίας με μεγαλύτερα μεγέθη δειγμάτων, για να αυξήσουμε την ισχύ του ελέγχου ή ισοδύναμα, για να μειώσουμε την πιθανότητα να συμβεί σφάλμα τύπου ΙΙ. Μπορούμε, βέβαια, να κάνουμε κάποιον άλλο, πιο ισχυρό, έλεγχο (αλλά, φυσικά, με το ανάλογο κόστος στην πιθανότητα σφάλματος τύπου Ι).. Αν τα k δείγματα δεν είναι του ιδίου μεγέθους, η μέθοδος Tukey μπορεί να εφαρμοσθεί με κατάλληλη προσαρμογή στον υπολογισμό των ορίων των διαστημάτων. Αντί MSE χρησιμοποιούμε n MSE + ni n Μια άλλη, πολύ γνωστή επίσης, μέθοδος πολλαπλών συγκρίσεων είναι η διαδικασία/μέθοδος Newman-Keuls (99; 95) γνωστή και ως Student-Newman- Keuls/SΝK. Είναι ανάλογη με τη διαδικασία Tukey με μία διαφορά. Η κριτική τιμή είναι Q p; nk k; α, όπου p, ο αριθμός των μέσων που βρίσκονται στο εύρος που ορίζουν οι συγκρινόμενοι κάθε φορά μέσοι. Δηλαδή η κριτική τιμή, Q p; nk k; α, δεν είναι ίδια για όλους τους ανά δύο ελέγχους. Ας εφαρμόσουμε τη μέθοδο SΝK για τα δεδομένα του Παραδείγματος-. Παράδειγμα- (συνέχεια): Διατάσσουμε τους τρεις δειγματικούς μέσους σε αύξουσα σειρά: y = 4. 5, y = 7. 8, 67 y = 96. Σύγκριση μ i vs μ Yi Y MSE n Y Y q = p Q p;5;. 5 MSE n i. Συμπέρασμα για τον έλεγχο: : μ = μ i : μ μ μ vs μ Απορρίπτεται η μ vs μ Απορρίπτεται η μ vs Δεν απορρίπτεται η μ Στατιστικά σημαντικές, με τη διαδικασία SNK, βλέπουμε ότι αναδείχθηκαν δύο διαφορές, η μ μ και η μ μ, ενώ με τη διαδικασία Tukey, όπως είδαμε, στατιστικά σημαντική αναδείχθηκε μόνο η διαφορά μ μ. Γενικά, η διαδικασία SNK είναι πιο ισχυρή (πιο ευαίσθητη, ή αλλιώς, λιγότερο συντηρητική, στην ανάδειξη διαφορών) από τη διαδικασία Tukey, δηλαδή, τείνει να αναδεικνύει, ως στατιστικά σημαντικές διαφορές, περισσότερες από αυτές που αναδεικνύει η διαδικασία Tukey. Όμως, η πιθανότητα α PE, να συμβεί τουλάχιστον ένα σφάλμα τύπου Ι, μπορεί να ξεπεράσει το επίπεδο που ορίζουμε (στο παράδειγμά μας, το 5%). i Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 7

17 Στον πίνακα που ακολουθεί φαίνονται τα αποτελέσματα που παίρνουμε από το στατιστικό πακέτο Statgraphics, για τη διαδικασία SNK που μόλις εφαρμόσαμε. Multiple Range Tests for αριθμός_σωματιδίων by εταιρεία-παραγωγής Method: 95, percent Student-Newman-Keuls Εταιρεία-παραγωγής Count Mean omogeneous Groups X X X Contrast Difference *-.8 - * * denotes a statistically significant difference. Παρατηρείστε τη στήλη με τα σύμβολα «Χ». Χρησιμοποιώντας έναν πιο ισχυρό έλεγχο, το πρόβλημα με την ασάφεια στην ταξινόμηση του δείγματος δεν υφίσταται πλέον (μπορούμε δηλαδή να πούμε ότι το συμπέρασμα είναι, μ = μ μ, αλλά (επειδή όλα στη ζωή έχουν κόστος) μπορεί η πιθανότητα, στις τρεις συγκρίσεις, να κάνουμε τουλάχιστον ένα σφάλμα τύπου Ι, να έχει αυξηθεί. Στη συνέχεια, θα αναφερθούμε σε βασικά μόνο χαρακτηριστικά και στη λογική πέντε ακόμη ελέγχων πολλαπλών συγκρίσεων χωρίς να αναφερθούμε λεπτομερώς σε αυτούς (η εκτέλεσή τους είναι πλέον εύκολη με χρήση στατιστικών πακέτων). Συγκεκριμένα, θα αναφερθούμε στους ελέγχους/μεθόδους, Scheffe, Dunn, Dunnett, Duncan και LSD. Ο έλεγχος Scheffe ή S-Method, διατηρεί την πιθανότητα σφάλματος τύπου Ι κατά πείραμα, σε προκαθορισμένο επίπεδο, όπως η διαδικασία Tukey και επομένως μας προσφέρει μεγάλη προστασία από σφάλματα τύπου Ι. Όμως, έχει σχεδιασθεί όχι για πολλαπλές συγκρίσεις ανά δύο αλλά για άλλου τύπου συγκρίσεις (γραμμικές αντιθέσεις/linear contrasts), στις οποίες δε θα αναφερθούμε. Αναφέρουμε μόνο, ότι σε ένα πείραμα, για παράδειγμα με k = 5 επεμβάσεις, έλεγχος γραμμικής αντίθεσης μ + μ είναι, για παράδειγμα, ο έλεγχος της μηδενικής υπόθεσης, : μ = ή της μ + μ μ 4 + μ5 : ή της μ μ. Όπως φαίνεται και από το = : = τελευταίο παράδειγμα, ο έλεγχος Scheffe μπορεί να εφαρμοσθεί και για όλες τις ανά δύο συγκρίσεις, όμως, στην περίπτωση αυτή, είναι πολύ συντηρητικός στην ανάδειξη στατιστικά σημαντικών διαφορών (περισσότερο και από τη διαδικασία Tukey). Ο έλεγχος Dunn (Bonferroni correction), χειρίζεται την πιθανότητα σφάλματος τύπου Ι κατά πείραμα, α PE, ως εξής: την προκαθορίζει σε ένα ορισμένο επίπεδο και την κατανέμει (όχι κατ ανάγκη εξίσου) στις ανά δύο συγκρίσεις που θα γίνουν (διόρθωση Bonferroni, με βάση τη σχέση α PE c α PC ). Για παράδειγμα, αν αποφασίσουμε να κάνουμε 4 συγκρίσεις και ορίσουμε την πιθανότητα σφάλματος τύπου Ι κατά πείραμα, σε 5%, μπορούμε κάθε σύγκριση να την κάνουμε σε επίπεδο σημαντικότητας α PC =.5 ή τις τρεις σε. την κάθε μια, και την τέταρτη σε., κ.τλ.. Είναι από τους πλέον συντηρητικούς ελέγχους και προσφέρεται για μικρό μόνο αριθμό συγκρίσεων. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 8

18 Ο έλεγχος Dunnett (955), σχεδιάσθηκε και προσφέρεται για περιπτώσεις που μας ενδιαφέρει η σύγκριση ενός μάρτυρα με κάθε μια από ένα σύνολο επεμβάσεων. Δηλαδή, όταν δεν μας ενδιαφέρουν όλες οι δυνατές συγκρίσεις αλλά έχουμε προσχεδιάσει να κάνουμε μόνο τις συγκεκριμένες συγκρίσεις με το μάρτυρα. Και αυτός ο έλεγχος, λαμβάνει υπόψη το σφάλμα τύπου Ι κατά πείραμα, α. Ο έλεγχος Duncan (955), όπως και ο SNK, χειρίζεται το σφάλμα τύπου Ι κατά πείραμα, α PE, λαμβάνοντας υπόψη τον αριθμό των μέσων που βρίσκονται μεταξύ των μέσων που κάθε φορά συγκρίνονται και γι αυτό και έχει ανάλογη συμπεριφορά με τον έλεγχο SNK, δηλαδή, έχει την τάση να αναδεικνύει περισσότερες στατιστικά σημαντικές διαφορές από τη διαδικασία Tukey. Τελευταίο αφήσαμε τον έλεγχο ελάχιστης σημαντικής διαφοράς LSD (Least Significant Difference) (Fisher, 95), γιατί είναι ο μόνος ο οποίος δε λαμβάνει υπόψη το σφάλμα τύπου Ι κατά πείραμα, α PE. Είναι ο πλέον ευαίσθητος στην ανάδειξη στατιστικά σημαντικών διαφορών, όμως παρέχει τη μικρότερη προστασία από σφάλματα τύπου Ι. Αν επιλέξουμε να τον εφαρμόσουμε, πρέπει αφενός οι συγκρίσεις να είναι λίγες, και αφετέρου, να έχει προηγηθεί έλεγχος ανάλυσης διασποράς της μηδενικής υπόθεσης : μ = μ =... = μk και αυτή να έχει απορριφθεί (έτσι μπορεί να δικαιολογηθεί και η χρησιμοποίησή του, παρότι δε λαμβάνει καμία μέριμνα για έλεγχο του σφάλματος τύπου Ι κατά πείραμα, με την έννοια, ότι αφού έχει προηγηθεί απόρριψη της : μ = μ =... = μk, περιμένουμε να μην συμβούν πολλά σφάλματα τύπου Ι στις πολλαπλές συγκρίσεις). Παρατήρηση: Παρότι, για την εφαρμογή των ελέγχων πολλαπλών συγκρίσεων δεν απαιτείται να έχει προηγηθεί έλεγχος ανάλυσης διασποράς της μηδενικής υπόθεσης : μ = μ =... = μ k και απόρριψή της, εντούτοις, συνηθίζεται να εφαρμόζονται μετά από έλεγχο ανάλυση διασποράς και απόρριψη της : μ = μ =... = μk. Όμως, επαναλαμβάνουμε, ειδικά ο έλεγχος ελάχιστης σημαντικής διαφοράς (LSD), πρέπει να εφαρμόζεται μόνο μετά από απόρριψη της μ = μ =... = μ : k. Ολοκληρώνοντας αυτή τη σύντομη αναφορά στους ελέγχους πολλαπλών συγκρίσεων, απαιτείται να κάνουμε ένα σχόλιο σχετικά με το πώς, με ποια κριτήρια, αποφασίζουμε, ποιος έλεγχος πολλαπλών συγκρίσεων είναι ο καταλληλότερος για την στατιστική ανάλυση των δεδομένων μας. Για να επιλέξουμε τον κατάλληλο έλεγχο πρέπει πρώτα να αποφασίσουμε αν θέλουμε να κάνουμε όλες τις ανά δύο συγκρίσεις ή μόνο κάποιες συγκεκριμένες. Στις περιπτώσεις που ενδιαφερόμαστε μόνο για κάποιες συγκεκριμένες συγκρίσεις πρέπει να επιλέξουμε μεταξύ των ελέγχων Dunnett και Scheffe (κατά περίπτωση). Πρέπει επίσης να σταθμίσουμε τη σημασία των σφαλμάτων τύπου Ι και τύπου ΙΙ στη συγκεκριμένη έρευνα. Δηλαδή, αν πρέπει να «προστατευθούμε» περισσότερο από σφάλματα τύπου Ι ή από σφάλματα τύπου ΙΙ, αν μας ενδιαφέρει ο έλεγχος της πιθανότητας σφάλματος τύπου Ι κατά πείραμα, α, ή/και της πιθανότητας σφάλματος τύπου Ι κατά σύγκριση, α PC Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 9 PE. Φυσικά, η απάντηση σε αυτά τα ερωτήματα εξαρτάται από το συγκεκριμένο κάθε φορά ερευνητικό πρόβλημα αλλά και από την γενικότερη αντίληψη/άποψη του ερευνητή για τη σημασία και τη βαρύτητα των διαφόρων τύπων σφαλμάτων σε μια έρευνα. Αν αποφασίσουμε ότι το κατά πείραμα σφάλμα τύπου Ι, α PE, μας ενδιαφέρει, τότε πρέπει να αποκλείσουμε από τις επιλογές μας τον έλεγχο LSD και να επιλέξουμε μεταξύ των ελέγχων, Tukey, Scheffe, Duncan SNK και Dunn. PE

19 Το βασικό στοιχείο που πρέπει, στο σημείο αυτό, να λάβουμε υπόψη μας είναι ο τρόπος που ο κάθε έλεγχος χειρίζεται την προστασία από το σφάλμα τύπου Ι κατά πείραμα, α PE, γιατί, ουσιαστικά, με βάση αυτόν διαφοροποιούνται. Υπενθυμίζουμε ότι, ο έλεγχος Scheffe, όταν χρησιμοποιείται για όλες τις ανά δύο συγκρίσεις είναι πολύ συντηρητικός, δηλαδή, παρέχει τη μικρότερη προστασία από σφάλματα τύπου ΙΙ κάτι το οποίο συμβαίνει και με τον έλεγχο Dunn όταν ο αριθμός των συγκρίσεων δεν είναι μικρός. Από τους ελέγχους, Tukey, Duncan και SNK ο πλέον συντηρητικός είναι ο Tukey αλλά παρέχει μεγαλύτερη προστασία από σφάλμα τύπου Ι κατά πείραμα, α PE, ενώ οι Duncan και SNK τείνουν να αναδεικνύουν περισσότερες σημαντικές διαφορές γιατί, όπως είδαμε, χειρίζονται το α PE, με άλλον τρόπο («διαβαθμίζουν» την προστασία). Ολοκληρώνοντας αυτό το σύντομο σχόλιο, σημειώνουμε ότι στη σχετική βιβλιογραφία, φυσικά, δεν υπάρχουν τυποποιημένα και απόλυτα κριτήρια ή αυστηρά οριοθετημένες περιπτώσεις για το ποιος ή ποιοι έλεγχοι είναι οι καταλληλότεροι. Η απόφαση ανήκει στον ερευνητή και πρέπει να είναι αιτιολογημένη. Απαραίτητη προϋπόθεση γι αυτό, είναι να έχει κατανοήσει τη λογική και τα βασικά, τουλάχιστον, χαρακτηριστικά κάθε ελέγχου. Υποθέσεις/παραδοχές στο εντελώς τυχαιοποιημένο σχέδιο Οι υποθέσεις/παραδοχές που κάνουμε στο εντελώς τυχαιοποιημένο σχέδιο (με καθορισμένες επιδράσεις), όπως ήδη έχουμε αναφέρει, είναι:. Τα k δείγματα είναι ανεξάρτητα τυχαία δείγματα (όλες οι παρατηρήσεις y i είναι μεταξύ τους ανεξάρτητες). Κάθε δείγμα προέρχεται από κανονικό πληθυσμό. Οι k πληθυσμοί έχουν κοινή διασπορά, σ (ομοσκεδαστικότητα) Αν ε i = Yi μ, =,,..., k, i =,,...,n η απόκλιση της Y i από τη μέση τιμή μ του πληθυσμού, τότε οι παραπάνω υποθέσεις είναι ισοδύναμες με τις εξής:. Τα ε i είναι μεταξύ τους ανεξάρτητα. ε i ~ N(, σ ) Τα ε i ονομάζονται υπόλοιπα (residuals) και εκφράζουν το πειραματικό σφάλμα (experimental error) δηλαδή, τη μεταβλητότητα που δεν εξηγείται από τις επεμβάσεις. Όταν τα μεγέθη, n n, n,,... k, των k δειγμάτων είναι ίσα, η ανάλυση διασποράς είναι «ανθεκτική» σε μικρές ή μέτριες αποκλίσεις από την υπόθεση τόσο της κανονικότητας των πληθυσμών όσο και της ομοσκεδαστικότητας. Δηλαδή, η πιθανότητα σφάλματος τύπου Ι είναι κοντά στο επίπεδο σημαντικότητας που ορίζουμε ακόμη και αν υπάρχουν μικρές ή μέτριες αποκλίσεις από τις δύο αυτές παραδοχές. Αν όμως, τα i n δεν είναι ίσα, τότε η πιθανότητα σφάλματος τύπου Ι μπορεί να διαφέρει αρκετά από το επίπεδο σημαντικότητας που ορίζουμε, ανάλογα με το μέγεθος της ετεροσκεδαστικότητας (αν μεγάλες διασπορές αντιστοιχούν σε μικρά δείγματα, η πιθανότητα σφάλματος τύπου Ι μπορεί να είναι αρκετά μεγαλύτερη από το επίπεδο σημαντικότητας που ορίζουμε). Επίσης, αν οι κατανομές των πληθυσμών είναι πλατύκυρτες ή λεπτόκυρτες και τα δείγματα μικρά, η πραγματική ισχύς (και επομένως η πιθανότητα σφάλματος τύπου ΙΙ) του ελέγχου επηρεάζεται. Βέβαια, αν τα δείγματα δεν είναι πολύ μικρά, μικρές αποκλίσεις από την κανονικότητα, δε δημιουργούν πρόβλημα εγκυρότητας του Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

20 ελέγχου ανάλυσης διασποράς. Σε κάθε περίπτωση, όμως, πρέπει να ελέγχουμε τη βασιμότητα των απαιτούμενων παραδοχών/υποθέσεων. Για τον έλεγχο της κανονικότητας των πληθυσμών από τους οποίους προέρχονται τα δείγματα είτε της κανονικότητας των υπολοίπων, αλλά και για τον έλεγχο της ισότητας των διασπορών και της ανεξαρτησίας των υπολοίπων, η Στατιστική μας προσφέρει μια μεγάλη ποικιλία μεθόδων και τεχνικών οι οποίες πλέον, με χρήση κάποιου στατιστικού πακέτου, μπορούν πολύ εύκολα να εφαρμοσθούν και να αξιοποιηθούν. Για τον έλεγχο της κανονικότητας μπορούμε να κάνουμε ελέγχους καλής προσαρμογής (έλεγχος Kolmogorov-Smirnov, έλεγχος Anderson-Darling, έλεγχος X, κ.ά.) Επίσης, για τον έλεγχο ισότητας των διασπορών μπορούμε να κάνουμε έλεγχο Bartlett, έλεγχο Cochran, έλεγχο artley, κ.ά.. Δεν θα αναφερθούμε αναλυτικά σε καθέναν από αυτούς τους ελέγχους. Για τον έλεγχο Bartlett, επειδή είναι από τους πλέον γνωστούς και χρησιμοποιείται πολύ συχνά, επισημαίνουμε μόνο ότι αν δεν ισχύει η υπόθεση της κανονικότητας, επηρεάζεται πολύ και μπορεί να δώσει μη έγκυρα αποτελέσματα. Τέλος, για το έλεγχο της ανεξαρτησίας των σφαλμάτων μπορούμε να κάνουμε κάποιο έλεγχο τυχαιότητας (randomness test) όπως, έλεγχο ροών (runs test). Εικόνα για τη βασιμότητα των παραπάνω παραδοχών/υποθέσεων παίρνουμε επίσης κατασκευάζοντας κατάλληλα ιστογράμματα, θηκογράμματα, κανονικά διαγράμματα πιθανοτήτων (NPP) και διαγράμματα υπολοίπων (residuals plots). Αν διαπιστώσουμε ότι η υπόθεση/παραδοχή της κανονικότητας ή της ομοσκεδαστικότητας (ή και οι δύο) δεν ικανοποιούνται, είναι δυνατόν με κατάλληλο μετασχηματισμό της μεταβλητής απόκρισης (των παρατηρήσεων) να «διορθώσουμε» τις αποκλίσεις από αυτές τις παραδοχές. Στο θέμα αυτό δε θα επεκταθούμε περισσότερο, αναφέρουμε μόνο ότι συχνά εφαρμοζόμενοι μετασχηματισμοί είναι, ο λογάριθμος και η τετραγωνική ρίζα. Αν δεν ικανοποιούνται οι υποθέσεις εφαρμογής ελέγχου ανάλυσης διασποράς, η Στατιστική μας προσφέρει λύσεις μέσω μη παραμετρικών ελέγχων, όπως ο έλεγχος Kruskal-Wallis, για τους οποίους οι προϋποθέσεις εφαρμογής είναι πολύ γενικές (π.χ. ότι η μεταβλητή απόκρισης έχει συνεχή κατανομή). Ας δούμε, με τη βοήθεια του στατιστικού πακέτου Statgraphics, αν ικανοποιούνται οι υποθέσεις της ανάλυσης διασποράς στο Παράδειγμα-. Παράδειγμα- (συνέχεια): Για να ελέγξουμε αν ικανοποιούνται οι υποθέσεις ότι τα 4 δείγματα προέρχονται από κανονικούς πληθυσμούς με κοινή διασπορά σ, μπορούμε ισοδύναμα να ελέγξουμε αν για τα θεωρητικά υπόλοιπα ε i = Yi μ ισχύει ότι ε i ~ N(, σ ). Για το σκοπό αυτό, χρησιμοποιούμε τα «παρατηρούμενα» υπόλοιπα εˆ i, καθένα από τα οποία υπολογίζεται αν από την αντίστοιχη παρατήρηση αφαιρέσουμε τη μέση τιμή του δείγματος στο οποίο αυτή ανήκει. Έτσι, επειδή οι τέσσερις δειγματικοί μέσοι είναι, αντίστοιχα, y = 7.4, y = 68.6, y = 7., y = , τα παρατηρούμενα υπόλοιπα των παρατηρήσεων από την επέμβαση Α είναι, = 8. 6, = 6. 4, = 5. 6, =. 6, =.4 (ομοίως υπολογίζονται και για τις υπόλοιπες παρατηρήσεις από τις άλλες επεμβάσεις). Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

Ανάλυση Διασποράς Προβλήματα και Ασκήσεις

Ανάλυση Διασποράς Προβλήματα και Ασκήσεις Ανάλυση Διασποράς Προβλήματα και Ασκήσεις 1. Ένας ερευνητής προκειμένου να συγκρίνει τρία σιτηρέσια εκτροφής κοτόπουλων (Σ1, Σ2 και Σ3, αντίστοιχα), σχεδίασε και εκτέλεσε το εξής πείραμα. Επέλεξε 15 νεογέννητα

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA)

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA) ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA). Εισαγωγή Η ανάλυση της διακύμανσης (ANalysis Of VAriance ANOVA) είναι μια στατιστική μεθόδος με την οποία η μεταβλητότητα που υπάρχει σ ένα σύνολο δεδομένων διασπάται στις

Διαβάστε περισσότερα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Αρχείο δεδομένων school.sav Στον πίνακα Descriptives, μας δίνονται για την Επίδοση ως προς τις πέντε διαφορετικές μεθόδους διδασκαλίας, το

Διαβάστε περισσότερα

την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ

την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ Ανάλυση Διασποράς Ανάλυση Διασποράς (Analysis of Variance, ANOVA) είναι μέθοδος στατιστικού ελέγχου υποθέσεων που αναφέρονται σε περισσότερους από δύο πληθυσμούς. Στην προηγούμενη ενότητα αναφερθήκαμε

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων α) Σημειοεκτιμητική β) Εκτιμήσεις Διαστήματος ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Παράδειγμα

Διαβάστε περισσότερα

Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Προβλήματα και Ασκήσεις

Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Προβλήματα και Ασκήσεις Έλεγχος Χ -Προβλήματα και Ασκήσεις Έλεγχος Χ (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Προβλήματα και Ασκήσεις 1. Στη βιβλιογραφία αναφέρεται ότι τα ποσοστά των ομάδων αίματος Α, Β, ΑΒ και Ο σε

Διαβάστε περισσότερα

Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις

Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις Για κάθε πρόβλημα που ακολουθεί, εκτός των ερωτημάτων που διατυπώνονται, να γίνουν (με τη βοήθεια κάποιου στατιστικού πακέτου)

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών

Διαβάστε περισσότερα

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή 4.3.3 Ο Έλεγχος των Shapro-Wlk για την Κανονική Κατανομή Ένας άλλος πολύ γνωστός έλεγχος καλής προσαρμογής για την κανονική κατανομή, ο οποίος μπορεί να χρησιμοποιηθεί στην θέση του ελέγχου Lllefors, είναι

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Εισαγωγή στην Εκτιμητική

Εισαγωγή στην Εκτιμητική Εισαγωγή στην Εκτιμητική Πληθυσμός Εκτίμηση παραμέτρου πληθυσμού μ, σ 2, σ, p Δείγμα Υπολογισμός στατιστικού Ερώτηματα: Πόσο κοντά στην πραγματική τιμή της παραμέτρου του πληθυσμού βρίσκεται η εκτίμηση

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ 3.1 Τυχαίοι αριθμοί Στην προσομοίωση διακριτών γεγονότων γίνεται χρήση ακολουθίας τυχαίων αριθμών στις περιπτώσεις που απαιτείται η δημιουργία στοχαστικών

Διαβάστε περισσότερα

Η Κανονική Κατανομή κανονική κατανομή (normal distribution) Κεντρικό Οριακό Θεώρημα (Central Limit Theorem) συνδέει οποιαδήποτε άλλη κατανομή

Η Κανονική Κατανομή κανονική κατανομή (normal distribution) Κεντρικό Οριακό Θεώρημα (Central Limit Theorem) συνδέει οποιαδήποτε άλλη κατανομή Η Κανονική Κατανομή H κανονική κατανομή (ormal dstrbuto) θεωρείται η σπουδαιότερη κατανομή της Θεωρίας Πιθανοτήτων και της Στατιστικής. Οι λόγοι που εξηγούν την εξέχουσα θέση της, είναι βασικά δύο: ) Πολλές

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA) ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 8. Ανάλυση διασποράς (ANOVA) Γενικά Επέκταση της σύγκρισης µέσων τιµών µεταβλητής ανάµεσα σε 2 δείγµατα (οµάδες ήστάθµες): Σύγκριση πολλών δειγµάτων (K>2) µαζί Σχέση ανάµεσα σε µια ποσοτική

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΕΦΑΛΑΙΟ 19 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΙ ΑΝΑΛΟΓΙΩΝ ΔΥΟ ΚΑΝΟΝΙΚΩΝ ΠΛΗΘΥΣΜΩΝ Όταν ενδιαφερόμαστε να συγκρίνουμε δύο πληθυσμούς, η φυσιολογική προσέγγιση είναι να προσπαθήσουμε να συγκρίνουμε

Διαβάστε περισσότερα

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΚΕΦΑΛΑΙΟ 13 ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Στις προηγούμενες ενότητες ασχοληθήκαμε με μεθόδους που οδηγούν σε εκτιμήτριες των τιμών μιας ή και περισσοτέρων αγνώστων παραμέτρων. Αυτό έγινε με την κατασκευή

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις

Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις. Μια μηχανή εμφιάλωσης κρασιού γεμίζει φιάλες του μισού κιλού με ποσότητα κρασιού η οποία είναι κανονική τυχαία μεταβλητή

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 3-4 ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ Βασικά Εργαλεία και Μέθοδοι για τον Έλεγχο της Ποιότητας [ΔΙΠ 5] 3η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ Προσοχή: Οι απαντήσεις των ασκήσεων πρέπει να φθάσουν

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ 2013-2014 ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ Βασικά Εργαλεία και Μέθοδοι για τον Έλεγχο της Ποιότητας [ΔΙΠ 50] 3η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ Προσοχή: Οι απαντήσεις των ασκήσεων πρέπει να

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling) 3 ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratfed Radom Samplg) Είναι προφανές από τα τυπικά σφάλματα των εκτιμητριών των προηγούμενων παραγράφων, ότι ένας τρόπος να αυξηθεί η ακρίβεια τους είναι να αυξηθεί

Διαβάστε περισσότερα

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες)

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες) Εργαστήριο Μαθηματικών & Στατιστικής Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ η Πρόοδος στο Μάθημα Στατιστική //7 ο Θέμα α) Περιγράψτε τη σχέση Θεωρίας Πιθανοτήτων και Στατιστικής. β) Αν Α, Β ενδεχόμενα του δειγματικού χώρου Ω

Διαβάστε περισσότερα

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n.. Μέτρα Κινδύνου για Δίτιμα Κατηγορικά Δεδομένα Σε αυτή την ενότητα θα ορίσουμε δείκτες μέτρησης του κινδύνου εμφάνισης μίας νόσου όταν έχουμε δίτιμες κατηγορικές μεταβλητές. Στην πιο απλή περίπτωση μας

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων Ένα Ερευνητικό Παράδειγμα Σκοπός της έρευνας ήταν να διαπιστωθεί εάν ο τρόπος αντίδρασης μιας γυναίκας απέναντι σε φαινόμενα

Διαβάστε περισσότερα

ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis)

ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis) ΚΕΦΑΛΑΙΟ 23 ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis) ΕΙΣΑΓΩΓΗ Έχοντας παρουσιάσει τις βασικές έννοιες των ελέγχων υποθέσεων, θα ήταν, ίσως, χρήσιμο να αναφερθούμε σε μια άλλη περιοχή στατιστικής συμπερασματολογίας

Διαβάστε περισσότερα

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. 7 ο ΜΑΘΗΜΑ ΚΕΦΑΛΑΙΟ 2 ΣΤΑΤΙΣΤΙΚΗ Σκοπός Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. Προσδοκώμενα αποτελέσματα Όταν θα έχετε ολοκληρώσει τη μελέτη αυτού του κεφαλαίου

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 Η Θεωρία Πιθανοτήτων είναι ένας σχετικά νέος κλάδος των Μαθηματικών, ο οποίος παρουσιάζει πολλά ιδιαίτερα χαρακτηριστικά στοιχεία. Επειδή η ιδιαιτερότητα

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΙΙ ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ, ΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΣΙΜΟΣ ΜΕΙΝΤΑΝΗΣ, Αναπληρωτής Καθηγητής Τμήμα Οικονομικών Επιστημών, ΕΚΠΑ ΓΙΑΝΝΗΣ Κ. ΜΠΑΣΙΑΚΟΣ, Επίκουρος Καθηγητής Τμήμα Οικονομικών

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling) 6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling) Από την θεωρία που αναπτύχθηκε στα προηγούμενα κεφάλαια, φαίνεται ότι μια αλλαγή στον σχεδιασμό της δειγματοληψίας και, κατά συνέπεια, στην μέθοδο εκτίμησης

Διαβάστε περισσότερα

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ .4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ. ΛΥΚΕΙΟΥ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΨΗΣ - ΘΕΜΑ Ο Έστω η συνάρτηση f( ) =, 0 ) Να αποδείξετε ότι f ( ). f( ) =. ) Να υπολογίσετε το όριο lm f ( )+ 4. ) Να βρείτε την εξίσωση της εφαπτομένης

Διαβάστε περισσότερα

Μην ξεχάσετε να προσθέσετε μόνοι σας τα Session του Minitab! Δηλαδή την ημερομηνία και ώρα που κάνατε κάθε άσκηση!

Μην ξεχάσετε να προσθέσετε μόνοι σας τα Session του Minitab! Δηλαδή την ημερομηνία και ώρα που κάνατε κάθε άσκηση! Μην ξεχάσετε να προσθέσετε μόνοι σας τα Session του Minitab! Δηλαδή την ημερομηνία και ώρα που κάνατε κάθε άσκηση! ΘΕΜΑ ο [Μονάδες 20] Ερώτημα i (4 μονάδες). Για να κάνουμε τους υπολογισμούς που χρειάζονται

Διαβάστε περισσότερα

2. ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

2. ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Εργαστήριο Μαθηματικών & Στατιστικής 2. ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Ας θεωρήσουμε ότι είναι γνωστό από στοιχεία της Παγκόσμιας Οργάνωσης Υγείας ότι οι τιμές χοληστερίνης στον πληθυσμό έχουν

Διαβάστε περισσότερα

8. Ανάλυση Διασποράς ως προς. δύο παράγοντες

8. Ανάλυση Διασποράς ως προς. δύο παράγοντες 8. Ανάλυση Διασποράς ως προς δύο παράγοντες Ανάλυση Διασποράς ως προς δύο παράγοντες Α, Β δύο παράγοντες κ: στάθμες (επίπεδα) του παράγοντα Α λ: στάθμες (επίπεδα) του παράγοντα Β κ λ : πειραματικές συνθήκες

Διαβάστε περισσότερα

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος Έλεγχοι Υποθέσεων 1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος µ = 100 Κάθε υπόθεση συνοδεύεται από µια εναλλακτική: Ο

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1 Γραµµική παλινδρόµηση Είναι

Διαβάστε περισσότερα

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE) ΔΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE) ΟΚΙΜΑΣΙΕΣ χ (CI-SQUARE). Εισαγωγή Οι στατιστικές δοκιμασίες που μελετήσαμε μέχρι τώρα ονομάζονται παραμετρικές (paramtrc) διότι χαρακτηρίζονται από υποθέσεις σχετικές είτε για

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ

ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ ΟΙΚΟΝΟΜΕΤΡΙΑ Ι ΦΥΛΛΑΔΙΟ Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι Πανεπιστημίου Πειραιώς) Τηλ.: 4..97,,, Fax : 4..634 URL : www.vtal.gr emal: f@vtal.gr Παράρτημα Πανεπιστημίου: Δεληγιώργη 6 Α (έναντι

Διαβάστε περισσότερα

T-tests One Way Anova

T-tests One Way Anova William S. Gosset Student s t Sir Ronald Fisher T-tests One Way Anova ΣΤΑΤΙΣΤΙΚΗ Νίκος Ζουρμπάνος Ρούσσος, Π.Λ., & Τσαούσης, Γ. (2002). Στατιστική εφαρμοσμένη στις κοινωνικές επιστήμες. Αθήνα: Ελληνικά

Διαβάστε περισσότερα

Γραπτή Εξέταση Περιόδου Σεπτεμβρίου 2008 στο Μάθημα Στατιστική Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ 29.9.2008

Γραπτή Εξέταση Περιόδου Σεπτεμβρίου 2008 στο Μάθημα Στατιστική Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ 29.9.2008 Γραπτή Εξέταση Περιόδου Σεπτεμβρίου 8 στο Μάθημα Στατιστική Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ 9.9.8. [] Μια βιομηχανία τροφίμων προμηθεύεται νωπά κοτόπουλα από τρεις διαφορετικούς παραγωγούς Α, Β, Γ. Το % των κοτόπουλων

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 4 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Στατιστικοί Έλεγχοι Υποθέσεων Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή Τι θέλουμε να συγκρίνουμε; Δύο δείγματα Μέση αρτηριακή πίεση σε δύο ομάδες Πιθανότητα θανάτου με δύο διαφορετικά

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝ. ΠΑΙΔΕΙΑΣ - Γ ΛΥΚΕΙΟΥ ΘΕΜΑΤΑ ΘΕΜΑ A A. Αν οι συναρτήσεις f, g είναι παραγωγίσιμες στο, να αποδείξετε ότι f g f g,. Μονάδες 7 Α. Σε ένα πείραμα με ισοπίθανα αποτελέσματα

Διαβάστε περισσότερα

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Ο έλεγχος της ενότητας αυτής αποτελεί μία επέκταση του μονόπλευρου ελέγχου Smirnov στην περίπτωση περισσοτέρων από δύο δειγμάτων. Ο έλεγχος αυτός

Διαβάστε περισσότερα

Χαρακτηριστικά της ανάλυσης διασποράς. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (One-way analysis of variance)

Χαρακτηριστικά της ανάλυσης διασποράς. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (One-way analysis of variance) ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (Oe-way aalysis of variace) Να γίνει µια εισαγωγή στη µεθοδολογία της ανάλυσης > δειγµάτων Να εφαρµοσθεί και να κατανοηθεί η ανάλυση διασποράς µε ένα παράγοντα. Να κατανοηθεί η χρήση των

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ Ι (Θ.Ε. ΠΛΗ 12) 6Η ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ - ΕΝΗΜΕΡΩΜΕΝΗ ΜΟΡΦΗ Ημερομηνία Αποστολής της εργασίας στον Φοιτητή 5 Μαϊου 2014

Διαβάστε περισσότερα

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

Άσκηση 10, σελ. 119. Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F Άσκηση 0, σελ. 9 από το βιβλίο «Μοντέλα Αξιοπιστίας και Επιβίωσης» της Χ. Καρώνη (i) Αρχικά, εισάγουμε τα δεδομένα στο minitab δημιουργώντας δύο μεταβλητές: τη x για τον άτυπο όγκο και την y για τον τυπικό

Διαβάστε περισσότερα

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ. ΣΤ. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (ANALYSIS OF VARIANCE - ANOVA) ΣΤ 1. Ανάλυση ιασποράς κατά µία κατεύθυνση. Όπως έχουµε δει στη παράγραφο Β 2, όταν θέλουµε να ελέγξουµε, αν η µέση τιµή µιας ποσοτικής µεταβλητής διαφέρει

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8 ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5. 5.8 5. Ένας υγειονοµικός σταθµός θέλει να ελέγξει αν ο µέσος αριθµός βακτηριδίων ανά µονάδα όγκου θαλασσινού νερού σε µια παραλία υπερβαίνει το επίπεδο ασφαλείας των 9 µονάδων. ώδεκα

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ ΚΕΦΑΛΑΙΟ 5 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ Α. Περίπτωση Ενός Πληθυσμού Έστω ότι μελετάμε μια ακολουθία ανεξαρτήτων δοκιμών κάθε μία από τις οποίες οδηγεί είτε σε επιτυχία είτε σε αποτυχία με σταθερή

Διαβάστε περισσότερα

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ Έστω ότι επιθυμούμε να μελετήσουμε ένα τυχαίο πείραμα με δειγματικό χώρο Ω και έστω η πιθανότητα να συμβεί ένα ενδεχόμενο Α Ω Υπάρχουν περιπτώσεις όπου ενώ δεν γνωρίζουμε

Διαβάστε περισσότερα

2. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ

2. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ 1. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ 1. Σφάλματα Κάθε μέτρηση ενός φυσικού μεγέθους χαρακτηρίζεται από μία αβεβαιότητα που ονομάζουμε σφάλμα, το οποίο αναγράφεται με τη μορφή Τιμή ± αβεβαιότητα π.χ έστω ότι σε ένα πείραμα

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ Θέμα εξετάσεων 2000 Εξετάσαμε 50 μαθητές ως προς τα βιβλία που έχουν διαβάσει και διαπιστώσαμε ότι: 5 μαθητές δεν έχουν διαβάσει κανένα βιβλίο, 15 μαθητές έχουν

Διαβάστε περισσότερα

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα Εργασία στα Γενικευμένα Γραμμικά Μοντέλα Μ. Παρζακώνης ΜΕΣ/ 06015 Ο παρακάτω πίνακας δίνει τα αποτελέσματα 800 αιτήσεων για δάνειο σε μία τράπεζα. Ο πίνακας παρουσιάζει τον αριθμό των δανείων που εγκρίθηκαν,

Διαβάστε περισσότερα

Μεταθέσεις και πίνακες μεταθέσεων

Μεταθέσεις και πίνακες μεταθέσεων Παράρτημα Α Μεταθέσεις και πίνακες μεταθέσεων Το παρόν παράρτημα βασίζεται στις σελίδες 671 8 του βιβλίου: Γ. Χ. Ψαλτάκης, Κβαντικά Συστήματα Πολλών Σωματιδίων (Πανεπιστημιακές Εκδόσεις Κρήτης, Ηράκλειο,

Διαβάστε περισσότερα