την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ"

Transcript

1 Ανάλυση Διασποράς Ανάλυση Διασποράς (Analysis of Variance, ANOVA) είναι μέθοδος στατιστικού ελέγχου υποθέσεων που αναφέρονται σε περισσότερους από δύο πληθυσμούς. Στην προηγούμενη ενότητα αναφερθήκαμε σε στατιστικούς ελέγχους υποθέσεων για την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ και μ, ή των διασπορών, σ και σ, δύο πληθυσμών, αντίστοιχα. Εύλογα γεννάται το ερώτημα: πώς μπορούμε να συγκρίνουμε, για παράδειγμα, τις μέσες τιμές μ, μ,..., μ k, k πληθυσμών όταν k > ; Μια απάντηση θα μπορούσε να είναι η εξής: να γίνει η σύγκριση των k μέσων τιμών k k ( k ) ανά δύο. Δηλαδή, να κάνουμε όλους τους, c = =, ελέγχους: : μi = μ, με i. : μ μ. i Είναι φανερό, ότι μια τέτοια διαδικασία είναι χρονοβόρα ακόμη και όταν το k είναι μικρό. Για παράδειγμα, αν θέλουμε να συγκρίνουμε k = 4 μέσες τιμές, πρέπει να κάνουμε c = 6, συνολικά, ελέγχους. Αν k = 5 πρέπει να κάνουμε c = ελέγχους, αν k = 6 πρέπει να κάνουμε c = 5 ελέγχους, ενώ αν k =, απαιτούνται c = 45 έλεγχοι! Όμως, αυτό το πρόβλημα θα μπορούσε να αντιμετωπισθεί (μάλιστα, με χρήση κατάλληλου λογισμικού, πολύ εύκολα). Το πραγματικό πρόβλημα που δημιουργείται είναι άλλο και σοβαρό. Αν ενδιαφερόμαστε να κάνουμε c ανεξάρτητους ελέγχους, σε επίπεδο σημαντικότητας α Pc τον καθένα (πιθανότητα σφάλματος τύπου Ι κατά σύγκριση/per comparison error rate), τότε η πιθανότητα λανθασμένης απόρριψης της μηδενικής υπόθεσης σε έναν τουλάχιστον από αυτούς, δηλαδή, η πιθανότητα, στους c ελέγχους, να συμβεί τουλάχιστον μια φορά σφάλμα Τύπου Ι (πιθανότητα σφάλματος τύπου Ι κατά c πείραμα/per experiment error rate), είναι: α = ( α. PE PC ) Για παράδειγμα, αν κάνουμε c = 6,, 5, 45 ανεξάρτητους ελέγχους σε επίπεδο σημαντικότητας α =. 5 τον καθένα, τότε, η πιθανότητα, α PE, είναι, αντίστοιχα: PC c α PE Είναι φανερό ότι το α PE αυξάνεται ραγδαία με τον αριθμό των ελέγχων, c. Ανάλογο πρόβλημα δημιουργείται και στην περίπτωση μη ανεξάρτητων ελέγχων, όπου, ισχύει, α PE c α PC (υποπροσθετική ιδιότητα). Για την αντιμετώπιση, επομένως, αυτού του προβλήματος, το οποίο στη βιβλιογραφία αναφέρεται ως πρόβλημα πολλαπλών συγκρίσεων (multiple comparisons problem), απαιτούνται άλλες προσεγγίσεις. Στην ενότητα αυτή θα δούμε πώς απαντάει στο πρόβλημα της σύγκρισης περισσότερων των δύο μέσων, η ανάλυση διασποράς. Ειδικότερα, θα δούμε πώς και με ποιες προϋποθέσεις μπορούμε να κάνουμε, σε επίπεδο σημαντικότητας α %, έλεγχο ανάλυσης διασποράς για να ελέγξουμε τη μηδενική υπόθεση, Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 9

2 : μ = μ =... = μ k, έναντι της εναλλακτικής, : μi μ, για ένα τουλάχιστον ζεύγος (i, ). Δηλαδή, θα δούμε, πώς μπορούμε να συγκρίνουμε τις μέσες τιμές μ, μ,..., μk, k > πληθυσμών, με έναν μόνο, αντί με πολλαπλούς ελέγχους. Όμως, παρότι φαίνεται ότι με τον έλεγχο ανάλυσης διασποράς το πρόβλημα των πολλαπλών ελέγχων παρακάμπτεται, εντούτοις, όπως θα δούμε αργότερα, τελικά δεν το αποφεύγουμε. Και αυτό, γιατί αν με τον έλεγχο ανάλυσης διασποράς, η μηδενική υπόθεση : μ = μ =... = μk, απορριφθεί, πρέπει να μπορούμε να πούμε κάτι για το ποιες από τις διαφορές μi μ είναι στατιστικά σημαντικές. Όμως, τώρα, ας δούμε τον έλεγχο ανάλυσης διασποράς. Η ανάλυση διασποράς προτάθηκε από τον Sir Ronald A. Fisher το 98. Ευρέως έγινε γνωστή μετά το 95 όταν εκδόθηκε το κλασικό πλέον βιβλίο του R. A. Fisher, Statistical Methods for Research Workers, στο οποίο είχε συμπεριλάβει και την ανάλυση διασποράς. ανάλυση διασποράς «γεννήθηκε»/προέκυψε κατά την ενασχόληση του Fisher με δύσκολα προβλήματα στατιστικής συμπερασματολογίας που εμφανίζονται στο γεωργικό πειραματισμό (πολλές πηγές μεταβλητότητας και συχνά εμφανιζόμενες ετερογένειες, και μάλιστα, προς διάφορες κατευθύνσεις του πειραματικού αγρού π.χ. ως προς τη γονιμότητα, την κλίση και την υγρασία των εδαφών, τις προηγούμενες καλλιέργειες, κ.τλ.). Η προσέγγιση της λύσης τέτοιου είδους προβλημάτων που πρότεινε ο Fisher, βασίζεται στην τυχαιοποίηση και στην επανάληψη και ως μαθηματικό εργαλείο για την υποστήριξη αυτής της προσέγγισης πρότεινε την ανάλυση διασποράς. Γι αυτό, όπως θα δούμε στη συνέχεια, στην ανάλυση διασποράς έχει επικρατήσει να χρησιμοποιείται ορολογία (και όχι μόνο) που χρησιμοποιείται στο γεωργικό πειραματισμό και γενικότερα στον πειραματισμό, παρότι δεν εφαρμόζεται μόνο στην ανάλυση πειραματικών δεδομένων. Ας δούμε τέσσερα προβλήματα στατιστικού ελέγχου υποθέσεων που αντιμετωπίζονται με έλεγχο ανάλυσης διασποράς. Πρόβλημα-: Ένας φοιτητής, στο πλαίσιο της πτυχιακής του εργασίας, προκειμένου να συγκρίνει τέσσερα είδη (Α, Α, Α και Α4, αντίστοιχα) πρόσθετης ύλης ζωοτροφών για αύξηση του βάρους νεογέννητων χοίρων, σχεδίασε και εκτέλεσε το εξής πείραμα. Επέλεξε νεογέννητους χοίρους και με μια τυχαία διαδικασία αντιστοίχισε σε 5 από αυτούς την πρόσθετη ύλη Α, σε 5 άλλους την Α, σε 5 άλλους την Α και σε 5 άλλους την Α4 (δες το σχήμα που ακολουθεί). Δημιούργησε έτσι, 4 ομάδες των 5 χοίρων η κάθε μια. Αφού χορήγησε στους χοίρους κάθε ομάδας τροφή με την αντίστοιχη πρόσθετη ύλη για τρεις μήνες, κατέγραψε την αύξηση του βάρους κάθε χοίρου (σε pounds). Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα πειραματικά δεδομένα ότι υπάρχουν στατιστικά σημαντικές διαφορές στη μέση αύξηση του βάρους των νεογέννητων χοίρων που να οφείλονται στα τέσσερα είδη πρόσθετης ύλης ζωοτροφών; Α Α Α Α Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 9

3 Πρόβλημα-: Ο επιβλέπων καθηγητής του φοιτητή του Προβλήματος-, μετά τη στατιστική ανάλυση των πειραματικών δεδομένων, του πρότεινε να εκτελέσει ένα ακόμη πείραμα. Έτσι, ο φοιτητής εκτέλεσε και το εξής πείραμα: Από πέντε διαφορετικές γέννες επέλεξε τυχαία 4 χοίρους από την κάθε μία. Δημιούργησε έτσι, 5 τετράδες χοίρων (Γ, Γ, Γ, Γ4 και Γ5, αντίστοιχα) όπου οι χοίροι της ίδιας τετράδας προέρχονταν από την ίδια γέννα, και στους χοίρους κάθε τετράδας αντιστοίχησε, με μια τυχαία διαδικασία, από μία πρόσθετη ύλη ζωοτροφών (δες το σχήμα που ακολουθεί). Αφού χορήγησε στους χοίρους κάθε ομάδας τροφή με την αντίστοιχη πρόσθετη ύλη στον καθένα για τρεις μήνες, κατέγραψε την αύξηση του βάρους κάθε χοίρου (σε pounds). Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα πειραματικά δεδομένα ότι υπάρχουν στατιστικά σημαντικές διαφορές στη μέση αύξηση του βάρους των νεογέννητων χοίρων που να οφείλονται στα τέσσερα είδη πρόσθετης ύλης ζωοτροφών; Γ Γ Γ Γ4 Γ5 Α (78) Α4 (7) Α (7) Α (66) Α (6) Α (78) Α (64) Α4 (8) Α (76) Α (69) Α (69) Α (68) Α (7) Α4 (74) Α (66) Α4 (8) Α (7) Α (76) Α (77) Α4 (7) Πρόβλημα-: Ένας φοιτητής του Τμήματος Επιστήμης και Τεχνολογίας Τροφίμων του Γ.Π.Α., στο πλαίσιο της πτυχιακής του εργασίας, συνέκρινε τις ποσότητες χοληστερίνης που περιέχουν τρία διαφορετικά είδη τροφίμων διαίτης, Α, Α και Α, αντίστοιχα. Από κάθε είδος πήρε ένα τυχαίο δείγμα μεγέθους 8 και μέτρησε την ποσότητα χοληστερίνης (σε milligrams ανά gr). Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν οι παρατηρήσεις που πήρε ο φοιτητής ότι υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των μέσων ποσοτήτων χοληστερίνης στα τρία είδη τροφίμων; Πρόβλημα-4: Ένας ερευνητής ενδιαφέρεται να μελετήσει την επίδραση της έντασης του φωτισμού και του επιπέδου της θερμοκρασίας στην ανάπτυξη ενός είδους χλωρόφυτων (φύκη). Μάλιστα, ενδιαφέρεται ιδιαίτερα, να διερευνήσει αν οι δύο αυτοί παράγοντες επιδρούν στην ανάπτυξη του συγκεκριμένου είδους χλωρόφυτου ανεξάρτητα ή η επίδραση του ενός διαφοροποιείται ανάλογα με τη στάθμη του άλλου. Για το σκοπό αυτό, σχεδίασε και εκτέλεσε στο εργαστήριο το εξής πείραμα. Καθόρισε τρία επίπεδα έντασης φωτισμού (Β, Β και Β) και τρία επίπεδα θερμοκρασίας ( ο C, ο C και ο C). Για κάθε συνδυασμό, έντασης φωτισμού και επιπέδου θερμοκρασίας, καλλιέργησε χλωρόφυτα του συγκεκριμένου είδους και μετά από μια εβδομάδα τα ζύγισε και κατέγραψε τα βάρη τους (σε gr). Τα δεδομένα που συγκέντρωσε φαίνονται στον πίνακα που ακολουθεί. Επίπεδο θερμοκρασίας ο C ο C ο C Β Ένταση Β φωτισμού Β Με βάση αυτά τα πειραματικά δεδομένα και σε επίπεδο σημαντικότητας 5%, τι μπορούμε να πούμε για το αν και πώς το επίπεδο θερμοκρασίας και η ένταση φωτισμού επιδρούν στην ανάπτυξη του συγκεκριμένου είδους χλωρόφυτων; Είναι προφανές ότι και τα τέσσερα προβλήματα είναι προβλήματα στατιστικού ελέγχου υποθέσεων που αφορούν περισσότερες από δύο μέσες τιμές (αντίστοιχων πληθυσμών). Στο Πρόβλημα-, τα δεδομένα προκύπτουν από δειγματοληψίες, ενώ στα Προβλήματα-, και 4 από εκτέλεση πειραμάτων και μάλιστα με διαφορετικό Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 94

4 πειραματικό σχέδιο το καθένα. Παρατηρείστε ότι στα Προβλήματα- και, ενώ το ερευνητικό ερώτημα είναι ακριβώς το ίδιο, ο τρόπος συγκέντρωσης των πειραματικών δεδομένων, δηλαδή το πειραματικό σχέδιο, διαφέρει. Παρατηρείστε, επίσης, ότι το σχέδιο δειγματοληψίας στο Πρόβλημα- και το πειραματικό σχέδιο στο Πρόβλημα- είναι ίδια. Για να απαντήσουμε στο Πρόβλημα-, πρέπει να κάνουμε, σε επίπεδο σημαντικότητας 5%, στατιστικό έλεγχο της μηδενικής υπόθεσης, : μ = μ = μ = μ 4, έναντι της εναλλακτικής, : μi μ, για ένα τουλάχιστον ζεύγος (i, ), όπου, μ, =,,, 4 η μέση τιμή της τυχαίας μεταβλητής που εκφράζει την αύξηση του βάρους νεογέννητων χοίρων μετά τη χορήγηση τροφής που περιέχει πρόσθετη ύλη, =,,,4, για τρεις μήνες μετά τη γέννησή τους. Ουσιαστικά, και με ορολογία A πειραματισμού, πρέπει να ελέγξουμε, αν επηρεάζονται οι τιμές μιας ποσοτικής μεταβλητής, έστω Υ, (αύξηση του βάρους νεογέννητων χοίρων όταν χρησιμοποιείται πρόσθετη ύλη στην τροφή τους για τρεις μήνες μετά τη γέννησή τους), από τις τιμές (Α, Α, Α, Α4) μιας ποιοτικής μεταβλητής (το είδος της πρόσθετης ύλης). Στην ορολογία του πειραματισμού, η ποιοτική μεταβλητή ονομάζεται παράγοντας (factor) και οι τιμές της ονομάζονται στάθμες ή επίπεδα (levels) του παράγοντα. Η εξαρτημένη μεταβλητή Υ ονομάζεται μεταβλητή απόκρισης (response variable) γιατί στις τιμές της αντανακλώνται οι αλλαγές στις τιμές του παράγοντα. Σε ένα πείραμα, ο ερευνητής μπορεί να ενδιαφέρεται για συγκεκριμένες τιμές του παράγοντα οπότε ως στάθμες ορίζει αυτές τις τιμές και τα συμπεράσματα θα αφορούν μόνον αυτές (πρότυπο Ι/πρότυπο καθορισμένων επιδράσεων/fixed effects model). Για παράδειγμα, ενδιαφέρεται να μελετήσει την αποτελεσματικότητα τεσσάρων συγκεκριμένων ειδών πρόσθετης ύλης ζωοτροφών. Αν τις τιμές του παράγοντα (στάθμες) τις επιλέξει τυχαία από ένα σύνολο δυνατών τιμών του παράγοντα (άπειρο ή πεπερασμένο) τότε τα συμπεράσματά του θα αφορούν όλο τον πληθυσμό των δυνατών τιμών του παράγοντα (πρότυπο ΙΙ/πρότυπο τυχαίων επιδράσεων/random effects model). Για παράδειγμα, ενδιαφέρεται να μελετήσει την αποτελεσματικότητα δέκα ειδών ζωοτροφών που υπάρχουν και ως στάθμες ορίζει τέσσερα από αυτά τα είδη που τα επέλεξε τυχαία από τα δέκα που υπάρχουν ή επιλέγει τυχαία πέντε περιοχές της χώρας για να καλλιεργήσει μια ποικιλία καλαμποκιού γιατί ενδιαφέρεται τα συμπεράσματα του να αφορούν όλη τη χώρα. Στο Πρόβλημα- όπως και στο Πρόβλημα-, ο φοιτητής ενδιαφέρεται να μελετήσει την επίδραση του παράγοντα «είδος πρόσθετης ύλης» (για τις ίδιες στάθμες όπως στο Πρόβλημα-) στην «αύξηση του βάρους νεογέννητων χοίρων όταν χρησιμοποιείται πρόσθετη ύλη στην τροφή τους για τρεις μήνες μετά τη γέννησή τους». Δηλαδή, τα δύο προβλήματα, διαφοροποιούνται μόνο στο πειραματικό σχέδιο που εφαρμόσθηκε. Στο Πρόβλημα- η μεταβλητή απόκρισης εκφράζει τις «τιμές χοληστερίνης στα τρόφιμα διαίτης», και ο παράγοντας είναι το «είδος τροφίμου διαίτης» με τρεις στάθμες. Στο Πρόβλημα-4 η μεταβλητή απόκρισης εκφράζει την «ανάπτυξη του συγκεκριμένου είδους χλωρόφυτων» και ο ερευνητής ενδιαφέρεται να μελετήσει την επίδραση δύο παραγόντων: του παράγοντα «επίπεδο θερμοκρασίας» με τρεις στάθμες και του παράγοντα «επίπεδο φωτισμού» με τρεις επίσης στάθμες. Κάθε συνδυασμός από δύο Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 95

5 στάθμες (μία από κάθε παράγοντα) ονομάζεται επέμβαση/αγωγή/μεταχείριση (treatment). Στο συγκεκριμένο πρόβλημα οι διαφορετικές επεμβάσεις (οι διαφορετικοί συνδυασμοί επιπέδου θερμοκρασίας-έντασης φωτισμού) είναι 9 και για κάθε επέμβαση ελήφθησαν παρατηρήσεις. Στην περίπτωση που μελετάμε την επίδραση ενός μόνο παράγοντα, οι επεμβάσεις είναι οι στάθμες του παράγοντα. Για παράδειγμα, στο Πρόβλημα-, οι επεμβάσεις είναι τα τρία είδη των τροφίμων διαίτης Α, Α και Α. Ας δούμε τώρα ποια είναι η βασική, η κεντρική, ιδέα της ανάλυσης διασποράς, το νόημά της και πώς εφαρμόζεται. Παρότι, η βασική ιδέα και το νόημα της ανάλυσης διασποράς είναι το ίδιο, ανεξάρτητα από το πειραματικό σχέδιο ή το σχέδιο δειγματοληψίας που χρησιμοποιούμε για τη συγκέντρωση των δεδομένων, εντούτοις, κατά περίπτωση, απαιτούνται κατάλληλες προσαρμογές στην εφαρμογή της μεθόδου (και είναι λογικό). Γι αυτό, στη συνέχεια θα παρουσιάσουμε τη μέθοδο ανά πειραματικό σχέδιο. Ειδικότερα, θα δούμε με ποιες προϋποθέσεις και πώς, μπορούμε να κάνουμε έλεγχο/ελέγχους ανάλυσης διασποράς στο Εντελώς Τυχαιοποιημένο Σχέδιο (Completely Randomized Design) και στο Σχέδιο Τυχαιοποιημένων Πλήρων Ομάδων (Randomized Complete Block Design) καθώς και στα παραγοντικά πειράματα και ειδικότερα στο α x b Παραγοντικό Πείραμα (α x b Factorial Experiment). Πριν προχωρήσουμε στην παρουσίαση της μεθόδου, αναφέρουμε και υπογραμμίζουμε τις υποθέσεις, ή αλλιώς, τις παραδοχές, που κάνουμε και πρέπει να ελέγχουμε αν ισχύουν/ικανοποιούνται όταν επιλέγουμε να εφαρμόσουμε ελέγχους ανάλυσης διασποράς. Υποθέσεις για την εφαρμογή ελέγχων ανάλυσης διασποράς. Οι πληθυσμοί από τους οποίους προέρχονται τα δείγματα είναι κανονικοί με κοινή διασπορά.. Οι υποθέσεις, κατά περίπτωση, που αφορούν τον τρόπο λήψης των παρατηρήσεων, δηλαδή, το πειραματικό σχέδιο. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 96

6 Εντελώς Τυχαιοποιημένο Σχέδιο (Completely Randomized Design) Πρόκειται για το πιο απλό πειραματικό σχέδιο, σύμφωνα με το οποίο, εργαζόμαστε με k ανεξάρτητα τυχαία δείγματα, ένα από κάθε πληθυσμό (ή αλλιώς, ένα από κάθε στάθμη του παράγοντα ή ένα από κάθε επέμβαση) και αποτελεί ευθεία γενίκευση του σχεδίου που γνωρίσαμε στα προηγούμενα όταν μιλήσαμε για τον έλεγχο των μέσων, μ και μ, δύο κανονικών πληθυσμών με δύο ανεξάρτητα τυχαία δείγματα. Τέτοια σχέδια είναι αυτά των Προβλημάτων και. Προτείνεται για περιπτώσεις όπου θεωρούμε ότι μόνο ένας παράγοντας ξεχωρίζει ως αξιοσημείωτη πηγή μεταβλητότητας της μεταβλητής απόκρισης και κάθε άλλη μεταβλητότητα στις τιμές της μεταβλητής απόκρισης, πέραν αυτής που οφείλεται σε αυτόν τον παράγοντα (επεμβάσεις), θεωρείται τυχαία μεταβλητότητα/πειραματικό σφάλμα. Δηλαδή, θεωρούμε ότι οι πειραματικές μονάδες δεν προσθέτουν μεταβλητότητα στις τιμές της μεταβλητής απόκρισης. Για παράδειγμα, στο Πρόβλημα-, ο φοιτητής, ως πηγή μεταβλητότητας των τιμών της χοληστερίνης, ξεχώρισε (για να μελετήσει) μόνο τον παράγοντα είδος τροφίμου διαίτης και όχι και κάποιον άλλο (π.χ. παραγωγός του τροφίμου διαίτης) και στο Πρόβλημα-, ο φοιτητής ξεχώρισε μόνο τον παράγοντα είδος πρόσθετης ύλης ως πηγή μεταβλητότητας της αύξησης του βάρους των νεογέννητων χοίρων. Άλλους παράγοντες που πιθανόν επηρεάζουν τη μεταβλητότητα της αύξησης του βάρους των νεογέννητων χοίρων (π.χ. ατομικότητα του ζώου, φυλή, γένος, συνθήκες ενσταυλισμού) δεν τους έλαβε υπόψη του στο σχεδιασμό. Ας θεωρήσουμε, ότι από καθέναν από k ( > ) κανονικούς πληθυσμούς με κοινή διασπορά, σ, και μέσες τιμές, αντίστοιχα, μ, μ,..., μk, παίρνουμε ένα τυχαίο δείγμα μεγέθους, αντίστοιχα, n, n,..., nk για να κάνουμε, με βάση αυτά τα k δείγματα, τον έλεγχο, της μηδενικής υπόθεσης, μ = μ =... = μ k : : μi μ για ένα τουλάχιστον ζεύγος (i, ) έναντι της εναλλακτικής, Πριν συνεχίσουμε την παρουσίαση της μεθόδου, επισημαίνουμε ότι, επειδή θεωρούμε ότι οι k πληθυσμοί είναι κανονικοί με κοινή διασπορά, σ, τότε, αν η μηδενική υπόθεση είναι αληθής, αυτό σημαίνει ότι τα k δείγματα προέρχονται από τον ίδιο πληθυσμό με κατανομή N ( μ, σ ), όπου, μ = μ = μ =... = μ k. Σημειώνουμε, επίσης, ότι ο συγκεκριμένος στατιστικός έλεγχος ανάλυσης διασποράς, εφαρμόζεται και για k = και μάλιστα, είναι ισοδύναμος, δηλαδή οδηγεί σε ταυτόσημα αποτελέσματα, με τον έλεγχο δύο μέσων με δύο ανεξάρτητα τυχαία δείγματα που γνωρίσαμε στα προηγούμενα. Η βασική ιδέα της μεθόδου είναι η εξής: όλες οι διαφορές στους δειγματικούς μέσους (στους μέσους των επεμβάσεων), y, y,..., yk, κρίνονται στατιστικά σημαντικές ή όχι, σε σχέση με τις μεταβλητότητες (διασπορές) εντός των δειγμάτων. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 97

7 Έτσι, παρότι στις δύο περιπτώσεις που φαίνονται στο Σχήμα-, οι αντίστοιχοι δειγματικοί μέσοι είναι ίσοι, στην πρώτη περίπτωση οι διαφορές που παρατηρούνται στους τρεις δειγματικούς μέσους κρίνονται στατιστικά σημαντικές και η μηδενική υπόθεση απορρίπτεται γιατί οι μεταβλητότητες εντός των δειγμάτων είναι μικρές, ενώ στη δεύτερη περίπτωση, ίδιες διαφορές στους δειγματικούς μέσους, δεν κρίνονται στατιστικά σημαντικές και η μηδενική υπόθεση δεν απορρίπτεται, γιατί οι μεταβλητότητες εντός των δειγμάτων είναι μεγάλες. μ = = απορρίπτεται : μ μ μ = = δεν απορρίπτεται : μ μ Σχήμα- Αυτή η ιδέα, «τεχνικά», υλοποιείται ως εξής: Εκτιμάμε την κοινή διασπορά, σ, των k κανονικών πληθυσμών (είναι άγνωστη συνήθως), με δύο τρόπους: ος τρόπος. Με το σταθμισμένο μέσο s w των k δειγματικών διασπορών, s, s,..., sk, δηλαδή, με το σταθμισμένο μέσο των διασπορών εντός των δειγμάτων (όπως κάναμε στον έλεγχο δύο μέσων με δύο ανεξάρτητα τυχαία δείγματα): ( n ) s + ( n ) s... + ( nk ) sk sw =, ν k όπου, ν = n + n n. k Αυτή η εκτίμηση είναι μια «λογική και καλή» εκτίμηση της από κοινού διασποράς, σ, ανεξάρτητα αν οι k μέσοι, μ, μ,..., μ k, είναι ίσοι ή όχι, δηλαδή, ανεξάρτητα αν η μηδενική υπόθεση είναι ή όχι αληθής. k = n ( y y) ος τρόπος. Με την sb =, όπου, y ο γενικός μέσος (ο μέσος όλων k των ν = n + n nk παρατηρήσεων) και y ο μέσος του δείγματος. Με αυτό τον τρόπο αξιοποιούμε τη σχέση που συνδέει τη διασπορά του πληθυσμού, σ, με τη διασπορά του δειγματικού μέσου, σ, δηλαδή, αξιοποιούμε τη σχέση, σ = nσ Y Y, που συνδέει τη διασπορά του πληθυσμού με τη διασπορά μεταξύ των δειγμάτων που παίρνουμε από αυτόν. Βέβαια, αυτή η εκτίμηση, είναι «λογική» και περιμένουμε να είναι περίπου ίση με την s w, μόνο αν η μηδενική υπόθεση είναι αληθής, δηλαδή, μόνο αν μ = μ =... = μ k = μ, γιατί στην περίπτωση αυτή τα k δείγματα θα προέρχονται από τον ίδιο κανονικό πληθυσμό, N ( μ, σ ), και επομένως μπορούμε τότε να αξιοποιήσουμε τη σχέση σ = nσ Y. sb Αν επομένως, η μηδενική υπόθεση είναι αληθής, αναμένουμε ο λόγος να είναι sw κοντά στο ένα, ενώ αν δεν είναι αληθής, περιμένουμε να αυξάνεται γιατί θα αυξάνεται ο αριθμητής που εμπεριέχει/ενσωματώνει και τη μεταβλητότητα στους δειγματικούς μέσους. Έτσι, ως κριτήριο/στατιστική συνάρτηση ελέγχου μπορούμε να χρησιμοποιήσουμε το λόγο: Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 98

8 μεταβλητό τητα μεταξύ των δειγμάτων μεταβλητότητα εντός των δειγμάτων Ανάλυση Διασποράς Ας συμβολίσουμε αυτόν το λόγο με F Tr. Προφανώς, με βάση τα προηγούμενα, ο SSTr ( k ) MSTr λόγος αυτός, μπορεί να εκφρασθεί ως, F tr = =, όπου, SSE ( ν k) MSE SSTr = n ( y y), ονομάζεται άθροισμα τετραγώνων των επεμβάσεων (ή αλλιώς, μεταξύ των δειγμάτων) και εκφράζει τη μεταβλητότητα μεταξύ των μέσων των k επεμβάσεων (ή αλλιώς, μεταξύ των μέσων των δειγμάτων) και έχει k βαθμούς ελευθερίας, SSE = ( y i y ), ονομάζεται άθροισμα τετραγώνων του σφάλματος και εκφράζει i τη μεταβλητότητα εντός των δειγμάτων (ή αλλιώς εντός των επεμβάσεων) και έχει ν k βαθμούς ελευθερίας, SSTr SSE MSTr = και MSE = ονομάζονται, αντίστοιχα, μέσο άθροισμα k ν k τετραγώνων των επεμβάσεων και μέσο άθροισμα τετραγώνων του σφάλματος και προφανώς είναι οι δύο εκτιμήτριες της κοινής διασποράς σ (που εξηγήσαμε προηγουμένως). Μάλιστα, (εύκολα) αποδεικνύεται ότι, n ( y y) + ( y y ) = ( y y), i i όπου, το διπλό άθροισμα ( y i y), συμβολίζεται με SSTot, ονομάζεται ολικό i άθροισμα τετραγώνων, έχει ν βαθμούς ελευθερίας και προφανώς εκφράζει την ολική μεταβλητότητα των παρατηρήσεων, ή αλλιώς, τη μεταβλητότητα όλων των παρατηρήσεων γύρω από το γενικό δειγματικό μέσο y. Δηλαδή, η ολική μεταβλητότητα, SSTot = ( y i y), αναλύεται σε δύο συνιστώσες: στη μεταβλητότητα μεταξύ των δειγμάτων: SSTr = n ( y y) και στη μεταβλητότητα εντός των δειγμάτων: SSE = ( y i y ). Δηλαδή, SSTr + SSE = SSTot. Αποδεικνύεται ότι, με την υπόθεση ότι η μηδενική υπόθεση, i i i i : μ = μ =... = μ k, είναι αληθής, η τυχαία μεταβλητή F Tr ακολουθεί την κατανομή F με k και ν k βαθμούς ελευθερίας, δηλαδή, MSTr Ftr = ~ F k ; ν k. MSE Επομένως, σε επίπεδο σημαντικότητας α %, η απορριπτική περιοχή του ελέγχου είναι: MSTr F tr = > Fk ; ν -k;α. MSE Για διευκόλυνση στον υπολογισμό των SSTot, SSTr και SSE, δίνουμε τους παρακάτω τύπους (αποδεικνύονται πολύ εύκολα). k G T G SSTot = yi, SSTr = και SSE = SSTot SSTr, όπου, ν n ν i = Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 99

9 G = i k y i = T = Ανάλυση Διασποράς, το γενικό άθροισμα (Grand total) των παρατηρήσεων, δηλαδή το άθροισμα όλων των ν = n + n nk, παρατηρήσεων και T, άθροισμα όλων των παρατηρήσεων του δείγματος. =,,..., k, το Για διευκόλυνσή μας, όλες τις πληροφορίες που είναι απαραίτητες για τον έλεγχο ανάλυσης διασποράς (αθροίσματα τετραγώνων, βαθμοί ελευθερίας, μέσα αθροίσματα τετραγώνων, τιμή του κριτηρίου) τις συγκεντρώνουμε σε έναν πίνακα που ονομάζεται Πίνακας Ανάλυσης Διασποράς (ANOVA Table). Πηγή μεταβλητότητας Επεμβάσεις (Treatments) ή Παράγοντας (factor) ή μεταξύ των δειγμάτων Σφάλμα (Error) ή εντός των δειγμάτων Β.Ε. Πίνακας Ανάλυσης Διασποράς (για το εντελώς τυχαιοποιημένο σχέδιο) Μέσο Άθροισμα άθροισμα τετραγώνων Κριτήριο F τετραγώνων SS MS k SSTr ν k SSE Ολική ν SSTot SSTr MSTr = k SSE MSE = ν k Περιοχή απόρριψης MSTr F Tr = FTr > F k ;ν k; α MSE Σημείωση: Στην περίπτωση που η κοινή διασπορά, σ, των k κανονικών πληθυσμών είναι γνωστή (κάτι το οποίο βέβαια δεν είναι σύνηθες σε πραγματικά προβλήματα), ως SSTr στατιστική συνάρτηση ελέγχου χρησιμοποιούμε το λόγο,. Με την υπόθεση ότι η σ SSTr μηδενική υπόθεση είναι αληθής, αποδεικνύεται ότι ~ χ k και επομένως, σε σ SSTr επίπεδο σημαντικότητας α %, η απορριπτική περιοχή του ελέγχου είναι, > χ k ; α. σ Ας δούμε, ως ένα παράδειγμα, πώς εφαρμόζουμε τα προηγούμενα για να απαντήσουμε στο ερώτημα που τίθεται στο Πρόβλημα-. Παράδειγμα-(αναφέρεται στο Πρόβλημα-): Προφανώς, το πείραμα σχεδιάσθηκε με βάση το εντελώς τυχαιοποιημένο σχέδιο. Έχουμε στη διάθεσή μας k = 4, ανεξάρτητα τυχαία δείγματα και κάνοντας τις παραδοχές ότι καθένα από αυτά προέρχεται από κανονικό πληθυσμό με διασπορά, σ, κοινή και για τους τέσσερις πληθυσμούς, θα εφαρμόσουμε τη μέθοδο ανάλυσης διασποράς για να ελέγξουμε, σε επίπεδο σημαντικότητας 5%, αν οι μέσες τιμές, μ, μ, μ, μ4, αντίστοιχα, των τεσσάρων πληθυσμών είναι ίσες ή όχι. Δηλαδή, θα ελέγξουμε αν τα συγκεκριμένα τέσσερα ανεξάρτητα τυχαία δείγματα υποστηρίζουν ή όχι, ότι η αύξηση του βάρους νεογέννητων χοίρων κατά τους τρεις πρώτους μήνες από τη γέννησή τους, επηρεάζεται από το είδος πρόσθετης ύλης (αν διαφοροποιείται από είδος σε είδος πρόσθετης ύλης). Συγκεκριμένα, σε επίπεδο σημαντικότητας 5%, θα κάνουμε τον έλεγχο της μηδενικής υπόθεσης, Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

10 : μ = μ = μ = μ4, έναντι της εναλλακτικής, : μi μ, για ένα τουλάχιστον ζευγάρι ( i, ), i, =,,, 4. Ανάλυση Διασποράς Τα τέσσερα δείγματα έχουν ίδιο μέγεθος, 5, δηλαδή, n = n = n = n4 = 5 και επομένως συνολικά έχουμε στη διάθεσή μας, ν = n + n + n + n4 = παρατηρήσεις. Για να κατασκευάσουμε τον πίνακα ανάλυσης διασποράς, κατ αρχάς, θα υπολογίσουμε τα αθροίσματα τετραγώνων SSTr, SSE και SSTot. Α Α Α Α T = 6 T = 4 T 66 T = 4 8 Το γενικό άθροισμα των ν = παρατηρήσεων είναι, G = y i = T = 45 και επομένως: G 45 SSTot = yi = ( ) = 88.55, i ν με ν = 9 βαθμούς ελευθερίας. = i 4 = T SSTr = 4 G = n ν βαθμούς ελευθερίας. 6 = = 54.5, με k = SSE = SSTot SSTr = = 684.4, με ν k = 6 βαθμούς ελευθερίας. Μπορούμε πλέον να κατασκευάσουμε τον πίνακα ανάλυσης διασποράς: Πίνακας Ανάλυσης Διασποράς Άθροισμα Μέσο άθροισμα Β.Ε. τετραγώνων τετραγώνων Κριτήριο F SS MS MSTr = = 5. 8 F Tr = = Σφάλμα MSE = = Πηγή μεταβλητότητας Παράγοντας (ή επεμβάσεις) (είδος πρόσθετης ύλης) Ολική Επειδή η τιμή F Tr =. δε βρίσκεται στην περιοχή απόρριψης της μηδενικής υπόθεσης αφού, F ;6;.5 =. 4, συμπεραίνουμε ότι, σε επίπεδο σημαντικότητας 5%, τα πειραματικά δεδομένα δεν υποστηρίζουν ότι το είδος πρόσθετης ύλης, επηρεάζει την αύξηση του βάρους νεογέννητων χοίρων κατά τους τρεις πρώτους μήνες από τη γέννησή τους. Για προβληματισμό: γιατί άραγε, ο επιβλέπων καθηγητής, μετά από αυτό το συμπέρασμα, πρότεινε στο φοιτητή (δες Πρόβλημα-) να εκτελέσει ένα ακόμη πείραμα, και μάλιστα, με διαφορετικό πειραματικό σχέδιο; Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

11 Ας δούμε ένα ακόμη παράδειγμα. Παράδειγμα-: Ένας μεταπτυχιακός φοιτητής του Τμήματος Γεωπονικής Βιοτεχνολογίας του Γ.Π.Α., στο πλαίσιο μιας εργαστηριακής άσκησης, διερεύνησε την περιεκτικότητα σε σωματιδιακές προσμείξεις ενός υγρού φαρμακευτικού σκευάσματος που χορηγείται ενδοφλεβίως σε ταύρους και παράγεται από τρεις διαφορετικές εταιρείες Α, Α και Α. Συγκεκριμένα, έλεγξε 6 σκευάσματα από κάθε εταιρεία (τυχαία επιλεγμένα) και κατέγραψε τον αριθμό σωματιδίων με διάμετρο μεγαλύτερη των 5 microns ανά λίτρο. Οι μετρήσεις που πήρε δίνονται στον πίνακα που ακολουθεί. Εταιρεία παραγωγής Αριθμός σωματιδίων (ανά λίτρο) Α Α Α Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα δεδομένα ότι υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των σκευασμάτων των τριών εταιρειών ως προς τη μέση περιεκτικότητά τους σε σωματιδιακές προσμείξεις; Ο φοιτητής έχει στη διάθεσή του 8 παρατηρήσεις, που συγκέντρωσε παίρνοντας k =, ανεξάρτητα τυχαία δείγματα. Με τις παραδοχές ότι καθένα από αυτά προέρχεται από κανονικό πληθυσμό με διασπορά, σ, κοινή και για τους τρεις πληθυσμούς, εφάρμοσε τη μέθοδο ανάλυσης διασποράς για να ελέγξει, σε επίπεδο σημαντικότητας 5%, αν οι μέσες τιμές, μ, μ, μ, αντίστοιχα, των τριών πληθυσμών είναι ίσες ή όχι. Δηλαδή, για να ελέγξει τη μηδενική υπόθεση, : μ = μ = μ, έναντι της εναλλακτικής, : μi μ, για ένα τουλάχιστον ζευγάρι ( i, ), i, =,,. Ο φοιτητής χρησιμοποίησε, για τους αναγκαίους υπολογισμούς, το στατιστικό πακέτο Statgraphics από το οποίο πήρε τον ακόλουθο πίνακα ανάλυσης διασποράς. ANOVA Table for αριθμός-σωματιδίων by εταιρεία-παραγωγής Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Between groups Within groups Total Επειδή P Value =.6 <. 5 (ή επειδή F Tr = 5.8 > F ;5;. 5 =. 68 ), η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 5% απορρίπτεται. Δηλαδή, τα δεδομένα από τα τρία συγκεκριμένα ανεξάρτητα και τυχαία δείγματα, δίνουν στατιστικά σημαντικές αποδείξεις ότι ο μέσος αριθμός σωματιδιακών προσμείξεων δεν είναι ίδιος στα τρία φαρμακευτικά σκευάσματα. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ.5 (μάλιστα, επειδή το στατιστικό πακέτο υπολόγισε την P-Value, μπορούμε να πούμε ότι αυτή η πιθανότητα είναι το πολύ.6). Βέβαια, το επόμενο (εύλογο) ερώτημα είναι: εφόσον η μηδενική υπόθεση απορρίπτεται, τι μπορούμε να πούμε για τις διαφορές των τριών μέσων; Διαφέρουν όλοι μεταξύ τους ή μόνο ένας (και ποιος είναι αυτός); Φυσικά, αυτό το ερώτημα, προκύπτει κάθε φορά που σε έναν έλεγχο ανάλυσης διασποράς, απορρίπτεται η μηδενική υπόθεση. Η απάντηση δεν είναι απλή, και ουσιαστικά, το ερώτημα αυτό, θέτει και πάλι το πρόβλημα πολλαπλών συγκρίσεων. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

12 Στη συνέχεια, θα δούμε κάποιες από τις απαντήσεις που δίνει σε αυτό το πρόβλημα η στατιστική συμπερασματολογία. (- α)% Διαστήματα Εμπιστοσύνης για τη μέση τιμή ενός πληθυσμού (ή αλλιώς, μιας επέμβασης) και για τη διαφορά των μέσων τιμών δύο πληθυσμών (ή αλλιώς, δύο επεμβάσεων) στο εντελώς τυχαιοποιημένο σχέδιο Ο φοιτητής (του προηγούμενου παραδείγματος), πιστεύει/υποψιάζεται, ότι από τα τρία φαρμακευτικά σκευάσματα, μεγαλύτερο αριθμό σωματιδιακών προσμείξεων περιέχει το σκεύασμα της εταιρείας Α και επίσης, ότι τα σκευάσματα των εταιρειών Α και Α μάλλον δε διαφέρουν (ως προς τον αριθμό σωματιδιακών προσμείξεων). Σε περιπτώσεις που υπάρχει ειδικό/προσχεδιασμένο ενδιαφέρον για κάποια k συγκεκριμένη, από τις k >, μέσες τιμές ή για κάποια, από τις, διαφορές μi μ, μια λύση είναι να κατασκευάσουμε ένα ( α ) % διάστημα εμπιστοσύνης, για τη συγκεκριμένη μέση τιμή που μας ενδιαφέρει και ένα ( α ) % διάστημα εμπιστοσύνης, για τη συγκεκριμένη διαφορά που μας ενδιαφέρει, χρησιμοποιώντας την κατανομή t. Μάλιστα, το απαιτούμενο για την κατασκευή των διαστημάτων s, μπορούμε να το υπολογίζουμε ως την τετραγωνική ρίζα του MSE αφού το MSE είναι αμερόληπτη εκτιμήτρια της άγνωστης διασποράς σ και μάλιστα υπολογίζεται από όλες τις παρατηρήσεις. Βέβαια, στην περίπτωση αυτή, για την κριτική τιμή χρησιμοποιούμε ν k βαθμούς ελευθερίας. (- α)% διάστημα εμπιστοσύνης για ένα μέσο μ i s y ± t ν k; n α (- α)% διάστημα εμπιστοσύνης για τη διαφορά μi μ δύο μέσων ( yi y ) ± s + tν k; α n i n Όπου, s = MSE και ν = n + n nk. Έτσι, στο παράδειγμά μας, έχουμε s = MSE = = 98. 9, y = 7. 8, y = 4.5, 67 y = 96. και επομένως, ένα 95% διάστημα εμπιστοσύνης για το μέσο αριθμό, μ, σωματιδιακών προσμείξεων στο φαρμακευτικό σκεύασμα της εταιρείας Α, είναι, s y ± t ν k ; α ή ± t5;. 5 ή ±. ή ± 86. n 6 6 και ένα 95% διάστημα εμπιστοσύνης για τη διαφορά μ μ των μέσων των σωματιδιακών προσμείξεων των σκευασμάτων των εταιρειών Α και Α είναι, ( y y) ± s + t ν k; α ή ( ) ± 98.9 t5;. 5 ή n n ±.69 ή [ 9., 5.6]. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

13 Παρατηρούμε ότι το 95% διάστημα εμπιστοσύνης, [ 9., 5.6], για τη διαφορά μ μ, περιέχει το και επομένως, σε επίπεδο σημαντικότητας 5%, τα δεδομένα από τα δείγματα δεν δείχνουν στατιστικά σημαντική διαφορά των μέσων των σωματιδιακών προσμείξεων των σκευασμάτων των εταιρειών Α και Α, δηλαδή, φαίνεται ότι ήταν βάσιμη η υποψία του ερευνητή. Στο Σχήμα- φαίνονται οι μέσοι των τριών δειγμάτων και τα αντίστοιχα 95% διαστήματα εμπιστοσύνης που κατασκευάσθηκαν όπως περιγράψαμε προηγουμένως. Το διάγραμμα αυτό έγινε με το στατιστικό πακέτο Statgraphics. Σχήμα- Παρατηρείστε, ότι υπάρχει επικάλυψη των διαστημάτων που αντιστοιχούν στα σκευάσματα των εταιρειών Α και Α αλλά και μεταξύ των Α και Α ενώ δεν υπάρχει μεταξύ των Α και Α. Όμως, αν ο φοιτητής δεν έχει προσχεδιάσει, δεν έχει εκ των προτέρων (a priori) ειδικό ενδιαφέρον, για κάποια διαφορά (π.χ, για την μ μ όπως είδαμε) και εκ των υστέρων (a posteriori) θέλει να διερευνήσει τη σημαντικότητα όλων των c = διαφορών, δηλαδή, και των διαφορών μ μ και μ μ, τότε απαιτείται άλλη προσέγγιση γιατί, όπως έχουμε εξηγήσει, αυξάνεται ραγδαία η πιθανότητα να αναδείξει τουλάχιστον μια από τις c διαφορές στατιστικά σημαντική ενώ δεν είναι (δηλαδή, η πιθανότητα να συμβεί τουλάχιστον μια φορά σφάλμα τύπου Ι ή αλλιώς, η πιθανότητα να συμβεί κατά πείραμα σφάλμα τύπου Ι). Ας δούμε πώς μπορούμε να κάνουμε πολλαπλές συγκρίσεις χωρίς να μας «ξεφεύγει» η πιθανότητα να κάνουμε σφάλμα τύπου Ι σε τουλάχιστον μια από αυτές, δηλαδή, η πιθανότητα σφάλματος τύπου Ι κατά πείραμα που συμβολίσαμε με α. Έλεγχοι πολλαπλών συγκρίσεων (multiple comparisons tests) Η πιο απλή (γιατί δεν υπάρχει μόνο μια) εκδοχή του προβλήματος των πολλαπλών συγκρίσεων, είναι αυτή στην οποία ήδη έχουμε αναφερθεί, δηλαδή, ο έλεγχος της : μ i = μ, έναντι της εναλλακτικής : μi μ, για όλα τα i, με i. Από τους πιο γνωστούς ελέγχους πολλαπλών συγκρίσεων αυτής της μορφής, είναι η διαδικασία/μέθοδος Tukey (95) (Tukey s method for paired comparisons), γνωστή και ως SD test (onestly Significant Difference test). Στη διαδικασία Tukey, όχι απλώς δεν μας «ξεφεύγει» το κατά πείραμα σφάλμα τύπου Ι, δηλαδή, η πιθανότητα να k κάνουμε σφάλμα τύπου Ι σε τουλάχιστον έναν από τους c = ελέγχους, αλλά το θέτουμε υπό τον έλεγχό μας, προκαθορίζοντάς το!! Δηλαδή, η διαδικασία Tukey, επιτυγχάνει το εξής: η πιθανότητα, μια τουλάχιστον διαφορά μ μ να αναδειχθεί, Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 4 i PE

14 ενώ δεν είναι, στατιστικά σημαντική, να είναι ίση με α %, που εμείς καθορίσαμε και επομένως προσφέρει μεγάλη προστασία από σφάλματα τύπου Ι αλλά γι αυτό θεωρείται (και είναι) συντηρητικός έλεγχος στην ανάδειξη στατιστικά σημαντικών διαφορών. Η διατήρηση της πιθανότητας σφάλματος τύπου Ι κατά πείραμα, σε προκαθορισμένο επίπεδο, επιτυγχάνεται με έναν απλό και έξυπνο τρόπο. Κατασκευάζουμε για όλες τις διαφορές μi μ, ( α)% ταυτόχρονα διαστήματα εμπιστοσύνης χρησιμοποιώντας την κατανομή studentized range Qk ; nk k και οι έλεγχοι της σημαντικότητάς τους γίνονται με αυτά τα διαστήματα. ( studentized range κατανομή Q είναι η κατανομή της τυχαίας μεταβλητής, S R όπου, R είναι το εύρος k κανονικών τυχαίων μεταβλητών και S μια εκτιμήτρια της τυπικής απόκλισής τους με υ βαθμούς ελευθερίας.) Αποδεικνύεται (δεν είναι δύσκολο) ότι, αν Y, =,,..., k είναι οι k δειγματικοί μέσοι σε ένα εντελώς τυχαιοποιημένο σχέδιο με k στάθμες, όπου για κάθε k στάθμη έχουμε ίδιο αριθμό παρατηρήσεων n = n = n =... = nk, τότε, τα ταυτόχρονα ( α)% διαστήματα εμπιστοσύνης για τις διαφορές μi μ είναι, MSE MSE Yi Y Qk; nk k; α, Yi Y + Qk; nk k; α, n n όπου, Qk; nk k; α το άνω α% ποσοστιαίο σημείο της Qk ; nk k κατανομής (υπάρχουν σχετικοί πίνακες). Ας δούμε πώς, κατασκευάζοντας 95% διαστήματα εμπιστοσύνης Tukey, μπορούμε να συγκρίνουμε, ανά δύο, τους μέσους, μ, μ, μ, του Παραδείγματος-. Παράδειγμα- (συνέχεια): Έχουμε, y = 7. 8, y = 4. 5, 67 y = 96., k =, MSE n = 6 και άρα, Q ; nk k; = Q;5;.5 = = 48. n 6 Έτσι, έχουμε: μi μ Yi Y k α. Q k; nk k; α MSE (όρια +/-) n 95% Δ.Ε. Tukey Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 5 k; υ Συμπέρασμα για τον έλεγχο: : μ = μ i : μ μ μ μ ( 78.9, 7.5) Δεν απορρίπτεται η μ μ ( 7., 5.4) Δεν απορρίπτεται η. μ μ Απορρίπτεται η ( 4.4, 44.) Επομένως, στατιστικά σημαντική αναδείχθηκε μόνο η διαφορά μ μ. Η πιθανότητα να κάνουμε ένα τουλάχιστον σφάλμα τύπου Ι στους τρεις ελέγχους, είναι το πολύ 5%. Στον πίνακα που ακολουθεί φαίνονται τα αποτελέσματα που παίρνουμε από το στατιστικό πακέτο Statgraphics, για τη διαδικασία Tukey που μόλις εφαρμόσαμε. i

15 Παρατηρείστε τη στήλη με τους δειγματικούς μέσους. Έχουν γραφεί σε αύξουσα σειρά και στην πρώτη στήλη έχουν γραφεί οι αντίστοιχες στάθμες (Α, Α, Α) του παράγοντα (εταιρεία παραγωγής). Παρατηρείστε, επίσης, τη στήλη με τα σύμβολα «Χ». Αυτά, «διαβάζονται» ως εξής: Στους μέσους που αντιστοιχούν σε «Χ» που βρίσκονται στην ίδια στήλη, δεν διαπιστώθηκε στατιστικά σημαντική διαφορά. Multiple Range Tests for αριθμός_σωματιδίων by εταιρεία-παραγωγής Method: 95, percent Tukey SD Εταιρεία-παραγωγής Count Mean omogeneous Groups X XX X Contrast Difference +/- Limits * *denotes a statistically significant difference. Η διαδικασία Tukey μπορεί να εφαρμοσθεί και ως εξής: Διατάσσουμε τους τρεις δειγματικούς μέσους σε αύξουσα σειρά, y = 4. 5, y = 7. 8, 67 y = 96. και Yi Y κάνουμε όλους τους ανά δύο ελέγχους με απορριπτική περιοχή, > Qk; nk k; α MSE n ή Yi Y > Qk; nk k; α MSE n, και αρχίζοντας με τη σύγκριση των μέσων που οι αντίστοιχοι δειγματικοί μέσοι είναι ο μεγαλύτερος και ο μικρότερος, συνεχίζουμε με την ίδια λογική. Αν η μηδενική υπόθεση δεν απορριφθεί για ένα ζευγάρι μέσων, τότε, οι έλεγχοι για τους μέσους που οι αντίστοιχοι δειγματικοί βρίσκονται εντός του εύρους των δειγματικών μέσων των δύο συγκρινόμενων μέσων, δε χρειάζεται να γίνουν. Δηλαδή, αν στο παράδειγμά μας, δεν απορριφθεί η : μ = μ, τότε δε χρειάζεται να γίνει και ο έλεγχος της : μ = μ (γιατί;). Στον πίνακα που ακολουθεί φαίνεται αυτός ο τρόπος εφαρμογής της διαδικασίας Tukey. Σύγκριση μ i i vs μ Y Y MSE n q Y Y i = Q ;5;. 5 MSE n Συμπέρασμα για τον έλεγχο: : μ = μ i : μ μ μ vs μ Απορρίπτεται η μ vs μ Δεν απορρίπτεται η μ vs Δεν απορρίπτεται η μ Στο Σχήμα- που ακολουθεί φαίνεται το διάγραμμα μέσων με τα αντίστοιχα 95% διαστήματα εμπιστοσύνης Tukey. i Σχήμα- Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 6

16 Παρατηρήσεις:. Αρκετά συχνά, όπως συμβαίνει και στο προηγούμενο παράδειγμα, τα αποτελέσματα ενός ελέγχου πολλαπλών συγκρίσεων, μπορεί να φαίνονται διφορούμενα/ασαφή. Παρατηρώντας τη στήλη με τα σύμβολα «Χ», φαίνεται το δείγμα και το δείγμα να προέρχονται από έναν πληθυσμό και το δείγμα και το δείγμα από έναν άλλο πληθυσμό. Και, φυσικά, γεννάται η απορία: τελικά από ποιον από τους δύο αυτούς πληθυσμούς προέρχεται το δείγμα; Η απάντηση είναι εξής: προφανώς η μέθοδος δε μπόρεσε να ταξινομήσει με σαφήνεια το δείγμα (συνέβη τουλάχιστον ένα σφάλμα τύπου ΙΙ). Επομένως, στο παράδειγμά μας, το συμπέρασμα από τις τρεις ανά δύο συγκρίσεις με τη διαδικασία Tukey, είναι ότι μ μ και όχι μ = μ μ = μ. Μια λύση στο πρόβλημα αυτό μπορεί να είναι η επανάληψη της δειγματοληψίας με μεγαλύτερα μεγέθη δειγμάτων, για να αυξήσουμε την ισχύ του ελέγχου ή ισοδύναμα, για να μειώσουμε την πιθανότητα να συμβεί σφάλμα τύπου ΙΙ. Μπορούμε, βέβαια, να κάνουμε κάποιον άλλο, πιο ισχυρό, έλεγχο (αλλά, φυσικά, με το ανάλογο κόστος στην πιθανότητα σφάλματος τύπου Ι).. Αν τα k δείγματα δεν είναι του ιδίου μεγέθους, η μέθοδος Tukey μπορεί να εφαρμοσθεί με κατάλληλη προσαρμογή στον υπολογισμό των ορίων των διαστημάτων. Αντί MSE χρησιμοποιούμε n MSE + ni n Μια άλλη, πολύ γνωστή επίσης, μέθοδος πολλαπλών συγκρίσεων είναι η διαδικασία/μέθοδος Newman-Keuls (99; 95) γνωστή και ως Student-Newman- Keuls/SΝK. Είναι ανάλογη με τη διαδικασία Tukey με μία διαφορά. Η κριτική τιμή είναι Q p; nk k; α, όπου p, ο αριθμός των μέσων που βρίσκονται στο εύρος που ορίζουν οι συγκρινόμενοι κάθε φορά μέσοι. Δηλαδή η κριτική τιμή, Q p; nk k; α, δεν είναι ίδια για όλους τους ανά δύο ελέγχους. Ας εφαρμόσουμε τη μέθοδο SΝK για τα δεδομένα του Παραδείγματος-. Παράδειγμα- (συνέχεια): Διατάσσουμε τους τρεις δειγματικούς μέσους σε αύξουσα σειρά: y = 4. 5, y = 7. 8, 67 y = 96. Σύγκριση μ i vs μ Yi Y MSE n Y Y q = p Q p;5;. 5 MSE n i. Συμπέρασμα για τον έλεγχο: : μ = μ i : μ μ μ vs μ Απορρίπτεται η μ vs μ Απορρίπτεται η μ vs Δεν απορρίπτεται η μ Στατιστικά σημαντικές, με τη διαδικασία SNK, βλέπουμε ότι αναδείχθηκαν δύο διαφορές, η μ μ και η μ μ, ενώ με τη διαδικασία Tukey, όπως είδαμε, στατιστικά σημαντική αναδείχθηκε μόνο η διαφορά μ μ. Γενικά, η διαδικασία SNK είναι πιο ισχυρή (πιο ευαίσθητη, ή αλλιώς, λιγότερο συντηρητική, στην ανάδειξη διαφορών) από τη διαδικασία Tukey, δηλαδή, τείνει να αναδεικνύει, ως στατιστικά σημαντικές διαφορές, περισσότερες από αυτές που αναδεικνύει η διαδικασία Tukey. Όμως, η πιθανότητα α PE, να συμβεί τουλάχιστον ένα σφάλμα τύπου Ι, μπορεί να ξεπεράσει το επίπεδο που ορίζουμε (στο παράδειγμά μας, το 5%). i Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 7

17 Στον πίνακα που ακολουθεί φαίνονται τα αποτελέσματα που παίρνουμε από το στατιστικό πακέτο Statgraphics, για τη διαδικασία SNK που μόλις εφαρμόσαμε. Multiple Range Tests for αριθμός_σωματιδίων by εταιρεία-παραγωγής Method: 95, percent Student-Newman-Keuls Εταιρεία-παραγωγής Count Mean omogeneous Groups X X X Contrast Difference *-.8 - * * denotes a statistically significant difference. Παρατηρείστε τη στήλη με τα σύμβολα «Χ». Χρησιμοποιώντας έναν πιο ισχυρό έλεγχο, το πρόβλημα με την ασάφεια στην ταξινόμηση του δείγματος δεν υφίσταται πλέον (μπορούμε δηλαδή να πούμε ότι το συμπέρασμα είναι, μ = μ μ, αλλά (επειδή όλα στη ζωή έχουν κόστος) μπορεί η πιθανότητα, στις τρεις συγκρίσεις, να κάνουμε τουλάχιστον ένα σφάλμα τύπου Ι, να έχει αυξηθεί. Στη συνέχεια, θα αναφερθούμε σε βασικά μόνο χαρακτηριστικά και στη λογική πέντε ακόμη ελέγχων πολλαπλών συγκρίσεων χωρίς να αναφερθούμε λεπτομερώς σε αυτούς (η εκτέλεσή τους είναι πλέον εύκολη με χρήση στατιστικών πακέτων). Συγκεκριμένα, θα αναφερθούμε στους ελέγχους/μεθόδους, Scheffe, Dunn, Dunnett, Duncan και LSD. Ο έλεγχος Scheffe ή S-Method, διατηρεί την πιθανότητα σφάλματος τύπου Ι κατά πείραμα, σε προκαθορισμένο επίπεδο, όπως η διαδικασία Tukey και επομένως μας προσφέρει μεγάλη προστασία από σφάλματα τύπου Ι. Όμως, έχει σχεδιασθεί όχι για πολλαπλές συγκρίσεις ανά δύο αλλά για άλλου τύπου συγκρίσεις (γραμμικές αντιθέσεις/linear contrasts), στις οποίες δε θα αναφερθούμε. Αναφέρουμε μόνο, ότι σε ένα πείραμα, για παράδειγμα με k = 5 επεμβάσεις, έλεγχος γραμμικής αντίθεσης μ + μ είναι, για παράδειγμα, ο έλεγχος της μηδενικής υπόθεσης, : μ = ή της μ + μ μ 4 + μ5 : ή της μ μ. Όπως φαίνεται και από το = : = τελευταίο παράδειγμα, ο έλεγχος Scheffe μπορεί να εφαρμοσθεί και για όλες τις ανά δύο συγκρίσεις, όμως, στην περίπτωση αυτή, είναι πολύ συντηρητικός στην ανάδειξη στατιστικά σημαντικών διαφορών (περισσότερο και από τη διαδικασία Tukey). Ο έλεγχος Dunn (Bonferroni correction), χειρίζεται την πιθανότητα σφάλματος τύπου Ι κατά πείραμα, α PE, ως εξής: την προκαθορίζει σε ένα ορισμένο επίπεδο και την κατανέμει (όχι κατ ανάγκη εξίσου) στις ανά δύο συγκρίσεις που θα γίνουν (διόρθωση Bonferroni, με βάση τη σχέση α PE c α PC ). Για παράδειγμα, αν αποφασίσουμε να κάνουμε 4 συγκρίσεις και ορίσουμε την πιθανότητα σφάλματος τύπου Ι κατά πείραμα, σε 5%, μπορούμε κάθε σύγκριση να την κάνουμε σε επίπεδο σημαντικότητας α PC =.5 ή τις τρεις σε. την κάθε μια, και την τέταρτη σε., κ.τλ.. Είναι από τους πλέον συντηρητικούς ελέγχους και προσφέρεται για μικρό μόνο αριθμό συγκρίσεων. Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 8

18 Ο έλεγχος Dunnett (955), σχεδιάσθηκε και προσφέρεται για περιπτώσεις που μας ενδιαφέρει η σύγκριση ενός μάρτυρα με κάθε μια από ένα σύνολο επεμβάσεων. Δηλαδή, όταν δεν μας ενδιαφέρουν όλες οι δυνατές συγκρίσεις αλλά έχουμε προσχεδιάσει να κάνουμε μόνο τις συγκεκριμένες συγκρίσεις με το μάρτυρα. Και αυτός ο έλεγχος, λαμβάνει υπόψη το σφάλμα τύπου Ι κατά πείραμα, α. Ο έλεγχος Duncan (955), όπως και ο SNK, χειρίζεται το σφάλμα τύπου Ι κατά πείραμα, α PE, λαμβάνοντας υπόψη τον αριθμό των μέσων που βρίσκονται μεταξύ των μέσων που κάθε φορά συγκρίνονται και γι αυτό και έχει ανάλογη συμπεριφορά με τον έλεγχο SNK, δηλαδή, έχει την τάση να αναδεικνύει περισσότερες στατιστικά σημαντικές διαφορές από τη διαδικασία Tukey. Τελευταίο αφήσαμε τον έλεγχο ελάχιστης σημαντικής διαφοράς LSD (Least Significant Difference) (Fisher, 95), γιατί είναι ο μόνος ο οποίος δε λαμβάνει υπόψη το σφάλμα τύπου Ι κατά πείραμα, α PE. Είναι ο πλέον ευαίσθητος στην ανάδειξη στατιστικά σημαντικών διαφορών, όμως παρέχει τη μικρότερη προστασία από σφάλματα τύπου Ι. Αν επιλέξουμε να τον εφαρμόσουμε, πρέπει αφενός οι συγκρίσεις να είναι λίγες, και αφετέρου, να έχει προηγηθεί έλεγχος ανάλυσης διασποράς της μηδενικής υπόθεσης : μ = μ =... = μk και αυτή να έχει απορριφθεί (έτσι μπορεί να δικαιολογηθεί και η χρησιμοποίησή του, παρότι δε λαμβάνει καμία μέριμνα για έλεγχο του σφάλματος τύπου Ι κατά πείραμα, με την έννοια, ότι αφού έχει προηγηθεί απόρριψη της : μ = μ =... = μk, περιμένουμε να μην συμβούν πολλά σφάλματα τύπου Ι στις πολλαπλές συγκρίσεις). Παρατήρηση: Παρότι, για την εφαρμογή των ελέγχων πολλαπλών συγκρίσεων δεν απαιτείται να έχει προηγηθεί έλεγχος ανάλυσης διασποράς της μηδενικής υπόθεσης : μ = μ =... = μ k και απόρριψή της, εντούτοις, συνηθίζεται να εφαρμόζονται μετά από έλεγχο ανάλυση διασποράς και απόρριψη της : μ = μ =... = μk. Όμως, επαναλαμβάνουμε, ειδικά ο έλεγχος ελάχιστης σημαντικής διαφοράς (LSD), πρέπει να εφαρμόζεται μόνο μετά από απόρριψη της μ = μ =... = μ : k. Ολοκληρώνοντας αυτή τη σύντομη αναφορά στους ελέγχους πολλαπλών συγκρίσεων, απαιτείται να κάνουμε ένα σχόλιο σχετικά με το πώς, με ποια κριτήρια, αποφασίζουμε, ποιος έλεγχος πολλαπλών συγκρίσεων είναι ο καταλληλότερος για την στατιστική ανάλυση των δεδομένων μας. Για να επιλέξουμε τον κατάλληλο έλεγχο πρέπει πρώτα να αποφασίσουμε αν θέλουμε να κάνουμε όλες τις ανά δύο συγκρίσεις ή μόνο κάποιες συγκεκριμένες. Στις περιπτώσεις που ενδιαφερόμαστε μόνο για κάποιες συγκεκριμένες συγκρίσεις πρέπει να επιλέξουμε μεταξύ των ελέγχων Dunnett και Scheffe (κατά περίπτωση). Πρέπει επίσης να σταθμίσουμε τη σημασία των σφαλμάτων τύπου Ι και τύπου ΙΙ στη συγκεκριμένη έρευνα. Δηλαδή, αν πρέπει να «προστατευθούμε» περισσότερο από σφάλματα τύπου Ι ή από σφάλματα τύπου ΙΙ, αν μας ενδιαφέρει ο έλεγχος της πιθανότητας σφάλματος τύπου Ι κατά πείραμα, α, ή/και της πιθανότητας σφάλματος τύπου Ι κατά σύγκριση, α PC Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 9 PE. Φυσικά, η απάντηση σε αυτά τα ερωτήματα εξαρτάται από το συγκεκριμένο κάθε φορά ερευνητικό πρόβλημα αλλά και από την γενικότερη αντίληψη/άποψη του ερευνητή για τη σημασία και τη βαρύτητα των διαφόρων τύπων σφαλμάτων σε μια έρευνα. Αν αποφασίσουμε ότι το κατά πείραμα σφάλμα τύπου Ι, α PE, μας ενδιαφέρει, τότε πρέπει να αποκλείσουμε από τις επιλογές μας τον έλεγχο LSD και να επιλέξουμε μεταξύ των ελέγχων, Tukey, Scheffe, Duncan SNK και Dunn. PE

19 Το βασικό στοιχείο που πρέπει, στο σημείο αυτό, να λάβουμε υπόψη μας είναι ο τρόπος που ο κάθε έλεγχος χειρίζεται την προστασία από το σφάλμα τύπου Ι κατά πείραμα, α PE, γιατί, ουσιαστικά, με βάση αυτόν διαφοροποιούνται. Υπενθυμίζουμε ότι, ο έλεγχος Scheffe, όταν χρησιμοποιείται για όλες τις ανά δύο συγκρίσεις είναι πολύ συντηρητικός, δηλαδή, παρέχει τη μικρότερη προστασία από σφάλματα τύπου ΙΙ κάτι το οποίο συμβαίνει και με τον έλεγχο Dunn όταν ο αριθμός των συγκρίσεων δεν είναι μικρός. Από τους ελέγχους, Tukey, Duncan και SNK ο πλέον συντηρητικός είναι ο Tukey αλλά παρέχει μεγαλύτερη προστασία από σφάλμα τύπου Ι κατά πείραμα, α PE, ενώ οι Duncan και SNK τείνουν να αναδεικνύουν περισσότερες σημαντικές διαφορές γιατί, όπως είδαμε, χειρίζονται το α PE, με άλλον τρόπο («διαβαθμίζουν» την προστασία). Ολοκληρώνοντας αυτό το σύντομο σχόλιο, σημειώνουμε ότι στη σχετική βιβλιογραφία, φυσικά, δεν υπάρχουν τυποποιημένα και απόλυτα κριτήρια ή αυστηρά οριοθετημένες περιπτώσεις για το ποιος ή ποιοι έλεγχοι είναι οι καταλληλότεροι. Η απόφαση ανήκει στον ερευνητή και πρέπει να είναι αιτιολογημένη. Απαραίτητη προϋπόθεση γι αυτό, είναι να έχει κατανοήσει τη λογική και τα βασικά, τουλάχιστον, χαρακτηριστικά κάθε ελέγχου. Υποθέσεις/παραδοχές στο εντελώς τυχαιοποιημένο σχέδιο Οι υποθέσεις/παραδοχές που κάνουμε στο εντελώς τυχαιοποιημένο σχέδιο (με καθορισμένες επιδράσεις), όπως ήδη έχουμε αναφέρει, είναι:. Τα k δείγματα είναι ανεξάρτητα τυχαία δείγματα (όλες οι παρατηρήσεις y i είναι μεταξύ τους ανεξάρτητες). Κάθε δείγμα προέρχεται από κανονικό πληθυσμό. Οι k πληθυσμοί έχουν κοινή διασπορά, σ (ομοσκεδαστικότητα) Αν ε i = Yi μ, =,,..., k, i =,,...,n η απόκλιση της Y i από τη μέση τιμή μ του πληθυσμού, τότε οι παραπάνω υποθέσεις είναι ισοδύναμες με τις εξής:. Τα ε i είναι μεταξύ τους ανεξάρτητα. ε i ~ N(, σ ) Τα ε i ονομάζονται υπόλοιπα (residuals) και εκφράζουν το πειραματικό σφάλμα (experimental error) δηλαδή, τη μεταβλητότητα που δεν εξηγείται από τις επεμβάσεις. Όταν τα μεγέθη, n n, n,,... k, των k δειγμάτων είναι ίσα, η ανάλυση διασποράς είναι «ανθεκτική» σε μικρές ή μέτριες αποκλίσεις από την υπόθεση τόσο της κανονικότητας των πληθυσμών όσο και της ομοσκεδαστικότητας. Δηλαδή, η πιθανότητα σφάλματος τύπου Ι είναι κοντά στο επίπεδο σημαντικότητας που ορίζουμε ακόμη και αν υπάρχουν μικρές ή μέτριες αποκλίσεις από τις δύο αυτές παραδοχές. Αν όμως, τα i n δεν είναι ίσα, τότε η πιθανότητα σφάλματος τύπου Ι μπορεί να διαφέρει αρκετά από το επίπεδο σημαντικότητας που ορίζουμε, ανάλογα με το μέγεθος της ετεροσκεδαστικότητας (αν μεγάλες διασπορές αντιστοιχούν σε μικρά δείγματα, η πιθανότητα σφάλματος τύπου Ι μπορεί να είναι αρκετά μεγαλύτερη από το επίπεδο σημαντικότητας που ορίζουμε). Επίσης, αν οι κατανομές των πληθυσμών είναι πλατύκυρτες ή λεπτόκυρτες και τα δείγματα μικρά, η πραγματική ισχύς (και επομένως η πιθανότητα σφάλματος τύπου ΙΙ) του ελέγχου επηρεάζεται. Βέβαια, αν τα δείγματα δεν είναι πολύ μικρά, μικρές αποκλίσεις από την κανονικότητα, δε δημιουργούν πρόβλημα εγκυρότητας του Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

20 ελέγχου ανάλυσης διασποράς. Σε κάθε περίπτωση, όμως, πρέπει να ελέγχουμε τη βασιμότητα των απαιτούμενων παραδοχών/υποθέσεων. Για τον έλεγχο της κανονικότητας των πληθυσμών από τους οποίους προέρχονται τα δείγματα είτε της κανονικότητας των υπολοίπων, αλλά και για τον έλεγχο της ισότητας των διασπορών και της ανεξαρτησίας των υπολοίπων, η Στατιστική μας προσφέρει μια μεγάλη ποικιλία μεθόδων και τεχνικών οι οποίες πλέον, με χρήση κάποιου στατιστικού πακέτου, μπορούν πολύ εύκολα να εφαρμοσθούν και να αξιοποιηθούν. Για τον έλεγχο της κανονικότητας μπορούμε να κάνουμε ελέγχους καλής προσαρμογής (έλεγχος Kolmogorov-Smirnov, έλεγχος Anderson-Darling, έλεγχος X, κ.ά.) Επίσης, για τον έλεγχο ισότητας των διασπορών μπορούμε να κάνουμε έλεγχο Bartlett, έλεγχο Cochran, έλεγχο artley, κ.ά.. Δεν θα αναφερθούμε αναλυτικά σε καθέναν από αυτούς τους ελέγχους. Για τον έλεγχο Bartlett, επειδή είναι από τους πλέον γνωστούς και χρησιμοποιείται πολύ συχνά, επισημαίνουμε μόνο ότι αν δεν ισχύει η υπόθεση της κανονικότητας, επηρεάζεται πολύ και μπορεί να δώσει μη έγκυρα αποτελέσματα. Τέλος, για το έλεγχο της ανεξαρτησίας των σφαλμάτων μπορούμε να κάνουμε κάποιο έλεγχο τυχαιότητας (randomness test) όπως, έλεγχο ροών (runs test). Εικόνα για τη βασιμότητα των παραπάνω παραδοχών/υποθέσεων παίρνουμε επίσης κατασκευάζοντας κατάλληλα ιστογράμματα, θηκογράμματα, κανονικά διαγράμματα πιθανοτήτων (NPP) και διαγράμματα υπολοίπων (residuals plots). Αν διαπιστώσουμε ότι η υπόθεση/παραδοχή της κανονικότητας ή της ομοσκεδαστικότητας (ή και οι δύο) δεν ικανοποιούνται, είναι δυνατόν με κατάλληλο μετασχηματισμό της μεταβλητής απόκρισης (των παρατηρήσεων) να «διορθώσουμε» τις αποκλίσεις από αυτές τις παραδοχές. Στο θέμα αυτό δε θα επεκταθούμε περισσότερο, αναφέρουμε μόνο ότι συχνά εφαρμοζόμενοι μετασχηματισμοί είναι, ο λογάριθμος και η τετραγωνική ρίζα. Αν δεν ικανοποιούνται οι υποθέσεις εφαρμογής ελέγχου ανάλυσης διασποράς, η Στατιστική μας προσφέρει λύσεις μέσω μη παραμετρικών ελέγχων, όπως ο έλεγχος Kruskal-Wallis, για τους οποίους οι προϋποθέσεις εφαρμογής είναι πολύ γενικές (π.χ. ότι η μεταβλητή απόκρισης έχει συνεχή κατανομή). Ας δούμε, με τη βοήθεια του στατιστικού πακέτου Statgraphics, αν ικανοποιούνται οι υποθέσεις της ανάλυσης διασποράς στο Παράδειγμα-. Παράδειγμα- (συνέχεια): Για να ελέγξουμε αν ικανοποιούνται οι υποθέσεις ότι τα 4 δείγματα προέρχονται από κανονικούς πληθυσμούς με κοινή διασπορά σ, μπορούμε ισοδύναμα να ελέγξουμε αν για τα θεωρητικά υπόλοιπα ε i = Yi μ ισχύει ότι ε i ~ N(, σ ). Για το σκοπό αυτό, χρησιμοποιούμε τα «παρατηρούμενα» υπόλοιπα εˆ i, καθένα από τα οποία υπολογίζεται αν από την αντίστοιχη παρατήρηση αφαιρέσουμε τη μέση τιμή του δείγματος στο οποίο αυτή ανήκει. Έτσι, επειδή οι τέσσερις δειγματικοί μέσοι είναι, αντίστοιχα, y = 7.4, y = 68.6, y = 7., y = , τα παρατηρούμενα υπόλοιπα των παρατηρήσεων από την επέμβαση Α είναι, = 8. 6, = 6. 4, = 5. 6, =. 6, =.4 (ομοίως υπολογίζονται και για τις υπόλοιπες παρατηρήσεις από τις άλλες επεμβάσεις). Εργαστήριο Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos)

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

13. Ανάλυση Διακύμανσης

13. Ανάλυση Διακύμανσης . Ανάλυση Διακύμανσης Ανάλυση Διακύμανσης Ανάλυση Διακύμανσης (Analysis of Variance, ANOVA) είναι μέθοδος στατιστικού ελέγχου υποθέσεων που αναφέρονται σε περισσότερους από δύο πληθυσμούς. Στην προηγούμενη

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 2 ο ) 31/3/2017

Ανάλυση διακύμανσης (Μέρος 2 ο ) 31/3/2017 Ανάλυση διακύμανσης (Μέρος 2 ο ) 31/3/2017 2 Σχέδιο τυχαιοποιημένων πλήρων ομάδων (1) Αποτελεί ευθεία γενίκευση του σχεδίου που γνωρίσαμε όταν μιλήσαμε για τη σύγκριση κατά ζεύγη δύο μέσων μ 1 και μ 2

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 015 Ανάλυση Διακύμανσης Η Ανάλυση Διακύμανσης είναι μία τεχνική που

Διαβάστε περισσότερα

Ανάλυση Διασποράς Προβλήματα και Ασκήσεις

Ανάλυση Διασποράς Προβλήματα και Ασκήσεις Ανάλυση Διασποράς Προβλήματα και Ασκήσεις 1. Ένας ερευνητής προκειμένου να συγκρίνει τρία σιτηρέσια εκτροφής κοτόπουλων (Σ1, Σ2 και Σ3, αντίστοιχα), σχεδίασε και εκτέλεσε το εξής πείραμα. Επέλεξε 15 νεογέννητα

Διαβάστε περισσότερα

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011 Εργαστήριο Μαθηματικών & Στατιστικής Γραπτή Εξέταση Περιόδου Φεβρουαρίου για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 5//. [] Η ποσότητα, έστω Χ, ενός συντηρητικού που περιέχεται σε φιάλες αναψυκτικού

Διαβάστε περισσότερα

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40] Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική 8// (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [4] Τα τελευταία χρόνια παρατηρείται συνεχώς αυξανόμενο ενδιαφέρον για τη μελέτη της συγκέντρωσης

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων 1 Μονοπαραγοντική Ανάλυση Διακύμανσης Παραμετρικό στατιστικό κριτήριο για τη μελέτη της επίδρασης μιας ανεξάρτητης μεταβλητής στην εξαρτημένη Λογική

Διαβάστε περισσότερα

Μάθημα: Στατιστική ανάλυση δεδομένων με χρήση Η/Υ (του 8 ου Εξαμήνου Σπουδών του Τμήματος Βιοτεχνολογίας) Διδάσκων: Γιώργος Κ.

Μάθημα: Στατιστική ανάλυση δεδομένων με χρήση Η/Υ (του 8 ου Εξαμήνου Σπουδών του Τμήματος Βιοτεχνολογίας) Διδάσκων: Γιώργος Κ. Μάθημα: Στατιστική ανάλυση δεδομένων με χρήση Η/Υ (του 8 ου Εξαμήνου Σπουδών του Τμήματος Βιοτεχνολογίας) Διδάσκων: Γιώργος Κ. Παπαδόπουλος 3. Ανάλυση Διακύμανσης Σύντομη ανασκόπηση βασικών εννοιών, προτάσεων

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ (Analyss of Varance for two factor Experments) (Two-Way Analyss of Varance) Ο πειραματικός σχεδιασμός για τον οποίο θα μιλήσουμε είναι μια επέκταση της μεθοδολογίας

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 3 ο ) 7/4/2017

Ανάλυση διακύμανσης (Μέρος 3 ο ) 7/4/2017 Ανάλυση διακύμανσης (Μέρος 3 ο ) 7/4/2017 2 α x b Παραγοντικό Πείραμα (1) Όταν θέλουμε να μελετήσουμε την επίδραση (στη μεταβλητή απόφασης) δύο παραγόντων, έστω Α και Β, με α στάθμες ο Α και b στάθμες

Διαβάστε περισσότερα

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική Εργαστήριο Μαθηματικών & Στατιστικής ΣΕΙΡΑ Α Γραπτή Εξέταση Περιόδου Φεβρουαρίου 013 στη Στατιστική για τα Τμήματα Ε.Τ.Τ., Γ.Β., Α.Ο.Α. και Ε.Ζ.Π.&Υ. 08/0/013 1. [0] Η ποσότητα, έστω Χ, καλίου που περιέχεται

Διαβάστε περισσότερα

Ανάλυση Διακύμανσης με ένα Παράγοντα (One Way ANOVA)

Ανάλυση Διακύμανσης με ένα Παράγοντα (One Way ANOVA) Κεφάλαιο 7 Ανάλυση Διακύμανσης με ένα Παράγοντα (One Way ANOVA) 7.1 Γενικότητες Η ANOVA περιλαμβάνει μία ομάδα στατιστικών μεθόδων κατάλληλων για την ανάλυση δεδομένων που προκύπτουν από πειραματικούς

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Πολλαπλές συγκρίσεις Στην ανάλυση διακύμανσης ελέγχουμε την ισότητα

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΕΝΟΤΗΤΕΣ 1. ΓΕΝΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ 3. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΗΣ ΠΡΟΟΔΕΥΤΙΚΗΣ ΠΡΟΣΘΗΚΗΣ

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

Επαναληπτικές Ασκήσεις 26/5/2017

Επαναληπτικές Ασκήσεις 26/5/2017 Επαναληπτικές Ασκήσεις 2 Άσκηση 1 η (1) Ένας ερευνητής μέτρησε τη συγκέντρωση γλυκόζης (σε mg/dl) στο αριστερό και το δεξί μάτι 35 τυχαία επιλεγμένων υγιών σκύλων συγκεκριμένης ράτσας Έστω ότι με Χ και

Διαβάστε περισσότερα

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Κεφάλαιο 14 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης 1 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Παραµετρικό στατιστικό κριτήριο για τη µελέτη της επίδρασης µιας ανεξάρτητης µεταβλητής στην εξαρτηµένη Λογική παρόµοια

Διαβάστε περισσότερα

7. Ανάλυση Διασποράς-ANOVA

7. Ανάλυση Διασποράς-ANOVA 7. Ανάλυση Διασποράς-ANOVA Παράδειγμα Μετρήσεις της συγκέντρωσης του strodum (mg/ml) σε πέντε υδάτινες περιοχές (Α,Β,C,D,Ε). Α Β C D Ε 8, 39,6 46,3 4,0 56,3 33, 40,8 4, 44, 54, 36,4 37,9 43,5 46,4 59,4

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA)

ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA) ΑΝΑΛΥΣΗ ΤΗΣ ΙΑΚΥΜΑΝΣΗΣ (ΑΝOVA). Εισαγωγή Η ανάλυση της διακύμανσης (ANalysis Of VAriance ANOVA) είναι μια στατιστική μεθόδος με την οποία η μεταβλητότητα που υπάρχει σ ένα σύνολο δεδομένων διασπάται στις

Διαβάστε περισσότερα

την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ

την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ Ανάλυση Διασποράς Ανάλυση Διασποράς (Analysis of Variance, ANOVA) είναι μέθοδος στατιστικού ελέγχου υποθέσεων που αναφέρονται σε περισσότερους από δύο πληθυσμούς. Στην προηγούμενη ενότητα αναφερθήκαμε

Διαβάστε περισσότερα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα Αρχείο δεδομένων school.sav Στον πίνακα Descriptives, μας δίνονται για την Επίδοση ως προς τις πέντε διαφορετικές μεθόδους διδασκαλίας, το

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Πολλαπλές Συγκρίσεις Μέσων Γενικά Η ANOVA αποκαλύπτει εάν υπάρχουν διαφορές μεταξύ των επεμβάσεων, αλλά ποιες ακριβώς είναι αυτές? Κατηγορίες συγκρίσεων A posteriori συγκρίσεις (αφού δούμε τα δεδομένα)

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό; Γραπτή Εξέταση Περιόδου Ιουνίου 008 στο Μάθημα Στατιστική /07/08. Η πιθανότητα να υπάρχει στο υπέδαφος μιας συγκεκριμένης περιοχής εκμεταλλεύσιμο κοίτασμα πετρελαίου είναι 50%. Μια εταιρεία, που πρόκειται

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Έλεγχος διακυμάνσεων Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Πειραματικό σχέδιο και ANOVA Η βασική διαφορά μεταξύ των πειραματικών σχεδίων είναι ο τρόπος με τον οποίο ταξινομούνται ή κατατάσσονται οι πειραματικές μονάδες (πειραματικά τεμάχια) Σε όλα τα σχέδια

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο ανεξάρτητων δειγμάτων, που διαχωρίζονται βάσει ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς

Διαβάστε περισσότερα

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα. Η Διωνυμική Κατανομή Η Διωνυμική κατανομή συνδέεται με ένα πολύ απλό πείραμα τύχης. Ίσως το απλούστερο! Πρόκειται για τη δοκιμή Bernoulli, ένα πείραμα τύχης με μόνο δύο, αμοιβαίως αποκλειόμενα, δυνατά

Διαβάστε περισσότερα

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Κλωνάρης Στάθης ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας Μέχρι τώρα ασχοληθήκαμε με τις τεχνικές εκτίμησης παραμέτρων για ένα πληθυσμό όπως: τον Μέσο µ και το ποσοστό p Θα συνεχίσουμε

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 5 Έστω για την σύγκριση δειγμάτων συλλέγουμε παρατηρήσεις Υ =,,, από

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α Δημήτρης Κουγιουμτζής e-mail: dkugiu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://users.auth.gr/~dkugiu/teach/civiltrasport/ide.html Στατιστική: Δειγματοληψία

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

και τυπική απόκλιση σ = 40mg ανά μπανάνα. α) Ποια είναι η πιθανότητα μια μπανάνα να περιέχει i)

και τυπική απόκλιση σ = 40mg ανά μπανάνα. α) Ποια είναι η πιθανότητα μια μπανάνα να περιέχει i) Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ Γραπτή Εξέταση Περιόδου Ιανουαρίου 8 στο Μάθημα Στατιστική 7..8. [] Ο ανθρώπινος οργανισμός χρειάζεται καθημερινά από έως 6 mg (mllgrams) καλίου. Η ποσότητα καλίου που περιέχεται στα τρόφιμα

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii Η Κανονική Κατανομή Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας

Διαβάστε περισσότερα

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Ενότητα 3 Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών Εκτός από τις μέσες τιμές, τυπικές αποκλίσεις κλπ, θέλουμε να βρούμε κατά πόσον αυτές οι παρατηρούμενες τάσεις εξαρτώνται από συγκεκριμένες συνθήκες ή προϋποθέσεις.

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ

Διαβάστε περισσότερα

Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις

Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις Διαστήματα Εμπιστοσύνης και Στατιστικοί Έλεγχοι Υποθέσεων Προβλήματα και Ασκήσεις Για κάθε πρόβλημα που ακολουθεί, εκτός των ερωτημάτων που διατυπώνονται, να γίνουν (με τη βοήθεια κάποιου στατιστικού πακέτου)

Διαβάστε περισσότερα

Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Προβλήματα και Ασκήσεις

Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Προβλήματα και Ασκήσεις Έλεγχος Χ -Προβλήματα και Ασκήσεις Έλεγχος Χ (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Προβλήματα και Ασκήσεις 1. Στη βιβλιογραφία αναφέρεται ότι τα ποσοστά των ομάδων αίματος Α, Β, ΑΒ και Ο σε

Διαβάστε περισσότερα

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός. ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ: ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ (Πάτρας) Διεύθυνση: Μεγάλου Αλεξάνδρου 1, 263 34 ΠΑΤΡΑ Τηλ.: 2610 369051, Φαξ: 2610 396184, email: mitro@teipat.gr Καθ η γη

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 3 ο ) 10/3/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 3 ο ) 10/3/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 3 ο ) 10/3/017 Στατιστικός έλεγχος υποθέσεων σε επίπεδο σημαντικότητας α για τη διακύμανση σ ενός κανονικού πληθυσμού με ένα τυχαίο δείγμα μεγέθους n Η 0 : σ = σ 0

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Copyright 2009 Cengage Learning 15.1 Ένα Κοινό Θέμα Τι πρέπει να γίνει; Τύπος Δεδομένων; Πλήθος Κατηγοριών; Στατιστική Μέθοδος; Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή

Διαβάστε περισσότερα

Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού

Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού ρ. Γεώργιος Μενεξές Τοµέας Φυτών Μεγάλης Καλλιέργειας και Οικολογίας Viola adorata Σκηνή Πρώτη Ερωτήσεις Σωστού-Λάθους (µέρος Ι). Ο µέσος όρος

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων α) Σημειοεκτιμητική β) Εκτιμήσεις Διαστήματος ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Παράδειγμα

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test 1 Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου One-Sample t-test 2 Μια σύντομη αναδρομή Στα τέλη του 19 ου αιώνα μια μεγάλη αλλαγή για την επιστήμη ζυμώνονταν στην ζυθοποιία Guinness. Ο William Gosset

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΕΠΙΔΡΑΣΕΩΣ ΜΕΘΟΔΩΝ ΕΡΓΑΣΙΑΣ ΣΤΗΝ ΠΑΡΑΓΩΓΙΚΟΤΗΤΑ ΕΛΛΗΝΙΚΗΣ ΒΙΟΤΕΧΝΙΑΣ ΠΑΡΑΓΩΓΗΣ ΠΑΙΔΙΚΩΝ ΕΝΔΥΜΑΤΩΝ

ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΕΠΙΔΡΑΣΕΩΣ ΜΕΘΟΔΩΝ ΕΡΓΑΣΙΑΣ ΣΤΗΝ ΠΑΡΑΓΩΓΙΚΟΤΗΤΑ ΕΛΛΗΝΙΚΗΣ ΒΙΟΤΕΧΝΙΑΣ ΠΑΡΑΓΩΓΗΣ ΠΑΙΔΙΚΩΝ ΕΝΔΥΜΑΤΩΝ ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΕΠΙΔΡΑΣΕΩΣ ΜΕΘΟΔΩΝ ΕΡΓΑΣΙΑΣ ΣΤΗΝ ΠΑΡΑΓΩΓΙΚΟΤΗΤΑ ΕΛΛΗΝΙΚΗΣ ΒΙΟΤΕΧΝΙΑΣ ΠΑΡΑΓΩΓΗΣ ΠΑΙΔΙΚΩΝ ΕΝΔΥΜΑΤΩΝ Του ΒΑΣΙΛΕΙΟΥ Κ. ΜΠΕΝΟΥ Ανωτάτη Βιομηχανική Σχολή Πειραιώς ΓΕΝΙΚΑ Πολλά πειράματα που λαμβάνουν

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ» ΚΑΛΥΒΑ ΠΑΝΑΓΙΩΤΑ ΛΑΖΑΡΟΥ ΜΑΡΙΕΛΕΝΑ

ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ» ΚΑΛΥΒΑ ΠΑΝΑΓΙΩΤΑ ΛΑΖΑΡΟΥ ΜΑΡΙΕΛΕΝΑ ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ» ΚΑΛΥΒΑ ΠΑΝΑΓΙΩΤΑ ΛΑΖΑΡΟΥ ΜΑΡΙΕΛΕΝΑ ΜΥΛΩΝΑ ΔΙΟΝΥΣΙΑ ΕΠΟΠΤΕΥΩΝ ΚΑΘΗΓΗΤΗΣ: ΔΡ. ΒΑΣΙΛΙΚΗ ΚΑΡΙΩΤΗ ΕΙΣΗΓΗΤΗΣ:

Διαβάστε περισσότερα

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική Ι. Ανάλυση Παλινδρόμησης Στατιστική Ι Ανάλυση Παλινδρόμησης Ανάλυση παλινδρόμησης Η πρόβλεψη πωλήσεων, εσόδων, κόστους, παραγωγής, κτλ. είναι η βάση του επιχειρηματικού σχεδιασμού. Η ανάλυση παλινδρόμησης και συσχέτισης είναι

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Στατιστική Ι Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Έλεγχοι Υποθέσεων. Χρήση της Στατιστικής. Η λογική του Ελέγχου Υπόθεσης Ο Έλεγχος Υπόθεσης 7-2

Έλεγχοι Υποθέσεων. Χρήση της Στατιστικής. Η λογική του Ελέγχου Υπόθεσης Ο Έλεγχος Υπόθεσης 7-2 Έλεγχοι Υποθέσεων 7-2 7 Έλεγχοι Υποθέσεων Χρήση της Στατιστικής Η λογική του Ελέγχου Υπόθεσης Ο Έλεγχος Υπόθεσης 7-3 7 Μαθησιακοί Στόχοι Όταν θα έχετε ολοκληρώσει την μελέτη του κεφαλαίου θα πρέπει να

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ . ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ (RANK REGRESSION).1 Μονότονη Παλινδρόμηση (Monotonic Regression) Από τη γραφική παράσταση των δεδομένων του προηγουμένου προβλήματος παρατηρούμε ότι τα ζευγάρια (Χ i, i )

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Οικονομετρία Ι Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα