Ενότητα 3: Έλεγχοι καλής προσαρµογής (Goodness of fit tests)

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Ενότητα 3: Έλεγχοι καλής προσαρµογής (Goodness of fit tests)"

Transcript

1 Ενότητα 3: Έλεγχοι καλής προσαρµογής (Goodess of ft tests) Ένα σηµαντικό πρόβληµα στην στατιστική είναι η εξεύρεση πληροφορίας σχετικά µε την µορφή της κατανοµής από την οποία προέρχεται ένα τυχαίο δείγµα. Είναι π.χ. γνωστό ότι οι περισσότεροι έλεγχοι γίνονται µε την προϋπόθεση ότι (υπό την Η ) το τυχαίο δείγµα προέρχεται από µια συγκεκριµένη κατανοµή. Μια τέτοια περίπτωση είναι τα t-tests που εξετάσαµε σε προηγούµενη ενότητα και τα οποία, ιδιαίτερα για µικρά δείγµατα, προϋποθέτουν ότι το δείγµα προέρχεται από κανονικό πληθυσµό (υπό την Η ). Εάν το τυχαίο δείγµα δεν προέρχεται από την κατανοµή κάτω από την οποία έχει κατασκευασθεί κάποιος έλεγχος τότε προφανώς το αντίστοιχο p-value που λαµβάνεται δεν είναι ακριβές (και εποµένως η πιθανότητα σφάλµατος τύπου Ι δεν είναι ακριβώς a). Συνεπώς είναι αρκετά χρήσιµη η δυνατότητα να ελέγχουµε αν κάποια δεδοµένα προέρχονται από µια συγκεκριµένη κατανοµή ή όχι. Έλεγχοι αυτής της µορφής καλούνται «έλεγχοι καλής προσαρµογής» των δεδοµένων σε µια συγκεκριµένη κατανοµή και έχουν προταθεί αρκετοί. Σε αυτήν την ενότητα αρχικά θα εξετάσουµε κάποιους «εµπειρικούς» ελέγχους οι οποίοι γίνονται µέσω κάποιων γραφηµάτων (P-P και Q-Q plots) ώστε να πάρουµε µια πρώτη εποπτική εικόνα για τα δεδοµένα (τα γραφήµατα αυτά δεν οδηγούν µε σχετική «ασφάλεια» σε κάποια απόφαση) ενώ στη συνέχεια θα περάσουµε στους πιο ση- µαντικούς ελέγχους καλής προσαρµογής: το χι-τετράγωνο τεστ καλής προσαρµογής και το Kolmogorv-Smrov τεστ. Τέλος, ένα ενδιαφέρον παρεµφερές πρόβληµα αφορά δύο δείγµατα και τον έλεγχο της υπόθεσης ότι τα δείγµατα αυτά προέρχονται από τον ίδιο πληθυσµό (δηλαδή από την ίδια κατανοµή). Για τον έλεγχο αυτό παρουσιάζονται εν συντοµία τρία απαραµετρικά τεστ, το Kolmogorov- Smrov για δυο δείγµατα, το το Wald-Wolfowtz τέστ των ροών και το Ma-Whtey U τέστ. 3.. P-P Plot και Q-Q Plot Τα P-P Plot και Q-Q plot (probablty-probablty plot και Quatle-Quatle plot) είναι δύο γραφήµατα τα οποία µας βοηθούν να ελέγξουµε αν κάποια δεδοµένα προέρχονται από κάποια συγκεκριµένη κατανοµή (π.χ. κανονική). Τα γραφήµατα αυτά βασίζονται στην ακόλουθη παρατήρηση: Αν Χ,Χ,,Χ είναι ένα τυχαίο δείγµα (ανεξ. τ.µ.) από µια (συνεχή) κατανοµή µε σ.κ. F τότε οι νέες τ.µ. Υ = F(X ), Υ = F(X ),, Υ = F(X ) είναι και αυτές ανεξάρτητες και ακολουθούν την οµοιόµορφη U(,) κατανοµή διότι P(F(X) x) = P(X F - (x)) = F(F - (x)) = x, x [,]. Είναι εύκολο να αποδειχθεί ότι αν Υ,Υ,,Υ ~ U(,) τότε κάθε µια από τις διατεταγµένες τ.µ. Υ (),Υ (),,Υ () ακολουθεί την κατανοµή βήτα και συγκεκριµένα Υ () ~ Beta(, +) µε Ε(Y () ) = /(+). Εποµένως, για µεγάλο θα ισχύει προσεγγιστικά ότι, για =,,,, Y( ) = F ) ή ισοδύναµα X ( ) F ( ) (διότι και V(Y () ) ) + + Με άλλα λόγια, αν Χ ~ F περιµένουµε ότι τα σηµεία του επιπέδου ή ισοδύναµα τα σηµεία του επιπέδου ( F ), + ), =,,,, F ( + )), =,,, θα βρίσκονται «κοντά» στην διαγώνιο (x = y) που περνά από την αρχή των αξόνων. Το P-P plot ακριβώς είναι το γράφηµα των πρώτων σηµείων (µαζί µε τη διαγώνιο) ενώ το Q-Q Plot είναι το γράφηµα των δεύτερων σηµείων (µαζί µε τη διαγώνιο). Και στα δύο γραφήµατα, αν τα σηµεία βρίσκονται «κοντά» στη διαγώνιο (και «τυχαία» γύρω από αυτήν) τότε µπορεί να θεωρηθεί ότι τα Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 5

2 δεδοµένα προέρχονται από την F. Ενδέχεται να µην είναι γνωστές όλες οι παράµετροι της κατανο- µής F (π.χ. µπορεί να είναι κανονική µε άγνωστο µ, σ ). Σε αυτή την περίπτωση οι άγνωστοι παράµετροι εκτιµώνται από τα δεδοµένα. Όπως υπονοήθηκε και στην εισαγωγή της ενότητας αυτής, ο έλεγχος µέσω των παραπάνω γραφηµάτων δεν µπορεί να είναι αξιόπιστος διότι δεν βασίζεται σε κάποιο στατιστικό κριτήριο που µας οδηγεί σε σωστή απόφαση π.χ. στο a % των περιπτώσεων. Συνήθως γίνεται για να πάρουµε µια πρώτη εποπτική εικόνα και για να δούµε αν υπάρχουν κάποιες έκτροπες, σε σχέση µε τις ανα- µενόµενες υπό την F, παρατηρήσεις. Είναι προφανές ότι, εκτός της κανονικής, µπορούµε γραφικά να ελέγξουµε την καλή προσαρµογή των δεδοµένων και σε άλλες κατανοµές (αλλάζουµε την Test dstrbuto). Εφαρµογή. Να ελεγχθεί γραφικά (µέσω P-P plot ή Q-Q plot) αν οι παρατηρήσεις του δείκτη χοληστερίνης (µεταβλητή chol εφαρµογής Ενότητας ) προέρχονται από την κανονική κατανοµή. Ανοίγουµε την ανάλυση Graphs/P-P και επιλέγοντας την µεταβλητή chol (6 παρατηρήσεις) λαµβάνουµε το γράφηµα στα δεξιά (ως proporto estmato formula επιλέγουµε την Va der Waerde s (=r/(+)) η οποία συµφωνεί µε την προηγηθείσα ανάλυση θεωρώντας ότι θα πρέπει r F ( r) ) + (κάποιοι άλλοι ερευνητές παραθέτοντας κάποια δικαιολόγηση έχουν προτείνει την r 3/ 8 r / απεικόνιση των σηµείων ( F ( r ) ), + / 4) (Blom s) ή των ( F ( r) ), ) (Rakt) κ.ο.κ.). Για µέτρια ή µεγάλα δείγµατα δεν υπάρχει ουσιαστική διαφορά οποιαδήποτε proporto estmato formula και αν επιλέξουµε., Normal P-P Plot of CHOL,75 Expected Cum Prob,5,5,,,5,5,75, Observed Cum Prob Φαίνεται ότι τα 6 σηµεία του επιπέδου δεν «απέχουν» πολύ από την διαγώνιο, ούτε φαίνονται κάποιες «έκτροπες» παρατηρήσεις. Εποµένως, τουλάχιστον γραφικά, δεν φαίνεται να υπάρχει επαρκής λόγος ώστε να µην θεωρήσουµε τα δεδοµένα ως κανονικά (για να είµαστε πιο ακριβείς θα πρέπει να προχωρήσουµε και σε έλεγχο µε δεδοµένο ε.σ. a, π.χ. χ ή K-S που θα εξετάσουµε παρακάτω). Αξίζει να παρατηρήσουµε ότι αν υπήρχαν κάποιες έκτροπες παρατηρήσεις (παρατηρήσεις αρκετά «αποµακρυσµένες» από την διαγώνιο) τότε θα έπρεπε αυτές να επανεξεταστούν λεπτοµερέστερα ώστε να βεβαιωθούµε ότι δεν ισχύουν κάποιες ειδικές συνθήκες για αυτές ή ότι δεν έχουν περαστεί λάθος στο SPSS. Το Q-Q plot λαµβάνεται µε παρόµοιο τρόπο: Ανοίγουµε την ανάλυση Graphs/Q-Q και επιλέγοντας την µεταβλητή chol λαµβάνουµε το γράφηµα στα δεξιά: Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 6

3 4 Normal Q-Q Plot of CHOL 3 Expected Normal Value 3 4 Observed Value To εµπειρικό αυτό τεστ είναι ισοδύναµο µε το προηγούµενο και εποµένως δεν περιµένουµε να δού- µε κάτι διαφορετικό. Και εδώ φαίνεται ότι τα 6 σηµεία του επιπέδου δεν «απέχουν» πολύ από την διαγώνιο και εποµένως δεν υπάρχει επαρκής λόγος ώστε απορρίψουµε ότι τα δεδοµένα είναι κανονικά. 3.. Ο έλεγχος χ (χι-τετράγωνο) καλής προσαρµογής Επιθυµούµε και πάλι να ελέγξουµε αν κάποιες παρατηρήσεις ενός τ.δ. Χ, Χ,, Χ προέρχονται από µια συγκεκριµένη κατανοµή µε σ.κ. F. O Pearso, ήδη από τις αρχές του προηγούµενου αιώνα (9), πρότεινε για το σκοπό αυτό τη χρήση µιας στατιστικής συνάρτησης η οποία, υπό την Η : X ~ F, ακολουθεί (προσεγγιστικά) κατανοµή χ (µε κάποιους β.ε.) ενώ όταν δεν ισχύει η Η λαµβάνει «µεγάλες» τιµές. Πριν δούµε ποια είναι η µορφή αυτής της στατιστικής συνάρτησης στο συγκεκριµένο πρόβληµα, αξίζει να θυµηθούµε ένα σηµαντικό θεωρητικό αποτέλεσµα το οποίο αφορά την πολυωνυµική κατανοµή και αποτελεί την βάση του χ ελέγχου καλής προσαρµογής. Ε- πίσης αποτελεί την βάση και για άλλους ελέγχους που θα εξετάσουµε σε επόµενες ενότητες (π.χ. χ έλεγχοι για πίνακες συνάφειας). Πρόταση. Αν το τυχαίο διάνυσµα N = (N,N,...,N k ) ακολουθεί πολυωνυµική κατανοµή µε k παραµέτρους και p,p,...,p k (µε = p = ) τότε η στατιστική συνάρτηση k ( N p ) T =, p ακολουθεί ασυµπτωτικά ( ) κατανοµή χ (χι-τετράγωνο µε k βαθµούς ελευθερίας). k Έστω τώρα Χ,Χ,,Χ ένα τυχαίο δείγµα και έστω ότι επιθυµούµε να ελέγξουµε την Η : X ~ F. Προκειµένου να χρησιµοποιήσουµε το αποτέλεσµα της παραπάνω πρότασης εργαζόµαστε ως εξής: διαµερίζουµε το πεδίο τιµών των Χ (υπό την Η ) σε k σύνολα Α, Α,, Α k (συνήθως έτσι ώστε στο κάθε σύνολο να αναµένονται τουλάχιστον 5 παρατηρήσεις). Στη συνέχεια θεωρούµε τις τ.µ. N = πλήθος των Χ,Χ,,Χ που ανήκουν στο σύνολο Α, =,,,. Είναι προφανές ότι όταν ισχύει η υπόθεση Η : X ~ F τότε το τυχαίο διάνυσµα (Ν,Ν,,Ν k ) ακολουθεί πολυωνυµική κατανοµή µε παραµέτρους και p,p,...,p k όπου p = P A / H : X ~ F ), =,,...,. Εποµένως, υπό την Η, η στατιστική συνάρτηση Η πολυωνυµική κατανοµή είναι η από κοινού κατανοµή του πλήθους των επιτυχιών ου -είδους, ου -είδους,...,k-είδους σε µία ακολουθία ανεξάρτητων και ισόνοµων δοκιµών µε k δυνατά είδη επιτυχιών (πιθ. επιτ. -είδους = p ) Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 7

4 T (X) = k ( N p ) p ακολουθεί προσεγγιστικά κατανοµή χ µε k β.ε. ενώ υπό την Η : X ~ G F θα λαµβάνει «µεγάλες» τιµές. Το τελευταίο συµβαίνει διότι, το p είναι το αναµενόµενο πλήθος παρατηρήσεων στο Α υπό την Η (Ε(Ν ) = p = P(Χ A / H )) και εποµένως όταν δεν ισχύει η Η κάθε Ν (παρατηρούµενη συχνότητα) θα διαφέρει αρκετά από το p (αναµενόµενη συχνότητα υπό την H ). Άρα, µε βάση την παραπάνω στατιστική συνάρτηση µπορούµε να κατασκευάσουµε έναν έλεγχο για την υπόθεση Η : X ~ F. Συγκεκριµένα θα απορρίπτουµε την Η (σε ε.σ. a περίπου) ό- ταν, µε βάση τις παρατηρήσεις x, x,, x, T ( x ) > c = χ ( ) : άνω a-σηµείο της k a χ k µε αντίστοιχο (προσεγγιστικό) p-value p value = P( T ) > T ( x)) = F ( T ( x)). χ Παρατήρηση. (έλεγχος χ όταν υπάρχουν άγνωστες παράµετροι). Παραπάνω προφανώς θεωρήσαµε ότι τα p είναι γνωστά (καθορίζονται πλήρως από την κατανοµή F ). Υπάρχουν όµως περιπτώσεις όπου τα p δεν είναι απολύτως γνωστά, αλλά εξαρτώνται από κάποιες άγνωστες παραµέτρους, δηλαδή p = p (θ) µε θ = (θ,θ,...,θ r ) άγνωστο. Η περίπτωση αυτή εµφανίζεται π.χ. κατά τον έλεγχο καλής προσαρµογής δεδοµένων σε µία γνωστή κατανοµή (π.χ. κανονική) µε άγνωστες όµως παραµέτρους (π.χ. µ, σ, δηλ. p = p (µ,σ)) ή π.χ. κατά τον έλεγχο ανεξαρτησίας σε πίνακες συνάφειας (χρησιµοποιώντας το χι-τετράγωνο τεστ). Στην περίπτωση αυτή χρησιµοποιούµε την τροποποιηµένη στατιστική συνάρτηση k ( N p ( θ)) T ) =, p ( θ) όπου θ είναι η εκτίµηση του θ από τα δεδοµένα. Τώρα, υπό την Η, αποδεικνύεται ότι η T ακολουθεί ασυµπτωτικά χι-τετράγωνο κατανοµή µε k r βαθµούς ελευθερίας, όπου r είναι το πλήθος των παραµέτρων που χρειάστηκε να εκτιµηθούν από τα δεδοµένα (αρκεί να χρησιµοποιηθούν οι εκτιµήτριες µέγιστης πιθανοφάνειας των παραµέτρων από τα οµαδοποιηµένα στις k κλάσεις δεδοµένα). Εποµένως τώρα, απορρίπτουµε την H σε ε.σ. a (περίπου) όταν T ( x ) > χk r ( a) µε αντί- στοιχο (προσεγγιστικό) p-value p value P T ( X) T ( x) H ) = F ( T ( )) ( k r k x. χ Παρατήρηση. Ο έλεγχος χ τις περισσότερες φορές δεν είναι ο καλύτερος έλεγχος καλής προσαρµογής για συνεχή δεδοµένα διότι προϋποθέτει οµαδοποίηση των δεδοµένων (διαµερίζουµε το πεδίο τιµών των παρατηρήσεων σε k σύνολα Α,Α,,Α k ) µε συνέπεια την απώλεια πληροφορίας (επίσης η διαµέριση είναι τις περισσότερες φορές αυθαίρετη). Σε αυτήν την περίπτωση (δεδοµένα από συνεχή κατανοµή) συνήθως προτιµάται ο έλεγχος Kolmogorov-Smrov (K-S) ο οποίος βασίζεται στην εµπειρική συνάρτηση κατανοµής του δείγµατος και δεν προϋποθέτει κάποια οµαδοποίηση των δεδοµένων. Ο έλεγχος χ προτιµάται όταν έχουµε κατηγορικά δεδοµένα που παίρνουν τι- µές σε ένα πεπερασµένο σύνολο (βλ. εφαρµογή παρακάτω). Για τους παραπάνω λόγους το SPSS δεν δίνει µεγάλο βάρος στους ελέγχους καλής προσαρ- µογής µέσω του χ τεστ. Συγκεκριµένα, µε το SPSS είναι δυνατός µόνο ο έλεγχος προσαρµογής κάποιων παρατηρήσεων σε µια διακριτή κατανοµή η οποία λαµβάνει k τιµές, ενώ οι πιθανότητες p, =,,, k θα πρέπει να δοθούν από τον χρήστη του προγράµµατος. Παρόλα αυτά µπορούµε µε έµµεσο τρόπο να πραγµατοποιήσουµε χ έλεγχο καλής προσαρµογής για οποιαδήποτε διακριτή (βλ. Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 8

5 εφαρµ. 4) ή συνεχή κατανοµή (βλ. εφαρµογές 3, 5) αφού κάνουµε µόνοι µας οµαδοποίηση και υπολογισµό των p (π.χ. χρησιµοποιώντας τις εντολές compute ή recode του SPSS). Εφαρµογή. Ρίχνοντας ένα ζάρι φορές καταγράφουµε τα εξής αποτελέσµατα: τo εµφανίστηκε 8 φορές, το εµφανίστηκε φορές, το 3 εµφανίστηκε 3 φορές το 4 εµφανίστηκε φορές, το 5 εµφανίστηκε 7 φορές, το 6 εµφανίστηκε φορές Να ελέγξετε (ε.σ. 5%) αν το ζάρι αυτό είναι αµερόληπτο. Αρχικά εισάγουµε τα δεδοµένα στο SPSS. Κανονικά θα πρέπει να εισάγουµε αποτελέσµατα, τα 8 από τα οποία θα είναι, τα επόµενα να είναι κ.ο.κ. (δηλ cases γραµµές µε µία µεταβλητή στήλη). Έχουµε δει όµως ότι σε τέτοιες περιπτώσεις (όπου έχουµε επαναλήψεις γραµµών) είναι ισοδύναµο αλλά αρκετά βολικότερο να χρησιµοποιούµε βάρη. Εισάγουµε εποµένως µία µεταβλητή apot µε τα αποτελέσµατα,, 3, 4, 5, 6 και µία άλλη µεταβλητή w (βάρη) τις αντίστοιχες εµφανίσεις 8,, 3,, 7, και επιλέγουµε ata/weght cases/weght cases by w. Για το χ τεστ θα χρησιµοποιήσουµε 6 κλάσεις, τις προφανείς: A = {}, A = {},,A 6 = {6}. Στη συνέχεια επιλέγουµε Aalyze/No parametrc tests/ch-square/test varable lst: apot. Επίσης θα πρέπει να εισάγουµε τις αναµενόµενες πιθανότητες p, p,,p k (εδώ k=6) υπό την H στο πεδίο expected values. Επειδή όπως εδώ p = p = = p 6 = /6 (Η : αµερόληπτο ζάρι) µπορούµε πολύ απλά να επιλέξουµε να είναι all categores equal (είναι η default επιλογή). Από την α- νάλυση αυτή λαµβάνουµε τους πίνακες APOT Observed N Expected N Resdual 8, -,,, 3 3,, 4,, 5 7, -3, 6, -8, Total Test Statstcs RESULTS Ch-Square 9, df 5 Asymp. Sg.,5 cells (,%) have expected frequeces less tha 5. The mmum expected cell frequecy s,. Ο πρώτος πίνακας απεικονίζει τις παρατηρούµενες και τις αναµενόµενες συχνότητες σε κάθε ένα από τα 6 σύνολα Α ={},,Α 6 ={6} (κατηγορίες ή κελιά) ενώ ο δεύτερος πίνακας δίνει την τιµή της στατιστικής συνάρτησης δείγµα, T ( x) = 9. (β.ε. = k =5) και το αντίστοιχο p-value =.5. Το p-value δεν είναι µικρότερο του a = 5% οπότε, µε βάση τις αυτές παρατηρήσεις, δεν µπορούµε να απορρίψουµε ότι το ζάρι είναι αµερόληπτο. Εφαρµογή 3. Να ελέγξετε (ε.σ. 5%) αν οι παρακάτω 45 παρατηρήσεις προέρχονται από την ο- µοιόµορφη κατανοµή στο (,) Εισάγουµε τα δεδοµένα στο SPSS: 45 cases (γραµµές) µε µία µεταβλητή (στήλη) µε όνοµα data (στο SPSS µερικές φορές, π.χ. σε ελληνικά wdows, ως υποδιαστολή θεωρείται το «,» αντί του «.»). Τώρα τα δεδοµένα δεν µπορούν να θεωρηθούν κατηγορικά (όπως στην προηγ. εφαρµογή) ώστε να εφαρµόσουµε απευθείας το χ τεστ, αλλά θα πρέπει να τα «οµαδοποιήσουµε». Για να έ- χουµε τουλάχιστον 5 αναµενόµενες παρατηρήσεις σε κάθε κελί θα χρησιµοποιήσουµε 8 κλάσεις, τις Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 9

6 A = [,/8), A = [/8,/8),, A 8 = [7/8,). Κατασκευάζουµε µία νέα µεταβλητή η οποία δείχνει τις κλάσεις µε Trasform/compute: categ = Truc(data*8) και εφαρµόζουµε το χ τεστ σε αυτή την µεταβλητή: επιλέγουµε Aalyze/No parametrc tests/ch-square/test varable lst: categ. Όπως και στην προηγούµενη εφαρµογή, οι αναµενόµενες πιθανότητες p, p,,p k (εδώ k = 8) υπό την H : Χ ~ οµοιόµορφη κατανοµή (,) είναι ό- λες ίσες (µε /8 διότι και τα A έχουν πλάτος /8). Και έτσι µπορούµε πολύ απλά να επιλέξουµε all categores equal. Λαµβάνουµε τους πίνακες CATEG Observed N Expected N Resdual 4 5,65 -,65 6 5,65, ,65 -,65 3 5,65 6, ,65, ,65 -, ,65, ,65-4,65 Total 45 Test Statstcs CAT Ch-Square 3,844 df 7 Asymp. Sg.,54 cells (,%) have expected frequeces less tha 5. The mmum expected cell frequecy s 5,6. Η τιµή της στατιστικής συνάρτησης δείγµα είναι µε αντίστοιχο p-value =.54. Το p- value δεν είναι µικρότερο του a = 5% οπότε δεν µπορούµε να απορρίψουµε ότι τα δεδοµένα προέρχονται από την οµοιόµορφη. Όπως έχει αναφερθεί και παραπάνω, σε αυτή την περίπτωση (συνεχής κατανοµή) είναι ίσως προτιµότερο να κάνουµε τεστ καλής προσαρµογής χρησιµοποιώντας το Kolmogorov Smrov τεστ που θα εξετάσουµε σε επόµενη παράγραφο. Εφαρµογή 4. Να ελέγξετε αν τα παρακάτω 3 δεδοµένα προέρχονται από την κατανοµή Posso µε λ = 3 (ε.σ. 5%) Πως θα ελέγχαµε αν τα δεδοµένα προέρχονται από την Posso (µε άγνωστο λ); Εισάγουµε τα δεδοµένα στο SPSS: 3 cases (γραµµές) µε µία µεταβλητή (στήλη) µε όνοµα data. Σε αυτή την περίπτωση τα δεδοµένα µπορούν µεν να θεωρηθούν κατηγορικά αλλά το πλήθος των κατηγοριών δεν είναι πεπερασµένο (µια τ.µ. που ακολουθεί την Posso µπορεί να πάρει τιµές στο {,,, }). Για το λόγο αυτό θα πρέπει να «ενώσουµε» κάποια δυνατά αποτελέσµατα σε κλάσεις (έτσι ώστε και οι αναµενόµενες συχνότητες σε αυτές τις κλάσεις να είναι τουλάχιστον 5). Παρατηρούµε ότι αν X ~ Posso(λ = 3) θα είναι x λ λ P( X = x) = e, x =,,, x! και εποµένως, x P(X x) P(X = x) P(X = x) Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 3

7 Ο παραπάνω πίνακας µπορεί πολύ εύκολα να κατασκευασθεί χρησιµοποιώντας το SPSS. Αρχικά φτιάχνουµε µόνοι µας την µεταβλητή x (µε τιµές,,,3,4,5,6). Στη συνέχεια κατασκευάζουµε την αθροιστική συνάρτηση κατανοµής P(X x) της Posso(λ=3) µέσω της Trasform/compute: cdfp = CF.POISSON(x,3). Η επόµενη στήλη µπορεί τώρα να ληφθεί από την cdfp µέσω της εντολής Trasform/create tme seres εισάγοντας στο πεδίο ew varable την cdfp µε Fucto:dfferece (order ). Η διαδικασία αυτή κατασκευάζει µια νέα µεταβλητή, την cdf_ η οποία απαρτίζεται από τις διαφορες των διαδοχικών τιµών της cdfp δηλ. τις P(X = x). Τέλος, η στήλη µε τις τιµές P(X = x) µπορεί να ληφθεί από την Trasform/compute, π.χ. expval = 3*cdf_. Από τον παραπάνω πίνακα παρατηρούµε ότι µπορούµε να χρησιµοποιήσουµε τα σύνολα (κλάσεις ή κατηγορίες) Α ={,}, Α ={}, Α 3 ={3}, Α 4 ={4}, A 5 ={5,6, } (για να έχουµε αναµενό- µενες συχνότητες σε όλες τις κλάσεις τουλάχιστον 5) µε αντίστοιχες αναµενόµενες πιθανότητες p : p = P(X ).99, p = P(X = ).4, p 3 = P(X = 3).4, p 4 = P(X = 4).68, p 5 = P(X 5).853 =.847 Στη συνέχεια θα πρέπει να κατασκευάζουµε µία νέα µεταβλητή categ η οποία δείχνει τις παραπάνω κλάσεις (µπορεί να γίνει µε τον γνωστό τρόπο χρησιµοποιώντας Trasform/recode) και εφαρµόζουµε το χ τεστ σε αυτή την µεταβλητή. Επιλέγουµε Aalyze/No parametrc tests/ch-square/test varable lst: categ. Σε αυτή όµως την περίπτωση δεν επιλέγουµε all categores equal αλλά περνάµε τις παραπάνω αναµενόµενες πιθανότητες.99,.4,.4,.68,.85 (τις εισάγουµε µε add µε αυτή την σειρά). Λαµβάνουµε τους πίνακες CATEG Observed N Expected N Resdual 8 6,, 8 6,7, ,7, , -, 5 3 5,5 -,5 Total 3 Test Statstcs CATEG Ch-Square,33 df 4 Asymp. Sg.,675 cells (,%) have expected frequeces less tha 5. The mmum expected cell frequecy s 5,. Η τιµή της στατιστικής συνάρτησης στο δείγµα είναι.33 (4 β.ε.) µε αντίστοιχο p-value =.675. Άρα δεν µπορούµε να απορρίψουµε ότι τα δεδοµένα προέρχονται από την Posso (λ = 3). Τέλος, εάν έπρεπε να ελέγξουµε αν τα δεδοµένα προέρχονται από κάποια Posso (δηλ, Posso µε άγνωστο λ) τότε σύµφωνα µε την Παρατήρηση της Παραγράφου 3. θα έπρεπε να κάνουµε όλα τα παραπάνω αυτή τη φορά χρησιµοποιώντας την εκτίµηση του λ από το δείγµα και όχι το λ = 3. Σε αυτή την περίπτωση χάνουµε έναν β.ε. (διότι κάναµε εκτίµηση µιας παραµέτρου) και θα πρέπει να βρούµε µόνοι µας το p-value (το SPSS θα µας δώσει την τιµή της στατιστικής συνάρτησης ch-square αλλά το p-value που θα λάβουµε θα αντιστοιχεί σε 4 β.ε. και εποµένως θα είναι µεγαλύτερο του p-value που αντιστοιχεί σε 3 β.ε.). Το p-value µπορεί να υπολογιστεί π.χ. από το compute : pvalue = CF.CHISQ(ch-square,3). Εφαρµογή 5. Να ελέγξετε αν οι παρακάτω παρατηρήσεις προέρχονται από την κανονική κατανοµή µε µέση τιµή και διασπορά 65 (ε.σ. 5%) Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 3

8 Όπως και στην εφαρµογή 3, θα ήταν ίσως προτιµότερο να κάνουµε το τεστ καλής προσαρ- µογής χρησιµοποιώντας το Kolmogorov Smrov τεστ που θα εξετάσουµε σε επόµενη παράγραφο. Είναι ενδιαφέρον όµως να δούµε πως µπορούµε να χρησιµοποιήσουµε το χ τεστ για έλεγχο καλής προσαρµογής. Προφανώς θα πρέπει και πάλι να οµαδοποιήσουµε τα δεδοµένα για να χρησι- µοποιήσουµε το χ τεστ. Η οµαδοποίηση θα πρέπει να γίνει έτσι ώστε σε κάθε κλάση η αναµενόµενη συχνότητα να είναι 5. Μπορούµε να ορίσουµε µόνοι µας τις κλάσεις, να δηµιουργήσουµε µια νέα µεταβλητή που να δείχνει τις κλάσεις και στην συνέχεια να υπολογίσουµε τις αναµενόµενες πιθανότητες p και να τις εισάγουµε στην ανάλυση του SPSS (όπως στην Εφαρµογή 4). Για να γλιτώσουµε όµως τον υπολογισµό των p (κάτι όχι τόσο εύκολο) µπορούµε να κάνουµε κάτι απλούστερο. Αντί να ελέγξουµε αν οι παραπάνω παρατηρήσεις X,X,,X προέρχονται από την N(,65), µπορούµε ισοδύναµα να ελέγξουµε αν οι µετασχηµατισµένες παρατηρήσεις Y = F(X ), Y = F(X ), Y = F(X ) προέρχονται από την οµοιόµορφη στο (,), όπου F είναι η σ.κ. της N(,65) (στην παρ. 3.. είδαµε ότι αν X ~ F:συνεχής τότε η τ.µ. Y = F(X) ~ Οµοιόµορφη στο (,)). Τις νέες παρατηρήσεις Y, Y,, Y µπορούµε να τις κατασκευάσουµε χρησιµοποιώντας την εντολή Trasform / compute Υ = CF.NORMAL(X,,SQRT(65)). Ο έλεγχος αν οι τ.µ. Y, Y,, Y προέρχονται από την οµοιόµορφη στο (,) γίνεται όµοια µε την Εφαρµογή 3. Αν π.χ. χρησι- µοποιήσουµε 8 κλάσεις βρίσκουµε p-value =.89 και εποµένως δεν απορρίπτουµε ότι τα δεδοµένα προέρχονται από την Ν(,65) Το κριτήριο Kolmogorov-Smrov (K-S) για ένα δείγµα Το κριτήριο K-S χρησιµοποιείται και αυτό για το έλεγχο καλής προσαρµογής ενός τυχαίου δείγµατος σε µία δεδοµένη συνεχή κατανοµή (Η : X ~ F ). Το κριτήριο K-S βασίζεται στην διαφορά της εµπειρικής συνάρτηση κατανοµής (που προέρχεται από το δείγµα) και της αναµενόµενης F (υπό την Η ). Πιο συγκεκριµένα, αν Χ,Χ,...,Χ είναι ένα τ.δ., η εµπειρική συνάρτηση κατανοµής (ΕΣΚ) του δείγµατος αυτού είναι #{ X x} F ( x) = I( X x) =, (όπου Ι(X x) = ή ανάλογα µε το αν X x ή όχι) η οποία ως γνωστό αποτελεί εκτίµηση της συνάρτησης κατανοµής των X διότι (από το νόµο των µεγάλων αριθµών, θέτοντας Y = Ι(X x)) F ( x) = I( X x) = Y E( Y ) = P( Y = ) + P( Y = ) = P( Y = ) = P( X x) = Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 3 F( x) για κάθε x. Εποµένως, υπό την Η, η ΕΣΚ θα πρέπει να είναι «κοντά» στην F. Αντίθετα, αν δεν ισχύει η Η αναµένουµε σηµαντική απόκλιση της ΕΣΚ από την F. Για να κατασκευάσουµε έναν έλεγχο µε βάση αυτόν τον συλλογισµό, θα πρέπει να ορίσουµε µία «απόσταση» µεταξύ των δύο κατανοµών (της ΕΣΚ και της F ) και να απορρίπτουµε την Η όταν αυτή η απόσταση γίνεται «µεγάλη». Σχετικά έχουµε τον επόµενο ορισµό. Ορισµός. Αν F, G είναι δύο συναρτήσεις κατανοµής στον R, τότε η ποσότητα d K ( F, G) = sup{ F( x) G( x) } x R καλείται απόσταση Kolmogorov µεταξύ της F και της G. Σύµφωνα µε τα παραπάνω, θα απορρίπτουµε την Η : X ~ F όταν η στατιστική συνάρτηση = d K ( F, F ) = sup{ F ( x) F ( x) }, x R λαµβάνει «ασυνήθιστα» µεγάλες τιµές, δηλαδή όταν > c. Το κριτήριο αυτό είναι γνωστό ως κριτήριο Kolmogorov Smrov (και η στατιστική συνάρτηση καλείται ελεγχοσυνάρτηση Kolmogorov Smrov). Προκειµένου να χρησιµοποιήσουµε το συγκεκριµένο κριτήριο θα πρέπει

9 να προσδιορίσουµε την κατανοµή της τ.µ. κάτω από την Η έτσι ώστε να υπολογίσουµε το c (για δεδοµένο επίπεδο σηµαντικότητας a) και το p-value ενός δείγµατος. Σε αυτό το σηµείο ίσως κάποιος αναλογιστεί ότι το κριτήριο αυτό έχει ένα σοβαρό µειονέκτηµα: η κατανοµή της θα πρέπει να εξαρτάται από την F (την κατανοµή από την οποία προέρχεται το δείγµα, υπό την H ) και εποµένως θα πρέπει να βρούµε την κατανοµή της για κάθε διαφορετική κατανοµή F. Ευτυχώς, αντίθετα µε αυτό που θα περίµενε κανείς, αποδεικνύεται ότι η κατανοµή της στατιστικής συνάρτησης δεν εξαρτάται από την F! Το γεγονός αυτό µας δίνει την δυνατότητα να χρησιµοποιήσουµε το κριτήριο αυτό οποιαδήποτε και αν είναι η κατανοµή από την οποία προέρχεται το δείγµα (υπό την Η ). Τέτοιοι έλεγχοι καλούνται απαραµετρικοί έλεγχοι (η κατανοµή της στατιστικής συνάρτησης που χρησιµοποιούµε και εποµένως η κρίσιµη περιοχή και το p-value δεν εξαρτώνται από την κατανοµή του δείγµατος υπό την H ). Το χ τεστ, το Kolmogorov Smrov τεστ καθώς και τα τεστ που θα εξετάσουµε στη συνέχεια στην ενότητα αυτή είναι απαρα- µετρικά. Πριν προχωρήσουµε, έχει ενδιαφέρον να δούµε γιατί η κατανοµή του δεν εξαρτάται από την F. Ξεκινάµε αναζητώντας µία απλούστερη έκφραση της τ.µ. ώστε να υπολογίζεται εύκολα από το τ.δ. Χ, Χ,..., Χ αλλά και να φαίνεται αµεσότερα η εξάρτησή της από τα Χ. Έστω Χ (), Χ (),...,Χ () οι διατεταγµένες τιµές των Χ, Χ,...,Χ (Χ () < Χ () <... < Χ () ). Παρατηρούµε ότι η εµπειρική συνάρτηση κατανοµής γράφεται ως εξής:, x < X () /, X () x < X () F ( x) = /, X () x < X (3) M /, X ( ) x δηλαδή είναι σταθερή στα διαστήµατα [X (-), X () ) ενώ παρουσιάζει άλµατα ύψους / στα σηµεία Χ (),...,Χ (). Εφόσον τώρα η F είναι αύξουσα συνάρτηση, η µέγιστη τιµή της F (x) F (x) θα λαµβάνεται πάνω σε κάποιο από τα σηµεία Χ (),..., Χ (). ηλαδή, + = sup { F ( x) F ( x)} = max { F ) F )} = max { F )}. x R,,...,,,..., Αυτό µπορεί να φανεί και από το παρακάτω σχήµα ( = 7): F F / X () X () X (3 )... Όµοια, το supremum της F (x) F (x) θα είναι = sup { F ( x) F ( x)} = max { F ) F )} = max { F ) } x R,,...,,,...,. Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 33

10 (όπου F(x ) = lm t x F(t)) και τελικά, { + } = sup{ F ( x) F ( x) } = max, = max F ( ) ), F ), =,,...,. x R Παρατηρούµε τώρα ότι οι τ.µ. U = F (X ),,,, είναι ανεξάρτητες και ακολουθούν την ο- µοιόµορφη στο (,) κατανοµή (βλ. και παρ. 3.) και εποµένως οι τ.µ. U () = F (X () ) µπορεί να θεωρηθεί ότι αποτελούν ένα διατεταγµένο δείγµα από την οµοιόµορφη στο (,) κατανοµή. Συνεπώς, οποιαδήποτε και αν είναι η F, η έχει ίδια κατανοµή (υπό την Η ) µε την τ.µ. max U ( ), U, =,,...,, όπου U,U,,U είναι ανεξάρτητες τ.µ. από την U(,) η οποία προφανώς δεν εξαρτάται από την F. Εποµένως, θα απορρίπτουµε την Η όταν > c (a), = όπου (a) είναι το άνω a-σηµείο της κατανοµής της τ.µ. (το οποίο δεν εξαρτάται από την F ). Η ακριβής κατανοµή της τ.µ. είναι δύσκολο να υπολογιστεί και για αυτό έχουν κατασκευαστεί πίνακες µε τα άνω a-σηµεία της. Αποδεικνύεται όµως ότι η κατανοµή της τ.µ. Ζ = (καλείται και Kolmogorov-Smrov Z) έχει ασυµπτωτικά (υπό την Η και για συνεχή σ.κ. F ) τη συνάρτηση κατανοµής, z P ( Z z) = P( z) ( ) e για κάθε z, και εποµένως το p-value ενός δείγµατος που έδωσε = d θα είναι (ασυµπτωτικά) p value = P( > d / H ) = P( < d) Παρατήρηση. Παραπάνω εξετάσαµε τον έλεγχο της υπόθεσης Η : X ~ F όπου η F ήταν πλήρως καθορισµένη. Συνηθέστερη όµως περίπτωση είναι να γνωρίζουµε την οικογένεια στην οποία ανήκει η F µε άγνωστες όµως παραµέτρους θ (π.χ. κανονική µε άγνωστα µ, σ). Στην περίπτωση αυτή συνήθως εκτιµούµε τις παραµέτρους θ από τα δεδοµένα και χρησιµοποιούµε την ίδια στατιστική συνάρτηση ( θ) = sup{ F ( x) F ( x; θ) }, x R όπου F ( x; θ) είναι η σ.κ. που προκύπτει αν θεωρήσουµε ότι οι άγνωστες παράµετροι της F έχουν εκτιµηθεί από τα δεδοµένα. Το αντίστοιχο p-value είναι περίπου ίσο (για µεγάλα δείγµατα) µε αυτό που θα προέκυπτε αγνοώντας το γεγονός της εκτίµησης του θ, δηλαδή, ( ) p value = Pr( ( θ ) d / H ) P( d / H ), e d και έτσι µπορούµε να χρησιµοποιήσουµε και πάλι την ασυµπτωτική κατανοµή της 3.. Για ορισµένες κατανοµές (π.χ. κανονική µε άγνωστες παραµέτρους) συνήθως χρησιµοποιείται µία τροποποίηση του K-S τεστ (π.χ. Lllefors K-S). 3 Στην πραγµατικότητα, η συγκεκριµένη προσεγγιστική τιµή του p-value είναι µεγαλύτερη από την αντίστοιχη ακριβή τιµή. Αυτό είναι διαισθητικά προφανές, διότι η ( F x; θ) θα ταιριάζει περισσότερο στα δεδοµένα από την F ( x; θ) (ακριβώς διότι χρησιµοποιούµε τις παραµέτρους που ταιριάζουν περισσότερο στα δεδοµένα) µε αποτέλεσµα να λαµβάνουµε µεγαλύτερο p-value. Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 34

11 Εφαρµογή 6. Να ελέγξετε αν οι παρακάτω παρατηρήσεις (είναι ίδιες µε της Εφαρµογής 5) προέρχονται από την κανονική κατανοµή (ε.σ. 5%) Εισάγουµε τα δεδοµένα στο SPSS (4 περιπτώσεις cases µε µια µεταβλητή: data). Στη συνέχεια επιλέγουµε Aalyze/o parametrc tests/ sample K-S/test varable: data, test dstrbuto: Normal. Λαµβάνεται ο πίνακας: Από τον πίνακα αυτό βλέπουµε ότι και Oe-Sample Kolmogorov-Smrov Test ATA N 4 Normal Parameters a,b Mea,335 Std. evato 7,868 Most Extreme ffereces Absolute,84 Postve,84 Negatve -,7 Kolmogorov-Smrov Z,534 Asymp. Sg. (-taled),938 a Test dstrbuto s Normal, b Calculated from data. + + =.84, =.7, = max{, } =.84, Ζ =.534 (.534) p value ( ) e.938 από όπου δεν µπορούµε να απορρίψουµε ότι τα δεδοµένα προέρχονται από την κανονική. Είναι σε αυτό το σηµείο ενδιαφέρον να παρατηρήσουµε ότι ο ίδιος έλεγχος µέσω του χ τεστ έδωσε p-value=.89 (βλ. Eφαρµογή 5). Η µεγάλη αυτή διαφορά οφείλεται στο γεγονός ότι στην Eφαρµογή 5 ελέγξαµε αν το δείγµα προέρχεται από την Ν(,65) ενώ τώρα οι παράµετροι της κανονικής κατανοµής δεν είχαν καθοριστεί και για αυτό εκτιµήθηκαν από το δείγµα. Είναι εύκολο να δούµε ότι X =.335, S = και εποµένως τώρα ουσιαστικά ελέγχθηκε η υπό- θεση Η : X ~ N(,335, ). Εάν είχαµε ελέγξει την ίδια υπόθεση µε το χ τεστ (µε την ίδια διαδικασία που περιγράφηκε στην Εφαρµογή 5) τότε θα βρίσκαµε ότι p-value = Το κριτήριο Kolmogorov-Smrov (K-S) για δύο δείγµατα Το κριτήριο K-S µπορεί να τροποποιηθεί ώστε να χρησιµοποιηθεί για να ελέγξουµε αν δύο δείγµατα προέρχονται από την ίδια κατανοµή. Συγκεκριµένα, έστω Χ, Χ,,Χ m και Υ,Y,,Y δύο τυχαία δείγµατα από τις κατανοµές F και G αντίστοιχα και έστω ότι επιθυµούµε να ελέγξουµε την υπόθεση H : F = G έναντι της H : F G Όπως και στο K-S για ένα δείγµα, θα χρησιµοποιήσουµε τις εµπειρικές συναρτήσεις κατανοµής των δύο δειγµάτων. Αυτή την φορά δεν θα τις συγκρίνουµε µε κάποια θεωρητική κατανοµή, αλλά µεταξύ τους. Θέτουµε m, = d K ( F m, G ) = sup{ Fm ( x) G ( x x R Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 35 ) }

12 Όπως και στην περίπτωση του ενός δείγµατος, υπό την H : F = G, η κατανοµή του m, δεν εξαρτάται από την κοινή κατανοµή των Χ, Y ενώ υπό την Η : F G, η m, λαµβάνει µεγάλες τιµές. Εποµένως θα απορρίπτουµε την Η όταν > c ( ) : άνω a-σηµείο της κατανοµής της τ.µ. m, (a) m, = m, a Η ακριβής κατανοµή της τ.µ. m, είναι δύσκολο να υπολογιστεί και για αυτό έχουν κατασκευαστεί πίνακες µε τα άνω a-σηµεία της. Αποδεικνύεται όµως ότι (υπό την Η και για συνεχείς F, G), όπως και στην περίπτωση του ενός δείγµατος, m z P ( m, z) ( ) e για κάθε z, m + και εποµένως το p-value ενός δείγµατος που έδωσε m, = d θα είναι (ασυµπτωτικά) p value = P(, m > d / H ) = P( m m +, m < m d) m + ( ) e m d m Το Wald-Wolfowtz τέστ των ροών (rus test) Έστω και πάλι ότι έχουµε Χ, Χ,,Χ m και Υ,Y,,Y δύο τυχαία δείγµατα από τις κατανο- µές F και G αντίστοιχα και έστω ότι επιθυµούµε να ελέγξουµε την υπόθεση H : F = G έναντι της H : F G Εκτός από το K-S τεστ, για τον έλεγχο αυτό έχουν προταθεί και άλλα τεστ όπως το τεστ των ροών (Wald-Wolfowtz rus τεστ) που θα περιγράψουµε εν συντοµία στη συνέχεια. Θεωρούµε τα δύο παραπάνω δείγµατα ως ένα δείγµα +m παρατηρήσεων και στη συνέχεια διατάσσουµε (από την µικρότερη προς την µεγαλύτερη) τις παρατηρήσεις στο κοινό αυτό δείγµα. Για παράδειγµα αν το πρώτο δείγµα είναι το.5,.4,., 4.6,.8 και το δεύτερο δείγµα είναι το.5, 3.4,.,.6,.8, 5. τότε λαµβάνουµε το διατεταγµένο δείγµα.,.8,.,.5,.6,.8,.4,.5, 3.4, 4.6, 5. Αν στην παραπάνω ακολουθία συµβολίσουµε µε Χ τις παρατηρήσεις από το ο δείγµα και µε Υ τις παρατηρήσεις από το ο δείγµα τότε λαµβάνουµε την ακολουθία συµβόλων Υ, Χ, Χ, Χ, Υ, Υ, Χ, Υ, Υ, Χ, Υ Κάτω από την H, οι +m παρατηρήσεις προέρχονται από την ίδια κατανοµή και εποµένως οι παρατηρήσεις από το ο και το ο δείγµα θα πρέπει να βρεθούν σε «τυχαίες» θέσεις στο διατεταγµένο από κοινού δείγµα. Αντίθετα υπό την H θα πρέπει να διαφαίνονται κάποιες συγκεντρώσεις των µεν ή των δε (π.χ. Χ,Χ,Χ,Χ,Υ,Χ,Υ,Υ,Υ,Υ,Υ). Μια στατιστική συνάρτηση που κατά κάποιο τρόπο εκφράζει το πόσο τυχαία βρίσκονται οι παρατηρήσεις από το ο και το ο δείγµα στο διατεταγµένο από κοινού είναι η R = πλήθος από οµάδες συνεχόµενων όµοιων συµβόλων Χ ή Υ (πλήθος «ροών») (στην ακολουθία συµβόλων που δείχνει τις θέσεις των Χ, Y στο διατεταγµένο από κοινού δείγµα). Στο παραπάνω παράδειγµα οι ροές οµοίων συµβόλων είναι R = 7: (Y), (XXX), (YY), (X), (YY), (X), (Y) (ενώ στην ακολουθία Χ,Χ,Χ,Χ,Υ,Χ,Υ,Υ,Υ,Υ,Υ υπάρχουν µόνο R = 4 ροές). Είναι προφανές ότι όταν ισχύει η Η η R θα λαµβάνει µικρές τιµές. Εποµένως θα απορρίπτουµε την Η όταν R < c. Για να βρεθεί το p-value που αντιστοιχεί στο συγκεκριµένο κριτήριο θα πρέπει να γνωρίζουµε την κατανοµή της R υπό την H (οι +m τ.µ. ακολουθούν την ίδια κατανοµή). Η κατανοµή αυτή µπορεί να εκφρασθεί αναλυτικά αλλά έχει σύνθετη µορφή και για αυτό συνήθως χρησιµοποιούµε το γεγονός ότι ασυµπτωτικά (πρακτικά m, > ), Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 36

13 Z = R m ( + ) m + ~ N(,) ( m, m(m m ) H ( m+ ) ( m+ ) ) Με βάση το παραπάνω (αν r είναι το πλήθος ροών στο δείγµα), p-value = Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 37 m r ( + ) m+ P ( R < r) Φ ( ). m m m ( m+ ) ( m+ ) (Σε περίπτωση που υπάρχουν ίσες παρατηρήσεις στο από κοινού δείγµα, τις διατάσσουµε έτσι ώστε να προκύψει ο µεγαλύτερος δυνατός αριθµός ροών). Παρατήρηση. (Έλεγχος τυχαιότητας µε βάση το πλήθος των ροών). Αξίζει να σηµειωθεί ότι το πλήθος των ροών µπορεί να χρησιµοποιηθεί και για ελέγχους τυχαιότητας. Συγκεκριµένα, έστω ότι έχουµε ένα δείγµα Χ,Χ,,Χ και θέλουµε να ελέγξουµε αν οι Χ αποτελούν τυχαίο δείγµα από κάποια F (δηλ. είναι ανεξάρτητες τ.µ. από την F). Παρατηρούµε ότι αν π.χ. P(X = ) = P(X = ) =.5 (δηλ F ~ Beroull(.5)) τότε µια πραγµατοποίηση της µορφής,,,,,,,,,, ή της µορφής,,,,,,,,,, θα µας γεννούσε υποψίες (για την «τυχαιότητα» µε την οποία παράγονται οι ακολουθίες). Στην περίπτωση που οι Χ,Χ,,Χ προέρχονται από µια F που δεν είναι δίτιµη, τότε µπορούµε να θέσουµε ίσες µε τις παρατηρήσεις που είναι κάτω του δειγµατικού µέσου (ή κάτω της δειγµατικής διάµεσου) και µε τις υπόλοιπες (αν κάποιες είναι ίσες µε το µέσο εξαιρούνται από την ανάλυση) και να πάρουµε µια ανάλογη µε το παραπάνω παράδειγµα ακολουθία από,. Το πλήθος των ροών R µπορεί και εδώ να χρησιµοποιηθεί αναλογιζόµενοι ότι ασυνήθιστα µεγάλες ή µικρές τιµές του R οδηγούν στο συµπέρασµα ότι το δείγµα δεν πρέπει να είναι τυχαίο (ανεξ. ισόνοµες τ.µ.). Εποµένως θα απορρίπτεται η Η : το δείγµα είναι τυχαίο όταν R < c ή R > c. Χρησιµοποιώντας το παραπάνω ασυµπτωτικό αποτέλεσµα, το αντίστοιχο p-value θα είναι (τώρα ο έλεγχος είναι αµφίπλευρος) p-value ( Φ r m ( + ) m+ m(m m ) ( m+ ) ( m+ ) όπου m, είναι το πλήθος από, αντίστοιχα στο δείγµα. Προφανώς θα µπορούσε κανείς εδώ αντί για αµφίπλευρο έλεγχο να απορρίπτει µόνο όταν R < c (π.χ. έχοντας ως εναλλακτική την θετική ε- ξάρτηση µεταξύ των παρατηρήσεων) ή όταν R > c (π.χ. έχοντας ως εναλλακτική την αρνητική ε- ξάρτηση µεταξύ των παρατηρήσεων) Όπως ίσως µπορεί κανείς να φαντασθεί, υπάρχουν πολλά διαφορετικά (απαραµετρικά) κριτήρια που θα µπορούσαν να χρησιµοποιηθούν για έναν έλεγχο τυχαιότητας ή για τον έλεγχο ισότητας των κατανοµών δύο δειγµάτων (πράγµατι στην βιβλιογραφία έχουν προταθεί απαραµετρικά κριτήρια που βασίζονται π.χ. στην µεγαλύτερη ροή, σε ανοδικές ροές, στους βαθµούς (raks) των παρατηρήσεων κ.α.). Το κάθε ένα από αυτά τα τεστ είναι «ευαίσθητο» σε διαφορετικού είδους ε- ναλλακτική υπόθεση. Το τεστ των ροών που εξετάσαµε παραπάνω αν και δεν είναι το πιο ισχυρό, είναι το πιο απλό και το πιο γενικό (όσον αφορά την εναλλακτική υπόθεση) τεστ αυτής της µορφής. Στη συνέχεια θα δούµε ακόµη ένα τεστ που βασίζεται περίπου στην ίδια ιδέα (διάταξη του από κοινού δείγµατος των X, Y ). ).

14 3.6. Το Ma-Whtey U τεστ Και αυτό το τεστ χρησιµοποιείται για τον έλεγχο ισότητας των κατανοµών δύο δειγµάτων. Έστω και πάλι ότι έχουµε Χ, Χ,,Χ m και Υ,Y,,Y δύο τυχαία δείγµατα από τις κατανοµές F και G αντίστοιχα και έστω ότι επιθυµούµε να ελέγξουµε την υπόθεση H : F = G έναντι της H : F G Ενώνουµε όπως και την περίπτωση του Wald-Wolfowtz rus τεστ τα δύο παραπάνω δείγµατα σε ένα δείγµα +m παρατηρήσεων και στη συνέχεια διατάσσουµε (από την µικρότερη προς την µεγαλύτερη) τις παρατηρήσεις στο κοινό αυτό δείγµα. Αυτή τη φορά όµως δεν µετράµε το πλήθος των ροών, αλλά το πλήθος από τα Υ που είναι µικρότερα του X συν το πλήθος από τα Υ που είναι µικρότερα του X κ.ο.κ. στο διατεταγµένο από κοινού δείγµα. Χρησιµοποιώντας το ίδιο παράδειγµα µε την προηγούµενη παράγραφο, αν το πρώτο δείγµα είναι το.5,.4,., 4.6,.8 και το δεύτερο είναι το.5, 3.4,.,.6,.8, 5. τότε λαµβάνουµε το διατεταγµένο δείγµα.,.8,.,.5,.6,.8,.4,.5, 3.4, 4.6, 5. Τώρα βλέπουµε ότι το.8, το. και το.5 είναι µεγαλύτερο από ένα Υ (το.), το.4 είναι µεγαλύτερο από τρία Υ (τα.,.6,.8), και το 4.6 είναι µεγαλύτερο από πέντε X. Άρα εδώ, U = = Θα απορρίπτεται η H : F = G έναντι της H : F G όταν το U είναι αδικαιολόγητα µικρό ή µεγάλο (U < c ή U > c ). Η κατανοµή της τ.µ. U µπορεί να παρασταθεί αναλυτικά (κάτω από την H ) αλλά και πάλι δεν έχει απλή µορφή. Αποδεικνύεται ότι, ασυµπτωτικά, U m / Z = ~ N(,) ( m, ) m( m + + ) / H και εποµένως (για µεγάλα m, ) αν z είναι η τιµή της παραπάνω στατιστικής συνάρτησης στο δείγ- µα, u m / P Z > z Φ z = Φ ( ) /. m m + + p-value = ( ) ( ( ) ( ) Το τεστ αυτό είναι σε αρκετές περιπτώσεις πιο ισχυρό από το τεστ των ροών διότι χρησιµοποιεί περισσότερη πληροφορία από το δείγµα. Εφαρµογή 7. Να ελέγξετε αν οι παρατηρήσεις.,.,.,.8,.,.8, 3.4 και.7,.9,., 5., 6.9, 7., 7.8, 9. προέρχονται από την ίδια κατανοµή. Εισάγουµε τα δεδοµένα σε µία στήλη του SPSS µε όνοµα π.χ. a (µία στήλη µε 7+8 = 5 παρατηρήσεις). Όπως και στα t-tests για δυο ανεξάρτητα δείγµατα χρησιµοποιούµε και µια βοηθητική µεταβλητή, την g η οποία λαµβάνει τις τιµές,,,,,,,,,,,,,, «δείχνοντας» το group που ανήκει κάθε παρατήρηση. Στη συνέχεια εκτελούµε Aalyze/No parametrc tests/ depedet samples, test varable: a, groupg varable: g, Test type: Kolmogorov-Smrov Z, Ma-Whtey U, Wald Wolfowtz rus test (δηλ. επιλέγουµε και τα τρία παραπάνω τεστ). Λαµβάνoνται οι πίνακες: Ma-Whtey Test Test Statstcs b A Ma-Whtey U 9, Wlcoxo W 37, Z -,99 Asymp. Sg. (-taled),8 Exact Sg. [*(-taled Sg.)],9 a Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 38

15 a Not corrected for tes, b Groupg Varable: G Two-Sample Kolmogorov-Smrov Test Test Statstcs A Most Extreme ffereces Absolute,65 Postve, Negatve -,65 Kolmogorov-Smrov Z,8 Asymp. Sg. (-taled),8 Wald-Wolfowtz Test Test Statstcs b,c Number of Z Exact Sg. (-taled) Rus A Exact Number of Rus 8 a,,54 a No ter-group tes ecoutered, b Wald-Wolfowtz Test, c Groupg Varable: G Από το Ma-Whtey τεστ απορρίπτουµε ότι τα δείγµατα προέρχονται από τον ίδιο πληθυσµό (σε ε.σ. 5%) διότι το p-value=.9 ενώ τα άλλα δύο τεστ δεν κατάφεραν µε βάση το συγκεκριµένο δείγµα να εντοπίσουν διαφορά στις κατανοµές των δυο δειγµάτων (p-values:.8 και.54). Εφαρµογή 8. Από ένα πείραµα λαµβάνονται κατά σειρά οι επόµενες παρατηρήσεις,, 4, 9,,, 8, 4, 7, 3,,. Οι παρατηρήσεις αυτές µπορεί να αποτελούν τυχαίο δείγµα; (δηλ. µπορεί να πρόκειται για πραγµατοποίηση ανεξάρτητων τ.µ. από µια κοινή κατανοµή;) Εισάγουµε τα δεδοµένα σε µια µεταβλητή, έστω x. Θα χρησιµοποιήσουµε το rus τεστ για το έλεγχο τυχαιότητας του δείγµατος (βλ. παρατήρηση στην Παράγραφο 3.5). Επιλέγουµε Aalyze/No parametrc tests/rus, test varable:x, cut pot: meda (οι παρατηρήσεις πάνω από την διάµεσο θεωρούνται και αυτές κάτω από την διάµεσο ). Λαµβάνεται ο πίνακας Rus Test X Test Value a 4, Cases < Test Value 5 Cases >= Test Value 7 Total Cases Number of Rus 3 Z -,8 Asymp. Sg. (-taled),37 a Meda από όπου βλέπουµε ότι βρέθηκαν 5 παρατηρήσεις µικρότερες και 7 παρατηρήσεις µεγαλύτερες ή ίσες της (δειγµατικής) διαµέσου (=4), ενώ ο αριθµός των ροών ήταν µόλις 3. Το αντίστοιχο p-value είναι.37, δηλαδή m r ( m+ + ) +.5 p-value ( Φ ).37 ( ) ( = 5, m = 7, r = 3) m m m ( m+ ) ( m+ ) (χρησιµ. διόρθωση συνέχειας) και εποµένως απορρίπτουµε (σε ε.σ. 5%) ότι οι παραπάνω παρατηρήσεις αποτελούν τυχαίο δείγµα από µία κατανοµή (πράγµατι, βλέπουµε ότι οι τιµές των παρατηρήσεων αρχικά αυξάνονται και µετά µειώνονται κάτι που, όπως φάνηκε από το p-value, σπάνια συµβαίνει «τυχαία»). Boutskas M.V. (4), Σηµειώσεις µαθήµατος «Στατιστικά Προγράµµατα» 39

Ενότητα 2: Έλεγχοι υποθέσεων για µέσες τιµες πληθυσµών (T-tests) µέσω SPSS

Ενότητα 2: Έλεγχοι υποθέσεων για µέσες τιµες πληθυσµών (T-tests) µέσω SPSS Ενότητα : Έλεγχοι υποθέσεων για µέσες τιµες πληθυσµών (T-tests) µέσω SPSS.. Έλεγχος υποθέσεων για το µέσο µ ενός πληθυσµού Έστω ότι θέλουµε να ελέγξουµε αν ο µέσος µ ενός κανονικού πληθυσµού (µε άγνωστή

Διαβάστε περισσότερα

Ενότητα 4: Πίνακες συνάφειας (Contingency tables)

Ενότητα 4: Πίνακες συνάφειας (Contingency tables) Ενότητα 4: Πίνακες συνάφειας (Cotigecy tables Σε αρκετές εφαρµογές παρουσιάζεται η ανάγκη ελέγχου της σχέσης µεταξύ δυο κατηγορικών µεταβλητών (Ordial ή omial. Π.χ. θέλουµε να διερευνήσουµε τη σχέση µεταξύ

Διαβάστε περισσότερα

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. A. ΈΛΕΓΧΟΣ ΚΑΝΟΝΙΚΟΤΗΤΑΣ A 1. Έλεγχος κανονικότητας Kolmogorov-Smirnov. Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov. Μηδενική υπόθεση:

Διαβάστε περισσότερα

2. Στοιχεία Πολυδιάστατων Κατανοµών

2. Στοιχεία Πολυδιάστατων Κατανοµών Στοιχεία Πολυδιάστατων Κατανοµών Είναι φανερό ότι έως τώρα η µελέτη µας επικεντρώνεται κάθε φορά σε πιθανότητες που αφορούν µία τυχαία µεταβλητή Σε αρκετές όµως περιπτώσεις ενδιαφερόµαστε να εξετάσουµε

Διαβάστε περισσότερα

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.) 3 Οριακά θεωρήµατα Κεντρικό Οριακό Θεώρηµα (ΚΟΘ) Ένα από τα πιο συνηθισµένα προβλήµατα που ανακύπτουν στη στατιστική είναι ο προσδιορισµός της κατανοµής ενός µεγάλου αθροίσµατος ανεξάρτητων τµ Έστω Χ Χ

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής. 2.6 ΟΡΙΑ ΑΝΟΧΗΣ Το διάστηµα εµπιστοσύνης παρέχει µία εκτίµηση µιας άγνωστης παραµέτρου µε την µορφή διαστήµατος και ένα συγκεκριµένο βαθµό εµπιστοσύνης ότι το διάστηµα αυτό, µε τον τρόπο που κατασκευάσθηκε,

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 7. Εκτίμηση χαρακτηριστικών ελέγχων υποθέσεων

ΚΕΦΑΛΑΙΟ 7. Εκτίμηση χαρακτηριστικών ελέγχων υποθέσεων ΚΕΦΑΛΑΙΟ 7 Εκτίμηση χαρακτηριστικών ελέγχων υποθέσεων Στο κεφάλαιο αυτό θα εξετάσουμε μία εφαρμογή της τεχνικής της προσομοίωσης στους στατιστικούς ελέγχους υποθέσεων. Συγκεκριμένα θα δούμε πως μπορούμε

Διαβάστε περισσότερα

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή: Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών Εισαγωγή Στα προβλήµατα που έχουµε ασχοληθεί µέχρι τώρα, υποστηρίζουµε ότι έχουµε ένα δείγµα X = (X 1, X 2,...,X n ) F(,θ). π.χ. X 1, X 2,...,X n τ.δ. N(µ,σ 2 ),

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο Κατανομές Στατιστικών Συναρτήσεων Δύο δείγματα από κανονική κατανομή Έστω Χ= ( Χ, Χ,..., Χ ) τ.δ. από Ν( µ, σ ) μεγέθους n και 1 n 1 1 Y = (Y, Y,...,Y ) τ.δ. από Ν( µ, σ ) 1 n 1 Χ Y ( µ µ ) S σ Τ ( Χ,Y)

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο Κατανομές Στατιστικών Συναρτήσεων Δύο ανεξάρτητα δείγματα από κανονική κατανομή Έστω Χ= ( Χ, Χ,..., Χ ) τ.δ. από Ν( µ, σ ) μεγέθους n και 1 n 1 1 Y = (Y, Y,..., Y ) τ.δ. από Ν( µ, σ ) 1 n 1 Χ Y ( µ µ )

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος Έλεγχοι Υποθέσεων 1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος µ = 100 Κάθε υπόθεση συνοδεύεται από µια εναλλακτική: Ο

Διαβάστε περισσότερα

Εισαγωγή στη Μη Παραμετρική Στατιστική

Εισαγωγή στη Μη Παραμετρική Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΠΙΘΑΝΟΤΗΤΩΝ-ΣΤΑΤΙΣΤΙΚΗΣ & ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ Εισαγωγή στη Μη Παραμετρική Στατιστική Διδακτικές Σημειώσεις Απόστολος Δ. Μπατσίδης ΙΩΑΝΝΙΝΑ 04 Στην Όλγα

Διαβάστε περισσότερα

1991 US Social Survey.sav

1991 US Social Survey.sav Παραδείγµατα στατιστικής συµπερασµατολογίας µε ένα δείγµα Στα παραδείγµατα χρησιµοποιείται απλό τυχαίο δείγµα µεγέθους 1 από το αρχείο δεδοµένων 1991 US Social Survey.sav Το δείγµα λαµβάνεται µε την διαδικασία

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ Μετά από την εκτίµηση των παραµέτρων ενός προσοµοιώµατος, πρέπει να ελέγχουµε την αλήθεια της υποθέσεως που κάναµε. Είναι ορθή η υπόθεση που κάναµε? Βεβαίως συνήθως υπάρχουν

Διαβάστε περισσότερα

Πολύγωνο αθροιστικών σχετικών συχνοτήτων και διάµεσος µιας τυχαίας µεταβλητής ρ. Παναγιώτης Λ. Θεοδωρόπουλος πρώην Σχολικός Σύµβουλος ΠΕ03 e-mail@p-theodoropoulos.gr Πρόλογος Στην εργασία αυτή αναλύονται

Διαβάστε περισσότερα

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ .5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 7 (ΛΥΣΗ) Στο αρχείο του SPSS θα υπάρχουν οι µεταβλητές,

ΑΣΚΗΣΗ 7 (ΛΥΣΗ) Στο αρχείο του SPSS θα υπάρχουν οι µεταβλητές, ΑΣΚΗΣΗ 7 (ΛΥΣΗ) Στο αρχείο του SPSS θα υπάρχουν οι µεταβλητές, Time: η ώρα γέννησης (4 ψηφία, τα δύο πρώτα είναι ώρες και τα άλλα δυο λεπτά), Sex: το φύλο (:κορίτσι, :αγόρι), Weight: το βάρος του νεογέννητου

Διαβάστε περισσότερα

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή Ανάλυση Συνδιακύµανσης Alsis of Covrice Η ανάλυση συνδιακύµανσης είναι µία άλλη τεχνική για να βελτιώσουµε την ακρίβεια της προσέγγισης του µοντέλου µας στο πείραµα. Ας υποθέσουµε ότι σ ένα πείραµα εκτός

Διαβάστε περισσότερα

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο Εαρινό εξάμηνο 2009-2010 Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο 2009-2010 Στατιστική και Θεωρία Πιθανοτήτων users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΣΤΟΥΣ ΕΛΕΓΧΟΥΣ ΥΠΟΘΕΣΕΩΝ

ΑΣΚΗΣΕΙΣ ΣΤΟΥΣ ΕΛΕΓΧΟΥΣ ΥΠΟΘΕΣΕΩΝ .Φουσκάκης- Ασκήσεις στους Ελέγχους Υποθέσεων ΑΣΚΗΣΕΙΣ ΣΤΟΥΣ ΕΛΕΓΧΟΥΣ ΥΠΟΘΕΣΕΩΝ ) Με µια νέα µέθοδο προσδιορισµού του σηµείου τήξης (σ.τ.) µετάλλων προέκυψαν οι παρακάτω µετρήσεις για το µαγγάνιο: 67,

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8 ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5. 5.8 5. Ένας υγειονοµικός σταθµός θέλει να ελέγξει αν ο µέσος αριθµός βακτηριδίων ανά µονάδα όγκου θαλασσινού νερού σε µια παραλία υπερβαίνει το επίπεδο ασφαλείας των 9 µονάδων. ώδεκα

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β Κουγιουμτζής Δημήτρης Τμήμα Πολιτικών Μηχανικών Α.Π.Θ. Θεσσαλονίκη, Μάρτιος 4 Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση.

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση. Κεφάλαιο 16 Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 1 Προϋποθέσεις για τη χρήση του τεστ ιαφορές ή συσχέτιση Κλίµακα µέτρησης Σχεδιασµός Σηµείωση ιαφορές Κατηγορική Ανεξάρτητα δείγµατα

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

3.4.1 Ο Συντελεστής ρ του Spearman

3.4.1 Ο Συντελεστής ρ του Spearman 3.4. Ο Συντελεστής ρ του Spearma Έστω (, ), (, ),..., (, ) ένα δείγμα παρατηρήσεων πάνω στο τυχαίο διάνυσμα (, ). Έστω ( ) ο βαθμός ή η τάξη μεγέθους της μεταβλητής όταν αυτή συγκρίνεται με τις άλλες Χ

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

εξαρτάται από το θ και για αυτό γράφουµε την σ.π.π. στην εξής µορφή: ( θ, + ) θ θ n 2n (θ,+ ) 1, 0, x θ.

εξαρτάται από το θ και για αυτό γράφουµε την σ.π.π. στην εξής µορφή: ( θ, + ) θ θ n 2n (θ,+ ) 1, 0, x θ. Άσκηση : Έστω Χ,,Χ τυχαίο δείγµα µεγέους από την κατανοµή µε σππ 3 p (,, >, > 0 α είξτε ότι η στατιστική συνάρτηση Τ( Χ : Χ ( m είναι επαρκής για την παράµετρο και πλήρης κ β Βρείτε ΑΕΕ του α Το στήριγµα

Διαβάστε περισσότερα

Σηµειώσεις στις σειρές

Σηµειώσεις στις σειρές . ΟΡΙΣΜΟΙ - ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ Σηµειώσεις στις σειρές Στην Ενότητα αυτή παρουσιάζουµε τις βασικές-απαραίτητες έννοιες για την µελέτη των σειρών πραγµατικών αριθµών και των εφαρµογών τους. Έτσι, δίνονται συστηµατικά

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σκ της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα Χ=(Χ, Χ,, Χ ) από πληθυσμό το

Διαβάστε περισσότερα

Εισαγωγή στη θεωρία ακραίων τιμών

Εισαγωγή στη θεωρία ακραίων τιμών Εισαγωγή στη θεωρία ακραίων τιμών Αντικείμενο της θεωρίας ακραίων τιμών αποτελεί: Η ανάπτυξη και μελέτη στοχαστικών μοντέλων με σκοπό την επίλυση προβλημάτων που σχετίζονται με την εμφάνιση «πολύ μεγάλων»

Διαβάστε περισσότερα

τη µέθοδο της µαθηµατικής επαγωγής για να αποδείξουµε τη Ϲητούµενη ισότητα.

τη µέθοδο της µαθηµατικής επαγωγής για να αποδείξουµε τη Ϲητούµενη ισότητα. Αριστοτελειο Πανεπιστηµιο Θεσσαλονικης Τµηµα Μαθηµατικων Εισαγωγή στην Αλγεβρα Τελική Εξέταση 15 Φεβρουαρίου 2017 1. (Οµάδα Α) Εστω η ακολουθία Fibonacci F 1 = 1, F 2 = 1 και F n = F n 1 + F n 2, για n

Διαβάστε περισσότερα

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV 5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι

Διαβάστε περισσότερα

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: Κατανοµές ειγµατοληψίας 1.Εισαγωγή Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: 1. Στατιστικής και 2. Κατανοµής ειγµατοληψίας

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 8. Εισαγωγή στη Μέθοδο Bootstrap

ΚΕΦΑΛΑΙΟ 8. Εισαγωγή στη Μέθοδο Bootstrap ΚΕΦΑΛΑΙΟ 8 Εισαγωγή στη Μέθοδο Bootstrap Υπενθυμίζεται ότι έως τώρα ασχοληθήκαμε με το πρόβλημα της εκτίμησης μιας ποσότητας μέσω ενός (ψευδο)τυχαίου δείγματος που παρήχθη με την βοήθεια ενός H/Y. Στο

Διαβάστε περισσότερα

Αρµονική Ανάλυση. Ενότητα: L p Σύγκλιση. Απόστολος Γιαννόπουλος. Τµήµα Μαθηµατικών

Αρµονική Ανάλυση. Ενότητα: L p Σύγκλιση. Απόστολος Γιαννόπουλος. Τµήµα Μαθηµατικών Ενότητα: L p Σύγκλιση Απόστολος Γιαννόπουλος Τµήµα Μαθηµατικών Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creaive Commos. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα Γκριζιώτη Μαρία ΜSc Ιατρικής Ερευνητικής Μεθοδολογίας Όταν ανοίγουµε µία βάση στο SPSS η πρώτη εικόνα που

Διαβάστε περισσότερα

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) .5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) Ο διωνυμικός έλεγχος μπορεί να χρησιμοποιηθεί για τον έλεγχο υποθέσεων αναφερομένων στα ποσοστιαία σημεία μίας τυχαίας μεταβλητής. Στην

Διαβάστε περισσότερα

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) Α. Ερωτήσεις πολλαπλών επιλογών.(11 βαθµοί) (1:3 βαθµοί, 2-9:8 βαθµοί) 1. ίνεται ο πίνακας: Χ

Διαβάστε περισσότερα

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test 1 Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου One-Sample t-test 2 Μια σύντομη αναδρομή Στα τέλη του 19 ου αιώνα μια μεγάλη αλλαγή για την επιστήμη ζυμώνονταν στην ζυθοποιία Guinness. Ο William Gosset

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που

Διαβάστε περισσότερα

5. Έλεγχοι Υποθέσεων

5. Έλεγχοι Υποθέσεων 5. Έλεγχοι Υποθέσεων Υποθέσεις Η μηδενική υπόθεση Η (ή ΗΑ) εναλλακτική υπόθεση Δεχόμαστε Η Απορρίπτουμε Η Η σωστή Σωστή απόφαση -α Σφάλμα τύπου Ι α Η λάθος Σφάλμα τύπου ΙΙ β Σωστή απόφαση -β ΒΙΟ39-Έλεγχος

Διαβάστε περισσότερα

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων Ασκήσεις Εξετάσεων Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων ΑΣΚΗΣΗ 1: Έλεγχος για τη μέση τιμή ενός πληθυσμού Η αντικαπνιστική νομοθεσία υποχρεώνει τους καπνιστές που εργάζονται σε

Διαβάστε περισσότερα

ONE WAY ANOVA. .Π.Μ.Σ. Μαθηµατικά των Υπολογιστών & των αποφάσεων. Πάτρα, 11 Ιανουαρίου 2011

ONE WAY ANOVA. .Π.Μ.Σ. Μαθηµατικά των Υπολογιστών & των αποφάσεων. Πάτρα, 11 Ιανουαρίου 2011 Πάτρα, 11 Ιανουαρίου 2011 Πίνακας Περιεχοµένων 1 completely random design with fixed effects 2 3 Πίνακας Περιεχοµένων 1 completely random design with fixed effects 2 3 Γενικά completely random design with

Διαβάστε περισσότερα

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ SPSS

Διαβάστε περισσότερα

Πίνακας κατανοµής συχνοτήτων και αθροιστικών συχνοτήτων. Σχετ.

Πίνακας κατανοµής συχνοτήτων και αθροιστικών συχνοτήτων. Σχετ. Λυµένη Άσκηση στην οµαδοποιηµένη κατανοµή Στην Γ τάξη του Ενιαίου Λυκείου µιας περιοχής φοιτούν 4 µαθητές των οποίων τα ύψη τους σε εκατοστά φαίνονται στον ακόλουθο πίνακα. 7 4 76 7 6 7 3 77 77 7 6 7 6

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Τυχαίο Δείγμα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 1. ΕΙ Η Ε ΟΜΕΝΩΝ, ΣΥΛΛΟΓΗ, ΚΩ ΙΚΟΠΟΙΗΣΗ ΚΑΙ ΕΙΣΑΓΩΓΗ Βασικές µορφές Ερωτήσεων - απαντήσεων Ανοιχτές Κλειστές Κλίµακας ΕΛΕΥΘΕΡΙΟΣ ΑΓΓΕΛΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΠΘ 2 Ανοιχτές ερωτήσεις Ανοιχτές

Διαβάστε περισσότερα

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι Εργαστήριο 9 1. Να χρησιμοποιηθεί το αρχείο data_kids. Τα δεδομένα του προέρχονται από την έρευνα των Chase και Dummer (1992), μελέτησαν τον ρόλο των

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ 1 ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ 1. Ένα σηµείο Α(χ, ψ) ανήκει στη γραφική παράσταση της f αν f(ψ)=χ. 2. Αν µια συνάρτηση είναι γνησίως αύξουσα σε ένα διάστηµα A,

Διαβάστε περισσότερα

Στατιστική. Εκτιμητική

Στατιστική. Εκτιμητική Στατιστική Εκτιμητική Χατζόπουλος Σταύρος 28/2/2018 και 01 /03/2018 Εισαγωγή Το αντικείμενο της Στατιστικής είναι η εξαγωγή συμπερασμάτων που αφορούν τον πληθυσμό ή το φαινόμενο που μελετάμε, με τη βοήθεια

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 1 ου κεφαλαίου Βιβλίο: Κολυβά Μαχαίρα, Φ. & Χατζόπουλος Στ. Α. (2016). Μαθηματική Στατιστική, Έλεγχοι Υποθέσεων. [ηλεκτρ. βιβλ.] Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Απαραμετρική Στατιστική. Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς

Απαραμετρική Στατιστική. Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς Απαραμετρική Στατιστική Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς Πολλά από τα κριτήρια της στατιστικής συμπερασματολογίας βασίζονται σε περιοριστικές υποθέσεις για την κατανομή των πληθυσμών από τους οποίους

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Γκριζιώτη Μαρία ΜSc Ιατρικής Ερευνητικής Μεθοδολογίας Αναλυτική στατιστική Σύγκριση ποιοτικών

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Κατανοµές. Η κατανοµή (distribution) µιας µεταβλητής (variable) φαίνεται από το σχήµα του ιστογράµµατος (histogram).

Κατανοµές. Η κατανοµή (distribution) µιας µεταβλητής (variable) φαίνεται από το σχήµα του ιστογράµµατος (histogram). Ιωάννης Παραβάντης Επίκουρος Καθηγητής Τµήµα ιεθνών και Ευρωπαϊκών Σπουδών Πανεπιστήµιο Πειραιώς Μάρτιος 2010 Κατανοµές 1. Οµοιόµορφη κατανοµή Η κατανοµή (distribution) µιας µεταβλητής (variable) φαίνεται

Διαβάστε περισσότερα

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ Θεόδωρος Χ. Κουτρουµ ανίδης Αναπληρωτής Καθηγητής ΠΘ ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ορεστιάδα 7 ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο ο : Παράγωγες κατανοµές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ ΜΑΘΗΜΑ ΙΑΡΚΕΙΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 3 ΩΡΕΣ ΘΕΜΑ Ο Α ) Να αποδείξετε ότι για δυο ασυµβίβαστα ενδεχόµενα Α, Β ενός δειγµατικού χώρου Ω ισχύει P( A B) = P( A) + P( B) ( µονάδες 8 ) Β ) Να δώσετε τον

Διαβάστε περισσότερα

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΚΕΦΑΛΑΙΟ 13 ΕΚΤΙΜΗΤΙΚΗ: ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Στις προηγούμενες ενότητες ασχοληθήκαμε με μεθόδους που οδηγούν σε εκτιμήτριες των τιμών μιας ή και περισσοτέρων αγνώστων παραμέτρων. Αυτό έγινε με την κατασκευή

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Κεφάλαιο 3 ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Σε πολλά προβλήµατα της µηχανικής δεν ενδιαφερόµαστε να εκτιµήσουµε την τιµή της παραµέτρου αλλά να διαπιστώσουµε αν η παραµέτρος είναι µικρότερη ή µεγαλύτερη από

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test) Σε ορισμένες περιπτώσεις απαιτείται ο έλεγχος της ύπαρξης στατιστικά

Διαβάστε περισσότερα

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΙΕΘΝΩΝ ΟΙΚΟΝΟΜΙΚΩΝ ΣΧΕΣΕΩΝ ΚΑΙ ΑΝΑΠΤΥΞΗΣ ΜΑΘΗΜΑ: ΣΤΑΤΙΣΤΙΚΗ IΙ ΕΙΣΗΓΗΤΡΙΑ: ΣΑΒΒΑΣ ΠΑΠΑ ΟΠΟΥΛΟΣ ΠΑΛΑΙΑ ΘΕΜΑΤΑ ********************************************************************

Διαβάστε περισσότερα

Αριθµητική Ανάλυση. Ενότητα 5 Προσέγγιση Συναρτήσεων. Ν. Μ. Μισυρλής. Τµήµα Πληροφορικής και Τηλεπικοινωνιών,

Αριθµητική Ανάλυση. Ενότητα 5 Προσέγγιση Συναρτήσεων. Ν. Μ. Μισυρλής. Τµήµα Πληροφορικής και Τηλεπικοινωνιών, Αριθµητική Ανάλυση Ενότητα 5 Προσέγγιση Συναρτήσεων Ν. Μ. Μισυρλής Τµήµα Πληροφορικής και Τηλεπικοινωνιών, Καθηγητής: Ν. Μ. Μισυρλής Αριθµητική Ανάλυση - Ενότητα 5 1 / 55 Παρεµβολή Ας υποθέσουµε ότι δίνονται

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ Καθ Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Έλεγχος διακυμάνσεων Μας ενδιαφέρει να εξετάσουμε 5 δίαιτες που δίνονται

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό.

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό. Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» Κεφάλαιο : Ακολουθίες πραγµατικών αριθµών Α Οµάδα Εξετάστε αν οι παρακάτω προτάσεις είναι αληθείς ή ψευδείς αιτιολογήστε πλήρως την απάντησή σας α Κάθε

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 4 ου κεφαλαίου Ελεγχοσυναρτήσεις Γενικευμένου Λόγου Πιθανοφανειών Σταύρος Χατζόπουλος 27/03/2017, 03/04/2017, 24/04/2017 1 Εισαγωγή Έστω το τ.δ. X,,, από την κατανομή

Διαβάστε περισσότερα

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ Έστω ότι επιθυμούμε να μελετήσουμε ένα τυχαίο πείραμα με δειγματικό χώρο Ω και έστω η πιθανότητα να συμβεί ένα ενδεχόμενο Α Ω Υπάρχουν περιπτώσεις όπου ενώ δεν γνωρίζουμε

Διαβάστε περισσότερα

Αριθµητική Παραγώγιση και Ολοκλήρωση

Αριθµητική Παραγώγιση και Ολοκλήρωση Ιαν. 9 Αριθµητική Παραγώγιση και Ολοκλήρωση Είδαµε στο κεφάλαιο της παρεµβολής συναρτήσεων πώς να προσεγγίζουµε µια (συνεχή) συνάρτηση f από ένα πολυώνυµο, όταν γνωρίζουµε + σηµεία του γραφήµατος της συνάρτησης:

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

x y max(x))

x y max(x)) ΚΕΦΑΛΑΙΟ 0 Απλή Γραµµική Παλινδρόµηση Μωυσιάδης Χρόνης 6 o Εξάµηνο Μαθηµατικών Ένα Πρόβληµα εδοµένα.6 3. 3.8 4. 4.4 5.8 6.0 6.7 7. 7.8 y 5.6 7.9 8.0 8. 8. 9. 9.5 9.4 9.6 9.9 Έχει σχέση το yµε το ; Ειδικότερα

Διαβάστε περισσότερα

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ 20 3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ ΟΡΙΣΜΟΣ ΤΗΣ ΜΕΣΗΣ ΤΙΜΗΣ Μια πολύ σηµαντική έννοια στη θεωρία πιθανοτήτων και τη στατιστική είναι η έννοια της µαθηµατικής ελπίδας ή αναµενόµενης τιµής ή µέσης τιµής µιας τυχαίας

Διαβάστε περισσότερα

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου Ένας καθηγητής µαθηµατικών έδωσε σε δύο τµήµατα µιας τάξης του σχολείου του το ίδιο τεστ. Η επίδοση των µαθητών του κάθε τµήµατος (όπως µετρήθηκε µε τη χρήση µιας εικοσαβάθµιας κλίµακας) παρουσιάζεται

Διαβάστε περισσότερα

Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square)

Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square) Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square) Το Chi Square τεστ αποτελεί ένα μη παραμετρικό τεστ και εφαρμόζεται σε ονομαστικές μεταβλητές, βάσει των οποίων τα

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΘΕΜΑΤΑ ΕΞΕΤΑΣΗΣ ΚΑΙ ΑΠΑΝΤΗΣΕΙΣ ΕΞΕΤΑΣΤΙΚΗ ΠΕΡΙΟ ΟΣ:

ΘΕΜΑΤΑ ΕΞΕΤΑΣΗΣ ΚΑΙ ΑΠΑΝΤΗΣΕΙΣ ΕΞΕΤΑΣΤΙΚΗ ΠΕΡΙΟ ΟΣ: ΘΕΜΑΤΑ ΕΞΕΤΑΣΗΣ ΚΑΙ ΑΠΑΝΤΗΣΕΙΣ ΕΞΕΤΑΣΤΙΚΗ ΠΕΡΙΟ ΟΣ: Ιανουάριος-Φεβρουάριος 7 ΜΑΘΗΜΑ: Αριθµητική Ανάλυση ΕΞΑΜΗΝΟ: ο Ι ΑΣΚΩΝ: Ε Κοφίδης Όλα τα ερωτήµατα είναι ισοδύναµα Καλή επιτυχία! Θέµα ο α Χρησιµοποιείστε

Διαβάστε περισσότερα

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ 6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ Η μελέτη διαφόρων στοχαστικών φαινομένων μπορεί γενικά να γίνει χρησιμοποιώντας

ΕΙΣΑΓΩΓΗ Η μελέτη διαφόρων στοχαστικών φαινομένων μπορεί γενικά να γίνει χρησιμοποιώντας ΕΙΣΑΓΩΓΗ Η μελέτη διαφόρων στοχαστικών φαινομένων μπορεί γενικά να γίνει χρησιμοποιώντας κυρίως τρεις μεθόδους:. Αναλυτικές Μέθοδοι: πραγματοποιείται κατάλληλη μαθηματική μοντελοποίηση του στοχαστικού

Διαβάστε περισσότερα

11 Το ολοκλήρωµα Riemann

11 Το ολοκλήρωµα Riemann Το ολοκλήρωµα Riem Το πρόβληµα υπολογισµού του εµβαδού οποιασδήποτε επιφάνειας ( όπως κυκλικοί τοµείς, δακτύλιοι και δίσκοι, ελλειπτικοί δίσκοι, παραβολικά και υπερβολικά χωρία κτλ) είναι γνωστό από την

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ ΚΑΤΑΝΟΜΈΣ ΚΕΦΑΛΑΙΟ 8 81 Εισαγωγή Οι κατανομές διακρίνονται σε κατανομές συχνοτήτων, κατανομές πιθανοτήτων και σε δειγματοληπτικές κατανομές Στη συνέχεια θα γίνει αναλυτική περιγραφή αυτών 82 Κατανομές

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ,

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, -- Άσκηση. Δίνονται τα παρακάτω δεδομένα 5 7 8 9 5 X 8 5 5 5 9 7 Y. 5.. 7..7.7.9.. 5.... 8.. α) Να γίνει το διάγραμμα διασποράς β) εξετάστε τα μοντέλα Υ = β + β Χ + ε, (linear),

Διαβάστε περισσότερα