1 ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "1 ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α"

Transcript

1 ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α. Εισαγωγή Στατιστική (sascs) είναι η επιστήµη ή «τέχνη» του να µαθαίνουµε από τα δεδοµένα. Η στατιστική συνίσταται στη συλλογή δεδοµένων που λέγεται δειγµατοληψία (samplg), στην περιγραφή τους που λέγεται περιγραφική στατιστική (descrpve sascs) και κυρίως στην ανάλυση τους που οδηγεί και στην απόκτηση συµπερασµάτων και αναφέρεται ως στατιστική συµπερασµατολογία (sascal ferece) ή απλά στατιστική. Σε αυτό και το επόµενο κεφάλαιο θα ασχοληθούµε µε τα δύο τελευταία θέµατα. Συγκεκριµένα, σε αυτό το κεφάλαιο θα παρουσιαστούν απλά γραφήµατα και πίνακες για την παρουσίαση και σύνοψη των στατιστικών δεδοµένων. Θα δοθεί επίσης η βασική µεθοδολογία για την εκτίµηση της µέσης τιµής καθώς και τη σύγκριση δεδοµένων ως προς τη µέση τιµή από διαφορετικές οµάδες ή µε διαφορετικές ιδιότητες. Γι αυτό θα χρησιµοποιήσουµε τη λεγόµενη ανάλυση διασποράς (Aalyss of Varace, ANOVA). Η παρουσίαση της στατιστικής µεθοδολογίας γίνεται µε παραδείγµατα από συγκοινωνιακά θέµατα. ίνεται έµφαση στην πρακτική εφαρµογή µε χρήση του στατιστικού λογισµικού SPSS.. Ορολογία Βασικές έννοιες Όλες οι παρατηρήσεις που συλλέγουµε είτε από οργανωµένα πειράµατα ή από απλές καταγραφές αποτελούν τα στατιστικά στοιχεία ή δεδοµένα (daa) που θέλουµε να επεξεργαστούµε µε στατιστικές µεθόδους για να καταλήξουµε σε συµπεράσµατα. Τα δεδοµένα αυτά συλλέγονται από µια καθορισµένη συλλογή στοιχείων που αποτελεί τον πληθυσµό (populao) που µας ενδιαφέρει. Η παρατήρηση όλων του στοιχείων του πληθυσµού είναι πρακτικά πολύ δύσκολη ή αδύνατη, γι αυτό συλλέγουµε ένα µικρό υποσύνολο του πληθυσµού που λέγεται δείγµα (sample) µε κάποιον προκαθορισµένο τρόπο. Οποιοδήποτε χαρακτηριστικό του οποίου η τιµή αλλάζει από το ένα στοιχείο του πληθυσµού στο άλλο λέγεται τυχαία µεταβλητή (radom varable) και για συντοµία θα γράφουµε τ.µ.. Στο εξής θα χρησιµοποιούµε κεφαλαία πλάγια λατινικά γράµµατα για να δηλώνουµε τις µεταβλητές, όπως = µέσο µεταφοράς, Y = χρόνος κάλυψης κάποιας διαδροµής, και µε µικρούς πλάγιους λατινικούς χαρακτήρες θα συµβολίζουµε τις παρατηρήσεις, όπως x, x,..., x είναι παρατηρήσεις της µεταβλητής. Οι τιµές που παίρνει µια τ.µ. µπορεί να είναι κατηγορίες και τότε λέγεται ποιοτική (qualave) τ.µ.. Η τ.µ. µπορεί επίσης να παίρνει αριθµητικές τιµές σε κάποια µονάδα µέτρησης και τότε λέγεται ποσοτική (quaave) τ.µ.. Μια ποσοτική τ.µ. που παίρνει τιµές από ένα σύνολο διακεκριµένων τιµών λέγεται διακριτή (dscree) σε αντίθεση µε µια ποσοτική τ.µ. που παίρνει τιµές σ ένα συνεχές διάστηµα και λέγεται συνεχής (couous). Με αντίστοιχο τρόπο διακρίνουµε και τα δεδοµένα, π.χ. τα δεδοµένα χρόνου κάλυψης µια απόστασης (δροµολόγιο µε τρένο) είναι συνεχή ποσοτικά.

2 .3 Περιγραφική Στατιστική Στην αρχή µιας στατιστικής µελέτης συλλέγουµε παρατηρήσεις για µια τ.µ. που µας ενδιαφέρει, που λέγεται και µεταβλητή ενδιαφέροντος (varable of eres). Η περιγραφική στατιστική συνίσταται στην παρουσίαση των δεδοµένων για κάθε τέτοια µεταβλητή µε στατιστικούς πίνακες και διαγράµµατα καθώς και στον υπολογισµό συνοπτικών µέτρων. Οι πίνακες, τα διαγράµµατα και τα συνοπτικά µέτρα µας βοηθούν να παρατηρήσουµε σηµαντικά χαρακτηριστικά των δεδοµένων, όπως την κεντρική τάση, το εύρος και τη συµµετρικότητα τους..3. Παρουσίαση ποιοτικών ή ποσοτικών διακριτών δεδοµένων Για ποιοτικά η διακριτά ποσοτικά δεδοµένα µπορούµε να υπολογίσουµε τη συχνότητα εµφάνισης f στο δείγµα x, x,..., x, της κάθε διακεκριµένης τιµής a για m διακεκριµένες τιµές a, a,, am. Η σχετική συχνότητα (relave frequecy) f εµφάνισης ή αλλιώς το ποσοστό (perce) p είναι p =. Για διατακτικά κατηγορικά δεδοµένα (δηλαδή για κατηγορίες που µπορούν να τεθούν σε διάταξη) ή διακριτά αριθµητικά δεδοµένα, υπολογίζεται η αθροιστική συχνότητα F για την τιµή a ως F = f j όπου οι δείκτες και j αντιστοιχούν στις τιµές j= a και a j και είναι aj < a. Με τον ίδιο τρόπο ορίζεται και η αθροιστική σχετική συχνότητα P. Ένας πίνακας συχνοτήτων (frequecy able) περιλαµβάνει όλα τα παραπάνω µεγέθη. Κάθε ένα από τα f, p, F και P, =,, m, µπορεί να παρασταθεί γραφικά σ ένα ραβδόγραµµα (bar char), όπου η κάθε ράβδος παρουσιάζει την αντίστοιχη συχνότητα για κάθε τιµή a, ή σε ένα κυκλικό διάγραµµα ή διάγραµµα πίτας (pe char) όπου το κάθε κοµµάτι της επιφάνειας του κύκλου («πίτα») παρουσιάζει την αντίστοιχη συχνότητα. Παράδειγµα: Ας θεωρήσουµε ένα δείγµα για τη χρήση µέσου µεταφοράς προς την εργασία (λεωφορείο, λεωφορείο-µετρό, αυτοκίνητο, άλλο) από 00 εργαζόµενους που επιλέχθηκαν τυχαία. Γι αυτό το δείγµα µπορούµε να σχηµατίσουµε πίνακα και γραφήµατα συχνοτήτων (και σχετικών συχνοτήτων) αλλά όχι αθροιστικών συχνοτήτων, αφού δεν υπάρχει σχέση διάταξης µεταξύ των τιµών της τ.µ. «µέσο µεταφοράς»..3. Οµαδοποίηση και παρουσίαση αριθµητικών δεδοµένων Όταν τα δεδοµένα είναι αριθµητικά και ο αριθµός των διακεκριµένων τιµών είναι µεγάλος ή οι τιµές ανήκουν σ ένα διάστηµα τιµών, τότε πρέπει πρώτα να τα χωρίσουµε σε οµάδες (groups), ή κλάσεις διαστηµάτων, και µετά να υπολογίσουµε, όπως πριν, τη συχνότητα για κάθε οµάδα (δηλαδή τον αριθµό των δεδοµένων σε κάθε οµάδα). Το εύρος τιµών της κάθε οµάδας είναι συνήθως το ίδιο και το διαλέγουµε ανάλογα µε την κλίµακα τιµών για την οποία µας ενδιαφέρει να δούµε διαφορές. Τα γραφήµατα σχηµατίζονται µε βάση τις οµάδες. Ειδικότερα για το ραβδόγραµµα, η κάθε ράβδος υψώνεται στο κέντρο του διαστήµατος της αντίστοιχης οµάδας. Επίσης δεν υπάρχει διάστηµα µεταξύ των ράβδων. Το γράφηµα αυτό λέγεται ιστόγραµµα (hsogram). Ένας άλλος χωρισµός σε οµάδες µε βάση τα ψηφία των µετρήσεων δίνει το φυλλογράφηµα (sem ad leaf plo).

3 Από το ιστόγραµµα ή το φυλλογράφηµα των αριθµητικών τιµών του δείγµατος µπορούµε να αναγνωρίσουµε χαρακτηριστικά της κατανοµής της τ.µ. που µελετάµε. Ειδικότερα µας ενδιαφέρει αν η κατανοµή είναι συµµετρική (δεν παρουσιάζει λοξότητα) και δεν έχει µεγάλες ουρές (άκρα της κατανοµής), αν δηλαδή έχει σχήµα καµπάνας. Τέτοια κατανοµή είναι η κανονική κατανοµή (ormal dsrbuo). Θεωρώντας κανονική κατανοµή για τα δεδοµένα διευκολύνεται η στατιστική ανάλυση καθώς υπάρχει συγκεκριµένη µεθοδολογία σε αυτήν την περίπτωση. Παράδειγµα: Αν έχουµε ένα δείγµα από χρόνους ηµι-αστικής διαδροµής συγκεκριµένου µήκους µε το ίδιο µέσο µεταφοράς σε 0 διαφορετικές περιοχές σε µια πόλη, το ιστόγραµµα θα µπορούσε να µας δείξει αν οι χρόνοι φαίνεται να µαζεύονται γύρω από µια κεντρική τιµή ή κατανέµονται οµοιόµορφα..3.3 Συνοπτικά µέτρα στατιστικών δεδοµένων Τα συνοπτικά µέτρα µπορεί να αναφέρονται σε χαρακτηριστικές θέσεις (κυρίως µας ενδιαφέρει η θέση της κεντρικής τάσης) ή στη µεταβλητότητα των δεδοµένων. Μέτρα κεντρικής τάσης Έστω x, x,..., x, οι τιµές των παρατηρήσεων του δείγµατος για µια µεταβλητή που µελετάµε. Τα κυριότερα µέτρα κεντρικής τάσης είναι η δειγµατική µέση τιµή (sample mea) ή µέσος όρος (average) και η δειγµατική διάµεσος (sample meda). Η δειγµατική µέση τιµή είναι το «κέντρο ισορροπίας» των δεδοµένων, συµβολίζεται x κι ορίζεται ως x x + x + + x = = = x. (.) Η δειγµατική διάµεσος x ορίζεται ως η κεντρική τιµή όταν διατάξουµε τα δεδοµένα σε αύξουσα σειρά. Αν ο αριθµός των δεδοµένων είναι περιττός τότε x είναι η τιµή στη θέση ( + )/, ενώ αν το είναι άρτιος τότε x είναι το ηµιάθροισµα των τιµών στις θέσεις / και / +. Μέτρα µεταβλητότητας ιαφορετικά δείγµατα από τον ίδιο πληθυσµό µπορεί να έχουν το ίδιο µέτρο κεντρικής τάσης αλλά να σκορπίζονται περισσότερο ή λιγότερο γύρω από το κέντρο. Κύρια µέτρα διασποράς των δεδοµένων είναι η δειγµατική διακύµανση ή δειγµατική διασπορά (sample varace), s, η δειγµατική τυπική απόκλιση (sadard devao), s, καθώς και το ενδοτεταρτοµοριακό εύρος Ι (erquarle rage). Η δειγµατική διασπορά ή διακύµανση µετράει τη µεταβλητότητα των παρατηρήσεων γύρω από τη δειγµατική µέση τιµή κι ορίζεται ως s x x x x = = = = ( ). (.) Η διασπορά s προκύπτει από τα τετράγωνα των παρατηρήσεων και γι αυτό είναι δύσκολο να την ερµηνεύσουµε. Γι αυτό συνήθως χρησιµοποιούµε τη δειγµατική τυπική απόκλιση s, που είναι απλά η θετική ρίζα της δειγµατικής διασποράς s, µετριέται στην ίδια µονάδα µέτρησης µε τα δεδοµένα κι εκφράζει πόσο µια τυπική τιµή της µεταβλητής απέχει από τη µέση τιµή. 3

4 Μια παρατήρηση ονοµάζεται το p-εκατοστιαίο σηµείο όταν το πολύ p% του συνόλου των παρατηρήσεων είναι µικρότερες απ αυτήν την παρατήρηση. Η διάµεσος είναι το 50-εκατοστιαίο σηµείο. Αλλά χαρακτηριστικά εκατοστιαία σηµεία είναι το 5-εκατοστιαίο σηµείο, δηλαδή το πρώτο ή κατώτερο τεταρτοµόριο (frs or lower quarle) Q και το 75-εκατοστιαίο σηµείο, δηλαδή το τρίτο ή ανώτερο τεταρτοµόριο (hrd or upper quarle) Q 3. Τα Q και Q 3 ορίζονται όπως η διάµεσος αλλά περιορίζοντας το σύνολο των δεδοµένων στα αντίστοιχα υποσύνολα (κατώτερο ή ανώτερο µισό, αντίστοιχα). Η διαφορά Ι=Q 3 Q, λέγεται ενδοτεταρτοµοριακό εύρος και δίνει το εύρος που καλύπτουν τα µισά από τα δεδοµένα που είναι πιο κοντά στην κεντρική τιµή (διάµεσο). Η διάµεσος, το πρώτο και τρίτο τεταρτοµόριο και η ελάχιστη και µέγιστη τιµή των δεδοµένων αποτελούν τη σύνοψη των 5 αριθµών (fve umber summary). Γραφικά η παρουσίαση της σύνοψης των 5 αριθµών γίνεται µε το θηκόγραµµα (box plo) σε οριζόντια ή κάθετη θέση όπως δείχνει το παρακάτω σχήµα. x m Q ~ x Q 3 x max Εικόνα. Σχηµατική παρουσίαση οριζόντιου θηκογράµµατος. Η ύπαρξη µεµονωµένων παρατηρήσεων που διαφέρουν σηµαντικά από τις υπόλοιπες παρατηρήσεις του δείγµατος δυσκολεύει τη στατιστική περιγραφή και ανάλυση. Γι αυτό θα πρέπει πριν προχωρήσουµε να βεβαιωθούµε αν η µακρινή παρατήρηση είναι σωστή και πρέπει να συµπεριληφθεί ή αν υποπτευόµαστε ότι µπορεί να οφείλεται σε λάθος της µέτρησης και να την αγνοήσουµε. Στο σχηµατισµό του θηκογράµµατος στο SPSS, τιµές που υπερβαίνουν κάποια όρια χαρακτηρίζονται ύποπτες απόµακρες τιµές (oulers) ή απόµακρες τιµές (exreme values) και δηλώνονται ως ξεχωριστά σηµεία στο θηκόγραµµα (Graphs > Boxplo ή Graphs > Ieracve > Boxplo). Η δειγµατική µέση τιµή και η δειγµατική διασπορά επηρεάζονται σηµαντικά από την ύπαρξη απόµακρων τιµών ενώ η διάµεσος και το ενδοτεταρτοµοριακό εύρος όχι. Γενικά στο SPSS υπάρχουν µια σειρά από γραφήµατα στο µενού Graphs, ενώ η στατιστική ανάλυση είναι στο µενού Aalyze..4 Εκτιµητική Η κατανοµή µιας τ.µ. χαρακτηρίζεται από κάποιες παραµέτρους. Για παράδειγµα η κανονική κατανοµή ορίζεται από τη µέση τιµή µ και τη διασπορά σ. Από το δείγµα των παρατηρήσεων συχνά θέλουµε να εκτιµήσουµε κάποια παράµετρο. Γι αυτό υπολογίζουµε µια τιµή που αντιπροσωπεύει την παράµετρο καλύτερα, κάνουµε δηλαδή σηµειακή εκτίµηση (po esmao). Επίσης υπολογίζουµε ένα διάστηµα τιµών που περιέχει την αληθινή τιµή της παραµέτρου µε κάποια µεγάλη πιθανότητα -α, το οποίο λέγεται (-α)% διάστηµα εµπιστοσύνης (cofdece erval). Το α λέγεται και στάθµη σηµαντικότητας (sgfcace level). 4

5 Ιδιαίτερο ενδιαφέρον παρουσιάζει η εκτίµηση της µέση τιµής µ µιας τ.µ. και της διαφοράς µέσων τιµών µ µ δύο τ.µ. και. Εκτίµηση µέσης τιµής Για τη µέση τιµή µ µιας τ.µ. Χ, η καλύτερη σηµειακή εκτίµηση είναι η δειγµατική µέση τιµή x (δες (.)). Για τον ακριβή υπολογισµό του διαστήµατος εµπιστοσύνης της µ χρειάζεται να γνωρίζουµε αν η κατανοµή της τ.µ. Χ είναι κανονική, αν η διασπορά σ είναι γνωστή και αν το µέγεθος του δείγµατος είναι µεγάλο ( > 30 ) ή µικρό. Στον Πίνακας. δίνεται το διάστηµα εµπιστοσύνης στις διάφορες περιπτώσεις. ιασπορά κατανοµή της N διάστηµα εµπιστοσύνης γνωστή κανονική γνωστή µη κανονική > 30 σ x ± z α / σ x ± z α / γνωστή µη κανονική < 30 µη-παραµετρικό άγνωστη > 30 άγνωστη κανονική < 30 x ± z x ± α /, α / άγνωστη µη κανονική < 30 µη-παραµετρικό Πίνακας. Εκτίµηση του δ.ε. της µ ανάλογα µε τη γνώση της διασποράς και κατανοµής της τ.µ. καθώς και του µεγέθους του δείγµατος. Το διάστηµα εµπιστοσύνης ορίζεται µε βάση την κατανοµή που ακολουθεί ο εκτιµητής x, ο οποίος θεωρείται επίσης τ.µ.. Το διάστηµα εµπιστοσύνης έχει τη γενική µορφή x ± (κρίσιµη τιµή) s x, (.3) όπου sx είναι η εκτίµηση της τυπικής απόκλισης ή (όπως συνηθίζεται) του τυπικού σφάλµατος (esmaed sadard error) του εκτιµητή της µέση τιµής x. Στο γενικό ορισµό του ( α )% διαστήµατος εµπιστοσύνης στην (.3) η κρίσιµη τιµή δίνεται από την κατανοµή της x, που κατά περίπτωση είναι η κρίσιµη τιµή της τυπικής κανονικής κατανοµής z a/ ή η κρίσιµη τιµή της κατανοµής sude ή - κατανοµής µε - βαθµούς ελευθερίας, a /. Για µικρά δείγµατα µιας τ.µ. που δε φαίνεται να ακολουθεί κανονική κατανοµή (µε βάση το ιστόγραµµα ή το θηκόγραµµα) δε γνωρίζουµε την κατανοµή της x και το διάστηµα εµπιστοσύνης δε µπορεί να οριστεί παραµετρικά (δηλαδή µε βάση κάποια γνωστή κατανοµή). Σε αυτήν την περίπτωση εκτιµούµε διάστηµα εµπιστοσύνης για τη διάµεσο χρησιµοποιώντας µη-παραµετρική µέθοδο. Γενικά µηπαραµετρικές µέθοδοι δε θα µας απασχολήσουν εδώ γι αυτό είναι σηµαντικό να εξετάζουµε αν η κατανοµή της τ.µ. ενδιαφέροντος είναι κανονική. s s 5

6 Παράδειγµα: Για το παράδειγµα του χρόνου κάλυψης ηµι-αστικής διαδροµής συγκεκριµένου µήκους µε το ίδιο µέσο µεταφοράς σε 0 διαφορετικές περιοχές, χρησιµοποιώντας τον τύπο (.) βρίσκουµε τη σηµειακή εκτίµηση του µέσου χρόνου της διαδροµής. Αν η κατανοµή των χρόνων φαίνεται να είναι κανονική µπορούµε να υπολογίσουµε το διάστηµα εµπιστοσύνης του µέσου χρόνου γι αυτό το µήκος της διαδροµής µε κάποια εµπιστοσύνη επιπέδου ( α )% κάνοντας χρήση του τύπου µε την κρίσιµη -τιµή (προτελευταία σειρά στον Πίνακας.). Εκτίµηση διαφοράς µέσων τιµών Συχνά µας ενδιαφέρει να εκτιµήσουµε αν δύο ανεξάρτητες τ.µ. και διαφέρουν ως προς τη µέση τιµή τους µ και µ αντίστοιχα. Γι αυτό εκτιµούµε το ( α )% διάστηµα εµπιστοσύνης για τη διαφορά µ µ και ελέγχουµε αν αυτό περιέχει το 0. Αν το διάστηµα εµπιστοσύνης είναι θετικό, σηµαίνει ότι σε στάθµη εµπιστοσύνης ( α )% η µέση τιµή µ είναι µεγαλύτερη από τη µ κατά ποσό που δίνεται από το διάστηµα εµπιστοσύνης. Αντίστοιχα ερµηνεύεται ένα αρνητικό διάστηµα εµπιστοσύνης. Τέλος αν το διάστηµα εµπιστοσύνης περιέχει το 0, δεν υπάρχει σηµαντική διαφορά. διασπορές των, Κατανοµές των,, διάστηµα εµπιστοσύνης για µ µ γνωστές κανονική σ σ x x ± z α / + ( ) γνωστές µη κανονική µεγάλα σ σ x x ± z α / + ( ) γνωστές µη κανονική µικρά µη-παραµετρικό άγνωστες άνισες ή ίσες µεγάλα s s x x ± z α / + ( ) άγνωστες και ίσες κανονική µικρά x x ± +, α / sp + ( ) άγνωστες και ίσες µη κανονική µικρά µη-παραµετρικό άγνωστες και άνισες µικρά ---- Πίνακας. Εκτίµηση του δ.ε. της διαφοράς µ - µ ανάλογα µε τη γνώση των διασπορών σ, σ και κατανοµών των τ.µ. και καθώς και των µεγεθών και των αντιστοίχων δειγµάτων. Στον Πίνακας. δίνεται το διάστηµα εµπιστοσύνης της µ µ στις διάφορες περιπτώσεις, όπως και για τη µέση τιµή. Εδώ εξετάζουµε επίσης αν οι διασπορές των και δε διαφέρουν σηµαντικά έτσι ώστε να µπορούν να θεωρηθούν ίσες. Στην περίπτωση που οι διασπορές είναι άγνωστες και ίσες, εκτιµούνται από την κοινή διασπορά (pooled varace) s ( ) s + ( ) s, (.4) p = + 6

7 όπου s και s είναι οι δειγµατικές διασπορές για τις τ.µ. και αντίστοιχα. Παράδειγµα: Για το παράδειγµα µε το χρόνο κάλυψης ηµι-αστικής διαδροµής συγκεκριµένου µήκους µε το ίδιο µέσο σε 0 διαφορετικές περιοχές σε µια πόλη Α θεωρούµε ότι έχουµε επίσης άλλες 5 µετρήσεις από µια άλλη πόλη Β. Υποθέτοντας κανονικές κατανοµές και ίδιες διασπορές για τους χρόνους διαδροµής στις δύο πόλεις, µπορούµε να υπολογίσουµε από τον τύπο (.4) την κοινή διασπορά από τις δειγµατικές διασπορές για τις πόλεις Α και Β. Στη συνέχεια µπορούµε να βρούµε το ( α )% διάστηµα εµπιστοσύνης για τη διαφορά των µέσων χρόνων διαδροµής για τις δύο πόλεις κάνοντας χρήση του τύπου µε την κρίσιµη -τιµή (έκτη σειρά στον Πίνακας.)..5 Έλεγχος υπόθεσης Απάντηση στο ερώτηµα αν διαφέρουν οι µέσες τιµές των τ.µ. και µπορούµε επίσης να δώσουµε χρησιµοποιώντας έλεγχο στατιστικής υπόθεσης. Γενικά στον έλεγχο στατιστικής υπόθεσης ξεκινάµε µε µια µηδενική υπόθεση (ull hypohess) Η 0 που συνήθως θέλουµε να απορρίψουµε για να δεχτούµε την εναλλακτική υπόθεση (alerave hypohess) Η. Για παράδειγµα για τη σύγκριση δύο τ.µ. ως προς τη µέση τιµή τους οι υποθέσεις είναι: Η 0 : µ = µ Η : µ µ. Στη συνέχεια επιλέγουµε µια κατάλληλη στατιστική ελέγχου (es sasc) q που ακολουθεί γνωστή κατανοµή (π.χ. q z~ Ν (0,), q ~ +, το σύµβολο ορίζει ταυτόσηµο συµβολισµό). Ορίζεται ένα σύνολο τιµών της q που είναι απίθανο (σε στάθµη σηµαντικότητας α) να πάρει η q αν ισχύει η Η 0, το οποίο ονοµάζεται απορριπτική περιοχή (rejeco rego), R. Αυτό το σύνολο αντιστοιχεί στις ουρές της κατανοµής της q. Για παράδειγµα, για την Η 0 : µ = µ, χρησιµοποιώντας q z είναι R { z z α /} = >. Υπολογίζουµε τη δειγµατική στατιστική ελέγχου q, δηλαδή την τιµή της q στο δείγµα, και εξετάζουµε αν αυτή ανήκει στο R για να απορρίψουµε την Η 0. Στον έλεγχο χρησιµοποιείται συχνά η p-τιµή (p-value), που δηλώνει τη χαµηλότερη στάθµη σηµαντικότητας α για την οποία µπορούµε να απορρίψουµε την Η 0 µε βάση το δείγµα. Στην περίπτωση όπου q z, είναι p = P( z > z ), όπου z η τιµή της στατιστικής q από το δείγµα που είναι ίδια µε την κρίσιµη τιµή z p /. Υπάρχει πλήρης συµφωνία του αποτελέσµατος από το διάστηµα εµπιστοσύνης και τον στατιστικό έλεγχο στην ίδια στάθµη σηµαντικότητας α. Για παράδειγµα αν απορρίψουµε την Η 0 : µ = µ 0 (η µηδενική υπόθεση για να ελέγξουµε αν η µέση τιµή µ µιας τ.µ. µπορεί να πάρει κάποια τιµή µ 0 ) για α = 0.05 τότε το 95% διάστηµα εµπιστοσύνης της µ δεν περιέχει την τιµή µ 0. Το ίδιο ισχύει για τη σύγκριση των µέσων τιµών των τ.µ. και. Η στατιστική ελέγχου q γι αυτούς τους ελέγχους ορίζεται κατά περίπτωση όπως και για τα αντίστοιχα διαστήµατα εµπιστοσύνης (δες Πίνακας. και Πίνακας.). Ο έλεγχος µπορεί επίσης να είναι µονόπλευρος (oe-sded es), π.χ. Η 0 : µ µ, Η : µ µ και τότε ορίζεται αντίστοιχα µονόπλευρα η απορριπτική περιοχή, π.χ. { } R z z α = >. 7

8 Στο SPSS υπάρχει δυνατότητα για πραγµατοποίηση ελέγχου και ταυτόχρονα υπολογισµό διαστήµατος εµπιστοσύνης για τη µέση τιµή (Compare Meas > Oe- Sample T es) και για σύγκριση δύο µέσων τιµών από ανεξάρτητα δείγµατα (Compare Meas > Idepede Samples T Tes), αλλά µόνο για άγνωστες διασπορές (χρήση κατανοµής sude, δες Πίνακας. και Πίνακας.)..6 Ανάλυση ιασποράς Σε πιο σύνθετα προβλήµατα, όπου π.χ. δεν έχουµε απλά να εκτιµήσουµε τη µέση τιµή ενός µεγέθους ή να συγκρίνουµε δύο οµάδες ως προς κάποιο χαρακτηριστικό τους, όπως είδαµε πριν, χρειάζεται να οργανώσουµε τη στατιστική µελέτη και να κάνουµε σχεδιασµό πειράµατος (expermeal desg). Για παράδειγµα σχεδιασµό πειράµατος χρειάζεται να κάνουµε όταν έχουµε να συγκρίνουµε τρεις οι παραπάνω τ.µ. ως προς τη µέση τιµή τους. Η µέθοδος στατιστικής ανάλυσης που χρησιµοποιούµε λέγεται ανάλυση διασποράς (aalyss of varace, ANOVA). Οι τ.µ. µπορεί να εκφράζουν οµάδες (υπο-πληθυσµούς) από έναν πληθυσµό (π.χ. χρόνος ηµι-αστικής διαδροµής ίδιας απόστασης σε τρία αστικά κέντρα) ή διαφορετικά χαρακτηριστικά (π.χ. χρόνος διαδροµής ίδιας απόστασης µε αυτοκίνητο, λεωφορείο, συνδυασµένη χρήση λεωφορείου-µετρό, άλλο µεταφορικό µέσο). Άρα οι µετρήσεις των διαφορετικών τ.µ. είναι ουσιαστικά µετρήσεις µιας µεταβλητής ενδιαφέροντος (π.χ. ο χρόνος κάλυψης µιας διαδροµής) άλλα σε διαφορετικές οµάδες ενός παράγοντα (facor), που αποτελείται από υπο-πληθυσµούς ή χαρακτηριστικά και πιθανόν να επηρεάζει τη µεταβλητή ενδιαφέροντος. Σε πιο σύνθετους σχεδιασµούς πειράµατος µπορεί να εξετάζουµε την επίδραση περισσοτέρων από έναν παράγοντα στη µεταβλητή ενδιαφέροντος ή να θέλουµε να εξαλείψουµε την επίδραση κάποιας άλλης µεταβλητής (covarae) που ίσως να καλύπτει την επίδραση του παράγοντα στη µεταβλητή ενδιαφέροντος..6. Μονόδροµη Ανάλυση ιασποράς Σ έναν πλήρως τυχαιοποιηµένο σχεδιασµό (compleely radomzed desg) υποθέτουµε πως το πείραµα δίνει τις µετρήσεις της µεταβλητής ενδιαφέροντος Y σε k διαφορετικές οµάδες (πληθυσµούς ή χαρακτηριστικά), δηλαδή y, y,, y είναι το δείγµα για την πρώτη οµάδα, y, y,, y για τη δεύτερη οµάδα κτλ. Θέλουµε να ελέγξουµε την υπόθεση ότι οι µέσες τιµές της Y στις k οµάδες είναι ίσες H 0 : µ = µ = = µ k. Τυπικά υποθέτουµε ότι η κατανοµή της µεταβλητής ενδιαφέροντος στις k οµάδες είναι κανονική και η διασπορά είναι η ίδια, άρα οι οµάδες µπορεί να διαφέρουν µόνο ως προς τη µέση τιµή. Η στατιστική ανάλυση που χρησιµοποιείται για να εξετάσουµε αυτήν τη H 0 λέγεται µονόδροµη ανάλυση διασποράς (oe way ANOVA). Αν y είναι ο µέσος όρος από όλα τα δείγµατα (grad mea) και y είναι ο µέσος όρος στο δείγµα, το µοντέλο της µονόδροµης ανάλυσης διασποράς θεωρεί την παρακάτω ανάλυση κάθε µέτρησης y j y = y + ( y y) + ( y y ) j j παρατήρηση ολικός µέσος απόκλιση λόγω παράγοντα τυχαίο σφάλµα 8

9 Έστω SSA το άθροισµα των τετραγώνων των αποκλίσεων λόγω του παράγοντα (µε βάση το δεύτερο όρο στην παραπάνω ανάλυση), δηλαδή το σφάλµα µεταξύ των δειγµάτων (bewee-sample error). Έστω επίσης SSE το άθροισµα των τετραγώνων των αποκλίσεων µέσα στο κάθε δείγµα (wh-sample error), που αντιστοιχεί τον τρίτο όρο στην παραπάνω ανάλυση. Ο λόγος SSA /( k ) F = (.5) SSE /( k) είναι η στατιστική ελέγχου που, κάτω από την Η 0, ακολουθεί κατανοµή Fsher, F µε k- βαθµούς ελευθερίας (για το σφάλµα µεταξύ δειγµάτων) και -k k, k βαθµούς ελευθερίας (για το σφάλµα µέσα στο δείγµα). Η απορριπτική περιοχή σε στάθµη σηµαντικότητας α είναι R = { F > Fk, k; a} και η τιµή Fk, k; a δίνεται σε αντίστοιχο στατιστικό πίνακα. Το SPSS κάνει αυτήν την ανάλυση (Compare Meas > Oe-Way ANOVA) και υπολογίζει την τιµή της στατιστικής F από το δείγµα, καθώς και την p-τιµή του ελέγχου. Αν απορρίψουµε την H 0 η ανάλυση συνεχίζεται µε τη διερεύνηση διαφορών στις οµάδες ανά ζεύγη κάνοντας επακόλουθες ή πολλαπλές συγκρίσεις (follow-up or mulple comparsos), υπολογίζοντας δηλαδή διαστήµατα εµπιστοσύνης διαφορών k µέσων τιµών για κάθε ζευγάρι οµάδων. Επειδή θέλουµε οι ( ) 9 συγκρίσεις από κοινού να είναι σωστές, θα πρέπει το κάθε διάστηµα εµπιστοσύνης να υπολογισθεί σε µικρότερη στάθµη σηµαντικότητας από α, έτσι ώστε όλα µαζί να αντιστοιχούν στη στάθµη σηµαντικότητας α. Υπάρχουν διάφορες τέτοιες διαδικασίες στο SPSS (Boferro, Tukey, Due, κτλ.) (επιλογή Pos Hoc στο Oe-Way ANOVA). Για να είναι αξιόπιστα τα αποτελέσµατα της (µονόδροµης) ανάλυσης διασποράς είναι σηµαντικό να κάνουµε έλεγχο ορθότητας των υποθέσεων (assumpo checkg), οι οποίες είναι ότι η κατανοµή στις οµάδες είναι κανονική και οι διασπορές ίσες. Σχηµατίζοντας τα θηκογράµµατα όλων των οµάδων σ ένα γράφηµα µας επιτρέπει να κάνουµε τον έλεγχο αυτό ποιοτικά. Τα θηκογράµµατα πρέπει να µη δείχνουν σηµαντικές αποκλίσεις από συµµετρία και να µην έχουν µακριές ουρές ή ακραία σηµεία (για να είναι οι κατανοµές κανονικές) και το µέγεθος της µεγαλύτερης θήκης (που δηλώνει το ενδοτεταρτοµοριακό εύρος) δε θα πρέπει να διαφέρει σηµαντικά από το µέγεθος της µικρότερης θήκης (για να είναι ίσες οι διασπορές). Παράδειγµα: Ας θεωρήσουµε το παράδειγµα µε τους χρόνους κάλυψης ηµι-αστικής διαδροµής κάποιας απόστασης µε το ίδιο µέσο µεταφοράς σε τρεις πόλεις Α, Β, Γ. Αν από την εφαρµογή της µονόδροµής ανάλυσης διασποράς στα δείγµατα προκύπτει ότι υπάρχουν διαφορές, δηλαδή απορρίπτεται η µηδενική υπόθεση, τότε η διαδικασία των πολλαπλών συγκρίσεων θα µας καταδείξει σε ποιες πόλεις ο χρόνος διαδροµής διαφέρει..6. Ανάλυση διασποράς µε δύο παράγοντες Στο σχεδιασµό πειράµατος µπορούµε να εισάγουµε και δεύτερο παράγοντα. Προσπαθούµε µε ένα τέτοιο πείραµα να απαντήσουµε στα παρακάτω ερωτήµατα:. Επηρεάζει ο πρώτος παράγοντας από µόνος του τη µεταβλητή ενδιαφέροντος;. Επηρεάζει ο δεύτερος παράγοντας από µόνος του τη µεταβλητή ενδιαφέροντος; 3. Έχουν οι δύο παράγοντες µαζί συνδυασµένη επίδραση στη µεταβλητή ενδιαφέροντος;

10 Για το κάθε ερώτηµα αντιστοιχεί µια µηδενική υπόθεση. Χρησιµοποιώντας την ανάλυση διασποράς δύο δρόµων (wo-way ANOVA) κάνουµε στατιστικό έλεγχο και για τις τρεις υποθέσεις ταυτόχρονα. Το µοντέλο εδώ είναι πιο πολύπλοκο αλλά η διαδικασία ελέγχου είναι παρόµοια µε αυτήν για τη µονόδροµη ανάλυση διασποράς. Ανάλογα µε την απόρριψη των µηδενικών υποθέσεων γίνονται και οι επακόλουθες πολλαπλές συγκρίσεις. Οι υποθέσεις για την εφαρµογή της ανάλυση διασποράς δύο δρόµων που πρέπει να ελεγχθούν ως προς την ορθότητα τους είναι και πάλι η κανονική κατανοµή σε κάθε οµάδα (και για τους δύο παράγοντες) και η ισότητα των διασπορών. Παράδειγµα: Θέλουµε να ελέγξουµε αν ο χρόνος κάλυψης ηµι-αστικής διαδροµής συγκεκριµένου µήκους επηρεάζεται από την περιοχή στην οποία αναφέρεται (πρώτος παράγοντας) ή από το µέσο µεταφοράς (δεύτερος παράγοντας). Αυτοί οι δύο παράγοντες µπορεί να επηρεάζουν ξεχωριστά το χρόνο διαδροµής. Επίσης µπορεί να έχουν και συνδυασµένη επίδραση στο χρόνο της διαδροµής, π.χ. το λεωφορείο µπορεί να κάνει πιο σύντοµα τη διαδροµή σε κάποια συγκεκριµένη περιοχή (αλλά όχι σε όλες). Η ανάλυση διασποράς δύο δρόµων δίνει απαντήσεις σε αυτά τα ερωτήµατα. 0

11 ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Β Σε αυτό το κεφαλαίο θα δούµε µοντέλα που περιγράφουν σχέσεις µεταξύ συνεχών τ.µ.. Συγκεκριµένα θα µελετήσουµε τη γραµµική εξάρτηση µιας τ.µ. από µια ή περισσότερες µεταβλητές. Στη συνέχεια θα ασχοληθούµε µε χρονικές σειρές και θα µελετήσουµε µοντέλα που περιγράφουν την εξάρτηση ενός σηµείου της χρονοσειράς από τα προηγούµενα. Σε όλες αυτές τις περιπτώσεις η δηµιουργία των µοντέλων αποσκοπεί κυρίως στην πρόβλεψη κάποιου µεγέθους, χρησιµοποιώντας τη γνώση µας είτε για άλλα µεγέθη ή για το ίδιο µέγεθος σε προηγούµενους χρόνους.. Συντελεστής Συσχέτισης Έστω δύο τ.µ. και Y µε διασπορά Var[ ] συνδιασπορά Cov [, Y ] Y σ = και σ Y, αντίστοιχα, και σ =. Η συνδιασπορά εκφράζει τη γραµµική συσχέτιση δύο τ.µ., δηλαδή την αναλογική µεταβολή (αύξηση ή µείωση) της µιας τ.µ. που αντιστοιχεί σε µεταβολή της άλλης µεταβλητής. Η γραµµική αυτή συσχέτιση εκφράζεται καλύτερα µε τον συντελεστή συσχέτισης (correlao coeffce) ρ που ορίζεται ως σ Y ρ =. (.) σ σ Το ρ δεν εξαρτάται από τη µονάδα µέτρησης των και Y και παίρνει τιµές στο διάστηµα [-,], όπου τιµές κοντά στο δηλώνουν ισχυρή θετική συσχέτιση (όσο αυξάνει η µια τ.µ. αυξάνει κι άλλη), τιµές κοντά στο - δηλώνουν ισχυρή αρνητική συσχέτιση και τιµές κοντά στο 0 δηλώνουν γραµµική ανεξαρτησία των και Y. Ποιοτικά η µορφή της συσχέτισης των και Y φαίνεται από την κατανοµή των σηµείων ( x, y ) στο καρτεσιανό σύστηµα συντεταγµένων. Αυτό το σχήµα αναφέρεται ως διάγραµµα διασποράς (scaer dagram)... Εκτίµηση του συντελεστή συσχέτισης Η σηµειακή εκτίµηση του συντελεστή συσχέτισης ρ του πληθυσµού από το δείγµα των ζευγαρωτών παρατηρήσεων ( x, y ),( x, y ),,( x, y ) Y { } των και Y γίνεται µε την αντικατάσταση της συνδιασποράς σ Y και των τυπικών αποκλίσεων σ και σ Y από τις αντίστοιχες εκτιµήσεις από το δείγµα sy ˆ ρ r =, (.) s s όπου s είναι η δειγµατική διασπορά του (δες (.)) και s Y είναι η εκτίµηση της συνδιασποράς των και Y, που ορίζεται ως s x x y y Y x y x y = = = = Y ( )( ). (.3)

12 Η εκτίµηση του συντελεστή συσχέτισης της (.) λέγεται και συντελεστής συσχέτισης Pearso (Pearso correlao coeffce) για να διαφοροποιηθεί από άλλες εκτιµήσεις του συντελεστή συσχέτισης. Αν οι τ.µ. και Y ακολουθούν τη δι-µεταβλητή κανονική κατανοµή (bvarae ormal dsrbuo) ορίζεται το ( α )% διάστηµα εµπιστοσύνης του ρ. Επίσης µπορεί να γίνει παραµετρικός έλεγχος για κάποια τιµή του ρ. Ιδιαίτερο ενδιαφέρον παρουσιάζει ο έλεγχος της Η 0 : ρ = 0 γιατί ουσιαστικά εξετάζει αν τα και Y είναι γραµµικά ανεξάρτητα. Στο SPSS υπάρχει η δυνατότητα υπολογισµού του συντελεστή συσχέτισης Pearso r καθώς και πραγµατοποίησης ελέγχου σηµαντικότητας του r (Correlae > Bvarae). Παράδειγµα: Θέλουµε να ελέγξουµε αν το αντίτιµο του εισιτηρίου αστικού λεωφορείου σε µια πόλη συσχετίζεται µε τη χρήση χώρων παρκαρίσµατος στο κέντρο της πόλης. Έχοντας συλλέξει κάποιο δείγµα (από ιστορικά στοιχεία), υπολογίζουµε τον συντελεστή συσχέτισης Pearso r. Αν το r βρεθεί να είναι µικρό (όπως ίσως αναµένεται), θα πρέπει να εξετάσουµε αν είναι διαφορετικό του 0 µε στατιστική σηµαντικότητα, κάνοντας τον κατάλληλο στατιστικό έλεγχο.. Απλή γραµµική παλινδρόµηση Η ανάλυση παλινδρόµησης (regresso aalyss) περιγράφει τη µεταβλητότητα µιας τ.µ. Υ χρησιµοποιώντας την πληροφορία που έχουµε για µια ή περισσότερες µεταβλητές,, κτλ.. Το πρόβληµα της παλινδρόµησης είναι η εύρεση ενός µοντέλου που περιγράφει την εξάρτηση της τ.µ. Υ, που ονοµάζεται εξαρτηµένη µεταβλητή (depede or respose varable), από µια µεταβλητή Χ που ονοµάζεται ανεξάρτητη µεταβλητή (depede or explaaory varable) ή κι από περισσότερες από µια µεταβλητές. Στην περίπτωση της απλής γραµµικής παλινδρόµησης (smple lear regresso) η ανεξάρτητη µεταβλητή είναι µία και η εξάρτηση θεωρείται γραµµική. Παράδειγµα: Θέλουµε να διερευνήσουµε την επίδραση του αριθµού των σηµατοδοτηµένων διασταυρώσεων στο χρόνο κάλυψης µιας διαδροµής. Η εξαρτηµένη τ.µ. Υ είναι ο χρόνος διαδροµής, η ανεξάρτητη µεταβλητή Χ είναι ο αριθµός σηµατοδοτηµένων διασταυρώσεων και υποθέτουµε πως η εξάρτηση είναι γραµµική... Μοντέλο απλής γραµµικής παλινδρόµησης Για τη δηµιουργία του µοντέλου της απλής γραµµικής παλινδρόµησης κάνουµε τις εξής υποθέσεις:. Η µέση τιµή της τ.µ. Υ για κάθε τιµή x της, Ε [ Y = x], είναι γραµµική συνάρτηση της x Ε [ Y = x] = α + β x. (.4). Η διασπορά της τ.µ. Υ για κάθε τιµή x της είναι σταθερή Var[ Y = x] σ Y = σ. (.5) Συνήθως υποθέτουµε επίσης ότι η δεσµευµένη κατανοµή της Υ ως προς τη είναι κανονική ( α β σ ) Y = x ~ Ν + x,. (.6)

13 Η παραπάνω συνθήκη επιτρέπει τον παραµετρικό έλεγχο και την παραµετρική εκτίµηση διαστηµάτων για τις παραµέτρους α και β καθώς και για την πρόβλεψη ŷ για κάποια τιµή της. Η τ.µ. y για κάποια τιµή x της Χ δίνεται κάτω από την υπόθεση της γραµµικής παλινδρόµησης ως y = α + β x + ε, (.7) όπου ε είναι το σφάλµα παλινδρόµησης (regresso error). Η διασπορά του σφάλµατος είναι Var[ ε ] σ = σ. ε.. Εκτίµηση παραµέτρων απλής γραµµικής παλινδρόµησης Το πρόβληµα της παλινδρόµησης είναι η εκτίµηση των παραµέτρων α και β καθώς και της διασποράς σ των σφαλµάτων από το δείγµα των ζευγαρωτών x, y, x, y,, x, y. Ο σταθερός όρος α είναι η τιµή του y { } παρατηρήσεων ( ) ( ) ( ) για x = 0 και λέγεται διαφορά ύψους (ercep). Ο συντελεστής του x, β, είναι η κλίση (slope) της ευθείας ή αλλιώς ο συντελεστής παλινδρόµησης (regresso coeffce). Η εκτίµηση των α και β γίνεται συνήθως µε τη µέθοδο των ελαχίστων τετραγώνων (mehod of leas squares) και είναι ˆ sy b β = και a ˆ α = y bx, (.8) s όπου s είναι η δειγµατική διασπορά του (δες (.)) και s Y είναι η εκτίµηση της συνδιασποράς των και Y (δες (.3)). Η ευθεία των ελαχίστων τετραγώνων είναι ŷ = a+ bx. (.9) Για κάθε δοθείσα τιµή x, µε τη βοήθεια της ευθείας ελαχίστων τετραγώνων, εκτιµούµε την τιµή ŷ που γενικά είναι διαφορετική από την πραγµατική τιµή y. Η κατακόρυφη απόσταση της πραγµατικής τιµής y από την ευθεία ελαχίστων τετραγώνων, e ˆ = y y, είναι το σφάλµα ελαχίστων τετραγώνων ή απλά υπόλοιπο (resdual). Το υπόλοιπο e είναι η εκτίµηση του σφάλµατος παλινδρόµησης ε. Άρα η εκτίµηση της διασποράς του σφάλµατος σ δίνεται από τη δειγµατική διασπορά s των υπολοίπων e s s ( ˆ ) e = y y, (.0) = όπου διαιρούµε µε - γιατί από τους βαθµούς ελευθερίας του µεγέθους του δείγµατος αφαιρούµε δύο για τις δύο παραµέτρους που έχουν ήδη εκτιµηθεί. ιαστήµατα εµπιστοσύνης για τις παραµέτρους α και β, δίνονται ως a s ±, α / a και, α / b ± s, ακολουθώντας το γενικό τύπο, όπως και για τη µέση τιµή (δες (.3)), όπου οι εκτιµήσεις των τυπικών σφαλµάτων των a και b, s a και s b, δίνονται από σχετικούς b 3

14 τύπους. Με τον ίδιο τρόπο µπορεί κάποιος να κάνει έλεγχο υπόθεσης για τα α και β. Συνήθως µας ενδιαφέρει να ελέγξουµε την υπόθεση Η 0 : β = 0, γιατί αν η κλίση β της ευθείας παλινδρόµησης βρεθεί να είναι στατιστικά ασήµαντη, τότε οδηγούµαστε στο συµπέρασµα ότι η τ.µ. Y δεν εξαρτάται από τη µεταβλητή...3 Εκτίµηση και πρόβλεψη της εξαρτηµένης µεταβλητής Το µοντέλο της ευθείας ελαχίστων τετραγώνων της (.9) δίνει τη σηµειακή εκτίµηση ŷ 0 της µέσης τιµής της Y για κάθε τιµή x 0 της. Το αντίστοιχο ( α )% διάστηµα εµπιστοσύνης είναι ( a+ bx ) ± s + ( x x ) 0 0, α / ( ) s. (.) Το παραπάνω διάστηµα αναφέρεται στη µέση ή αναµενόµενη τιµή της Y για µια δεδοµένη τιµή x 0 της. Για να ορίσουµε τα όρια της πρόβλεψης (lms of predco) της Y για µια τιµή x 0, υπολογίζουµε ένα λίγο ευρύτερο διάστηµα µε κέντρο επίσης το ŷ 0, που λέγεται διάστηµα πρόβλεψης (predco erval) και είναι ( a+ bx ) ± s + + ( x x ) 0 0, α / ( ) s. (.)..4 Επάρκεια του µοντέλου Ο σχεδιασµός της ευθείας ελαχίστων τετραγώνων ŷ = a+ bx στο διάγραµµα διασποράς δίνει µια πρώτη εικόνα της καταλληλότητας του µοντέλου, δηλαδή πόσο x, y. Επίσης φανερώνει, αν υπάρχουν, καλά προσαρµόζεται στα σηµεία ( ) συστηµατικές (όχι τυχαίες) αποκλίσεις των σηµείων από την προσαρµοσµένη ευθεία. Αν για παράδειγµα, το γραµµικό µοντέλο δεν είναι σωστό (π.χ. αν µια παραβολική καµπύλη ταιριάζει περισσότερο στα δεδοµένα) περιµένουµε περισσότερα σηµεία να είναι κάτω από την ευθεία για κάποιες τιµές του και πάνω από την ευθεία για κάποιες άλλες τιµές του. Άλλα χαρακτηριστικά που θα πρέπει ακόµα να ελέγξουµε είναι αν η κατανοµή των σηµείων γύρω από την ευθεία είναι κανονική και η διασπορά τους για τις διαφορετικές τιµές του σταθερές. Τα παραπάνω ελέγχονται καλύτερα, αλλά πάντα ποιοτικά, αν σχεδιάσουµε τα υπόλοιπα e προς τις προσαρµοσµένες τιµές y ˆ. Ένα τέτοιο διάγραµµα θα πρέπει να µη δίνει κανενός είδους σχηµατισµό των σηµείων για να είναι το µοντέλο επαρκές. Τα σηµεία απλά θα πρέπει να σκορπίζονται το ίδιο πάνω και κάτω από την οριζόντια γραµµή στο ύψος 0 και αυτό να συµβαίνει κατά µήκος όλης της γραµµής (όπου υπάρχουν σηµεία)..3 Πολλαπλή Γραµµική Παλινδρόµηση Στην πολλαπλή γραµµική παλινδρόµηση (mulple lear regresso) θεωρούµε ότι η τ.µ. Y εξαρτάται γραµµικά από κάποιες µεταβλητές,,, k. Το y για κάποια τιµή x της, x της,, x k της k, δίνεται ως 4

15 y = β + β x + β x + + β x + ε. (.3) 0 k k Οι υποθέσεις της πολλαπλής γραµµικής παλινδρόµησης είναι όπως και για την απλή γραµµική παλινδρόµηση, δηλαδή υποθέτουµε πως τα σφάλµατα ε της παλινδρόµησης (όπως και η τ.µ. Y για κάθε τιµή των,,, k ) ακολουθούν κανονική κατανοµή µε σταθερή διασπορά. Γενικά το πρόβληµα και η εκτίµηση της πολλαπλής γραµµικής παλινδρόµησης δε διαφέρει ουσιαστικά από αυτό της απλής γραµµικής παλινδρόµησης. Ένα καινούριο στοιχείο στην πολλαπλή γραµµική παλινδρόµηση είναι ότι, πριν προχωρήσουµε στην εκτίµηση των παραµέτρων, πρέπει να ελέγξουµε αν πράγµατι πρέπει να συµπεριλάβουµε όλες τις ανεξάρτητες µεταβλητές στο µοντέλο..3. Επιλογή των ανεξάρτητων µεταβλητών Αν έχουµε στη διάθεση µας ένα µεγάλο αριθµό ανεξάρτητων µεταβλητών είναι πιθανόν κάποιες από αυτές να είναι περιττές, δηλαδή να µην έχουν να προσφέρουν επιπλέον πληροφορία για τη µεταβλητότητα της Y, όταν ήδη έχουµε θεωρήσει την εξάρτηση της Y από κάποιες άλλες µεταβλητές. Υπάρχουν διάφορες µέθοδοι για την επιλογή των «σηµαντικότερων» µεταβλητών και η πιο διαδεδοµένη είναι η τεχνική της βηµατικής παλινδρόµησης (sepwse regresso echque). Η διαδικασία αυτής της τεχνικής αρχίζει µε το απλό σταθερό µοντέλο y = β0 + ε. Σε κάθε βήµα προστίθεται µια ανεξάρτητη µεταβλητή στο µοντέλο µόνο αν αυτή η µεταβλητή προσφέρει σηµαντική πληροφορία για τη Y, επιπρόσθετα στην πληροφορία που παρέχουν οι ανεξάρτητες µεταβλητές που είναι ήδη στο µοντέλο από το προηγούµενο βήµα. Η διαδικασία αυτή επιτυγχάνεται µε τους εξής στατιστικούς ελέγχους:. Αν κάποια από τις µεταβλητές που δεν ήταν στο µοντέλο πρέπει να προστεθεί σ αυτές που ήδη έχουν συµπεριληφθεί.. Αν κάποια από τις µεταβλητές που ήταν στο µοντέλο του προηγούµενου βήµατος πρέπει να παραµείνει στο νέο µοντέλο, στο οποίο έχει συµπεριληφθεί µια νέα µεταβλητή. Στο τέλος η διαδικασία της βηµατικής παλινδρόµησης δίνει ένα σύνολο από ανεξάρτητα χρήσιµες µεταβλητές για την εξήγηση της Y. Παράδειγµα: Έστω ότι θέλουµε να εξηγήσουµε τη µεταβλητότητα του χρόνου κάλυψης διαδροµής συγκεκριµένου µήκους (µε αυτοκίνητο) σε ηµι-αστική ζώνη κι εκτός από τον αριθµό σηµατοδοτηµένων διασταυρώσεων, θεωρούµε κι άλλους πιθανούς παράγοντες, όπως η καταλληλότητα του οδοστρώµατος (σε κάποια αριθµητική κλίµακα αξιολόγησης), ο αριθµός βιοµηχανικών µονάδων κατά µήκος της διαδροµής (εντός κάποιας προκαθορισµένης ακτίνας), το ποσοστό των φορτηγών στο πλήθος των οχηµάτων που κινούνται σε αυτήν τη διαδροµή, κτλ. Η βηµατική παλινδρόµηση θα ξεχωρίσει ποιοι από αυτούς τους παράγοντες είναι χρήσιµοι και εξηγούν κάποιο σηµαντικό µέρος της µεταβλητότητας του χρόνου διαδροµής που δεν εξηγείται από τους υπόλοιπους παράγοντες. Θα περίµενε ίσως κάποιος το ποσοστό των φορτηγών να µη δίνει κάποια επιπλέον πληροφορία όταν ήδη έχει συµπεριληφθεί ως σηµαντική ανεξάρτητη µεταβλητή στο µοντέλο ο αριθµός των βιοµηχανικών µονάδων (η κίνηση πολλών φορτηγών αναµένεται να είναι προς και από τις βιοµηχανικές µονάδες). 5

16 .3. Προσαρµογή µοντέλου Η εκτίµηση των παραµέτρων του µοντέλου πολλαπλής παλινδρόµησης γίνεται µε τη µέθοδο ελαχίστων τετραγώνων όπως και για την απλή γραµµική παλινδρόµηση. Αντίστοιχα διαστήµατα εµπιστοσύνης και πρόβλεψης για τη Y για κάθε σύνολο τιµών των,,, k υπολογίζονται όπως στις (.) και (.) (µε κάποια διαφοροποίηση στον τύπο έτσι ώστε να συµπεριλαµβάνει όλες τις ανεξάρτητες µεταβλητές του µοντέλου). Τέλος η επάρκεια του µοντέλου εξετάζεται επίσης από το e, y. διάγραµµα υπολοίπων προς προσαρµοσµένες τιµές ( ) Στο SPSS υπάρχει η δυνατότητα εκτίµησης µοντέλου απλής και πολλαπλής γραµµικής παλινδρόµησης (Regresso > Lear)..4 Χρονικές Σειρές Χρονική σειρά ή χρονοσειρά (me seres) είναι ένα σύνολο παρατηρήσεων x, x,..., x από µια διαδικασία µε χρονική διάταξη,,,. Το κάθε στοιχείο της διαδικασίας είναι µια τ.µ. και οι χρονικά διαταγµένες τ.µ. (µε βάση το δείκτη ) συσχετίζονται µε τρόπο που ορίζεται από τη διαδικασία. Ενώ σε προβλήµατα παλινδρόµησης εξετάζουµε την εξάρτηση κάποιας τ.µ. Y από άλλες µεταβλητές,,, k (ο δείκτης εδώ δε δηλώνει χρονική διάταξη αλλά απλά διαφορετικές µεταβλητές), σε προβλήµατα χρονοσειρών µας ενδιαφέρει κυρίως η εξάρτηση που µπορεί να έχει η τ.µ. από τις προηγούµενες τ.µ.,,, για κάθε χρονική στιγµή. Το πρόβληµα αυτό αναφέρεται ως αυτοπαλινδρόµηση (auoregresso). Πριν περάσουµε όµως σε αυτό το πρόβληµα ας δούµε τη γενικότερη µορφή που µπορεί να έχει µια χρονοσειρά..4. Απλό περιγραφικό µοντέλο χρονοσειρών όπου: Κάθε χρονοσειρά x, x,..., x µπορεί να περιγραφεί από το απλό µοντέλο x = µ + s + y, (.4) µ είναι το στοιχείο (συνιστώσα) τάσης (red compoe) και περιγράφει τη µακροπρόθεσµη συµπεριφορά της χρονοσειράς. s είναι το στοιχείο περιοδικότητας ή εποχικότητας (cyclcal or seasoal compoe) και περιγράφει κανονικές διακυµάνσεις κάποιας περιόδου (που µπορεί να αντιστοιχούν σε ένα χρόνο, µια εποχή του χρόνου, µια βδοµάδα κτλ). y είναι το µη οµαλό στοιχείο (rregular compoe) που αποµένει όταν αφαιρεθούν από τη χρονοσειρά τα µ και s. Η χρονοσειρά των y µπορεί να αποτελείται από πλήρως τυχαίες διακυµάνσεις και τότε λέγεται λευκός θόρυβος (whe ose), ή να παρουσιάζει κάποια δοµή και να επιδέχεται κάποιο µοντέλο αυτοπαλινδρόµησης. Μια χρονοσειρά θεωρείται στάσιµη (saoary) όταν η κοινή κατανοµή των, +, είναι ανεξάρτητη του χρόνου, ή πιο απλά όταν οι στατιστικές ιδιότητες 6

17 της χρονοσειράς δεν αλλάζουν µε το χρόνο. Κυρίως µας ενδιαφέρει να µην αλλάζει η µέση τιµή και συνδιασπορά που αναφέρεται και ως ασθενής στασιµότητα (weak saoary). Άρα µια χρονοσειρά µε τάση ή περιοδικότητα δεν είναι στάσιµη και η απαλοιφή τους αποσκοπεί πρακτικά να την κάνει στάσιµη. Στοιχείο τάσης Μια πραγµατική χρονοσειρά είναι φυσικό να εµφανίζει κάποια τάση, π.χ. η χρονοσειρά µέτρησης της κυκλοφορίας σε µια οδική αρτηρία µπορεί να παρουσιάζει αυξητική τάση µε το χρόνο. Μια τέτοια τάση µπορεί να περιγραφεί από κάποια απλή συνάρτηση του χρόνου f (), π.χ. ένα πολυώνυµο κάποιας τάξης. Έτσι αν π.χ. η αύξηση της κυκλοφορίας είναι αναλογική ως προς το χρόνο, τότε προσαρµόζουµε στη χρονοσειρά πολυώνυµο πρώτης τάξης µ = f() = a0 + a. Για µια πιο πολύπλοκη τάση θα χρειαστεί να προσαρµόσουµε πιο σύνθετη f (), π.χ. εκθετική συνάρτηση ή πολυώνυµο µεγάλης τάξης. Σε πολλές εφαρµογές στην ανάλυση χρονοσειράς το ενδιαφέρον δεν είναι στην µακροπρόθεσµη τάση, που µπορεί να οφείλεται σε εξωγενείς παράγοντες (π.χ. αύξηση της κυκλοφορίας λόγω αύξησης της αγοράς αυτοκινήτων) αλλά σε αλλαγές που γίνονται σε µικρότερη χρονική κλίµακα. Σε τέτοιες περιπτώσεις θέλουµε να απαλείψουµε την τάση. Αν µπορούµε να προσαρµόσουµε ικανοποιητικά µια συνάρτηση f () την αφαιρούµε από τη χρονοσειρά και συνεχίζουµε µε τη χρονοσειρά των υπολοίπων. Γενικά ένας εύκολος τρόπος να απαλείψουµε την τάση είναι να φτιάξουµε µια άλλη σειρά αποτελούµενη από τις πρώτες διαφορές y = x = x x. (.5) Στοιχείο περιοδικότητας Μια χρονοσειρά µπορεί να παρουσιάζει κάποια περιοδικότητα, που είτε οφείλεται σε εξωγενείς παράγοντες που δε µας ενδιαφέρει να µελετήσουµε σε βάθος και γι αυτό θέλουµε να την απαλείψουµε, ή είναι σηµαντική για τη µελέτη µας και θέλουµε να τη προσδιορίσουµε. Για παράδειγµα, η κυκλοφορία σε µια οδική αρτηρία παρουσιάζει συστηµατικές µεταβολές στις διάφορες ώρες της ηµέρας. Αν θέλουµε να µελετήσουµε τη µεταβολή της κυκλοφορίας στις διάφορες περιόδους της ηµέρας είναι σηµαντικό να προσδιορίσουµε αυτήν τη µεταβολή ως µια συνάρτηση του χρόνου για µια ηµέρα. Αν θέλουµε να δούµε αν η κυκλοφορία έχει κάποια δυναµική, δηλαδή αν η κυκλοφορία σε κάποια ώρα της ηµέρας εξαρτάται από την κυκλοφορία στις προηγούµενες ώρες, τότε για να µελετήσουµε τέτοιες σχέσεις, πρέπει να απαλείψουµε την περιοδικότητα, δηλαδή την κίνηση που αναλογεί λόγω της συγκεκριµένης ώρας της ηµέρας. Και στις δύο περιπτώσεις πρέπει πρώτα να εκτιµήσουµε µε κάποιο τρόπο την περιοδικότητα. Αν υποθέσουµε πως έχουµε µια χρονοσειρά x, x,..., x χωρίς τάσεις (ή αφού απαλείψαµε ήδη την τάση) αλλά µε περιοδικότητα µε περίοδο d, τότε για κάθε k =,, d υπολογίζουµε το µέσο όρο των παρατηρήσεων x k + jd, όπου k + jd. Αυτοί οι µέσοι όροι αποτελούν την εκτίµηση του στοιχείου περιοδικότητας s ˆk, k =,, d. 7

18 .4. Αυτοσυσχέτιση Είδαµε πως η γραµµική σχέση δύο τ.µ. και Y µετριέται µε τη συνδιασπορά και τον συντελεστή συσχέτισης. Στις στάσιµες χρονοσειρές θεωρούµε ως τ.µ. τις και τ, για κάθε χρονική υστέρηση τ. Η συνδιασπορά ορίζεται για κάθε υστέρηση τ ως [ ] γ ( τ) = Cov, τ και λέγεται συνάρτηση αυτοδιασποράς (auocovarace fuco). Ο συντελεστής συσχέτισης για κάθε υστέρηση τ είναι γ ( τ ) ρ ( τ) = (.6) σ και λέγεται συνάρτηση αυτοσυσχέτισης (auocorrelao fuco). Η διασπορά είναι σταθερή αφού η χρονοσειρά θεωρείται στάσιµη. Σε αντιστοιχία µε τη δειγµατική συνδιασπορά, η εκτίµηση της αυτοδιασποράς είναι ˆ ( ) ( x x )( x x ) x x x γ τ = τ = τ (.7) τ = τ+ τ = τ+ και της αυτοσυσχέτισης ˆ γ ( τ ) r ( ) ˆ τ = ρ( τ) =. (.8) s Σηµειώνεται ότι r ( τ ) και r( τ ) = r( τ ). Η συνάρτηση αυτοσυσχέτισης ορίζει τη γραµµική συσχέτιση µεταξύ των στοιχείων της χρονικής σειράς. Έτσι αν η χρονοσειρά είναι λευκός θόρυβος, η αυτοσυσχέτιση µηδενίζεται για κάθε υστέρηση τ 0. Πρακτικά αυτό σηµαίνει πως η εκτίµηση της αυτοσυσχέτισης r ( τ ) θα πρέπει να κυµαίνεται στα όρια ± z α / για κάποια στάθµη σηµαντικότητας α. Η αυτοσυσχέτιση χρησιµοποιείται ως στατιστική ελέγχου στον έλεγχο ανεξαρτησίας (es of depedece), δηλαδή για τη µηδενική υπόθεση ότι η χρονοσειρά είναι λευκός θόρυβος..4.3 Μοντέλα αυτοπαλινδρόµησης Στη συνέχεια υποθέτουµε ότι η χρονοσειρά δεν έχει τάσεις ή περιοδικότητα, ή αν είχε έχουν απαλειφθεί. Υποθέτουµε επίσης ότι η µέση τιµή για τη χρονοσειρά είναι 0 (αλλιώς στους παρακάτω τύπους, αντικαθιστούµε τη τ.µ. µε µ και την παρατήρηση x µε x x, όπου µ η µέση τιµή της διαδικασίας και x η µέση τιµή της παρατηρούµενης χρονοσειράς). Θέλουµε να µελετήσουµε την εξάρτηση της από τις προηγούµενες τ.µ.,,, για κάθε χρονική στιγµή. Το γενικό µοντέλο Το γενικό µοντέλο αυτοπαλινδρόµησης έχει τη µορφή όπου: p p 0 q q σ = φ + φ + θ ε + θε + + θ ε (.9) 8

19 Οι πρώτοι p όροι του µοντέλου αντιστοιχούν στο αυτοπαλινδροµούµενο µέρος (auoregressve erm) και δίνουν τη γραµµική εξάρτηση της στις,,,. p Ο όρος θ0ε δηλώνει το σφάλµα ή θόρυβο στη χρονική στιγµή. Συνήθως θεωρούµε θ 0 =. Οι τελευταίοι q όροι του µοντέλου αντιστοιχούν στο θόρυβο στις προηγούµενες q χρονικές στιγµές και αποτελούν το µέρος του κινούµενου µέσου (movg average erm). Το µοντέλο αυτό λέγεται αυτοπαλινδροµούµενο µοντέλο κινούµενου µέσου (auoregressve movg average model) και συµβολίζεται ARMA(p,q). Υποθέτουµε πως τα ε είναι ανεξάρτητα µεταξύ τους και έχουν πανοµοιότυπη κατανοµή (decally ad depedely dsrbued, d). Επίσης κάθε ε είναι ανεξάρτητο των s για χρόνο s κι έχει διασπορά σ ε. Συνήθως υποθέτουµε επίσης ότι τα ε ακολουθούν κανονική κατανοµή για να µπορούµε να υπολογίζουµε παραµετρικά διαστήµατα εµπιστοσύνης και πρόβλεψης (αλλά για σηµειακές εκτιµήσεις δεν είναι απαραίτητο). Το αυτοπαλινδροµούµενο µοντέλο Πιο γνωστό είναι το αυτοπαλινδροµούµενο µοντέλο (auoregressve model) AR(p) = φ + φ + ε. (.0) p p Το AR(p) ορίζεται όπως το µοντέλο πολλαπλής παλινδρόµησης (δες (.3)), µε τη διαφορά ότι οι µεταβλητές,,, p είναι από την ίδια διαδικασία, όπως η εξαρτηµένη µεταβλητή. Άρα για το µοντέλο AR(p) δε µπορούµε να θεωρήσουµε τις,,, p ως ανεξάρτητες µεταβλητές. Παρ όλα αυτά χρησιµοποιείται κι εδώ η µέθοδος των ελαχίστων τετραγώνων για την εκτίµηση των παραµέτρων φ,,, φp σε. Άλλες µέθοδοι χρησιµοποιούν τη σχέση που υπάρχει µεταξύ της συνάρτησης αυτοσυσχέτισης ρ ( τ ) για τ = 0,,, p (όπου ρ (0) = σ ) και των παραµέτρων φ,,, φp σε, που αναφέρεται και ως σύστηµα κανονικών ή Yule- Walker εξισώσεων (ormal or Yule-Walker equaos): ρ() ρ( p ) φ ρ() () ( p ) φ ρ ρ ρ() = (.) ρ( p ) ρ( p ) φ p ρ( p) και p = j ( j) + ε j= σ φρ σ. (.) 9

20 Για την εκτίµηση των φ,,, φp σε, αντικαθιστούµε στις εξισώσεις (.) και (.) τις αυτοσυσχετίσεις ρ ( τ ) για τ = 0,,, p µε τις εκτιµήσεις r ( τ ) από τη χρονοσειρά. Βαθµός µοντέλου Όπως στην πολλαπλή γραµµική παλινδρόµηση επιλέγουµε µε κάποιο τρόπο τις σηµαντικές ανεξάρτητες µεταβλητές έτσι και στην αυτοπαλινδρόµηση υπάρχουν κριτήρια επιλογής του βαθµού του µοντέλου (order seleco), δηλαδή του αριθµού των µεταβλητών,,, p που θα συµπεριληφθούν στο µοντέλο. Τέτοια κριτήρια είναι το κριτήριο πληροφορίας του Akake (Akake formao crero, AIC) και το τελικό σφάλµα πρόβλεψης (Fal Predco Error, FPE). Επίσης ένα χρήσιµο εργαλείο για την επιλογή του βαθµού του µοντέλου είναι η συνάρτηση µερικής αυτοσυσχέτισης (paral auocorrelao fuco). Επάρκεια µοντέλου Για να είναι κατάλληλο ένα µοντέλο AR(p) ή ARMA(p,q) θα πρέπει τα υπόλοιπα e να είναι λευκός θόρυβος. Αυτό µπορεί να ελεγχθεί µε κατάλληλο έλεγχο ανεξαρτησίας στη χρονοσειρά των υπολοίπων..4.4 Αυτοπαλινδροµούµενο µοντέλο για µη-στάσιµη χρονοσειρά Για τα µοντέλα AR(p) και ARMA(p,q) θεωρήσαµε πως η χρονοσειρά x, x,..., x είναι στάσιµη. Αν δεν είναι στάσιµη µπορούµε να απαλείψουµε πρώτα την τάση και την περιοδικότητα s και µετά να εφαρµόσουµε το µοντέλο AR(p) ή ARMA(p,q) στη σειρά των υπολοίπων y, y,..., y. Αυτό ακριβώς κάνουν τα ολοκληρωµένα αυτοπαλινδροµούµενα µοντέλα (auoregressve egraed movg average models) ARIMA(p,d,q), που εκτιµούνται απευθείας από την αρχική χρονοσειρά. Ένα µοντέλο ARIMA(p,d,q) περιγράφεται ως εξής: εφαρµόζουµε d φορές τον τελεστή πρώτων διαφορών x = x x στην αρχική χρονοσειρά και το µοντέλο ARMA(p,q) στη d χρονοσειρά y = x που προκύπτει από τις d πρώτες διαφορές. Ο βαθµός ολοκλήρωσης d είναι κατά κανόνα µικρός και συνήθως είναι. Το µοντέλο ARIMA(p,d,q) µπορεί να επεκταθεί ώστε να συµπεριλάβει και την περιοδικότητα ή εποχικότητα που µπορεί να έχει η χρονοσειρά..4.5 Πρόβλεψη χρονοσειρών Στην πρόβλεψη χρονοσειρών ξεχωρίζουµε δύο περιπτώσεις: όταν θέλουµε να προβλέψουµε την τάση ή την περιοδικότητα και όταν θέλουµε να προβλέψουµε µε κάποιο µοντέλο αυτοπαλινδρόµησης. Πρόβλεψη τάσης και περιοδικότητας Αν το χαρακτηριστικό της χρονοσειράς που µας ενδιαφέρει να προβλέψουµε είναι η τάση ή η περιοδικότητα, η πρόβλεψη γίνεται µε την εκτίµηση της τάσης ή της περιοδικότητας από µια συνάρτηση του χρόνου, f (). Τότε η πρόβλεψη για T χρονικά βήµατα µπροστά (T me seps ahead predco) είναι xˆ + x ( T) = f( + T). (.3) T µ 0

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α Δημήτρης Κουγιουμτζής e-mail: dkugiu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://users.auth.gr/~dkugiu/teach/civiltrasport/ide.html Στατιστική: Δειγματοληψία

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ B Δημήτρης Κουγιουμτζής e-mal: dkugu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://uer.auth.gr/~dkugu/teach/cvltraport/dex.html Εφαρμοσμένη Στατιστική:

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j όπου x j x i για j i. P i =

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j όπου x j x i για j i. P i = Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Σ αυτό το κεφάλαιο ϑα δούµε πρώτα τρόπους να παρουσιάσουµε τα δεδοµένα µε στατιστικούς πίνακες και διαγράµµατα και µετά να συνοψίσουµε τα δεδοµένα υπολογίζοντας συνοπτικά

Διαβάστε περισσότερα

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ. Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ Στα προηγούµενα κεφάλαια ορίσαµε και µελετήσαµε την τ.µ. µε τη ϐοήθεια της πιθανο- ϑεωρίας (κατανοµή, ϱοπές) και της στατιστικής (εκτίµηση, στατιστική υπόθεση). Σ

Διαβάστε περισσότερα

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j. P i = p j.

Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ. 1.1 Περιγραφή Στατιστικών εδοµένων. p i = f i n. (1.1) F i = f j. P i = p j. Κεφάλαιο 1 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Σ αυτό το κεφάλαιο ϑα δούµε πρώτα τρόπους να παρουσιάσουµε τα δεδοµένα µε στατιστικούς πίνακες και διαγράµµατα και µετά να συνοψίσουµε τα δεδοµένα υπολογίζοντας συνοπτικά

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί) Α. Ερωτήσεις πολλαπλών επιλογών.(11 βαθµοί) (1:3 βαθµοί, 2-9:8 βαθµοί) 1. ίνεται ο πίνακας: Χ

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Κεφάλαιο 3 ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ Σε πολλά προβλήµατα της µηχανικής δεν ενδιαφερόµαστε να εκτιµήσουµε την τιµή της παραµέτρου αλλά να διαπιστώσουµε αν η παραµέτρος είναι µικρότερη ή µεγαλύτερη από

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ ιαφάνειες για το µάθηµα Information Management ΑθανάσιοςΝ. Σταµούλης 1 ΠΗΓΗ Κονδύλης Ε. (1999) Στατιστικές τεχνικές διοίκησης επιχειρήσεων, Interbooks 2 1 Γραµµική παλινδρόµηση Είναι

Διαβάστε περισσότερα

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος Έλεγχοι Υποθέσεων 1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος µ = 100 Κάθε υπόθεση συνοδεύεται από µια εναλλακτική: Ο

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΜΟΝΤΕΛΩΝ ΚΑΙ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝ ΡΟΜΗΣΗΣ 6.1 Εισαγωγή Σε πολλές στατιστικές εφαρµογές συναντάται το πρόβληµα της µελέτης της σχέσης δυο ή περισσότερων τυχαίων µεταβλητών. Η σχέση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

2) Περιγραφή ιακριτών Ποσοτικών εδοµένων

2) Περιγραφή ιακριτών Ποσοτικών εδοµένων ) Περιγραφή ιακριτών Ποσοτικών εδοµένων Για να περιγράψουµε διακριτά ποσοτικά δεδοµένα µε λίγες τιµές ( σε περίπτωση πολλών τιµών τα θεωρούµε ως συνεχή) κάνουµε: Πίνακας συχνοτήτων Ραβδόγραµµα, Κυκλικό

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 9 ο 9.1 ηµιουργία µοντέλων πρόβλεψης 9.2 Απλή Γραµµική Παλινδρόµηση 9.3 Αναλυτικά για το ιάγραµµα ιασποράς

Διαβάστε περισσότερα

Στατιστική ΜΕΡΟΣ Β. για Ηλεκτρολόγους Μηχανικούς. ηµήτρης Κουγιουµτζής http://www.users.auth.gr/dkugiu/teach/electricengineer/

Στατιστική ΜΕΡΟΣ Β. για Ηλεκτρολόγους Μηχανικούς. ηµήτρης Κουγιουµτζής http://www.users.auth.gr/dkugiu/teach/electricengineer/ Στατιστική για Ηλεκτρολόγους Μηχανικούς ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://www.users.auth.gr/dkugiu/teach/electricengineer/ E mail: dkugiu@gen.auth.gr Απρίλιος 2010 2 Στο Μέρος Α ασχοληθήκαµε µε την τυχαία

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή Ανάλυση Συνδιακύµανσης Alsis of Covrice Η ανάλυση συνδιακύµανσης είναι µία άλλη τεχνική για να βελτιώσουµε την ακρίβεια της προσέγγισης του µοντέλου µας στο πείραµα. Ας υποθέσουµε ότι σ ένα πείραµα εκτός

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

Απλή Παλινδρόμηση και Συσχέτιση

Απλή Παλινδρόμηση και Συσχέτιση Απλή Παλινδρόμηση και Συσχέτιση Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός Πωλητών Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) Έτος Πωλήσεις (χιλ ) Διαφήμιση (χιλ ) Πωλητές (Άτομα) 98 050 6 3 989

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ Στα πλαίσια της ΣΤΑΤΙΣΤΙΚΗΣ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑΣ προσπαθούµε να προσεγγίσουµε τα χαρακτηριστικά ενός συνόλου (πληθυσµός) δια της µελέτης των χαρακτηριστικών αυτών επί ενός µικρού

Διαβάστε περισσότερα

Ενδεικτικές ασκήσεις ΔΙΠ 50

Ενδεικτικές ασκήσεις ΔΙΠ 50 Ενδεικτικές ασκήσεις ΔΙΠ 50 Άσκηση 1 (άσκηση 1 1 ης εργασίας 2009-10) Σε ένα ράφι μιας βιβλιοθήκης τοποθετούνται με τυχαία σειρά 11 διαφορετικά βιβλία τεσσάρων θεματικών ενοτήτων. Πιο συγκεκριμένα, υπάρχουν

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5.1 5.8 ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ 5. 5.8 5. Ένας υγειονοµικός σταθµός θέλει να ελέγξει αν ο µέσος αριθµός βακτηριδίων ανά µονάδα όγκου θαλασσινού νερού σε µια παραλία υπερβαίνει το επίπεδο ασφαλείας των 9 µονάδων. ώδεκα

Διαβάστε περισσότερα

Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το

Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το ΜΑΘΗΜΑ 9ο ΣΥΝΟΛΟΚΛΗΡΩΣΗ (Έννοιες, Ορισµοί) Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το πρόβληµα της

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα

Συνοπτικά περιεχόμενα

Συνοπτικά περιεχόμενα b Συνοπτικά περιεχόμενα 1 Τι είναι η στατιστική;... 25 2 Περιγραφικές τεχνικές... 37 3 Επιστήμη και τέχνη των διαγραμματικών παρουσιάσεων... 119 4 Αριθμητικές μέθοδοι της περιγραφικής στατιστικής... 141

Διαβάστε περισσότερα

ν ν = 6. όταν είναι πραγµατικός αριθµός.

ν ν = 6. όταν είναι πραγµατικός αριθµός. Συνάρτηση: ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ λέγεται µια διαδικασία µε την οποία κάθε στοιχείο ενός συνόλου Α αντιστοιχίζεται σε ένα ακριβώς στοιχείο κάποιου άλλου συνόλου Β. Γνησίως αύξουσα: σε ένα διάστηµα του πεδίου

Διαβάστε περισσότερα

στατιστική θεωρεία της δειγµατοληψίας

στατιστική θεωρεία της δειγµατοληψίας στατιστική θεωρεία της δειγµατοληψίας ΕΙΓΜΑΤΟΛΗΨΙΑ : Εισαγωγή δειγµατοληψία Τα στοιχεία που απαιτούνται τόσο για την ανάλυση των µεταφορικών συστηµάτων και όσο και για την ανάπτυξη των συγκοινωνιακών µοντέλων

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΕΝΟΤΗΤΕΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ (One-Way Analyss of Varance) Η ανάλυση

Διαβάστε περισσότερα

Στατιστική Εισαγωγικές Έννοιες

Στατιστική Εισαγωγικές Έννοιες Στατιστική Εισαγωγικές Έννοιες Στατιστική: η επιστήµη που παρέχει µεθόδους και εργαλεία για την οργάνωση, συστηµατική περιγραφή και περιληπτική παρουσίαση δεδοµένων, καθώς και για την ανάλυση της πληροφορίας

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C Επιμέλεια: Κ Μυλωνάκης ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΕΡΩΤΗΣΗ Τι ονομάζεται πραγματική συνάρτηση με πεδίο ορισμού το Α; Έστω Α ένα υποσύνολο του R Ονομάζουμε πραγματική συνάρτηση με πεδίο ορισμού το Α μια διαδικασία

Διαβάστε περισσότερα

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική // (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [] Επιλέξαμε φακελάκια (της μισής ουγκιάς) που περιέχουν σταφίδες από την παραγωγή μιας εταιρείας

Διαβάστε περισσότερα

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis) Μέρος V. Ανάλυση Παλινδρόμηση (Regresso Aalss) Βασικές έννοιες Απλή Γραμμική Παλινδρόμηση Πολλαπλή Παλινδρόμηση Εφαρμοσμένη Στατιστική Μέρος 5 ο - Κ. Μπλέκας () Βασικές έννοιες Έστω τ.μ. Χ,Υ όπου υπάρχει

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Επαναληπτικές Ερωτήσεις για Οικονοµετρία 2

Επαναληπτικές Ερωτήσεις για Οικονοµετρία 2 Επαναληπτικές Ερωτήσεις για Οικονοµετρία 2 Κεφάλαιο 8 1) Τι είναι ετεροσκεδαστικότητα και τι είδους προβλήµατα παρουσιάζονται; ( 2, 4, σελίδες 370-372). 2) Γράψτε τον τύπο της διακύµανσης της κλίσης όταν

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΗΣ ΚΡΗΤΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΗΣ ΚΡΗΤΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΗΣ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ- ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ Εργασία για το σεµινάριο «Στατιστική περιγραφική εφαρµοσµένη στην ψυχοπαιδαγωγική(β06σ03)» ΤΙΤΛΟΣ: «ΜΕΛΕΤΗ ΠΕΡΙΓΡΑΦΙΚΗΣ

Διαβάστε περισσότερα

ΣΥΛΛΟΓΗ ΚΑΙ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΣΤΑΤΙΣΤΙΚΩΝ Ε ΟΜΕΝΩΝ

ΣΥΛΛΟΓΗ ΚΑΙ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΣΤΑΤΙΣΤΙΚΩΝ Ε ΟΜΕΝΩΝ ΤΕΤΑΡΤΟ ΠΑΚΕΤΟ ΣΗΜΕΙΩΣΕΩΝ ΣΥΛΛΟΓΗ ΚΑΙ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΣΤΑΤΙΣΤΙΚΩΝ Ε ΟΜΕΝΩΝ ΓΕΝΙΚΑ Η συλλογή των στατιστικών δεδοµένων αποτελεί σηµαντικό στάδιο κάθε Στατιστικής έρευνας. Απαιτεί ιδιαίτερη προσοχή, διότι,

Διαβάστε περισσότερα

ΒΑΣΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΕΙΡΩΝ ΚΑΝΟΝΙΚΟΤΗΤΑ

ΒΑΣΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΕΙΡΩΝ ΚΑΝΟΝΙΚΟΤΗΤΑ ΒΑΣΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΕΙΡΩΝ ΚΑΝΟΝΙΚΟΤΗΤΑ απόκλιση από την κανονικότητα µπορεί να σηµαίνει Ύπαρξη θετικής ή αρνητικής ασυµµετρίας Ύπαρξη λεπτοκύρτωσης, δηλαδή παρουσία ακραίων τιµών που δεν είναι συµβατές

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 20 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 20 2.1.1 Αβεβαιότητα

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών Εισαγωγή Στα προβλήµατα που έχουµε ασχοληθεί µέχρι τώρα, υποστηρίζουµε ότι έχουµε ένα δείγµα X = (X 1, X 2,...,X n ) F(,θ). π.χ. X 1, X 2,...,X n τ.δ. N(µ,σ 2 ),

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 13 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. 7 ο ΜΑΘΗΜΑ ΚΕΦΑΛΑΙΟ 2 ΣΤΑΤΙΣΤΙΚΗ Σκοπός Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. Προσδοκώμενα αποτελέσματα Όταν θα έχετε ολοκληρώσει τη μελέτη αυτού του κεφαλαίου

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 16. Απλή Γραμμική Παλινδρόμηση και Συσχέτιση ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

ΕΙ Η ΠΑΛΙΝ ΡΟΜΗΣΗΣ. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΛΙΝ ΡΟΜΗΣΗ (Simple Linear Regression) ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ (Regression) ΠΑΛΙΝ ΡΟΜΗΣΗ.

ΕΙ Η ΠΑΛΙΝ ΡΟΜΗΣΗΣ. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΛΙΝ ΡΟΜΗΣΗ (Simple Linear Regression) ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ (Regression) ΠΑΛΙΝ ΡΟΜΗΣΗ. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΛΙΝ ΡΟΜΗΣΗ (Smple Lear Regresso) Να κατανοηθεί η έννοια της παλινδρόµησης Ποιες οι προϋποθέσεις για να εφαρµοσθεί η γραµµική παλινδρόµηση; Τι είναι το γραµµικό µοντέλο και πως εκτιµούνται

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟΥ ΛΑΘΟΥΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ Γ ΓΕΝΙΚΗΣ 1 ΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ 1. Ένα σηµείο Α(χ, ψ) ανήκει στη γραφική παράσταση της f αν f(ψ)=χ. 2. Αν µια συνάρτηση είναι γνησίως αύξουσα σε ένα διάστηµα A,

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς

Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς Ποιοτική & Ποσοτική Ανάλυση εδοµένων Εβδοµάδα 5 η 6 η είκτες Κεντρικής Τάσης και ιασποράς Παιδαγωγικό Τµήµα ηµοτικής Εκπαίδευσης ηµοκρίτειο Πανεπιστήµιο Θράκης Αλεξανδρούπολη, 2014-2015 Εµπειρικές Στατιστικές

Διαβάστε περισσότερα

2. Στοιχεία Πολυδιάστατων Κατανοµών

2. Στοιχεία Πολυδιάστατων Κατανοµών Στοιχεία Πολυδιάστατων Κατανοµών Είναι φανερό ότι έως τώρα η µελέτη µας επικεντρώνεται κάθε φορά σε πιθανότητες που αφορούν µία τυχαία µεταβλητή Σε αρκετές όµως περιπτώσεις ενδιαφερόµαστε να εξετάσουµε

Διαβάστε περισσότερα

Κεϕάλαιο 5 Συσχέτιση και Παλινδρόµηση

Κεϕάλαιο 5 Συσχέτιση και Παλινδρόµηση Κεϕάλαιο 5 Συσχέτιση και Παλινδρόµηση Στο προηγούµενο κεϕάλαιο µελετήσαµε τη διάδοση του σϕάλµατος από µια τυχαία µεταβλητή X σε µια τ.µ. Y που δίνεται ως συνάρτηση της X. Σε αυτό το κεϕάλαιο ϑα διερευνήσουµε

Διαβάστε περισσότερα

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική)

28/11/2016. Στατιστική Ι. 9 η Διάλεξη (Περιγραφική Στατιστική) Στατιστική Ι 9 η Διάλεξη (Περιγραφική Στατιστική) 1 2 Πληθυσμός ή στατιστικός πληθυσμός Ονομάζεται η κατανομή των τιμών μιας τ.μ., δηλαδή η κατανομή των τιμών που παίρνει ένα χαρακτηριστικό μιας ομάδας

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος 75 Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ 1.1. Τυχαία γεγονότα ή ενδεχόμενα 17 1.2. Πειράματα τύχης - Δειγματικός χώρος 18 1.3. Πράξεις με ενδεχόμενα 20 1.3.1. Ενδεχόμενα ασυμβίβαστα

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού

ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού ΣΤΑΤΙΣΤΙΚΗ : Παράσταση Περιγραφή δεδομένων Σύγκριση δεδομένων Εξαγωγή συμπερασμάτων Σχέση αιτίου - αιτιατού Με τις στατιστικές μεθόδους επιδιώκεται αφενός η συνοπτική αλλά εμπεριστατωμένη παρουσίαση των

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων 7.. Η Μέθοδος των Ελαχίστων Τετραγώνων Όπως ήδη αναφέρθηκε, μία ευρύτατα διαδεδομένη μέθοδος για την εκτίμηση των σταθερών α και β είναι η μέθοδος των ελαχίστων τετραγώνων. Η μέθοδος αυτή επιλέγει εκτιμήτριες

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7 ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13 1.1. Εισαγωγή 13 1.2. Μοντέλο ή Υπόδειγμα 13 1.3. Η Ανάλυση Παλινδρόμησης 16 1.4. Το γραμμικό μοντέλο Παλινδρόμησης 17 1.5. Πρακτική χρησιμότητα

Διαβάστε περισσότερα

Περιγραφική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων. της σ 2 είναι επίσης αµερόληπτη. n 1 +n 2

Περιγραφική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων. της σ 2 είναι επίσης αµερόληπτη. n 1 +n 2 4.2. ΑΠΛ Η ΓΡΑΜΜΙΚ Η ΠΑΛΙΝ Ρ ΟΜΗΣΗ 79 ΑΣΚΗΣΕΙΣ Περιγραφική Στατιστική, Εκτίµηση και Ελεγχος Παραµέτρων 1. είξτε ότι η εκτιµήτρια s 2 της διασποράς σ 2 είναι αµερόληπτη. 2. ύο τυχαίες µεταβλητές X 1 και

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40] Εργαστήριο Μαθηματικών & Στατιστικής η Πρόοδος στο Μάθημα Στατιστική 8// (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) ο Θέμα [4] Τα τελευταία χρόνια παρατηρείται συνεχώς αυξανόμενο ενδιαφέρον για τη μελέτη της συγκέντρωσης

Διαβάστε περισσότερα

Λυµένες Ασκήσεις στο Μάθηµα Στατιστικής στο Τµήµα Πολιτικών Μηχανικών

Λυµένες Ασκήσεις στο Μάθηµα Στατιστικής στο Τµήµα Πολιτικών Μηχανικών Στατιστική Λυµένες Ασκήσεις, Πολιτικοί Μηχανικοί Ιανουάριος 6 Λυµένες Ασκήσεις στο Μάθηµα Στατιστικής στο Τµήµα Πολιτικών Μηχανικών Μέρος Α Θεωρία Πιθανοτήτων Άσκηση [Θέµα στις εξετάσεις Φεβρουαρίου ]

Διαβάστε περισσότερα

Kruskal-Wallis H... 176

Kruskal-Wallis H... 176 Περιεχόμενα KΕΦΑΛΑΙΟ 1: Περιγραφή, παρουσίαση και σύνοψη δεδομένων................. 15 1.1 Τύποι μεταβλητών..................................................... 16 1.2 Κλίμακες μέτρησης....................................................

Διαβάστε περισσότερα

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011 Εργαστήριο Μαθηματικών & Στατιστικής Γραπτή Εξέταση Περιόδου Φεβρουαρίου για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 5//. [] Η ποσότητα, έστω Χ, ενός συντηρητικού που περιέχεται σε φιάλες αναψυκτικού

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Στατιστική ανάλυση του γεωχηµικού δείγµατος µας δίνει πληροφορίες για τον γεωχηµικό πληθυσµό που µελετάµε. Συνυπολογισµός σφαλµάτων Πειραµατικά

Διαβάστε περισσότερα

Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος

Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος ΜΑΘΗΜΑ 10 ο Συνολοκλήρωση και μηχανισμός διόρθωσης σφάλματος Η μέθοδος της συνολοκλήρωσης είναι ένας τρόπος με τον οποίο μπορούμε να εκτιμήσουμε τη μακροχρόνια σχέση ισορροπίας που υπάρχει μεταξύ δύο ή

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3 ΜΕΛΕΤΗ ΑΠΟ ΟΣΗΣ ΚΑΙ ΕΠΙΤΥΧΙΑΣ ΗΜΕΡΗΣΙΩΝ ΗΜΟΣΙΩΝ ΚΑΙ Ι ΙΩΤΙΚΩΝ ΛΥΚΕΙΩΝ ΕΙΣΑΓΩΓΗ

ΚΕΦΑΛΑΙΟ 3 ΜΕΛΕΤΗ ΑΠΟ ΟΣΗΣ ΚΑΙ ΕΠΙΤΥΧΙΑΣ ΗΜΕΡΗΣΙΩΝ ΗΜΟΣΙΩΝ ΚΑΙ Ι ΙΩΤΙΚΩΝ ΛΥΚΕΙΩΝ ΕΙΣΑΓΩΓΗ ΚΕΦΑΛΑΙΟ 3 ΜΕΛΕΤΗ ΑΠΟ ΟΣΗΣ ΚΑΙ ΕΠΙΤΥΧΙΑΣ ΗΜΕΡΗΣΙΩΝ ΗΜΟΣΙΩΝ ΚΑΙ Ι ΙΩΤΙΚΩΝ ΛΥΚΕΙΩΝ ΕΙΣΑΓΩΓΗ Στο κεφάλαιο αυτό θα εξετάσουµε την απόδοση και την επιτυχία των υποψηφίων η µερησίων δηµοσίων και ιδιωτικών λυκείων

Διαβάστε περισσότερα

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια) ΠΜΣ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΥΓΕΙΑ, ΙΑΧΕΙΡΙΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΑΠΟΤΙΜΗΣΗ ΑΚ. ΕΤΟΣ 2006-2007, 3ο εξάµηνο ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Απλή γραµµική παλινδρόµηση Παράδειγµα 6: Χρόνος παράδοσης φορτίου ΜΑΘΗΜΑ

Διαβάστε περισσότερα

Ορισµένοι ερευνητές υποστηρίζουν ότι χρειαζόµαστε µίνιµουµ 30 περιπτώσεις για να προβούµε σε κάποιας µορφής ανάλυσης των δεδοµένων.

Ορισµένοι ερευνητές υποστηρίζουν ότι χρειαζόµαστε µίνιµουµ 30 περιπτώσεις για να προβούµε σε κάποιας µορφής ανάλυσης των δεδοµένων. ειγµατοληψία Καθώς δεν είναι εφικτό να παίρνουµε δεδοµένα από ολόκληρο τον πληθυσµό που µας ενδιαφέρει, διαλέγουµε µια µικρότερη οµάδα που θεωρούµε ότι είναι αντιπροσωπευτική ολόκληρου του πληθυσµού. Τέσσερις

Διαβάστε περισσότερα

Χαρακτηριστικά της ανάλυσης διασποράς. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (One-way analysis of variance)

Χαρακτηριστικά της ανάλυσης διασποράς. ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (One-way analysis of variance) ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (Oe-way aalysis of variace) Να γίνει µια εισαγωγή στη µεθοδολογία της ανάλυσης > δειγµάτων Να εφαρµοσθεί και να κατανοηθεί η ανάλυση διασποράς µε ένα παράγοντα. Να κατανοηθεί η χρήση των

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία 4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Παλινδρόμηση Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

1.1.3 t. t = t2 - t1 1.1.4 x2 - x1. x = x2 x1 . . 1

1.1.3 t. t = t2 - t1 1.1.4  x2 - x1. x = x2 x1 . . 1 1 1 o Κεφάλαιο: Ευθύγραµµη Κίνηση Πώς θα µπορούσε να περιγραφεί η κίνηση ενός αγωνιστικού αυτοκινήτου; Πόσο γρήγορα κινείται η µπάλα που κλώτσησε ένας ποδοσφαιριστής; Απαντήσεις σε τέτοια ερωτήµατα δίνει

Διαβάστε περισσότερα

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου

Ποιο από τα δύο τµήµατα είχε καλύτερη επίδοση; επ. Κωνσταντίνος Π. Χρήστου Ένας καθηγητής µαθηµατικών έδωσε σε δύο τµήµατα µιας τάξης του σχολείου του το ίδιο τεστ. Η επίδοση των µαθητών του κάθε τµήµατος (όπως µετρήθηκε µε τη χρήση µιας εικοσαβάθµιας κλίµακας) παρουσιάζεται

Διαβάστε περισσότερα

Κεφάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ. 2.1 Σηµειακή Εκτίµηση. ˆθ παίρνει διαφορετικές τιµές, δηλαδή η ˆθ είναι η ίδια τ.µ. µε κάποια κατανοµή κι έχει µέση

Κεφάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ. 2.1 Σηµειακή Εκτίµηση. ˆθ παίρνει διαφορετικές τιµές, δηλαδή η ˆθ είναι η ίδια τ.µ. µε κάποια κατανοµή κι έχει µέση Κεφάλαιο 2 ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ Οι στατιστικές δείγµατος, όπως η δειγµατική µέση τιµή x και η δειγµατική διασπορά s 2, που ϑα δούµε παρακάτω, υπολογίζονται από τα στατιστικά δεδοµένα που έχουµε συλλέξει

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ 2. Περιγραφική Στατιστική Βασικά είδη στατιστικής ανάλυσης 1. Περιγραφική στατιστική: περιγραφή του συνόλου των δεδοµένων (δείγµατος) 2. Συµπερασµατολογία: Παραγωγή συµπερασµάτων για τα

Διαβάστε περισσότερα

Κεφάλαιο 7 Βασικά Θεωρήµατα του ιαφορικού Λογισµού

Κεφάλαιο 7 Βασικά Θεωρήµατα του ιαφορικού Λογισµού Σελίδα 1 από Κεφάλαιο 7 Βασικά Θεωρήµατα του ιαφορικού Λογισµού Στο κεφάλαιο αυτό θα ασχοληθούµε µε τα βασικά θεωρήµατα του διαφορικού λογισµού καθώς και µε προβλήµατα που µπορούν να επιλυθούν χρησιµοποιώντας

Διαβάστε περισσότερα

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: Κατανοµές ειγµατοληψίας 1.Εισαγωγή Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι: 1. Στατιστικής και 2. Κατανοµής ειγµατοληψίας

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 05 Πολλαπλές συγκρίσεις Στην ανάλυση διακύμανσης ελέγχουμε την ισότητα

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ .Φουσκάκης- Περιγραφική Στατιστική ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Οι µεταβλητές µιας στατιστικής έρευνας αποτελούνται συνήθως από ένα µεγάλο πλήθος στοιχείων που αφορούν τον πληθυσµό που µας ενδιαφέρει. Για να

Διαβάστε περισσότερα

Μάθηµα 1. Κεφάλαιο 1o: Συστήµατα. γ R παριστάνει ευθεία και καλείται γραµµική εξίσωση µε δύο αγνώστους.

Μάθηµα 1. Κεφάλαιο 1o: Συστήµατα. γ R παριστάνει ευθεία και καλείται γραµµική εξίσωση µε δύο αγνώστους. Μάθηµα 1 Κεφάλαιο 1o: Συστήµατα Θεµατικές Ενότητες: A. Συστήµατα Γραµµικών Εξισώσεων B. Συστήµατα 3x3 Α. ΣΥΣΤΗΜΑΤΑ ΓΡΑΜΜΙΚΩΝ ΕΞΙΣΩΣΕΩΝ Ορισµοί Κάθε εξίσωση της µορφής α x+β =γ, µε α, β, γ R παριστάνει

Διαβάστε περισσότερα

Πολύγωνο αθροιστικών σχετικών συχνοτήτων και διάµεσος µιας τυχαίας µεταβλητής ρ. Παναγιώτης Λ. Θεοδωρόπουλος πρώην Σχολικός Σύµβουλος ΠΕ03 e-mail@p-theodoropoulos.gr Πρόλογος Στην εργασία αυτή αναλύονται

Διαβάστε περισσότερα

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου

Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου Για το Θέμα 1 στα Μαθηματικά Γενικής Παιδείας Γ Λυκείου Διαφορικός Λογισμός 1. Ισχύει f (g())) ) f ( = f (g())g () όπου f,g παραγωγίσιµες συναρτήσεις 2. Αν µια συνάρτηση f είναι παραγωγίσιµη σε ένα διάστηµα

Διαβάστε περισσότερα

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange 64 Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrage Ας υποθέσουµε ότι ένας δεδοµένος χώρος θερµαίνεται και η θερµοκρασία στο σηµείο,, Τ, y, z Ας υποθέσουµε ότι ( y z ) αυτού του χώρου δίδεται από

Διαβάστε περισσότερα