ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΕΨΕΩΝ & ΕΛΕΓΧΟΥ ΜΑΘΗΜΑ ΠΡΩΤΟ ΘΕΩΡΙΑΣ-ΕΙΣΑΓΩΓΙΚΟ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ Δρ. Κουνετάς Η Κωνσταντίνος Ακαδημαϊκό Έτος 011-01
Παράμετροι Κεντρικής Τάσης: ο Μέσος Μέσος Αριθμητικός (δεδομένα σε απλή μορφή) Έστω ότι έχουμε παρατηρήσεις x 1, x,, x μιας μεταβλητής X Ο μέσος αριθμητικός δίνεται από τον τύπο x x x... x Χαρακτηριστικά του μέσου αριθμητικού: Υπολογίζεται εύκολα 1 Λαμβάνει υπόψη όλες τις παρατηρήσεις Επηρεάζεται από ακραίες τιμές Έχει «προβλέψιμη συμπεριφορά» 1 x
Διακύμανση (Varace) Διακύμανση σ του πληθυσμού όπου μ ο μέσος του πληθυσμού Αν έχουμε δείγμα μεγέθους, τότε Αν θέλουμε να χρησιμοποιήσουμε το δείγμα για να σ 1 (x 1 μ) (x x) (1) () βγάλουμε συμπεράσματα για τον πληθυσμό τότε η παρακάτω σχέση δίνει καλύτερη εκτίμηση 1 (x x) -1 (3)
Συνδιακύμανση Δύο Μεταβλητών Έστω Χ και Υ δύο μεταβλητές (π.χ. αριθμός διαφημίσεων και πωλήσεις μιας επιχείρησης) 700 Πωλήσεις 600 500 400 300 0 1 3 4 5 6 Αριθμός Διαφημίσεων Η συνδιακύμανση δίνει τη συμμεταβολή δύο μεταβλητών, όταν αυτές συνδέονται γραμμικά Ορισμός συνδιακύμανσης: XY (x x)(y y)
Ερμηνεία Συνδιακύμανσης Αν ρ ΧΥ > 0, τότε όταν η Χ αυξάνεται, η Υ επίσης αυξάνεται και αντίστροφα Αν ρ ΧΥ < 0, τότε όταν η Χ αυξάνεται, η Υ μειώνεται και αντίστροφα Αν ρ ΧΥ = 0, τότε δεν υπάρχει γραμμική σχέση μεταξύ των Χ και Υ Η συνδιακύμανση εξαρτάται από τις μονάδες μέτρησης των μεταβλητών
Συντελεστής Συσχέτισης (Correlato Coeffcet) Ορισμός συντελεστή συσχέτισης όπου ρ XY είναι η συνδιακύμανση των δύο μεταβλητών, δηλαδή Γενικά ισχύει y x XY Y X XY XY r XY (x x)(y y) XY y y x x y x x y r
Ερμηνεία Συντελεστή Συσχέτισης Είναι καθαρός αριθμός Παίρνει τιμές μεταξύ -1 και +1 Όσο πιο κοντά στο μηδέν είναι η τιμή του συντελεστή, τόσο πιο ασθενής η σχέση Τιμές του συντελεστή κοντά στο +1 σημαίνουν ισχυρή θετική συσχέτιση Τιμές του συντελεστή κοντά στο -1 σημαίνουν ισχυρή αρνητική συσχέτιση Προσοχή: Υψηλή τιμή του συντελεστή δε σημαίνει αναγκαστικά και αιτιώδη σχέση
Αναμενόμενη Τιμή Αν Χ είναι μία ασυνεχής (διακριτή) τυχαία μεταβλητή η οποία παίρνει τιμές x με αντίστοιχες πιθανότητας f(x ) (=1,,), τότε η αναμενόμενη τιμή (expected value) της Χ είναι: E(X) 1 Λέγεται και προσδοκώμενη τιμή ή μαθηματική ελπίδα (mathematcal expectato) της Χ x f( x ) (Ουσιαστικά είναι ένας σταθμικός μέσος των τιμών της Χ σταθμισμένων με τις αντίστοιχες πιθανότητές τους) Αν η Χ είναι συνεχής, τότε η αναμενόμενη τιμή της είναι: E(X) x f( x)dx
Διακύμανση Τυχαίας Μεταβλητής Έστω Χ τυχαία μεταβλητή με αναμενόμενη τιμή Ε(Χ)=μ. Η αναμενόμενη τιμή της τυχαίας μεταβλητής λέγεται διακύμανση (varace) της Χ. Αν η Χ είναι διακριτή τότε είναι Αν η Χ είναι συνεχής τότε είναι Αποδεικνύεται ότι var(x) E(X ) E(X) 1 (X μ) var(x) E(Xμ) ( x μ) f( x ) ( var(x) E(Xμ) x μ) f( x)dx
Ιδιότητες Αναμενόμενης Τιμής και Διακύμανσης Αναμενόμενη Τιμή Σταθεράς Ε(α) = α Ε(αΧ)=α Ε(Χ) Ε(αΧ+β)=α Ε(Χ)+β Αν Y=g(X) είναι μία γραμμική συνάρτηση της Χ τότε είναι: E(Y) ge(x) E g(x) Αν η g(x) δεν είναι γραμμική, τότε γενικά E(Y) g E(X) Επίσης είναι var(αχ β) α var(x)
ΚΟΘ & ΚΑΤΑΝΟΜΕΣ ΚΟΘ: Για δείγματα αρκετά μεγάλου μεγέθους η κατανομή των μέσων τιμών δείγματος είναι κατα προσέγγιση κανονική. Άριστη γνώση των συνεχών και διακριτών κατανομών (κυρίως κανονικής,της κατανομής t-tudet, της κατανομής F και της κατανομής.
ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ Η μεθοδολογία του ελέγχου στηρίζεται στην διατύπωση μιας πρότασης σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου και αφετέρου στην επιλογή ενός κριτηρίου, με βάση το οποίο θα αποφασίσουμε για το εάν η υπόθεση που κάνουμε ισχύει ή όχι. Η λέξη στατιστική αναφέρεται σο γεγονός ότι μιλάμε πάντα σε όρους πιθανότηας και υπάρχει το ενδεχόμενο για σφάλμα.
ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ-ΕΙΔΗ ΣΦΑΛΜΑΤΟΣ Δύο είδη σφάλματος μπορούν να προκύψουν απο έναν έλεγχο Σφάλμα τύπου Ι:Απόρριψη της αρχικής υπόθεσης ενώ αυτή είναι σσωστή Σφάλμα τύπου ΙΙ:Απόρριψη της αρχικής υπόθεσης ενώ αυτή δεν είναι σσωστή
ΤΙ ΝΑ ΔΙΑΒΑΣΩ; Στατιστική. Σημειώσεις που βρίσκονται στο e-cla http://ecla.tepat.gr/