Shmei sveic Perigrafik c Statisvtik c E. G. Tsvi ac Ας θεωρήσ ουμε έναν πίνακα αριθμών X ={x 1, x,..., x } (1) Το σ ύνολο αυτό θα μπορούσ ε να αποτελείται από τις αποδόσ εις μιας μετοχής σ ε διαφορετικές ημέρες που σ υμβολίζουμε με τον δείκτη 1,, 3,...,. Θα μπορούσ αμε να γράψουμε τη σ ειρά των αριθμών πιο σ υνοπτικά ως εξής: (x i, i = 1,..., ). Είναι γνωσ τή η έννοια της μέσ ης απόδοσ ης που ορίζεται ως εξής: x = x 1 + x +... + x = x i ή εναλλακτικά x = 1 x i. Από την () προκύπτει ότι: () x i = x (3) Ποια έννοια μπορούμε να αποδώσ ουμε σ τη μέσ η απόδοσ η όπως την ορίσ αμε παραπάνω Στη Βικιπαίδεια διαβάζουμε: Μέσ ος όρος ή αλλιώς δειγματική μέσ η τιμή ενός σ υνόλου ν παρατηρήσ εων αποτελεί το σ πουδαιότερο και χρησ ιμότερο μέτρο της Στατισ τικής και είναι ένα μέτρο θέσ ης, δηλαδή δείχνει σ χετικά τις θέσ εις των αριθμών σ τους οποίους αναφέρεται. Η μέσ η τιμή σ υμμετέχει σ ε αρκετούς τύπους της σ τατισ τικής και εξετάζεται σ ε σ χεδόν όλες τις σ τατισ τικές κατανομές. Γενικά, ορίζεται ως το άθροισ μα των παρατηρήσ εων δια του πλήθους αυτών. Είναι δηλαδή η μαθηματική πράξη ανεύρεσ ης της «μέσ ης απόσ τασ ης» ανάμεσ α σ ε δύο ή περισ σ ότερους αριθμούς. Σχεδόν όλα όσ α αναφέρονται είναι λανθασ μένα λιγότερο ή περισ σ ότερο. Είναι ασ φαλώς σ ωσ τό ότι ορίζεται ως το άθροισ μα των παρατηρήσ εων δια του πλήθους αυτών αλλά δεν είναι σ αφές (α) για ποιον λόγο λέγεται και δειγματική μέσ η τιμή, (β) που υπάρχει η μαθηματική πράξη ανεύρεσ ης της μέσ ης απόσ τασ ης η τι είναι μια απόσ τασ η και πως σ υνδέεται με τον μέσ ο όρο (πράγμα που είναι λάθος) και 1
(γ) με ποιον τρόπο ο μέσ ος όρος δείχνει σ χετικά τις θέσ εις των αριθμών σ τους οποίους αναφέρεται. Ο όρος δειγματική μέσ η τιμή αναφέρεται σ το δείγμα που έχουμε σ τη διάθεσ η μας και δεν είναι παρά το σ ύνολο των αριθμών X. Οι όροι δείγμα η τυχαίο δείγμα δεν έχουν ακόμη νόημα σ τη σ υζήτησ ή μας αν και πρέπει να είναι γνωσ τοί από την καθημερινή ζωή. 1 Skopìc tw perigrafik mètrw. 1.1 Eisvagwgikˆ Σκοπός του μέσ ου όρου δεν είναι παρά να περιγράψει ή να σ υνοψίσ ει το σ ύνολο των αριθμών X. Στη γενική περίπτωσ η το σ ύνολο των αριθμών αποτελείται από μεγάλο αριθμό σ τοιχείων ή παρατηρήσ εων, όπως λέγονται. Για παράδειγμα ένα έτος ημερήσ ιων αποδόσ εων μιας μετοχής θα έχει 50 παρατηρήσ εις. Προφανώς το σ ύνολο αυτό περιέχει όλη την πληροφόρησ η που χρειαζόμασ τε για να μάθουμε σ χετικά με τη σ υμπεριφορά της μετοχής αλλά το πλήθος των παρατηρήσ εων δεν μας επιτρέπει να διαχειρισ θούμε αποτελεσ ματικά αυτή την πληροφόρησ η. Στην περιγραφική σ τατισ τική προσ παθούμε να σ υνοψίσ ουμε την πληροφόρησ η σ ε μερικά σ τατισ τικά μέτρα ένα από τα οποία είναι ο αριθμητικός μέσ ος. Σε σ χέσ η με τις αποδόσ εις των μετοχών από την καθημερινή ζωή είμασ τε εξοικειωμένοι με τις έννοιες της μέσ ης απόδοσ ης και του κινδύνου ή ρίσ κου. Είναι λογικό να υποθέσ ουμε ότι οι έννοιες αυτές αποτελούν θεμελιώδη χαρακτηρισ τικά της ταυτότητας ή σ υμπεριφοράς μιας μετοχής. Αυτά τα θεμελιώδη χαρακτηρισ τικά είναι επίσ ης λογικό να υποθέσ ουμε ότι μπορούν να υπολογισ θούν από την παρατηρούμενη σ υμπεριφορά της μετοχής, δηλαδή τις αποδόσ εις της σ τη διάρκεια μιας ορισ μένης χρονικής περιόδου. Με τον τρόπο αυτό, αν πραγματικά η μέσ η απόδοσ η και ο κίνδυνος χαρακτηρίζουν μια οποιαδήποτε μετοχή τότε οι παρατηρήσ εις για μια σ ειρά μετοχών μπορούν ν αντικατασ ταθούν από τα θεμελιώδη χαρακτηρισ τικά της. Για παράδειγμα αν είχαμε τρεις μετοχές, Α, Β και Γ, και οι παρατηρήσ εις μας ήταν: X A = {α 1, α,..., α }, X B = {β 1, β,..., β }, X Γ = {γ 1, γ,..., γ } θα μπορούσ αμε ν αντικατασ τήσ ουμε τα σ ύνολα των παρατηρήσ εων με µ = {µ A, µ B, µ Γ } για τις μέσ ες αποδόσ εις και σ = {σ A, σ B, σ Γ } για τον κίνδυνο. Αν οι μέσ ες αποδόσ εις και ο κίνδυνος είναι γνωσ τά τότε θα έχουμε επιτύχει ν αντικατασ τήσ ουμε τα σ ύνολα παρατηρήσ εων ή δείγματα X A, X B, X Γ με τα χαρακτηρισ τικά µ και σ. Αν επιπλέον είναι γνωσ τό ότι οι τρεις μετοχές έχουν τον ίδιο κίνδυνο, δηλαδή σ A = σ B = σ Γ, τότε θα αρκούσ αν οι μέσ ες αποδόσ εις µ για να περιγράψουμε ή να σ υνοψίσ ουμε πλήρως την πληροφόρησ η που χρειαζόμασ τε. Για παράδειγμα αν έπρεπε να επιλέξουμε τότε θα επιλέγαμε τη μετοχή που έχει τη μεγαλύτερη μέσ η απόδοσ η.
Για τη μέσ η απόδοσ η ο υπολογισ μός της μπορεί να γίνει με βάσ η τον αριθμητικό μέσ ο µ A 1 α i, µ B 1 β i, µ Γ 1 γ i (4) Στον υπολογισ μό του κινδύνου θα αναφερθούμε αργότερα. Από τις παραπάνω εκφράσ εις είναι σ αφές ότι αν έχουμε μια επιπλέον παρατήρησ η α +1 η τιμή του μέσ ου µ A θα μεταβληθεί. Αν χρησ ιμοποιήσ ουμε την έκφρασ η () θα έχουμε: x +1 = +1 x i = x i + x +1 = x + x +1 + 1 + 1 + 1 (5) όπου x = xi. Η έκφρασ η (5) παρέχει έναν τρόπο υπολογισ μού του μέσ ου όταν προσ τίθεται μια παρατήρησ η χωρίς να είναι υποχρεωτικό να υπολογίσ ουμε τον αριθμητικό μέσ ο όλων των + 1 παρατηρήσ εων απ την αρχή. Στην πραγματικότητα είναι μια αναδρομική έκφρασ η η οποία σ υνδέει τους αριθμητικούς μέσ ους x +1 και x. Ωσ τόσ ο το ερώτημα είναι πως μπορούμε να δικαιολογήσ ουμε το γεγονός ότι τα θεμελιώδη χαρακτηρισ τικά, όπως η μέσ η απόδοσ η, είναι δυνατόν να μεταβάλλονται όταν απλώς προσ τίθεται μια παρατήρησ η. Αν πραγματικά είναι θεμελιώδη τότε δεν θα έπρεπε να μεταβάλλονται. Αυτός είναι ο λόγος για τον οποίο χρησ ιμοποιήσ αμε το σ ύμβολο της ισ ότητας κατά προσ έγγισ η σ την (4). Για μια μετοχή η θεμελιώδης μέσ η της απόδοσ η θα είναι µ ενώ η δειγματική μέσ η απόδοσ η θα είναι ο αριθμητικός μέσ ος x. Η διάκρισ η μπορεί να φαίνεται τεχνητή αλλά σ την πραγματικότητα δεν είναι. Για παράδειγμα ας υποθέσ ουμε ότι σ τον πληθυσ μό το άγνωσ το ποσ οσ τό που έχει κάποιο πολιτικό κόμμα αν γίνονταν σ ήμερα εκλογές είναι µ. Αν λάβουμε ένα τυχαίο δείγμα μεγέθους = 1000 ατόμων καταγράφουμε τις απαντήσ εις: x i = 1 αν το άτομο i προτίθεται να ψηφίσ ει το κόμμα αυτό και 0 διαφορετικά. Είναι φανερό ότι το ποσ οσ τό του κόμματος σ το σ υγκεκριμένο δείγμα είναι x = xi, για παράδειγμα 0,5 δηλαδή 5,%. Αν λάβουμε ένα τυχαίο δείγμα του ίδιου μεγέθους η απάντησ η δεν μπορεί παρά να είναι διαφορετική, πχ 5,1% ή 5,8% σ ε κάποιο τρίτο τυχαίο δείγμα. Αυτό δεν σ ημαίνει ότι μεταβάλλεται το θεμελιώδες χαρακτηρισ τικό µ αλλά απλώς ότι ο αριθμητικός μέσ ος αναπόφευκτα μεταβάλλεται όταν λαμβάνουμε διαφορετικά τυχαία δείγματα. Το ίδιο σ υμβαίνει με τα λεγόμενα exit polls. Το εκλογικό αποτέλεσ μα µ έχει ήδη διαμορφωθεί αλλά οι απαντήσ εις x από διαφορετικά τυχαία δείγματα θα είναι διαφορετικές. Οπως λέμε, ο αριθμητικός μέσ ος υπόκειται σ τις κυμάνσ εις της τυχαίας δειγματοληψίας. Δεν είναι ακόμη δυνατόν να ορίσ ουμε αυσ τηρά την έννοια του πληθυσ μού, της τυχαίας δειγματοληψίας, του δείγματος και του τυχαίου δείγματος εφόσ ον απαιτείται θεωρία πιθανοτήτων. Ωσ τόσ ο η έννοια δεν πρέπει να είναι τελείως άγνωσ τη από την καθημερινή ζωή. Για τους σ κοπούς μας πληθυσ μός είναι ολόκληρο το εκλογικό σ ώμα και τυχαίο δείγμα είναι ένα υποσ ύνολο του πληθυσ μού που έχει ληφθεί με τυχαίο τρόπο, δηλαδή χωρίς κάποια σ υσ τηματικότητα σ την επιλογή 3
των ατόμων (σ υγκεκριμένα η επιλογή ενός ατόμου δεν εξαρτάται καθόλου από το αν έχει ή όχι επιλεγεί κάποιο άλλο). Ο σ υγκεκριμένος τρόπος να κατανοήσ ουμε τον πληθυσ μό μπορεί να φαίνεται πολύ γενικός ή ακόμα και σ ωσ τός αλλά σ την πραγματικότητα δεν είναι. Αν έ- χουμε για παράδειγμα σ τη διάθεσ η μας τις παρατηρήσ εις X = {x 1, x,..., x } των αποδόσ εων μιας μετοχής για ημέρες τότε ποιος είναι ο πληθυσ μός και το δείγμα Στην περίπτωσ η αυτή φαίνεται πως το δείγμα είναι και ολόκληρος ο πληθυσ μός! Μια τέτοια θεώρησ η των πραγμάτων προφανώς δεν μπορεί να είναι σ ωσ τή. Αυτό φαίνεται από την εξής παρατήρησ η: Αν η μέσ η απόδοσ η της μετοχής, µ, παραμένει αμετάβλητη διαχρονικά αλλά έχουμε μια επιπλέον παρατήρησ η όπως σ την (5) ο αριθμητικός μέσ ος x +1 φυσ ικά θα διαφέρει από τον x αλλά η πραγματική ή θεμελιώδης μέσ η απόδοσ η µ παραμένει αμετάβλητη. Ο τρόπος με τον οποίο μπορούμε να σ υμβιβάσ ουμε αυτές τις παρατηρήσ εις μεταξύ τους παρέχεται από τη θεωρία της δειγματοληψίας που θα μας απασ χολήσ ει μετά τη θεωρία πιθανοτήτων. Στο σ τάδιο αυτό μας αρκεί να παρατηρήσ ουμε ότι ο αριθμητικός μέσ ος φαίνεται ν αποτελεί ένα φυσ ικό μέτρο προσ έγγισ ης της άγνωσ της θεμελιώδους μέσ ης απόδοσ ης όπως σ την (4). Αν μη τι άλλο οπωσ δήποτε αποτελεί ένα λογικό μέτρο θέσ ης όπως λέμε. Τα σ τατισ τικά μέτρα θέσ ης έχουν σ αν σ κοπό τους να μας δώσ ουν μια εικόνα σ χετικά με την πιο αντιπροσ ωπευτική τιμή των παρατηρήσ εων X = {x 1, x,..., x } ή τη θέσ η σ την οποία αναμένουμε να βρίσ κονται οι περισ σ ότερες παρατηρήσ εις. Με την έννοια αυτή ο αριθμητικός μέσ ος δεν είναι πολύ διαφορετικός από το κέντρο βάρους. Ενα άλλο μέτρο θέσ ης είναι η διάμεσ ος. Αν έχουμε τις παρατηρήσ εις X = {x 1, x,..., x } μπορούμε να τις διατάξουμε σ ε αύξουσ α σ ειρά, έσ τω x (1) x ()... x (). Η διάμεσ ος θα είναι η κεντρική παρατήρησ η αν το ν είναι περιττός και = x ( +1 ) (6) x ( = ) + x ( +1) (7) αν το ν είναι άρτιος. Στη σ χέσ η (6) η κεντρική παρατήρησ η μπορεί να βρεθεί ακριβώς. Στην (7) αυτό δεν είναι δυνατόν και επομένως παίρνουμε τον μέσ ον όρο των παρατηρήσ εων που θα περιλάμβαναν την κεντρική παρατήρησ η. Για παράδειγμα έσ τω ότι έχουμε παρατηρήσ εις X = {4, 3,, 1}. Ο αριθμητικός μέσ ος είναι,5. Οι διατεταγμένες παρατηρήσ εις είναι {1,, 3, 4}, δηλαδή x (1) = 1, x () =, x (3) = 3, x (4) = 4. Εφόσ ον = 4 η διάμεσ ος είναι = x () + x (3) =, 5. Αυτό το αποτέλεσ μα δεν είναι γενικό εφόσ ον ο μέσ ος και η διάμεσ ος δεν σ υμπίπτουν σ τη γενική περίπτωσ η. Για τις παρατηρήσ εις X = {1,, 3, 994} η διάμεσ ος παραμένει αμετάβλητη αλλά ο μέσ ος είναι 50. Από το παράδειγμα αυτό φαίνεται ότι η διάμεσ ος εξαρτάται μόνο από τις δυο κεντρικές παρατηρήσ εις χωρίς να επηρεάζεται από τις ακραίες τιμές σ τα δεδομένα. Η τιμή 994 είναι προφανώς ακραία σ ε σ χέσ η με τις υπόλοιπες, πράγμα που επηρεάζει αρκετά τον μέσ ο αλλά όχι τη διάμεσ ο. Ο γεωμετρικός μέσ ος ορίζεται ως εξής: 4
G = (x 1 x...x ) 1/ (8) Ο λόγος για την ύπαρξη αυτής της έκφρασ ης γίνεται σ αφής αν λάβουμε λογαρίθμους: lg = lx i (9) Από την έκφρασ η αυτή βλέπουμε ότι ο λογάριθμος του γεωμετρικού μέσ ου είναι ο απλός μέσ ος των λογαρίθμων των δεδομένων μας. Ο λόγος για τον οποίο χρησ ιμοποιούμε λογαρίθμους είναι ότι ο μετασ χηματισ μός αυτός κάνει την κλίμακα των δεδομένων πιο ομοιόμορφη. Για παράδειγμα σ τις παρατηρήσ εις X = {1,, 3, 994} έχουμε G = 8, 79 που αποτελεί μια πιο λογική απάντησ η σ ε σ χέσ η με τον αριθμητικό μέσ ο. Ο αρμονικός μέσ ος είναι: H = 1 x i = 1 x 1 + 1 x +... + 1 (10) x Στο παράδειγμά μας ο αρμονικός μέσ ος είναι,181 περίπου. Από την (10) έχουμε: 1 H = 1 1 = 1 x i ȳ με τη σ ύμβασ η ȳ = yi, y i = 1 x i, i = 1,..,. Αν έχουμε δυο παρατηρήσ εις X = {x 1, x } τότε οι τρεις μέσ οι είναι: x = x1+x, G = x 1 x και H = x1x x 1+x = G x. (11) Από τη σ χέσ η αυτή βλέπουμε ότι G = H x, δηλαδή ο γεωμετρικός μέσ ος των δυο παρατηρήσ εων είναι ο γεωμετρικός μέσ ος των δυο άλλων μέσ ων. Ας υποθέσ ουμε ότι έχουμε τις παρατηρήσ εις X = {x 1, x,..., x } και θεωρούμε τον γραμμικό μετασ χηματισ μό: Αν αθροίσ ουμε τις παραπάνω εξισ ώσ εις έχουμε: y i = α + βx i, i = 1,..., (1) y 1 +... + y = (α +... + α) + β(x 1 +... + x ) y i = α + β x i. Διαιρώντας κατά μέλη με έχουμε: ȳ = α + β x (13) Επομένως ο γραμμικός μετασ χηματισ μός τροποποιεί τον αριθμητικό μέσ ο κατά τον προφανή τρόπο. 5
1. Exagwg tou arijmhtikoô mèsvou Ας υποθέσ ουμε σ τη σ υνέχεια ότι ορίζουμε την αντιπροσ ωπευτική τιμή των δεδομένων X = {x 1, x,..., x } ως εκείνη την τιμή, έσ τω A, η οποία βρίσ κεται πλησ ιέσ τερα προς όλες τις παρατηρήσ εις. Θα πρέπει φυσ ικά να εξειδικεύσ ουμε μια έννοια απόσ τασ ης. Δυο τέτοιες επιλογές είναι: και Q(Α) = x i A (14) S(Α) = (x i A) (15) Για να ελαχισ τοποιήσ ουμε την (15) λαμβάνουμε την πρώτη παράγωγο και έχουμε: S (A) = d { (x1 A) + (x A) +... + (x A) } = da Θέτοντας την πρώτη παράγωγο ίσ η με το μηδέν προκύπτει (x i A) (16) (x i A) = 0 x i A = 0 A = x i = x (17) Επομένως αν θεωρήσ ουμε σ αν έννοια απόσ τασ ης την (15) η αντιπροσ ωπευτική τιμή σ ε κάθε σ ύνολο παρατηρήσ εων θα πρέπει να είναι ο αριθμητικός μέσ ος. Από την (17) προκύπτει απευθείας η ακόλουθη σ ημαντική ιδιότητα: (x i x) = 0 (18) δηλαδή το άθροισ μα των αποκλίσ εων από τον μέσ ο είναι πάντα μηδέν. Η ιδιότητα αυτή προκύπτει κατευθείαν από τη σ υνθήκη πρώτης τάξης (17). Από την (16) η δεύτερη παράγωγος είναι S (A) = { d da } (x i A) { = d da } x i + A = > 0, A R (19) 6
και επομένως σ το σ ημείο A = x η (15) θα έχει ολικό ελάχισ το 1. Αν η έννοια της απόσ τασ ης που υιοθετούμε είναι η (14) τότε το πρόβλημα είναι: mi (A) : Q(A) = x i A (0) Εφόσ ον η αντικειμενική σ υνάρτησ η δεν είναι παραγωγίσ ιμη για A = x i (για κάποιο i = 1,..., ) δεν μπορούμε να πάρουμε παραγώγους. Για να προσ διορίσ ουμε τη λύσ η του προβλήματος έσ τω ότι έχουμε δυο παρατηρήσ εις οπότε η (0) είναι Q(A) = x 1 A + x A. Χωρίς βλάβη της γενικότητας έσ τω x 1 < x. Κατ αρχήν δεν είναι δυνατόν να έχουμε A > x > x 1. Στην περίπτωσ η αυτή θα είχαμε S(A) = A x 1 x και το ελάχισ το της (0) θα ήταν σ το A =. Παρόμοια δεν είναι δυνατόν να έχουμε A < x 1 < x. Στην περίπτωσ η αυτή θα είχαμε Q(A) = x 1 + x A και το ελάχισ το της (0) θα ήταν σ το A = +. Επομένως σ τη λύσ η του προβλήματος έχουμε A (x 1, x ) και επομένως: S(A) = x x 1. Εφόσ ον η τιμή της σ υνάρτησ ης δεν μεταβάλλεται με την τιμή του Α σ το διάσ τημα A (x 1, x ) κάθε τιμή σ το διάσ τημα αυτό αποτελεί λύσ η του προβλήματος και σ υμβατικά μπορούμε να θέσ ουμε A = x1+x. Στη γενική περίπτωσ η που έχουμε παρατηρήσ εις X = {x 1,..., x } η αντικειμενική σ υνάρτησ η (0) γίνεται: Q(A) = x 1 A + x A +... + x A. Χωρίς βλάβη της γενικότητας έσ τω x 1 < x <... < x. Θα υπάρχει ένας δείκτης ν {,..., 1} τέτοιος ώσ τε: x 1 < x <... < x ν A και A x ν+1 > x ν+ >... > x. Επομένως η λύσ η A θα είναι οποιοσ δήποτε αριθμός σ το διάσ τημα [x ν, x ν+1 ] και σ υμβατικά μπορούμε να θέσ ουμε A = xν+xν+1. Από την απόδειξη είναι σ αφές ότι η λύσ η του προβλήματος δεν είναι παρά η διάμεσ ος. 1.3 Diasvporˆ Από την κατασ κευή των προβλημάτων (14) και (15) είναι σ αφές ότι δεν έχουμε μόνο τη λύσ η A αλλά και ένα μέτρου του κατά πόσ ο μια σ υγκεκριμένη λύσ η είναι καλή. Αυτό το μέτρο δεν είναι παρά η τιμή της αντικειμενικής σ υνάρτησ ης. Αν σ υμφωνήσ ουμε ότι και q = 1 x i (1) s = 1 (x i x) () 1 Na dikaiologhjeð sva ˆsvkhsvh. 7
τότε οι (1) και () είναι μη αρνητικές, είναι μηδέν μόνο αν όλες οι παρατηρήσ εις είναι ίσ ες μεταξύ τους και όσ ο περισ σ ότερο αποκλίνουν οι παρατηρήσ εις από τη διάμεσ ο σ την (1) ή τον μέσ ο σ την () τόσ ο περισ σ ότερο η τιμή τους αυξάνεται. Αλλά όσ ο αυξάνεται η τιμή των q και s τόσ ο περισ σ ότερο αυξάνεται η απόσ τασ η των παρατηρήσ εων από το αντιπροσ ωπευτικό μέσ ο θέσ ης. Επομένως η τιμή των q και s σ χετίζεται άμεσ α με τη διασ πορά των δεδομένων από τη διάμεσ ο ή τον μέσ ο και λέγονται μέτρα διασ ποράς. Οι (1) και () αποτελούν μερικές περιπτώσ εις του μέτρου L p = ( 1 ) 1/p x i θ p (3) όπου θ είναι ένα μέτρο θέσ ης και p > 0. Για p = 1 έχουμε την (1) ενώ για p = προκύπτει το s σ την (). Μπορεί να αποδειχθεί ότι: L = max : x i θ (4),..., δηλαδή L = max{ x 1 θ, x θ,..., x θ }, η μέγισ τη απόσ τασ η από το μέτρο θέσ ης. Το μέτρο q είναι γνωσ τό σ αν απόλυτη απόκλισ η. Το μέτρο s λέγεται διακύμανσ η ενώ η (θετική) τετραγωνική του ρίζα s είναι γνωσ τή σ αν τυπική απόκλισ η. Ο δειγματικός μέσ ος x και η δειγματική τυπική απόκλισ η ή η διακύμανσ η είναι τα πιο γνωσ τά μέτρα θέσ ης και διασ ποράς αντίσ τοιχα. Υπολογίζονται αυτόματα από τα σ τατισ τικά προγράμματα και όλα τα προγράμματα φύλλων εργασ ίας όπως το Excel. 1.4 Idiìthtec thc diakômasvhc Από την () το άθροισ μα των τετραγώνων μπορεί να αναλυθεί ως εξής: S = (x i x) ( = x i + x ) xx i Αθροίζοντας τους επιμέρους όρους έχουμε: (5) ( S = x i + x ) xx i = x i + x x = x i x (6) σ την οποία έχουμε χρησ ιμοποιήσ ει την (3). Από την (6) και την () έχουμε: s = S = x i x (7) 8
Από την (7) προκύπτει ότι μπορούμε να υπολογίσ ουμε τη διακύμανσ η χωρίς να πάρουμε διαφορές από τον μέσ ο όπως σ την () αλλά υπολογίζοντας μόνο το άθροισ μα των τετραγώνων των αρχικών δεδομένων. Ας θεωρήσ ουμε τα δεδομένα X = {1,, 3} σ τα οποία έχουμε x = και s = 14 3 και s =, 16. Αν ωσ τόσ ο αντικατασ τήσ ουμε το με 1 σ την (7) τότε θα είχαμε s = 1. Η δεύτερη απάντησ η φαίνεται πιο ικανοποιητική εφόσ ον η απόκλισ η των παρατηρήσ εων 1 και 3 από τον μέσ ο είναι 1. Συχνά λοιπόν ορίζουμε: s = (x i x) = x i x 1 1 (8) Από την () είναι σ αφές ότι η διακύμανσ η δεν είναι παρά ο αριθμητικός μέσ ος των (x i x), i = 1,...,. Φαινομενικά το πλήθος των παρατηρήσ εων είναι αλλά σ την πραγματικότητα αν γνωρίζουμε τις 1 παρατηρήσ εις τότε η επόμενη μπορεί πάντα να προσ διορισ θεί με βάσ η την (18). Πραγματικά από την (18) έχουμε: (x i x) = 0 1 x i = x x = x x i (9) Επομένως η τελευταία παρατήρησ η είναι πάντα δεσ μευμένη αν γνωρίζουμε τις 1 παρατηρήσ εις και τον γενικό μέσ ο. Κατά σ υνέπεια μόνον 1 παρατηρήσ εις είναι ανεξάρτητες ή ελεύθερες. Η διόρθωσ η με ν = 1 (30) είναι γνωσ τή σ αν διόρθωσ η με τους λεγόμενους βαθμούς ελευθερίας. Αν οι παρατηρήσ εις υποσ τούν έναν γραμμικό μετασ χηματισ μό όπως σ την (1) τότε θα έχουμε: (y i ȳ) = (α + βx i α β x) = {β (x i x)} = β (x i x) Διαιρώντας κατά μέλη με 1 έχουμε: (31) από την οποία προκύπτει επίσ ης ότι: s y = β s x (3) s y = β s x (33) 9
Από τις σ χέσ εις (13) και (33) προκύπτει ότι ο δειγματικός μέσ ος και η δειγματική διακύμανσ η τροποποιούνται όταν τα δεδομένα υπόκεινται σ έναν γραμμικό μετασ χηματισ μό. Ο πολλαπλασ ιασ μός με β αλλάζει τις μονάδες μέτρησ ης (όπως όταν αλλάζουμε το νόμισ μα από ευρώ σ ε δολάρια) ενώ η πρόσ θεσ η της σ ταθεράς α γίνεται όταν πχ αλλάζουμε τις μονάδες μέτρησ ης της θερμοκρασ ίας από Κελσ ίου σ ε Φαρενάϊτ. Αν υποθέσ ουμε ότι α = 0 και β > 0 σ την (13) τότε ο μέσ ος και η διακύμανσ η ενώ αλλάζουν έχουμε: s ȳ y = βs x β x = s x x (34) όπου s x = (xi x) 1 και s y = (yi ȳ) 1 C = s x x. Το σ τατισ τικό μέτρο (35) λέγεται σ υντελεσ τής μεταβλητότητας και όπως δείξαμε σ την (34) δεν εξαρτάται από αλλαγές σ τις μονάδες μέτρησ ης ή από μεταβολές της κλίμακας. Φυσ ικά δεν ορίζεται για x = 0. Η σ χέσ η (34) είναι χρήσ ιμη όταν πρέπει να σ υγκρίνουμε τη διασ πορά σ ε δυο διαφορετικά σ ύνολα δεδομένων τα οποία είναι εκφρασ μένα σ ε διαφορετικές μονάδες, πχ ευρώ και δολάρια. Μια λύσ η είναι ασ φαλώς πρώτα να εκφράσ ουμε τα δεδομένα σ τις ίδιες μονάδες και μετά να υπολογίσ ουμε την τυπική απόκλισ η ή τη διακύμανσ η ώσ τε να είναι σ υγκρίσ ιμες. Η λύσ η αυτή έχει τα προβλήματά της σ ε ορισ μένες περιπτώσ εις. Για παράδειγμα ας υποθέσ ουμε ότι έχουμε τις αποδόσ εις δυο μετοχών Α και Β με x A = x B = 0, 07 (επομένως έχουν μέσ η ημερήσ ια απόδοσ η 7%) και s A = 0, 10, s B = 0, 0. Ενώ οι δυο μετοχές είναι σ τις ίδιες μονάδες (% αποδόσ εις) και η μέσ η απόδοσ η είναι η ίδια, η διακύμανσ η της μετοχής Β είναι πολύ μεγαλύτερη. Αυτό σ ημαίνει ότι οι αποδόσ εις της μετοχής Α θα τείνουν να κινούνται πλησ ιέσ τερα προς τον μέσ ο τους (δηλαδή x A ) και ε- πομένως η μέσ η απόδοσ η 7% σ χετίζεται με μικρότερο κίνδυνο. Οι σ υντελεσ τές μεταβλητότητας είναι 0,7 και 0,35 αντίσ τοιχα από τους οποίους είναι φανερό ότι η μετοχή Α έχει μεγαλύτερο κίνδυνο. Η σ υζήτησ η αυτή μας οδηγεί με φυσ ικό τρόπο σ το να θεωρήσ ουμε την τυπική απόκλισ η ή τη διακύμανσ η σ αν μέτρο κινδύνου των χρηματοοικονομικών αποδόσ εων γενικά. Το μέτρο αυτό χρησ ιμοποιείται ευρύτατα αν και δεν υπάρχει λόγος για τον οποίο η μέσ η απόλυτη απόκλισ η σ την (1) να μην μπορεί επίσ ης να θεωρηθεί σ αν σ τατισ τικό μέτρο του κινδύνου. Στην πραγματικότητα αν η διάμεσ ος μπορεί να θεωρηθεί ως καλύτερο μέτρο θέσ ης τότε από τη διαδικασ ία με την οποία οδηγηθήκαμε σ την (1) το καλύτερο μέτρο διασ ποράς θα είναι η μέσ η απόλυτη απόκλισ η. 1.5 Isvtìgramma Το ισ τόγραμμα αποτελεί τον καλύτερο τρόπο να περιγράψουμε διαγραμματικά έ- να σ ύνολο δεδομένων αντί να περιορισ θούμε αποκλεισ τικά σ τα μέτρα θέσ ης και 10
διασ ποράς. Για ένα σ ύνολο δεδομένων X = {x 1, x,..., x } ας υποθέσ ουμε ότι η ε- λάχισ τη και μέγισ τη τιμή είναι α και β και αποφασ ίζουμε να χωρίσ ουμε το διάσ τημα [a, b] σ ε K + 1 < κατηγορίες. Επομένως θα έχουμε τα υποδιασ τήματα: [a, c 1 ), [c 1, c ),..., (c K, b]. Αν έχουμε k παρατηρήσ εις σ ε κάθε υποδιάσ τημα (k = 1,..., K και K k=1 k = ) και το μέσ ο του κάθε υποδιασ τήματος είναι m k, το ισ τόγραμμα είναι η γραφική παράσ τασ η (m k, k ). Οι ποσ ότητες f k = k, k = 1,..., K (36) λέγονται σ χετικές σ υχνότητες. Τα k είναι γνωσ τά σ αν σ υχνότητες. Προφανώς έχουμε Διάγραμμα 1. 3000 K f k 0, f k = 1 (37) k=1 500 000 1500 1000 500 0 4 3 1 0 1 3 4 5 Στο παραπάνω σ χήμα βλέπουμε ένα ισ τόγραμμα με 10 υποδιασ τήματα ενός δείγματος μεγέθους 10.000. Η καμπύλη σ υνδέει τα σ ημεία (m k, k ) ενώ το κάθε ορθογώνιο αντισ τοιχεί σ τα υποδιασ τήματα που έχουμε κατασ κευάσ ει. Στο Διάγραμμα παρισ τάνονται τα ισ τογράμματα των αποδόσ εων για μια ομολογία και μια μετοχή. 11
Διάγραμμα. Το ισ τόγραμμα μας παρέχει μια σ αφή εικόνα σ χετικά με (α) τα μέτρα θέσ ης και διασ ποράς, και (β) τις ακραίες αποδόσ εις. Σε πολλές περιπτώσ εις τα μέτρα θέσ ης και διασ ποράς ενδέχεται να είναι παραπλανητικά όπως σ το Διάγραμμα 3. Διάγραμμα 3. 500 000 1500 1000 500 0 4 0 4 6 8 10 1 14 Ο μέσ ος (,95) και η διάμεσ ος (0,56) σ την περίπτωσ η αυτή δεν σ υνοψίζουν τα δεδομένα με ορθό τρόπο. Ενα κλασ σ ικό παράδειγμα που οδηγεί σ ε ισ τογράμματα όπως αυτά σ το Διάγραμμα 3 είναι όταν αναμιγνύονται διαφορετικοί ή ετερογενείς πληθυσ μοί, πχ οι σ τρεμματικές αποδόσ εις ορεινών και πεδινών αγροκτημάτων. Ενα ακόμη παράδειγμα, αυτή τη φορά με βάσ η ημερήσ ια σ τοιχεία του δείκτη Dow Joes (/11/1998-18/5/01) φαίνεται σ το Διάγραμμα 4. 1
Διάγραμμα 4. 0.15 0.1 0.05 0 0.05 0.1 0 500 1000 1500 000 500 3000 3500 4000 800 600 400 00 0 0.1 0.05 0 0.05 0.1 0.15 Ερωτήσ εις. 1. Στο Διάγραμμα 4 ποια είναι προσ εγγισ τικά τα μέτρα θέσ ης και διασ ποράς. Ποιο είναι το εύρος σ το οποίο κινήθηκαν οι αποδόσ εις του δείκτη Ας θεωρήσ ουμε και πάλι το Διάγραμμα 1. Ας σ υμβολίσ ουμε: k = #{i : c k 1 x i < c k }, k = 1,..., K + 1 (38) όπου #A δηλώνει τον αριθμό των σ τοιχείων του σ υνόλου A, c 0 = a, c K+1 = b. Η έννοια της (37) είναι ότι k είναι ο αριθμός των παρατηρήσ εων που βρίσ κονται σ το υποδιάσ τημα I k = [c k 1, c k ), k = 1,,..., K + 1. Με διαφορετικό σ υμβολισ μό k = #{i : x i I k }, k = 1,..., K + 1 (39) Το κάθε υποδιάσ τημα έχει το ίδιο μήκος δ = c 1 a = c c 1 =... = c K+1 c K. Εφόσ ον κάθε υποδιάσ τημα έχει σ αν κεντρικό του σ ημείο το m k = c k 1+c k είναι σ αφές από το Διάγραμμα 1 ότι η σ υνεχής καμπύλη που σ υνδέει τα σ ημεία (m k, k ), k = 1,..., K + 1 μπορεί να θεωρηθεί ως εναλλακτικός τρόπος παρουσ ίασ ης του ισ τογράμματος. Με βάσ η το ισ τόγραμμα είναι εύκολο να ορίσ ουμε ένα άλλο μέτρο θέσ ης γνωσ τό σ αν τύπο. Ο τύπος είναι η τιμή εκείνη που εμφανίζεται πιο σ υχνά. Αν υποτεθεί ότι η μέγισ τη τιμή των σ υχνοτήτων είναι ν (για κάποιο ν = 1,..., K +1) τότε ο τύπος δεν είναι παρά m ν. 13
Omadopoihmèa dedomèa Η παράθεσ η των δεδομένων με τη μορφή ισ τογράμματος κάνει αντιληπτό ότι σ την πραγματικότητα έχουμε ομαδοποιήσ ει τα δεδομένα σ ε K 1 κατηγορίες που αντισ τοιχούν σ τα υποδιασ τήματα. Αν υποθέσ ουμε ότι έχουμε μόνο τα ομαδοποιημένα δεδομένα {(m k, f k ), k = 1,..., K} ή ότι τα ομαδοποιημένα δεδομένα μπορούν να υποκατασ τήσ ουν τα αρχικά, τότε η ερμηνεία των ομαδοποιημένων δεδομένων είναι απλή. Συγκεκριμένα, η παρατήρησ η m k λαμβάνει σ πουδαιότητα ή σ ημασ ία που δίνεται από τη σ χετική της σ υχνότητα, f k. Η παρατήρησ η m k μπορεί να μην εμφανίζεται καν σ τα αρχικά δεδομένα αλλά μπορεί να θεωρηθεί σ αν η αντιπροσ ωπευτική παρατήρησ η εκείνων που ανήκουν σ το σ υγκεκριμένο υποδιάσ τημα. Ας θεωρήσ ουμε τις εκφράσ εις: s = x = K m k f k (40) k=1 K (m k x) f k (41) k=1 Οι εκφράσ εις αυτές μπορούν να θεωρηθούν ως προσ εγγίσ εις του αριθμητικού μέσ ου και της διακύμανσ ης όταν έχουμε ομαδοποιημένα σ τοιχεία. Η παράσ τασ η (40) είναι ένας σ ταθμικός μέσ ος των κεντρικών σ ημείων m k με σ ταθμίσ εις τις σ χετικές σ υχνότητες. Αντίσ τοιχα η παράσ τασ η (41) είναι ένας σ ταθμικός μέσ ος των τετραγωνισ μένων αποκλίσ εων των κεντρικών σ ημείων από τον μέσ ο. Είναι προφανές ότι μεγαλύτερη βαρύτητα δίνεται σ ε εκείνα τα κεντρικά σ ημεία τα οποία σ χετίζονται με τις μεγαλύτερες σ χετικές σ υχνότητες, όπως άλλωσ τε θα έπρεπε. Μπορούμε να δείξουμε ότι: K f k (m k x) = 0 (4) k=1 s = K f k m k x (43) k=1 Οι ιδιότητες αυτές είναι ανάλογες με τις σ χέσ εις (18) και (6). Αξίζει να παρατηρήσ ουμε ότι αν f 1 = f =... = f K τότε αναγκασ τικά θα έχουμε f 1 = f =... = f K = 1 και επομένως οι σ χέσ εις (4) και (43) καταλήγουν σ τις (18) και (6) ενώ οι ορισ μοί (40) και (41) καταλήγουν σ τους () και (). Ας υιοθετήσ ουμε τον σ υμβολισ μό: E (X) p i x i (44) EÐai gwsvtì ìti a èqoume parathr sveic o bèltisvtoc arijmìc tw kathgori K eðai. 14
όπου p=(p 1,..., p ) είναι σ ταθμίσ εις και X = {x 1,..., x } είναι ένα σ ύνολο δεδομένων. Υποθέτουμε ότι p i 0, p i = 1 (45) Η σ χέσ η (44) μπορεί να γενικευθεί σ την περίπτωσ η της διακύμανσ ης ως εξής: E {X E (X)} p i (x i E (X)) (46) Η σ χέσ η αυτή μπορεί με τη σ ειρά της να γενικευθεί ως εξής: E {X E (X)} k p i {x i E (X)} k, k = 1,,... (47) όπου E {X E (X)} = 0. Ας δούμε ορισ μένες ιδιότητες για την περίπτωσ η που X = {x 1,..., x } και Y = {y 1,..., y } είναι δυο σ ύνολα δεδομένων με σ ταθμίσ εις p R. Ιδιότητα 1. E {X E (X)} = 0. Απόδειξη. E {X E (X)} = p i (x i E (X)) = p i x i E (X) p i = E (X). Ιδιότητα. E (α + βx) = α + βe (X). Απόδειξη. E (α + βx) = p i (α + βx i ) = α p i + β p i x i = α + βe (X). Ιδιότητα 3. E (X + Y) = E (X) + E (Y). Απόδειξη. E (X + Y) = p i (x i + y i ) = p i x i + p i y i = E (X) + E (Y). Παρόμοια έχουμε την επόμενη Ιδιότητα 4. E (αx + βy) = αe (X) + βe (Y), α, β R όπως και την ακόλουθη Ιδιότητα 5. Για κάθε α R M, E ( M m=1 α mx m ) = M m=1 α me (X m ), όπου X 1, X,... είναι σ ύνολα δεδομένων με πλήθος παρατηρήσ εων 1,,... Ιδιότητα 6. E (X + Y) = E (X ) + E (Y ) + E (XY). Απόδειξη. E (X + Y) = p i (x i + y i ) = p i (x i + y i + x iy i ) = E (X ) + E (Y ) + p i x i y i = E (X ) + E (Y ) + E (XY) Ιδιότητα 7. E (X Y) = E (X ) + E (Y ) E (XY). Οι ιδιότητες 6 και 7 αποτελούν υποπερίπτωσ η της ακόλουθης: Ιδιότητα 8. E (αx + βy) = α E (X ) + β E (Y ) + αβe (XY). Ερώτησ η. Ας ορίσ ουμε E p (X) = p ix i. Εφόσ ον E q (Y) = q iy i να προσ διορίσ ετε την έκφρασ η E (αx + βy). Ας υποθέσ ουμε τώρα ότι q R m και m. Μπορεί να υπολογισ θεί η έκφρασ η αυτή 15
.1 Ajroisvtikèc svuqìthtec Ας υποθέσ ουμε ότι έχουμε το ισ τόγραμμα (m k, f k, k = 1,..., K) όπου f k είναι σ χετική σ υχνότητα. Η σ χετική σ υχνότητα δίνει την αναλογία των παρατηρήσ εων που ανήκουν σ το υποδιάσ τημα το οποίο έχει σ αν κεντρική τιμή το m k. Επομένως θα μπορούσ αμε να πούμε ότι παρέχει την αναλογία των παρατηρήσ εων που είναι κοντά σ το m k. Αν επιλέξουμε το πρώτο υποδιάσ τημα να μην περιλαμβάνει καμία παρατήρησ η τότε f 1 = 0. Αυτό μπορεί να γίνει πάντοτε αν το ανώτατο άκρο του πρώτου υποδιασ τήματος είναι μια τιμή μικρότερη από την ελάχισ τη παρατήρησ η. Ας ορίσ ουμε F k = k f j, k = 1,,..., K (48) j=1 Η ποσ ότητα αυτή μας δίνει την αναλογία των παρατηρήσ εων που ανήκουν σ το k υποδιάσ τημα ή σ ε υποδιασ τήματα προς τ αρισ τερά του. Μας δίνει, μ άλλα λόγια, την αναλογία των παρατηρήσ εων που είναι (προσ εγγισ τικά μιλώντας) μικρότερες από m k -ακριβέσ τερα, μικρότερες από το άνω άκρο του υποδιασ τήματος που έχει σ αν κεντρική τιμή του το m k. Ας υιοθετήσ ουμε τον σ υμβολισ μό P(X I k ) = f k, k = 1,..., K (49) που έχει την εξής ερμηνεία: Η αναλογία των παρατηρήσ εων της λίσ τας X που ανήκουν σ το υποδιάσ τημα I k είναι f k. Το σ ύμβολο P σ υμφωνούμε ότι προέρχεται από τη λέξη proportio. Εφόσ ον κάθε υποδιάσ τημα έχει το ίδιο μήκος h είναι σ αφές ότι I k = [a k, a k + h) και m k = a k + h. Επομένως θα μπορούσ αμε να γράψουμε τη σ χέσ η (49) ως εξής: P(a k X < a k + h) = f k, k = 1,..., K (50) Με αυτή τη σ ύμβασ η η αθροισ τική σ υχνότητα μπορεί να γραφεί με τη μορφή: F k = P(X a k + h), k = 1,..., K (51) Προκύπτει επίσ ης εύκολα με βάσ η την (51) ότι έχουμε: F k F k 1 = f k, k =,..., K (5) Ας υποθέσ ουμε θεωρητικά ότι έχουμε έναν άπειρα μεγάλο αριθμό παρατηρήσ εων. Θα μπορούσ αμε να γράψουμε την (51) με τη μορφή F (x + h) = P(X x + h), x R (53) 16
η οποία περιλαμβάνει απλώς την αντικατάσ τασ η του a k με x, μια σ υνεχή μεταβλητή και κυρίως την υποθεσ η ότι μπορούμε να περιγράψουμε την αθροισ τική σ υχνότητα F k με μια σ υνεχή σ υνάρτησ η F (x) και F : R [0, 1]. Η λογική αυτής της αντικατάσ τασ ης είναι ότι εφόσ ον έχουμε έναν άπειρα μεγάλο αριθμό παρατηρήσ εων μπορούμε να έχουμε έναν άπειρα μεγάλο αριθμό κατηγοριών a k, δηλαδή K. Αυτό σ ημαίνει φυσ ικά ότι h 0. Αν υποθέσ ουμε ότι h 0 αλλά δεν είναι μηδέν θα μπορούσ αμε να γράψουμε εναλλακτικά την (5) με την ακόλουθη μορφή: F (x + h) F (x) = f(x)h (54) όπου f(x) είναι το αντίσ τοιχο του f k όπως ακριβώς το αντίσ τοιχο του F k είναι η σ υνάρτησ η F (x). Διαιρώντας την (54) με h θα έχουμε: f(x) = F (x + h) F (x) h (55) Λαμβάνοντας όρια και σ τα δυο μέλη, εφόσ ον πρόκειται για ταυτότητα (ορισ μό) έχουμε: f(x) = lim h 0 F (x + h) F (x) h (56) Οταν το όριο υπάρχει και μπορούμε να υποθέσ ουμε ότι η σ υνάρτησ η F (x) δεν είναι απλώς σ υνεχής αλλά παραγωγίσ ιμη, τότε: f(x) = F (x) = Φυσ ικά σ ε όρους διαφορικών έχουμε: df (x) dx (57) df (x) =f(x)dx (58) Με βάσ η την ανάλυσ ή μας είναι λογικό να ονομάσ ουμε τη σ υνάρτησ η f(x) σ υνάρτησ η σ υχνότητας και τη σ υνάρτησ η F (x) αθροισ τική σ υνάρτησ η σ υχνότητας. Εφόσ ον f k = 1 είναι λογικό να διατηρήσ ουμε την ίδια σ ύμβασ η και να υποθέσ ουμε ότι: ˆ f(x)dx = 1 (59) το οποίο έχει την έννοια ότι το εμβαδόν κάτω από την καμπύλη f(x) σ υμφωνούμε για ευκολία να είναι μονάδα. Οι σ χέσ εις (58) και (59) σ ημαίνουν ότι: F ( ) F ( ) = 1 (60) 17
όπου F (± ) = lim x ± F (x). Η σ χέσ η (60) με τη σ ύμβασ η ότι F ( ) = 0 σ ημαίνει ότι: F ( ) = 1 (61) Επίσ ης, είναι φανερό από την (57) ότι F (x) 0 και επομένως η αθροισ τική σ υνάρτησ η δεν μπορεί να είναι φθίνουσ α σ ε κανένα σ ημείο της. Η ανάλυσ η αυτή μας οδηγεί σ ε δυο σ ημαντικά σ υμπεράσ ματα που θα έχουν κεντρική σ ημασ ία σ τη θεωρία πιθανοτήτων. Συμπέρασ μα 1. Αν εξειδικεύσ ουμε μια παραγωγίσ ιμη σ υνάρτησ η F (x) ως την αθροισ τική σ υνάρτησ η τότε η σ υνάρτησ η σ υχνότητας f(x) προκύπτει (από τη σ χέσ η (55» ως η παράγωγός της. Συμπέρασ μα. Αν εξειδικεύσ ουμε μια σ υνάρτησ η f(x) ως τη σ υνάρτησ η σ υχνότητας τότε η αθροισ τική σ υνάρτησ η F (x) προκύπτει από το ολοκλήρωμά της: F (x) = ˆ x f(t)dt (6) Για να δούμε την ισ χύ της (6) ας θεωρήσ ουμε την (57) από την οποία έχουμε: F (t) = f(t) ˆ x F (t)dt = ˆ x f(t)dt F (x)+c = ˆ x f(t)dt (63) Η σ ταθερά της ολοκλήρωσ ης c θα είναι μηδέν λόγω της (61). Δηλαδή, η γενική λύσ η δίνεται από το τελευταίο σ κέλος της (63) αλλά αν λάβουμε όρια καθώς x έχουμε: F ( ) + c = f(t)dt = 1 c = 0. Από τα Συμπεράσ ματα 1 και είναι σ αφές ότι μπορούμε να εξειδικεύσ ουμε είτε τη σ υνάρτησ η σ υχνότητας f(x) είτε την αθροισ τική σ υνάρτησ η F (x) εφόσ ον αν έχουμε τη μια εύκολα προκύπτει η άλλη. { 1, x [0, 1] Παράδειγμα. Ας υποθέσ ουμε ότι f(x) = 0, διαφορετικά. Είναι εύκολο να διαπισ τώσ ουμε ότι: x, x [0, 1] F (x) = 0, x < 0 1, x > 1. 18