Ζημιοκατανομές και Θεωρία Ακραίων Τιμών Χατζηκωνσταντής Παναγιώτης ΜΑΕ/07023 Τμήμα Στατιστικής Επιστήμης και Ασφαλίσεων Υγείας M.Sc. Aναλογιστικής Επιστήμης και Risk Mgemet Πανεπιστήμιο Πειραιώς (2007)
Αύξων αριθμός: 7 ΜΕΡΟΣ Α (Α) Το γράφημα ΟΛΩΝ των τιμών της μετοχής που μου ζητείται είναι το παρακάτω: Figure: Stock Prices 6000 ημερών Έχοντας φορτώσει την μεταβλητή S απο το αρχείο dt.txt στο R-Project, οι ημέρες που μου αντιστοιχούν είναι: 85, 852,..., 5850. Στο εξής λοιπον, θα ασχολούμαι με τις τιμές της μετοχής μόνο για αυτες τις ημέρες. (A2) Σύμφωνα με το μοντέλο Blck-Scholes οι λογαριθμικές αποδόσεις δίνονται απο Si+ τη σχέση: X i = 00 l, i =,2,..., S i Επομένως δημιουργούνται νέες λογαριθμικές τιμές Χ οι οποίες πλέον είναι 4999. Το ραβδόγραμμα των Χ είναι το παρακάτω:
Figure 2: Ραβδόγραμμα των 4999 παρατηρήσεων Το Boxplot των των Χ είναι το παρακάτω: Figure 3: Boxplot των Log-Returs
Η μεγαλύτερη τιμή, η μικρότερη, ο μέσος, η διάμεσος, μαζί με ο και 3 ο τεταρτημόριο είναι τα εξής: Figure 4: Ελάχιστο, μέγιστο, μέσος και διάμεσος Επίσης η τυπική απόκλιση είναι: Vr( x ) =3.02299. (Α3) Η εμπειρική συνάρτηση κατανομής των Log-Returs είναι: Figure 4: Εμπειρική συνάρτηση κατανομής των Log-Returs To ιστόγραμμα των Log-Returs χρησιμοποιώντας τις κλάσεις (-20,-9], (-9, -8],..., (9,20] είναι το παρακάτω:
Figure 5: Ιστόγραμμα Log-Returs Η εξέταση των Log-Returs αν προέρχονται από την κανονική κατανομή γίνεται με την παρατήρηση του QQ-Plot στο Figure 6 που βρίσκεται παρακάτω: Figure 6: QQ-Plot των Log-Returs
Από το Figure 6 μπορεί εύκολα κανείς να παρατηρήσει πως τα δεδομένα μας (Logreturs) δεν προέρχονται από την κανονική κατανομή, αυτό γιατί όπως είναι φανερό οι περισσότερες τιμές δεν ακουμπάνε στην περίπου οριζόντια γραμμή του σχήματος έτσι φαίνεται. Μια δεύτερη παρατήρηση που μπορεί καποιος να κάνει στο Figure 6 είναι πως από ότι φαίνεται από τις θετικές ακραίες τιμές έχουμε αρκετές, συνεπώς έχουμε να κάνουμε με Log-Returs που προέρχονται από δεδομένα με βαριά δεξιά ουρά. ΜΕΡΟΣ Β (Μέθοδος Block Mxim) (Β) Υπάρχουν 4999 τιμές Log-Returs, άρα περίπου 5000 παρατηρήσεις. Αν χωρίσει, λοιπόν, κανείς τις παρατηρήσεις σε 25 Block θα έχει 200 παρατηρήσεις στο καθένα, περίπου. Επομένως τώρα που εχουν χωρισθεί οι παρατηρήσεις σε Blocks μπορούν να δημιουργηθούν τα Block Mxim. Το γράφημα με τις τιμές των Block Mxim είναι: Figure 7: Ιστόγραμμα των Block Mxim Σύμφωνα με τα θεωρητικά αποτελέσματα τα Block Mxim θα πρέπει να ακολουθούν προσεγγιστικά την Gumbel κατανομή.
(Β2) Από το QQ-Plot της Gumbel παρακάτω, φαίνεται οτι το γράφημα των σημείων είναι κοίλο, άρα θα πρέπει να πάρουμε θετικό ξ για την GEV, δηλ. ξ > 0. Figure 8: Gumbel QQ-Plot Επομένως παίρνοντας για ξ = το QQ-Plot της GEV: Figure 9: QQ-Plot της GEV για ξ =
Για ξ = έγινε κυρτό το γράφημα άρα θα πρέπει να μικρύνει το ξ, γίνονται λοιπόν δοκιμές του 0 < ξ < μέχρι το γράφημα να γινει όσο πιο γράμμικο γίνεται. Figure 0: GEV QQ-Plot, ξ = 0.5 Figure : GEV QQ-Plot, ξ = 0.4 Figure 2: GEV QQ-Plot, ξ = 0.3 Figure 3: GEV QQ-Plot, ξ = 0.2 Από τα Figures 0-3 μπορεί κανείς να δει οτί για ξ > 0.2 αρχίζει πάλι το QQ-Plot της GEV να γίνεται κοίλο και ότι για ξ = 0.3 έχουμε την καλύτερη γραμμικότητα. Επομένως χοντρικά η τιμή του ξ είναι 0.3, και άρα ξ = 0.3. (Β3) Η εκτίμηση μέγιστης πιθανοφάνειας, για την εκτίμηση των παραμέτρων της GEV από τα Block Mxim μας δίνει μέσω του R-Project: μ= 4.6540459, σ = 2.0978840, ξ = 0.277828 με αντίστοιχες τυπικές αποκλίσεις: σ μ = 0.77909 σ σ = 0.425638 σ ξ = 0.0654285 Ο εκτιμημένος πίνακας διασποράς συνδιακύμανσης είναι: Figure 4: Πίνακας διασποράς-συνδιασποράς των παραμέτρων GEV
Το διάστημα εμπιστοσύνης 95% για κάθε μια απο τις παραμέτρους είναι: 4.32 < μ< 4.99.82 < σ < 2.38 0.5 < ξ < 0.4 Τα οποία βρέθηκαν από τους τύπους: ( ˆ μ± s z ),( ˆ σ ± s z ),( ˆ ξ ± s z ), 2 2,2 2 3,3 2 Το γράφημα του profile log-likelihood της παραμέτρου ξ είναι: Figure 5: Profile log-likelihood της ξ Από το παραπάνω γράφημα παρατηρώντας την πάνω οριζόντια γραμμή εκεί που τέμνει την καμπύλη είναι φανερό ότι το ξ 0.26 (άξονας των χ). Επίσης παρατηρώντας την κάτω οριζόντια γραμμή στα δύο σημεία που τέμνει την καμπύλη μπορεί κανείς βρεί ένα διάστημα εμπιστοσύνης για την παράμετρο ξ, εδώ: 0.6 < ξ < 0.4.
(Β4) Τα γραφήματα για τον έλεγχο καλής προσαρμογής των Block Mxim στην GEV είναι τα παρακάτω: Figure 6: Διαγνωστικά γραφήματα καλής προσαρμογής των Block Mxim στην GEV για 25 Blocks Figure 6: Διαγνωστικά γραφήματα καλής προσαρμογής των Block Mxim στην GEV για 50 Blocks
Παραπάνω το Figure 5 αποτελείται από διαγνωστικα γραφήματα για την καλή προσαρμογή 25 blocks στην GEV ενώ το Figure 6 δίνει τα διαγνωστικά γραφήματα για την καλή προσαρμογή 50 blocks στην GEV. Ιδιαίτερα από το Probbility Plot του Figure6 μπορεί κανείς να δει πως έχουμε πολλές τιμές που δεν είναι πάνω στην γραμμή σε αντίθεση με το Probbility Plot του Figure5 όπου οι τιμές φαίνονται σχεδόν όλες να βρίσκονται επάνω στην γραμμή. Αν, λοιπόν είχε πάρει κάποιος αρχικά 50 blocks με 00 παρατηρήσεις και δεν του άρεσε η προσαρμογή τότε θα έπρεπε να μικρύνει των αριθμό των blocks ή αλλιώς να μεγαλώσει τα blocks. (Β5) Η στάθμη απόδοσης είναι: z ˆp = 24.7342 Που βρέθηκε από τον τύπο: ˆ σ ˆ w zˆ ˆ ( p p e ξ = μ ), wp = l( l( p)) ˆ ξ Figure 7: Εκτίμηση στάθμης απόδοσης από την profile log-likelihood Αυτό σημαίνει πως ένα Block Mximum θα ξεπερνά την τιμή 24 (με διάστημα εμπιστοσύνης 95% από 8 εώς 34) με πιθανότητα p = 0.0 κάθε 25 περιόδους (αφού έχω 25 blocks).
(Β6) Το γράφημα της στάθμης απόδοσης για 0,,..., 00 χρονικές περιόδους είναι: Figure8: Γράφημα σταθμης απόδοσης για 0 εώς 00 χρ. Περιόδους
ΜΕΡΟΣ Γ (Μέθοδος Peks Over Threshold) (Γ) Η επιλογή του κατωφλιού θα γίνει από την παρατήρηση των γραφημάτων: Figure 9: Me Excess Plot Figure 20: Me residul live plot Εκεί που ξεκινάει η γραμμικότητα είναι για u = 2 περίπου, επομένως επιλέγω u = 2.
Τα γραφήματα των εκτιμήσεων των ˆ ξ, ˆ σ της GPD για διάφορες τιμές του u είναι: Figure 2: Γραφήματα εκτιμήσεων ˆ ξ, ˆ σ της GPD (Γ2) Με βάση ότι το u = 2, η μέθοδος μέγιστης πιθανοφάνειας μας δίνει ότι: threshold = 2 (Το u που έχει επιλεχθεί) exc = 798 (Αριθμός των τιμών που ξεπερνούν το κατώφλι u) cov = 0 llh = 385.252 mle =.6696707, 0.2234308 (Οι παράμετροι σίγμα και ξι της GPD, αντίστοιχα) rte = 0.59639 se = 0.0920402, 0.04299400 (Οι αντίστοιχες τυπικές αποκλίσεις των παραμέτρων) To profile log-likelihood γράφημα είναι το εξής:
Figure 22: Profile log-likelihood της GPD Από το παραπάνω γράφημα είναι ευκρινές ότι η παράμετρος ˆ ξ = 0.22 με δ.ε. 95% από 0.5 εώς 0.32. (Γ3) Μπορεί κάποιος να δει ότι υπάρχει καλή προσαρμογή των ΡΟΤ στην GPD από τα παρακάτω διαγνωστικά γραφήματα: Figure 23: Διαγνωστικά γραφήματα καλής προσαρμογής των ΡΟΤ στην GPD
(Γ4) Η στάθμη απόδοσης για m = 000 παρατηρήσεις δίνεται από τον τύπο: Εδώ είναι: x ˆm = 7.7396 ˆ ξ ˆ σ mk( u) xˆ m u+ ˆ ξ Η ίδια ποσότητα από το γράφημα της profile log-likelihood δίνοντας ένα διάστημα εμπιστοσύνης 95% εκτιμάται από το παρακάτω: Figure 24: Γράφημα profile log-likelihood xˆm 7.736 με δ.ε. 95% περίπου από 7.73 εώς 7.744. Αυτός ο αριθμός εκφράζει τη στάθμη που ξεπερνά μία παρατήρηση με πιθανότητα = 0.00 ανά έτος. m
(Γ5) Το γράφημα της στάθμης απόδοσης για m παρατηρήσεις που αντιστοιχούν σε 0,,..., 00 χρονικές περιόδους είναι: Figure 25 Το κοινό γράφημα με το αντίστοιχο της μεθόδου Block Mxim είναι: Figure 26: Κοινό γράφημα μεθόδου BM και ΡΟΤ
ΜΕΡΟΣ Δ (Δ) Απόδειξη για Gumbel: Αν X ~ Λ, d = l( ) και C = τότε: i ( ) M d (l( ) x) e P x = P( M l( ) + x) =Λ (l( ) + x) = e + = c (l( ) + x) l( ) x x = e = e = e e ( e e ) ( e ) Άρα η Gumbel είναι Mx-stble. x e e =, x, Απόδειξη για Frechet Αν X i ~ Φ, d = 0, α c = τότε: x M d P x = P( M cx+ d) = P M x =Φ α x = e c x x e = = e, x> 0 M d Για x 0 προφανώς P c Άρα η Frechet είναι Mx-stble. x = 0. Aπόδειξη για iverse Weibull Αν X ~ Ψ, d = 0, i c = τότε: x M d P x = P( M cx+ d) = P M x =Ψ α x = e c [( x) ] ( x) = e = e, x 0 M d Για x > 0, προφανώς P c x =. Άρα η iverse Weibull είναι Mx-stble.
(Δ2) α) Έστω F = x, και για d = 0 και c = τότε: M d P x = PM ( cx + d) = P( Fcx ( + d) ) = [ ( cx + d) ] c ( x) x x = e = e Που είναι Frechet. β) Έστω F ( x) = και για d =, c = τότε: M d P x = PM ( cx + d) = P( Fcx ( + d) ) = [ ( cx + d) ] c ( x) = [ x] = ( x) = Που είναι Iverse Weibull. e ( x) x bb ( x γ) Έστω F = e ), x (0, b) και c 2 b = ( + bl ) M d P x = P( M cx+ d) = e c Όπου μετά από πράξεις καταλήγω: e 2 cx ( + d) bb [ ( cx + d)] b, d = b τότε: + b l 2 bx bl [ bl + 2 ] b + bl bx Όμως έχω απροσδιοριστία όταν το τείνει στο άπειρο της μορφής ένα εις την άπειρο!