Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 7 ου Πανελληνίου Συνεδρίου Στατιστικής (2004), σελ. 283-290 ΠΡΟΒΛΕΨΕΙΣ ΜΕ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΜΙΑ ΕΦΑΡΜΟΓΗ ΣΕ ΠΕΡΙΒΑΛΛΟΝΤΙΚΑ ΘΕΜΑΤΑ Μανώλη Μανατάκη Πολυτεχνική Σχολή Πανεπιστήµιο Πατρών Ιωάννα Μανατάκη Οικονοµικό Πανεπιστήµιο Αθηνών ΠΕΡΙΛΗΨΗ Όταν χρησιµοποιείται η γραµµική εκτίµηση για σκοπούς πρόβλεψης, προτείνεται η ελαχιστοποίηση του αθροίσµατος των σχετικών σφαλµάτων, ως ένα εναλλακτικό κριτήριο στην ελαχιστοποίηση του αθροίσµατος των τετραγώνων των σφαλµάτων και στην ελαχιστοποίηση του αθροίσµατος των απολύτων των σφαλµάτων. Το πρόβληµα διατυπώνεται ως ένα πρόβληµα γραµµικού µοντέλου, προτείνεται η κατάλληλη λύση και εφαρµόζεται σε προβλήµατα περιβαλλοντολογικού ενδιαφέροντος.. ΕΙΣΑΓΩΓΗ Ας θεωρήσουµε το γραµµικό µοντέλο Y=β 0 x 2x 2 +... kxk +ε () όπου Υ είναι η εξαρτηµένη (προβλεπόµενη) τιµή, x είναι οι ανεξάρτητες (προβλέπουσες) τιµές, β 0, β,..., β κ είναι k+ άγνωστες σταθερές και ε το τυχαίο σφάλµα. Η ελαχιστοποίηση του αθροίσµατος των τετραγώνων των σφαλµάτων (Ε.Α.Τ.Σ.), είναι το κριτήριο που εφαρµόζεται συχνότερα για την εκτίµηση των σταθερών β, 0,,2,k. = Εν τούτοις σε πολλά προβλήµατα η Ε.Α.Τ.Σ δείχνει να µην είναι η καλύτερη µέθοδος. Για παράδειγµα, σε οικονοµικά γραµµικά µοντέλα της µορφής της εξίσωσης () προτείνεται η ελαχιστοποίηση του αθροίσµατος των απολύτων των σφαλµάτων (Ε.Α.Α.Σ.), (Smth (978), (Taylor (974)) ως ένα ικανοποιητικό κριτήριο των απωλειών από την Ε.Α.Τ.Σ. Επίσης για την εκτίµηση αµοιβών-αποζηµιώσεων (Chares A. (985)) και για τη δηµιουργία επενδυτικών µοντέλων (Meyer J.& (994) ή Ε.Α.Α.Σ προτείνεται ως πιο αποδοτική µέθοδος 283
από την Ε.Α.Τ.Σ. Σε οικονοµικές µελέτες (Butler(996), (Emerso (972) ή σε θέµατα µηχανικών, αν και χρησιµοποιείται η Ε.Α.Τ.Σ., τα αποτελέσµατα ερµηνεύονται απλούστερα µε την Ε.Α.Α.Σ. Τέλος η µέθοδος ελαχιστοποίησης του αθροίσµατος των σχετικών σφαλµάτων (Ε.Α.Α.Σ) εφαρµόζεται ως κριτήριο για την εκτίµηση της καταλληλότητας της εξίσωσης πρόβλεψης. Στην παρούσα εργασία εφαρµόζεται το κριτήριο ελαχιστοποίησης αθροίσµατος απολύτων των σφαλµάτων, σε αντιδιαστολή µε την Ε.Α.Τ.Σ και Ε.Α.Σ.Σ για την εκτίµηση των συντελεστών β της σχέσης (), σε ένα πρακτικό πρόβληµα κυκλοφοριακού θορύβου και δηµιουργούνται διαστήµατα εµπιστοσύνης και πρόβλεψης θορύβου στα οποία εφαρµόζεται η µέθοδος. 2.. Σχηµατοποίηση του προβλήµατος 2. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ Ας υποθέσουµε ότι η σχέση µεταξύ της τυχαίας µεταβλητής Υ και των ανεξάρτητων µεταβλητών x δίνεται από το γραµµικό µοντέλο της εξίσωσης (). Ένα σύνολο παρατηρήσεων έχει τη µορφή: Y =β 0 x 2x 2 +... kx k +ε, =,2,..., (2) Ενδιαφερόµαστε για τον υπολογισµό των β, έτσι ώστε να ελαχιστοποιείται το άθροισµα των σχετικών σφαλµάτων, δηλ. Ελαχιστοποίηση του Σε ξ (3) = όπου ε = y ( β 0 x +... kx k), =,2,..., (4) και ξ = / y, y 0 (5) Για τη λύση του προβλήµατος θεωρούµε ότι:, ε =ε ε µε ε, ε 0, =, 2,..., (6) όπου ε, ε, είναι το µέγεθος της απόκλισης της παρατήρησης πάνω και κάτω από την εκτιµούµενη γραµµή, αντίστοιχα. Έτσι το πρόβληµα τίθεται ως εξής: (Π) µε : Ελαχιστοποίηση k 0 j j j= (7) = z = ( ε +ε ) ξ β + β x + ( ε ε ) = y, =, 2,..., (8) ε, ε 0, =, 2,..., (9) Η βέλτιστη λύση z είναι η τιµή της ελαχιστοποίησης του αθροίσµατος των σχετικών σφαλµάτων. 284
2.2. Προσέγγιση του προβλήµατος Το πρόβληµα (Π) ανάγεται στην τυποποίηση των Chares κ.α. (995), της ελαχιστοποίησης του αθροίσµατος των απόλυτων σφαλµάτων όταν ξ = για όλα τα. Επίσης ο Wager (989) έδειξε ότι το παρακάτω δυϊκό πρόβληµα (Π) Ε.Α.Α.Σ. µπορεί να λυθεί πιο αποτελεσµατικά απ αυτό καθεαυτό το (Π). Το πρόβληµα αυτό τίθεται ως εξής: (Π) Ελαχιστοποίηση Σ yd (0) = µε Σ d = 0, Σ xd j = 0, ξ d ξ, = = =,2,..., () Με µια απλή αλλαγή των µεταβλητών στα d f = d +ξ (2) µετασχηµατίζει το πρόβληµα (Π) στο παρακάτω απλούστερο πρόβληµα (Π2) (Π2) Ελαχιστοποίηση yf = Σ Σ ξ (3) y = µε Σ f = Σξ = =, Σ xf j = xj = = Σ ξ j=,2,,k (4) 0 f 2 ξ, =,2,, (5) o Το πρόβληµα (Π2) µπορεί να λυθεί χρησιµοποιώντας ειδικούς αλγορίθµους (Wager (989). 2.3 Λύση του γενικού προβλήµατος Ας θεωρήσουµε ένα σύνολο παρατηρήσεων της µορφής εξίσωσης (2) Y =β 0 x 2x 2 +... kx k +ε, =,2,..., (2) όπου ε είναι η διαφορά µεταξύ της Υ και της δεσµευµένης αναµενόµενης τιµής της Υ για δοσµένα x και υπολογίζεται από την µ y/x, δηλ. ε = Y µ = Y Yˆ (6) Y X Υποθέτουµε ότι η τ.µ. Υ κατανέµεται κανονικά, δηλ. 2 Y N( µ Y/X, σ Y/X) (7) και ότι για τα σφάλµατα ε ισχύει: 2 2 E( ε ) = 0, Var( ε ) =σ, ε N(0, σ ), cov( ε, ε j) = 0 j (8) Το σύνολο των παρατηρήσεων της εξίσωσης (2) σε πινακοποιηµένη µορφή γράφεται ως εξής Y= XB+ε (9) όπου Υ,Χ,Β και ε είναι πίνακες τάξεων ( x), (x (k+), ((k+)x)και (x) αντίστοιχα. 285
Το άθροισµα των σφαλµάτων είναι Ψ=(Υ-ΧΒ) Τ (Υ-ΧΒ) (20) όπου Τ δηλώνει ανάστροφο πίνακα. Ο εκτιµητής ελαχίστων τετραγώνων του πίνακα Β είναι = B (XX) XY (2) 2.4 Προβλέψεις Μια πολύ σηµαντική ιδιότητα των πολυµεταβλητών µοντέλων είναι να κάνουµε προβλέψεις για τις εξαρτηµένες µεταβλητές, όταν οι τιµές των προβλεπουσών τιµών είναι άγνωστες. Για µεγάλα δείγµατα, διαστήµατα ± 2s δίνουν προσεγγιστικά 95% όρια πρόβλεψης. (Maataks E. (2003) & (2002)). ιάστηµα εµπιστοσύνης για τη δεσµευµένη µέση τιµή της Υ, δοθέντος του x. Έστω x p = (, x p, x κp ) Τ. Η προβλεπόµενη µέση τιµή του Υ δοθέντος ότι x= x p είναι Εˆ Y/x Η διασπορά της ποσότητας αυτής είναι ναr όπου ( ) ˆ T = xp = xb p (22) ( ˆ ) = ( ) xb T x T T 2 p p σ p XX x (23) T 2 X X σ είναι ο πίνακας συνδιασποράς του ˆΒ. Έτσι ένα (-α)00% διάστηµα εµπιστοσύνης για την Ε[Υ/ x= x p ] είναι xb ˆ ± t.s. x(xx) x (24) T T T - p -k-,a/2 p p ιάστηµα πρόβλεψης για την Υ. Ένα (-α)00% διάστηµα πρόβλεψης για µια µεµονωµένη τιµή της Υ, όταν x= x p είναι Tˆ T T xb± t.s. + x( XX) x (25) p -k-,a/2 p p 3. ΠΕΙΡΑΜΑΤΑ Ελήφθησαν µετρήσεις για τον κυκλοφοριακό θόρυβο σε 6 βασικούς δρόµους της Πάτρας µε διαφορετική σύνθεση στη ροή των οχηµάτων για να δηµιουργηθεί το Στατιστικό µοντέλο. Χρησιµοποιήθηκε µετρητής θορύβου που τοποθετήθηκε σε 286
τρίποδο,2 m από το έδαφος. Τυπικό δείγµα µετρήσεων δίνεται στον Πίν.2. Για τον προσδιορισµό των συντελεστών β του γραµµικού µοντέλου ακολουθήθηκε η διαδικασία που προβλέπει η Ακουστική Ανάλυση αλλά και η Στατιστική Ανάλυση επιδιώκοντας την ελαχιστοποίηση του αθροίσµατος των απολύτων των σφαλµάτων, των τετραγώνων των σφαλµάτων και των σχετικών σφαλµάτων. Εφαρµόζοντας τη θεωρία της 2 έγινε ο προσδιορισµός των συντελεστώνβ, =0,,2,3 του γραµµικού µοντέλου y=β 0 x 2x2 3x3 (26) όπου y είναι η στάθµη θορύβου Leq (db) και x, x 2, x 3, οι ρυθµοί κυκλοφορίας ανά ώρα των δικύκλων, Ι.Χ. και φορτηγών αντίστοιχα. Έτσι οι παρακάτω εξισώσεις δίνουν το επίπεδο του θορύβου y=leq για τις 3 περιπτώσεις ελαχιστοποίησης αθροίσµατος σχετικών σφαλµάτων, απολύτων των σφαλµάτων, και των τετραγώνων των σφαλµάτων. ΕΑΣΣ: y = Leq = 65,645 + 0,389x + 0,5x 2 + 0,487x 2 (27) ΕΑΑΣ: y = Leq = 66,27+ 0,40x + 0,6x 2 + 0,497x 2 (28) ΕΑΤΣ : y = Leq = 67,24 + 0,432x + 0,6x 2 + 0,53x 2 (29) Στη συνέχεια υπολογίστηκαν τα διαστήµατα εµπιστοσύνης για τη δεσµευµένη µέση τιµή του θορύβου y δοθέντος των x και τα διαστήµατα πρόβλεψης για τις περιπτώσεις Ε.Α.Σ.Σ, Ε.Α.Α.Σ, και Ε.Α.Τ.Σ., όπως φαίνονται στον Πίν. και στο Σχ.. 4. ΣΥΜΠΕΡΑΣΜΑΤΑ Στην εργασία αυτή παρουσιάζεται µια Στατιστική προσέγγιση του κυκλοφοριακού θορύβου. Βασιζόµενοι στις αρχές της Στατιστικής Συµπερασµατολογίας και της Ακουστικής Ανάλυσης αναπτύσσεται ένα µοντέλο πρόβλεψης του κυκλοφοριακού θορύβου στη µορφή ζωνών εµπιστοσύνης και ζωνών πρόβλεψης για το µέσο επίπεδο θορύβου. Προτείνεται η πρόβλεψη µε χρήση µοντέλου µέσω της ελαχιστοποίησης του αθροίσµατος των σχετικών σφαλµάτων και όχι της ελαχιστοποίησης του αθροίσµατος των τετραγώνων των σφαλµάτων ή των απολύτων των σφαλµάτων, αφού τα διαστήµατα εµπιστοσύνης και πρόβλεψης έχουν µικρότερο πλάτος. ABSTRACT Whe lear regresso used for predcto purposes, the mmzato of the sum of relatve errors s proposed as a alteratve crtero to the mmzato of the sum of squared errors ad the mmzato of the sum of absolute errors. The problem of subset selecto wth the mmzato of the sum of relatve errors s formulated for evaluatg ad predctg the equvalet ce level. The method s based o the statstcal theory of regresso aalyss ad the results are expressed by cofdece ad predcto tervals of ose. 287
ΑΝΑΦΟΡΕΣ - Butler W ad Kavesh R., (996). How Busess Ecoomcs Fore cast. Pretce Hall, Eglewood Clffs, N.J. - Chares a.,cooper W. Ad Ferguso R., (985). Optmal Estmato of executve compesato by lear programmg. Maagemet Scece, 0, 307-323. - Emerso F., (972). Valuato of resdetal ametes: a ecoometrc approach. The Appraser Joural, 40, 268-279. - Maataks E., (2000). A ew methodologcal tral o Statstcal Aalyss of costructo equpmet ose. Appled Acoustcs, 59, 67-76. - Μανατάκης Ε., (2002). Στατιστικά µοντέλα διαστηµάτων πρόβλεψης και διαστηµάτων εµπιστοσύνης κυκλοφοριακού θορύβου βασιζόµενα σε διαδικασίες Posso ο Συνέδριο Ακουστικής, 367-374. - Maataks E., Skarlatos D., (2002). A statstcal model for evaluato ad predcto of the ose exposure a costructo equpmet area. Appled Acoustcs 63, 759-773. - Μανατάκης Μ., (2003). Πολυµεταβλητά µοντέλα πρόβλεψης κυκλοφοριακού θορύβου Heleco 20003, Συνέδριο Τ.Ε.Ε.,τ.Α., 33-37. - Mayer J.R. & Glauber R.R., (994). Ivestmet Decsos, Ecoomcs Forecastg ad Publc Polcy. Harvard Busess School Press, Bosto, Massachusetts. - Smth W.C. ad Mc Cormck, (978). Mmzg the sum of Absolute devatos. Gottge: Vadehoeck ad Ruprecht. - Taylor L., (974). Estmato by mzg the sum of Absolute errors. Froters Ecoometrcs. Academc Press, N.Y. - Wager H.W., (989). Lear programmg techques for regresso aalyss. J. Amer. Stat.Assoc., 54,206-22. 288
ΠΙΝΑΚΑΣ. ιαστήµατα εµπιστοσύνης και πρόβλεψης του θορύβου. Σηµείο Μέτρησης* Μέσοι κυκλοφοριακοί όγκοι (αριθµός οχηµάτων/ώρα) Επίπεδα θορύβου Leq (db) ιάστηµα εµπιστοσύνης ιάστηµα πρόβλεψης ΙΧ Φορτηγά Μοτοσυκλέτες ΕΑΣΣ ΕΑΤΣ ΕΑΑΣ ΕΑΣΣ ΕΑΤΣ ΕΑΑΣ 23 2 7 [75.-76.4] [74.8-77.0] [74.6-77.3] [74.7-77.] [74.2-77.5] [73.8-78.0] 2 8 3 [7.8-73.9] [7.0-74.2] [70.3-75.2] [7.4-74.5] [70.8-75.0] [70.-75.8] 3 2 3 3 [7.8-73.6] [7.0-74.] [69.9-74.7] [70.6-74.2] [70.8-75.4] [68.8-75.] 4 9 2 2 [75.5-77.0] [75.0-77.5] [74.-77.] [75.4-77.2] [74.9-78.0] [75.0-77.2] 5 9 9 [73.4-74.8] [73.-75.2] [73.-75.5] [73.4-75.0] [73.0-75.4] [73.0-75.8] 6 9 2 4 [73.2-74.] [73.0-75.0] [72.8-76.0] [73.5-75.] [73.4-75.6] [73.-76.2] *. Γούναρη-Κορίνθου 4. Κανακάρη-Βότση, 2. Κορίνθου-Ερµού 5. Γούναρη-Υψηλάντου, 3. Κολοκοτρώνη-Κανακάρη 6. Κορίνθου-Κολοκοτρώνη 289
ΠΙΝΑΚΑΣ 2. Τυπικό δείγµα µετρήσεων Σηµείο µέτρησης 2 3 4 5 6 Επίπεδα θορύβου, db(a) 76.2 76.7 77.2 75.5 76.9 74.8 72.4 74.4 75. 69.7 75.6 74.5 79. 76.9 77.4 76.2 75.3 75.8 80. 8.2 79.4 78.3 79.9 8.2 8. 80.9 79.6 78.9 80.0 79. 80. 80.4 79.4 79.3 78.8 77.6 79. 79.3 80.3 8. 78.4 79.2 78.4 78.8 79. 79.3 79.0 80.0 79. 79.8 72. 74. 74.3 70. 69.8 68. 7.2 72.3 74.0 74.3 78.4 77.9 78.3 79.0 78.3 78.8 79. 77.4 78.0 74.4 77.2 76.8 77.3 78. 77. 76.0 77.2 76.3 77. 72.7 78.6 79.4 77.9 78.5 78.0 78.8 78.0 79. 79.8 80.2 73.4 7.4 74.7 72.8 7.6 68.9 69. 7.4 74.2 75.4 78.5 78.4 80. 79.9 78. 79.0 78.4 74.3 74.8 75. 77.4 77. 78. 78.4 79. 79.2 79.8 80. 80.4 78.9 290