2 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η Κεφάλαιο Πολυωνυµική Παρεµβολή. Εισαγωγή Το πρόβληµα που ϑα µας απασχολήσει στο κεφάλαιο τούτο αφορά την περίσταση όπου σ ένα διακριτό, πεπερασµένο σύνολο n + σηµείων, P = {x o, x...,x n } µε x o < x < x 2 < < x n, γνωρίζουµε τις τιµές µιας συνάρτησης y = f(x), η οποία είτε µας είναι άγνωστη σε αναλυτική µορφή ή ο υπολογισµός της σε αυ- ϑαίρετο σηµείο x ϑεωρείται δύσκολος, δεν µπορεί δηλαδή να υπολογισθεί µε τις στοιχειώδεις πράξεις της πρόσθεσης/αφαίρεσης και πολλαπλασιασµού/διαίρεσης. Π.χ. ο πειραµατικός καθορισµός ενός πίνακα µε την σχέση δύο ϕυσικών µεταβλητών εκφράζει ουσιαστικά την εξαρτηµένη µεταβλητή ως συνάρτηση της ανεξάρτητης χωρίς όµως ν αντιστοιχίζει κάποιο αναλυτικό τύπο. Επίσης πολλές στοιχειώδεις συναρτήσεις, όπως οι log(x), ln(x), exp(x), sin(x), cos(x), κ.α., µας είναι γνωστές σε συγκεκριµένα σηµεία από ειδικούς πίνακες, ενώ ο υπολογισµός τους για αυθαίρετη τιµή του x δεν είναι δυνατόν να γίνει µε τις στοιχειώδεις πράξεις. Παράδειγµα. Αντίσταση Ohm Για να εκτιµηθεί η ποιότητα ενός αγωγού από νέο υλικό, πριν την διάθεσή του στην αγορά, υποβάλλεται σε πειραµατισµούς για να διαπιστωθεί η εξάρτηση της Ωµικής του αντίστασης από την ϑερµοκρασία. Οι πειραµατισµοί έχουν αποδόσει τις ακόλουθες τιµές. T - 5. 0. 5. 0. 8. 22. 30. 32. 40. 45. 50. 5.3 R 60. 65.7 68. 72. 75. 77.8 79.8 80.5 8. 84.2 85.7 86.2 Προφανώς η Ωµική αντίσταση, R, του υλικού είναι συνάρτηση της ϑερµοκρασίας T. Η εξάρτησης του R από το T δίδεται από τα συλλεχθέντα δεδοµένα, όχι όµως από κάποιον αναλυτικό τύπο R = f(t). Η συνάρτηση f( ) µας είναι άγνωστη. Γνωρίζουµε τις τιµές της ( το γράφηµά της στο Σχήµα.) µόνον στα σηµεία για τα οποία πραγµατοποιήθηκαν µετρήσεις στο πείραµα. Εάν µας ενδιέφερε η τιµή της Ωµικής αντίστασης του υλικού στην ϑερµοκρασία 25 o C, πώς ϑα µπορούσαµε να την υπολογίσουµε, έστω προσεγγιστικά; Σχήµα.: Απεικόνιση των δεδοµένων του Παραδείγµατος.. Παράδειγµα.2 Ταχύτητα Πυραύλου Οι πύραυλοι εξοπλίζονται µε αισθητήρες ταχύτητας που καταµετρούν και εκπέµπουν προς το κέντρο ελέγχου την ταχύτητά τους, η οποία χρησιµοποιείται στον υπολογισµό της επιτάχυνσής τους, του ύψους και άλλων κρίσηµων χαρακτηριστών της πτήσης των. Παράδειγµα τέτοιων τιµών ταχύτητας από την πτήση ενός πυραύλου δίδονται από τον ακόλουθο πίνακα, t (sec) 0 60 20 80 240 v(t) (feet/sec) 0 500 550 3480 7950 όπου t είναι ο χρόνος πτήσης του πυραύλου και v(t) η ταχύτητά του ως συνάρτηση του χρόνου. Ενδεχοµένως ϑα ενδιέφερε η ταχύτητα του πυραύλου, π.χ. την στιγµή t = 40 sec, που όµως δεν εµπεριέχεται στα δεδοµένα που έχει αποστείλει ο αισθητήρας. Ισως να ενδιέφερε η απόσταση που διανύει ο πύραυλος µεταξύ της στιγµής 40 και 90 ή ίσως η επιτάχυνσή του την στιγµή 40. Πως ϑα µπορούσαν ν απαντηθούν τέτοια ερωτήµατα από την στιγµή που είναι άγνωστη αναλυτικά η συνάρτηση v(t); Παράδειγµα.3 Το µέτρο ελαστικότητας του Young Το µέτρο ελαστικότητας ή µέτρο εφελκυστικότητας του Young (Young s modulus) µετράει την ακαµψία ισότροπων ελαστικών υλικών. Ορίζεται ως ο λόγος της µονοαξονικής τάσης προς την µονοαξονική έκτακτη παραµόρφωση στο πεδίο τάσης όπου ισχύει ο νόµος του Hooke. Το µέτρο ελαστικότητας επιτρέπει τον υπολογισµό της συµπεριφοράς µιας ϱάβδου από ισοτροπικό ελαστικό υλικό που υποβάλλεται σε εφελκυστικά ή συµπιεστικά ϕορτία,
.. ΕΙΣΑΓΩΓ Η 3 4 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η π.χ. χρησιµοποιείται για να προβλεφθεί το µήκος επέκτασης ενός καλωδίου όταν υποβληθεί σε εφελκισµό. Το µέτρο ελαστικότητας του Young, E, υπολογίζεται διαιρώντας την εφελκυστική τάση µε την έκτακτη παραµόρφωση που οφείλεται στην συγκεκριµένη τάση: E = F/A 0 L/L 0 = FL 0 A 0 L. όπου F είναι η δύναµη που εφαρµόζεται στο αντικείµενο, A 0 είναι το αρχικό εµβαδόν διατοµής του αντικειµένου δια µέσου της οποίας εφαρµόζεται η δύναµη, L είναι το µήκος παραµόρφωσης, το ποσόν δηλαδή µε το οποίο το αρχικό µήκος του αντικειµένου επεκτείνεται και L 0 είναι το αρχικό µήκος του αντικειµένου. Ο νόµος του Hooke, ο οποίος περιγράφει την ακαµψία ενός ιδεατού ελατηρίου, µπορεί να παραχθεί από τον τύπο του Young: ( ) EA0 όπου k = και x = L. L 0 ( ) EA0 F = L = kx, L 0 Ας υποθέσουµε ότι ένα καλώδιο πριν διατεθεί στην αγορά υποβάλλεται σε δοκιµές αντοχής. Συγκεκριµένα διάφορα ϐάρη w k αναρτώνται στην µία άκρη του καλωδίου, αρχικού µήκους L 0, αφού η άλλη του άκρη έχει σταθεροποιηθεί, και τα µήκη l k που το καλώδιο λαµβάνει κάτω από την επηροή των ϐαρών καταµετρώνται. Το αποτέλεσµα είναι η διαµόρφωση ενός πίνακα όπως k 2 3 4 5 6 7 8 9 w k 6 8 2 24 26 27 3 33 35 l k 23.044 23.850 24.657 25.463 26.270 27.076 28.689 29.496 30.496 Εάν γνωρίζαµε το µήκος του καλωδίου L o όταν αυτό δεν υποβάλλεται σε εφελκυστική τάση, π.χ. L o = 23.000, και εάν επίσης η µέση διάµετρός του, D = 0.5, έχει µετρηθεί, τότε για κάθε µήκος l k, µπορούµε εύκολα να υπολογίσουµε µία αντίστοιχη τιµή E k, διότι η αντίστοιχη δύναµη F k υπολογίζεται µετατρέποντας την µάζα σε ϐάρος F k = g w k, το µήκος της παραµόρφωσης L k υπολογίζεται ως L k = l k L o και τέλος το εµβαδόν A o = πd2 4 παραµένει το ίδιο για όλες τις µετρήσεις. Ετσι, για g = 386, οι τιµές της ελαστικότητας Young αντίστοιχες των δεδοµένων του πίνακα είναι 2 3 4 5.903Ε9 5.737Ε6.763Ε6 9.04Ε5 5.5993Ε05 6 7 8 9 3.7424Ε5 2.2057Ε5.8008Ε5.4344Ε5 µε µέση τιµή 2.256E8. Πώς ϑα µπορούσαµε όµως να εκτιµήσουµε το µέτρο του Young για ϐάρη που δεν εµπεριέχονται στον πίνακα, όπως π.χ. για 25 ή 34; Και αν το ανεπηρέαστο µήκος του καλωδίου, L o, δεν καταµετρήθηκε ποτέ, π.χ. διότι για να εξαλειφθεί η ενδεχόµενη επιρροή από σπειρώσεις, στριψίµατα και τυλίγµατα, το µήκος του καλωδίου µετρήθηκε για πρώτη ϕορά µόνο τεντωµένο υπό την εφέλκυση του αρχικού ϐάρους, πως ϑα µπορούσε να εκτιµηθεί το L o που είναι τόσο απαραίτητο στον υπολογισµό της ελαστικότητας Young; Παράδειγµα.4 Πίνακες στοιχειωδών συναρτήσεων Υπάρχουν συναρτήσεις των οποίων ο υπολογισµός, παρά την απλή τους εµφάνιση, είναι δύσκολος καθώς δεν στηρίζεται στις στοιχειώδεις πράξεις της πρόσθεσης/αφαίρεσης και πολλαπλασιασµού/διαίρεσης. Για τον λόγο αυτό, οι τιµές τους πινακοποιούνται και οι πίνακες αυτοί διατίθενται τυπωµένοι ή/και µε την µορφή ψηφιακών καταλόγων. Τέτοιοι πίνακες υπάρχουν π.χ. για τις τριγωνοµετρικές συναρτήσεις, για τις εκθετικές συναρτήσεις, για τους λογαρίθµους, κ.α. Απόσπασµα από έναν τέτοιο πίνακα για τον λογάριθµο µε ϐάση το 0 είναι τ ακόλουθο: x log(x) x log(x).00 0.0000000.0 0.043927.60 0.204200.20 0.07982.70 0.2304489.30 0.39434.80 0.2552725.40 0.46280.90 0.2787536.50 0.76093 2.00 0.300300 Σχεδόν για όλους τους αντίστοιχους πίνακες, οι τιµές της µεταβλητή x αποτελούν µία αριθµητική πρόοδο και η κοινή διαφορά των τιµών h είναι το ϐήµα (step) του πίνακα: h = x k+ x k = σταθερά, k = 0,,2,...,n x k = x o + k h, k = 0,,2,...,n. Λέµε ότι τα σηµεία του πίνακα είναι ισαπέχοντα (equidistant) ανά δύο διαδοχικά. Στο απόσµασµα του λογαριθµικού πίνακα το ϐήµα είναι h = 0. και αποτελεί την απόσταση δύο διαδοχικών σηµείων. Οι τιµές της συνάρτησης για όλα τα x ενός πίνακα παρουσιάζονται µε το ίδιο απόλυτο σφάλµα. Ολες οι τιµές έχουν δηλαδή την ίδια ακρίβεια και αυτή είναι η ακρίβεια του πίνακα. Ετσι, στο απόσπασµα του λογαριθµικού πίνακα, όλες οι τιµές της συνάρτησης log(x) παρουσιάζονται µε ακρίβεια 7 δεκαδικών και συνεπώς τ απόλυτο σφάλµα κάθε τιµής ξεχωριστά είναι ε = 0.5 0 7. Ο σκοπός αυτών των πινάκων είναι να επικουρήσουν τον υπολογισµό της συνάρτησης τόσο για τις δεδοµένες τιµές του x όσο και για τιµές του x που δεν έχουν καταχωρηθεί στον πίνακα. Αλλά πως µπορεί να επιτευχθεί ο υπολογισµός, π.χ. του log(.45) µε την χρήση των τιµών του πίνακα; Σ όλα τα προηγούµενα παραδείγµατα, το ϐασικό πρόβληµα είναι ο υπολογισµός µιας αναλυτικά δύσκολης ή άγνωστης συνάρτησης y = f(x), γνωστής µόνον εν
.. ΕΙΣΑΓΩΓ Η 5 µέρει µέσω των πινακοποιηµένων τιµών της, {f(x i )} n, για ένα πλέγµα P σηµείων ή κόµβων {x i } n, σε σηµεία, x P, που δεν είναι κόµβοι. Ενας τρόπος επίλυσης αυτού του προβλήµατος είναι να προσεγγισθεί η συνάρτηση y = f(x)) από µία συνάρτηση y = F(x) µε σχετικά εύκολο να υπολογισθεί αναλυτικό τύπο. Ετσι, η άγνωστη τιµή f(x) για x P προσεγγίζεται από την τιµή F(x) που µπορεί να υπολογισθεί σχετικά εύκολα. Για να επιτευχθεί όµως κάτι τέτοιο, ϑα πρέπει να διευκρινισθεί (α) τι εννοείται ό- ταν λέγεται πως η y = F(x) προσεγγίζει την y = f(x) (ϐ) πως εννοείται η «καλή» προσέγγιση της y = f(x) από την y = F(x) (γ) τι είδους συναρτήσεις, ποια κλάση δηλαδή συναρτήσεων, ϑεωρούνται ως υποψήφιες για το ορισµό της y = F(x) και (δ) πως ορίζεται το σφάλµα της προσέγγισης, δηλαδή η διαφορά µεταξύ της εκτιµούµενης και της ακριβούς τιµής y = f(x). Ο περιορισµός σε µία µόνον κλάση συναρτήσεων και η εξ αυτής επιλογή της y = F(x) για την καλύτερη δυνατή προσέγγιση της y = f(x) είναι αναγκαίος διότι διαφορετικά το πρόβληµα µπορεί να επιδέχεται άπειρες ή και καθόλου λύσεις. Ως δε κριτήριο καλής προσέγγισης ή καλής προσαρµογής της y = F(x), από την συγκεκριµένη κλάση, στην y = f(x) χρησιµοποιείται συχνά, αλλά όχι αποκλειστικά, το κριτήριο Chebyshev d = max,,...,n f(x i) F(x i ), το οποίο ϐασίζεται στην έννοια της απόστασης µε την µορφή της µέγιστης απόκλισης της συνάρτησης F( ) από την συνάρτηση f( ) στους κόµβους x i του πλέγµατος P. Ενα άλλο συχνό κριτήριο καλής προσέγγισης ή προσαρµογής δίδεται από την έννοια της απόστασης µε την µορφή του αθροίσµατος των τετραγώνων των αποκλίσεων για τους κόµβους x i του πλέγµατος P: d 2 = (f(x i ) F(x i )) 2. Ενα τρίτο κριτήριο µπορεί να ϐασισθεί στην έκφραση της απόστασης ως αθροίσµατος των απολύτων τιµών των αποκλίσεων στους κόµβους x i του πλέγµατος P: d = f(x i ) F(x i ). Τυπικά, από µία κλάση συναρτήσεων F, επιλέγεται ως συνάρτηση καλής προσέγγισης της y = f(x) εκείνη η συνάρτηση F( ) F η οποία ελαχιστοποιεί την ορισθείσα απόσταση κάποιου κριτηρίου. Στην περίπτωση της d 2, η διαδικασία επιλογής και ταυτοποίησης της F( ) είναι γνωστή ως µέθοδος των ελαχίστων τετραγώνων (least squares method). Η µέθοδος αυτή χρησιµοποιείται συνήθως όταν επιθυµούµε να διατυπώσουµε τις τάσεις των δεδοµένων ή όταν υπάρχει πλή- ϑος πληροφόρησης αλλά µε χαµηλή ακρίβεια, π.χ. η y = f(x) προέρχεται από 6 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η κάποιο πείραµα όπου έγιναν πολλές µετρήσεις αλλά µε όργανα χαµηλής ακρί- ϐειας, έτσι είναι µεν γνωστή σε πολλά σηµεία x i αλλά η ακρίβεια των τιµών της f(x i ) είναι χαµηλή. Ως προς την επιλογή κλάσης συναρτήσεων, πέντε είναι αυτές που εµφανίζονται συχνότερα στις εφαρµογές:. Η πολυνυωµική κλάση που αποτελείται από πολυώνυµα ϐαθµού το πολύ n τα οποία είναι γραµµικοί συνδυασµοί των συναρτήσεων, x, x 2,...,x n. 2. Η κλάση των τµηµατικώς πολυωνυµικών συναρτήσεων (splines) µε πολλές εφαρµογές στα γραφικά Η/Υ, στις κινήσεις ϱοµποτικών ϐραχιόνων και στον σχεδιασµό µε την υποστήριξη Η/Υ (CAD/CAM). 3. Η τριγωνοµετρική κλάση, όπου οι συναρτήσεις sin(a i x) και cos(a i x) χρησιµοποιούνται για την δηµιουργία σειρών και ολοκληρωµάτων Fourier. Η προσέγγιση µε πολυώνυµο Chebyshev, όπου οι κόµβοι x k του πλέγµατος δηµιουργούνται στο κανονικοποιηµένο διάστηµα [, +] από τον τύπο ( ) 2n + 2k x k = cos π, k = 0,,..., n, 2(n + ) δεν ανήκει σ αυτήν την κλάση αλλά στην πρώτη. 4. Η εκθετική κλάση, όπου οι εκθετικές συναρτήσεις exp(a i x) χρησιµοποιούνται στην προσέγγιση σωρευτικών και αποσυνθετικών ϕαινοµένων. 5. Η κλάση ϱητών συναρτήσεων (κλασµάτων πολυωνύµων) που χρησιµοποιείται στην προσέγγιση Padé. Στο παρόν κεφάλαιο ϑα εξετάσουµε την ιδιαίτερη περίπτωση του κριτηρίου Chebyshev όπου ϑ απαιτήσουµε d = 0 για την συνάρτηση προσέγγισης F( ). Αυτό ουσιαστικά σηµαίνει πως απαιτούµε πλήρη ταύτιση της F( ) και της f( ) για τους κόµβους του πλέγµατος: F(x i ) = f(x i ), x i P. (.) Επίσης ϑα επιλέξουµε την F( ) από την πολυωνυµική κλάση. Η διαδικασία αναζήτησης συνάρτησης F( ) που να ικανοποιεί τις συνθήκες (.) ονοµάζεται παρεµβολή (interpolation) µε την ευρεία έννοια, η συνάρτηση F( ) ονοµάζεται συνάρτηση παρεµβολής ενώ τα σηµεία {(x i, f(x i ))} n, αλλά κάποιες ϕορές και τα ίδια σηµεία του πλέγµατος P, αναφέρονται και ως σηµεία παρεµ- ϐολής. Οταν η επιλογή της F( ) περιορίζεται στα πολυώνυµα ϐαθµού το πολύ n οµιλούµε περί πολυωνυµικής παρεµβολής. Οταν η F( ) καθορίζεται για την εκτίµηση της τιµής y = f(x) σε σηµεία x που ικανοποιούν x [x o, x n ], οµιλούµε
.. ΕΙΣΑΓΩΓ Η 7 περί παρεµβολής µε την στενή έννοια, ενώ εάν x [x o, x n ], οµιλούµε περί πα- ϱεκβολής (extrapolation). Π.χ. στο Παράδειγµα.3 η εκτίµηση των µηκών που λαµβάνει το καλώδιο για τα ϐάρη 25 και 34 µε µία τέτοια συνάρτηση F( ) αντιστοιχεί σε παρεµβολή µε την στενή έννοια, ενώ αν αποτολµηθεί και η εκτίµηση του αρχικού µήκους, L o, µε την ίδια συνάρτηση ϑα αντιστοιχεί σε παρεκβολή. 8 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η χρώµα µαγέντα) που δεν διέρχεται από κάποιο από τα δεδοµένα σηµεία πλην του τελευταίου. Για το Παράδειγµα.3, η εκτίµηση των µηκών για τα ϐάρη 25 και 34 που είναι εσωτερικά του δεδοµένου πλέγµατος ϑα µπορούσε να επιτευχθεί µε την διαδικασία της παρεµβολής. Για την εκτίµηση όµως του αρχικού µήκους, L o, που αντιστοιχεί στο ϐάρος 0, το οποίο όχι µόνον είναι εξωτερικό του δεδοµένου πλάγµατος αλλά και σε πολύ µεγάλη απόσταση απ αυτό, η χρήση της παρεκβολής δεν συνιστάται. Η προσαρµογή καµπύλης, π.χ. µε την χρήση της µεθοδολογίας των ελαχίστων τετραγώνω, που να εκφράζει την τάση των δεδοµένων ϑα ήταν οπωσδήποτε η καταλληλότερη επιλογή από τις δύο. Θα εξετάσουµε την προσαρµογή καµπύλης σε ιδιαίτερο κεφάλαιο. Σχήµα.2: Πολυώνυµο παρεµβολής ϐαθµού για το Παράδειγµα. της Ωµικής αντίστασης υλικού Γεωµετρικά (Σχήµα.2), το πρόβληµα της παρεµβολής για την συνάρτηση y = f(x) αφορά στην κατασκευή στον Καρτεσιανό (x, y)-χώρο µιας καµπύλης η οποία διέρχεται από τα σηµεία {(x o, f i (x o ))} n, όπου στην περίπτωση της πολυωνυµικής παρεµβολής, η καµπύλη αυτή αντιστοιχεί στην γραφική παράσταση ενός πολυωνύµου ϐαθµού το πολύ n. ιαχωρίζουµε έτσι γενικώς την παρεµβολή από την προσαρµογή καµπύλης (curve fitting). Η παρεµβολή αφορά στην εύσχηµη σύνδεση δεδοµένων διακριτών σηµείων στον (x, y)-καρτεσιανό χώρο µε τέτοιον τρόπο ώστε να επιτευχθεί µία λογική εκτί- µηση για σηµεία ενδιάµεσα των δεδοµένων, ενώ η προσαρµογή καµπύλης, όπως π.χ. στην περίπτωση των ελαχίστων τετραγώνων, αποσκοπεί στην ανεύρεση µιας καµπύλης, η οποία σύµφωνα µε κάποια έννοια απόστασης, υποδεικνύει όσον το δυνατόν καλύτερα την ϱοπή των δεδοµένων. Η καµπύλη αυτή δεν απαιτείται να διέρχεται από τα δεδοµένα σηµεία στον (x, y)-καρτεσιανό χώρο. Π.χ. η διαφο- ϱοποίηση αυτή είναι εµφανής στο Σχήµα.3, όπου, για τον πίνακα δεδοµένων του Παραδείγµατος.3, δίνεται τόσο ένα πολυώνυµο παρεµβολής (µε το πράσινο χρώµα) που διέρχεται απ όλα τα σηµεία όσο και µία προσαρµογή καµπύλης (µε Σχήµα.3: Πολυώνυµο παρεµβολής ϐαθµού 8 και προσαρµογή καµπύλης για τα δεδοµένα ϐάρη και µήκη του Παραδείγµατος.3 του µέτρου Young ελαστικότητας υλικού. Χαρακτηριστικό παράδειγµα πολυωνυµικής παρεµβολής είναι η χορδή µε την ο- ποία προσεγγίζεται η συνάρτηση f(x) στην µέθοδο της χορδής. Για δύο (n = ) σηµεία x k και x k µε αντίστοιχες τιµές f(x k ) και f(x k ), η συνάρτηση f(x) προσεγγίζεται από το πολυώνυµο πρώτου (n = ) ϐαθµού P (x) = f(x k ) + f(x k) f(x k ) x k x k (x x k ), το οποίο εκφράζει την γραµµή της χορδής που διέρχεται από τα σηµεία (x k, f(x k ))
.. ΕΙΣΑΓΩΓ Η 9 και (x k, f(x k )). Επειδή το πολυώνυµο είναι γραµµικό, στην περίπτωση αυτήν έχοµε γραµµική παρεµβολή (linear interpolation). Π.χ., από τον πίνακα στο Παράδειγµα.4, εκτιµούµε την τιµή του λογαρίθµου στο.45 ως P (.45) = 0.622203 επιλέγοντας x k =.30, f(x k ) = 0.39434, x k =.40 και f(x k ) = 0.46280 από τον πίνακα. Για σύγκριση, η ακριβής τιµή του log(.45) είναι 0.6368. Ως σφάλµα προσέγγισης της f( ) από την συνάρτηση παρεµβολής F( ), όταν η τιµή, f( x), της πρώτης σ ένα συγκεκριµένο σηµείο x εκτιµάται µε την τιµή, F( x), της δεύτερης, εκλαµβάνεται η απόλυτη τιµή της διαφοράς µεταξύ της ακριβούς και της προσεγγιστικής τιµής: ε( x) = f( x) F( x). (.2) Ετσι, για το παράδειγµα της γραµµικής παρεµβολής, το σφάλµα είναι 0.6368 0.622203 = 0.0008523. Εάν όµως η παρεµβολή αφορά σ όλα τα σηµεία ενός διαστήµατος [a, b], όπου a x o < x < x 2 < x n b, το σφάλµα προσέγγισης, σύµφωνα µε το κριτήριο Chebyshev, είναι ε = max f(x) F(x). (.3) x [a,b] Η πολυωνυµική παρεµβολή µπορεί ν ατυχίσει στην πράξη όταν π.χ. ο ϐαθµός του πολυωνύµου είναι πολύ υψηλός. Ετσι για 00 σηµεία παρεµβολής, το απαιτούµενο πολυώνυµο παρεµβολής µπορεί να είναι ϐαθµού 99 και ϐαθµού 999 για 000 σηµεία. Η αύξηση του ϐαθµού συνεπάγεται αύξηση του ϕόρτου υπολογισµών για την προσέγγιση της τιµής f(x) µε την τιµή F(x) µε επακόλουθο και την αύξηση των σφαλµάτων στρογγυλοποίησης και άρα του ολικού σφάλµατος στην προσέγγιση. Ενα δεύτερο µειονέκτηµα είναι ότι, λόγω του τρόπου ορισµού τους, τα πολυώνυµα αυτά µπορεί να παρουσιάσουν ένα ϕαινόµενο υψηλών διακυµάνσεων ή ταλαντώσεων. ηλαδή, ενώ f(x i ) = F(x i ), για όλες τις πινακοποιηµένες τιµές της συνάρτησης f( ), δεν υπάρχει τίποτα που να εµποδίζει το πολυώνυµο F( ) από το να είναι µία πολύ κακή προσέγγιση της f( ) σε σηµεία που δεν περιέχονται στον πίνακα τιµών της f( ). Οπως ϕαίνεται από το Σχήµα.2, τα προαναφερθέντα µειονεκτήµατα µπορεί να εµφανισθούν και σε πολυώνυµα πολύ µικρότερου ϐαθµού από 99 ή 999. Η απότοµη διακύµανσή του πολυωνύµου στα διαστήµατα [ 5, 0] και [0, 5] µας δηµιουργεί οπωσδήποτε αµφιβολίες για την ποιότητα των προσεγγίσεων που µπορεί να προσφέρει στις τιµές της Ωµικής αντίστασης στα συγκεκριµένα διαστή- µατα, όταν οι τιµές του πίνακα ϕαίνεται να υποδεικνύουν µία ουσιαστικά µονότονη συνάρτηση. Ετσι η άγνωστη τιµή R(25 o C) προσεγγίζεται από το πολυώνυµο µε την τιµή 78.807 που ϕαίνεται λογική σε σύγκριση µε τις άλλες τιµές του πίνακα, ενώ οι άγνωστες τιµές R = f( 2 o C) και R = f(2 o C) προσεγγίζονται µε τις τιµές 72.45082 και 64.6797 που δεν ϕαίνεται να συµβαδίζουν µε τις άλλες τιµές του πίνακα. 0 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η Γενικά, η πολυωνυµική παρεµβολή, µε την µορφή ενός πολυωνύµου αποτυπω- µένου σε αναλυτικό τύπο, χρησιµοποιείται συνήθως µόνον όταν τα πολυώνυµα που απαιτούνται είναι µικρού σχετικά ϐαθµού, µε την γραµµική, τετραγωνική και κυβική παρεµβολή να είναι οι πιο συνηθισµένες. Θα εξετάσουµε τεχνικές που προσεγγίζουν την τιµή f(x) της συνάρτησης f( ) σε αυθαίρετο σηµείο x [x o, x n ] µε την τιµή F(x) ενός πολυωνύµου παρεµβολής χωρίς ν απαιτούν εν γένει τον αναλυτικό τύπο του πολυωνύµου F(x) στην µορφή a n x n + a n x n + + a x + a o. Η πολυωνυµική παρεµβολή είναι πολύ σηµαντική και στην αριθµητική παραγώγιση και ολοκλήρωση συναρτήσεων όπως ϑα δούµε σε ιδιαίτερο κεφάλαιο..2 Υπαρξη Πολυωνύµου Παρεµβολής Το κάτωθι ϑεώρηµα του Weierstrass, σύµφωνα µε το οποίο µία συνεχής συνάρτηση σ ένα κλειστό διάστηµα µπορεί να προσεγγισθεί οµοιόµορφα από ένα πολυώνυµο, αναφέρεται συχνά ως δικαιολογία για την χρήση πολυωνυµικής παρεµβολής. Θεώρηµα. Θεώρηµα Προσέγγισης του Weierstrass Εστω ότι η συνεχής συνάρτηση f( ) είναι ορισµένη στο διάστηµα [a, b]. Για κάθε ǫ > 0 υπάρχει ένα πολυώνυµο P( ) τέτοιο ώστε f(x) P(x) < ǫ, x [a, b]. Οµως η απαίτηση στην πολυωνυµική παρεµβολή για ακριβή σύµπτωση των P( ) και f( ) στα σηµεία {x k } του πλέγµατος δεν συµπίπτει µε τον ορισµό του πολυωνύµου στο ϑεώρηµα αυτό, γνωστό και ως Θεώρηµα των Weierstrass Stone. Ετσι, το ϑεώρηµα αν και υποβλητικό δεν είναι εφαρµόσιµο στην περίπτωση της πολυωνυµικής παρεµβολής. Από την άλλη πλευρά, το ϑεώρηµα που ακολουθεί αφορά στην περίπτωση αυτή. Θεώρηµα.2 Υποθέτουµε ότι στο διάστηµα [a, b] είναι δεδοµένο ένα πλέγµα P µε n + σηµεία {x k } n που ικανοποιούν a x o < x < x 2 < < x n b και n + αντίστοιχοι αυθαίρετοι αριθµοί {f k } n. Τότε υπάρχει ένα πολυώνυµο P( ) ϐαθµού όχι µεγαλύτερου του n που στα σηµεία {x k } n λαµβάνει τις αντίστοιχες τιµές {f k } n, και το πολυώνυµο αυτό είναι µοναδικό. Απόδειξη: Αναζητούµε ένα πολυώνυµο P(x) = a n x n + a n x n + + a 2 x 2 + a x + a o,
.2. ΥΠΑΡΞΗ ΠΟΛΥΩΝ ΥΜΟΥ ΠΑΡΕΜΒΟΛ ΗΣ του οποίου οι συντελεστές {a k } n είναι άγνωστοι. Για να ταυτοποιήσουµε τους n + συντελεστές έχουµε στην διάθεσή µας n + εξισώσεις : a n x n o + a n xo n + + a 2 x 2 o + a x o + a o = f o a n x n + a n x n + + a 2 x 2 + a x + a o = f a n x n 2 + a n x2 n + + a 2 x 2 2 + a x 2 + a o = f 2 Va = f, (.4)................................................ a n x n n + a n xn n + + a 2 x 2 n + a x n + a o = f n όπου η µήτρα, V, των συντελεστών του συστήµατος είναι γνωστή ως µήτρα Vandermonde. Η ορίζουσα του συστήµατος είναι x n o xo n x o x n x n x det(v) W(x o, x,..., x n ) = x n 2 x2 n x 2, (.5).................... x n n xn n x n Η ορίζουσα αυτή, γνωστή ως ορίζουσα Vandermonde, είναι προφανώς συνάρτηση των κόµβων x o, x,...,x n. Συµπεραίνουµε, από το Λήµµα. που ακολουθεί, ότι η ορίζουσα Vandermonde είναι µη-µηδενική, W 0, εάν τα σηµεία {x k } του πλέγµατος είναι όλα διαφορετικά, x i x k (i k). Επειδή W 0, το σύστηµα (.4) έχει µία µοναδική λύση a = (a n, a n,...,a 2, a, a o ) T η οποία µπορεί να υπολογισθεί, π.χ. µε τον κανόνα του Cramer: a k = W k, k = 0,, 2,..., n, W όπου x n o xo n x k+ o f o x k o x o x n x n x k+ f x k x W k = x n 2 x2 n x k+ 2 f 2 x k 2 x 2 (για k = 0,, 2,..., n)......................................... x n n xn n x k+ n f n x k n x n είναι η ορίζουσα W µε την δεξιά πλευρά του συστήµατος (.4) όµως να έχει αντικαταστήσει την στήλη k. Η ύπαρξη και µοναδικότητα των συντελεστών (a n, a n,..., a 2, a, a o ) T συνεπάγεται την ύπαρξη και µοναδικότητα του πολυωνύµου P( ) που ικανοποιεί τις προϋποθέσεις του ϑεωρήµατος. Εάν a n 0, το πολυώνυµο είναι ϐαθµού n, και ϐαθµού < n εάν a n = 0. Η κατανόηση της απόδειξης και όλης της.2 προϋποθέτει γνώσεις Γραµµικής Άλγεβρας. 2 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η Η ύπαρξη και η µοναδικότητα πολυωνύµου παρεµβολής είναι άµεσο επακόλουθο του ϑεωρήµατος για τη περίπτωση που f k = f(x k ) για κάποια συνάρτηση f( ). Πόρισµα. Εστω ότι η συνάρτηση f( ) είναι συνεχής στο [a, b] και η οποία για ένα πλέγµα P από n + σηµεία a x o < x < < x n a λαµβάνει τις αντίστοιχες n + τιµές {f(x k )} n. Υπάρχει τότε ένα πολυώνυµο P( ) ϐαθµού, το πολύ, n που ικανοποιεί τις συνθήκες παρεµβολής P(x k ) = f(x k ) k = 0,, 2..., n, και το πολυώνυµο αυτό είναι µοναδικό. Λήµµα. Ορίζουσα Vandermonde Για την µήτρα Vandermonde, det(v), από την εξίσωση (.5) έχοµε det(v) = W(x o, x,...,x n ) = (x i x k ), (.6) 0 k<i n το οποίο είναι γνωστό ως πολυώνυµο Vandermonde. Απόδειξη: Για n = 2 έχοµε det(v 2 ) = x x 2 = x 2 x. Για αυθαίρετο n, αφαιρούµε τον πρώτο στοίχο από τους υπόλοιπους, οπότε x x n x x n x 2 x2 n 0 x 2 x x2 n x n det(v n ) = =....... x n xn n 0 x n x xn n x n Ανάπτυξη κατά µήκος της πρώτης στήλης δίδει det(v n ) =. x n x xn n x 2 x x2 n x n. x n Από τον kστό στοίχο µπορούµε να εξάγουµε τον παράγοντα x k x, οπότε n 2 x 2 + x x2 n 2 i x i ( n ) n 2 x 3 + x x3 n 2 i x i det(v n ) = (x k x ). k=2... n 2 x n + x xn n 2 i x i.
.2. ΥΠΑΡΞΗ ΠΟΛΥΩΝ ΥΜΟΥ ΠΑΡΕΜΒΟΛ ΗΣ 3 4 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η Αφαιρούµε από την δεύτερη στήλη την πρώτη επί x και συνεχίζουµε έτσι µε την τρίτη, τέταρτη, κ.λ.π., οπότε ( n ) x 2 x n 2 2 x 3 x n 2 3 det(v n ) = (x k x ) k=2... x n xn n 2 ( n ) ή, ισοδύναµα, det(v n ) = (x k x ) det(v n ). Επειδή επαναλαµβάνοντας k=2 στο τέλος αποµένει να υπολογίσουµε απλώς την αποδεικνύουµε έτσι τον τύπο (.6). det(v 2 ) = x n x n = x n x n, Παράδειγµα.5 Εστω ότι γνωρίζουµε µία συνάρτηση από το πίνακα n+ = 2 δεδοµένων x - 2 f(x) 2 6 Επειδή έχοµε δύο γνωστά σηµεία µπορούµε να παρεµβάλοµε το γραµµικό πολυώνυµο P(x) = a x + a o. Για την ανεύρεση των συντελεστών του πολυωνύµου παρεµβολής δια µέσου αυτών των σηµείων, δηµιουργούµε το σύστηµα Va = f, όπου ( ) ( ) ( ) a 2 V =, a =, f = 2 a o 6 Το σύστηµα επιλύεται για a = 4 3 και a o = 0 3. Άρα το πολυώνυµο παρεµβολής είναι P(x) = 4 3 x + 0 3, ϐαθµού n =. Η παρεµβολή είναι γραµµική, όπως στην περίπτωση της χορδής. Για να εκτιµήσουµε την τιµή της άγνωστης συνάρτησης f( ) στο ενδιάµεσο σηµείο x =, υπολογίζουµε το πολυώνυµο στο σηµείο αυτό και λαµβάνοµε την τιµή P() = 4 3. Παρεκβολή (extrapolation) σηµαίνει ότι εκτιµούµε την τιµή της συνάρτησης σε σηµείο που δεν είναι ενδιάµεσο των δεδοµένων. Π.χ. εκτιµούµε την άγνωστη τιµή f( 2) µε την τιµή P( 2) = 2 3. Η παρεκβολή είναι συνήθως λιγότερο ακριβής εκτίµηση από την παρεµβολή και συχνά «επικίνδυνη» να εφαρµοσθεί στην πράξη, π.χ. για προβλέψεις σε δεδοµένα χρηµατιστηρίου. Παράδειγµα.6 Επανεξετάζουµε το Παράδειγµα. της Ωµικής αντίστασης του υλικού. Υπάρχουν n+ = 2 δεδοµένα, άρα αναζητούµε πολυώνυµο παρεµβολής ϐαθµού, το πολύ, n =. Για την ταυτοποίηση των συντελεστών του πολυωνύµου ϑέτουµε το σύστηµα Va = r, όπου η V είναι η (2 2) µήτρα Vandermonde, a είναι το διάνυσµα των 2 αγνώστων συντελεστών του πολυωνύµου και r είναι το διάνυσµα µε τα 2 στοιχεία της καταµετρηµένης αντίστασης R. Ας είναι t ένα διάνυσµα µε τα 2 στοιχεία ϑερµοκρασίας που καταµετρή- ϑηκαν στο πείραµα και καταχωρήθηκαν στο T. Τότε, οι 2 στήλες της V αντιστοιχούν σε V = (t t 0 t 9 t 2 tt 0 ), όπου οι δυνάµεις,,0,...,2,0, εφαρµόζονται στα στοιχεία των διανυσµάτων και όχι στα διανύσµατα αυτά καθ εαυτά. Επειδή, σύµφωνα µε την απόδειξη του προηγούµενου ϑεω- ϱήµατος, det(v) 0, η µήτρα Vandermonde είναι αντιστρέψιµη, η λύση του συστήµατος µπορείνα υπολογισθεί ως a = V r. Το Ϲητούµενο πολυώνυµο είναι τότε P(x) = a x + a 2 x 0 + a 3 x 9 + a 4 x 8 + a 5 x 7 + a 6 x 6 + a 7 x 5 + a 8 x 4 + a 9 x 3 + +a 0 x 2 + a x + a 2 = (.7) n+ = a k x n+ k, k= όπου a = (a,a 2,...,a,a 2 ) T είναι λύση του συστήµατος. Στο Scilab, εφόσον καταχωρηθεί ο πίνακας του Παραδείγµατος. στα διανύσµατα T και R, το απόσπασµα κώδικα που ακολουθεί ϑα επιλύσει το σύστηµα αντιστρέφοντας την µήτρα Vandermonde, ϑα δηµιουργήσει το πολυώνυµο παρεµβολής, ϑα το υπολογίσει στο διάστηµα [ 5,5.3] για µια σειρά ισαπεχόντων σηµείων µε ϐήµα h = 0. και τέλος ϑα δηµιουργήσει την γραφική του παράσταση (Σχήµα.2). V=[T.^ T.^0 T.^9 T.^8 T.^7 T.^6 T.^5 T.^4 T.^3 T.^2 T T. ^0]; a=inv (V) R; deff ( p=p( x ), p=a() x^+a(2) x^0+a(3) x^9+a(4) x^8+a(5) x^7... +a( 6) x^6+a( 7) x^5+a( 8) x^4+a( 9) x^3+a(0) x^2+a() x+a(2) ) ; x= 5:0.:5.3; y=p( x ) ; plot ( x,y, b,t,r, r ) ; Ο τελεστής. εφαρµόζει την ανύψωση σε δύναµη στα στοιχεία του αντίστοιχου διανύσµατος και η συνάρτηση inv αντιστρέφει την µήτρα V. Σε Octave/Matlab χρησιµοποιούµε την συνάρτηση inline αντί της deff. Για την προσέγγιση της Ωµικής αντίστασης σε ϑερµοκρασία που δεν περιέχεται στον πίνακα του Παραδείγµατος. µπορούµε να χρησιµοποιήσουµε την αντίστοιχη τιµή του πολυωνύµου. Ενα σοβαρότατο πρόβληµα µε την διαδικασία που υποδεικνύει η απόδειξη του ϑεωρήµατος και που την χρησιµοποιήσαµε στο προηγούµενο παράδειγµα είναι ότι η µήτρα Vandermonde είναι κακής κατάστασης. Αυτό συνεπάγεται ότι εισάγονται µεγάλα σφάλµατα κατά την επίλυση του συστήµατος εξισώσεων. Μάλιστα όσο το πλήθος των δεδοµένων αυξάνει τόσο χειροτερεύει και η κατάσταση της µήτρας Vandermonde και άρα εισάγονται συνεχώς µεγαλύτερα σφάλµατα. Ετσι, εάν η ακρίβεια του Η/Υ είναι ε, τότε το σχετικό σφάλµα στην λύση του συστήµατος ϑα
.3. ΠΟΛΥ ΩΝΥΜΟ ΣΕ ΜΟΡΦ Η LAGRANGE 5 6 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η είναι της τάξης ε cond(v), όπου cond(v) = V V είναι ο αριθµός κατάστασης της µήτρας. Στην περίπτωση του προηγουµένου παραδείγµατος, ο αριθµός κατάστασης της µήτρας είναι πολύ υψηλός, cond(v) 3.288 0 9. Για την αποφυγή του προβλήµατος, ϑα εξετάσουµε στην συνέχεια διαδικασίες πολυωνυµικής παρεµβολής που δεν απαιτούν την αριθµητική επίλυση του συστή- µατος Va = f για τον υπολογισµό των συντελεστών του πολυωνύµου P(x) = n a kx k καθώς ϑα χρησιµοποιηθούν διαφορετικές µορφές του πολυωνύµου..3 Πολυώνυµο σε Μορφή Lagrange Λόγω των αριθµητικών δυσκολιών στην επίλυση του συστήµατος Va = f, όπου η V είναι η µήτρα Vandermonde, ϑα εξετάσουµε την συµβολική επίλυση αντί της αριθµητικής του συστήµατος. Θα εξετάσουµε δηλαδή εάν µπορούµε να διατυπώσουµε την λύση του συστήµατος µε αλγεβρικούς τύπους. Το επόµενο παράδειγµα επεξηγεί την τελευταία έννοια. Παράδειγµα.7 Θεωρούµε µία συνάρτηση f( ) δεδοµένη µε την µορφή πίνακα n+ = 3 σηµείων: k 0 2 x x o x x 2 y = f(x) y o = f(x o ) y = f(x ) y 2 = f(x 2 ) Αναζητούµε πολυώνυµο παρεµβολής ϐαθµού, το πολύ, n = 2 που διέρχεται από τα σηµεία (x o,y o ),(x,y ) και (x 2,y 2 ). Αναζητούµε δηλαδή P(x) = a 2 x 2 + a x + a o τέτοιο ώστε P(x o ) = y o,p(x ) = y και P(x 2 ) = y 2. Οι απαιτήσεις αυτές διαµορφώνουν το σύστηµα εξισώσεων a 2 x 2 o + a x o + a o = y o a 2 x 2 + a x + a o = y a 2 x 2 2 + a x 2 + a o = y 2, µε αγνώστους τους τρεις συντελεστές a 2,a και a o του δευτεροβάθµιου πολυωνύµου P( ). Οπως έχοµε δει, η µήτρα συντελεστών x o x 2 o V = x x 2 x 2 x 2 2 είναι µήτρα Vandermonde µε det(v) 0 εφόσον x o x,x o x 2 και x x 2. Μάλιστα, αναπτύσσοντας την det(v), π.χ. κατά µήκος της πρώτης στήλης, µετά από µερικές αλγεβρικές πράξεις, έχοµε det(v) = x x 2 x 2 x 2 x o x 2 o 2 x 2 x 2 + x o x 2 o 2 x x 2 = (x x o )(x 2 x o )(x 2 x ), η οποία πράγµατι είναι 0 εφόσον x o x,x o x 2 και x x 2. Υπό την υπόθεση αυτήν, οι συντελεστές του πολυωνύµου υπολογίζονται µε τον κανόνα του Cramer ως εξής: y o x o x 2 o a o = det(v) y x x 2 y 2 x 2 x 2,a y o x 2 o = det(v) y x 2 2 y 2 x 2,a x o y o 2 = det(v) x y 2 x 2 y 2. Εισαγωγή αυτών των συντελεστών στην έκφραση του δευτεροβάθµιου πολυωνύµου και µετά από πολλές αλγεβρικές απλοποιήσεις καταλήγουµε στην ακόλουθη έκφραση για το πολυώνυµο: (x x )(x x 2 ) P(x) = y o (x o x )(x o x 2 ) + y (x x o )(x x 2 ) (x x o )(x x 2 ) + y (x x o )(x x ) 2 (x 2 x o )(x 2 x ). Η µορφή αυτή του πολυωνύµου παρεµβολής είναι γνωστή ως µορφή Lagrange. Εάν ϑέσουµε l o (x) = (x x )(x x 2 ) (x o x )(x o x 2 ),l (x) = (x x o)(x x 2 ) (x x o )(x x 2 ),l 2(x) = (x x o)(x x ) (x 2 x o )(x 2 x ), η Λαγρανζιανή µορφή του πολυωνύµου γίνεται P(x) = y o l o (x) + y l (x) + y 2 l(x), όπου l(x o ) =,l (x ) =,l 2 (x 2 ) = ενώ l o (x ) = l o (x 2 ) = l (x o ) = l (x 2 ) = l 2 (x o ) = l 2 (x ) = 0. Τα πολυώνυµα l o ( ),l ( ) και l 2 ( ) είναι τα ϐασικά πολυώνυµα Lagrange. Προφανώς το πολυώνυµο P( ) ικανοποιεί, εκ κατασκευής, τις απαιτήσεις παρεµβολής: P(x o ) = y o,p(x ) = y και P(x 2 ) = y 2. Προκύπτει από το προηγούµενο παράδειγµα ότι εάν η πολυωνυµική µορφή της Λαγρανζιανής παρεµβολής µπορεί να γενικευθεί σε περισσότερα από 3 σηµεία, τότε η παρεµβολή µπορεί να πραγµατοποιείται χωρίς την ανάγκη επίλυσης ενός συστήµατος εξίσωσης µε την κακής κατάστασης µήτρα Vandermonde. Οντως, η γενίκευση αυτή είναι πραγµατοποιήσιµη. Θεώρηµα.3 Εστω n + σηµεία {(x k, y k )} n µε x k x j εφόσον k j. Το πολυώνυµο Lagrange L(x) = y k l k (x), (.8) όπου l k = (x x o) (x x k )(x x k+ ) (x x n ) (x k x o ) (x k x k )(x k x k+ ) (x k x n ) (.9) είναι τα ϐασικά πολυώνυµα Lagrange, είναι το µοναδικό πολυώνυµο παρεµβολής. Απόδειξη: Για τα ϐασικά Λαγρανζιανά πολυώνυµα έχοµε:
.3. ΠΟΛΥ ΩΝΥΜΟ ΣΕ ΜΟΡΦ Η LAGRANGE 7 8 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η. Το l k (x) είναι πολυώνυµο ϐαθµού n. { εάν k = j 2. l k (x j ) = δ kj = 0 εάν k j Kronecker. για 0 k, j n, όπου το δ kj είναι το δ του Αποδεικνύουµε πρώτα ότι ένα πολυώνυµο που ικανοποιεί αυτές τις ιδιότητες έχει πράγµατι την µορφή (.9): Επειδή l k (x) είναι ϐαθµού n και µηδενίζεται στα n ση µεία x j, j k, διαιρείται από το πολυώνυµο (x x j ) χωρίς υπόλοιπο. Άρα l k (x) = c k n j=0,j k (x x j ), όπου c k είναι µία σταθερά, την οποία όµως µπορού- j=0,j k µε να ταυτοποιήσουµε από την απαίτηση l k (x k ) =. Πράγµατι, ως αποτέλεσµα λαµβάνοµε l k (x) = j=0,j k j=0,j k που είναι µία συµπαγής έκφραση της (.9). (x x j ) (x k x j ) (.0) Από τις δύο ιδιότητες των ϐασικών πολυωνύµων προκύπτει ότι (α) το Λαγρανζιανό πολυώνυµο L( ), όπως ορίζεται από την σχέση (.8), είναι ϐαθµού, το πολύ, n και (ϐ) ότι διέρχεται από τα σηµεία παρεµβολής, όντως L(x k ) = n j=0 y jl j (x k ) = n j=0 y jδ jk = y k για όλα τα k = 0,,..., n. Το πολυώνυµο L( ) είναι µοναδικό, διότι εάν υπήρχε ένα άλλο πολυώνυµο παρεµ- ϐολής, ˆL( ), για τα δεδοµένα σηµεία, ϑα είχαµε L(x k ) = ˆL(x k ) = y k, k. Αλλά τότε το πολυώνυµο της διαφοράς τους, DL(x) = L(x) ˆL(x), ϐαθµού, όχι µεγαλύτερου του n ϑα µηδενίζονταν στα n + σηµεία x o, x,...,x n, ϑα είχε δηλαδή n + ϱίζες, πράγµα αδύνατον για µη-µηδενικό πολυώνυµο. Άρα το DL( ) είναι µηδενικό, δηλαδή DL(x) = 0, x, και συνεπώς το L( ) και το ˆL( ) ταυτίζονται. Από την έκφραση (.0), προκύπτει η συµπαγής, εναλλακτική της (.8), έκφραση του πολυωνύµου Lagrange: L(x) = j=0,j k y k j=0,j k (x x j ) (x k x j ) (.) Παράδειγµα.8 Για την άγνωστη συνάρτηση y = f(x) έχοµε τις ακόλουθες πινακοποιηµένες τιµές: k 0 2 x 2 3 y 8 27 Επειδή έχοµε n + = 3 σηµεία, αναζητούµε πολυώνυµο παρεµβολής ϐαθµού το πολύ n = 2. Υπολογίζουµε πρώτα τα ϐασικά Λαγρανζιανά πολυώνυµα: l o = (x 2)(x 3) ( 2)( 3), l (x )(x 3) = (2 )(2 3), l (x )(x 2) 2 = (3 )(3 2) Οπότε, το Λαγρανζιανό πολυώνυµο παρεµβολής είναι L(x) = y o l o (x)+y l (x)+y 2 l 2 (x) = 6x 2 x + 6, δηλαδή ένα δευτεροβάθµιο πολυώνυµο. Παράδειγµα.9 Για την άγνωστη συνάρτηση y = f(x) έχοµε τις ακόλουθες πινακοποιηµένες τιµές: k 0 2 3 4 x -.5-0.75 0 0.75.5 y -4.04-0.93596 0 0.93596 4.04 Επειδή έχοµε n + = 5 σηµεία, αναζητούµε πολυώνυµο παρεµβολής ϐαθµού το πολύ n = 4. Υπολογίζουµε πρώτα τα ϐασικά Λαγρανζιανά πολυώνυµα: l o (x) = (x x )(x x 2 )(x x 3 )(x x 4 ) (x o x )(x o x ) (x o x 3 )(x o x 4 ) = x(2x 3)(4x 3)(4x + 3), 243 (x x o )(x x 2 )(x x 3 )(x x 4 ) l (x) (x x o )(x x 2 )(x x 3 )(x x 4 ) = 8 x(2x 3)(2x + 3)(4x 3), 243 l 2 (x) = 3 (2x + 3)(4x + 3)(4x 3)(2x 3), 243 l 3 (x) = 8 x(2x 3)(2x + 3)(4x + 3), 243 l 4 (x) = x(2x + 3)(4x 3)(4x + 3). 243 Οπότε, το Λαγρανζιανό πολυώνυµο παρεµβολής είναι L(x) = y o l o (x) + y l (x) + y 2 l 2 (x) + y 3 l 3 (x) + y 4 l 4 (x) = 4.83484x 3.477474x, δηλαδή ένα τριτοβάθµιο πολυώνυµο. Ο ακόλουθος κώδικας Octave/Matlab υπολογίζει τους συντελεστές του Λαγρανζιανού πολυωνύµου και τους αποθηκεύει σε διάταξη ϕθίνουσας δύναµης στο διάνυσµα lpoly. Π.χ. η εφαρµογή του στα δεδοµένα του προηγοµένου παραδείγµατος ϑ αποφέρει lpoly = [0.0 4.83484 0.0.477474 0.0].
.3. ΠΟΛΥ ΩΝΥΜΟ ΣΕ ΜΟΡΦ Η LAGRANGE 9 20 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η function [ lpoly ] = lagrangeinterpol ( x, y ) n = length ( x ) ; lpoly = 0; for k = :n+ pcoef = ; for j = :n+ if j =k pcoef = conv( pcoef,[ x ( j ) ] ) / ( x (k) x ( j ) ) ; end end lpoly = lpoly + y (k) pcoef ; end end Η συνάρτηση συνέλιξης, conv από την λέξη convolution, όταν εφαρµόζεται στα διανύσµατα συντελεστών δύο πολυωνύµων ισοδυναµεί µε το πολλαπλασιασµό των πολυωνύµων. Για δύο διανύσµατα u και v διαστάσεων n και m αντίστοιχα, το αποτέλεσµα της συνέλιξης, w = conv(u, v), είναι ένα διάνυσµα w διαστάσεων n+m και µε στοιχεία w k = k j= u jv k j+. Π.χ. ο πολλαπλασιασµός των γραµ- µικών πολυωνύµων (x x o )(x x ) = x 2 (x +x o )x+x o x αντιστοιχεί στην συνέλιξη των συντελεστών τους, conv([ x o ], [ x ]) = [ (x +x o ) x o x ]. Στο Scilab η αντίστοιχη συνάρτηση είναι convol. Στην Fortran, η συνέλιξη w = conv(u, v) ϑα µπορούσε ν αποδοθεί µε το ακόλουθο απόσπασµα κώδικα: DO k =, m+n w( k) = 0. DO j =, k w(k) = w(k) + u( j ) v (k j +) ENDDO END DO Παράδειγµα.0 Χρησιµοποιούµε την προηγούµενη συνάρτηση lagrangeinterpol στα δεδοµένα του Παραδείγµατος.2 που αφορούν την ταχύτητα πυραύλου. Μετά την δηµιουργία του Λαγρανζιανού πολυωνύµου παρεµβολής, δίδεται και η γραφική του πα- ϱάσταση (Σχήµα.4). Απαντούµε επίσης στα ερωτήµατα που αφορούν την ταχύτητα του πυραύλου τις στιγµές 40 και 90 και µε την ϐοήθεια του Λαγρανζιανού πολυωνύµου ε- κτιµούµε την ταχύτητα του πυραύλου σε 2040.9feet/sec και 3984.3feet/sec αντίστοιχα. Οι εντολές που απαιτούνται σε Octave/Matlab είναι: t =[0 60 20 80 240]; v=[0 500 550 3480 7950]; lpoly = lagrangeinterpol ( t, v ) ; tt =[0:0.:240]; vv=polyval ( lpoly, tt ) ; clf ; plot ( tt, vv, b, t,v, r ) ; x=40;x2=90; y=polyval ( lpoly, x ) ; y2=polyval ( lpoly, x2) Σχήµα.4: Λαγρανζιανή πολυωνυµική παρεµβολή για τα δεδοµένα πτήσης πυ- ϱαύλου Μπορούµε πια να εκτιµήσουµε την απόσταση που ο πύραυλος διήνυσε µεταξύ του 40 και 90 δευτερολέπτου σε 4729feet και την επιτάχυνσή του την στιγµή 40 σε 4.578feet/sec/sec Η συνάρτηση polyval υπολογίζει την τιµή ενός πολυωνύµου σε δεδοµένο σηµείο. Εάν δο- ϑούν περισσότερα του ενός σηµεία µε την µορφή διανύσµατος, το πολυώνυµο υπολογίζεται σ όλα τα σηµεία. Προϋποθέτει ότι το πολυώνυµο n ϐαθµού δίδεται από ένα n+-διάνυσµα συντελεστών που είναι σε ϕθίνουσα διάταξη εκθέτη, δηλαδή ο συντελεστής του x n είναι πρώτος και ο σταθερός όρος τελευταίος σ αυτήν την διάταξη όπως στο πολυώνυµο (.7). Στο Scilab δεν υπάρχει αντίστοιχη µε την polyval συνάρτηση. Μπορεί όµως να υλοποιηθεί µε την διαδικασία του Horner, όπου το n-ϐάθµιο πολυώνυµο n+ k= a kx n+ k υπολογίζεται σύµφωνα µε την διάταξη a n+ + x(a n + x(a n + x( + x(a 2 + xa )))): polval =0; for i =:n+ polval = polval x+a( i ) ; end Η διαδικασία αυτή απαιτεί O(n) πράξεις κινητής υποδιαστολής (flops). Θα πρέπει να τονισθεί ότι το πολυώνυµο Lagrange δεν είναι ένα διαφορετικό πολυώνυµο παρεµβολής απ αυτό της.2 αλλά απλώς µία άλλη µορφή του, διότι το πολυώνυµο παρεµβολής για n + δεδοµένα σηµεία είναι µοναδικό. Αυτό που διαχωρίζει τις δύο µορφές του πολυωνύµου είναι ο τρόπος κατασκευής τους.
.3. ΠΟΛΥ ΩΝΥΜΟ ΣΕ ΜΟΡΦ Η LAGRANGE 2 22 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η ύο ειδικές περιπτώσεις του Λαγρανζιανού πολυωνύµου είναι πολύ χρήσιµες στην πράξη, γραµµική και η τετραγωνική παρεµβολή. Για n =, έχοµε δύο γνωστά σηµεία (x o, y o ) και (x, y ), οπότε το πολυώνυµο Lagrange είναι γραµµικό µε την γραφική του παράσταση να είναι η ευθεία που διέρχεται από τα δύο αυτά σηµεία: L(x) = y o x x x o x + y x x o x x o. Για n = 2, έχοµε τρία γνωστά σηµεία (x o, y o ), (x, y ) και (x 2, y 2 ), οπότε το Λαγραν- Ϲιανό πολυώνυµο είναι µία παραβολή που διέρχεται από τα τρία αυτά σηµεία: (x x )(x x 2 ) L(x) = y o (x o x )(x o x 2 ) + y (x x o )(x x 2 ) (x x o )(x x 2 ) + y (x x o )(x x ) 2 (x 2 x o )(x 2 x ). Ο υπολογισµός των συντελεστών του Λαγρανζιανού πολυωνύµου σε µορφή n+ k= a kx n+ k που εκτελείται από τον προηγούµενο κώδικα Octave/Matlab έχει υψηλό υπολογιστικό κόστος και δεν χρησιµοποιείται έτσι στην πράξη. Πράγµατι, η υποδιαδικασία της συνέλιξης δύο διανυσµάτων u και v διαστάσεων m και n αντίστοιχα απαιτεί + 2 + + ν = ν(ν+) = O(ν 2 ) αριθµητικές πράξεις (flops), όπου 2 ν = m+n+. Για τον υπολογισµό κάθε συντελεστή, η υποδιαδικασία αυτή καλείται n+ ϕορές µε το µέγεθος του ενός διανύσµατος να κυµαίνεται από έως και n+ ενώ του άλλου είναι πάντοτε 2. Άρα απαιτούνται O( 2 +2 2 +3 2 + +ν 2 ) = O(n 3 ) αριθµητικές πράξεις (flops) για κάθε συντελεστή και υπάρχει ένα σύνολο n + συντελεστών, οπότε ο κώδικας απαιτεί O(n 4 ) αριθµητικές πράξεις (flops) συνολικά. Θα εξετάσουµε στην συνέχεια τρόπους υλοποίησης της Λαγρανζιανής παρεµβολής που απαιτούν λιγότερες πράξεις. Παρατηρούµε ότι τα ϐασικά Λαγρανζιανά πολυώνυµα είναι ανεξάρτητα από τις τιµές y o, y,...,y n αλλά εξαρτώνται από το νέο σηµείο x όπου Ϲητείται η εκτίµηση της τιµής y = f(x) µε την τιµή παρεµβολής L(x). Ετσι δεν υπάρχει συνήθως λόγος για την διατήρηση των τιµών των ϐασικών Λαγρανζιανών πολυωνύµων. Ο ακόλουθος κώδικας σε Fortran κάνει ακριβώς αυτό, για δεδοµένο πίνακα από n + σηµεία x και y υπολογίζει µία εκτίµηση της τιµής της άγνωστης συνάρτησης σ ένα νέο σηµείο xnew µε O(n 2 ) πράξεις κινητής υποδιαστολής (flops). REAL FUNCTION lagrange_value ( degree, xpoints, yvalues,xnew) IMPLICIT NONE INTEGER, INTENT( IN ) : : degree REAL, DIMENSION( 0: degree ), INTENT( IN ) : : xpoints, yvalues REAL, INTENT( IN ) : : xnew REAL : : ynew, lbas INTEGER : : i, j ynew = 0.0 DO i = 0, degree lbas =.0 DO j = 0, degree IF ( j/=i ) lbas=lbas (xnew xpoints ( j ) ) / ( xpoints ( i) xpoints ( j ) ) ENDDO ynew = ynew + lbas yvalues ( i ) ENDDO lagrange_value = ynew END FUNCTION lagrange_value Το ενδεχόµενο ν αποθηκευθούν οι τιµές των ϐασικών Λαγρανζιανών πολυωνύµων υπάρχει µόνον όταν επιθυµούµε να εκτιµήσουµε τις τιµές πολλών συναρτήσεων f (x), f 2 (x),...,f m (x) για το ίδιο πλέγµα P = {x o, x,..., x n } στο ίδιο σηµείο x. Το ϐασικό µειονέκτηµα της Λαγρανζιανής παρεµβολής που παρουσιάσαµε είναι ότι εάν ένας κόµβος x k αφαιρεθεί ή εάν προστεθεί κι άλλος κόµβος στους ήδη υπάρχοντες, τότε όλα τα ϐασικά πολυώνυµα Lagrange πρέπει να επαναϋπολογισθούν. Το πολυώνυµο Newton που ϑα εξετάσουµε στην.5 είναι πιο κατάλληλο για την ενσωµάτωση τέτοιων αλλαγών. Ενας τρόπος οργάνωσης του υπολογισµού των ϐασικών συντελεστών του Λαγραν- Ϲιανού πολυωνύµου δίδεται παραστατικά από τον κάτωθι πίνακα: x o x x 2 x n Γινόµενα x o x x o x o x x o x 2 x o x n Π o (x) x x x o x x x x 2 x x n Π (x) x 2 x 2 x o x 2 x x x 2 x 2 x n Π 2 (x)......... x n x n x o x n x x n x 2 x x n Π n (x) Π n+ (x) Ο πίνακας αποτελείται από n + στοίχους, όσα και τα δεδοµένα σηµεία, και από τον ίδιο αριθµό στηλών συν µία πρόσθετη στήλη µε τον τίτλο «Γινόµενα». Το στοιχείο στην ϑέση (i, j) του πίνακα, i j, είναι η διαφορά x i x j, ενώ η κύρια διαγώνιος αποτελείται από τις (υπογεγραµµένες) διαφορές x x i, i. Η πρόσθετη στήλη µε τον τίτλο «Γινόµενα» αποτελείται από τα γινόµενα των στοιχείων κάθε στοίχου. Ετσι, Π o (x) = (x x o )(x o x )(x o x 2 ) (x o x n ) και, γενικώτερα, Π i (x) = (x i x o )(x i x )(x i x 2 ) (x i x i )(x x i )(x i x i+ ) (x i x n ). Τέλος, το Π n+ (x) αντιστοιχεί στο γινόµενο των στοιχείων της κυρίας διαγωνίου, δηλαδή Π n+ (x) = (x x o )(x x )(x x 2 ) (x x n ). Τα γινόµενα Π i (x) είναι πρωτοβάθµια πολυώνυµα, ενώ το Π n+ (x) είναι ϐαθµού n +.
.3. ΠΟΛΥ ΩΝΥΜΟ ΣΕ ΜΟΡΦ Η LAGRANGE 23 Με αυτά τα δεδοµένα, τα µεν ϐασικά Λαγρανζιανά πολυώνυµα δίδονται από l k (x) = Π n+(x) Π k (x) και είναι ϐαθµού n, το δε πολυώνυµο παρεµβολής από για k = 0,, 2,..., n, (.2) 24 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η 0 2 6 Γινόµενα 0 4-0 0-0-2 0-6 -48-0 4- -2-6 5 2 2-0 2-4-2 2-6 -6 6 6-0 6-6-2 4-6 -240-48 L(x) = Π n+ (x) και είναι ϐαθµού, το πολύ, n. Π k (x) y k = Π n+ (x) y k Π k (x) (.3) ) Άρα η Λαγρανζιανή εκτίµηση είναι L(4) = ( 48)( 48 + 3 5 + 3 6 + 87 240 = 255. Από την εξίσωση (.2) προκύπτει ότι τα ϐασικά Λαγρανζιανά πολυώνυµα µπορούν να επαναδιατυπωθούν ως Επειδή Π n+ (x) = έχοµε για την πρώτη παράγωγό του Π n+ (x i) = οπότε τα γινόµενα του πίνακα είναι (x x k ), (.4),k i (x i x k ), Π k (x) = (x x k )Π n+(x k ) για k = 0,, 2,..., n Για τον λόγο αυτό, η έκφραση (.3) του Λαγρανζιανού πολυωνύµου µπορεί να επαναδιατυπωθεί ως L(x) = Π n+ (x) (x x k )Π n+ (x k) y k ή L(x) = Π n+ (x) y k (x x k )Π n+ (x k). (.5) Παράδειγµα. Η συνάρτηση f(x) είναι γνωστή µέσω του πίνακα k 0 2 3 x 0 2 6 y 3 3 87 Για να εκτιµήσουµε την τιµή της συνάρτησης στο σηµείο x = 4 µέσω παρεµβολής Lagrange, σχηµατίζουµε τον πίνακα των διαφορών και υπολογίζουµε τα γινόµενα: l k (x) = Π n+(x) x x k (x k x i ),i k ω k = Π n+ (x), όπου ω k = x x k,i k (x k x i ) οπότε το Λαγρανζιανό πολυώνυµο παρεµβολής λαµβάνει την ϐαρυκεντρική µορ- ϕή L(x) = Π n+ (x) ω k x x k y k. Εάν τα ϐαρυκεντρικά σταθµά ω k προϋπολογισθούν και αποθηκευθούν, τότε το πλήθος των πράξεων για τον υπολογισµό του L n (x) γίνεται O(n) αντί του O(n 2 ) που απαιτείται από την αρχική µορφή. Σε αντίθεση µε την αρχική µορφή, η ϐαρυκεντρική έχει την δυνατότητα να ενσωµατώσει σχετικά εύκολα την προσθήκη ενός νέου κόµβου x n+ στο πλέγµα. Αυτό που απαιτείται είναι να διαιρεθούν τα σταθµά ω k µε το (x k x n+ ) και να δηµιουργηθεί ένα ακόµη σταθµό ω n+ =. (x n+ x i ) Επειδή για την σταθερή συνάρτηση f(x) = έχοµε y k = για όλα τα σηµεία x k του πλέγµατος, προκύπτει από την ϐαρυκεντρική µορφή ότι = Π n+ (x) ω k x x k.,
.4. ΣΦ ΑΛΜΑ ΚΟΛ ΟΒΩΣΗΣ ΣΤΗΝ ΙΑ ΙΚΑΣ ΙΑ ΠΑΡΕΜΒΟΛ ΗΣ 25 ιαιρώντας την ϐαρυκεντρική µορφή µ αυτήν την µονάδα λαµβάνοµε L(x) = ω k y k x x k, ω k x x k όπου έχοµε κατορθώσει να εξαλείψουµε το πολυώνυµο Π n+ (x). Αυτή είναι η κύρια ϐαρυκεντρική µορφή του Λαγρανζιανού πολυωνύµου παρεµβολής και έχει το πρόσθετο πλεονέκτηµα ότι δεν επιβαρυνόµαστε µε τον υπολογισµό του Π n+ (x) κάθε ϕορά που υπολογίζεται το L n (x)..4 Σφάλµα Κολόβωσης στην ιαδικασία Παρεµβολής Υποθέτουµε ότι η συνάρτηση f( ) προσεγγίζεται στο διάστηµα [a, b] από ένα πολυώνυµο παρεµβολής P n ( ), π.χ. από το Λαγρανζιανό πολυώνυµο ϐαθµού, το πολύ, n. Το υπόλοιπο αυτής της προσέγγισης είναι R n (x) = f(x) P n (x) f(x) = P n (x) + R n (x). Για δεδοµένο σηµείο παρεµβολής x [a, b] λαµβάνοµε ως εκτίµηση του σφάλµατος την ποσότητα ε = R n ( x) = f( x) P n ( x), ενώ για ολόκληρο το διάστηµα η ποσότητα ε = max x [a,b] R n(x) = max x [a,b] f(x) P n(x) εκλαµβάνεται ως εκτίµηση του σφάλµατος παρεµβολής. Θεώρηµα.4 Ας είναι η f( ) n + ϕορές συνεχής διαφορίσιµη στο διάστηµα [a, b] και ας είναι P n ( ) ένα πολυώνυµο ϐαθµού, το πολύ, n που για το πλέγµα P = {a x o < x < x 2 < < x n b} από n + διακριτά σηµεία ικανοποιεί τις συνθήκες παρεµβολής P n (x k ) = f(x k ), k. Υπάρχει τότε ξ (a, b) για το οποίο R n ( x) = f(n+) (ξ) (n + )! όπου f (n+) ( ) είναι η παράγωγος τάξης n + της f( ). ( x x k ), (.6) 26 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η Απόδειξη: Εάν το x είναι ένα από τα σηµεία του πλέγµατος, η ισότητα (.6) αληθεύει µε µηδενική την δεξιά της πλευρά. Υποθέτουµε στην συνέχεια ότι x P. Χρησιµοποιώντας τα n + σηµεία του πλέγµατος και το σηµείο x κατασκευάζουµε το Λαγρανζιανό πολυώνυµο ϐαθµού, το πολύ, n + για τα n + 2 δεδοµένα σηµεία: (x x k ) (x x) (x x k ) L n+ (x) = f( x) + j=0 f(x,k j j) ( x x k ) (x j x) (x j x k ),k j που ικανοποιεί τις συνθήκες L n+ (x k ) = f(x k ), k, και L n+ ( x) = f( x). Η συνάρτηση υπολοίπου R(x) = f(x) L n+ (x) µηδενίζεται σ αυτά τα n + 2 σηµεία, οπότε, από το Θεώρηµα του Rolle, σε κάθε διάστηµα µεταξύ αυτών των σηµείων υπάρχει κάποια τιµή του x για την οποία η παράγωγος R (x) επίσης µηδενίζεται. Εχοµε συνεπώς από την επανειληµένη εφαρµογή αυτού του ϑεωρήµατος (Σχήµα.5): R (ξ k ) = 0, k = 0,, 2,..., n όπου ξ k (a, b), R (ξ 2k ) = 0, k = 0,, 2,..., n όπου ξ 2k (a, b),..., R (n+) (ξ) = 0, όπου ξ (a, b). Τα γινόµενα (x x k ) και (x x) (x x k ) είναι πολυώνυµα ϐαθµού n +,k j µε συντελεστή την µονάδα για τον όρο µε την µέγιστη δύναµη. Άρα οι παράγωγοί τους της τάξης (n + ) είναι ίσες µε (n + )!. Συνεπώς αφού n+ (x) = (n + )! f( x) f(x j ) + j=0 ( x x k ) (x j x) (x j x k ) L (n+) = ( x x k ) (x j x) (n + )! f( x) f(x j ) j=0 ( x x k ) = x x j x j x L (n+) n+ (x) =,k j ( x x k ) =,k j,k j ( x x k ), (x j x k ),k j,k j ( x x k ). Άρα (n + )! (f( x) L n ( x)) = (n + )!R n( x) ( x x k ) ( x x k )
.4. ΣΦ ΑΛΜΑ ΚΟΛ ΟΒΩΣΗΣ ΣΤΗΝ ΙΑ ΙΚΑΣ ΙΑ ΠΑΡΕΜΒΟΛ ΗΣ 27 και από την ισότητα R (n+) (ξ) = 0 έχοµε f (n+) (ξ) L (n+) n+ (ξ) = 0 που ισοδυναµεί µε την ισότητα (.6). Θα πρέπει να τονισθεί ότι σε αντίθεση µε την παρεµβολή (µε την στενή της έννοια), στην περίπτωση της παρεκβολής (extrapolation), της εκτίµησης δηλαδή της τιµής ȳ = f( x) για x [a, b], το ξ δεν ανήκει στο [a, b] και ουσιαστικά το υπόλοιπο (.6) δεν µπορεί να χρησιµοποιηθεί ευθέως για την εκτίµηση του σφάλµατος. R R R R (3) R (4) Σχήµα.5: Εφαρµογή του Θεωρήµατος του Rolle στην απόδειξη του Θεωρήµατος.4 Παρατηρούµε επίσης ότι το πολυώνυµο (x x k ) που εµφανίζεται στην εκτίµηση του σφάλµατος (.6) αυξάνει ταχύτατα καθώς το x αποµακρύνεται από τα άκρα του διαστήµατος [a, b] που περιέχει τα σηµεία του πλέγµατο P = {x k }. Για τον λόγο αυτό το πολυώνυµο παρεµβολής δεν ϑα πρέπει να χρησιµοποιείται αλόγιστα για x [a, b] (παρεκβολή). Παράδειγµα.2 Για την συνάρτηση f(x) = sin(x) έχοµε k 0 2 x 0 π/6 π/2 f(x) 0 /2 Επιθυµούµε να εκτιµήσουµε την τιµή sin(π/4) µε παρεµβολή. Κατασκευάζουµε το δευτεροβάθµιο Λαγρανζιανό πολυώνυµο: L 2 (x) = f(0) (x π/6)(x π/2) (0 π/6)(0 π/2) + f(π/6) (x 0)(x π/2) (π/6 0)(π/6 π/2) + f(π/2) (x 0)(x π/6) (π/2 0)(π/2 π/6) = = (π/2 x)x 2 + x(x π/6) π 2 /8 π 2 /8. Άρα L 2 (π/4) = 6 = 0.6875. Για το σφάλµα έχοµε: R 2 (π/4) = cos(ξ) 3! (π/4 0)(π/4 π/6)(π/4 π/2) για ξ (0, π/2), οπότε R 2 (π/4) π3 52 < 0.03. 28 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η Ως σύγκριση, η ακριβής τιµή είναι sin(π/4) = 0.096. Εάν υποθέσουµε ότι τότε οπότε 2 2 0.707 οπότε το ακριβές σφάλµα είναι f (n+) (x) M, x [a, b], π.χ. M = max f (n+) (x), x [a,b] για το Π n+ (x) από την (.4). ε = R n ( x) M x x k, (n + )! ε = max R n (x) M x [a,b] (n + )! max Π n+ (x) x [a,b] Παράδειγµα.3 Στην µέθοδο της χορδής, το γραµµικό πολυώνυµο P (x) = f(a) + f(b) f(a) (x a) b a παρεµβάλλεται στα ακραία σηµεία του διαστήµατος [a, b] για την δις συνεχή διαφορίσιµη συνάρτηση f( ). Ποιό είναι το σφάλµα παρεµβολής για την προσέγγιση της f( ) από το P ( ) στο [a,b]; Εχοµε ε = max x [a,b] R (x) M 2! όπου M = max x [a,b] f (x). max x [a,b] M(b a)2 (x a)(x b) =, 8 Πόρισµα.2 Τα ϐασικά πολυώνυµα Lagrange (.9) έχουν την ιδιότητα αθροίζονται δηλαδή στην µονάδα. l k (x) =, Απόδειξη: Ας υποθέσουµε ότι f(x). Τότε όλα τα f k =, i = 0,, 2,..., n. Από την άλλη πλευρά, f (n+) (x) 0. Οπότε από το Θεώρηµα.4, L n (x) = f(x) =. Αλλά L n (x) = n f k l k (x) και εξ αυτού n l k(x) =. Μπορεί να ϕαντάζει παράξενο που για να εκτιµήσουµε το σφάλµα στην προσέγγιση της τιµής µιας άγνωστης συνάρτησης µε πολυώνυµο παρεµβολής ϐαθµού n ϑα πρέπει να γνωρίζουµε την παράγωγό της τάξης n +, αλλά, όπως ϑα δούµε στην συνέχεια, δεν απαιτείται ο αναλυτικός τύπος της παραγώγου για να εκτιµήσουµε την τιµή f (n+) (ξ).
.5. ΠΟΛΥ ΩΝΥΜΟ ΣΕ ΜΟΡΦ Η NEWTON 29.5 Πολυώνυµο σε Μορφή Newton Θα εξετάσουµε τώρα την δυνατότητα να εκφρασθεί το πολυώνυµο παρεµβολής σε µία νέα, υπολογιστικά πιο ευέλικτη µορφή απ αυτή του Lagrange. Ορισµός. Για ένα πλέγµα µε n + σηµεία, P = {x k } n, λέµε ότι το n-στου ϐαθµού πολυώνυµο N n (x) = a o +a (x x o )+a 2 (x x o )(x x )+ +a n (x x o ) (x x n ) (.7) είναι σε µορφή Newton. Παρατηρούµε ότι η Νευτώνεια µορφή του πολυωνύµου έχει αναδροµικό χαρακτήρα, δηλαδή το πολυώνυµο ϐαθµού k παράγεται προσθέτοντας στο πολυώνυµο ϐαθµού k τον όρο a k (x x o )(x x ) (x x k ). Εχοµε συγκεκριµένα N o (x) = a o N (x) = N o (x) + a (x x o ) N 2 (x) = N (x) + a 2 (x x o )(x x )... N k (x) = N k (x) + a k (x x o ) (x x k )... N n (x) = N n (x) + a n (x x o ) (x x n ) Σε σύγκριση µε την µορφή Lagrange, η Νευτώνεια µορφή µας επιτρέπει εποµένως να ενσωµατώσουµε σ ένα ήδη διαµορφωµένο πολυώνυµο πολύ εύκολα την προσθήκη νέων κόµβων στο πλέγµα. Στην περίπτωση της παρεµβολής είναι συνεπώς πιο κατάλληλη η Νευτώνεια µορφή απ ότι η χρήση της ορίζουσας Vandermonde ή η Λαγρανζιανή µορφή εάν επιθυµούµε µία συγκεκριµένη ακρίβεια και αποφασί- Ϲουµε µε ϐάση αυτό τ απαιτούµενα σηµεία του πλέγµατος χωρίς να τα ϑεωρούµε εκ των προτέρων δεδοµένα. Για να χρησιµοποιήσουµε όµως το πολυώνυµο Newton ως πολυώνυµο παρεµβολής για κάποια συνάρτηση y = f(x) µε τιµές {y k = f(x k )} n στα σηµεία του πλέγµατος P ϑα πρέπει να ταυτοποιήσουµε τους συντελεστές a o, a,...,a n του πολυωνύµου. Από τον αναδροµικό χαρακτήρα του πολυωνύµου έχοµε ότι εάν χρησιµοποιήσου- µε µόνον ένα σηµείο, x o, του πλέγµατος, τότε N o (x) = a o =σταθερά. Αλλά η παρεµβολή απαιτεί N o (x o ) = y o, οπότε αναγκαστικά a o = y o. 30 ΚΕΦ ΑΛΑΙΟ. ΠΟΛΥΩΝΥΜΙΚ Η ΠΑΡΕΜΒΟΛ Η Το πολυώνυµο N (x) παρεµβάλλεται στα δύο σηµεία (x o, y o ) και (x, y ), οπότε N (x o ) = y o a o + a (x o x o ) = y o a o = y o και N (x ) = y a o + a (x x o ) = y a = y a o x x o a = y y o x x o. Την ποσότητα y y o f(x ) f(x o ) την ονοµάζουµε πρώτη διηρηµένη διαx x o x x o ϕορά (first divided difference) ή διηρηµένη διαφορά πρώτης τάξης και την συµβολίζουµε µε Df o ή f[x o, x ] ή ακόµη και µε [x o, x ] ή [y o, y ]. Γενικά έχοµε Ορισµός.2 Για τα σηµεία {(x k, y k = f(x k ))} n η πρώτη διηρηµένη διαφορά ορίζεται ως Df k f[x k, x k+ ] f(x k+) f(x k ) x k+ x k = f(x k) f(x k+ ) x k x k+ f[x k+, x k ]. Η πρώτη διηρηµένη διαφορά είναι δηλαδή συµµετρική. Το πρωτοβάθµιο Νευτώνειο πολυώνυµο παρεµβολής µπορεί συνεπώς να διατυπωθεί ως N (x) = y o + y y o x x o x f(x o ) + f[x o, x ](x x o ). Το δευτεροβάθµιο Νευτώνειο πολυώνυµο N 2 (x) = N (x) + a 2 (x x o )(x x ) πα- ϱεµβάλλεται τώρα στα τρία σηµεία (x o, y o ), (x, y ) και (x 2, y 2 ). Επειδή ο προστιθέ- µενος στο N (x) όρος µηδενίζεται για x = x o και x = x, το πολυώνυµο κληρονοµεί τις τιµές των συντελεστών a o και a από το πρωτοβάθµιο N (x). Αποµένει συνεπώς να το προσαρµόσουµε στο σηµείο (x, y 2 ), οπότε έχοµε y 2 N (x 2 ) N 2 (x 2 ) = y 2 N (x 2 ) + a 2 (x 2 x o )(x 2 x ) = y 2 a 2 = (x 2 x o )(x 2 x ) y 2 y y y o x a 2 = 2 x x x o a 2 = f[x, x 2 ] f[x o, x ] Df Df o. x 2 x o x 2 x o x 2 x o Την ποσότητα D 2 f o f[x o, x, x 2 ] f[x, x 2 ] f[x o, x ] Df Df o την ονοx 2 x o x 2 x o µάζουµε δεύτερη διηρέµη διαφορά ή διηρηµένη διαφορά δεύτερης τάξης. Παρατηρούµε ότι η δεύτερη διηρηµένη διαφορά αντιστοιχεί στην πρώτη διηρηµένη διαφορά των ποσοτήτων Df και Df o. Γενικά, η τρίτη, τέταρτη, κ.ο.κ. διηρηµένη διαφορά ορίζεται αναλόγως, οπότε έχοµε