HMY 799 : Αναγνώριση Συστημάτων Διαλέξεις 3 4 Παραμετροποιήσεις γραμμικών χρονικά αμετάβλητων συστημάτων Μοντέλα πρόβλεψης Μοναδικότητα Αναγνωρισιμότητα
Τ y () = φ () θ + e () 2 Ee {()} = 0, E{ ee } = λ Ι Τ ( ) 2 θˆ LS N( θ0, λ Φ Φ ) 0 Πως ελέγχουμε αν η εκτίμηση ενός συντελεστή θˆj είναι διαφορετική του μηδενός? Υποθέτουμε ότι η «αληθινή» μέση τιμή του θ j,0 είναι μηδέν, και ελέγχουμε πόσο πιθανό είναι η τιμή που έχουμε υπολογίσει ( θˆj ) να είναι διαφορετική από το μηδέν Για να το κάνουμε αυτό, χρησιμοποιούμε την κατανομή του συντελεστή ˆθ (, 2 ) j N θ j,0 λ r j για 2 Τ θ j,0 = 0, δηλ. ˆθ j N(0, λ rj ) (όπου rj = diag( Φ Φ) ) ελέγχουμε με άλλα λόγια πόσο πιθανό είναι 2 j η τιμή να έχει προέλθει από την κατανομή N(0, λ r θˆj j ) Ορίζουμε ένα επίπεδο σημαντικότητας α (τυπικά 0.05) Σχηματίζουμε την ˆθ j z j = λ Αν το λ είναι γνωστό (ντετερμινιστικό): zj N(0,) Αν το λ στοχαστικό (πιο ρεαλιστικό): zj N d Συγκρίνουμε την τιμή z j με την πιθανότητα ουράς N d, α /2 Για μεγάλες τιμές του Ν η κατανομή αυτή πλησιάζει την κανονική κατανομή Ν(0,) Διάστημα εμπιστοσύνης r j (θ ˆ ˆ λ r,θ ˆ + ˆ λ r ) j N d, α/2 N j j N d, α/2 N j
Πως ελέγχουμε τη σημαντικότητα μιας ομάδας συντελεστών ταυτόχρονα? ( MSE MSE2)/( d d2) F = MSE /( N d ) 2 2 F Η τ.μ. αυτή ακολουθεί κατανομή d2 d, N d2 2 Για μεγάλο Ν η κατανομή αυτή προσεγγίζει την χd2 d Συγκρίνουμε την ποσότητα αυτή με την d ή την 2 d, N d2 Υπολογιστικά ζητήματα: Βασικό πρόβλημα η αντιστροφή Φ Τ Φ Έλεγχος: ιδιοτιμές του Φ Τ Φ ή ιδιάζουσες τιμές του Φ Αριθμός κατάστασης (σ max /σ min ) Λύσεις: QR decomposiion (Φ=QR) SVD decomposiion Regularizaion F α 2 χ d2 d, α ˆθ j θ0, j ˆθ j
Μοντέλα ARX y( ) + a y( ) +... + a y( n) = bu( ) +... + b u( m) n y () = φ () θ θ = [ a... a b... b ] n m φ() = [ y( )... y( n) u( )... u( m)] N N k k kyk k= N k= θ ˆ Ν = N φ φ φ m Για αμερόληπτη εκτίμηση θα πρέπει (φ στοχαστικό): Ο θόρυβος e() είναι λευκός Ο θόρυβος έχει μηδενική μέση τιμή, η είσοδος u() είναι ανεξάρτητη του θορύβου και δεν υπάρχουν όροι της μορφής y( i) Maximum likelihood esimaion θˆ ML = arg max θ p( y θ) Για Γκαουσιανό λευκό θόρυβο θˆ ˆ ML = θls Bayesian esimaion p(, ) p( ) p( ) Likelihood Prior p( ) = y θ Poserior= θˆ MAP = arg max θ p( θ y) p( ) = y θ θ θ y y p( y) Normalizing Consan
Παραμετρικά μοντέλα γραμμικών συστημάτων Στη γενική περίπτωση έχουμε ένα μοντέλο της μορφής του σχήματος y ( ) = g( τ) u ( τ) + h( τ) e ( τ) = Gqu ( ) ( ) + H( qe ) ( ), h(0) = τ = τ = 0 τ Gq ( ) = g( τ) q, Hq ( ) = + h( τ) q τ= τ= τ Για να προσδιορίσουμε πλήρως ένα τέτοιο σύστημα, χρειαζόμαστε και την συνάρτηση κατανομής πιθανότητας του θορύβου e() Συνήθως, θεωρούμε ότι το e() είναι λευκός θόρυβος, άρα οι ιδιότητές του περιγράφονται πλήρως από τις ροπές πρώτης και δεύτερης τάξης (μέση τιμή και διακύμανση (0,λ 2 )). Σε αυτή την περίπτωση το φάσμα 2 2 του υ() είναι Φ υ ( ω ) = λ Η ( ω ) Πρακτικά, εκφράζουμε τις συναρτήσεις μεταφοράς G,H σε συνάρτηση με έναν πεπερασμένο αριθμό παραμέτρων είτε χρησιμοποιώντας ρητές συναρτήσεις μεταφοράς Α(q) και Β(q) (συναρτήσεις του q ) ή πεπερασμένα μοντέλα κατάστασης χώρου (sae space models) Επειδή είναι δύσκολο συνήθως να αποφασίσουμε ί ουμε την ακριβή μορφή των GHεκ G,H των προτέρων, χρησιμοποιούμε ένα σύνολο παραμέτρων θ τις οποίες θέλουμε να εκτιμήσουμε από τις παρατηρήσεις μας, με άλλα λόγια παραμετροποιούμε το σύστημα: y () = G( q, θ) u () + Hq (, θ )(), e E{ ee } = diag ( Λ( θ)) u() G(q) Το διάνυσμα των παραμέτρων θ, με διάσταση d, λαμβάνει τιμές σε ένα υποσύνολο του R d : θ D M d υ() H(q) + e() y()
Παραμετρικά μοντέλα γραμμικών συστημάτων y Gq u Hq e E diagλ i 2 ( ) = (, θ) ( ) + (, θ) ( ), { ee } = ( ( θ)) d D M θ Οι εξισώσεις αυτές ορίζουν πλέον ένα σύνολο μοντέλων (model se) από τα οποία πρέπει να επιλέξουμε το πιο κατάλληλο λ Ένας κοινός τρόπος παραμετροποίησης των G(q), H(q) είναι u() να τις εκφράσουμε ως ρητές συναρτήσεις του q Στη γενική περίπτωση: AR X y () + ay ( ) +... + an y ( n ) ( )... ( ) a a = b u + + bn u n b b + MA + e ( ) + ce ( ) +... + cn u ( n) c c Aq ( ) y ( ) = Bqu ( ) ( ) + Cqe ( ) ( ) nb Β( q) bq +... + bn q b Gq (, θ) = = na Aq ( ) + aq +... + an q a u() nc C ( q ) + cq +... + c n q c H ( q, θ ) = = na Aq ( ) + aq +... + a q θ = [ a... a b... b c... c ] n n n a b c n a Μοντέλο ARMAX (AuoRegressive Moving Average wih exogenous inpu) G(q) B(q)/A(q) υ() H(q) + + e() e() C(q)/A(q) y() y()
Παραμετρικά μοντέλα γραμμικών συστημάτων Εδ Ειδικές περιπτώσεις: n b =n c =0 Auoregressive model (ΑR) (μοντέλο αυτοπαλινδρόμησης) A( qy ) () = e () θ = [ a... a ] na n a =n b =0 Moving average model (MA) (μοντέλο κινητού μέσου) y() = C( q) e() θ = [ c... c ] nc n b =0 Auoregressive moving average model (ARMA) A( qy ) ( ) = Cqe ( ) ( ) θ = [ a... a c... c ] n a n c Στις παραπάνω περιπτώσεις μοντελοποιούμε απλά τη χρονοσειρά y() (ime series modeling) δεν έχουμε εξωτερική είσοδο! Με τα μοντέλα ΜΑ/ARMA συχνά μοντελοποιούμε σήματα που αντιστοιχούν σε αργές διαταραχές (slow drifs)
Παραμετρικά μοντέλα γραμμικών συστημάτων n c =0 ARX model dl y( ) + a y( ) +... + a y( n ) = bu( ) +... + b u( n ) + e( ) n a n b θ = [ a... a b... b ] n a a n b Β( q) υ() y() = u() + e() u() Aq ( ) Aq ( ) B(q)/A(q) + Λιγότερη ευελιξία στη μοντελοποίηση του θορύβου Οθό θόρυβος υ() μοντελοποιείται ως διαδικασία δ AR Μοντέλα αυτής της μορφής έχουν χρησιμοποιηθεί εκτεταμένα Όπως είδαμε, μπορούμε να δούμε το μοντέλο αυτό ως γραμμική παλινδρόμηση Οι ανεξάρτητες μεταβλητές δεν είναι ντετερμινιστικές (υπάρχουν όροι μορφής y( n)) n a =n c =0 Finie i impulse response (FIR) model dl y() = bu( ) +... + b u( n ) + e() θ = [ b... b n ] y () =Β ( qu ) () + e () b n b b b Δεν έχουμε προηγούμενες τιμές της εξόδου στο μοντέλο ισοδυναμία με κρουστική απόκριση Γραμμική παλινδρόμηση Οι ανεξάρτητες μεταβλητές εδώ είναι ντετερμινιστικές αν θεωρήσουμε την είσοδο ντετερμινιστική (δεν υπάρχουν όροι μορφής y( n)) Τυπικά χρειάζεται περισσότερες ελεύθερες παραμέτρους από τα μοντέλα AR/ARMAX, επίσης δεν μπορεί να μοντελοποιήσει αναδράσεις /A(q) e() y()
Παραμετρικά μοντέλα γραμμικών συστημάτων Δυο εναλλακτικές μορφές του μοντέλου ARMAX Μπορούμε να μοντελοποιήσουμε το θόρυβο ως διαδικασία AR, δηλαδή A( q) y() =Β ( q) u() + e() Dq ( ) nd Dq ( ) = dq +... + d q n d η ακόμη και πιο γενικά ως διαδικασία ARMA, δηλ Cq ( ) Aq ( ) y ( ) =Β ( qu ) ( ) + e ( ) ARARMAX Dq ( ) u() ARARX e() B(q) C(q)/A(q) υ() + /A(q) y() Σε όλες τις παραπάνω περιπτώσεις, οι συναρτήσεις μεταφοράς G(q) και H(q) έχουν κοινό παράγοντα το Α(q) Είναι λογικό να υποθέσει κανείς ότι είναι πιο ρεαλιστικό να παραμετροποιήσουμε τις συναρτήσεις μεταφοράς G, H ανεξάρτητα τη μια από την άλλη, δηλ Β ( q ) C ( q ) e() y() = u() + e() Fq ( ) Dq ( ) Μοντέλο Box Jenkins C(q)/A(q) u() B(q)/F(q) + υ() y()
Παραμετρικά μοντέλα γραμμικών συστημάτων Στην πιο απλή περίπτωση, έχουμε: w ( ) + f w ( ) +... + f w ( n ) = bu ( ) +... + b u ( n) n f n b f y () = w () + e () Oupu error model dl θ = [ b... b f... f ] n b n f b u() B(q)/F(q) w() + e() y() Βλέπουμε λοιπόν ότι υπάρχουν διάφορες επιλογές για την παραμετροποίηση ενός ΓΧΑ συστήματος. Όλες αυτές οι μορφές είναι ειδικές περιπτώσεις του γενικού μοντέλου: y() = g( τ) u ( τ) + h( τ) e ( τ) = Gqu ( ) () + Hqe ( ) () τ= τ= 0 Σε κάποιες από αυτές συμπεριλαμβάνουμε και προηγούμενες τιμές της εξόδου Λιγότερες παράμετροι ροι από FIR Ανάδραση Διαφορετικοί τρόποι με τους οποίους ο θόρυβος εξόδου συμπεριλαμβάνεται Κάποια μοντέλα (πχ Box Jenkins) μας δίνουν μεγαλύτερη ελευθερία αλλά με το κόστος μεγαλύτερης πολυπλοκότητας Θα δούμε στα επόμενα πιο λεπτομερώς πως μπορούμε να εκτιμήσουμε τις παραμέτρους των μοντέλων αυτών
Μοντέλα πρόβλεψης (predicion models) Μια από τις πιο βασικές χρήσεις της περιγραφής ενός συστήματος είναι η προσομοίωση της εξόδου του (simulaion) για διάφορες εισόδους u() e() Όπως είδαμε και στα προηγούμενα, μας ενδιαφέρει η αδιατάρακτη έξοδος H(q) y *( ) = G ( qu ) ( ), =, 2,..., N υ() Μπορούμε επίσης να χρησιμοποιήσουμε την περιγραφή u() ενός συστήματος για να προβλέψουμε τις μελλοντικές τιμές G(q) y() + της εξόδου με βάση την πληροφορία που έχουμε μέχρι την παρούσα στιγμή. Στην απλούστερη περίπτωση, έστω ότι έχουμε το μοντέλο κινητού μέσου του θορύβου υ () = H ( q ) e () = hke ( ) ( k ), =, 2,...,, N k = 0 και θέλουμε μια πρόβλεψη της τιμής υ() με βάση τις παρατηρήσεις υ(s) για s - Σημείωση: Υποθέτουμε ότι το σύστημα Η είναι ευσταθές. Για να είναι το σύστημα αντιστρέψιμο, με άλλα λόγια για να μπορούμε να υπολογίσουμε το e() από το υ() ως εξής: e ( ) = H ( q) υ( ) = hk ( ) υ( k) k = 0 θα πρέπει ο αντίστροφος του μετασχηματισμού z του Η (/Η(z)) να είναι αναλυτική συνάρτηση για z, δηλαδή με άλλα λόγια να μην έχει πόλους επάνω η εκτός του μοναδιαίου κύκλου z =. Ισοδύναμα, θα πρέπει ο Η(z) να μην έχει μηδενικά επάνω η εκτός του μοναδιαίου κύκλου. H ( q) = H ( q)
Μοντέλα πρόβλεψης (predicion models) Έχουμε (h(0)=): υ() = e() + h( k) e( k) k = Συβολίζουμε την πρόβλεψη του υ() βάσει των παρατηρήσεων υ(s), ( ) s - ˆ( υ ) () O δεύτερος όρος της () είναι γνωστός τη χρονική στιγμή, έστω ότι τον συμβολίζουμε με m( ) H τ.μ. e έχει μηδενική μέση τιμή και τα δείγματά της είναι ανεξάρτητα κατανεμημένα Η πρόβλεψη που ελαχιστοποιεί την διακύμανση: είναι: 2 [ υ ˆ υ ] = [ + ˆ υ ] = + [ ˆ υ ] 2 2 2 E{ () ( ) } E{ e() m( ) ( ) } E{ e ()} E{ m( ) ( ) } ˆ( υ ) = m( ) = h( k) e( k) k = η οποία μπορεί να ξαναγραφεί ως k ˆ( υ ) = hke ( ) ( k) = hkq ( ) e ( ) = [ H( q) ] e ( ) = Hq = = = Hq k= k= ( ) υ() [ H ( q )] υ () h ( k ) υ ( k ) ( ) k =
Μοντέλα πρόβλεψης (predicion models) Έστω ότι θέλουμε να προβλέψουμε την επόμενη τιμή της εξόδου y() του μοντέλου: y() = G( q) u() + H( q) e() = G( q) u() +υ() από τις παρατηρήσεις y(s) και u(s), s - Έχουμε: υ () s = y () s G ()() qus Άρα οι τιμές της υ(s) είναι επίσης γνωστές για s - y ˆ( ) = Gqu ()() + ˆ υ( ) = = Gqu ( ) ( ) + [ H ( q )] υ ( ) = = Gqu + H q y G q u = ( ) () [ ( )][ () ( ) ()] = H ( q) G( q) u( ) + [ H ( q)] y( ) η οποία μπορεί να γραφεί ως: yˆ( ) = l( k) u( k) + h ( k) y( k) k= k= u() G(q) H(q) όπου ηl(k) αντιστοιχεί στον αντίστροφο μετασχηματισμό α Ζ της ηςg( G(q)/H(q) ) Στην παραπάνω ανάλυση, θεωρήσαμε ότι όλα τα δείγματα από μείον άπειρο μέχρι. Στην πράξη αυτό δεν είναι δυνατό, αλλά γνωρίζουμε μόνο δείγματα στο διάστημα [0, ], οπότε στην πραγματικότητα παίρνουμε μια προσέγγιση: yˆ( ) l( k) u( k) + h ( k) y( k) Για πιο ακριβή προσέγγιση: Φίλτρο Kalman k= k= + e() υ() y()
Μοντέλα πρόβλεψης (predicion models) Το σφάλμα πρόβλεψης σε αυτή την περίπτωση είναι: y yˆ = y H q G q u H q y = () ( ) ( ) ( ) ( ) ( ) [ ( )] ( ) = H ( q) G( q) u() + H ( q) y() = e() H(q) e() Άρα η μεταβλητή e() αντιστοιχεί στο μέρος εκείνο της εξόδου που δεν μπορεί να προβλεφθεί από παρατηρήσεις του παρελθόντος, αντιπροσωπεύει με άλλα λόγια τη νέα πληροφορία, γι αυτό και συχνά αναφέρεται ως διαδικασία ανανέωσης/ανανεώσεις (innovaions) u() G(q) + υ() y()
Μοντέλα πρόβλεψης (predicion models) Επιστρέφουμε στα παραμετροποιημένα μοντέλα που είδαμε στην αρχή Με βάση το προηγούμενο αποτέλεσμα μπορούμε να υπολογίσουμε τον προγνωστήρα ενός βήματος μπροστά (one sep ahead predicor), από τη σχέση: yˆ( ) H = ( q, θ) G( q, θ) u( ) + [ H ( q, θ)] y( ) Μοντέλο ARX A( qy ) ( ) = Bqu ( ) ( ) + e ( ) Β( q) Gq (, θ ) =, Hq (, θ ) = A( q) A( q) yˆ( θ) = B( q) u( ) + [ A( q)] y( ) που προκύπτει πολύ εύκολα και από τη σχέση: n a n b u() y() + a y( ) +... + a y( n ) = bu( ) +... + b u( n ) + e() a B(q)/A(q) θεωρώντας πως δεν μπορούμε να προβλέψουμε την «επόμενη» τιμή του e() Όπως έχουμε δει και στα προηγούμενα, η σχέση αυτή μπορεί να γραφτεί ως: y () = φ () θ φ( ) = [ y( )... y( na) u( )... u( nb)] είναι δηλ. ένα μοντέλο γραμμικής παλινδρόμησης Τα μοντέλα ARX χρησιμοποιούνται εκτεταμένα (και) λόγω αυτής της ιδιότητάς τους b /A(q) e() y() +
Μοντέλα πρόβλεψης (predicion models) ˆ( y ( ) = H (, q θ ) G ( q, θ ) u ( ) + [ H ( q, θ )] y ( ) Μοντέλο ARΜΑX A( q) y( ) = B( q) u( ) + C( q) e( ) Β ( q ) C ( q ) Gq (, θ) =, Hq (, θ) = A( q) A( q) One sep ahead predicor u() Bq ( ) Aq ( ) yˆ( ( θ ) = u () + [ ]() y C( q) C( q) Η σχέση αυτή μπορεί να ξαναγραφεί ως: Cqy ( ) ˆ( θ) = Bqu ( ) ( ) + [ Cq ( ) Aq ( )] y ( ) y ˆ ( θ ) = Bqu ( ) () + [ Aq ( )] y () + [ Cq ( ) ][ y () y ˆ ( θ )] = B(q)/A(q) e() C(q)/A(q) y() + = Bqu ( ) ( ) + [ Aq ( )] y ( ) + [ Cq ( ) ] ε (, θ) Ορίζοντας το διάνυσμα φ() ως: φ(, θ) = [ y ( )... y ( n) u ( )... u ( n) ε(, θ)... ε( n, θ)] a b c μπορούμε να γράψουμε: y () = φ (, θ) θ όπου θ = [ a... an b... b... ] a n c c b nc Η σχέση () δεν είναι γραμμική παλινδρόμηση ως προς θ γιατί οι μεταβλητές ε εξαρτώνται από το θ! Ψευδογραμμική παλινδρόμηση (pseudolinear regression)
Μοντέλα πρόβλεψης (predicion models) ˆ( y ( ) = H (, q θ ) G ( q, θ ) u ( ) + [ H ( q, θ )] y ( ) Oupu error model Bq ( ) y () = u () + e () Fq ( ) Β( q) Gq (, θ) =, Hq (, θ) = Fq ( ) One sep ahead predicor Bq ( ) yˆ( θ) = u() Fq ( ) Ορίζοντας: θ = [ b... b f... f ] n b n f u() B(q)/F(q) φ(, θ) = u ( )... u ( n) (, )... (, ) b w θ w n f θ y () = φ (, θ) θ w() + e() y() Οι μεταβλητές w δεν είναι γνωστές αλλά μπορούν να εκτιμηθούν ως εξής: w ( k, θ) = y ˆ( k θ), k=, 2,..., nf Και αυτή η σχέση δεν είναι γραμμική παλινδρόμηση ως προς θ (τα w εξαρτώνται από τις παραμέτρους θ)
Μοντέλα πρόβλεψης (predicion models) ˆ( y ( ) = H (, q θ ) G ( q, θ ) u ( ) + [ H ( q, θ )] y ( ) e() Box Jenkins Β( q) C( q) y() = u() + e() Fq ( ) Dq ( ) Β( q) C( q) Gq ( ) =, Hq ( )= F( q) D( q) Bq ( ) Dq ( ) Cq ( ) Dq ( ) yˆ( θ) = u() + y() Fq ( ) Cq ( ) Cq ( ) u() B(q)/F(q) C(q)/A(q) Βλέπουμε πως το μοντέλο πρόβλεψης εξαρτάται σε κάθε περίπτωση από τον τρόπο που εισέρχεται ο θόρυβος και ο τρόπος που τον μοντελοποιούμε (e() τελείως τυχαίο άρα μη προβλέψιμο, Η(q)e() έχει κάποια δομή άρα μπορεί να προβλεφθεί σε κάποιο βαθμό) + υ() y()
Μοντέλα κατάστασης χώρου (Sae space models) Στα μοντέλα κατάστασης χώρου εκφράζουμε τη σχέση μεταξύ της εισόδου, του θορύβου και της εξόδου για ένα γραμμικό σύστημα με ένα σύστημα γραμμικών διαφορικών εξισώσεων (συνεχής χρόνος) ή εξισώσεων διαφορών (διακριτός χρόνος) σε συνάρτηση με ένα διάνυσμα βοηθητικών μεταβλητών (καταστάσεων saes) x() Αυτού του είδους τα μοντέλα μπορούν να συμπεριλάβουν γνώση που έχουμε για τις φυσικές ιδιότητες ενός συστήματος καθώς πολλοί νόμοι της φυσικής μπορούν να εκφραστούν ως γραμμικές διαφορικές εξισώσεις πρώτης τάξης (π.χ. νόμος του Νεύτωνα, νόμοι κυκλωμάτων κλπ.) Σε συνεχή χρόνο x ( () = Ax () + Bu () + w () y() = Cx() + υ() A: n n, B: n m, C: n n Αριθμός καταστάσεων: n, Αριθμός εισόδων: m Οι έξοδοι (δηλ. οι μετρήσεις μας) είναι κάποιος γραμμικός συνδυασμός των μεταβλητών κατάστασης w() (nx): Θόρυβος διεργασίας (process noise) υ() (nx): Θόρυβος μετρήσεων εων (measuremen noise) Τα μοντέλα κατάστασης χώρου μας δίνουν τη δυνατότητα να δούμε το σύστημα ως «γκρι κουτί» Υπάρχουν πολύ ισχυρά εργαλεία για την ανάλυση τέτοιων συστημάτων (π.χ. χρονικά αμετάβλητο και χρονικά μεταβλητό φίλτρο Kalman που επιτρέπει την εκτίμηση των καταστάσεων και του θορύβου σε κάθε χρονική στιγμή)
Μοντέλα κατάστασης χώρου (Sae space models) Παράδειγμα (ντετερμινιστικό όμηχανικό σύστημα συνεχούς χρόνου) ) Η εξίσωση κίνησης για το σώμα αυτό μας δίνει (όπου x η μετατόπιση) 2 d x() dx() m b kx() f() 0 2 d + d + = Η εξίσωση αυτή είναι γραμμική αλλά δεύτερης τάξης. Μπορούμε να τη φέρουμε σε μορφή μοντέλου κατάστασης χώρου ορίζοντας τις καταστάσεις μας και την έξοδο του συστήματος ως εξής: Καταστάσεις: μετατόπιση x(), ταχύτητα v()=dx()/d. Είσοδος: δύναμη f(). Η εξίσωση γράφεται: dv() dv() b k m + bv() + kx() f () = 0 = v() x() + v() d d m m m Ορίζουμε την έξοδο ως: y()=x(). Σε μορφή πινάκων παίρνουμε τελικά: dx() d 0 x ( ) 0 x () = = f () dv() + k / m b/ m v() / m d x () y() = [ 0 ] + [0] f() v ()
Μοντέλα κατάστασης χώρου (Sae space models) Συγκρίνοντας με το γενικό μοντέλο κατάστασης χώρου έχουμε: 0 A = km / bm / 0 B = / m C = 0 D = 0 [ ] Malab: Εντολή sspace saespace = ss(a, B, C, D)
Μοντέλα κατάστασης χώρου (Sae space models) Σε διακριτό χρόνο έχουμε την αντίστοιχη αναπαράσταση με εξισώσεις διαφορών x( + ) = A( θ) x( ) + B( θ) u( ) + w( ) y() = Cx() + υ() A : n n, B: n m, C: n n Για τις μεταβλητές θορύβου υποθέτουμε: E{ ww } = R ( θ), E{ υυ } = R ( θ), E{ wυ } = R ( θ) 2 2 Αν έχουμε λευκό θόρυβο: διαγώνιοι πίνακες Αναλογία με το μοντέλο: y() = G( q) u() + H( q)() e Ποια είναι η συνάρτηση μεταφοράς G(q) μεταξύ u και y? x( + ) = A( θ) x( ) + B( θ) u( ) + w( ) x () = ( q I A ( θ )) B ( θ ) u () + w () y() = C( qi A( θ)) B( θ) u() + w() + υ() Gq [ ] [ ] (, θ) = C( qi A( θ)) B( θ)
Μοντέλα κατάστασης χώρου (Sae space models) Ισοδυναμία με μοντέλο AR. Έστω το μοντέλο: y() + a y( ) +... + an y( n) = e() Ορίζοντας το διάνυσμα κατάστασης ως: x( ) = [ y( ) y( )... y( n+ )] μπορούμε να γράψουμε αυτό το μοντέλο στη μορφή: x( + ) = A( θ) x( ) + B( θ) u( ) + w( ) y() = Cx() + υ() όπου: a... an an... 0 0 A = 0......... 0 0 0 B = [ 0... 0] C = [ 0... 0] u() = υ() = 0 w() = e()
Ορίζοντας: Μοντέλα πρόβλεψης (predicor models) μπορούμε να γράψουμε το γενικό μοντέλο y() = G( q) u() + H( q) e() = G( q) u() +υ() ως: Επίσης, μπορούμε να γράψουμε τον προγνωστή ενός βήματος y ˆ( ) = H ( qgqu ) ( ) ( ) + [ H ( q)] y ( ) ως: όπου (αφού φ ύ παραμετροποιήσουμε) ) () Έχουμε μια σχέση μεταξύ (q,θ) και W(q,θ) Ορισμός: Ένα μοντέλο προγνωστή ενός γραμμικού χρονικά αμετάβλητου συστήματος είναι ένα ευσταθές φίλτρο W(q,θ) το οποίο ορίζεται όπως στην () Ορισμός: Ένα πλήρες πιθανοτικό μοντέλο πρόγνωσης του ΓΧΑ συστήματος ορίζεται ως το ζευγάρι {W(q,θ),p e (e)}. Στις περισσότερες περιπτώσεις, η ακριβής μορφή της σ.π.π. p e δεν είναι γνωστή, οπότε δουλεύουμε με τη μέση τιμή και τη διακύμανση του σήματος θορύβου e.
Μοντέλα πρόγνωσης (predicor models) Το μοντέλο πρόγνωσης μπορεί να είναι ευσταθές χωρίς το σύστημα να είναι ευσταθές, π.χ. έστω το μοντέλο ARX y() + ay( ) = bu( ) + e() όπου α >. Το μοντέλο μεταξύ u και y είναι ασταθές γιατί: Bq ( ) y () = u () + e () Aq ( ) Aq ( ) bq (πόλοι εκτός του μοναδιαίου κύκλου) G( q) =, H ( q) = + aq + aq Αντίθετα το μοντέλο πρόγνωσης είναι: yˆ( ) = B( q) u( ) + [ A( q)] y( ) = bu( ) ay( ) το οποίο είναι πάντα ευσταθές!!
Σύνολα μοντέλων (model ses) Όπως έχουμε δει, το πρόβλημα της αναγνώρισης συστημάτων αφορά την επιλογή ενός κατάλληλου λ μοντέλου από ένα σύνολο υποψήφιων μοντέλων. Παραδείγματα: Β( q) C( q) Το μοντέλο ARMAX y () = u () + e () Aq ( ) Aq ( ) Το μοντέλο κατάστασης χώρου κλπ. Επιλογή της δομής μοντέλου Μοντέλο ARMAX: επιλογή των n a, n b, n c. Mοντέλο κατάστασης χώρου: Διάσταση του διανύσματος κατάστασης, τρόπος εξάρτησης των πινάκων Α,Β,C,D CDαπό τις παραμέτρους θ Η επιλογή εξαρτάται από την εφαρμογή όπως έχουμε δει. Παράγοντες: Ευελιξία (Flexibiliy): Το μοντέλο θα πρέπει να μπορεί να περιγράψει τη δυναμική συμπεριφορά του συστήματος για διαφορετικά σενάρια που μπορεί να συμβούν στην εκάστοτε εφαρμογή. Οικονομία (Parsimony): Μεταξύ δύο μοντέλων με διαφορετικό αριθμό παραμέτρων που περιγράφουν το σύστημά μας με παρόμοιο τρόπο επιλέγουμε το μοντέλο με τις λιγότερες παραμέτρους. Υπολογιστική ική πολυπλοκότητα λοκό (π.χ. χ εφαρμογές σε αληθινό χρόνο) (Ασυμπτωτικές) Ιδιότητες της συνάρτησης κριτηρίου. Τοπικά/ολικά ελάχιστα κλπ.
Μοναδικότητα (uniqueness) Έστω ότι το αληθινό σύστημα περιγράφεται από τις συναρτήσεις μεταφοράς G 0, H 0 και τη διακύμανση του θορύβου e, λ 2 : y() = G0( q) u() + H0( q) e() Τότε αν ορίσουμε το σύνολο D ως: 2 2 D = { θ G = G( q, θ), H = H( q, θ), λ = λ ( θ)} 0 0 0 μπορούμε να διακρίνουμε τις εξής περιπτώσεις: D κενό: υποπαραμετροποιημένη (underparamerized) δομή μοντέλου (δεν έχουμε αρκετές παραμέτρους) Το D περιέχει περισσότερα από ένα σημεία: υπερπαραμετροποιημένη δομή μοντέλου Το D περιέχει ακριβώς ένα σημείο: Ιδανική περίπτωση, το σύστημα προσδιορίζεται μοναδικά από το μοντέλο για θ=θ θ 0 Στην πράξη, δύσκολο να αποδειχθεί η μοναδικότητα ενός μοντέλου
Μοναδικότητα (uniqueness) Παράδειγμα: Μοντέλο ARMAX Έστω ότι το αληθινό σύστημα δίνεται από 2 2 A ( q) y() = B ( q) u() + C ( q) e (), E{ e } = λ s s s s s s και το μοντέλο από: 2 2 Aq ( ) y ( ) = Bqu ( ) ( ) + Cqe ( ) ( ), Ee { } = λ άρα το σύνολο D ορίζεται από τις ισότητες: Βs( q) Β( q) Cs( q) C( q) 2 2 =, =, s A( q) Aq ( ) A( q) Aq ( ) λ = λ s Θα πρέπει λοιπόν: n n, n n, n n a as b bs c cs s για να έχουμε τουλάχιστον μια λύση. Αν ορίσουμε: n * = min( n n, n n, n n ) a as b bs c cs έχουμε τελικά ότι: n*>0: περισσότερες από μια λύση (άπειρες) n*=0: ακριβώς μια λύση n*<0: καμία λύση
Αναγνωρισιμότητα (idenifiabiliy) Ένα σύστημα είναι αναγνωρίσιμο (sysem idenifiable) όταν το σύνολο 2 2 D = { θ G0 = G( q, θ), H0 = H( q, θ), λ0 = λ ( θ)} δεν είναι κενό και θˆ D, N Ένα σύστημα είναι αναγνωρίσιμο ως προς τις παραμέτρους του (parameer idenifiable) όταν είναι αναγνωρίσιμο και το σύνολο D περιέχει ένα σημείο ( θ ˆ θ ) 0 Με άλλα λόγια, αν η επιλογή μοντέλου, σήματος εισόδου και μεθόδου αναγνώρισης έχει ως αποτέλεσμα το διάνυσμα των εκτιμώμενων παραμέτρων ˆθ να συγκλίνει σε ένα διάνυσμα παραμέτρων που περιγράφει τέλεια το σύστημα καθώς ο αριθμός των παρατηρήσεων τείνει στο άπειρο, το σύστημα λέγεται αναγνωρίσιμο. Αν επιπλέον το σύστημα προσδιορίζεται μοναδικά από αυτό το μοντέλο, τότε λέγεται και αναγνωρίσιμο ως προς τις παραμέτρους (parameer idenifiable)