Υπολογιστική Φυσική Στοιχειωδών Σωματιδίων 4ο Εξάμηνο2005-2006 Στατιστική Πιθανότητες-Κατανομές Διδάσκοντες : Χαρά Πετρίδου Δήµος Σαμψωνίδης 28/3/2005 Υπολογ.Φυσική ΣΣ 1
28/3/2005 Υπολογ.Φυσική ΣΣ 2 Πιθανότητες Ορισμός 1-Μαθηματικός: P(A) είναι αριθμός που πληρεί τα αξιώματα του Kolmogorov ΔΕΝ δινει πληροφορία ο μαθηματικός ορισμός! 1 ) ( ) ( ) ( ) ( 0 ) ( 2 1 2 1 = + = i A P A P A P A A P A P
Πιθανότητες Ορισμός 2 : Κλασσικός ορισμός ΗπιθανότηταP(A) είναι η ιδιότητα ενός αντικειμένου που καθορίζει πόσο συχνά συμβαίνει ένα γεγονός Α. Δίνεται από την συμμετρία για εξίσου πιθανά γεγονότα. Γεγονότα όχι το ίδιο πιθανά τα θεωρουμε εξισου πιθανα Παράδειγμα : ρίχνουμε ένα νομισμα : P(Η) = 1/2 Ρίχνουμε δύο ζάρια : P(8) = 5/36? ή P(8) = 6/36? 28/3/2005 Υπολογ.Φυσική ΣΣ 3
Προβήματα με τον κλασσικό ορισμό 1. Ποτε πρόκειται για εξισου πιθανές περιπτώσεις?. Αν ρίξουμε δύο νομίσματα έχουμε 3 ή 4 ίσες δυνατότητες? 2. Τι κανουμε σε περιπτώσεις που έχουμε συνεχείς μεταβλητές?. Πως να χωρίσουμε ένα τρίγωνο σε δύο τυχαία μέρη? Έχουμε λύση Δεν Έχουμε λύση 28/3/2005 Υπολογ.Φυσική ΣΣ 4
Πιθανότητες - Συχνότητα Ορισμός 3 -Frequentist ( συχνάζουσα πιθανότητα) ΗπιθανότηταP(A) είναι το όριο του λόγου Ν(Α)/Ν (σε ένα σύνολο Ν με ιδιότητα Α) P( A) N = N ( A) N 28/3/2005 Υπολογ.Φυσική ΣΣ 5
Πρόβλημα (περιορισμός) με τον ορισμό της συχνάζουσας πιθανότητας Η P(A) εξαρτάται και απο το Α και απο το σύνολο Ν. Η πιθανότητα που υπολογίζουμε μπορεί να είναι παραπλανητική αν βασιστούμε στην συχνότητα του γεγονότος : 10 στους 30 ανθρώπους σε ένα σύνολο είναι πλούσιοι => P(πλούσιος) = 1/3!!! 28/3/2005 Υπολογ.Φυσική ΣΣ 6
Συνέπειες για την Κβαντομηχανική (QM) Στην QM υπολογίζουμε πιθανότητες Λ p Οι πιθανότητες εξαρτώνται απο το είδος των γεγονότων που έχουμε Λ (π.χ. Λ 0 ) και την αλληλεπίδραση PDG: P(pπ )=0.639 P(nπ 0 )=0.358 π n π 0 28/3/2005 Υπολογ.Φυσική ΣΣ 7
Το πρόβλημα με τον ορισμό της συχνάζουσας πιθανότητας ΔΕΝ μπορεί να εφαρμοστεί σε μεμονωμένα γεγονότα! ηέκφραση πιθανόν να βρέξει αύριο ΔΕΝ είναι επιστημονική!!! Ενω : η δήλωση πιθανόν να βρέξει αύριο είναι σωστή είναι Η ανακάλυψη ή όχι του Higgs H ανακάλυψη ή όχι σκοτεινής ύλης 28/3/2005 Υπολογ.Φυσική ΣΣ 8
Ορισμός της υποκειμενικής πιθανότητας (Βayesian) P(A) είναι η πιθανότητα που δίνουμε στην ιδιότητα Α να υπάρξει. Το Α μπορει να είναι ο,τιδήποτε. Νεα θεωρία, νέο σωματίδιο, δίασπαση σωματιδίου, βροχή, ενα στοίχημα 28/3/2005 Υπολογ.Φυσική ΣΣ 9
A To Θεώρημα του Βayes A B B Ω Υπό όρους πιθανότητα (conditional probability) : P(A B) είναι η πιθανότητα των κοινών σημείων των Α και Β σε σχέσημετοσύνολοβκαιη P(A B) σε σχέση με το Ω P(A B) = P(A B)*P(B) = P(B A)*P(A) => P( B A) P ( A B) = P( A) P( B) Γνωρίζουμε την πιθανότητα να συμβεί B όταν συμβαίνει A και υπολογίζουμε την αντίστροφη πιθανότητα 28/3/2005 Υπολογ.Φυσική ΣΣ 10
Εφαρμογή του Θεωρήματος Bayes για την συχνάζουσα πιθανότητα Ταυτοποίηση σωματιδίων -Τύποι σωματιδίων :e, π, μ, Κ, p -Σήματα απο ανιχνευτές: DCH, RICH, TOF, TRD P '( e) = P( e DCH ) = P( DCH e) P( DCH ) P( e) P ( DCH ) = P( DCH e) P( e) + P( DCH µ ) P( µ ) + P( DCH π ) P( π )... Αντίστοιχα υπολογίζουμε την P(e RICH) κλπ (δηλ. σήμα στον ανιχνευτή να οφείλεται σε e) 28/3/2005 Υπολογ.Φυσική ΣΣ 11
Παράδειγμα χρήσης του θεωρήματος Βayes με την συχνάζουσα πιθανότητα Δεσμη αποτελείται από π ς & e ς Ν e /N π =10-3 Το σύστημα σκανδαλισμού: ε e =0.98, ε π =0.03 P(e)=10-3 P(π)=1-10 -3 P(T e)=0.98, P(T π)=0.03 π, e trigger P(e T)=P(T e)*p(e)/(p(t e)*p(e)+p(t π)p(π)) είναι η πιθανότητα το εισερχόμενο σωμάτιο να είναι ηλεκτρόνιο όταν το σύστημα σκανδαλισμού λέει ναι 28/3/2005 Υπολογ.Φυσική ΣΣ 12 expt
Το θεώρημα Bayes και η υποκειμενική πιθανότητα P( Result Theory) P ( Theory Result) = P( Theory) P( Result) Η εκ των προτέρων πίστη σε μια θεωρία αλλάζει με βάση τα πειραματικά αποτελέσματα : Εαν (P(Result Theory) = 0, (η Θεωρία απαγορεύει το πειραματικό αποτέλεσμα) =>η Θεωρία δεν ισχύει Εαν (P(Result Theory) = Μεγάλο, ενισχύεται η πίστη μας στη Θεωρία 28/3/2005 Υπολογ.Φυσική ΣΣ 13
Πρόβλημα με την υποκειμενική πιθανότητα Ηπιθανότητα μου P(A) και η πιθανότητα P(A) ενος τρίτου μπορει να διαφέρουν Αλλα οι επιστήμονες θάπρεπε να ειναι αντικειμενικοί! Δικαιολογείται η άγνοια να δηλώνεται με P(A)=flat? (αν το Α παιρνει διακριτές τιμές το ίδιο πιθανές, ναι. Αν συνεχής μεταβλητή, π.χ. Μ higgs διαφορετική υπόθεση θα δώσει άλλα αποτελέσματα) M 28/3/2005 Υπολογ.Φυσική ΣΣ 14 M M
Συνάρτηση Πυκνότητας Πιθανότητας- Κατανομές Ορίσαμε τη Πιθανότητα Όταν μετρούμε ένα παρατηρήσιμο μέγεθος πολλές φορές, το απoτέλεσμα x κατανέμεται σύμφωνα με μιά κατανομή πιθανότητας (probability distribution) Tο αποτέλεσμα έχει μια διακύμανση είτε λόγω καποιων παραμέτρων (π.χ. ηλετρονικό θόρυβο) είτε λόγω διακύμανσης του φυσικού φαινομένου (π.χ. διάσπαση ή σκέδαση σωματιδίων) Οι κατανομές πιθανότητας μπορεί να είναι διακριτές ή συνεχείς. 28/3/2005 Υπολογ.Φυσική ΣΣ 15
Πιθανότητα vs Στατιστικής Πιθανότητα: απο την θεωρία στα δεδομένα Υπολογίζουμε όλα τα πιθανά αποτελέσματα (συνέπειες) ενός πειράματος για συγκεκριμένο πρόβλημα Στατιστική: απο τα δεδομένα στη θεωρία Λύνουμε το αντίστροφο πρόβλημα: απο τα δεδομένα προσπαθούμε να βρούμε τους κανόνες-νόμους=> ανάλυση των δεδομένων => Υπολογισμός παραμέτρων και του σφάλματος => έλεγχος της υπόθεσης: πιστότητα, συμφωνία 28/3/2005 Υπολογ.Φυσική ΣΣ 16
Συναρτήσεις Πυκνότητας Πιθανότητας Επανειλημένη μέτρηση -πειραματικά- μιας συνεχούς μεταβλητής x Ορισμός : η πιθανότηταp να μετρήσουμε μια τιμή x στο διάστημα (x, x+dx) δίνεται από την συνάρτηση πυκνότητας πιθανότητας : probability density function f(x) (p.d.f.) : P=f(x) dx Είναιτομέτροτουπόσοσυχνάητιμήx εμφανίζεται σένα δείγμα 28/3/2005 Υπολογ.Φυσική ΣΣ 17
Κατανομές-ιδιότητες Αναμενόμενη τιμή =Μέση τιμή Διασπορά -Variance = σ 2 =το τετραγωνο της απόκλισης σ Μετράει την διασπορά του x σε σχέση με την μέση τιμή 28/3/2005 Υπολογ.Φυσική ΣΣ 18
Παραδείγματα Οχρόνοςζωήςt σωματιδίου στο σύστημα ηρεμίας του π.χ. Το πιόνιο : μέσοςχρόνοςζωήςτ π = 2.6 10-8 sec 28/3/2005 Υπολογ.Φυσική ΣΣ 19
Παραδείγματα Κατανομή της πολικής γωνίας θ του μιονίου στην σκέδαση ee μμ 28/3/2005 Υπολογ.Φυσική ΣΣ 20
Κατανομές-Διακριτές κατανομές Διώνυμη κατανομή: η τυχαία μεταβλητή εχει δύο δυνατότητες 0.4 n προσπάθειες και r επιτυχίες p η μεμονωμένη πιθανότητα για επιτυχία 0.2 0 0 1 2 3 4 5 r Mean µ=<r>=σrp( r ) P( r ; n, p) n! r!( n = r n r p (1 p ) r)! Variance V σ 2 =<(r- µ ) 2 >=<r 2 >-<r> 2 =np(1-p) = np 1-p p q 28/3/2005 Υπολογ.Φυσική ΣΣ 21
Παραδείγματα διώνυμης κατανομής 0.8 0.6 0.4 0.2 0 p=0.1 r n=5 0.3 0.2 0.1 0 n=20 r r 0.2 0.15 0.1 0.05 0 r n=50 n=10 p=0.2 p=0.5 p=0.8 0.4 0.2 0 r r 0.3 0.2 0.1 0 r 0.4 0.3 0.2 0.1 0 r 28/3/2005 Υπολογ.Φυσική ΣΣ 22
Κατανομή Poisson 0.3 0.2 0.1 λ=2.5 Δίνει την πιθανότητα να συμβούν r γεγονότα όταν ο ρυθμός των γεγονότων κατά μέσον όρο είναι λ ( είναι το όριο της διωνυμικής κατανομής όταν n p 0, np=λ) 0 r P( r; λ) = e λ r λ r! Mean µ=<r>=σrp( r ) = λ Variance V σ 2 =<(r- µ ) 2 >=<r 2 >-<r> 2 =λ 28/3/2005 Υπολογ.Φυσική ΣΣ 23
Παραδείγματα κατανομής Poisson 0.8 0.6 0.4 0.2 0 λ=0.5 r r 0.4 0.3 0.2 0.1 0 λ=1.0 r r 0.3 0.2 0.1 0 λ=2.0 r λ=5.0 0.2 λ=10 λ=25 0.1 0.2 0.1 0 r 0.1 0 r 28/3/2005 r Υπολογ.Φυσική ΣΣ 24 0 r
Κατανομές Poisson Το πλήθος των ραδιενεργών διασπάσεων σε ορισμένο χρόνο t, μικρό σε σχέση με τον χρόνο διάσπασης Το πλήθος συγκεκριμένου τύπου σωματιδίων σε σκέδαση σωματιδίου-σωματιδίου όταν ο συνολικός αριθμός των γεγονότων είναι πολύ μεγάλος και η συγκεκριμένη διαδικασία σπάνια Η πιθανότητα παρατήρησης n γεγονότων σε χρόνο t, όταν ο μέσος ρυθμός είναι μ : λ=μt. Hμέση τιμή λ- αναμενόμενη τιμή- και η διακύμανση : variance στην κατανομή Poisson είναι ισες!. Απο δώ προκύπτει o τύπος : n± n που χρησιμοποιείται στα στατιστικά σφάλματα όταν μετρούμε σε συγκεκριμένο χρονικό διάστημα 28/3/2005 Υπολογ.Φυσική ΣΣ 25
Ομοιόμορφες Κατανομές (Uniform Distributions) H πιθανότητα είναι σταθερή σε ένα διάστημα : πχηκατανομήτων μιονίων κατα την αζιμουθιακή γωνία φ στη σκέδαση : ee μμ μ + μ - Ε : αναμενόμενη τιμή V : variance 28/3/2005 Υπολογ.Φυσική ΣΣ 26
Κατανομή Gauss ή Νοrmal Πυκνότητα πιθανότητας P( x; µ, σ ) = σ 1 2π e ( x µ ) 2 / 2 σ 2 Mean µ=<x>= xp( x ) dx =µ Variance V σ 2 =<(x- µ ) 2 >=<x 2 >-<x> 2 =σ 2 28/3/2005 Υπολογ.Φυσική ΣΣ 27
Central Limit Theorem (CLT) 0.12 0.12 0.1 0.08 0.06 0.04 0.08 0.02 0 0.06 Το άθροισμα y, n τυχαίων, ανεξάρτητων αριθμών x i είναι gaussian (n ) όποια κι αν είναι η κατανομή των x i Convolute uniform distribution με τον εαυτό της 0.1 1 2 3 4 5 6 7 8 9 10 0.12 0.1 0.08 0.06 0.04 0.02 0 1 2 3 4 5 6 7 8 9 1011121314151617181920 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Series1 0.08 0.07 0.07 0.07 0.04 0.06 0.05 0.04 0.04 0.04 0.03 0.03 0.03 0.02 0.02 0.02 0.01 0.01 0.01 0 0 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 1 4 7 1013161922252831343740434649525558 0.02 0.06 0.06 0.05 0.05 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 28/3/2005 Υπολογ.Φυσική ΣΣ 28
Σχέσεις μεταξύ κατανομών Διώνυμη : Ν=το πλήθος των δοκιμών, p=η πιθανότητα επιτυχίας σε κάθε δοκιμή 28/3/2005 Υπολογ.Φυσική ΣΣ 29
Μια μόνο κατανομή υπαρχει! Τύποι κατανομών Gauss 68.27% within 1σ 95.45% within 2σ 99.73% within 3σ 90% within 1.645 σ 95% within 1.960 σ 99% within 2.576 σ 99.9% within 3.290σ Normalisati on (if required) Location change µ Width scaling factor Falls to 1/e of peak at x=µ±σ 28/3/2005 Υπολογ.Φυσική ΣΣ 30
z = χ 2 = n i=1 Κατανομή Chi-Squared (χ 2 ) 2 x i µ i σ i x i : ανεξαρτητες μεταβλητές με κατανομή Gauss Το πλήθος των βαθμών ελευθερίας Γ(x) = e Cx 1 + e x / n 28/3/2005 Υπολογ.Φυσική ΣΣ 31 x Π n=1 1+ x /n C = lim n 1+ 1 2 + 1 3 +...+ 1 n ln(n)
Υπολογιστική Φυσική Στοιχειωδών Σωματιδίων 4ο Εξάμηνο2005-2006 Ιστογράμματα (Histograms) Διδάσκοντες : Χαρά Πετρίδου Δήµος Σαμψωνίδης 28/3/2005 Υπολογ.Φυσική ΣΣ 32
Ιστογράμματα Συνήθως οι μεταβλητές που χρησιμοποιούμε είναι διακριτές μεταβλητές x 1, x 2, x n που προέρχονται από πειραματικές μετρήσεις Παράδειγμα: κατανομή πολικής γωνίας θ Σύγκριση των δεδομένων με ομαλή κατανομή 28/3/2005 Υπολογ.Φυσική ΣΣ 33
Iστογράμματα Entries, normalization, Bin width(s) (στο παράδειγμα ισαπέχουσες bins) Πλήθος των bins Περιοχή (Range) 28/3/2005 Υπολογ.Φυσική ΣΣ 34
Ιστογράμματα Εαν Ν (entries) μεγάλος αριθμός το ιστόγραμμα αντιπροσωπεύει κατανομή πιθανότητας (pdf) Ενδιαφέρει το πλήθος των γεγονότων σε κάθε bin και το σφάλμα H κανονικοποίηση του ιστογράμματος Ημέσητιμήτουιστογράμματος 28/3/2005 Υπολογ.Φυσική ΣΣ 35
Σφάλματα στο Ιστόγραμμα 28/3/2005 Υπολογ.Φυσική ΣΣ 36
Σφάλματα στο Ιστόγραμμα Προσθέτουμε error bars στο ιστόγραμμα 28/3/2005 Υπολογ.Φυσική ΣΣ 37
Σφάλματα στο Ιστόγραμμα Προσοχή!Περίπτωση μικρού πλήθους γεγονότων 28/3/2005 Υπολογ.Φυσική ΣΣ 38
Poisson vs Gaussian 28/3/2005 Υπολογ.Φυσική ΣΣ 39
Σφάλματα στο Ιστόγραμμα 28/3/2005 Υπολογ.Φυσική ΣΣ 40
Ιστογράμματα Τι θα πρέπει να προσέχουμε? Το μέγεθος του bin (bin size) Γεγονότα εκτός των ορίων του ιστογράμματος (underflows, overflows) Κατανομές με γρήγορες μεταβολές (steeply falling/fast varying functions) 28/3/2005 Υπολογ.Φυσική ΣΣ 41
Επιλογή του bin width Επιλέγουμε την υποδιαίρεση της κλίμακας (bin width) έτσι ώστε το πλήθος των γεγονότων ανά υποδιαίρεση να είναι λογικό 28/3/2005 Υπολογ.Φυσική ΣΣ 42
Επιλογή του bin width Ο αριθμός των γεγονότων που μετατοπίζονται εντός και εκτός της υποδιαίρεσης πρέπει να είναι παρόμοιος (bin migration-σταθερότητα και καθαρότητα του δείγματος) Το bin width πρέπει να ταιριάζει με την πειραματική διακριτική ικανότητα στην συγκεκριμένη μεταβλητή (experimental resolution) Να υπάρχει αρκετή στατιστική για κάθε υποδιαίρεση (bin statistics) 28/3/2005 Υπολογ.Φυσική ΣΣ 43
Επιλογή του bin width Σημαντικό για συναρτήσεις με απότομη κλίση Παράδειγμα: η κατανομή της ορμής του σωματιδίουσυντονισμού ρ 28/3/2005 Υπολογ.Φυσική ΣΣ 44
Επιλογή της κλίμακας (Histogram range) Κακή επιλογή κλίμακας μπορεί να οδηγήσει σε παραπλανητικά συμπεράσματα =>Πρέπει να ελέγχουμε να μην υπάρχουν overflows και underflows Η κλίμακα είναι σημαντική και στην περίπτωση κανονικοποίησης 28/3/2005 Υπολογ.Φυσική ΣΣ 45
Σύγκριση ιστογράμματος με ομαλή συνάρτηση Προσοχή στις συναρτήσεις με απότομες ή γρήγορες μεταβολές 28/3/2005 Υπολογ.Φυσική ΣΣ 46
Ιστογράμματα 2- διαστάσεων (scaterplots) =>Χρήσιμο εργαλείο για να μελετήσουμε συσχετισμούς δύο μεταβλητών (correlations) Συσχετίσεις-Συμμεταβολή (correlations-covariance) 28/3/2005 Υπολογ.Φυσική ΣΣ 47
Ιδιότητες-Συσχετισμοί (correlations) Για συναρτήσεις με διάφορες μεταβλητές μπορεί να υπάρχουν συσχετίσεις μεταξύ των μεταβλητών Παράδειγμα : για συναρτήσεις δύο τυχαίων μεταβλητών x, y η συμμεταβολή (covariance) V(x,y) (ή cov(x,y)) -error matrix- ορίζεται ως: Ο παράγοντας συσχέτησης ορίζεται ως: ρ=1 για y=ax+b 28/3/2005 Υπολογ.Φυσική ΣΣ 48
28/3/2005 Υπολογ.Φυσική ΣΣ 49
Ιδιότητες-Συσχετισμοί (correlations) Υπολογισμός του σφάλματος για συναρτήσεις με συσχετιζόμενες μεταβλητές: παίρνουμε υπ όψη την συσχέτηση 28/3/2005 Υπολογ.Φυσική ΣΣ 50