Στατιστική και Θεωρητική Πληροφορική σε πολλές Διαστάσεις

Σχετικά έγγραφα
Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Στατιστική. Εκτιμητική

Στατιστική Ι (ΨΥΧ-1202) ΑΣΚΗΣΕΙΣ

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Παρατηρήσεις για τη χρήση ενός κυκλικού διαγράμματος

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 1 Εισαγωγή

Στατιστικοί πίνακες. Δημιουργία κλάσεων

4.4 ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

Κάνοντας ακριβέστερες μετρήσεις με την βοήθεια των Μαθηματικών. Ν. Παναγιωτίδης, Υπεύθυνος ΕΚΦΕ Ν. Ιωαννίνων

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

9. Παλινδρόμηση και Συσχέτιση

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

ΕΡΩΤΗΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

f , Σύνολο 40 4) Να συμπληρώστε τον παρακάτω πίνακα f , , Σύνολο 5) Να συμπληρώστε τον παρακάτω πίνακα

Μαθηματικά: Αριθμητική και Άλγεβρα. Μάθημα 3 ο, Τμήμα Α. Τρόποι απόδειξης

Επαναληπτικά θέματα στα Μαθηματικά προσανατολισμού-ψηφιακό σχολείο ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Η παρουσίαση που ακολουθεί, αφορά την κανονική κατανομή και σκοπό έχει τη διευκόλυνση των φοιτητών του τμήματος Ηλεκτρολόγων Μηχανικών & Μηχανικών

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Μέτρα θέσης και διασποράς

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

Μεθοδολογία Επίλυσης Προβλημάτων ============================================================================ Π. Κυράνας - Κ.

Μάθηµα 11. Κεφάλαιο: Στατιστική

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΠΟΣΟΤΙΚΗ ΓΕΝΕΤΙΚΗ 03. ΜΕΣΗ ΤΙΜΗ & ΔΙΑΚΥΜΑΝΣΗ

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

6.5. ΑΠΟΤΕΛΕΣΜΑΤΑ ΕΡΕΥΝΩΝ ΣΤΟΥΣ ΚΑΤ ΕΚΤΙΜΗΣΗ ΥΠΟΛΟΓΙΣΜΟΥΣ ΤΗΣ ΣΧΟΛΗΣ ΤΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΤΗΣ ΦΥΣΗΣ ΚΑΙ ΤΗΣ ΖΩΗΣ

Στατιστική Ι Ασκήσεις 3

3. Κατανομές πιθανότητας

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Δειγματικές Κατανομές

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Εισαγωγή στη Στατιστική

Υπολογισμός του πίνακα A n, n Z Νίκος Χαλιδιάς Τμήμα Στατιστικής και Αναλογιστικών - Χρηματοοικονομικών Μαθηματικών Πανεπιστήμιο Αιγαίου

ΘΕΜΑ Α Α1. Αν και είναι δύο συμπληρωματικά ενδεχόμενα ενός δειγματικού χώρου να αποδείξετε ότι για τις πιθανότητές τους ισχύει: ( ) 1 ( ).

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

ΣΤΟΧΑΣΤΙΚΑ ΜΑΘΗΜΑΤΙΚΑ- ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ- ρ. Σ.Πατσιοµίτου

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Γ ΛΥΚΕΙΟΥ. Μηχανική Στερεού Σώματος. Ροπή Δυνάμεων & Ισορροπία Στερεού Σώματος. Επιμέλεια: ΑΓΚΑΝΑΚΗΣ A.ΠΑΝΑΓΙΩΤΗΣ, Φυσικός

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Μαθηματικά Και Στατιστική Στη Βιολογία

HY118-Διακριτά Μαθηματικά. Θεωρία γράφων/ γραφήματα. Τι έχουμε δει μέχρι τώρα. Ισομορφισμός γράφων: Μία σχέση ισοδυναμίας μεταξύ γράφων.

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Θέμα «Η διδασκαλία και η αξιολόγηση των Μαθηματικών στις Πανελλαδικές Εξετάσεις νέοι δρόμοι και αλλαγή φιλοσοφίας»

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

Γραφική επίλυση γραμμικού συστήματος με δύο αγνώστους.

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΟΥ ΕΠΑ.Λ. Δ. Ε. ΚΟΝΤΟΚΩΣΤΑΣ ΜΑΘΗΜΑΤΙΚΟΣ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Το Κεντρικό Οριακό Θεώρημα

Στατιστική Συμπερασματολογία

HY118- ιακριτά Μαθηµατικά. Θεωρία γράφων / γραφήµατα. Τι έχουµε δει µέχρι τώρα. Υπογράφηµα Γράφοι

Το Κεντρικό Οριακό Θεώρημα

X = = 81 9 = 9

ΜΑΘΗΜΑΤΙΚΑ. 1 ο ΔΙΑΓΩΝΙΣΜΑ. ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f x. Ι. Το πεδίο ορισμού της f είναι:., 1 υ -1, B. 1, Γ. -1,., 1.

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

Υποθέσεις - - Θεωρήματα Υποθέσεις - Θεωρήματα Στα μαθηματικά και στις άλλες επιστήμες κάνουμε συχνά υποθέσεις. Οταν δείξουμε ότι μια υπόθεση είναι αλη

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

να είναι παραγωγίσιμη Να ισχύει ότι f Αν μια από τις τρεις παραπάνω συνθήκες δεν ισχύουν τότε δεν ισχύει και το θεώρημα Rolle.

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

Φυσική Θετικών Σπουδών Γ τάξη Ενιαίου Λυκείου 2 0 Κεφάλαιο

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

F x h F x f x h f x g x h g x h h h. lim lim lim f x

Διάλεξη 1 Βασικές έννοιες

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

f x g x f x g x, x του πεδίου ορισμού της; Μονάδες 4 είναι οι παρατηρήσεις μιας ποσοτικής μεταβλητής Χ ενός δείγματος μεγέθους ν και w

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Γ ΛΥΚΕΙΟΥ ΣΥΜΒΟΛΗ ΚΥΜΑΤΩΝ. Επιμέλεια: ΑΓΚΑΝΑΚΗΣ A.ΠΑΝΑΓΙΩΤΗΣ, Φυσικός.

Transcript:

Στατιστική και Θεωρητική Πληροφορική σε πολλές Διαστάσεις ΜΑΝΩΛΗΣ ΖΑΜΠΕΤΑΚΗΣ ΔΙΔΑΚΤΟΡΙΚΟΣ ΦΟΙΤΗΤΗΣ ΜΙΤ Ημερίδα «Νέες Εξελίξεις στην Πληροφορική», 2018

Ροή Ομιλίας Παράδειγμα Σύνθετου Στατιστικού Προβλήματος. Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Σύνθετο Στατιστικό Πρόβλημα στις Πολλές Διαστάσεις. Η Κατάρα των Πολλών Διαστάσεων. Λύση;

Ροή Ομιλίας Παράδειγμα Σύνθετου Στατιστικού Προβλήματος. Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Σύνθετο Στατιστικό Πρόβλημα στις Πολλές Διαστάσεις. Η Κατάρα των Πολλών Διαστάσεων. Λύση;

Η πιο απλή στατιστική ερώτηση Έστω ότι έχουμε συλλέξει δείγματα από κάποιο φυσικό ή βιολογικό μέγεθος. Για παράδειγμα ας υποθέσουμε ότι έχουμε διαλέξει δείγματα από το μήκος καβουριών (σε cm).

Η πιο απλή στατιστική ερώτηση Έστω ότι έχουμε συλλέξει δείγματα από κάποιο φυσικό ή βιολογικό μέγεθος. Για παράδειγμα ας υποθέσουμε ότι έχουμε διαλέξει δείγματα από το μήκος καβουριών (σε cm).

Η πιο απλή στατιστική ερώτηση Έστω ότι έχουμε συλλέξει δείγματα από κάποιο φυσικό ή βιολογικό μέγεθος. Για παράδειγμα ας υποθέσουμε ότι έχουμε διαλέξει δείγματα από το μήκος καβουριών (σε cm). 17.08 22.08 17.13 19.40 19.49

Η πιο απλή στατιστική ερώτηση Έστω ότι έχουμε συλλέξει δείγματα από κάποιο φυσικό ή βιολογικό μέγεθος. Για παράδειγμα ας υποθέσουμε ότι έχουμε διαλέξει 10 000 δείγματα από το μήκος καβουριών (σε cm). 17.08 22.08 17.13 19.40 19.49 13.15 24.06 21.36 21.22 20.26 11.84 17.81 15.41 17.16 19.16 18.23 19.21 14.16 19.09 19.48 Ερώτηση: Ποιο είναι το «τυπικό» μήκος ενός καβουριού από αυτόν τον πληθυσμό;

Η πιο απλή στατιστική ερώτηση Ερώτηση: Ποιό είναι το τυπικό μήκος ενός καβουριού από αυτόν τον πληθυσμό; Ας δούμε όλα τα δείγματα που πήραμε: Παρατήρηση 1: Σχεδόν όλα τα δείγματα που πήραμε είναι συγκεντρωμένα γύρω από μια τιμή 20.

Η πιο απλή στατιστική ερώτηση Ερώτηση: Ποιό είναι το τυπικό μήκος ενός καβουριού από αυτόν τον πληθυσμό; Ας δούμε όλα τα δείγματα που πήραμε: Παρατήρηση 1: Σχεδόν όλα τα δείγματα που πήραμε είναι συγκεντρωμένα γύρω από μια τιμή 20.

Η πιο απλή στατιστική ερώτηση Ερώτηση: Ποιό είναι το τυπικό μήκος ενός καβουριού από αυτόν τον πληθυσμό; Θεώρημα: Η Παρατήρηση 1 ισχύει για όλα τα μεγέθη που ακολουθούν την Κανονική (ή Gaussιανή) Κατανομή. Επιπλέον, η τίμη γύρω από την οποία συγκεντρώνονται τα δείγματα είναι η μέση τιμή. Παρατήρηση 1: Σχεδόν όλα τα δείγματα που πήραμε είναι συγκεντρωμένα γύρω από μια τιμή 20.

Η πιο απλή στατιστική ερώτηση Ερώτηση: Ποιό είναι το τυπικό μήκος ενός καβουριού από αυτόν τον πληθυσμό; Απάντηση: μήκος i-οστού δείγματος πλήθος δειγμάτων Γιατί όμως να θεωρούμε ότι το μέγεθος που μελετάμε ακολουθεί κανονική κατανομή; Απάντηση 1: Γιατί αυτό παρατηρούμε στην φύση.

Η πιο απλή στατιστική ερώτηση Ερώτηση: Ποιό είναι το τυπικό μήκος ενός καβουριού από αυτόν τον πληθυσμό; Απάντηση: μήκος i-οστού δείγματος πλήθος δειγμάτων Γιατί όμως να θεωρούμε ότι το μέγεθος που μελετάμε ακολουθεί κανονική κατανομή; Απάντηση 2: Το Κεντρικό Οριακό Θεώρημα αποδεικνύει ότι κάτω από πολύ γενικές προϋποθέσεις ένα φυσικό μέγεθος πρέπει να ακολουθεί την κανονική κατανομή.

Ένα περίεργο φαινόμενο 1894 To 1894 o Karl Pearson προσπαθεί να αναλύσει δεδομένα από το μήκος 1000 καβουριών και παρατηρεί ότι τα δείγματα ακολουθούν την παρακάτω κατανομή. Karl Pearson 1857 1936 Πώς εξηγείται αυτή η ασυμμετρία;

Ένα περίεργο φαινόμενο 1894

Ένα περίεργο φαινόμενο 1894

Ένα περίεργο φαινόμενο 1894

Μίγμα Κανονικών Κατανομών Η ασυμμετρία προκύπτει γιατί υπάρχουν δύο είδη καβουριών! Πώς όμως ξεχωρίζουμε τα καβούρια; Άρα, ο γενικός μέσος όρος δεν έχει κάποια φυσική σημασία! Πρέπει να υπολογίσουμε δύο μέσους όρους. μικρά μεγάλα!

Μίγμα Κανονικών Κατανομών Η ασυμμετρία προκύπτει γιατί υπάρχουν δύο είδη καβουριών! Πώς όμως ξεχωρίζουμε τα καβούρια; Άρα, ο γενικός μέσος όρος δεν έχει κάποια φυσική σημασία! Πρέπει να υπολογίσουμε δύο μέσους όρους. μικρά μεγάλα!

Μίγμα Κανονικών Κατανομών Η ασυμμετρία προκύπτει γιατί υπάρχουν δύο είδη καβουριών! Πώς όμως ξεχωρίζουμε τα καβούρια; Άρα, ο γενικός μέσος όρος δεν έχει κάποια φυσική σημασία! Πρέπει να υπολογίσουμε δύο μέσους όρους. μικρά μεγάλα!

Μίγμα Κανονικών Κατανομών Η ασυμμετρία προκύπτει γιατί υπάρχουν δύο είδη καβουριών! Πώς μπορούμε να υπολογίσουμε δύο μέσους όρους;

Μίγμα Κανονικών Κατανομών Η ασυμμετρία προκύπτει γιατί υπάρχουν δύο είδη καβουριών! Πώς μπορούμε να υπολογίσουμε δύο μέσους όρους; Karl Pearson Ο Karl Pearson εισήγαγε την μέθοδο των ροπών και έδωσε μία αναλυτική λύση στο πρόβλημα λύνοντας (με το χέρι!) ένα σύστημα έξι πολυωνυμικών εξισώσεων. Επιπλέον, μας έδωσε έναν απλό τρόπο να ξεχωρίζουμε τα καβούρια!

Μίγμα Κανονικών Κατανομών Η ασυμμετρία προκύπτει γιατί υπάρχουν δύο είδη καβουριών! Πώς μπορούμε να υπολογίσουμε δύο μέσους όρους; Μπορούμε να υπολογίσουμε όλους τους δυνατούς συνδυασμούς μέχρι κάποια ακρίβεια. 75 75 = 5625 συνδυασμοί

Ροή Ομιλίας Παράδειγμα Σύνθετου Στατιστικού Προβλήματος. Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Σύνθετο Στατιστικό Πρόβλημα στις Πολλές Διαστάσεις. Η Κατάρα των Πολλών Διαστάσεων. Λύση;

Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Στο πρόβλημα που μελέτησε ο Pearson κάθε δείγμα περιγραφόταν με έναν πραγματικό αριθμό γι αυτό λέμε ότι το πρόβλημα είναι μονοδιάστατο. Τι συμβαίνει όμως όταν τα δείγματα που έχουμε είναι πιο πολύπλοκα αντικείμενα όπως εικόνες; Ας σκεφτούμε για παράδειγμα εικόνες σε αποχρώσεις του γκρί και δύο μόνο pixel.

Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Ας σκεφτούμε για παράδειγμα εικόνες με δύο μόνο pixel. Y X Y Αυτή η εικόνα αντιστοιχεί σ αυτό το σημείο στις δύο διαστάσεις. X

Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Ας σκεφτούμε για παράδειγμα εικόνες με τρία μόνο pixel. X Y Z Z Αυτή η εικόνα αντιστοιχεί σ αυτό tο σημείο στις τρεις διαστάσεις. X Y

28 Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Ας δούμε τώρα πιο ρεαλιστικές μικρές εικόνες. 28 συνολικά 28 28 = 784 pixels χρειαζόμαστε 784 αριθμούς για την περιγράψουμε λέμε ότι αντιστοιχεί σ ένα σημείο στις 784 διαστάσεις

28 Γιατί πολλές διαστάσεις; Ας δούμε τώρα πιο ρεαλιστικές μικρές εικόνες. 28 συνολικά 28 28 = 784 pixels χρειαζόμαστε 784 αριθμούς για την περιγράψουμε λέμε ότι αντιστοιχεί σ ένα σημείο στις 784 διαστάσεις

Ροή Ομιλίας Παράδειγμα Σύνθετου Στατιστικού Προβλήματος. Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Σύνθετο Στατιστικό Πρόβλημα στις Πολλές Διαστάσεις. Η Κατάρα των Πολλών Διαστάσεων. Λύση;

Μίγμα Κατανομών σε Πολλές Διαστάσεις Ας υποθέσουμε τώρα ότι βλέπουμε ένα μίγμα από είκονες με σχήματα 0 και 1 από διαφορετικούς γραφικούς χαραστήρες. Για τον άνθρωπο είναι πολύ απλό να ξεχωρίσει ποια είναι 0 και ποια είναι 1. Μπορούμε όμως να μάθουμε στον υπολογιστή να τα ξεχωρίζει; Μπορούμε να δοκιμάσουμε την τεχνική που είδαμε στον Pearson...αλλά σε 784 διαστάσεις.

Μίγμα Κανονικών Κατανομών Η ασυμμετρία προκύπτει γιατί υπάρχουν δύο είδη καβουριών! Πώς μπορούμε να υπολογίσουμε δύο μέσους όρους; Μπορούμε να υπολογίσουμε όλους τους δυνατούς συνδυασμούς μέχρι κάποια ακρίβεια. 75 75 = 5625 συνδιασμοί

Ροή Ομιλίας Παράδειγμα Σύνθετου Στατιστικού Προβλήματος. Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Σύνθετο Στατιστικό Πρόβλημα στις Πολλές Διαστάσεις. Η Κατάρα των Πολλών Διαστάσεων. Λύση;

τιμή δεύτερου pixel Η Κατάρα των Πολλών Διαστάσεων Ας προσπαθήσουμε να κάνουμε τον ίδιο αλγόριθμο που είδαμε στο παράδειγμα του Pearson σε εικόνες με δύο pixel άρα στις δύο διαστάσεις. Άρα πρέπει να δοκιμάσουμε όλους τους δυνατούς συνδυασμούς σημείων στο επίπεδο δεδομένης κάποιας ακρίβειας. 75 Υπάρχουν 75 2 δυνατά σημεία 75 2 75 2 = 75 4 δυνατοί συνδυασμοί σημείων. 75 Άρα πρέπει να κοιτάξουμε 75 4 = 31 640 625 επιλογές. τιμή πρώτου pixel

τιμή δεύτερου pixel Η Κατάρα των Πολλών Διαστάσεων Ας προσπαθήσουμε να κάνουμε τον ίδιο αλγόριθμο που είδαμε στο παράδειγμα του Pearson σε εικόνες με τρία pixel άρα στις τρεις διαστάσεις. Άρα πρέπει να δοκιμάσουμε όλους τους δυνατούς συνδυασμούς σημείων στις τρεις διαστάσεις δεδομένης κάποιας ακρίβειας. 75 Υπάρχουν 75 3 δυνατά σημεία 75 3 75 3 = 75 6 δυνατοί συνδυασμοί σημείων. 75 Άρα πρέπει να κοιτάξουμε 75 6 178 10 9 επιλογές. τιμή πρώτου pixel

Η Κατάρα των Πολλών Διαστάσεων Ας προσπαθήσουμε να κάνουμε τον ίδιο αλγόριθμο που είδαμε στο παράδειγμα του Pearson σε εικόνες με 784 pixel άρα στις 784 διαστάσεις. Άρα πρέπει να δοκιμάσουμε όλους τους δυνατούς συνδυασμούς σημείων στις 784 διαστάσεις δεδομένης κάποιας ακρίβειας. Υπάρχουν 75 784 δυνατά σημεία 75 784 75 784 = 75 1568 δυνατοί συνδυασμοί σημείων. Άρα πρέπει να κοιτάξουμε 75 1568 επιλογές. Το πλήθος των στοιχειωδών σωμματιδίων στο σύμπαν είναι λιγότερο από 75 42!!!

Ροή Ομιλίας Παράδειγμα Σύνθετου Στατιστικού Προβλήματος. Γιατί μας ενδιαφέρουν οι Πολλές Διαστάσεις; Σύνθετο Στατιστικό Πρόβλημα στις Πολλές Διαστάσεις. Η Κατάρα των Πολλών Διαστάσεων. Λύση;

Αλγόριθμος ΕΜ (Εxpectation-Maximization) Άρα, στις πολλές διαστάσεις ο απλός αλγόριθμος που δοκιμάζει όλες τις επιλογές δεν θα τελειώσει σχεδόν πότε! Οπότε, πρέπει να κάνουμε κάτι πιο έξυπνο! Οι Dempster, Laird και Rubin το 1977 διατυπώσανε τον αλγόριθμο EM (Expectation- Maximization) για να λύσουν μια πολύ γενική κλάση προβλημάτων.

Αλγόριθμος ΕΜ (Εxpectation-Maximization) Παρ όλο τον εφυέστατο ορισμό του αλγορίθμου, δεν υπήρχε κάμια απόδειξη ότι θα βρει τελικά την λύση ακόμα και του απλούστερου πρόβλήματος του Pearson. Παρ όλα ταύτα, ο ΕΜ έγινε ίσως ο πιο δημοφιλής αλγόριθμος σε όλους του τομείς της επιστημής, έχοντας χρησιμοποιηθεί σε πάνω από 50 000 επιστημονικές δημοσιεύσεις αριθμό ρεκόρ για δημοσίευση που έχει κάποια σχέση με μαθηματικά και στατιστική!

Αλγόριθμος ΕΜ (Εxpectation-Maximization) Ten steps of EM Suffice for Mixture of Two Gaussians, Κ. Δασκαλάκης, Χ. Τζάμος, Μ. Ζαμπετάκης, 2017 Θεώρημα: Ο αλγόριθμος EM αν εφαρμοστεί στην περίπτωση του προβλήματος του Pearson, ακόμα και σε πολλές διαστάσεις, θα τερματίσει γρήγορα βρίσκοντας την σωστή λύση.

Ανοιχτά Προβλήματα Μπορούμε να αποδείξουμε σε πιο γενικά προβλήματα από αυτό του Pearson ότι ο EM βρίσκει την σωστή λύση; Πώς λύνεται το πρόβλημα του Pearson σε πολλές διαστάσεις όταν έχουμε μίγμα με πάνω από δύο κατανομές; Πώς λύνουμε γενικότερα στατιστικά προβλήματα σε πολλές διαστάσεις; Πώς μπορούμε να αντιμετωπίσουμε την κατάρα των πολλών διαστάσεων; Σας ευχαριστώ για την προσοχή σας!