Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Σχετικά έγγραφα
Συμπίεση Πληροφορίας Πλαισίου με Ανάλυση Κύριων Συνιστωσών

Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

HMY 795: Αναγνώριση Προτύπων

Συμπίεση Πληροφορίας Πλαισίου: χρήση του Αυτοπαλίνδρομου Υποδείγματος για επίτευξη Αποδοτικών Ασύρματων Επικοινωνιών

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

Υπερπροσαρμογή (Overfitting) (1)

Συμπίεση Πληροφορίας Πλαισίου με Ανάλυση Κύριων Συνιστωσών

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΠΡΟΒΛΗΜΑ ΣΥΓΓΡΑΜΜΙΚΟΤΗΤΑΣ

Περιεχόμενα. Πρόλογος... 15

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΝΑΥΤΙΛΙΑΚΩΝ ΣΠΟΥΔΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

1. Βασικές Συναρτήσεις Στατιστικής

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

9. Παλινδρόμηση και Συσχέτιση

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

Είδη Μεταβλητών. κλίµακα µέτρησης

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

E [ -x ^2 z] = E[x z]

1.4 Λύσεις αντιστρόφων προβλημάτων.

Γ. Πειραματισμός - Βιομετρία

ΤΟΜΟΣ Α : Συμβολικός Προγραμματισμός

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29


ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA)

Εισόδημα Κατανάλωση

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Συμπίεση Δεδομένων

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

Διερεύνηση περιβαλλοντικών χρονοσειρών με στατιστικές μεθόδους και τεχνικές εξόρυξης δεδομένων

HMY 795: Αναγνώριση Προτύπων

ΕΡΩΤΗΣΕΙΣ ΣΩΣΤΟ ΛΑΘΟΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Βιοστατιστική ΒΙΟ-309

Αναγνώριση Προτύπων Ι

ΠΕΡΙΕΧΟΜΕΝΑ ΜEΡOΣ A : ΓNΩΡΙΜΙΑ ΜΕ ΤΗΝ ΕΠΙΣΤΗΜOΝΙΚΗ ΕΡΓΑΣΙΑ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Stochastic Signals Class Estimation Theory. Andreas Polydoros University of Athens Dept. of Physics Electronics Laboratory

Χρησιμοποιούμενες Συναρτήσεις του Microsoft Excel

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Συνοπτικά περιεχόμενα

Στοχαστικότητα: μελέτη, μοντελοποίηση και πρόβλεψη φυσικών φαινομένων

i μιας μεταβλητής Χ είναι αρνητικός αριθμός

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

1ο ΣΤΑΔΙΟ ΓΕΝΕΣΗ ΜΕΤΑΚΙΝΗΣΕΩΝ

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Προσαρμογή καμπύλης με τη μέθοδο των ελαχίστων τετραγώνων

Ζητήματα ηήμ με τα δεδομένα

Κεφ. 3: Παρεμβολή. 3.1 Εισαγωγή. 3.2 Πολυωνυμική παρεμβολή Παρεμβολή Lagrange Παρεμβολή Newton. 3.3 Παρεμβολή με κυβικές splines

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Απλή Παλινδρόμηση και Συσχέτιση

Βασικές Έννοιες Στατιστικής & Μέθοδοι Πρόβλεψης

Διάστημα εμπιστοσύνης της μέσης τιμής

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

3η Ενότητα Προβλέψεις

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

(p 1) (p m) (m 1) (p 1)

HMY 795: Αναγνώριση Προτύπων

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1)

Στατιστική Επιχειρήσεων Ι

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΠΡΟΒΛΗΜΑΤΑ ΜΗΧΑΝΙΚΗΣ ΕΦΑΡΜΟΓΕΣ ΜΕ ΧΡΗΣΗ MATLAB ΔΕΥΤΕΡΗ ΕΚΔΟΣΗ [ΒΕΛΤΙΩΜΕΝΗ ΚΑΙ ΕΠΑΥΞΗΜΕΝΗ]

Πιο συγκεκριμένα, η χρήση του MATLAB προσφέρει τα ακόλουθα πλεονεκτήματα.

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

HY213. ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ ΕΛΑΧΙΣΤΑ ΤΕΤΡΑΓΩΝΑ AΝΑΛΥΣΗ ΙΔΙΑΖΟΥΣΩΝ ΤΙΜΩΝ

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Transcript:

Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία (Μ1046) Επιβλέποντες: Επίκουρος Καθηγητής, Χατζηευθυμιάδης Ευστάθιος Υποψήφιος Διδάκτωρ, Παπαταξιάρχης Βασίλειος Αθήνα, Δεκέμβριος 2011

Σκοπός Διπλωματικής Μελέτη & σύγκριση στατιστικών μεθοδολογιών για εκτίμηση ελλιπούς πληροφορίας (interpolation - extrapolation). Μελέτη & σύγκριση αλγορίθμων κατηγοριοποίησης για εκτίμηση μεμονωμένων τιμών. Υπολογισμός απώλειας πληροφορίας έπειτα από εφαρμογή τεχνικών μείωσης διαστάσεων.

Σφάλματα Αισθητήρων Μεροληψία στα συλλεχθέντα δεδομένα. Πλήρη αποτυχία μετάδοσης της τιμής. Ελλειπούσα τιμή ή μετάδοση μιας σταθεράς. Συσσωρευτική απόκλιση σφαλμάτων. Υποβάθμιση της ακρίβειας της μέτρησης.

Ανάλυση Κύριων Συνιστωσών Principal Component Analysis - PCA Χρησιμοποιείται όταν έχουμε ψηλά συσχετισμένες μεταβλητές. Μειώνει τον αριθμό των αρχικών μεταβλητών σε ένα μικρότερο αριθμό κύριων συνιστωσών που μετρούν τη μεγαλύτερη δυνατή διασπορά του δείγματος. Μείωση Δεδομένων Οπτικοποίηση Δεδομένων Ανίχνευση Ακραίων Τιμών (noise reduction) Ομαδοποίηση Δεδομένων

Ανάλυση Κύριων Συνιστωσών - PCA Υπολογισμός του πίνακα συνδιακύμανσης (covariance matrix) S. Υπολογισμός των ιδιοτιμών και ιδιοδιανυσμάτων του πίνακα S. Προβολή στη βασική συνιστώσα με τη μεγαλύτερη ιδιοτιμή.

Μεθοδολογίες Παρεμβολής / Προεκβολής Παρεμβολή (Interpolation) είναι η διαδικασία ανάκτηση τιμών ανάμεσα στα ήδη γνωστά σημεία (δεδομένα) μιας καμπύλης. Προεκβολή (Extrapolation) είναι η διαδικασία απόκτησης μιας τιμής από ένα γράφημα ή μια γραφική παράσταση που εκτείνεται πέρα από τα συλλεχθέντα δεδομένα.

Αλγόριθμοι Παρεμβολής - Προεκβολής Γραμμική Συνάρτηση Πολυώνυμα Lagrange Cubic Spline Τα δεδομένα δεν παρουσιάζουν περιοδικότητα. Δεν μπορεί να υπολογιστεί η παράγωγος της συνάρτησης. Η καμπύλη δεν είναι υποχρεωτικό να περνά από όλες τις μετρήσεις (Cubic Spline)

Αλγόριθμοι Κατηγοριοποίησης Δημιουργία δένδρων απόφασης που χρησιμοποιούνται ως μοντέλα πρόβλεψης ελλιπών τιμών. ID3 / C4.5 Ελαχιστοποίηση Εντροπίας Information Gain (δηλ. ελαχιστοποίηση ερωτήσεων για την επιλογή του επόμενου μονοπατιού) C4.5 VS ID3 Αντιμετώπιση αριθμητικών γνωρισμάτων Χειρισμός ελλιπών τιμών (δεν υπολογίζονται στον υπολογισμό της εντροπίας) Αντιμετώπιση «θορύβου» δεδομένων (τεχνική εκτίμησης ποσοστού λάθους) Δημιουργία Κανόνων

Αλγόριθμοι Κατηγοριοποίησης (2) M5P Τα φύλλα των δένδρων που χτίζει (model trees), αποτελούνται από γραμμικά μοντέλα πολλών μεταβλητών και οι κόμβοι του δένδρου επιλέγονται βάσει του γνωρίσματος ελαχιστοποιεί το αναμενόμενο σφάλμα σε συνάρτηση με την τυπική απόκλιση της τιμής εξόδου. RepTree Εφαρμόζεται σε αριθμητικά δεδομένα και δίνει ως αποτέλεσμα την μέση τιμή των αντικειμένων του κάθε φύλλου. Χρησιμοποιεί τη μετρική του information gain και τη μείωση της διακύμανσης στους εσωτερικούς κόμβους.

Αλγόριθμοι Κατηγοριοποίησης (3) Decision Stump Δένδρο απόφασης ενός επιπέδου (βάθους 1). Κάνει τις προβλέψεις βασιζόμενο στην τιμή μίας μόνο μεταβλητής εισόδου. Υπολογίζει ένα σκορ, για κάθε ένα γνώρισμα, καταμετρώντας πόσο καλά χωρίζει το σύνολο της τάξης. Πολυπλοκότητα Επαγωγής Δένδρων Ο(m n log n) + O(n (log n) 2 )

Πειραματική Αξιολόγηση Δεδομένα που συλλέχθηκαν σε πραγματικό χρόνο. 387 διαφορετικές μετρήσεις για διακριτές χρονικές στιγμές. Το δίκτυο αισθητήρων αποτελείται από τρία ζευγάρια αισθητήρων που μετρούν την θερμοκρασία και την υγρασία του περιβάλλοντος και έναν τέταρτο αισθητήρα που μετρά την ταχύτητα του ανέμου τις ίδιες χρονικές στιγμές. Διανυσματική Μέτρηση x = (temp_1, hum_1, temp_2, hum_2, temp_3, hum_3, wind_speed) Επέκταση και σε ένα γενικότερο περιβάλλον με πλήθος κόμβων αισθητήρων (άρα και διαφορετικό αριθμό μεταβλητών) καθώς και σε διαφορετικό είδος μετρήσεων.

Πειράματα Προεκβολής (1) Προβλέψεις για την θερμοκρασία του τρίτου ζεύγους αισθητήρων την 251 η χρονική στιγμή. Η πραγματική τιμή της μέτρηση είναι 18,6.

Πειράματα Προεκβολής (2) Προβλέψεις για την υγρασία του τρίτου ζεύγους αισθητήρων την 251 η χρονική στιγμή. Η πραγματική τιμή της μέτρηση είναι 74,5.

Πειράματα Κατηγοριοποίησης Πρόβλεψη Θερμοκρασίας 3 ου Ζεύγους Αισθητήρων Σενάρια που δοκιμάστηκαν 1 ο Σενάριο: Προβλέψεις Μετρήσεων 251 300 2 ο Σενάριο: Προβλέψεις Μετρήσεων 338 387 Δεδομένα Εκπαίδευσης 20 Μετρήσεις (1/20 του συνόλου) 75 Μετρήσεις (1/5 του συνόλου) 190 Μετρήσεις (1/2 του συνόλου) Διακριτοποίηση Τιμών a : 6-9,9 βαθμούς C. b : 10-13,9 βαθμούς C. c : 14-17,9 βαθμούς C. d : 18-22,3 βαθμούς C.

Μετρικές Ποσοστό Επιτυχίας Αλγορίθμων Κατηγοριοποίησης Τετραγωνική Ρίζα Μέσου Τετραγωνικού 2 2 Σφάλματος ( p 1 a 1 ) +... + ( p a ) Συντελεστές Συσχέτισης Μέση Τιμή Σχετικού Σφάλματος έπειτα από χρήση PCA pi p j p i Διακύμανση Σχετικού Σφάλματος έπειτα από 2 χρήση PCA ( x x) n 1 n n n

Παραδείγματα εκτίμησης τιμών

Διαγραμματική Απεικόνιση Ποσοστά Επιτυχίας Αλγορίθμων για το 1 ο δείγμα Ποσοστά Επιτυχίας Αλγορίθμων για το 2 ο δείγμα

Ποσοστά Τετραγωνικής Ρίζας Μέσου Τετραγωνικού Σφάλματος

Συντελεστές Συσχέτισης Αριθμητικών Αλγορίθμων

Παραδείγματα με χρήση PCA

Συγκεντρωτική Διαγραμματική Απεικόνιση

Συμπεράσματα Τα συμπεράσματα δεν μπορούν να γενικευτούν σε δείγμα με χαμηλή συσχέτιση μεταβλητών. Το μέγεθος του δείγματος πιθανόν να τροποποιήσει τα αποτελέσματα των πειραμάτων. Extrapolation Χρειάζονται περίπου 10 μετρήσεις για να σταθεροποιηθεί η τιμή της πρόβλεψης Όσο μικρότερο ήταν το δείγμα εκπαίδευσης τόσο καλύτερες ήταν οι τιμές εκτίμησης. Υπερτερεί η χρήση της Μέσης Τιμής Αλγόριθμοι Κατηγοριοποίησης Η χρήση Pruning δεν διαφοροποιεί σημαντικά τα αποτελέσματα. Καλύτερη απόδοση με μεγαλύτερο ποσοστό δεδομένων εκπαίδευσης. (Ποιο το κόστος?) Μικρή απώλεια πληροφορίας με χρήση PCA

Ανοιχτά Θέματα Σύγκριση PCA με Factor Analysis Αλλαγή στον τρόπο υπολογισμού των κύριων συνιστωσών καθώς και στην επιλογή του πλήθους των κύριων συνιστωσών Μελέτη όλων των κατηγοριών σφαλμάτων Τρόποι δυναμικής ανανέωσης των μοντέλων πρόβλεψης

Ευχαριστώ πολύ!