ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ



Σχετικά έγγραφα
ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

squared error, Mean absolute error, Root mean squared error) µεγάλωσαν,

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ

Ι. Preprocessing (Επεξεργασία train.arff):

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ

ιατµηµατικό Μεταπτυχιακό Πρόγραµµα Σπουδών ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ

Τεχνικές Προβλέψεων. Προετοιμασία & Ανάλυση Χρονοσειράς

2o μέρος εργασίας (Αρχείο cpu)

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j

ΕΡΩΤΗΜΑ 1 ΕΡΩΤΗΜΑ 2. ELONGATEDNESS <= 41 AND MAX.LENGTH ASPECT RATIO <= 7 AND COMPACTNESS > 95: bus (70.0/1.0)

Τεχνικές Προβλέψεων. 2η Ενότητα Προετοιμασία & Ανάλυση Χρονοσειράς

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Συστημάτων Προβλέψεων & Προοπτικής Forecasting System Unit

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΤΞΗ ΠΛΗΡΟΦΟΡΙΑ

4.4 Βάσεις Δεδομένων με πολλές Μεταβλητές

2η Ενότητα Προετοιμασία & Ανάλυση Χρονοσειράς. -

Αναγνώριση Προτύπων Εργασία 1η Classification

Εισαγωγή στο Data Mining Από τα δεδομένα στη γνώση

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση

Δείγμα πριν τις διορθώσεις

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΡΚΕΙΑΣ ΦΩΝΗΜΑΤΩΝ ΤΗΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΜΕ ΕΦΑΡΜΟΓΗ ΣΤΗ ΣΥΝΘΕΣΗ ΟΜΙΛΙΑΣ

Data Analytics Και Ευφυή Συστήματα Πρόβλεψης Δεδομένων Σε Χρονοσειρά. Εφαρμογή Στον Εναρμονισμένο Δείκτη Τιμών Καταναλωτή.

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ. Κεφάλαιο 3

Διδάσκουσα: Χάλκου Χαρά,

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Το μοντέλο Perceptron

Ψηφιακή Επεξεργασία Σήματος Coursework

ΧΡΟΝΟΣΕΙΡΕΣ. Διαχείριση Πληροφοριών

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

Δυαδικό Σύστημα Αρίθμησης

2. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Επιστημονική γραφή αποτελεσμάτων

Αριθμητική Ανάλυση & Εφαρμογές

ΕΜΠ ΔΠΜΣ Εφαρμοσμένες Μαθηματικές Επιστήμες Αλγόριθμοι Εξόρυξης Πληροφορίας. Διάλεξη02 ΣυνιστώσεςΔεδομένων Οπτικοποίηση&Εξερεύνηση

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Διερεύνηση περιβαλλοντικών χρονοσειρών με στατιστικές μεθόδους και τεχνικές εξόρυξης δεδομένων

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

P-Μiner : ιαχείριση Πυλών Καταλόγων (Portals) µε Υποστήριξη ιαδικασιών Εξόρυξης εδοµένων Χρήσης

ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ: ΕΠΙΛΟΓΗ ΒΕΛΤΙΣΤΟΥ ΑΛΓΟΡΙΘΜΟΥ

Στοιχεία Στατιστικής 1 ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ

Περιεχόμενα. Πρόλογος 17 ΚΕΦΑΛΑΙΟ 1 23

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΡΟΣΟΜΟΙΩΣΗ ΔΙΕΡΓΑΣΙΩΝ ΧΡΗΣΙΜΟΠΟΙΩΝΤΑΣ ΤΟ ΛΟΓΙΣΜΙΚΟ EXTEND. 1 ο εργαστήριο Διοίκησης και Παραγωγής Έργων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μεθοδολογία Έρευνας Κοινωνικών Επιστημών. Ενότητα 9: ΕΝΝΟΙΑ ΤΗΣ ΜΕΤΡΗΣΗΣ Λοίζου Ευστράτιος Τμήμα Τεχνολόγων Γεωπόνων-Kατεύθυνση Αγροτικής Οικονομίας

x 2,, x Ν τον οποίον το αποτέλεσμα επηρεάζεται από

Επιχειρηματικές Προβλέψεις: Μέθοδοι & Τεχνικές Προετοιμασία & Ανάλυση Χρονοσειράς Διάλεξη 2

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016

ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΕΨΗΣ ΠΟΛΛΑΠΛΩΝ ΜΕΤΑΒΛΗΤΩΝ ΕΞΟΔΟΥ

GreekLUG Ελεύθερο Λογισμικό & Λογισμικό Ανοικτού Κώδικα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 3ο

Είδη Διορθωτών: Υπάρχουν πολλών ειδών διορθωτές. Μία βασική ταξινόμησή τους είναι οι «Ειδικοί Διορθωτές» και οι «Κλασσικοί Διορθωτές».

ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

Stochastic Signals Class Estimation Theory. Andreas Polydoros University of Athens Dept. of Physics Electronics Laboratory

Σύνοψη Προηγούμενου. Πίνακες (Arrays) Πίνακες (Arrays): Βασικές Λειτουργίες. Πίνακες (Arrays) Ορέστης Τελέλης

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ. ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΕΨΕΩΝ& ΕΛΕΓΧΟΥ ΜΑΘΗΜΑ ΘΕΩΡΙΑΣ-ΣΤΑΣΙΜΕΣΔΙΑΔΙΚΑΣΙΕΣ-ΥΠΟΔΕΙΓΜΑΤΑ ARIMA (p,d,q)

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

Εισαγωγή στην Ανάλυση Δεδομένων

Αλγόριθμοι Μηχανικής Μάθησης σε Πολυεπεξεργαστικά Περιβάλλοντα

Το πρόβλημα στα Μαθηματικά

ENOTHTA 8 IAXEIPIΣH KAI ΣYΣTHMATA APXEIΩN

Ζήτημα 1ο. Ζήτημα 2o. Τρέχουμε κάποιους αλγόριθμους. Ο OneR δίνει τους παρακάτω κανόνες

ΤΟΜΕΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ (Τ. & Τ.Π.) ΕΡΓΑΣΤΗΡΙΟ ΕΝΣΥΡΜΑΤΟΥ ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΣ

Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Ανάπτυξη Λογισμικού για Δίκτυα και Τηλεπικοινωνίες. Χειμερινό εξάμηνο

Γραφικά υπολογιστών Εργαστήριο 4 Εισαγωγή στις λίστες

Διπλωματική Εργασία. Διαχείριση Γνώσης και Ασφάλεια Πληροφοριών

Υπερπροσαρμογή (Overfitting) (1)

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΑΘΗΜΑ 4 ο. Μοναδιαία ρίζα

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

Δέντρα Απόφασης (Decision(

Εξόρυξη Γνώσης από Βιολογικά εδομένα

ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΙ, 5 Ο ΕΞΑΜΗΝΟ, ΠΕΡΙΕΧΟΜΕΝΑ ΠΑΡΑΔΟΣΕΩΝ. Κεφ. 1: Εισαγωγή (διάρκεια: 0.5 εβδομάδες)

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

Εισαγωγή στις βάσεις δεδομένων - Η ανατομία μιας βάσης δεδομένων

Οδηγός Ανάλυσης Αξιοπιστίας και Εγκυρότητας Ψυχομετρικών Κλιμάκων με το SPSS

Δομή Ηλεκτρονικού υπολογιστή

HMY 799 1: Αναγνώριση Συστημάτων

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

dtw(a, B) = dtw(a n, B m )

Εισαγωγή στην επιστήµη των υπολογιστών. Πράξεις µε µπιτ

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

ΕΝΟΤΗΤΑ 5 ΠΡΟΣΘΕΣΗ ΚΑΙ ΑΦΑΙΡΕΣΗ ΑΡΙΘΜΩΝ ΜΕΧΡΙ ΤΟ 10

ΕΝΟΤΗΤΑ 5 ΠΡΟΣΘΕΣΗ ΚΑΙ ΑΦΑΙΡΕΣΗ ΑΡΙΘΜΩΝ ΜΕΧΡΙ ΤΟ 10

Εισαγωγή στην επιστήμη των υπολογιστών. Πράξεις με μπιτ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Πληροφορικής

Transcript:

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ : ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ ΠΙΘΑΝΟΝΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΓΑΣΙΑ 08: ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ

1 Ο ΣΤΑΔΙΟ: Πριν εφαρμόσουμε οποιοδήποτε αλγόριθμο στο training set, προεπεξεργαζόμαστε πρώτα τα δεδομένα. Παρατηρούμε ότι το training set αποτελείται από 39 numeric attributes των 2528 instances. Επειδή στην attribute38 όλα τα instances είναι 0, την αφαιρούμε από το training set με τη εντολή Remove. Όμως παρόμοια διαπιστώνουμε ότι οι attribute36 και η attribute34 έχουν 15 και 1 αντίστοιχα διαφορετικά του μηδενός instances. Άρα θεωρούμε σκόπιμο να τις αφαιρέσουμε. Για να επαληθεύσουμε αυτή την κίνηση που κάναμε, τρέξαμε κάποιους αλγόριθμους καιπαρατηρούμε ότι τα σφάλματα (Mean absolute error, Root mean squared error, Relative absolute error, Root relative squared error) είναι μικρότερα αν έχουμε αφαιρέσει τις attributes34,36,38 απ ότι μόνο την attribute38. Έτσι αποθηκεύουμε το

καινούριο training set με το όνομα train343638.arff. Eπίσης υλοποιήσαμε και τον αλγόριθμο attribute selection και παρατηρούμε ότι τα attributes μειώνονται από 39 σε 11 και συγκεκριμένα είναι τα εξής: Attributes: 11 attr06 attr07 attr12 attr13 attr23 attr24 attr27 attr28 attr32 attr35 output Όμως, υλοποιώντας οποιοδήποτε αλγόριθμο έχοντας σαν training set αυτό με τα 10 attributes παρατηρούμε ότι τα σφάλματα είναι μεγαλύτερα σε σχέση με το train343638.arff οπότε κρατάμε το δεύτερο. Επιπλέον μπορούμε σε ένα training set γενικά μπορούμε να χρησιμοποιήσουμε αρκετούς κανόνες ταξινόμησης (classification rules), κανόνες συσχέτισης (association rules) και κανόνες ομαδοποίησης. Επειδή όμως το δικό μας training set όλες οι attributes είναι αριθμητικές (numeric) δεν μπορούμε να εφαρμόσουμε όλους αυτούς τους κανόνες. Υπάρχει βέβαια η δυνατότητα αλλαγής της κλάσης των χαρακτηριστικών από numeric -> nominal πράγμα που δεν το εφαρμόζουμε γιατί μπορεί να μεγαλώσει το σφάλμα. 2 ο ΣΤΑΔΙΟ: είναι η επανάληψη όλων των μεθόδων που ακολουθήσαμε στο quiz set και συγκεκριμένα η αφαίρεση των attributes 34,36,38 και η αποθήκευση του καινούριου quiz set με το όνομα quiz343638.arff.

3 ο ΣΤΑΔΙΟ: είναι η επιλογή του κατάλληλου αλγορίθμου με το μικρότερο σφάλμα για training set και η αντίστοιχη εφαρμογή σαν supply test στο quiz set. Δοκιμάζοντας αρκετούς αλγόριθμους επιλέξαμε εκείνον που έδινε το μεγαλύτερο ποσοστό επιτυχίας και τον τρέξαμε για το test set έτσι ώστε να πετύχουμε το βέλτιστο ποσοστό επιτυχίας. Παρακάτω ακολουθούν κάποιοι από τους πολλούς αλγόριθμους που εφαρμόστηκαν στο training set με χαμηλό σφάλμα και μεγάλο ποσοστό επιτυχίας στο quiz set. 1. Βagging->RegressionByDiscretization->Reptree Correlation coefficient 0.9123 Mean absolute error 0.0615 Root mean squared error 0.1742 Relative absolute error 17.0029 % Root relative squared error 40.9434 % 2. RandomSubspace->Bagging-> RegressionByDiscretization-> Reptree Correlation coefficient 0.9219 Mean absolute error 0.0758 Root mean squared error 0.1672 Relative absolute error 20.9631 % Root relative squared error 39.2965 % 3. Bagging ->RandomSubspace->Reptree

Correlation coefficient 0.9159 Mean absolute error 0.0914 Root mean squared error 0.1759 Relative absolute error 25.2535 % Root relative squared error 41.3445 % 4. RegressionByDiscretization->J48 Correlation coefficient 0.8852 Mean absolute error 0.0494 Root mean squared error 0.2012 Relative absolute error 13.6587 % Root relative squared error 47.3025 % 5. Bagging->RepTree Correlation coefficient 0.9018 Mean absolute error 0.0778 Root mean squared error 0.1843 Relative absolute error 21.5171 % Root relative squared error 43.3226 % 6. Random subspace-> RegressionByDiscretization->J48

Correlation coefficient 0.9154 Mean absolute error 0.0721 Root mean squared error 0.1722 Relative absolute error 19.9263 % Root relative squared error 40.4707 % 7. RandomSubspace-> RegressionByDiscretization-> J48graft Correlation coefficient 0.9198 Mean absolute error 0.0685 Root mean squared error 0.1678 Relative absolute error 18.9252 % Root relative squared error 39.4458 % 4 ο ΣΤΑΔΙΟ: Επιλέγουμε τον αλγόριθμο με Correlation coefficient κοντά στο 1 αρκετά και ποσοστό επιτυχίας για το quiz set 0.955 που είναι ο RandomSubspace- >RegressionByDiscretization->J48graft και τον εφαρμόζουμε στο test set. Αν δεν υπάρξη overtraining στο training set εξαιτίας του ότι χρησιμοποιήσαμε 2 meta αλγόριθμους το success rate θα αναμέντε υψηλό.