ΜΕΘΟΔΟΙ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΗΝ ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ. Ελευθεριάδου Ίννα Α.Μ. 100/05. Επιβλέπων Καθηγητής: Ευστάθιος Κύρκος

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΜΕΘΟΔΟΙ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΗΝ ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ. Ελευθεριάδου Ίννα Α.Μ. 100/05. Επιβλέπων Καθηγητής: Ευστάθιος Κύρκος"

Transcript

1 ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΜΕΘΟΔΟΙ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΗΝ ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ Ελευθεριάδου Ίννα Α.Μ. 100/05 Επιβλέπων Καθηγητής: Ευστάθιος Κύρκος ΑΤΕΙ ΘΕΣΣΑΛΟΝΙΚΗΣ 2010 ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ 1

2 ΠΕΡΙΕΧΟΜΕΝΑ Περιεχόμενα 2 Περίληψη..4 1.Εισαγωγή Διάρθρωση της εργασίας Τι είναι το Data mining;.5 3. Παρουσίαση των άρθρων 6 Εργασία 1. Threshold accepting trained principal component neural network and feature subset selection: Application to bankruptcy prediction in banks.6 Εργασία 2. An integrative model with subject weight (IMSW) based on neural network learning for bankruptcy prediction.10 Εργασίας 3. Using neural network ensembles for bankruptcy prediction and credit scoring...11 Εργασία 4. Bankruptcy prediction with neural logic networks by means of grammar-guided genetic programming...14 Εργασία 5. Early bankruptcy prediction using ENPC 15 Εργασία 6. An experimental comparison of ensemble of classifiers for bankruptcy prediction and credit scoring...18 Εργασία 7. Predicting bank financial failures using neural networks, support vector machines and multivariate statistical methods:a comparative analysis in the sample of savings deposit insurance fund (SDIF) transferred banks in Turkey 20 Εργασία 8. Financial failure prediction using efficiency as a predictor 23. Εργασία 9. Differential evolution trained wavelet neural networks: Application to bankruptcy prediction in banks.25 Εργασία 10. A selective ensemble based on expected probabilities for bankruptcy prediction..27 2

3 4. Αξιολόγηση Σύγκριση των άρθρων Συμπεράσματα..35 Αναφορές.. 3

4 ΠΕΡΙΛΗΨΗ Αυτό το έγγραφο παρουσιάζει διάφορες μελέτες που έχουν γίνει πάνω στο θέμα της πρόβλεψης χρεοκοπίας. Αναλύοντας τις εργασίες βγαίνει το συμπέρασμα ότι αν και η κάθε μελέτη χρησιμοποιεί διαφορετικές μεθόδους εξόρυξης δεδομένων και διαφορετικά σύνολα δεδομένων, όλες έχουν κοινό στόχο, την επίτευξη καλύτερης πρόβλεψης πτώχευσης. Είναι σημαντικό να σημειωθεί ότι σε κάθε μελέτη γίνεται αναφορά στην πηγή από την οποία προέρχονται τα δεδομένα, στη χώρα στην οποία αναφέρεται η μελέτη καθώς και στην χρονική περίοδο στην οποία αναφέρεται. Τέλος γίνεται σύγκριση όλων αυτών των άρθρων για να προκύψει ένα τελικό αποτέλεσμα. 1. ΕΙΣΑΓΩΓΗ Λόγω της ριζικής αλλαγής στη παγκόσμια οικονομία, η οικονομική πρόβλεψη αποτυχίας μιας εταιρίας παίζει όλο και περισσότερο σημαντικό ρόλο. Συχνά η οικονομική αποτυχία εμφανίζεται όταν έχει μια εταιρία τις χρόνιες και σοβαρές απώλειες ή και όταν η εταιρία γίνεται αφερέγγυη με τα στοιχεία του παθητικού. Οι ευρέως διαδεδομένες αιτίες και τα συμπτώματα της οικονομικής αποτυχίας περιλαμβάνουν τη φτωχή διαχείριση, την αυταρχική ηγεσία και τις δυσκολίες να λειτουργήσουν επιτυχώς στην αγορά. Η εταιρική πτώχευση δεν προκαλεί μόνο σημαντικές απώλειες στην επιχειρησιακή κοινότητα αλλά και στην κοινωνία συνολικά. Επομένως, τα ακριβή μοντέλα πρόβλεψης πτώχευσης είναι κρίσιμης σπουδαιότητας στους διάφορους συμμετάσχοντες όπως είναι οι επενδυτές, οι υπάλληλοι, οι μέτοχοι και άλλα ενδιαφερόμενα μέλη. Η ανάπτυξη των οικονομικών μοντέλων για την πρόβλεψη των επιχειρησιακών αποτυχιών μπορούν να θεωρηθούν συστήματα έγκαιρης προειδοποίησης, που αποδεικνύονται πολύ χρήσιμα για τους διευθυντές και τις αρμόδιες αρχές που μπορούν να αποτρέψουν το περιστατικό των αποτυχιών. Επιπλέον, αυτά τα μοντέλα είναι σε θέση να βοηθήσουν τους ιθύνοντες των οικονομικών οργάνων να αξιολογήσουν και να επιλέξουν τις εταιρίες για να συνεργαστούν ή να επενδύσουν 1.1 Διάρθρωση της εργασίας Η υπόλοιπη της εργασίας ξεκινάει με την παρουσίαση του Data Mining στο Κεφάλαιο 2. Ακολουθεί στο Κεφάλαιο 3 η αναλυτική παρουσίαση των εργασιών που μελετήθηκαν. Στο Κεφάλαιο 4 γίνεται σύγκριση και αξιολόγηση των 4

5 αποτελεσμάτων των ερευνών. Τέλος στο Κεφάλαιο 5 αναφέρονται τα συμπεράσματα. 2. Τι είναι το Data mining; Η εξόρυξη δεδομένων παίρνει το όνομά της από τις ομοιότητες που έχει η αναζήτηση πολύτιμων επιχειρηματικών πληροφοριών σε μια μεγάλη βάση δεδομένων με την εξόρυξη πολύτιμων ορυκτών από μια ορεινή μάζα. Η εξόρυξη δεδομένων δηλαδή η εξαγωγή των κρυμμένων πληροφοριών από μεγάλες βάσεις δεδομένων, αποτελεί ισχυρή τεχνολογία με πολύ μεγάλες δυνατότητες να βοηθήσει τις εταιρείες να επικεντρωθούν στις πιο σημαντικές πληροφορίες που περιέχονται στις βάσεις δεδομένων τους. Με τη χρήση περίπλοκων αλγορίθμων οι χρήστες έχουν τη δυνατότητα να αναγνωρίζουν τα χαρακτηριστικά των επιχειρηματικών διαδικασιών. Οι αναλύσεις που προσφέρονται από την εξόρυξη δεδομένων πάνε πέρα από τις στατιστικές αναλύσεις. Τα εργαλεία εξόρυξης δεδομένων είναι δυνατόν να απαντήσουν σε επιχειρηματικές ερωτήσεις, πράγμα που, παραδοσιακά, ήταν πολύ χρονοβόρο. Η επιστήμη της εξόρυξη δεδομένων έχει ευρύ φάσμα και με πολλαπλές εφαρμογές. Τα συστήματα Εξόρυξης Δεδομένων είναι φτιαγμένα για να διαχειρίζονται τεράστιες ποσότητες πληροφορίας, να μπορούν να έχουν και να ανατρέχουν σε ιστορικά δεδομένα, να χειρίζονται από υψηλόβαθμα στελέχη εταιριών έτσι ώστε σε μικρό χρονικό διάστημα να έχουν οπτική αναπαράσταση πληροφοριών για την καλύτερη λήψη αποφάσεων. 5

6 3. ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΑΡΘΡΩΝ Εργασία 1. Threshold accepting trained principal component neural network and feature subset selection: Application to bankruptcy prediction in banks. Αυτό το άρθρο προτείνει μια εφαρμογή της νέας αρχιτεκτονικής κύριων συστατικών νευρωνικών δικτύων (PCNN principal component neural network) στο πρόβλημα πρόβλεψης πτώχευσης στις εμπορικές τράπεζες. Παράλληλα παρουσιάζει έναν αλγόριθμο βασισμένο στην threshold accepting (TA) για να εκπαιδεύσει το PCNN. Η αποτελεσματικότητα του αλγορίθμου εξετάζεται στο σύνολο δεδομένων Ισπανικών τραπεζών και στο σύνολο δεδομένων Τούρκικων τραπεζών. Παρακάτω παρουσιάζονται οι τέσσερις παραλλαγές του PCNN που εκπαιδεύονται από έναν TA-based αλγόριθμο. Αρχικά, αναπτύχθηκαν δύο παραλλαγές του ταξινομητή PCNN: PCNN χωρίς επιλογή και PCNN με την επιλογή χαρακτηριστικών γνωρισμάτων χαρακτηριστικών γνωρισμάτων (PCNN- WOFS). (PCNN-WFS). PCNN-WOFS μετασχηματισμός PCNN-WFS-LTF PCNN-WFS-STF -γραμμικός PCNN-WOFS Μετασχηματισμός -Sigmoid (STF=Sigmoid (LTF= linear transformation)*** transformation) * WOFS = without feature selection *** Η sigmoid λειτουργία μεταφοράς χρησιμοποιείται μεταξύ της εισόδου και του κρυμμένου στρώματος και μεταξύ του κρυμμένου και στρώματος εξόδου. The principal component neural network architecture 6

7 Το προτεινόμενο hybrid neural network και FSS feature subset selection algorithm εξετάστηκαν για το πρόβλημα πρόβλεψης πτώχευσης σε 2 σύνολα: Ισπανικό σύνολο δεδομένων Τουρκικό σύνολο δεδομένων τραπεζών που αποτελείται από τραπεζών που αποτελείται 66 τράπεζες με 9 οικονομικές αναλογίες από 40 τράπεζες με 12 (rations)η κάθε μια. οικονομικές αναλογίες (rations) η κάθε μία. Και στις περιπτώσεις που αφορούν τις Ισπανικές τράπεζες αλλά και στις περιπτώσεις που αφορούν τις Τούρκικες τράπεζες χρησιμοποιείται η 10-fold crossvalidation. Προκειμένου να ερευνηθεί η δύναμη των παραλλαγών PCNN, όπου το κρυμμένο στρώμα (hidden layer) είναι εμφανώς απόν, συγκρίναμε την απόδοσή τους με: την ανάλυση-βασισμένη και την ανάλυση-βασισμένη στο στην αποδοχή κατώτατων πίσω νευρωνικό δίκτυο διάδοσης ορίων του νευρωνικού κύριων συστατικών (PCA- BPNN δικτύου (PCA- TANN principal component analysis-based principal component analysis- back propagation neural network) based threshold accepting neural network) Σε αντίθεση με το PCNN στα (PCA-TANN) και (PCA-BPNN) ένα κρυμμένο στρώμα είναι ΠΑΡΟΝ ROC καμπύλες Ισπανικές τράπεζες Τουρκικές τράπεζες -Οι παραλλαγές: PCANN-WOFS-LTF, -PCNN-WFS-LTF ξεπέρασε PCANN-WFS-LTF ξεπέρασαν όλες τις όλες τις τεχνικές με το άλλες τεχνικές όσον αφορά το ποσοστό ποσοστό ταξινόμησης του και την περιοχή ταξινόμησης κάτω από 100% και AUC την καμπύλη ROC (AUC) 7

8 - PCNN-WOFS-LTF ξεπέρασαν όλες τις -Το διάφορο(the variant) άλλες τεχνικές με το ποσοστό ταξινόμησης PCA- TANN είχε καλή απόδοση 96,6% και το AUC με το ποσοστό ταξινόμησης 97,5% και AUC PCNN-WFSLTF είναι δίπλα στο PCNN - TANN δίπλα σε PCA-TANN WOFS-LTF με το ποσοστό ταξινόμησης 92,5 με το ποσοστό ταξινόμησης και AUC του 91.6% και AUC 9000, PCNN-WOFS-LTF εκτελείται - TANN ξεπέρασε όλες τις άλλες τεχνικές καλά όσον αφορά το όσον αφορά το ποσοστό ταξινόμησης ποσοστό ταξινόμησης 97,5% αλλά έχει την πολύ χαμηλή 97,5% ιδιομορφία. - Από τις τέσσερις τεχνικές TANN, PCA- TANN, - Οι παραλλαγές PCNN και PCABPNN οι παραλλαγές TANN έχουν καλύτερο αποτέλεσμα. -Από TANN και PCA- TANN, το TANN είχε καλό αποτέλεσμα. WFS-STF, PCNN-WOFS-STF δεν εκτέλεσαν καλά και κατέλαβε τις τελευταίες θέσεις Το συμπέρασμα που προκύπτει από τα παραπάνω είναι ότι οι PCNN-WOFS/WFS-LTF μπορούν να χρησιμοποιηθούν ως πρότυποι ταξινομητές. Οι παραλλαγές με την sigmoid, PCNN-WOFS - STF και PCNN-WFS - STF δεν έχουν αποδώσει καλά και στις δυο περιπτώσεις. PCNN= principal component neural network(νευρωνικό δίκτυο κύριων συστατικών) FSS =feature subset selection (επιλογή υποσυνόλων χαρακτηριστικών γνωρισμάτων) TA = threshold accepting (αποδοχή κατώτατων ορίων) TANN= threshold accepting neural network(κατώτατο όριο που δέχεται το νευρωνικό δίκτυο) BPNN= back propagation neural network(πίσω νευρωνικό δίκτυο) 8

9 ROC καμπύλες για όλους τους ταξινομητές όσον αφορά τις ισπανικές τράπεζες. ROC καμπύλες για όλους τους ταξινομητές όσον αφορά τις τούρκικες τράπεζες. * Να σημειωθεί ότι όσο υψηλότερη είναι η αξία AUC τόσο καλύτερος είναι ο ταξινομητής 9

10 Εργασία 2. An integrative model with subject weight (IMSW) based on neural network learning for bankruptcy prediction. Προτείνεται μια στρατηγική ολοκλήρωσης σχετικά με το πώς να συνδυαστούν αποτελεσματικά οι τεχνικές στατιστικής και της τεχνητής νοημοσύνης.ο συνδυασμός της multiple discriminant analysis MDA, της logistic regression, των neural networks NN και της decision trees induction εισάγει ένα περιεκτικό μοντέλο με το υπαγόμενο βάρος βασισμένο στο νευρωνικό δίκτυο ερευνώντας την πρόβλεψη πτώχευσης(an integrative model with subject weight based on neural network learning for bankruptcy prediction) IMSW. Συγκριτικά με τη Multiple discriminant analysis (MDA), η Logistic regression προτιμάται διότι η Logistic regression μπορεί να ενσωματώσει τα μη γραμμικά αποτελέσματα. Τα Neural networks NN παρέχουν καλή πρόβλεψη για τα σύνθετα προβλήματα όπου οι μεταβλητές συσχετίζονται η μια με την άλλη με έναν μη γραμμικό τρόπο. Ένα ευδιάκριτο χαρακτηριστικό γνώρισμα των νευρωνικών δικτύων έναντι στις παραδοσιακές στατιστικές μεθόδους είναι η ύπαρξη των κρυμμένων στρωμάτων. Οι κρυμμένοι κόμβοι είναι η λειτουργία των ανεξάρτητων μεταβλητών ενώ οι εξαρτημένες μεταβλητές είναι η λειτουργία των κρυμμένων κόμβων. Η rule induction αναφέρεται στους κανόνες που παράγονται από τον αλγόριθμο δέντρων απόφασης στον τομέα της εξόρυξης δεδομένων (Data mining). Source methods (Μέθοδοι πηγής) Για να αναπτυχθεί το integrative prediction model, χρησιμοποιήθηκαν οι ακόλουθες τέσσερις μέθοδοι ως πηγές, η MDA multiple discriminant analysis, η logistic regression, τα neural networks και η rule induction. Το integrative model with subject weight (IMSW) περιλαμβάνει κάποιες διαδικασίες διαμόρφωσης και οι οποίες είναι οι ακόλουθες: ΒΗΜΑ 1: Αν S<0 τότε bankrupt αλλιώς healthy ΒΗΜΑ 2: I i = 1 αν η πρόβλεψη είναι σωστή αλλιώς 0 ΒΗΜΑ 3: Αν Pr>0.50 τότε bankrupt αλλιώς healthy Η εργασία βαρών μπορεί να δοθεί με τη σύγκριση των ακόλουθων τεσσάρων περιπτώσεων: α)αν I i =1 και Pr(Y=1) i =0,95 bankrupt(υψηλό επίπεδο εμπιστοσύνης) β)αν I i =1 και Pr(Y=1) i =0,05 healthy (με υψηλό επίπεδο εμπιστοσύνης) γ) Αν I i =0 και Pr(Y=1) i =0,95 ανακριβώς bankrupt δ) Αν I i =0 και Pr(Y=1) i =0,55 ανακριβώς bankrupt με χαμηλό επίπεδο εμπιστοσύνης *S= αποτέλεσμα Pr= πιθανότητα της ύπαρξης πτώχευσης 10

11 i= MDA, LOGIC, ANN, RULE Xs= depent variables (ανεξάρτητες μεταβλητές) Y= indepent variables (εξαρτημένες μεταβλητές) I= μεταβλητή δεικτών Πείραμα και αποτελέσματα Για το πείραμα χρησιμοποιήθηκαν τα ετήσια οικονομικά στοιχεία που συλλέχθηκαν από το Ταμείο πιστωτικών Εγγυήσεων της Κορέας (Korea Credit Guarantee Fund). Τα στοιχεία αποτελούνται από 900 χρεοκοπημένες εταιρείες και 900 υγιείς την περίοδο : Υιοθετήθηκε μια πενταπλάσια διαγώνια επικύρωση (five-fold cross validation) για να ενισχύσει τη δυνατότητα γενίκευσης των test results Η ακρίβεια πρόβλεψης μετριέται με 3 τρόπους: -correct classification ratio (RC) - false positive ratio (FP) that refers to incorrectly predicting bankrupt - false negative ratio (FN) for implying incorrectly predicting healthy Το συμπέρασμα με βάση τα πειράματα που έχουν γίνει είναι οτι το IMSW οδηγεί στην καλύτερη απόδοση. Ο μέσος όρος των σωστών αναλογιών ταξινόμησης(rc) του IMSW είναι 78,92%, το οποίο είναι μεγαλύτερο από άλλα μοντέλα. Όσον αφορά τη λάθος ταξινόμηση, το LOGIC δίνει τη χαμηλότερη ψεύτικη θετική αναλογία(fp), 11,79%, ενώ η ANN δίνει τη χαμηλότερη ψεύτικη αρνητική αναλογία(fn), 7,61%. Όσον αφορά τον απλό αλγόριθμο ψηφοφορίας(svm) ΔΕΝ είναι επιτυχής. Financial variables (οικονομικές μεταβλητές εισόδου) Οι μεταβλητές που επιλέγονται περιλαμβάνουν: κέρδος στις πωλήσεις(profit to sales), λειτουργούν κέρδος στις πωλήσεις (Operating profit to sales), (Ordinary profit to total capital), τρέχοντα στοιχεία του παθητικού (Current liabilities to total capital), το καθαρό κόστος χρηματοδότησης(net financing cost), το καθαρό κεφάλαιο κίνησης (Net working capital to total capital), το ποσοστό αύξησης των παρόντων προτερημάτων(growth rate of current assets) και το συνηθισμένο εισόδημα στην καθαρή αξία(ordinary income to net worth). Εργασία 3. Using neural network ensembles for bankruptcy prediction and credit scoring Σε αυτό το έγγραφο γίνεται η σύγκριση της απόδοσης του single neural network classifier με τους multiple classifiers και τους diversified multiple neural network classifiers άνω των τριών συνόλων δεδομένων για τα προβλήματα πρόβλεψης πτώχευσης και πιστωτικής σημείωσης. Για την λύση των οικονομικών προβλημάτων λήψεων αποφάσεων έχουν χρησιμοποιηθεί: - Artificial intelligence (η τεχνητή νοημοσύνη) 11

12 - Machine learning techniques Σε αυτές τις 2 τεχνικές συμπεριλαμβάνονται: α) τεχνητά νευρωνικά δίκτυα ANN β) δέντρα αποφάσεων DT και γ) διανυσματικές μηχανές υποστήριξης SVM Η περισσότερο όμως χρησιμοποιημένη τεχνική για τα οικονομικά προβλήματα λήψης αποφάσεων είναι το multilayer perceptron (MLP) network Κατά μέσον όρο οι single classifiers είναι καταλληλότεροι για την πρόβλεψη πτώχευσης και την πιστωτική σημείωση. Εντούτοις, όταν εξετάζουμε τα ποσοστά σφάλματος τύπων Ι και ΙΙ, δεν υπάρχει κανένας ακριβής νικητής. Οι περισσότεροι από τους diversified multiple classifiers αποδίδουν χειρότερα από τους single classifiers και τους multiple classifiers. Αν και οι single classifiers εκτελούν καλύτερα στην περίπτωση της μέσης ακρίβειας πρόβλεψης, multiple classifiers ή οι diversified multiple classifiers δεν πρέπει να αγνοηθούν στην πρόβλεψη πτώχευσης και την πιστωτική σημείωση. Τύπος Ι σφάλματος: Αυτό εμφανίζει το ποσοστό σφαλμάτων πρόβλεψης ενός μοντέλου, στο οποίο η ταξινόμηση δεν είναι σωστή, δηλαδή ταξινομείται η κακή πιστωτική ομάδα στην καλή πιστωτική ομάδα. - Τύπος ΙΙ σφάλματος: Αντίθετα από το σφάλμα τύπων Ι, αυτό παρουσιάζει το ποσοστό σφαλμάτων πρόβλεψης ενός μοντέλου στο οποίο η ταξινόμηση επίσης δεν είναι σωστή δηλαδή ταξινομείται η καλή πιστωτική ομάδα στην κακή πιστωτική ομάδα Artificial neural networks ANN Ο πιο κοινός τύπος νευρωνικών δικτύων αποτελείται από τρία στρώματα: στρώματα εισόδου (input layers), κρυμμένα στρώματα (hidden layers) και στρώματα εξόδου (output layers) και ο οποίος καλείται multilayer perceptron MLP (πολυστρωματικό perceptron). Ένα στρώμα των μονάδων εισόδου συνδέεται με ένα στρώμα των κρυμμένων μονάδων, το οποίο συνδέεται με ένα στρώμα των μονάδων εξόδου. Η δραστηριότητα των στρωμάτων εισόδου αντιπροσωπεύει τις ακατέργαστες πληροφορίες που τροφοδοτούν το δίκτυο. Η δραστηριότητα κάθε κρυμμένης μονάδας καθορίζεται από τις δραστηριότητες των μονάδων εισόδου και τα βάρη στις συνδέσεις μεταξύ της εισόδου και των κρυμμένων μονάδων. Η συμπεριφορά των μονάδων εξόδου εξαρτάται από τη δραστηριότητα των κρυμμένων μονάδων και των βαρών μεταξύ των κρυμμένων και μονάδων εξόδου. 12

13 Σχήμα: The three-layer neural network. Πολλαπλάσιοι ταξινομητές (Multiple classifiers) Ως εναλλακτική λύση μιας ενιαίας προσέγγισης ταξινομητών, εξετάζεται ο συνδυασμός πολλαπλάσιων ταξινομητών. Η βασική ιδέα στα πολλαπλάσια συστήματα ταξινομητών είναι να συνδυαστούν διάφοροι ταξινομητές έτσι ώστε το προκύπτον συνδυασμένο σύστημα να επιτυγχάνει την υψηλότερη ακρίβεια και αποδοτικότητα ταξινόμησης από τους αρχικούς ενιαίους ταξινομητές. Στο πείραμα αυτού του άρθρου συμπεριλαμβάνονται τρία οικονομικά σύνολα, τα οποία είναι Αυστραλιανή πίστωση (Australian credit), Γερμανική πίστωση (, German credit) και Ιαπωνική πίστωση (Japanese credit) ΣΥΜΠΕΡΑΣΜΑΤΑ -Έγινε η σύγκριση της απόδοσης του single neural network classifier με τους diversified multiple neural network classifiers άνω των τριών συνόλων δεδομένων για τα προβλήματα πρόβλεψης πτώχευσης και πιστωτικής σημείωσης. - ο ενιαίος νευρωνικός ταξινομητής δικτύων είναι καταλληλότερος από τους πολλαπλάσιους - Τα αποτελέσματα δείχνουν ότι εξετάζοντας τα προβλήματα πιστωτικής σημείωσης της Αυστραλίας της Γερμανίας και της Ιαπωνίας, ο ιθύνων πρέπει να εξετάσει όχι μόνο τους single classifiers αλλά και τους multiple classifiers και τους diversified multiple classifiers διότι όταν εξετάζουμε τα ποσοστά σφάλματος τύπων Ι και ΙΙ, οι ενιαίοι ταξινομητές δεν ξεπερνούν συνολικά τους πολλαπλάσιους ή διαφοροποιημένους πολλαπλάσιους ταξινομητές, ειδικά για τον τύπο ΙΙ σφάλμα. 13

14 Εργασία 4. Bankruptcy prediction with neural logic networks by means of grammar-guided genetic programming Στο έγγραφο αυτό γίνεται χρήση υβριδικών ευφυών συστημάτων (hybrid intelligent systems) για το πρόβλημα ταξινόμησης της πτώχευσης. Στόχος της μελέτης είναι η ικανότητα πρόβλεψης της επιχειρησιακής αποτυχίας. Προτείνεται η εφαρμογή των neural logic networks με τη βοήθεια του genetic programming. Για την μελέτη αυτή χρησιμοποιήθηκαν στοιχεία από 118 Ελληνικές επιχειρήσεις. Το συνολικό σύνολο 118 περιπτώσεων, αποτελείται από δύο άνισα υποσύνολα, ένα που αντιπροσωπεύει το training set (σύνολο κατάρτισης) (80 περιπτώσεις) και άλλο το testing data set (εξεταστικό σύνολο στοιχείων) (38 περιπτώσεις). Το πρώτο, training σύνολο στοιχείων αποτελείται από 80 ελληνικές εταιρίες, οι οποίες ανήκουν σε διαφορετικές βιομηχανίες. Το ολόκληρο σύνολο στοιχείων μπορεί να διαιρεθεί σε δύο ίσα υποσύνολα, συμπεριλαμβανομένων 40 εταιριών που χρεοκόπησαν κατά τη διάρκεια περιόδου και 40 μη-χρεοκοπημένων εταιριών για το ίδιο χρονικό διάστημα. Η επιλογή γίνεται κατά τέτοιο τρόπο ώστε να υπάρχουν παρόμοια χαρακτηριστικά, όπως ο αριθμός υπαλλήλων και συνολικών προτερημάτων. Οι περισσότερες από τις πτωχεύσασες εταιρίες (42%) άνηκαν στον κλωστοϋφαντουργικό τομέα και το υπόλοιπο ποσοστό ισορροπήθηκε μεταξύ των διάφορων τομέων όπως τα τρόφιμα, η ένδυση και τα υποδήματα, το ξύλο, τα πλαστικά, οι χημικές ουσίες, η βιομηχανία μετάλλων, τα οχήματα μεταφορών, κ.λπ. Ομοίως, το δεύτερο testing (εξεταστικό) δείγμα που αποτελείται από 38 περιπτώσεις χωρίζεται σε δύο ίσους υποτομείς, δηλαδή 19 χρεοκοπημένες εταιρίες και 19 μη χρεοκοπημένες το χρονικό διάστημα Οι περισσότερες από τις πτωχεύσασες εταιρίες (37%) του δείγματος δοκιμής ανήκουν επίσης στον κλωστοϋφαντουργικό τομέα ενώ το υπόλοιπο ποσοστό ισορροπήθηκε πάλι μεταξύ των διάφορων τομέων όπως τα τρόφιμα, η ένδυση και τα υποδήματα, το ξύλο, τα πλαστικά, οι χημικές ουσίες, η βιομηχανία μετάλλων και τα οχήματα μεταφορών. Οι οικονομικές δηλώσεις για τις πτωχεύσασες επιχειρήσεις συλλέχθηκαν για μια περίοδο 1 έτους πριν από την αποτυχία. Για την πρόβλεψη πτώχευσης εξετάστηκαν 12 financial rations και οι οποίες είναι οι εξής: 1. Net income/gross profit (Εισόδημα δικτύου/ακαθάριστο κέρδος) 2. Gross profit/total assets 3. Net income/total assets 4. Net income/net worth (εισόδημα δικτύου/δίκτυο αξίας) 14

15 5. Current assets/current liabilities (παρόντων προτερημάτων/των παρόντων στοιχείων του παθητικού) 6. Quick assets/current liabilities (γρήγορα προτερήματα/των παρόντων στοιχείων του παθητικού) 7. Net worth/net fixed assets (αξίας/ πάγια ενεργητικά δικτύου) 8. Inventories/Working capital (κατάλογοι/κεφάλαιο κίνησης) 9. Current liabilities/total assets (παρόντα στοιχεία του παθητικού/συνολικά προτερήματα) 10. Working capital/net worth (κεφάλαιο κίνησης/δίκτυο αξίας) Genetic programming GP genetic programming είναι μια μεθοδολογία αναζήτησης που ανήκει στην οικογένεια του evolutionary computation (EC). Σήμερα αυτοί οι αλγόριθμοι έχουν εφαρμοστεί σε ένα ευρύ φάσμα των πραγματικών προβλημάτων. To genetic programming με την κανονική μορφή του επιτρέπει την αυτόματη παραγωγή των μαθηματικών εκφράσεων. Ένα πλεονέκτημά του πέρα από τους αλγορίθμους, είναι η δυνατότητα να κατασκευάσει λειτουργικά δέντρα του ποικίλου μήκους. Το βασικότερο όμως πλεονέκτημα αυτής της διαδικασίας είναι ότι η επιλογή χαρακτηριστικών γνωρισμάτων και η διαμόρφωση συστημάτων, εμφανίζονται κατά τη διάρκεια του κανονικού τρεξίματος και δεν απαιτούν οποιαδήποτε ανθρώπινη προεπεξεργασία. Εργασία 5. Early bankruptcy prediction using ENPC * ENPC = - Evolutionary Nearest Neighbor Classifier Αυτή η εργασία ασχολείται με την αξιολόγηση της απόδοσης του ENPC συγκρίνοντας την με έξι (6) εναλλακτικές λύσεις. Υπάρχουν 2 τρόποι να εξεταστεί η πρόβλεψη πτώχευσης: ο 1 ος είναι δομική προσέγγιση (structural approach), περιλαμβάνει τις λεπτομερείς προβολές των οικονομικών δηλώσεων και ο 2 ος είναι μια στατιστική προσέγγιση και η οποία χρησιμοποιείται σε αυτήν την εργασία. Λόγω της δικτυακής γειτονιάς οι προσπάθειες πρόβλεψης γίνονται με πολύ διαφορετικές τεχνικές όπως: k-nearest neighbor multiple discriminant analysis (η πολλαπλάσια διακρίνουσα ανάλυση MDA) logit models (τα μοντέλα λογικού) 15

16 artificial neural networks ANN (τα τεχνητά νευρικά δίκτυα) classification trees (τα δέντρα ταξινόμησης) ENPC : Ένα από τα βασικά πλεονεκτήματα αυτού του αλγορίθμου είναι η έλλειψη για τις αρχικές παραμέτρους που καθορίζονται από το χρήστη για να καθοδηγήσει τη διαδικασία Η διαδικασία κατάρτισης (training process) αποτελείται από 8 στάδια. Ροή του αλγορίθμου ENPC Initialization (έναρξη) Information gathering (συλλογή πληροφοριών) Mutation (μεταλλαγή) Reproduction (αναπαραγωγή) Fight Move (κίνηση) Die(κύβος) End condition (συνθήκη,όρος, τέλος) End 16

17 Initialization(Έναρξη) : Η αρχική θέση του αλγορίθμου είναι άσχετη και ρυθμίζεται αυτόματα. Information gathering (συλλογή πληροφοριών): Στην αρχή κάθε επανάληψης ο αλγόριθμος συγκεντρώνει τις πληροφορίες σχετικά με τα πρωτότυπα, τις κλάσεις και τα σύνολα προτύπων που απαιτούνται για τα ακόλουθα πέντε στάδια. Reproduction (αναπαραγωγή): Αυτό το στάδιο εισάγει νέα πρωτότυπα στον ταξινομητή. Όρος τέλους. Η διαδικασία συνεχίζεται έως ότου αποφασίζει να σταματήσει ο χρήστης. Ο αλγόριθμος ENPC έχει συγκριθεί με 6 ταξινομητές οι οποίοι φαίνονται στον επόμενο πίνακα ο οποίος αναφέρει τα συνοπτικά αποτελέσματα για το δείγμα δοκιμής. NB LR C4.5 PART SVM MLP ENPC Accuracy 73.30% 76.47% 71.95% 74.66% 74.66% 79.19% 80.09% T. I Error 76.79% 85.71% 96.43% 99.99% 99.99% 76.79% 71.43% T. II Error 9.70% 2.42% 4.85% 0.00% 0.00% 1.81% 2.42% * NB= Naive Bayes LR= logistic regression with a ridge estimator (λογιστική οπισθοδρόμηση με έναν εκτιμητή κορυφογραμμών) SVM= support vector machine trained with sequential minimal optimization MLP= multilayer perceptron Καθορίζεται ο Type I error ως λανθασμένη καταχώρηση μιας αποτυχημένης εταιρίας ως υγιούς απ την άλλη ο Type IΙ error θα εμφανίζεται όποτε οι μηχρεοκοπημένες επιχειρήσεις ταξινομούνται ως πτωχεύσασες. Με βάση το πίνακα το MLP εκτελεί καλύτερα από τα υπόλοιπα. Τα C4.5, NB δεν είναι χρήσιμα αφού εμφανίζουν ένα βαθμό για την ακρίβεια κάτω των 77.46%.Τα SVM,PART έχουν τα χειρότερα αποτελέσματα. Τέλος το ENPC προσφέρει τα καλύτερα αποτελέσματα αν και δεν διαφέρει και πολύ από το MLP Μεταβλητές- αναλογίες (Variables) Στην ανάλυση χρησιμοποιούνται 5 επεξηγηματικές μεταβλητές Μεταβλητές πρόβλεψης NAME WC/TA Definition (καθορισμός) Κεφάλαιο κίνησης /Συνολικά 17

18 προτερήματα RE/TA EBIT/TA MVE/TA S/TA CR Διατηρημένες αποδοχές/ Συνολικά προτερήματα Αποδοχές πριν από το φόρο/ Συνολικά προτερήματα Αγοραστική αξία / Συνολικά προτερήματα Πωλήσεις / Συνολικά προτερήματα Παρόντα προτερήματα/ Παρόντα στοιχεία του παθητικού Το δείγμα στην μελέτη αυτού του άρθρου αποτελείται από 552 Αμερικάνικες επιχειρήσεις, 138 εκ των οποίων χρεοκόπησαν μεταξύ των ετών Ως συμπέρασμα της μελέτης που αναλύθηκε πριν μπορεί να αναφερθεί η καινοτομία του ENPC, η οποία αναλύεται ως εξής: α) ευκολία στην χρήση β) αντίθετα με MLP βρίσκει τις απαραίτητες παραμέτρους αυτόνομα στο χρόνο εκτέλεσης γ) είναι άξιος ανταγωνιστικός αλγόριθμος Εργασία 6. An experimental comparison of ensemble of classifiers for bankruptcy prediction and credit scoring. Είναι το πρώτο έγγραφο που συγκρίνει διάφορες μεθόδους για την πρόβλεψη πτώχευσης και την πιστωτική σημείωση, δείχνοντας έτσι ότι το σύνολο ταξινομητών μπορεί να χρησιμοποιηθεί για την ώθηση της απόδοσης του αυτόνομου ταξινομητή ( stand-alone ) Το άρθρο αυτό αναφέρεται σε διάφορες οικονομικές μεθόδους λήψης αποφάσεων (decision-making methods) όπως : multilayer perceptron (MLP), Decision Tree (δέντρο απόφασης) και η Support Vector Machine SVM (διανυσματική μηχανή υποστήριξης). Το σύνολο μεθόδων ταξινομητών που εξετάζονται σε αυτό το έγγραφο είναι: α) Bagging (BA) β) Random Subspace (RS) Κάθε αυτόνομος ταξινομητής (stand-alone classifier) χρησιμοποιεί μόνο ένα υποσύνολο όλων των χαρακτηριστικών γνωρισμάτων για την κατάρτιση και τη δοκιμή (training and testing). 18

19 γ) Class Switching (CW) Κάθε νέο σύνολο κατάρτισης (training set) λαμβάνεται τυχαία μεταστρέφοντας τις κλάσεις του παραδείγματος κατάρτισης δ) Rotation Forest (RF) Στη συνέχεια εξετάστηκαν οι ακόλουθοι ταξινομητές: α) Levenberg Marquardt neural net με πέντε κρυμμένες μονάδες (LM) β) Multi-layer perceptron neural net με πέντε κρυμμένες μονάδες (MLP). γ) Radial Basis function Support Vector Machine (RV)2 (Ακτινωτή διανυσματική μηχανή (RV) 2 υποστήριξης) δ) The old 5-nearest neighbour. (5nn) Για τα πειράματα αυτού του εγγράφου επιλέγονται τρία οικονομικά σύνολα δεδομένων(financial datasets): Αυστραλιανή πίστωση (Australian credit), Γερμανική πίστωση(german credit), και Ιαπωνική πίστωση ( Japanese credit) Πείραμα Συγκρίνεται ένας ενιαίος ταξινομητής MLP ( multilayer perceptron ) με τους πολλαπλάσιους ταξινομητές και τους διαφοροποιημένους πολλαπλάσιους ταξινομητές σε τρία σύνολα δεδομένων. Στον πίνακα φαίνονται τα χαρακτηριστικά των συνόλων δεδομένων που χρησιμοποιούνται στο πείραμα. Σύνολο στοιχείων #A #E #С Ιαπωνία Αυστραλία Γερμανία #A= αριθμός ιδιοτήτων #E= αριθμός παραδειγμάτων #C=αριθμός κλάσεων Παράμετροι Οι παράμετροι που χρησιμοποιούνται για να συγκρίνουν τις δοκιμασμένες μεθόδους είναι: α) Accuracy (Ακρίβεια) β) The area under the Receiver Operating Characteristic curve (AUC) Η περιοχή κάτω από τη λειτουργούσα χαρακτηριστική καμπύλη δεικτών σχεδιάζει το αληθινό θετικό ποσοστό ενάντια στο ψεύτικο θετικό ποσοστό. Η AUC είναι μια από τις καλύτερες μεθόδους για τους ταξινομητές στα προβλήματα δύο-κλάσης (two-class problems). γ) Type I error αριθμός προτύπων που ανήκουν στην κακή πιστωτική ομάδα και ταξινομείται ανακριβώς στην καλή πιστωτική ομάδα. δ) Type II error αριθμός προτύπων που ανήκουν στην καλή πιστωτική ομάδα που ταξινομείται ανακριβώς στην κακή πιστωτική ομάδα. 19

20 Συμπέρασμα: Η Accuracy και τα Type I error και Type II error ΔΕΝ είναι αξιόπιστοι παράμετροι(αυτοί οι δείκτες ΔΕΝ εξετάζουν τα αποτελέσματα των ταξινομητών). Αντιθέτως το AUC είναι ο καλύτερος δείκτης για να συγκρίνουμε τις μεθόδους και είναι βασισμένο στην πλοκή του αληθινού θετικού ποσοστού ενάντια στο ψεύτικο θετικό ποσοστό. Συμπέρασμα: Ο καλύτερος αυτόνομος ταξινομητής(stand-alone classifier) είναι MLP και το καλύτερο σύστημα είναι το RS LMNC. Η καινοτομία αυτού του εγγράφου είναι ότι κάνει σύγκριση ενός συνόλου ταξινομητών για την πρόβλεψη πτώχευσης και την πιστωτική σημείωση. Εργασία 7. Predicting bank financial failures using neural networks, support vector machines and multivariate statistical methods:a comparative analysis in the sample of savings deposit insurance fund (SDIF) transferred banks in Turkey. Αυτή η μελέτη στοχεύει να εφαρμόσει τις διάφορες neural network techniques NN, τις support vector machines SVM και τις multivariate statistical methods στο πρόβλημα πρόβλεψης αποτυχίας τραπεζών σε μια τουρκική περίπτωση και να παρουσιάσει μια περιεκτική σύγκριση των αποδόσεων ταξινόμησης των δοκιμασμένων τεχνικών. Μέθοδοι Artificial neural networks (ANN) = Τεχνητά Νευρωνικά Δίκτυα Multi-layer Perceptron(MLP) Competitive Learning (CL) Selforganizing Map (SOM) Learning Vector Quantization (LVQ)= διανυσματική κβαντοποίηση εκμάθησης Support vector machines (SVM) = Διανυσματικές μηχανές υποστήριξης Multivariate statistical methods = Πολλών μεταβλητών στατιστικές μέθοδοι Multivariate Discriminant Analysis (MDA) K-Means Cluster Analysis (CA) Logistic Regression Analysis (LRA) Δείγμα: Συνολικά 21 Τράπεζες μεταφέρθηκαν στο SDIF από τι οποίες οι 21 τράπεζες ήταν αποτυχημένες και οι 44 τράπεζες ήταν μη-αποτυχημένες. Ως εκ τούτου, το ολόκληρο σύνολο στοιχείων αποτελούνταν από 65 τράπεζες και αναφέρεται στην περίοδο Οι μη-αποτυχημένες τράπεζες επιλέχτηκαν τυχαία με το ποσό διπλάσιο του αριθμού αποτυχημένων τραπεζών. Επιπλέον, δύο πιο μη- 20

21 αποτυχημένες τράπεζες επιλέχτηκαν και περιλήφθηκαν επίσης τυχαία στα ερευνητικά στοιχεία (δηλ: 21x2=42+2) Το ολόκληρο σύνολο στοιχείων διαιρείται έπειτα σε: υποσύνολα κατάρτισης υποσύνολα επικύρωσης (training subsets) (validation subsets) τυχαία επιλεγμένες 29 τράπεζες 7 τράπεζες 15 τράπεζες 14 τράπεζες που που δεν που μεταφέρθηκαν που δεν απέτυχαν μεταφέρθηκαν σε απέτυχαν σε SDIF SDIF Ο αριθμός τραπεζών στα ερευνητικά στοιχεία ΕΤΟΣ Ολόκληρο σύνολο Σύνολο κατάρτισης Training set Σύνολο επικύρωσης Validation set Αποτυχημένος μηαποτυχημένος Αποτυχημένος μηαποτυχημένος Αποτυχημένος μηαποτυχημένος Σύνολο Αποτελέσματα απόδοσης για την κατάρτιση και την επικύρωση των τεχνικών πρόβλεψης Μοντέλο πρόβλεψης Απόδοση κατάρτισης (%)Training performance Απόδοση επικύρωσης (%) Multi-layer perceptron (MLP) Competitive learning (CL)

22 Self-organizing map (SOM) Learning vector quantization (LVQ) Support vector machines (SVMs) Multivariate discriminant analysis (MDA) K-means cluster analysis (CA) Logistic regression analysis (LRA) Τα αποτελέσματα για το MLP έδειξαν ότι ολόκληρο το σύνολο στοιχείων με 20 καθαρές μεταβλητές εισόδου δίνουν τα ακριβέστερα αποτελέσματα ταξινόμησης. Το MLP ταξινόμησε σωστά 100% των τραπεζών στο σύνολο στοιχείων κατάρτισης (Training performance %), και 95,5% των τραπεζών στο σύνολο επικύρωσης (Validation performance %). Αυτά τα αποτελέσματα σημαίνουν ότι MLP ταξινόμησε ακριβώς όλα τα πρότυπα εισόδου του συνόλου στοιχείων κατάρτισης και το μεγαλύτερο μέρος του συνόλου στοιχείων επικύρωσης. Η απόδοση του MLP μπορεί να θεωρηθεί ως ικανοποιητική. Artificial neural networks. Σε αυτό το άρθρο για την πρόβλεψη αποτυχίας των τραπεζών χρησιμοποιήθηκαν τα εξής μοντέλα Multi-layer Perceptron (MLP) Competitive Learning (CL), Selforganizing Map (SOM) and Learning Vector Quantization (LVQ) SVMs Support vector machines. Είναι μια τεχνική: Ταξινόμησης (classification) Αναγνώρισης (recognition) Regression και time series technique 22

23 Multivariate statistical methods. Για την πρόβλεψη οικονομικών αποτυχιών των τραπεζών χρησιμοποιούνται: Multivariate Discriminant Analysis (MDA) (πολλών μεταβλητών διακρίνουσα ανάλυση) K-Means Cluster Analysis (CA) και Logistic Regression Analysis (LRA) Οικονομικές αναλογίες-μεταβλητές: Capital adequacy: (CA3). Asset quality: (AQ5). Management: Personnel expenses/average assets (M1). Earnings: Net profit/average assets. Liquidity: Liquid assets/total assets Sensitivity to market risk: Trading securities/total assets (SMR1). Εργασία 8. Financial failure prediction using efficiency as a predictor. Σε αυτό το έγγραφο, προτείνεται μια προσέγγιση πρόβλεψης που χρησιμοποιεί την αποδοτικότητα της εταιρίας ως προάγγελο (predictor). Στην προτεινόμενη μέθοδο, η data envelopment analysis (DEA) υιοθετείται ως εργαλείο για να αξιολογήσει την αποδοτικότητα εισόδου/εξόδου κάθε εταιρίας. Δίνεται έμφαση στο γεγονός ότι μια βασική αιτία της οικονομικής αποτυχίας είναι η φτωχή διαχείριση και ότι η αποδοτικότητα επιχειρησιακής λειτουργίας είναι μια καλή αντανάκλαση της διαχείρισης της εταιρείας. Για να ελέγξουμε την αποτελεσματικότητα της αποδοτικότητας ως προάγγελο, χρησιμοποιούμε τα στοιχεία των εταιριών που εμφανίζονται στην λίστα της ανταλλαγής αποθεμάτων της Σαγγάης (SSE) (Shanghai stock exchange (SSE)), και συγκρίνουμε την ακρίβεια της ίδιας μεθόδου πρόβλεψης με και χωρίς τη μεταβλητή αποδοτικότητας (efficiency). Τα μοντέλα πρόβλεψης αποτυχίας που χρησιμοποιεί η έρευνα αυτή είναι τα εξής: multiple discriminant approach (MDA), logistic regression και support vector machines (SVMs).Και τα τρία μοντέλα προτείνουν ότι η αποδοτικότητα λειτουργεί πολύ καλά ως προάγγελος. Οι τρείς προαναφερθείσες μέθοδοι εφαρμόζονται στην οικονομική πρόβλεψη αποτυχίας των εταιριών στην Κίνα. Το σύνολο δεδομένων που υιοθετείται σε αυτήν την έρευνα παρέχεται από τις οικονομικές δηλώσεις των εταιριών που παρατίθενται στην ανταλλαγή αποθεμάτων της Σαγγάης (SSE)( Shanghai stock exchange). Το σύνολο δεδομένων περιέχει 120 ελεγχόμενες εταιρίες, από τις οποίες οι 60 περιπτώσεις έχουν τον κίνδυνο της πτώχευσης και οι 60 περιπτώσεις δεν κινδυνεύουν και αναφέρεται για την περίοδο Μια επιχείρηση βρίσκεται 23

24 στην λίστα για τον οικονομικό κίνδυνο εάν εμφανίζεται ως αφερέγγυα με τα στοιχεία του παθητικού. Επιλέγονται οι πτωχεύσασες και μη-πτωχεύσασες εταιρίες τυχαία, έτσι η επιλογή καλύπτει ολόκληρο το φάσμα από στις κατασκευαστικές εταιρίες. Misclassification C (εσφαλμένη κατηγοριοποίηση): Για να ερευνηθεί η αποτελεσματικότητα της προτεινόμενης προσέγγισης, πραγματοποιούνται δύο πειράματα για τη σύγκριση μέσω των διαφορετικών Cross-validation. Στο πρώτο πείραμα εφαρμόζεται η SVMs, η logistic regression και η πολλαπλάσια διακρίνουσα ανάλυση (MDA) στην οικονομική πρόβλεψη αποτυχίας που χρησιμοποιεί επτά (7) οικονομικές αναλογίες ως μεταβλητές ενώ το δεύτερο πείραμα χρησιμοποιεί τις επτά μεταβλητές και την αποδοτικότητα ως μεταβλητή. Με βάση τα αποτελέσματα που προτείνονται, η κατάλληλη σειρά για το C τίθεται μεταξύ 0,1 και 100. Ποσοστό της βελτίωσης λάθος ταξινόμησης(misclassification) του SVMs-E ανω των SVMs με διάφορο το C είναι διευκρινισμένο στο Σχ 1. Η βελτίωση λάθος ταξινόμησης(misclassification) του SVMs-ε πέρα από SVMs ορίζεται ως: (misclassification of SVMs - misclassification of SVMs-E)/ (misclassification of SVMs) 100%. Σχήμα. 1. Misclassification improvement of SVMs-E over SVMs. (Βελτίωση λάθος ταξινόμησης του SVMs-E ανω των SVMs.) * Parameter v represents the number of subsets in v-fold cross-validation. *SVMs-E= SVMs efficiency=αποδοτικότητα Μπορεί να παρατηρηθεί από το σχέδιο ότι η απόδοση SVMs που χρησιμοποιεί την αποδοτικότητα (E) είναι με συνέπεια καλύτερη από το SVMs χωρίς αποδοτικότητα. Κάνουμε το ίδιο πείραμα αλλά αντί να χρησιμοποιήσουμε το SVMs χρησιμοποιούμε τη logistic regression και το MDA στο σύνολο δεδομένων χρησιμοποιώντας επτά και οκτώ μεταβλητές, αντίστοιχα. Το συμπέρασμα είναι ότι οι γενικές αποδόσεις πρόβλεψης του SVMs, της logistic regression και της MDA που χρησιμοποιούν την 24

25 αποδοτικότητα ως προάγγελο είναι καλύτερες από εκείνες χωρίς αποδοτικότητα. Επομένως, η χρησιμοποίηση της αποδοτικότητας που λήφθηκε μέσω DEA ως προάγγελος στην εταιρική οικονομική πρόβλεψη αποτυχίας θα μπορούσε να βελτιώσει την ακρίβεια πρόβλεψης. Σε αυτό το έγγραφο, ως μεταβλητές εισόδου για DEA επιλέχθηκαν οι συνολικές ευθύνες και οι δαπάνες των πωλήσεων για DEA, και ως μεταβλητή εξόδου επιλέχθηκε το εισόδημα των πωλήσεων. Εργασία 9. Differential evolution trained wavelet neural networks: Application to bankruptcy prediction in banks. Σε αυτήν την μελέτη, αναπτύσσεται το DEWNN (differential evolution trained wavelet neural network) και συγκρίνεται με TAWNN threshold accepting trained wavelet neural network και με το αρχικό WNN a wavelet neural network όσον αφορά τα σύνολα δεδομένων συγκριτικής μέτρησης επιδόσεων (benchmark datasets), δηλαδή σύνολο δεδομένων IRIS, σύνολο δεδομένων κρασιού και σύνολο δεδομένων καρκίνου του μαστού του Wisconsin καθώς επίσης και σύνολα στοιχείων πτώχευσης δηλαδή σύνολο δεδομένων αμερικανικών τραπεζών, σύνολο δεδομένων τουρκικών τραπεζών και σύνολο δεδομένων ισπανικών τραπεζών. **DEWNN = διαφορικό εκπαιδευμένο νευρωνικό δίκτυο κυματακιών. TAWNN = το εκπαιδευμένο νευρωνικό δίκτυο κυματακιών. WNN = νευρωνικό δίκτυο κυματακιών. Όσον αφορά τα σύνολα στοιχείων πτώχευσης έχουμε τα εξής: Το σύνολο δεδομένων που αφορά την Τουρκία περιέχει: 22 που έχουν χρεοκοπήσει 40 τράπεζες 18 που είναι υγιείς Το σύνολο δεδομένων που αφορά την Ισπανία περιέχει: 37 που έχουν χρεοκοπήσει 66 τράπεζες 29 που είναι υγιείς (περίοδος 1982) Το σύνολο δεδομένων που αφορά την Αμερική περιέχει: 65 που έχουν χρεοκοπήσει 129 τράπεζες 64 που είναι υγιείς (περίοδος ) *Στο πείραμα γίνεται η χρήση της 10-fold cross validation method 25

26 Differential evolution algorithm (DE) (διαφορικός αλγόριθμος εξέλιξης) προτείνεται για να εκπαιδεύσει ένα wavelet neural network (WNN) (νευρωνικό δίκτυο κυματακιών). Το προκύπτον δίκτυο ονομάζεται ως differential evolution trained wavelet neural network (DEWNN) (διαφορικό εκπαιδευμένο νευρωνικό δίκτυο κυματακιών).η απόδοση DEWNN συγκρίνεται με αυτήν της ευαισθησίας που αποδέχεται το trained wavelet neural network (TAWNN) (εκπαιδευμένο νευρωνικό δίκτυο κυματακιών). Το WNN (a wavelet neural network) αποτελείται από τρία στρώματα: στρώμα εισόδου, κρυμμένο στρώμα και στρώμα εξόδου (input layer, hidden layer and output layer). Η δομή του WNN στην συγκεκριμένη έρευνα αποτελείται απο δύο εισαγμένους και έξι κρυμμένους κόμβους Input layer Hidden layer Output layer Έξοδος δείγματος Financial ratios of the datasets and the selected features Στοιχεία των τουρκικών τραπεζών 1 Δαπάνες ενδιαφέροντος/μέσος όρος κερδοφόρων προτερημάτων (Interest expenses/average profitable assets) 2 Δαπάνες ενδιαφέροντος/μέσος όρος μη-κερδοφόρων προτερημάτων (Interest expenses/average non-profitable assets) 3 (Share holders equity + total income)/(deposits + non-deposit funds) 4 (Interest income/interest expenses) 5 (Share holders equity + total income)/total assets 6 (Share holders equity + total income)/(total assets + contingencies & commitments) 7 Κεφάλαιο δικτύωσης /συνολικά προτερήματα (Networking capital / total assets) Στοιχεία των ισπανικών τραπεζών 1 Ενεργητικό/συνολικά προτερήματα (Current assets/total assets) 2 (Current assets-cash/total assets) 26

27 3 Ενεργητικό/δάνεια (Current assets/loans) 4 Επιφυλάξεις/δάνεια (Reserves/loans) 5 Καθαρό εισόδημα/συνολικά προτερήματα (Net income/total assets) 6 Καθαρό εισόδημα/συνολικό κεφάλαιο δικαιοσύνης (Net income/total equity capital) 7 Καθαρό εισόδημα/δάνεια (Net income/loans) 8 Κόστος των πωλήσεων/πωλήσεις (Cost of sales/sales) 9 Ταμειακή ροή/δάνεια (Cash flow/loans) Στοιχεία των αμερικανικών τραπεζών 1 Κεφάλαιο κίνησης/συνολικά προτερήματα (Working capital/total assets) 2 Διατηρημένες αποδοχές/συνολικά προτερήματα (Retained earnings/total assets) 3 Αποδοχές πριν από τους φόρους/τα συνολικά προτερήματα (Earnings before interest and taxes/total assets) 4 (Market value of equity/total assets) 5 Πωλήσεις/συνολικά προτερήματα (Sales/total assets) Συμπέρασμα: -Τα αποτελέσματα δείχνουν πως το DEWNN ξεπερνά τους άλλους αλγορίθμους. - Το DEWNN είναι ένας αποτελεσματικός αλγόριθμος για τα προβλήματα ταξινόμησης που εμφανίζονται στην χρηματοδότηση. - Η παρούσα έρευνα καταλήγει στο συμπέρασμα ότι η κατάρτιση WNN με την διαφορική εξέλιξη (DE) λύνει τα προβλήματα ταξινόμησης με την αυξανόμενη ακρίβεια. Εργασία 10. A selective ensemble based on expected probabilities for bankruptcy prediction. Σε αυτό το έγγραφο, προτείνεται ένα σύνολο τριών ταξινομητών, the Decision Tree, the Back propagation neural network, BPN και the support vector machine, SVM. Με βάση τις αναμενόμενες πιθανότητες της πτώχευσης και της μη-πτώχευσης, αυτό το σύνολο παρέχει μια προσέγγιση που κληρονομεί τα πλεονεκτήματα και αποφεύγει τα μειονεκτήματα των διαφορετικών τεχνικών ταξινόμησης. Μέθοδοι: α) Decision trees Ένα δέντρο απόφασης καταχωρεί μερικούς κανόνες ταξινόμησης στους κόμβους κλάδων προκειμένου να ομαδοποιηθούν τα παρόμοια δείγματα στους ίδιους κόμβους φύλλων. Επομένως, ένα δέντρο απόφασης είναι μια τεχνική ταξινόμηση ή πρόβλεψη. Υπάρχουν πολλοί αλγόριθμοι των δέντρων αποφάσεων. Η βασική διαφορά τους είναι ο τρόπος να αποφασιστεί η ακολουθία ιδιοτήτων που πρέπει να χρησιμοποιηθεί για κάθε κόμβο κλάδων. ID3 (Quinlan, 1986) είναι ένας διάσημος αλγόριθμος δέντρων απόφασης, ο οποίος χρησιμοποιεί το κέρδος πληροφοριών για την επιλογή της ακολουθίας ιδιοτήτων. C4.5 (Quinlan, 27

28 1993) είναι μια εκτεταμένη έκδοση ID3, η οποία χρησιμοποιεί αναλογία κέρδους αντί του κέρδους πληροφοριών για να αποφύγει αυτό το πρόβλημα. An example of decision tree. β) Artificial neural networks(ann). ANNs έχουν χρησιμοποιηθεί ευρέως για πολλές στοιχειώδεις εργασίες ταξινόμησης και πρόβλεψης όπως η αξιολόγηση επιχειρησιακού κινδύνου, η πρόβλεψη πτώχευσης, η πρόβλεψη τιμών αποθεμάτων κ.λπ...) An example of ANN. γ) Support vector machine (SVM). Χρησιμοποιείται κυρίως για τις δυαδικές στοιχειώδεις εργασίες ταξινόμησης. Το SVM έχει γίνει ένα από τα δημοφιλέστερα μοντέλα ταξινόμησης λόγω της καλής εκτέλεσής του στα μεγάλα διαστήματα χαρακτηριστικών γνωρισμάτων. 28

29 An example of SVM. Η έννοια της αναμενόμενης πιθανότητας. Υπάρχουν δύο κατευθύνσεις πρόβλεψης για κάθε ταξινομητή πτώχευσης, δηλ. ένας για την πτώχευση και άλλη για την μη-πτώχευση. Η ακρίβεια (CA) ταξινόμησης χρησιμοποιείται συνήθως ως κριτήριο απόδοσης. Περιγράφουμε το CA (ακρίβεια ταξινόμησης) ως εξής: A δείχνουμε τον αριθμό μη-χρεοκοπημένων επιχειρήσεων που προβλέπονται επίσης ως μη-χρεοκοπημένες επιχειρήσεις, B δείχνει τον αριθμό μη-χρεοκοπημένων επιχειρήσεων που προβλέπονται ως χρεοκοπημένες επιχειρήσεις, C δείχνει τον αριθμό χρεοκοπημένων επιχειρήσεων που προβλέπονται ως μη-χρεοκοπημένες επιχειρήσεις. D δείχνει τον αριθμό χρεοκοπημένων επιχειρήσεων που προβλέπονται επίσης ως χρεοκοπημένες επιχειρήσεις. Καθορίζουμε την ακρίβεια ταξινόμησης ενός ταξινομητή, CA model, ως (1), της ακρίβειας ταξινόμησης για τις χρεοκοπημένες επιχειρήσεις, CAbankruptcy, ως (2) και ακρίβεια ταξινόμησης για τις μη-χρεοκοπημένες επιχειρήσεις, CA μη-πτώχευση, ως (3) (1) CA model = A + D A+B+C+D (1) (2) CAbankruptcy= D C+D (2) (3) CA μη-πτώχευση= A A+B (3) Pbankruptcy = D B+A Pnon-bankruptcy = A A+C 29

30 Το προτεινόμενο εκλεκτικό σύνολο. (The proposed selective ensemble) Αυτό το έγγραφο ενσωματώνει την έννοια του εκλεκτικού συνόλου με την αναμενόμενη πιθανότητα προκειμένου να κατακτηθεί το παραδοσιακό δίλημμα για το συνδυασμό των διαφορετικών ταξινομητών. Γίνεται τακτοποίηση της ακολουθίας ταξινομητών σε ένα δέντρο απόφασης βασισμένο στην αναμενόμενη πιθανότητα κάθε ταξινομητή. Ο ταξινομητής Α έχει τη μέγιστη αναμενόμενη πιθανότητα για την μη-πτώχευση και αυτός ο ταξινομητής είναι ο κορυφαίος κόμβος του δέντρου συνόλων. An example of selective ensemble tree Πειραματικό σχέδιο. Περιγραφή του συνόλου στοιχείων Σε αυτό το έγγραφο χρησιμοποιείται το σύνολο στοιχείων Wieslaw (Wieslaw, 2004) Περιέχει 30 οικονομικές αναλογίες από 56 πτωχεύσασες επιχειρήσεις και 64 μηπτωχεύσασες επιχειρήσεις μεταξύ 1997 και Κάθε επιχείρηση παρέχει δύο συνεχή ετήσια στοιχεία έτσι υπάρχουν 240 δείγματα στο σύνολο. Wieslaw dataset X01 cash/current liabilities X02 cash/total assets X03 current assets/current liabilities X04 current assets/total assets X05 working capital/total assets 30

31 X06 working capital/sales X07 sales/inventory X08 sales/receivables X09 net profit/total assets X10 net profit/current assets X11 net profit/sales X12 gross profit/sales X13 net profit/liabilities X14 net profit/equity X15 net profit/(equity + long term liabilities) X16 sales/receivables X17 sales/total assets X18 sales/current assets X19 (365 * receivables)/sales X20 sales/total assets X21 liabilities/total income X22 current liabilities/total income X23 receivables/liabilities X24 net profit/sales X25 liabilities/total assets X26 liabilities/equity X27 long term liabilities/equity X28 current liabilities/equity X29 EBIT (earnings before interests and taxes)/total assets X30 current assets/sales Υπάρχουν πολλοί αλγόριθμοι δέντρων απόφασης. Χρησιμοποιούμε το J4.8, το οποίο είναι μια τροποποίηση της C4.5. Για την τεχνική του SVM, χρησιμοποιούμε το διαδοχικό ελάχιστο αλγόριθμο βελτιστοποίησης (SMO= sequential minimal optimization). Για ANN, χρησιμοποιούμε το BPN= back propagation neural networks και γίνεται χρήση του 10-fold cross-validation. Σύμφωνα με τον αλγόριθμό μας, υπολογίζουμε αρχικά όλες τις αναμενόμενες πιθανότητες για J4.8, SVM και BPN όπως φαίνεται παρακάτω. Η μέγιστη αναμενόμενη πιθανότητα είναι P non-πτώχευση για J4.8 και έτσι είναι ο πρώτος κόμβος κλάδων του δέντρου συνόλων. J4.8 (%) BPN (%) SVM (%) Pbankruptcy Pnon-bankruptcy

32 The selective ensemble tree using the Wieslaw data set. 4. ΑΞΙΟΛΟΓΗΣΗ - ΣΥΓΚΡΙΣΗ Η εταιρική οικονομική πρόβλεψη αποτυχίας είναι κρίσιμης σπουδαιότητας τόσο για τους διευθυντές όσο και για τα άτομα που σχετίζονται ακόμα και έμμεσα με την συγκεκριμένη τράπεζα ή επιχείρηση. Στη λογοτεχνία, πολλές έρευνες έχουν εστιάσει στις οικονομικές αναλογίες των εταιριών για την πρόβλεψη αποτυχίας. Είναι αξιοσημείωτο ότι από κάθε εργασία προκύπτει και μια μέθοδος που θεωρείται η καλύτερη για την πρόβλεψη πτώχευσης της επιχείρησης ή της τράπεζας. Παρακάτω γίνεται σύγκριση και αξιολόγηση όλων των παραπάνω άρθρων. Τι επιχειρήσεις αφορούν; PAPERS Τράπεζες Επιχειρήσεις ή Εταιρείες Πίστωση μιας χώρας Από την ανάλυση των παραπάνω papers προκύπτουν χρήσιμες πληροφορίες οι οποίες αφορούν την χρονική περίοδο στην οποία αναφέρεται το κάθε paper καθώς και για την χώρα από την οποία προέρχονται τα δεδομένα που χρησιμοποιήθηκαν στις έρευνες. Συγκεκριμένα, όσον αφορά τις Τράπεζες: Ένα paper εξετάζει την πορεία των Ισπανικών και των Τούρκικων Τραπεζών. Ένα άλλο paper ασχολείται με το πρόβλημα πρόβλεψης αποτυχίας Τραπεζών σε μια Τούρκικη περίπτωση το χρονικό 32

33 διάστημα Τέλος, ένα άλλο paper ασχολείται με τα σύνολα στοιχείων πτώχευσης Αμερικάνικων, Τούρκικων καθώς και Ισπανικών Τραπεζών. Όσον αφορά τα papers που ασχολούνται με τα προβλήματα πτώχευσης των τραπεζών μπορούμε να βγάλουμε το συμπέρασμα ότι και στις 3 περιπτώσεις εκτός των άλλων γίνεται αναφορά στις Τράπεζες της Τουρκίας. Αναλύοντας τα papers που ασχολήθηκαν με επιχειρήσεις και εταιρείες έχουμε τα εξής: Ένα paper αναλύει ένα πείραμα για το οποίο χρησιμοποιήθηκαν τα ετήσια οικονομικά στοιχεία που συλλέχθηκαν από το Ταμείο πιστωτικών Εγγυήσεων της Κορέας (Korea Credit Guarantee Fund). Τα στοιχεία αποτελούνται από 900 χρεοκοπημένες εταιρείες και 900 μη-χρεοκοποημένες την περίοδο Ένα άλλο paper μελετά την ικανότητα πρόβλεψης της επιχειρησιακής αποτυχίας παίρνοντας στοιχεία από 118 Ελληνικές επιχειρήσεις την περίοδο Το συνολικό σύνολο 118 περιπτώσεων, αποτελείται από 2 άνισα υποσύνολα, ένα που αντιπροσωπεύει το σύνολο κατάρτισης (training set) (80 περιπτώσεις) και άλλο το εξεταστικό σύνολο (testing data set) (38 περιπτώσεις). Τέλος έχουμε ένα paper που αναλύει μια περίπτωση η οποία αναφέρεται σε 56 πτωχεύσασες επιχειρήσεις και 64 μη πτωχεύσασες επιχειρήσεις μεταξύ Η ιδιαιτερότητα της μελέτης που αναφέρει το άρθρο αυτό είναι ότι κάθε επιχείρηση παρέχει 2 συνεχή ετήσια στοιχεία, έτσι υπάρχουν 240 δείγματα στο σύνολο. Ένα πολύ σημαντικό συμπέρασμα όσον αφορά τις επιχειρήσεις είναι ότι μόνο σε μια περίπτωση τα σύνολα των παρατηρήσεων έχουν ίσο αριθμό χρεοκοπημένων και μη χρεοκοπημένων εταιρειών. Στις άλλες δυο περιπτώσεις τα σύνολα είναι άνισα. Τέλος στα papers που γίνεται αναφορά στην πιστωτική κατάσταση μιας χώρας έχουμε τα εξής: και τα 2 papers ασχολούνται με την Αυστραλιανή, την Γερμανική και την Ιαπωνική πίστωση. Μοντέλα, μέθοδοι που χρησιμοποιούνται. MODELS PAPERS Neural Networks 5 Decision Trees 3 Hybrid 1 Support Vector Machines (SVM) 5 MDA (πολλών μεταβλητών 4 διανυσματικές μέθοδοι) Logistic Regression 2 MLP(Multilayer perceptron) 2 PCNN (Principal component neural 1 network) DE (Differential evolution algorithm) 33

34 WNN (Wavelet neural network) DEWNN (Differential evolution trained wavelet neural network) 1 Αξίζει να σημειωθεί ότι τα δημοφιλέστερα μοντέλα είναι τα Neural Networks και τα Decision Trees. Αυτό όμως δεν σημαίνει ότι τα υπόλοιπα είναι λιγότερο καλύτερα ως προς το αποτέλεσμα καλύτερης επίτευξης πρόβλεψης πτώχευσης. Ποιο είναι το ερευνητικό ζητούμενο; Σύγκριση διαφόρων μεθόδων για την πρόβλεψη πτώχευσης. Προτείνεται σύνολο ταξινομητών ή γίνεται συνδυασμός ταξινομητών Προτείνεται μια μέθοδος για την πρόβλεψη πτώχευσης εταιρίας ή τράπεζας. PAPERS Ο παραπάνω πίνακας δείχνει ότι για να βρεθεί ο καλύτερος τρόπος πρόβλεψης πτώχευσης οι περισσότερες έρευνες είτε κάνουν σύγκριση μιας συγκεκριμένης μεθόδου με πολλές είτε γίνεται συνδυασμός πολλών ταξινομητών. Τέλος μπορούμε να αναφερθούμε στην 10 fold cross validation η οποία χρησιμοποιείται σε πολλές μελέτες. Στην μέθοδο επικύρωσης 10 τμημάτων (10 fold cross validation) το δείγμα διαιρείται σε 10 υποσύνολα. Κάθε υποσύνολο περιέχει διαφορετικές παρατηρήσεις. Η επιλογή των υποσυνόλων είναι τυχαία. Ένα από τα υποσύνολα χρησιμοποιείται ως σύνολο επικύρωσης και τα υποσύνολα 9 συνενώνονται και δημιουργούν το δείγμα εκπαίδευσης. Το μοντέλο εκπαιδεύεται χρησιμοποιώντας το δείγμα εκπαίδευσης και δοκιμάζεται έναντι του δείγματος επικύρωσης. Η διαδικασία επαναλαμβάνεται 10 φορές, κάθε φορά χρησιμοποιώντας ένα διαφορετικό σύνολο ως σύνολο επικύρωσης και τα υπόλοιπα εννέα ως σύνολο εκπαίδευσης. Στο τέλος υπολογίζεται η μέση επίδοση του μοντέλου. Η μέθοδος μπορεί να διαφοροποιηθεί ως προς το πλήθος των τμημάτων. 34

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΠΜΣ στην Αναλογιστική Επιστήμη και Διοικητική Κινδύνου. Πιστωτικός Κίνδυνος. Διάλεξη 3: Υποδείγματα πιστωτικού κινδύνου,

ΠΜΣ στην Αναλογιστική Επιστήμη και Διοικητική Κινδύνου. Πιστωτικός Κίνδυνος. Διάλεξη 3: Υποδείγματα πιστωτικού κινδύνου, ΠΜΣ στην Αναλογιστική Επιστήμη και Διοικητική Κινδύνου Πιστωτικός Κίνδυνος Διάλεξη 3: Υποδείγματα πιστωτικού κινδύνου, Credit score models and structural models Μιχάλης Ανθρωπέλος anthropel@unipigr http://webxrhunipigr/faculty/anthropelos

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Διακριτικές Συναρτήσεις

Διακριτικές Συναρτήσεις Διακριτικές Συναρτήσεις Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Θερµικός χάρτης των XYZ ξενοδοχείων σε σχέση µε τη γεωγραφική περιοχή τους P. Adamopoulos New

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

Λογιστική & Χρηματοοικονομικά

Λογιστική & Χρηματοοικονομικά ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Λογιστική & Χρηματοοικονομικά Δημήτριος Αγγελόπουλος, Υποψήφιος Διδάκτωρ ΕΜΠ Ιωάννης Ψαρράς, Καθηγητής ΕΜΠ Παίγνια Αποφάσεων

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε.

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε. ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε. Άδειες Χρήσης Το

Διαβάστε περισσότερα

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΔΙΕΥΘΥΝΣΗ ΑΝΩΤΕΡΗΣ ΚΑΙ ΑΝΩΤΑΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΥΠΗΡΕΣΙΑ ΕΞΕΤΑΣΕΩΝ ΠΑΓΚΥΠΡΙΕΣ ΕΞΕΤΑΣΕΙΣ 2010

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΔΙΕΥΘΥΝΣΗ ΑΝΩΤΕΡΗΣ ΚΑΙ ΑΝΩΤΑΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΥΠΗΡΕΣΙΑ ΕΞΕΤΑΣΕΩΝ ΠΑΓΚΥΠΡΙΕΣ ΕΞΕΤΑΣΕΙΣ 2010 ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΔΙΕΥΘΥΝΣΗ ΑΝΩΤΕΡΗΣ ΚΑΙ ΑΝΩΤΑΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΥΠΗΡΕΣΙΑ ΕΞΕΤΑΣΕΩΝ ΠΑΓΚΥΠΡΙΕΣ ΕΞΕΤΑΣΕΙΣ 2010 ΤΕΧΝΟΛΟΓΙΑ Ι ΤΕΧΝΙΚΩΝ ΣΧΟΛΩΝ ΠΡΑΚΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Μάθημα: ΛΟΓΙΣΤΙΚΗ Ημερομηνία

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 2 ο : Βασικές έννοιες Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Γλωσσική Τεχνολογία, Μάθημα 2 ο, Βασικές

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων. Διαλέξεις 15-16

HMY 795: Αναγνώριση Προτύπων. Διαλέξεις 15-16 HMY 795: Αναγνώριση Προτύπων Διαλέξεις 15-16 Νευρωνικά Δίκτυα(Neural Networks) Fisher s linear discriminant: Μείωση διαστάσεων (dimensionality reduction) y Τ =w x s + s =w S w 2 2 Τ 1 2 W ( ) 2 2 ( ) m2

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1)

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1) ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1) 1 Προέλευση και ιστορία της Επιχειρησιακής Έρευνας Αλλαγές στις επιχειρήσεις Τέλος του 19ου αιώνα: βιομηχανική

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΠΡΟΕΠΙΣΚΟΠΗΣΗ ΚΑΙ ΕΞΕΡΕΥΝΗΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Τα προς επεξεργασία

Διαβάστε περισσότερα

Stabilization of stock price prediction by cross entropy optimization

Stabilization of stock price prediction by cross entropy optimization ,,,,,,,, Stabilization of stock prediction by cross entropy optimization Kazuki Miura, Hideitsu Hino and Noboru Murata Prediction of series data is a long standing important problem Especially, prediction

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διδάσκων: Γεώργιος Μήτσης, Λέκτορας, Τμήμα ΗΜΜΥ Γραφείο: GP401 Ώρες γραφείου: Οποτεδήποτε (κατόπιν επικοινωνίας) Τηλ: 22892239 Ηλ. Ταχ.: gmitsis@ucy.ac.cy Βιβλιογραφία C. M.

Διαβάστε περισσότερα

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ DATA MINING ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ 1 ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ Αφού δεν γνωρίζουμε κάποιο τρόπο για να επιλέξουμε εκ των προτέρων την πιο κατάλληλη και αποδοτική μέθοδο μάθησης

Διαβάστε περισσότερα

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας

Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα

Διαβάστε περισσότερα

Το Πολυεπίπεδο Perceptron. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Το Πολυεπίπεδο Perceptron. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Το Πολυ Perceptron Δίκτυα Πρόσθιας Τροφοδότησης (feedforward) Tο αντίστοιχο γράφημα του δικτύου δεν περιλαμβάνει κύκλους: δεν υπάρχει δηλαδή ανατροφοδότηση της εξόδου ενός νευρώνα προς τους νευρώνες από

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ Ε Θ Ν Ι Κ Ο Μ Ε Τ Σ Ο Β Ι Ο Π Ο Λ Υ Τ Ε Χ Ν Ε Ι Ο ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ & ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ:

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΧΟΥΧΟΥΜΗΣ ΙΩΑΝΝΗΣ Το σύνολο των

Διαβάστε περισσότερα

ΚΑΤΗΓΟΡΙΕΣ ΤΑΞΙΝΟΜΗΣΗΣ

ΚΑΤΗΓΟΡΙΕΣ ΤΑΞΙΝΟΜΗΣΗΣ ΚΑΤΗΓΟΡΙΕΣ ΤΑΞΙΝΟΜΗΣΗΣ Κατευθυνόμενη ταξινόμηση (supervsed cassfcaton) Μη-κατευθυνόμενη ταξινόμηση (unsupervsed cassfcaton) Γραμμική: Lnear Dscrmnant Anayss Μη- Γραμμική: Νευρωνικά δίκτυα κλπ. Ιεραρχική

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 1 M = 1 N = N prob k N k { k n ω wrongly classfed} = (1 ) N k 2 Η συνάρτηση πιθανοφάνειας L(p) μεγιστοποιείται όταν =k/n. 3 Αφού τα s είναι άγνωστα,

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΕΤΑΙΡΕΙΑ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΕΠΙΣΤΗΜΗΣ ERSA

ΕΛΛΗΝΙΚΗ ΕΤΑΙΡΕΙΑ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΕΠΙΣΤΗΜΗΣ ERSA ΕΛΛΗΝΙΚΗ ΕΤΑΙΡΕΙΑ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΕΠΙΣΤΗΜΗΣ ERSA ΜΕΛΟΣ ΤΗΣ ΔΙΕΘΝΟΥΣ ΚΑΙ ΕΥΡΩΠΑΪΚΗΣ ΕΤΑΙΡΕΙΑΣ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΕΠΙΣΤΗΜΗΣ (RSAI, ERSA) Οικονομική Κρίση και Πολιτικές Ανάπτυξης και Συνοχής 10ο Τακτικό Επιστημονικό

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑ ΚΑΡΑΘΕΟΔΩΡΗΣ 2008

ΠΡΟΓΡΑΜΜΑ ΚΑΡΑΘΕΟΔΩΡΗΣ 2008 ΠΡΟΓΡΑΜΜΑ ΚΑΡΑΘΕΟΔΩΡΗΣ 2008 ΤΙΤΛΟΣ ΕΡΓΟΥ: "Μελέτη της χρηματοοικονομικής αποτύπωσης περιβαλλοντικών πληροφοριών, της περιβαλλοντικής διαχείρισης, επίδοσης και αποτελεσματικότητας των ελληνικών επιχειρήσεων"

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΦΟΡΩΝ

ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΦΟΡΩΝ ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΦΟΡΩΝ Ενότητα 4: Time and Frequency Analysis Διδάσκων: Γεώργιος Στεφανίδης Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών Σκοποί ενότητας Για την περιγραφή ενός συστήματος κρίσιμο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Version 2 1 ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Πρόκειται για μια οικογένεια μη γραμμικών ταξινομητών Είναι συστήματα απόφασης πολλών σταδίων (multistage),

Διαβάστε περισσότερα

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner 10. Text Mining Για να μπορέσουμε να χρησιμοποιήσουμε τις δυνατότητες text mining του Rapid Miner πρέπει να εγκαταστήσουμε το Text Mining Extension. Πηγαίνουμε Help Updates and Extensions (Marketplace)

Διαβάστε περισσότερα

Διδάσκουσα: Χάλκου Χαρά,

Διδάσκουσα: Χάλκου Χαρά, Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr Επιβλεπόμενοι Μη Επιβλεπόμενοι Ομάδα Κατηγορία Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ

ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 18 ου Πανελληνίου Συνεδρίου Στατιστικής (2005) σελ.247-256 ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ ΣΥΜΠΤΩΣΕΩΝ

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται δύο κριτήρια απόρριψης απομακρυσμένων από τη μέση τιμή πειραματικών μετρήσεων ενός φυσικού μεγέθους και συγκεκριμένα

Διαβάστε περισσότερα

ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ

ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ Φεβρουάριος 2015 1 Table of Contents ΔΙΟΙΚΗΤΙΚΗ ΠΕΡΙΛΗΨΗ... 3 1. ΕΙΣΑΓΩΓΗ... 4 2. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΜΟΝΤΕΛΩΝ... 4 2.1 ΔΕΔΟΜΕΝΑ... 4 2.1.1

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

ΓΕΩΡΓΙΑ ΚΑΙ ΑΛΙΕΙΑ AGRICULTURE AND FISHING

ΓΕΩΡΓΙΑ ΚΑΙ ΑΛΙΕΙΑ AGRICULTURE AND FISHING ΤΜΗΜΑ B.Ι - SECTION B.Ι ΓΕΩΡΓΙΑ ΚΑΙ ΑΛΙΕΙΑ AGRICULTURE AND FISHING Κλάδοι / Sectors Περιγραφή NACE / NACE description Κωδικός / Code Επιχειρήσεις / Companies Γεωργία και Aλιεία Γεωργία, θήρα και δασοκομία.

Διαβάστε περισσότερα

news τη θέση της εταιρείας σας . Μεγαλύτερο Επιχειρηματικό Οδηγό & by ICAP Group εταιρει μ α από το και ιλικ για περαιτ ρ εταιρει

news τη θέση της εταιρείας σας . Μεγαλύτερο Επιχειρηματικό Οδηγό &  by ICAP Group εταιρει μ α από το και ιλικ για περαιτ ρ εταιρει τη θέση της εταιρείας σας ρο ολ τ προ ό τ πηρε ι α ε ε ειδικε μ α λ η ολογι μ κλ δ εταιρει μ α από το ρο λ. επιχειρ ε ε χ ρε Επε εργ ιμε λ τε εταιρει για περαιτ ρ α λ η και μεγαλύτερη τόχε η αχε α και

Διαβάστε περισσότερα

Predicting the Choice of Contraceptive Method using Classification

Predicting the Choice of Contraceptive Method using Classification ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΣΣΑΛΟΝΙΚΗ Predicting the Choice of Contraceptive Method using Classification ΠΑΠΑΔΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Νικόλαος Σαμαράς ΕΞΕΤΑΣΤΗΣ:

Διαβάστε περισσότερα

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ Ιωάννα Τζουλάκη Κώστας Τσιλίδης Ιωαννίδης: κεφάλαιο 2 Guyatt: κεφάλαιο 18 ΕΠΙςΤΗΜΟΝΙΚΗ ΙΑΤΡΙΚΗ Επιστήμη (θεωρία) Πράξη (φροντίδα υγείας) Γνωστικό μέρος Αιτιό-γνωση Διά-γνωση Πρό-γνωση

Διαβάστε περισσότερα

Ο Ι ΚΟ Ν Ο Μ Ι Κ Α / Σ ΤΑΤ Ι Σ Τ Ι Κ Η

Ο Ι ΚΟ Ν Ο Μ Ι Κ Α / Σ ΤΑΤ Ι Σ Τ Ι Κ Η Ο Ι ΚΟ Ν Ο Μ Ι Κ Α / Σ ΤΑΤ Ι Σ Τ Ι Κ Η Σ χ ε τ ι κ ά μ ε τ ι ς ε κ τ ι μ ή σ ε ι ς - σ υ ν ο π τ ι κ ά Σεμινάριο Εκτιμήσεων Ακίνητης Περιουσίας, ΣΠΜΕ, 2018 ΣΤΑΤΙΣΤΙΚΗ Σ Χ Ε Τ Ι Κ Α Μ Ε Τ Ι Σ Ε Κ Τ Ι Μ

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Κατηγοριοποίηση. 3 ο Φροντιστήριο. Ε Ξ Ό Ρ Υ Ξ Η Δ Ε Δ Ο Μ Έ Ν Ω Ν Κ Α Ι Α Λ Γ Ό Ρ Ι Θ Μ Ο Ι Μ Ά Θ Η Σ Η ς. Σκούρα Αγγελική

Κατηγοριοποίηση. 3 ο Φροντιστήριο. Ε Ξ Ό Ρ Υ Ξ Η Δ Ε Δ Ο Μ Έ Ν Ω Ν Κ Α Ι Α Λ Γ Ό Ρ Ι Θ Μ Ο Ι Μ Ά Θ Η Σ Η ς. Σκούρα Αγγελική Κατηγοριοποίηση Ε Ξ Ό Ρ Υ Ξ Η Δ Ε Δ Ο Μ Έ Ν Ω Ν Κ Α Ι Α Λ Γ Ό Ρ Ι Θ Μ Ο Ι Μ Ά Θ Η Σ Η ς 3 ο Φροντιστήριο Σκούρα Αγγελική skoura@ceid.upatras.gr Κατηγοριοποίηση (Classification) Σκοπός: Learn a method for

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην Ταξινόμηση Καρκινικών Δεδομένων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην Ταξινόμηση Καρκινικών Δεδομένων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Πολυτεχνείο Κρήτης Τμήμα Ηλεκτρονικών Μηχανικών και Μηχανικών Ηλεκτρονικών Υπολογιστών Τομέας Τηλεπικοινωνιών Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην

Διαβάστε περισσότερα

ΠΑΡΑΡΤΗΜΑ III ΒΑΣΙΚΟΙ ΑΡΙΘΜΟΔΕΙΚΤΕΣ ΚΑΙ ΤΡΟΠΟΣ ΥΠΟΛΟΓΙΣΜΟΥ ΤΟΥΣ ΦΕΡΕΓΓΥΟΤΗΤΑ (SOLVENCY)

ΠΑΡΑΡΤΗΜΑ III ΒΑΣΙΚΟΙ ΑΡΙΘΜΟΔΕΙΚΤΕΣ ΚΑΙ ΤΡΟΠΟΣ ΥΠΟΛΟΓΙΣΜΟΥ ΤΟΥΣ ΦΕΡΕΓΓΥΟΤΗΤΑ (SOLVENCY) ΠΑΡΑΡΤΗΜΑ III ΒΑΣΙΚΟΙ ΑΡΙΘΜΟΔΕΙΚΤΕΣ ΚΑΙ ΤΡΟΠΟΣ ΥΠΟΛΟΓΙΣΜΟΥ ΤΟΥΣ ΔΕΙΚΤΕΣ ΥΠΟΛΟΓΙΣΜΟΣ ΦΕΡΕΓΓΥΟΤΗΤΑ (SOLVENCY) ΒΡΑΧΥΧΡΟΝΙΑ ΦΕΡΕΓΓΥΟΤΗΤΑ (SHORT TERM SOLVENCY) ΡΕΥΣΤΟΤΗΤΑ (Liquidity) Kυκλοφοριακό Ενεργητικό

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Πειραματικό σχέδιο και ANOVA Η βασική διαφορά μεταξύ των πειραματικών σχεδίων είναι ο τρόπος με τον οποίο ταξινομούνται ή κατατάσσονται οι πειραματικές μονάδες (πειραματικά τεμάχια) Σε όλα τα σχέδια

Διαβάστε περισσότερα

Μοντέλα εκτίμησης επενδύσεων. Κριτήρια επενδύσεων. Μοντέλα εκτίμησης επενδύσεων

Μοντέλα εκτίμησης επενδύσεων. Κριτήρια επενδύσεων. Μοντέλα εκτίμησης επενδύσεων Μοντέλα εκτίμησης επενδύσεων Κριτήρια επενδύσεων Accounting rate of return Economic Value Added (EVA) Payback Net Present Value (NPV) Internal Rate of Return (IRR) Profitability Index (PI) 2 Μοντέλα εκτίμησης

Διαβάστε περισσότερα

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016 Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016 Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος Η παρούσα εργασία έγινε στα πλαίσια της εκπόνησης της διπλωματικής διατριβής

Διαβάστε περισσότερα

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο Copyright 2009 Cengage Learning 15.1 Ένα Κοινό Θέμα Τι πρέπει να γίνει; Τύπος Δεδομένων; Πλήθος Κατηγοριών; Στατιστική Μέθοδος; Περιγραφή ενός πληθυσμού Ονομαστικά Δύο ή

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΗ ΠΡΟΒΛΕΨΗΣ ΕΤΑΙΡΙΚΗΣ ΠΤΩΧΕΥΣΗΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΕΛΕΓΚΤΙΚΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΠΕΡΙ «ΣΥΝΕΧΙΣΗΣ ΔΡΑΣΤΗΡΙΟΤΗΤΑΣ»

ΕΦΑΡΜΟΓΗ ΠΡΟΒΛΕΨΗΣ ΕΤΑΙΡΙΚΗΣ ΠΤΩΧΕΥΣΗΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΕΛΕΓΚΤΙΚΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΠΕΡΙ «ΣΥΝΕΧΙΣΗΣ ΔΡΑΣΤΗΡΙΟΤΗΤΑΣ» ΕΦΑΡΜΟΓΗ ΠΡΟΒΛΕΨΗΣ ΕΤΑΙΡΙΚΗΣ ΠΤΩΧΕΥΣΗΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΕΛΕΓΚΤΙΚΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΠΕΡΙ «ΣΥΝΕΧΙΣΗΣ ΔΡΑΣΤΗΡΙΟΤΗΤΑΣ» Δημήτριος Γ. Γκλούμπος Επιβλέπων Καθηγητής: Ευστράτιος Λιβάνης ΠΜΣ Εφαρμοσμένης Λογιστικής

Διαβάστε περισσότερα

On line αλγόριθμοι δρομολόγησης για στοχαστικά δίκτυα σε πραγματικό χρόνο

On line αλγόριθμοι δρομολόγησης για στοχαστικά δίκτυα σε πραγματικό χρόνο On line αλγόριθμοι δρομολόγησης για στοχαστικά δίκτυα σε πραγματικό χρόνο Υπ. Διδάκτωρ : Ευαγγελία Χρυσοχόου Επιβλέπων Καθηγητής: Αθανάσιος Ζηλιασκόπουλος Τμήμα Μηχανολόγων Μηχανικών Περιεχόμενα Εισαγωγή

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ. Στατιστική????? Κάθε μέρα ερχόμαστε σε επαφή 24/02/2018

ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ. Στατιστική????? Κάθε μέρα ερχόμαστε σε επαφή 24/02/2018 ΣΤΑΤΙΣΤΙΚΕΣ ΕΝΝΟΙΕΣ Αντώνης Κ. Τραυλός (B.A., M.A., Ph.D.) Καθηγητής ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ Σχολή Επιστημών Ανθρώπινης Κίνησης και Ποιότητας Ζωής Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού Στατιστική?????

Διαβάστε περισσότερα

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. 3 η ΠΑΡΟΥΣΙΑΣΗ. Ι. Δημόπουλος Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών. ΤΕΙ Πελοποννήσου

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. 3 η ΠΑΡΟΥΣΙΑΣΗ. Ι. Δημόπουλος Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών. ΤΕΙ Πελοποννήσου ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ 3 η ΠΑΡΟΥΣΙΑΣΗ Ι. Δημόπουλος Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών. ΤΕΙ Πελοποννήσου Συλλογή δεδομένων Πρωτογενή δεδομένα Εργαστηριακές μετρήσεις Παρατήρηση Παρατήρηση με συμμετοχή,

Διαβάστε περισσότερα

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (# 252) Ε ΕΞΑΜΗΝΟ 9 η ΕΙΣΗΓΗΣΗ ΣΗΜΕΙΩΣΕΙΣ ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ ΛΙΓΗ ΘΕΩΡΙΑ Στην προηγούμενη διάλεξη μάθαμε ότι υπάρχουν διάφορες μορφές έρευνας

Διαβάστε περισσότερα

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Η συνολική εικόνα Τοπικές Βάσεις Βάσεις Κεντρικών Συστημάτων Βάσεις Τρίτων Ποιοτική Αναβάθμιση δεδομένων Λογισμικό Επικοινωνιών DATA WAREHOUSE Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Warehouse

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

Σχεδιασμός και Διεξαγωγή Πειραμάτων

Σχεδιασμός και Διεξαγωγή Πειραμάτων Σχεδιασμός και Διεξαγωγή Πειραμάτων Πρώτο στάδιο: λειτουργικοί ορισμοί της ανεξάρτητης και της εξαρτημένης μεταβλητής Επιλογή της ανεξάρτητης μεταβλητής Επιλέγουμε μια ανεξάρτητη μεταβλητή (ΑΜ), την οποία

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM Μάθηση χωρίς επίβλεψη (unsupervised learning) Σύνολο εκπαίδευσης D={(x n )}, n=1,,n. x n =(x n1,, x nd ) T, δεν υπάρχουν τιμές-στόχοι t n. Προβλήματα μάθησης χωρίς

Διαβάστε περισσότερα

ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΑΥΤΩΝ ΣΠΟΥΔΑΣΤΕΣ : ΖΩΡΗΣ ΝΙΚΟΛΑΟΣ ΚΑΤΣΙΝΟΥΛΑΣ ΝΙΚΟΛΑΟΣ

ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΑΥΤΩΝ ΣΠΟΥΔΑΣΤΕΣ : ΖΩΡΗΣ ΝΙΚΟΛΑΟΣ ΚΑΤΣΙΝΟΥΛΑΣ ΝΙΚΟΛΑΟΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΑΥΤΩΝ ΣΠΟΥΔΑΣΤΕΣ : ΖΩΡΗΣ ΝΙΚΟΛΑΟΣ ΚΑΤΣΙΝΟΥΛΑΣ ΝΙΚΟΛΑΟΣ ΤΕΧΝΗΤΑ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΟΡΙΣΜΟΣ : Ένα νευρωνικό δίκτυο είναι ένας μαζικά παράλληλος διανεμημένος επεξεργαστής που

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική

Κατηγοριοποίηση. Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης. 2 ο Φροντιστήριο. Σκούρα Αγγελική Κατηγοριοποίηση Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης 2 ο Φροντιστήριο Σκούρα Αγγελική skoura@ceid.upatras.gr Μηχανική Μάθηση Η μηχανική μάθηση είναι μια περιοχή της τεχνητής νοημοσύνης η οποία αφορά

Διαβάστε περισσότερα

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Αναπαράσταση των δεδομένων ως διανύσματα χαρακτηριστικών (feature vectors): Επιλογή ενός

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Χ 2 test ανεξαρτησίας: σχέση 2 ποιοτικών μεταβλητών

Διαβάστε περισσότερα

ΣΥΣΤΗΜΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΑΕΡΟΣΩΜΑΤΙ ΙΑΚΗΣ ΡΥΠΑΝΣΗΣ ΣΕ ΣΧΕ ΟΝ ΠΡΑΓΜΑΤΙΚΟ ΧΡΟΝΟ

ΣΥΣΤΗΜΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΑΕΡΟΣΩΜΑΤΙ ΙΑΚΗΣ ΡΥΠΑΝΣΗΣ ΣΕ ΣΧΕ ΟΝ ΠΡΑΓΜΑΤΙΚΟ ΧΡΟΝΟ ΣΥΣΤΗΜΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΑΕΡΟΣΩΜΑΤΙ ΙΑΚΗΣ ΡΥΠΑΝΣΗΣ ΣΕ ΣΧΕ ΟΝ ΠΡΑΓΜΑΤΙΚΟ ΧΡΟΝΟ ΠΑΡΑ ΟΤΕΟ 9 ΠΛΑΤΦΟΡΜΑ ΥΠΟΛΟΓΙΣΜΟΥ ΑΕΡΟΣΩΜΑΤΙ ΙΑΚΗΣ ΡΥΠΑΝΣΗΣ Συγγραφείς: ημήτρης Παρώνης, Αδριανός Ρετάλης, Φίλιππος Τύμβιος,

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΜΕΤΑΔΟΣΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΛΙΚΩΝ Εξαγωγή χαρακτηριστικών μαστογραφικών μαζών και σύγκριση

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά Μάιος 2008 Τα δεδομένα που έχουμε προς επεξεργασία χωρίζονται σε τρία μέρη: 1. Τα δεδομένα εκπαίδευσης (training set) που αποτελούνται από 2528

Διαβάστε περισσότερα

Στάδιο Εκτέλεσης

Στάδιο Εκτέλεσης 16 ΚΕΦΑΛΑΙΟ 1Ο 1.4.2.2 Στάδιο Εκτέλεσης Το στάδιο της εκτέλεσης μίας έρευνας αποτελεί αυτό ακριβώς που υπονοεί η ονομασία του. Δηλαδή, περιλαμβάνει όλες εκείνες τις ενέργειες από τη στιγμή που η έρευνα

Διαβάστε περισσότερα

Ζητήματα ηήμ με τα δεδομένα

Ζητήματα ηήμ με τα δεδομένα Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών

Διαβάστε περισσότερα

Υπολογιστική Νοημοσύνη. Μάθημα 9: Γενίκευση

Υπολογιστική Νοημοσύνη. Μάθημα 9: Γενίκευση Υπολογιστική Νοημοσύνη Μάθημα 9: Γενίκευση Υπερπροσαρμογή (Overfitting) Ένα από τα βασικά προβλήματα που μπορεί να εμφανιστεί κατά την εκπαίδευση νευρωνικών δικτύων είναι αυτό της υπερβολικής εκπαίδευσης.

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Διαχωριστικές συναρτήσεις Ταξινόμηση κανονικών

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων. ΠΕΡΙΛΗΨΗ Η τεχνική αυτή έκθεση περιλαµβάνει αναλυτική περιγραφή των εναλλακτικών µεθόδων πολυκριτηριακής ανάλυσης που εξετάσθηκαν µε στόχο να επιλεγεί η µέθοδος εκείνη η οποία είναι η πιο κατάλληλη για

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Bayesian decision Minimum misclassificaxon rate decision: διαλέγουμε την κατηγορία Ck για

Διαβάστε περισσότερα

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M. 09470015 AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Διδάσκων: Γιώργος Τζιραλής ΔΠΜΣ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Στάδιο 1 ο. Προεπισκόπηση-προεπεξεργασία δεδομένων: Δίδονται τα παρακάτω

Διαβάστε περισσότερα

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 : Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 : 1. Να χρησιμοποιηθεί το αρχείο gssft.sav για να γίνει έλεγχος της υπόθεσης ότι στους εργαζόμενους με πλήρη απασχόληση η τιμή του μέσου

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

Νευρωνικά ίκτυα και Εξελικτικός

Νευρωνικά ίκτυα και Εξελικτικός Νευρωνικά ίκτυα και Εξελικτικός Προγραµµατισµός Σηµερινό Μάθηµα RBF (Radial Basis Functions) δίκτυα Παρεµβολή συνάρτησης Θεώρηµα Cover ιαχωρισµός προτύπων Υβριδική Εκµάθηση Σύγκριση µε MLP Εφαρµογή: Αναγνώριση

Διαβάστε περισσότερα

Μοντέλο Perceptron πολλών στρωμάτων Multi Layer Perceptron (MLP)

Μοντέλο Perceptron πολλών στρωμάτων Multi Layer Perceptron (MLP) Μοντέλο Perceptron πολλών στρωμάτων Multi Layer Perceptron (MLP) x -0,5 a x x 2 0 0 0 0 - -0,5 y y 0 0 x 2 -,5 a 2 θ η τιμή κατωφλίου Μία λύση του προβλήματος XOR Multi Layer Perceptron (MLP) x -0,5 Μία

Διαβάστε περισσότερα

(Σύμφωνα με τα ιεθνή Πρότυπα Χρηματοοικονομικής αναφοράς που έχουν εγκριθεί από την Ευρωπαϊκή Ένωση)

(Σύμφωνα με τα ιεθνή Πρότυπα Χρηματοοικονομικής αναφοράς που έχουν εγκριθεί από την Ευρωπαϊκή Ένωση) Ετήσια Οικονομική Έκθεση χρήσης από 1 ης Ιανουαρίου 2014 έως 31 ης Δεκεμβρίου 2014 (Σύμφωνα με τα ιεθνή Πρότυπα Χρηματοοικονομικής αναφοράς που έχουν εγκριθεί από την Ευρωπαϊκή Ένωση) «ΜΕΤΡΟΛΟΓΙΑ ΕΛΛΑΣ

Διαβάστε περισσότερα