ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης"

Transcript

1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης «Αναγνώριση μερών του λόγου σε ελληνικά κείμενα με τεχνικές ενεργητικής μάθησης» Πρόδρομος Μαλακασιώτης Επιβλέπων: Ίων Ανδρουτσόπουλος ΑΘΗΝΑ, ΙΟΥΝΙΟΣ 2005

2 ΠΕΡΙΕΧΟΜΕΝΑ 1 Εισαγωγή Αντικείμενο και στόχοι της εργασίας Διάρθρωση της εργασίας Ευχαριστίες Μηχανική Μάθηση (Machine Learning) Εισαγωγή Επιβλεπόμενη Μάθηση (Supervised Learning) Ο αλγόριθμος των k κοντινότερων γειτόνων (k-nn) Η βασική ιδέα Μέτρο επικάλυψης (Overlap metric) Τροποποιημένο μέτρο διαφοράς τιμών Πληροφοριακό κέρδος Ζυγισμένη ψήφος με βάση την απόσταση (Distance-weighted class voting) Αντιμετώπιση ισοπαλιών (tie breaking) Διασταυρωμένη επικύρωση Αναγνώριση μερών του λόγου Εισαγωγή Προηγούμενες προσεγγίσεις στην αναγνώριση μερών του λόγου Μάθηση στηριζόμενη σε κανόνες μετασχηματισμού οδηγούμενη από σφάλματα (transformation-based error-driven learning TBED ) Κρυφά μοντέλα Markov Συστήματα μέγιστης εντροπίας Εκμάθηση με αποθήκευση στη μνήμη (memory-based learning) Άλλες προσεγγίσεις Πειράματα για την ελληνική γλώσσα Αναγνώριση μερών του λόγου με ενεργητική μάθηση Ενεργητική Μάθηση Δειγματοληψία βασισμένη στην αβεβαιότητα (Uncertainty based sampling)... 26

3 4.1.2 Επερώτηση με Επιτροπή (Query by Committee) Επιλογή παραδειγμάτων κοντά στην επιφάνεια διαχωρισμού Κριτήρια τερματισμού Αναθεώρηση της έννοιας της ενεργητικής μάθησης Εισαγωγή ο στάδιο ενεργητικής μάθησης (εύρεση λαθών στην επισημείωση) Βασική ιδέα Ο αλγόριθμος Παραδείγματα ο στάδιο ενεργητικής μάθησης (συμβολή του συστήματος στην εύρεση ιδιοτήτων) Βασική ιδέα Παράδειγμα ο στάδιο ενεργητικής μάθησης (επιλογή των «καλύτερων» παραδειγμάτων) Πειραματική αξιολόγηση και αποτελέσματα Σώμα κειμένων Το σύνολο των ετικετών Πειράματα με ενεργητική μάθηση Πειράματα με το 3 ο στάδιο ενεργητικής μάθησης Πειράματα με παθητική μάθηση Πειράματα με το 2 ο και 3 ο στάδιο ενεργητικής μάθησης Αποτελέσματα Συμπεράσματα μελλοντική έρευνα Ανασκόπηση της εργασίας και συμπεράσματα Μελλοντικές επεκτάσεις ΠΑΡΑΡΤΗΜΑ I: Το σύνολο των ετικετών ΠΑΡΑΡΤΗΜΑ II: Θέματα υλοποίησης Βιβλιογραφία

4 Περίληψη Η διπλωματική αυτή εργασία έχει ως στόχο να μελετήσει τη συμβολή της ενεργητικής μάθησης στο πρόβλημα της αναγνώρισης μερών του λόγου (part of speech tagging), μια περιοχή της επεξεργασίας φυσικής γλώσσας στην οποία οι τεχνικές της ενεργητικής μάθησης δεν έχουν αξιοποιηθεί ως τώρα επαρκώς. Η εργασία επικεντρώθηκε στην αναγνώριση μερών του λόγου σε ελληνικά κείμενα. Χρησιμοποιήθηκαν και προτάθηκαν νέες τεχνικές ενεργητικής μάθησης και μετρήθηκε η αποτελεσματικότητά τους. Πιο συγκεκριμένα, επαναπροσδιορίστηκε η έννοια της ενεργητικής μάθησης, η οποία χωρίστηκε σε τρία στάδια. Σε κάθε στάδιο υλοποιήθηκαν ήδη υπάρχουσες αλλά και νέες τεχνικές και μετρήθηκε πειραματικά η αποτελεσματικότητά τους. Τα πειράματα περιελάμβαναν χειρωνακτική επισημείωση ενός σώματος ελληνικών ειδησεογραφικών κειμένων συνολικού μεγέθους λέξεων, διαχωρισμό τους σε σώμα εκπαίδευσης (15300 λέξεις) και σώμα ελέγχου (5074 λέξεις) και εφαρμογή των τριών σταδίων ενεργητικής μάθησης σε συνδυασμό με τον αλγόριθμο κατάταξης των k κοντινότερων γειτόνων. Αν και δεν επιτεύχθηκαν ιδιαίτερα υψηλά ποσοστά ορθότητας (περίπου 80%), τα αποτελέσματα είναι ενθαρρυντικά, καθώς δείχνουν τη θετική συμβολή της ενεργητικής μάθησης, συμπεριλαμβανομένων των νέων τεχνικών που προτείνουμε. Θα πρέπει να σημειωθεί, επίσης, ότι χρησιμοποιήθηκε ένα ιδιαίτερα μεγάλο σύνολο ετικετών για την επισημείωση των λέξεων (112 ετικέτες), κάτι που κάνει το πρόβλημα κατάταξης που είχαμε να αντιμετωπίσουμε ιδιαίτερα δύσκολο. Τέλος, αξίζει να σημειωθεί ότι οι τεχνικές ενεργητικής μάθησης οι οποίες χρησιμοποιήθηκαν μπορούν εύκολα να εφαρμοστούν και σε άλλα προβλήματα της επεξεργασίας φυσικής γλώσσας. 2

5 1 Εισαγωγή 1.1 Αντικείμενο και στόχοι της εργασίας Με τον όρο «αναγνώριση μερών του λόγου» (part of speech tagging) εννοούμε τη διαδικασία αντιστοίχισης μοναδικής ετικέτας (tag) σε κάθε λέξη ενός συνόλου κειμένων, ώστε η ετικέτα να παριστάνει το μέρος του λόγου στο οποίο ανήκει η λέξη. Η αναγνώριση μερών του λόγου αποτελεί μέρος του ευρύτερου σταδίου της μορφολογικής ανάλυσης κειμένων και χρησιμοποιείται σε πολλά συστήματα επεξεργασίας φυσικής γλώσσας. Είναι μία ενδιαφέρουσα περιοχή τόσο από πρακτικής όσο και από ερευνητικής πλευράς. Ιδιαίτερο ερευνητικό ενδιαφέρον παρουσιάζει η περίπτωση χρήσης τεχνικών μηχανικής μάθησης, ιδιαίτερα ενεργητικής μάθησης, κατά την οποία το ίδιο το σύστημα συμμετέχει στην επιλογή των παραδειγμάτων εκπαίδευσής του. Αξίζει να σημειωθεί ότι η πλειοψηφία των συστημάτων αναγνώρισης μερών του λόγου χρησιμοποιεί ήδη μηχανική μάθηση αλλά οι τεχνικές ενεργητικής μάθησης δεν έχουν ακόμα αξιοποιηθεί επαρκώς στην περιοχή αυτή. Αν και η δημιουργία ενός πολύ καλού συστήματος αναγνώρισης μερών του λόγου έχει εξέχουσα σημασία, λόγω των πολλών εφαρμογών στις οποίες μπορεί να χρησιμοποιηθεί, ο στόχος της παρούσης εργασίας είναι περισσότερο ερευνητικός. Άλλωστε υπάρχει μία πληθώρα πολύ καλών συστημάτων, κυρίως για τα Αγγλικά, τα οποία ήδη χρησιμοποιούνται. Πιο συγκεκριμένα, η εργασία μελετά το αν και κατά πόσο η ενεργητική μάθηση μπορεί να βελτιώσει τα αποτελέσματα ενός συστήματος αναγνώρισης μερών του λόγου. Η εργασία προτείνει μια ευρύτερη θεώρηση του ρόλου της ενεργητικής μάθησης, όπου ο ρόλος του συστήματος δεν περιορίζεται στον εντοπισμό νέων παραδειγμάτων εκπαίδευσης αλλά περιλαμβάνει και τον εντοπισμό λαθών επισημείωσης στα υπάρχοντα παραδείγματα εκπαίδευσης και τη συμμετοχή του στην ανεύρεση κατάλληλων ιδιοτήτων. Για κάθε ένα από τα τρία αυτά στάδια, η εργασία χρησιμοποιεί υπάρχουσες αλλά και νέες μεθόδους και μελετά πειραματικά την απόδοσή τους. 3

6 Αξίζει να σημειωθεί ότι οι μέθοδοι ενεργητικής μάθησης της εργασίας μπορούν να εφαρμοστούν και σε άλλα προβλήματα επεξεργασίας φυσικής γλώσσας. Τέλος, παρ όλο που η εργασία εστιάζεται στην αναγνώριση μερών του λόγου σε ελληνικά κείμενα, όλες οι τεχνικές που προτείνονται μπορούν εύκολα να εφαρμοστούν και σε άλλες γλώσσες. 1.2 Διάρθρωση της εργασίας Το υπόλοιπο της εργασίας είναι διαρθρωμένο ως εξής: Το κεφάλαιο 2 αναφέρεται στη μηχανική μάθηση. Πιο συγκεκριμένα περιέχει εκτεταμένη ανάλυση του αλγορίθμου k-nn, ο οποίος αλγόριθμος μηχανικής μάθησης που χρησιμοποιήθηκε είναι ο Στο κεφάλαιο 3 περιγράφεται αναλυτικότερα το πρόβλημα της αναγνώρισης μερών του λόγου, ενώ γίνεται και μία επισκόπηση των σημαντικότερων προσεγγίσεων που έχουν προταθεί στην περιοχή. Το κεφάλαιο 4 περιγράφει τη διαδικασία της ενεργητικής μάθησης και παρουσιάζει τις σημαντικότερες μεθόδους που έχουν προταθεί γι αυτή, καθώς και τη δική μας προσέγγιση. Το κεφάλαιο 5 περιγράφει την πειραματική διαδικασία και παρουσιάζει τα αποτελέσματά της. Τέλος στο κεφάλαιο 6 γίνεται αξιολόγηση της εργασίας και παρουσιάζονται θέματα για πιθανή μελλοντική έρευνα. 1.3 Ευχαριστίες Αρχικά θα ήθελα να εκφράσω τις ευχαριστίες μου στον επιβλέποντα καθηγητή μου, κ. Ίωνα Ανδρουτσόπουλο, για τις ουσιαστικές κατευθύνσεις και πολύτιμες συμβουλές που μου έδωσε κατά τη διάρκεια της εκπόνησης της διπλωματικής μου εργασίας, καθώς και τον κ. Θεόδωρο Καλαμπούκη, που 4

7 αποδέχθηκε το ρόλο του δεύτερου αξιολογητή. Επιπλέον, θα ήθελα να ευχαριστήσω το Γιώργο Λουκαρέλλι για τα ειδησεογραφικά κείμενα που μου παρείχε σε μορφή HTML, καθώς και για τις ουσιαστικές συζητήσεις τις οποίες κάναμε πάνω στα θέματα των εργασιών μας. Τέλος, θα ήταν παράλειψη να μην ευχαριστήσω τον Κώστα Στρογγυλό για την εφαρμογή αφαίρεσης ετικετών HTML που μου διέθεσε και για τις πολύτιμες συμβουλές του σε θέματα υλοποίησης και συγγραφής κώδικα. 5

8 2 Μηχανική Μάθηση (Machine Learning) 2.1 Εισαγωγή Η Μηχανική Μάθηση αποτελεί έναν από τους παλαιότερους και σημαντικότερους τομείς έρευνας της Τεχνητής Νοημοσύνης. Στόχος της είναι η δημιουργία συστημάτων που να είναι σε θέση να διδάσκονται από προηγούμενα εμπειρικά δεδομένα, ώστε να εκτελούν την εργασία για την οποία προορίζονται αποτελεσματικότερα. Η διαδικασία εκμάθησης αποτελείται από τα παρακάτω στάδια Απόκτηση εμπειρικών δεδομένων από την αλληλεπίδραση με το περιβάλλον. Επεξεργασία των δεδομένων, ούτως ώστε να βρεθούν πιθανές γενικεύσεις ή εξειδικεύσεις. Χρησιμοποίηση των αποτελεσμάτων της επεξεργασίας και λήψη ανατροφοδότησης από το περιβάλλον, έτσι ώστε να βελτιωθεί περαιτέρω το σύστημα. 2.2 Επιβλεπόμενη Μάθηση (Supervised Learning) Μία κατηγορία μηχανικής μάθησης είναι η Επιβλεπόμενη Μάθηση. Ένα σύστημα που χρησιμοποιεί επιβλεπόμενη μάθηση αρχικά εκπαιδεύεται σε ένα σύνολο παραδειγμάτων εκπαίδευσης τα οποία συνοδεύονται και από τις κατηγορίες στις οποίες ανήκουν. Για παράδειγμα ένα σύστημα παραγωγής ιατρικών διαγνώσεων θα είχε ως παραδείγματα εκπαίδευσης ιατρικές εξετάσεις συνοδευόμενες από τις ορθές διαγνώσεις. Από την εκπαίδευση προκύπτει ένα μοντέλο των κατηγοριών, το οποίο στη συνέχεια χρησιμοποιείται για να κατατάξει νέες περιπτώσεις των οποίων δεν είναι γνωστή η κατηγορία. Ένα παράδειγμα επιβλεπόμενης μάθησης είναι η μάθηση που χρησιμοποιεί αποθήκευση στη μνήμη (ενότητα 3.2.4). Υπάρχουν πολλοί γνωστοί αλγόριθμοι επιβλεπόμενης μηχανικής μάθησης, όπως ο αλγόριθμος των k κοντινότερων 6

9 γειτόνων (k-nearest Neighbours, k-nn), ο Naïve Bayes, ο ID3 κ.τ.λ. ([Mi97]). Εμείς όμως θα περιοριστούμε στην παρουσίαση των αλγορίθμων που χρησιμοποιούνται στη εργασία. Ο βασικός τρόπος εκπαίδευσης και αξιολόγησης ενός συστήματος επιβλεπόμενης μάθησης περιγράφεται παρακάτω. Αρχικά πρέπει να οριστούν δύο σύνολα από αντικείμενα: το σύνολο εκπαίδευσης και το σύνολο ελέγχου. Τα αντικείμενα των συνόλων αυτών πρέπει να έχουν καταταγεί χειρωνακτικά σε δύο η περισσότερες κατηγορίες. Στην περίπτωση που εξετάζουμε σε αυτή την εργασία, η τομή των κατηγοριών ανά δύο πρέπει να είναι κενή. Δε μπορεί δηλαδή ένα αντικείμενο να καταταγεί σε περισσότερες από μία κατηγορίες. Επιπλέον πρέπει να οριστεί και ένα σύνολο ιδιοτήτων. Κάθε αντικείμενο των συνόλων εκπαίδευσης και ελέγχου αναπαρίσταται από ένα διάνυσμα, κάθε συντεταγμένη του οποίου αποτελεί την τιμή μίας συγκεκριμένης ιδιότητας. Ο αλγόριθμος εκπαιδεύεται στα αντικείμενα του συνόλου εκπαίδευσης και έτσι δημιουργείται ένα ταξινομητής, η ορθότητα του οποίου αξιολογείται στο σύνολο ελέγχου, συγκρίνοντας τις αποφάσεις του ταξινομητή με τις σωστές κατηγορίες Ο αλγόριθμος των k κοντινότερων γειτόνων (k-nn) Η βασική ιδέα Η βασική ιδέα του k-nn είναι ότι κατά τη διάρκεια της εκπαίδευσης ο αλγόριθμος απλά αποθηκεύει τα διανύσματα των αντικειμένων του συνόλου εκπαίδευσης. Στη συνέχεια για κάθε αντικείμενο του συνόλου ελέγχου υπολογίζεται η απόσταση του διανύσματός του από τα διανύσματα όλων των αντικειμένων του συνόλου εκπαίδευσης. Τέλος επιλέγονται τα k αντικείμενα εκπαίδευσης που έχουν τις μικρότερες αποστάσεις από το εξεταζόμενο αντικείμενο, το οποίο κατατάσσεται στην κατηγορία που πλειοψηφεί μεταξύ των k γειτόνων. 7

10 Σημαντικό ρόλο για την καλύτερη απόδοση του αλγορίθμου παίζει και η επιλογή της τιμής του k. Συνήθως, μία τιμή μεταξύ του 5 και του 10 δίνει πολύ καλά αποτελέσματα για δεδομένα με λίγες διαστάσεις, ενώ μία καλή τεχνική για τον καθορισμό του k είναι η διασταυρωμένη επικύρωση (ενότητα 2.3). Για την εύρεση των k κοντινότερων γειτόνων ενός εξεταζόμενου αντικειμένου πρέπει να ορισθεί κατάλληλα ένα μέτρο απόστασης. Φυσικά ο κάθε χρήστης μπορεί να προσθέσει τα δικά του μέτρα απόστασης, ανάλογα με το είδος του εργασίας που θέλει να επιτελέσει. Πολύ σημαντικό πλεονέκτημα του k-nn αποτελεί το γεγονός ότι μπορεί να μάθει κάθε είδους συνάρτηση και δεν περιορίζεται, για παράδειγμα, μόνο σε γραμμικούς διαχωριστές. Τα παραπάνω, σε συνδυασμό με την απλότητα του αλγορίθμου, τον καθιστούν έναν από τους πιο σημαντικούς δημοφιλείς αλγορίθμους μηχανικής μάθησης Μέτρο επικάλυψης (Overlap metric) Το πιο σύνηθες μέτρο που χρησιμοποιείται για τον προσδιορισμό της απόστασης αντικειμένων είναι το μέτρο επικάλυψης που περιγράφεται από τις Δ X r, Y r είναι η απόσταση μεταξύ των σχέσεις 2.1 και 2.2. Στις σχέσεις αυτές ( ) αντικειμένων X r και Y r, που το καθένα έχει n ιδιότητες, ενώ ( x, ) δ είναι η απόσταση ανά ιδιότητα. Η απόσταση μεταξύ δύο αντικειμένων είναι απλά το άθροισμα των διαφορών ανάμεσα στις ιδιότητες. Ο αλγόριθμος που χρησιμοποιεί το συγκεκριμένο μέτρο είναι η απλούστερη μορφή του k-nn και είναι γνωστός στους χρήστες του TiMBL (βλ. παράρτημα II) ως IB1 ([AhKi91]). i y i Δ r r n ( X, Y ) = δ (, ) i= 1 x i y i (2.1) 8

11 xi yi abs αν αριθμητικές τιμές, διαφορετικά max i min i δ ( xi, yi ) = 0 αν xi = yi (2.2) 1 αν xi yr Τροποποιημένο μέτρο διαφοράς τιμών Το μέτρο επικάλυψης έχει το μειονέκτημα ότι περιορίζεται σε ακριβές ταίριασμα μεταξύ των τιμών των συμβολικών ιδιοτήτων. Αυτό σημαίνει ότι όλες οι δυνατές τιμές που μπορεί να πάρει μία συμβολική ιδιότητα θεωρείται ότι διαφέρουν το ίδιο μεταξύ τους. Εν τούτοις, υπάρχουν περιπτώσεις όπου αυτό δεν ισχύει. Για το σκοπό αυτό οι Stanfill και Waltz όρισαν ένα μέτρο ([StWa86]) το οποίο βελτιώθηκε περαιτέρω από τους Cost και Salzberg ([CoSa93]). Το μέτρο αυτό ονομάζεται τροποποιημένο μέτρο διαφοράς τιμών (Modified Value Difference Metric (MVDM)) και περιγράφεται από τη σχέση 2.3. Η σχέση αυτή μπορεί να χρησιμοποιηθεί και για αριθμητικές ιδιότητες, αλλά σε πολλές υλοποιήσεις (και στο TiMBL) χρησιμοποιείται για αυτές το μέτρο επικάλυψης (σχέση 2.2) m ( v, v ) = P( C v ) P( C v ) δ (2.3) 1 2 i 1 i 2 i= 1 Στην ουσία το μέτρο αυτό παρέχει έναν τρόπο προσδιορισμού της ομοιότητας των τιμών μίας ιδιότητας εξετάζοντας τη συνύπαρξη των τιμών αυτών με τις κατηγορίες. Δηλαδή προσπαθεί να υπολογίσει την επίπτωση που έχει στην πρόβλεψη της κατηγορίας το γεγονός ότι το ένα αντικείμενο έχει τιμή για την ιδιότητα v 1 ενώ το άλλο v 2. Όταν χρησιμοποιείται το μέτρο επικάλυψης της προηγούμενης ενότητας με συμβολικές (μη αριθμητικές) ιδιότητες, η απόσταση μετριέται ως το άθροισμα των ιδιοτήτων στις οποίες τα αντικείμενα έχουν διαφορετικές τιμές. Αυτό συχνά κάνει πολλά παραδείγματα εκπαίδευσης να φαίνεται ότι 9

12 ισαπέχουν από το υπό κατάταξη αντικείμενο. Εντούτοις, σε κάποια από αυτά τα παραδείγματα εκπαίδευσης οι διαφορές στις τιμές των ιδιοτήτων από το υπό κατάταξη αντικείμενο μπορεί να είναι πιο σημαντικές από ό,τι σε άλλα. Με το MVDM, οι αποστάσεις αντανακλούν καλύτερα τις ουσιώδεις διαφορές μεταξύ των αντικειμένων. Έτσι είναι πιο δύσκολο να βρεθούν πολλά παραδείγματα εκπαίδευσης στην ίδια απόσταση από το υπό κατάταξη αντικείμενο, κάτι που κάνει ευκολότερη την επιλογή των k κοντινότερων γειτόνων Πληροφοριακό κέρδος Το μέτρο απόστασης της σχέσης 2.1 δίνει ίση βαρύτητα σε όλες τις ιδιότητες. Αυτή η επιλογή είναι λογική αν όλες οι ιδιότητες είναι εξίσου σημαντικές. Διαφορετικά μπορούμε να ορίσουμε βάρη για τις ιδιότητες, τα οποία θα υποδηλώνουν το πόσο χρήσιμες είναι οι διάφορες ιδιότητες για την πρόβλεψη της κατηγορίας στην οποία πρέπει να καταταγεί ένα νέο αντικείμενο. Η Θεωρία Πληροφορίας μας παρέχει ένα τέτοιου είδους εργαλείο, το πληροφοριακό κέρδος ([Qu86]). Το πληροφοριακό κέρδος (information gain) εξετάζει κάθε ιδιότητα ξεχωριστά και μετράει πόση πληροφορία συνεισφέρει στη γνώση τη σωστής κατηγορίας. Το πληροφοριακό κέρδος της i-οστής ιδιότητας μετριέται υπολογίζοντας την αναμενόμενη μείωση της αβεβαιότητας για τη σωστή κατηγορία που προκαλεί η γνώση της τιμής της ιδιότητας (σχέση 2.4). ( C) P( v) H ( C v) w = H i v V i (2.4) Στη σχέση 2.4 με C συμβολίζουμε το σύνολο των κατηγοριών, με V i το σύνολο των τιμών της i-οστής ιδιότητας, ενώ H ( C) είναι η εντροπία των κατηγοριών και H ( C v) η εντροπία των κατηγοριών αν η τιμή της ιδιότητας είναι v (σχέσεις 2.5, 2.6). 10

13 ( C) = P( c) P( c) H 2 c C ( C v) = P( c v) log P( c v) c C log (2.5) H 2 (2.6) Οι πιθανότητες υπολογίζονται από τις σχετικές συχνότητες στο σύνολο εκπαίδευσης. Για ιδιότητες με αριθμητικές τιμές, πρέπει να γίνει ένα ενδιάμεσο βήμα καθώς είναι δύσκολο να εκτιμηθούν οι πιθανότητες για όλες τις δυνατές αριθμητικές τιμές. Για κάθε μία αριθμητική ιδιότητα, τα παραδείγματα εκπαίδευσης τοποθετούνται στον άξονα των πραγματικών αριθμών, σύμφωνα με τις τιμές που έχουν στη συγκεκριμένη ιδιότητα. Στη συνέχεια ο άξονας των πραγματικών αριθμών διαχωρίζεται σε διαστήματα (προεπιλεγμένη τιμή στο TiMBL, 20) κάθε ένα από τα οποία περιέχει τον ίδιο αριθμό παραδειγμάτων εκπαίδευσης (προεπιλεγμένη τιμή στο TiMBL, 1/20 του συνολικού αριθμού των παραδειγμάτων εκπαίδευσης). Στη συνέχεια, τα παραδείγματα εκπαίδευσης σε κάθε ένα από αυτά τα διαστήματα χρησιμοποιούνται στον υπολογισμό του πληροφοριακού κέρδους σαν να έχουν όλα την ίδια τιμή. Αυτός ο διαχωρισμός είναι μόνο προσωρινός και δε χρησιμοποιείται στον υπολογισμό του μέτρου απόστασης. Ένα από τα μειονεκτήματα του πληροφοριακού κέρδους είναι ότι έχει την τάση να υπερεκτιμά τη σημαντικότητα των ιδιοτήτων που έχουν μεγάλο πλήθος τιμών. Τέτοιου είδους ιδιότητες έχουν πολύ μεγάλο πληροφοριακό κέρδος αλλά δεν προσφέρουν καμία γενίκευση στα νέα αντικείμενα. Έστω για παράδειγμα ότι σε ένα σύστημα εξαγωγής ιατρικών διαγνώσεων έχουμε ως ιδιότητα τον κωδικό του ασθενή. Η τιμή της ιδιότητας αυτής είναι ξεχωριστή για κάθε παράδειγμα εκπαίδευσης και συνεπώς έχει μεγάλο πληροφοριακό κέρδος αφού φαίνεται να προβλέπει πλήρως τη διάγνωση. Στην ουσία όμως ο κωδικός του ασθενή δεν παρέχει καμία σημαντική πληροφορία σε μελλοντικές περιπτώσεις. Το παραπάνω πρόβλημα εμφανίζεται κυρίως όταν χρησιμοποιούμε ιδιότητες που χαρακτηρίζουν μονοσήμαντα τα αντικείμενα 11

14 εκπαίδευσης (ιδιότητες κλειδιά). Για την αντιμετώπιση τέτοιων περιπτώσεων ο Quinlan ([Qu93]) εισήγαγε μία κανονικοποιημένη έκδοση του πληροφοριακού κέρδους, η οποία ονομάζεται αναλογία κέρδους (Gain Ratio), και υπολογίζεται ως ο λόγος του πληροφοριακού κέρδους διά την εντροπία των τιμών της ιδιότητας ( si () i, σχέσεις 2.6, 2.7). w i = H ( C) P( v) H ( C v) v V i si() i () i = P( v) P( v) v V i (2.6) si log (2.7) 2 Οι τιμές που προκύπτουν από τον υπολογισμό είτε του πληροφοριακού κέρδους είτε της αναλογίας κέρδους μπορούν να χρησιμοποιηθούν ως βάρη κατά τον υπολογισμό του μέτρου απόστασης, όπως φαίνεται στη σχέση 2.8. Ο αλγόριθμος k-nn που χρησιμοποιεί αυτό το μέτρο απόστασης ονομάζεται στο TiMBL IB1-IG ([DaBo92]). Δ r r n ( X, Y ) = w δ ( x, y ) i= 1 i i i (2.8) Η δυνατότητα του αυτόματου προσδιορισμού των βαρών των ιδιοτήτων μάς επιτρέπει να προσθέτουμε στο σύνολο ιδιοτήτων ιδιότητες που δεν είμαστε βέβαιοι για τη χρησιμότητά τους, καθώς το πληροφοριακό κέρδος θα μετριάσει πολύ τη συνεισφορά τους στη συνολική απόσταση αν δεν είναι χρήσιμες. Εν τούτοις, αυτή δεν είναι απαραίτητα η ενδεδειγμένη στρατηγική, καθώς αν έχουμε πολλές «περιττές» ιδιότητες επιβαρύνονται άσκοπα οι υπολογισμοί των αποστάσεων που απαιτούνται κατά την κατάταξη νέων αντικειμένων Ζυγισμένη ψήφος με βάση την απόσταση (Distance-weighted class voting) Η πιο συνηθισμένη μέθοδος ψηφοφορίας των k κοντινότερων γειτόνων για να αποφασίσουν την κατηγορία ενός νέου αντικειμένου είναι η μέθοδος 12

15 της πλειοψηφίας, κατά την οποία η ψήφος κάθε γείτονα έχει την ίδια βαρύτητα. Το νέο αντικείμενο κατατάσσεται στην κατηγορία που θα πάρει τις περισσότερες ψήφους. Μία επέκταση της παραπάνω διαδικασίας ψηφοφορίας είναι η ψηφοφορία κατά την οποία η ψήφος κάθε γείτονα έχει διαφορετική βαρύτητα ανάλογα με το πόσο απέχει ο γείτονας αυτός από το νέο αντικείμενο. Αυτό είναι λογικό καθώς οι κοντινοί γείτονες μοιάζουν περισσότερο με το νέο αντικείμενο από ό,τι οι μακρινοί. Ένα μέτρο βαρύτητας που εξυπηρετεί το σκοπό αυτό είναι το «βάρος αντίστροφης απόστασης» (inverse distance weight) που προτάθηκε από τον Dudani ([Du76]) και περιγράφεται στη σχέση 2.9. Στον παρονομαστή της σχέσης αυτής συνήθως προστίθεται μία σταθερά για να αποφευχθεί η διαίρεση με το μηδέν ([We94]). w i 1, αν d 0 (2.9) d = j j Αντιμετώπιση ισοπαλιών (tie breaking) Όταν χρησιμοποιείται η μέθοδος της πλειοψηφίας, είναι πολύ πιθανό να υπάρξουν ισοπαλίες μεταξύ δύο ή περισσοτέρων κατηγοριών. Το φαινόμενο αυτό είναι εντονότερο όταν δε χρησιμοποιούνται ζυγισμένες ψήφοι. Για παράδειγμα αν έχουμε ένα σύνολο δέκα κοντινότερων γειτόνων, μπορεί πέντε να ψηφίσουν για την κατηγορία Α και πέντε για την κατηγορία Β. Μία μέθοδος, η οποία χρησιμοποιείται στο TiMBL, για την αντιμετώπιση του προβλήματος είναι η ακόλουθη. Αρχικά, αυξάνεται το k κατά ένα και διενεργείται νέα ψηφοφορία από το καινούριο σύνολο κοντινότερων γειτόνων. Αν η ισοπαλία παραμένει, επιλέγεται από τις υποψήφιες κατηγορίες αυτή με τα περισσότερες εμφανίσεις στο σύνολο εκπαίδευσης. Αν υπάρχουν περισσότερες από μία τέτοιες κατηγορίες, τότε επιλέγεται τυχαία μία από αυτές. Εναλλακτικά, η αντιμετώπιση ισοπαλιών μπορεί να γίνει με τυχαία επιλογή από τις ισόπαλες κατηγορίες, φροντίζοντας, όμως, κάθε κατηγορία να έχει πιθανότητα επιλογής ανάλογη της συχνότητάς της στο σύνολο 13

16 εκπαίδευσης. Τέλος στην περίπτωση που έχουμε μόνο δύο κατηγορίες μπορούμε απλά να επιλέξουμε περιττή τιμή για το k, οπότε δε θα υπάρξουν ποτέ ισοπαλίες. 2.3 Διασταυρωμένη επικύρωση Ένας τρόπος για να ελέγξουμε την αποτελεσματικότητα ενός συστήματος που χρησιμοποιεί μηχανική μάθηση είναι η διασταυρωμένη επικύρωση (cross validation). Η διαδικασία αυτή μπορεί να χρησιμοποιηθεί για οποιονδήποτε αλγόριθμο εκπαίδευσης και η εκτέλεσή της γίνεται ως εξής. Το σύνολο των δεδομένων διαχωρίζεται σε k ισάριθμα τμήματα και ο αλγόριθμος εκπαιδεύεται σε k-1 από αυτά. Η αποτελεσματικότητα του ταξινομητή που δημιουργείται ελέγχεται με το εναπομείναν τμήμα των δεδομένων. Συνολικά διενεργούνται k πειράματα αφήνοντας κάθε φορά διαφορετικό τμήμα έξω από τα δεδομένα εκπαίδευσης. Στο τέλος υπολογίζεται ο μέσος όρος των αποτελεσμάτων που προέκυψαν από τα k πειράματα. Οι πιο δημοφιλείς τιμές για το k είναι το 5 και το 10 οπότε έχουμε αντίστοιχα πενταπλή και δεκαπλή διασταυρωμένη επικύρωση (5-fold, 10-fold cross validation). 14

17 3 Αναγνώριση μερών του λόγου 3.1 Εισαγωγή Ένα από τα σημαντικότερα στάδια της μορφολογικής ανάλυσης κειμένων, είναι η «Αναγνώριση Μερών του Λόγου» (part of speech tagging). Πιο συγκεκριμένα, δεδομένου ενός συνόλου κειμένων και ενός συνόλου ετικετών (κατηγοριών) που παριστάνουν τα μέρη του λόγου (ουσιαστικό, ρήμα, άρθρο, κλπ.), ένα σύστημα αναγνώρισης μερών του λόγου πρέπει να αντιστοιχίσει κάθε λέξη του συνόλου κειμένων σε μία και μόνο κατηγορία του συνόλου ετικετών. Σε πολλές περιπτώσεις οι ετικέτες δεν αντιστοιχούν απλά στα μέρη του λόγου αλλά υποδηλώνουν και διάφορα μορφολογικά χαρακτηριστικά της λέξης, όπως για παράδειγμα το γένος, τον αριθμό, το χρόνο, τη φωνή, κ.τ.λ. (π.χ. αρσενικό ουσιαστικό ενικού αριθμού, ρήμα στον ενεστώτα της ενεργητικής φωνής). Στην περίπτωση αυτή, το σύστημα μπορεί να θεωρηθεί ότι δεν κάνει απλά αναγνώριση μερών του λόγου, αλλά γενικότερα μορφολογική ανάλυση. Παρ όλα, αυτά συνηθίζεται να χρησιμοποιείται ο όρος «Αναγνώριση Μερών του Λόγου» και για αυτά τα συστήματα και θα ακολουθήσουμε την ίδια πρακτική. Η σημαντικότητα της συγκεκριμένης περιοχής έγκειται στο γεγονός ότι η μορφολογική πληροφορία που αποδίδεται σε κάθε λέξη ενός κειμένου αποτελεί τη βάση για την περαιτέρω επεξεργασία του. Συνεπώς ένα τέτοιο σύστημα, μορφολογικής ανάλυσης κειμένων, μπορεί να χρησιμοποιηθεί ως τμήμα διαφόρων άλλων συστημάτων επεξεργασίας φυσικής γλώσσας, όπως συντακτικοί αναλυτές, διορθωτές κειμένων, συστήματα αναγνώρισης φωνής κ.α. Εκτός όμως από πρακτικό ενδιαφέρον, η αναγνώριση μερών του λόγου έχει και ερευνητικό ενδιαφέρον, καθώς ενσωματώνοντας πολλές μορφολογικές πληροφορίες στις ετικέτες δημιουργείται ένα πολύ μεγάλο πλήθος κατηγοριών. Έτσι η μορφολογική ανάλυση κειμένων καθίσταται ένα δύσκολο πρόβλημα κατηγοριοποίησης. 15

18 Ένα σημαντικό ερώτημα που θα μπορούσε ίσως να προκύψει είναι το γιατί δε χρησιμοποιείται ένα ηλεκτρονικό λεξικό, της εκάστοτε γλώσσας, για τη μορφολογική ανάλυση των λέξεων. Η απάντηση είναι απλή και έγκειται στους περιορισμούς που υπεισέρχονται σε μία τέτοια λύση. Καταρχάς, η κατασκευή ενός ηλεκτρονικού λεξικού είναι μία χρονοβόρα και ιδιαίτερα ακριβή διαδικασία, με συνέπεια τα περισσότερα ηλεκτρονικά λεξικά να μην είναι ελεύθερα διαθέσιμα στο κοινό. Επιπλέον, ένα λεξικό, περιέχοντας πεπερασμένο πλήθος λέξεων, είναι αδύνατο να καλύψει όλες τις πιθανές λέξεις που μπορεί να εμφανιστούν, ιδιαίτερα κύρια ονόματα και νέους τεχνικούς όρους. Τέλος, ένα σύστημα που συμβουλεύεται απλά ένα λεξικό χωρίς να λαμβάνει υπόψη του τα συμφραζόμενα της κάθε λέξης, σε πολλές περιπτώσεις δε μπορεί να αποφασίσει για την ετικέτα που θα αποδώσει σε μία λέξη (π.χ. η λέξη «διατάξεις» εμφανίζεται και ως ρήμα και ως ουσιαστικό). 3.2 Προηγούμενες προσεγγίσεις στην αναγνώριση μερών του λόγου Όπως έχει ήδη αναφερθεί η αναγνώριση μερών του λόγου αποτελεί απαραίτητο στάδιο σε πολλά συστήματα επεξεργασίας φυσικής γλώσσας. Λογικό είναι λοιπόν να έχουν παρουσιαστεί κατά καιρούς διάφορες προσεγγίσεις για την επίλυση του συγκεκριμένου προβλήματος. Παρακάτω θα παρουσιάσουμε τις σημαντικότερες από αυτές Μάθηση στηριζόμενη σε κανόνες μετασχηματισμού οδηγούμενη από σφάλματα (transformation-based error-driven learning TBED ) Πρόκειται για μια γενική μέθοδο μηχανικής μάθησης, η οποία όμως έχει εφαρμοστεί με μεγάλη επιτυχία σε συστήματα αναγνώρισης μερών του λόγου [Br92], [Br93], [Br95b]. Η μέθοδος βασίζεται στην εκμάθηση κανόνων μετασχηματισμού, καθένας από τους οποίους τροποποιεί, στην περίπτωση της αναγνώρισης μερών του λόγου, την ετικέτα της λέξης στην οποία εφαρμόζεται, 16

19 εφόσον ικανοποιούνται οι περιορισμοί του. Το σύστημα μαθαίνει τέτοιους κανόνες χρησιμοποιώντας ένα σώμα κειμένων καθώς και ένα σύνολο από μορφότυπους (πρότυπα) κανόνων που έχουν προκαθοριστεί. Πιο συγκεκριμένα, υπάρχουν δύο ειδών κανόνες: λεκτικοί κανόνες (lexical rules), οι οποίοι προβλέπουν την πιθανότερη ετικέτα για τις άγνωστες λέξεις εξετάζοντας μόνο τις ίδιες τις λέξεις (καταλήξεις, προθέματα, κ.τ.λ.), και κανόνες συμφραζομένων (contextual rules), οι οποίοι εξετάζουν τα συμφραζόμενα των λέξεων. Οι κανόνες συμφραζομένων είναι της μορφής: Η ετικέτα i αντικαθίσταται από την ετικέτα j αν P, το οποίο σημαίνει ότι η αρχική ετικέτα που έχει αποδοθεί σε μία λέξη (ετικέτα i ) αντικαθίσταται από μία νέα ετικέτα (ετικέτα j ) αν τα συμφραζόμενα είναι P. Τα συμφραζόμενα αποτελούνται από την υπό εξέταση λέξη και την ετικέτα που της έχει αποδοθεί καθώς και από τις δύο προηγούμενες λέξεις μαζί με τις ετικέτες που τους έχουν αποδοθεί. Η εκπαίδευση διενεργείται σε γενικές γραμμές ως εξής. Αρχικά, το σύστημα αναθέτει σε κάθε λέξη του σώματος εκπαίδευσης μία ετικέτα. Στην απλούστερη περίπτωση, ανατίθεται σε κάθε λέξη η συχνότερη ετικέτα της γλώσσας (π.χ. ανατίθεται σε όλες τις λέξεις η ετικέτα του ουσιαστικού). Κατόπιν μετριέται ο αριθμός ορθών ετικετών που προέκυψαν από την παραπάνω διαδικασία, συγκρίνοντάς τις με τις ορθές ετικέτες που έχουν προστεθεί χειρωνακτικά στο σώμα εκπαίδευσης. Στη συνέχεια το σύστημα δοκιμάζει κάθε έναν από τους δυνατούς κανόνες συμφραζομένων ξεχωριστά σε ολόκληρο το σώμα εκπαίδευσης και για κάθε έναν κανόνα μετρά τον αριθμό ορθών ετικετών στον οποίο οδηγεί η εφαρμογή του κανόνα. Ο κανόνας που οδηγεί στη μεγαλύτερη αύξηση του αριθμού των ορθών ετικετών υιοθετείται, δηλαδή οι ετικέτες που έχει αναθέσει το σύστημα στις λέξεις του σώματος εκπαίδευσης θεωρείται πλέον ότι είναι οι αρχικές με τις διορθώσεις του κανόνα που υιοθετήθηκε. Ο κανόνας που υιοθετήθηκε τοποθετείται επίσης στο τέλος μίας λίστας που περιέχει τους υιοθετημένους κανόνες. Η ίδια 17

20 διαδικασία επαναλαμβάνεται, δηλαδή υιοθετείται σε κάθε επανάληψη ένας νέος κανόνας, που προστίθεται στη λίστα, μέχρι το σημείο όπου δεν είναι δυνατόν να αυξηθεί ο αριθμός των ορθών ετικετών με την εφαρμογή κανενός κανόνα. Έτσι, δημιουργείται μία λίστα με κανόνες οι οποίοι είναι ταξινομημένοι με τη σειρά που εφαρμόστηκαν στην παραπάνω διαδικασία. Αφού ολοκληρωθεί η διαδικασία εκπαίδευσης, το σύστημα μπορεί να χρησιμοποιηθεί για να προστεθούν ετικέτες μερών του λόγου σε νέα, μη χειρωνακτικά επισημειωμένα κείμενα.αρχικά, κάθε λέξη επισημειώνεται με μία ετικέτα όπως και στη διαδικασία εκπαίδευσης. Αν η λέξη δεν υπάρχει στο σώμα εκπαίδευσης (άγνωστη) τότε εφαρμόζονται σε αυτήν οι λεκτικοί κανόνες. Στη συνέχεια εφαρμόζονται οι κανόνες συμφραζομένων που έμαθε το σύστημα με τη σειρά που εφαρμόστηκαν κατά τη διαδικασία εκπαίδευσης Κρυφά μοντέλα Markov Από στατιστικής πλευράς η μορφολογική ανάλυση κειμένων μπορεί να οριστεί ως πρόβλημα μεγιστοποίησης. Έστω = { c 1, c2,..., c N } ετικετών και v { w w,..., } β το σύνολο των = 1, 2 w m το σύνολο των λέξεων που είναι δυνατόν να εμφανιστούν στα κείμενα. Για μια ακολουθία λέξεων μήκους L, W = w w,...,, το ζητούμενο αποτέλεσμα είναι η εύρεση μίας ακολουθίας 1, 2 w L ετικετών Ĉ μέγιστης πιθανότητας, δηλαδή: ( C W ) ( ) P( W C) P( W ) P C ˆ L = arg max P = arg max, C β (3.1) C C C Επειδή η πιθανότητα P ( W ) είναι σταθερή μπορεί να παραληφθεί και το πρόβλημα ανάγεται στο πρόβλημα μεγιστοποίησης του αριθμητή της σχέσης 3.1. Στη σχέση αυτή το γλωσσικό μοντέλο, P ( C), αναπαριστά τις πιθανές ακολουθίες ετικετών, ενώ οι λεκτικές πιθανότητες, P ( W C), αναπαριστούν τη σχέση ανάμεσα στο λεξιλόγιο και τις ετικέτες. 18

21 Για την επίλυση της σχέσης 3.1 πρέπει να γίνουν οι υποθέσεις Markov που περιγράφονται παρακάτω ούτως ώστε να απλοποιηθεί το πρόβλημα. Έστω X ( X,..., ) = μία ακολουθία τυχαίων μεταβλητών οι 1 X L οποίες παίρνουν τιμές από κάποιο πεπερασμένο σύνολο { s } S =,...,, το οποίο ονομάζεται σύνολο καταστάσεων. Αν η 1 s N X έχει τις δύο ακόλουθες ιδιότητες είναι μία αλυσίδα Markov. o Περιορισμένος Ορίζοντας (Limited Horizon): ( X s X,..., X ) = P( X s X ) l+ 1 = k 1 l l+ 1 = k l, δηλαδή η τιμή P μιας τυχαίας μεταβλητής (διαισθητικά, η κατάσταση στην οποία βρισκόμαστε κατά το χρόνο l+1) εξαρτάται μόνο από την τιμή της προηγούμενης τυχαίας μεταβλητής (την κατάσταση στην οποία βρισκόμασταν κατά το χρόνο l). Στη γενικότερη περίπτωση η τιμή μίας τυχαίας μεταβλητής μπορεί να εξαρτάται από τις τιμές των m προηγούμενων, οπότε έχουμε μοντέλο Markov m τάξης o Ανεξαρτησία χρόνου Στασιμότητα (Time Invariant Stationary): P( X = s X ) = P( X s X ) l + 1 k l 2 = k 1, δηλαδή η παραπάνω εξάρτηση παραμένει η ίδια με την πάροδο του χρόνου. Θεωρώντας ότι οι ακολουθίες των ετικετών ικανοποιούν τις υποθέσεις Markov δεύτερης τάξης και θεωρώντας ότι η πιθανότητα εμφάνισης μιας λέξης στη θέση i της ακολουθίας W εξαρτάται μόνο από την ετικέτα c i της αντίστοιχης θέσης το πρόβλημα ανάγεται στο παρακάτω πρόβλημα μεγιστοποίησης: Cˆ = arg max P i i 1 i c1... cl 1... L ( c c, c ) P( w c ) 2 i i (3.2) 19

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων

Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Ανάπτυξη συστήματος ερωταποκρίσεων για αρχεία ελληνικών εφημερίδων Οικονομικό Πανεπιστήμιο Αθηνών Πρόγραμμα Μεταπτυχιακών Σπουδών «Επιστήμη των Υπολογιστών» Διπλωματική Εργασία Μαρία-Ελένη Κολλιάρου 2

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Περιεχόµενα...1 1. Εισαγωγή...3. 2. Μηχανική Μάθηση...7. 3. Προηγούµενες πειραµατικές προσπάθειες...15

Περιεχόµενα...1 1. Εισαγωγή...3. 2. Μηχανική Μάθηση...7. 3. Προηγούµενες πειραµατικές προσπάθειες...15 Περιεχόµενα Περιεχόµενα Περιεχόµενα...1 1. Εισαγωγή...3 1.1 Αντικείµενο της εργασίας... 3 1.2 Κυριότερα αποτελέσµατα της εργασίας... 4 1.3 ιάρθρωση της εργασίας... 5 1.4 Ευχαριστίες... 5 2. Μηχανική Μάθηση...7

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #06 Πιθανοτικό Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΑΕΠΠ Ερωτήσεις θεωρίας

ΑΕΠΠ Ερωτήσεις θεωρίας ΑΕΠΠ Ερωτήσεις θεωρίας Κεφάλαιο 1 1. Τα δεδομένα μπορούν να παρέχουν πληροφορίες όταν υποβάλλονται σε 2. Το πρόβλημα μεγιστοποίησης των κερδών μιας επιχείρησης είναι πρόβλημα 3. Για την επίλυση ενός προβλήματος

Διαβάστε περισσότερα

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη

Διαχείριση εγγράφων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Διαχείριση εγγράφων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκων: Μ. Χαλκίδη Απεικόνιση κειμένων για Information Retrieval Δεδομένου ενός κειμένου αναζητούμε μια μεθοδολογία απεικόνισης του γραμματικού χώρου

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1 Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Αντικείμενο Μελέτη και ανάπτυξη μεθόδων από τον χώρο της μηχανικής μάθησης για

Διαβάστε περισσότερα

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση Διαδικασίες παραγωγής λογισμικού Περιεχόμενα Παρουσίαση μοντέλων διεργασίας ανάπτυξης λογισμικού Περιγραφή τριών γενικών μοντέλων διεργασίας ανάπτυξης λογισμικού Γενική περιγραφή των διαδικασιών που περιλαμβάνονται

Διαβάστε περισσότερα

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης Σφάλματα Μετρήσεων 4.45 Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης Διάστημα εμπιστοσύνης βρίσκονται εκτός του Διαστήματος Εμπιστοσύνης 0.500 X 0.674σ 1 στις 0.800 X 1.8σ 1 στις

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ 3.1 Τυχαίοι αριθμοί Στην προσομοίωση διακριτών γεγονότων γίνεται χρήση ακολουθίας τυχαίων αριθμών στις περιπτώσεις που απαιτείται η δημιουργία στοχαστικών

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα «Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα Σεμινάριο 8: Χρήση Μηχανικής Μάθησης στην Εξαγωγή Πληροφορίας Ευάγγελος Καρκαλέτσης, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο

Διαβάστε περισσότερα

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Όνοµα: Νικολαΐδης Αντώνιος Επιβλέπων: Τ. Σελλής Περίληψη ιπλωµατικής Εργασίας Συνεπιβλέποντες: Θ. αλαµάγκας, Γ. Γιαννόπουλος

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Περιεχόμενα. Δομές δεδομένων. Τεχνικές σχεδίασης αλγορίθμων. Εισαγωγή στον προγραμματισμό. Υποπρογράμματα. Επαναληπτικά κριτήρια αξιολόγησης

Περιεχόμενα. Δομές δεδομένων. Τεχνικές σχεδίασης αλγορίθμων. Εισαγωγή στον προγραμματισμό. Υποπρογράμματα. Επαναληπτικά κριτήρια αξιολόγησης Περιεχόμενα Δομές δεδομένων 37. Δομές δεδομένων (θεωρητικά στοιχεία)...11 38. Εισαγωγή στους μονοδιάστατους πίνακες...16 39. Βασικές επεξεργασίες στους μονοδιάστατους πίνακες...25 40. Ασκήσεις στους μονοδιάστατους

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 10 ΥΠΟΠΡΟΓΡΑΜΜΑΤΑ

ΚΕΦΑΛΑΙΟ 10 ΥΠΟΠΡΟΓΡΑΜΜΑΤΑ ΚΕΦΑΛΑΙΟ 10 Όπως είδαμε και σε προηγούμενο κεφάλαιο μια από τις βασικότερες τεχνικές στον Δομημένο Προγραμματισμό είναι ο Τμηματικός Προγραμματισμός. Τμηματικός προγραμματισμός ονομάζεται η τεχνική σχεδίασης

Διαβάστε περισσότερα

Θέματα Συστημάτων Πολυμέσων

Θέματα Συστημάτων Πολυμέσων Θέματα Συστημάτων Πολυμέσων Ενότητα # 6: Στοιχεία Θεωρίας Πληροφορίας Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό

Διαβάστε περισσότερα

«Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης»

«Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης» ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ θέμα: «Αναγνώριση και Κατάταξη Ονομάτων Οντοτήτων σε Ελληνικά Κείμενα με Χρήση Μηχανών ιανυσμάτων Υποστήριξης» Βασιλάκος Ξενοφών Επιβλέπων

Διαβάστε περισσότερα

ΠΡΟΒΛΗΜΑΤΑ ΜΕΤΑΦΟΡΑΣ

ΠΡΟΒΛΗΜΑΤΑ ΜΕΤΑΦΟΡΑΣ (Transportation Problems) Βασίλης Κώστογλου E-mail: vkostogl@it.teithe.gr URL: www.it.teithe.gr/~vkostogl Περιγραφή Ένα πρόβλημα μεταφοράς ασχολείται με το πρόβλημα του προσδιορισμού του καλύτερου δυνατού

Διαβάστε περισσότερα

Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 - Project Σεπτεμβρίου Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος Εξέταση: Προφορική, στο τέλος της εξεταστικής. Θα βγει ανακοίνωση στο forum. Ομάδες

Διαβάστε περισσότερα

Ψευδοκώδικας. November 7, 2011

Ψευδοκώδικας. November 7, 2011 Ψευδοκώδικας November 7, 2011 Οι γλώσσες τύπου ψευδοκώδικα είναι ένας τρόπος περιγραφής αλγορίθμων. Δεν υπάρχει κανένας τυπικός ορισμός της έννοιας του ψευδοκώδικα όμως είναι κοινός τόπος ότι οποιαδήποτε

Διαβάστε περισσότερα

Δομές Δεδομένων και Αλγόριθμοι

Δομές Δεδομένων και Αλγόριθμοι Δομές Δεδομένων και Αλγόριθμοι Χρήστος Γκόγκος ΤΕΙ Ηπείρου Χειμερινό Εξάμηνο 2014-2015 Παρουσίαση 20 Huffman codes 1 / 12 Κωδικοποίηση σταθερού μήκους Αν χρησιμοποιηθεί κωδικοποίηση σταθερού μήκους δηλαδή

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΡΟΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΜΑΘΗΜΑ: ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ ΔΙΑΔΙΚΑΣΙΕΣ ΠΑΡΑΓΩΓΗΣ ΛΟΓΙΣΜΙΚΟΥ Διδάσκων: Γ. Χαραλαμπίδης,

Διαβάστε περισσότερα

Κεφάλαιο 6. Μέθοδοι επίλυσης προβλημάτων ακέραιου προγραμματισμού

Κεφάλαιο 6. Μέθοδοι επίλυσης προβλημάτων ακέραιου προγραμματισμού Κεφάλαιο 6 Μέθοδοι επίλυσης προβλημάτων ακέραιου προγραμματισμού 1 Γραφική επίλυση Η γραφική μέθοδος επίλυσης μπορεί να χρησιμοποιηθεί μόνο για πολύ μικρά προβλήματα με δύο ή το πολύ τρεις μεταβλητές απόφασης.

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Ανάλυση Χρόνου, Πόρων & Κόστους

Ανάλυση Χρόνου, Πόρων & Κόστους ΠΜΣ: «Παραγωγή και ιαχείριση Ενέργειας» ιαχείριση Ενέργειας και ιοίκηση Έργων Ανάλυση Χρόνου, Πόρων & Κόστους Επ. Καθηγητής Χάρης ούκας, Καθηγητής Ιωάννης Ψαρράς Εργαστήριο Συστημάτων Αποφάσεων & ιοίκησης

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 6 ΟΥ ΚΕΦΑΛΑΙΟΥ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ 6.1 Τι ονοµάζουµε πρόγραµµα υπολογιστή; Ένα πρόγραµµα

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΕΣ 3: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΚΑΙ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ Ακαδημαϊκό Έτος 7 8, Χειμερινό Εξάμηνο Καθ.: Νίκος Τσαπατσούλης ΕΡΩΤΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ Το παρόν

Διαβάστε περισσότερα

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος Αναστασιάδης Αντώνιος Τα ιστολόγια σήμερα Διπλωματική Εργασία Η σημασία των πληροφοριών των ιστολόγιων Μέθοδοι κατάτμησης ιστολόγιων Αξιολόγηση κατάτμησης Ταξινόμηση καταχωρήσεων Αξιολόγηση ταξινόμησης

Διαβάστε περισσότερα

Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα

Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα Επεκτάσεις και Περαιτέρω Αξιολόγηση Συστήµατος Αναγνώρισης Μερών του Λόγου για Ελληνικά Κείµενα Ιωάννης Χρονάκης ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Επιβλέπων Καθηγητής: Ίων Ανδρουτσόπουλος Τµήµα Πληροφορικής Οικονοµικό

Διαβάστε περισσότερα

1. Πότε χρησιμοποιούμε την δομή επανάληψης; Ποιες είναι οι διάφορες εντολές (μορφές) της;

1. Πότε χρησιμοποιούμε την δομή επανάληψης; Ποιες είναι οι διάφορες εντολές (μορφές) της; 1. Πότε χρησιμοποιούμε την δομή επανάληψης; Ποιες είναι οι διάφορες (μορφές) της; Η δομή επανάληψης χρησιμοποιείται όταν μια σειρά εντολών πρέπει να εκτελεστεί σε ένα σύνολο περιπτώσεων, που έχουν κάτι

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος. http://www.aueb.gr/users/ion/

Τεχνητή Νοημοσύνη. 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος. http://www.aueb.gr/users/ion/ Τεχνητή Νοημοσύνη 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται στα βιβλία: Τεχνητή Νοημοσύνη των Βλαχάβα κ.ά., 3η έκδοση, Β. Γκιούρδας

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Κβάντιση Δρ. Ν. Π. Σγούρος 2 Άσκηση 5.1 Για ένα σήμα που έχει τη σ.π.π. του σχήματος να υπολογίσετε: μήκος του δυαδικού κώδικα για Ν επίπεδα κβάντισης για σταθερό μήκος λέξης;

Διαβάστε περισσότερα

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1 ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1 ΣΥΝΑΡΤΗΣΕΙΣ Η έννοια της συνάρτησης είναι θεμελιώδης στο λογισμό και διαπερνά όλους τους μαθηματικούς κλάδους. Για το φοιτητή είναι σημαντικό να κατανοήσει πλήρως αυτή

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Επεξεργασία Ερωτήσεων ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήματος 1. Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασμός) 2. Προγραμματισμός (Σχεσιακή Άλγεβρα, SQL) ημιουργία/κατασκευή Εισαγωγή εδομένων

Διαβάστε περισσότερα

Εισαγωγή στους Υπολογιστές

Εισαγωγή στους Υπολογιστές Εισαγωγή στους Υπολογιστές Ενότητα #2: Αναπαράσταση δεδομένων Αβεβαιότητα και Ακρίβεια Καθ. Δημήτρης Ματαράς Πολυτεχνική Σχολή Τμήμα Χημικών Μηχανικών Αναπαράσταση δεδομένων (Data Representation), Αβεβαιότητα

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 2 ο : Βασικές έννοιες Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Γλωσσική Τεχνολογία, Μάθημα 2 ο, Βασικές

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ 2013-2014

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ 2013-2014 ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ 2013-2014 Επιμέλεια: Ομάδα Διαγωνισμάτων από το Στέκι των Πληροφορικών Θέμα Α A1. Να γράψετε στο τετράδιό σας τους

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Ανάπτυξη μιας προσαρμοστικής πολιτικής αντικατάστασης αρχείων, με χρήση

Διαβάστε περισσότερα

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου J-GANNO ΓΕΝΙΚΕΥΜΕΝΟ ΠΑΚΕΤΟ ΥΛΟΠΟΙΗΣΗΣ ΤΕΧΝΗΤΩΝ ΝΕΥΡΩΝΙΚΩΝ ΙΚΤΥΩΝ ΣΤΗ ΓΛΩΣΣΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ JAVA Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β,

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Ζητήματα ηήμ με τα δεδομένα

Ζητήματα ηήμ με τα δεδομένα Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ ΚΕΦΑΛΑΙΟ ΔΙΑΤΑΞΕΙΣ ΜΕΤΑΘΕΣΕΙΣ ΣΥΝΔΥΑΣΜΟΙ Εισαγωγή. Οι σχηματισμοί που προκύπτουν με την επιλογή ενός συγκεκριμένου αριθμού στοιχείων από το ίδιο σύνολο καλούνται διατάξεις αν μας ενδιαφέρει η σειρά καταγραφή

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46 ΠEΡΙΕΧΟΜΕΝΑ Από το Γυμνάσιο στο Λύκειο................................................ 7 1. Το Λεξιλόγιο της Λογικής.............................................. 11 2. Σύνολα..............................................................

Διαβάστε περισσότερα

Κεφ. 1: Εισαγωγή στην έννοια του Αλγορίθμου και στον Προγραμματισμό. Η έννοια του προβλήματος

Κεφ. 1: Εισαγωγή στην έννοια του Αλγορίθμου και στον Προγραμματισμό. Η έννοια του προβλήματος Η έννοια του προβλήματος 1. Αναφέρετε μερικά από τα προβλήματα που συναντάτε στην καθημερινότητά σας. Απλά προβλήματα Ποιο δρόμο θα ακολουθήσω για να πάω στο σχολείο; Πως θα οργανώσω μια εκδρομή; Πως θα

Διαβάστε περισσότερα

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Διαδικασία Ελέγχου Μηδενικών Υποθέσεων Πέτρος Ρούσσος, Τμήμα Ψυχολογίας, ΕΚΠΑ Η λογική της διαδικασίας Ο σάκος περιέχει έναν μεγάλο αλλά άγνωστο αριθμό (αρκετές χιλιάδες) λευκών και μαύρων βόλων: 1 Το

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Προσδιορισμός Δείκτη Ποιότητας Κτηματολογικής Βάσης

Προσδιορισμός Δείκτη Ποιότητας Κτηματολογικής Βάσης Προσδιορισμός Δείκτη Ποιότητας Κτηματολογικής Βάσης Ιωάννης Καββάδας Αγρ. Τοπογράφος Μηχανικός, MSc Υποψήφιος Διδάκτωρ Ε.Μ.Π. Προϊστάμενος Τμήματος Ελέγχων & Διαχείρισης Ποιότητας Έργων Διεύθυνση Έργων

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

Περί της Ταξινόμησης των Ειδών

Περί της Ταξινόμησης των Ειδών Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Tel.: +30 2310998051, Ιστοσελίδα: http://users.auth.gr/theodoru Περί της Ταξινόμησης

Διαβάστε περισσότερα

ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ. Κεφάλαιο 3 Μορφοποίηση Προβλημάτων Ακέραιου Προγραμματισμού

ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ. Κεφάλαιο 3 Μορφοποίηση Προβλημάτων Ακέραιου Προγραμματισμού ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Κεφάλαιο 3 Μορφοποίηση Προβλημάτων Ακέραιου Προγραμματισμού 1 Σχέση γραμμικού και ακέραιου προγραμματισμού Ενα πρόβλημα ακέραιου προγραμματισμού είναι

Διαβάστε περισσότερα

Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ

Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ Τι είναι η ερευνητική εργασία Η ερευνητική εργασία στο σχολείο είναι μια δυναμική διαδικασία, ανοιχτή στην αναζήτηση για την κατανόηση του πραγματικού κόσμου.

Διαβάστε περισσότερα

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα Βάσεις

Διαβάστε περισσότερα

ΔΙΔΑΚΤΙΚΗ της ΠΛΗΡΟΦΟΡΙΚΗΣ

ΔΙΔΑΚΤΙΚΗ της ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΔΙΔΑΚΤΙΚΗ της ΠΛΗΡΟΦΟΡΙΚΗΣ Μ. Γρηγοριάδου Ρ. Γόγουλου Ενότητα: Η Διδασκαλία του Προγραμματισμού Περιεχόμενα Παρουσίασης

Διαβάστε περισσότερα

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων Ενότητα 4 Επεξεργασία πινάκων 36 37 4.1 Προσθήκη πεδίων Για να εισάγετε ένα πεδίο σε ένα πίνακα που υπάρχει ήδη στη βάση δεδομένων σας, βάζετε τον κέρσορα του ποντικιού στο πεδίο πάνω από το οποίο θέλετε

Διαβάστε περισσότερα

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Μέθοδοι μονοδιάστατης ελαχιστοποίησης Βασικές αρχές μεθόδων ελαχιστοποίησης Μέθοδοι μονοδιάστατης ελαχιστοποίησης Οι μέθοδοι ελαχιστοποίησης είναι επαναληπτικές. Ξεκινώντας από μια αρχική προσέγγιση του ελαχίστου (την συμβολίζουμε ) παράγουν

Διαβάστε περισσότερα

Στάδιο Εκτέλεσης

Στάδιο Εκτέλεσης 16 ΚΕΦΑΛΑΙΟ 1Ο 1.4.2.2 Στάδιο Εκτέλεσης Το στάδιο της εκτέλεσης μίας έρευνας αποτελεί αυτό ακριβώς που υπονοεί η ονομασία του. Δηλαδή, περιλαμβάνει όλες εκείνες τις ενέργειες από τη στιγμή που η έρευνα

Διαβάστε περισσότερα

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Γραμμικός Προγραμματισμός Μέθοδος Simplex ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραμμικός Προγραμματισμός Μέθοδος Simplex Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Πρότυπη Μορφή ΓΠ 2. Πινακοποίηση

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

ΣΦΑΛΜΑΤΑ ΑΡΙΘΜΗΤΙΚΩΝ ΥΠΟΛΟΓΙΣΜΩΝ

ΣΦΑΛΜΑΤΑ ΑΡΙΘΜΗΤΙΚΩΝ ΥΠΟΛΟΓΙΣΜΩΝ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Εργαστήριο Θερμικών Στροβιλομηχανών Μονάδα Παράλληλης Υπολογιστικής Ρευστοδυναμικής & Βελτιστοποίησης ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ (4 ο Εξάμηνο Σχολής Μηχ.Μηχ. ΕΜΠ) ΣΦΑΛΜΑΤΑ ΑΡΙΘΜΗΤΙΚΩΝ

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ C ΣΕΙΡΑ 1 η

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ C ΣΕΙΡΑ 1 η Δημοκρίτειο Πανεπιστήμιο Θράκης Πολυτεχνική Σχολή Τμήμα Μηχανικών Παραγωγής & Διοίκησης Ακαδ. έτος 2015-2016 Τομέας Συστημάτων Παραγωγής Εξάμηνο Β Αναπληρωτής Καθηγητής Στέφανος Δ. Κατσαβούνης ΜΑΘΗΜΑ :

Διαβάστε περισσότερα

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική

Διαβάστε περισσότερα

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη.

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. 4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη. Η μετατροπή μιας εντολής επανάληψης σε μία άλλη ή στις άλλες δύο εντολές επανάληψης, αποτελεί ένα θέμα που αρκετές φορές έχει εξεταστεί σε πανελλαδικό

Διαβάστε περισσότερα

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr I ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ i e ΜΕΡΟΣ Ι ΟΡΙΣΜΟΣ - ΒΑΣΙΚΕΣ ΠΡΑΞΕΙΣ Α Ορισμός Ο ορισμός του συνόλου των Μιγαδικών αριθμών (C) βασίζεται στις εξής παραδοχές: Υπάρχει ένας αριθμός i για τον οποίο ισχύει i Το σύνολο

Διαβάστε περισσότερα

Σκοπός. Εργαστήριο 6 Εντολές Επανάληψης

Σκοπός. Εργαστήριο 6 Εντολές Επανάληψης Εργαστήριο 6 Εντολές Επανάληψης Η δομή Επιλογής στη PASCAL H δομή Επανάληψης στη PASCAL. Ρεύμα Εισόδου / Εξόδου.. Ρεύμα Εισόδου / Εξόδου. To πρόγραμμα γραφικών gnuplot. Γραφικά στη PASCAL. Σκοπός 6.1 ΕΠΙΔΙΩΞΗ

Διαβάστε περισσότερα

Δομές Δεδομένων και Αλγόριθμοι

Δομές Δεδομένων και Αλγόριθμοι Δομές Δεδομένων και Αλγόριθμοι Χρήστος Γκόγκος ΤΕΙ Ηπείρου Χειμερινό Εξάμηνο 2014-2015 Παρουσίαση 19 Hashing - Κατακερματισμός 1 / 23 Πίνακες απευθείας πρόσβασης (Direct Access Tables) Οι πίνακες απευθείας

Διαβάστε περισσότερα

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε.

Χημική Τεχνολογία. Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων. Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε. ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Χημική Τεχνολογία Ενότητα 1: Στατιστική Επεξεργασία Μετρήσεων Ευάγγελος Φουντουκίδης Τμήμα Μηχανολόγων Μηχανικών Τ.Ε. Άδειες Χρήσης

Διαβάστε περισσότερα

AYTONOMOI ΠΡΑΚΤΟΡΕΣ

AYTONOMOI ΠΡΑΚΤΟΡΕΣ AYTONOMOI ΠΡΑΚΤΟΡΕΣ 2012-2013 ΠΑΠΑΚΩΣΤΑΣ ΜΙΧΑΛΗΣ ΑΜ: 2007030001 ΑΚΡΙΒΗΣ ΣΥΜΠΕΡΑΣΜΟΣ ΔΙΚΤΥΟΥ BAYES ΣΕ ΑΡΘΑ ΕΦΗΜΕΡΙΔΑΣ ΠΕΡΙΛΗΨΗ Στη συγκεκριμένη εργασία προσπαθήσαμε να στήσουμε ένα δίκτυο Bayes διακριτών

Διαβάστε περισσότερα

Περιληπτικά, τα βήματα που ακολουθούμε γενικά είναι τα εξής:

Περιληπτικά, τα βήματα που ακολουθούμε γενικά είναι τα εξής: Αυτό που πρέπει να θυμόμαστε, για να μη στεναχωριόμαστε, είναι πως τόσο στις εξισώσεις, όσο και στις ανισώσεις 1ου βαθμού, που θέλουμε να λύσουμε, ακολουθούμε ακριβώς τα ίδια βήματα! Εκεί που πρεπει να

Διαβάστε περισσότερα

O n+2 = O n+1 + N n+1 = α n+1 N n+2 = O n+1. α n+2 = O n+2 + N n+2 = (O n+1 + N n+1 ) + (O n + N n ) = α n+1 + α n

O n+2 = O n+1 + N n+1 = α n+1 N n+2 = O n+1. α n+2 = O n+2 + N n+2 = (O n+1 + N n+1 ) + (O n + N n ) = α n+1 + α n Η ύλη συνοπτικά... Στοιχειώδης συνδυαστική Γεννήτριες συναρτήσεις Σχέσεις αναδρομής Θεωρία Μέτρησης Polyá Αρχή Εγκλεισμού - Αποκλεισμού Σχέσεις Αναδρομής Γραμμικές Σχέσεις Αναδρομής με σταθερούς συντελεστές

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 10 ΟΥ ΚΕΦΑΛΑΙΟΥ ΥΠΟΠΡΟΓΡΑΜΜΑΤΑ 1. Πως ορίζεται ο τμηματικός προγραμματισμός; Τμηματικός προγραμματισμός

Διαβάστε περισσότερα

Case 08: Επιλογή Διαφημιστικών Μέσων Ι ΣΕΝΑΡΙΟ (1)

Case 08: Επιλογή Διαφημιστικών Μέσων Ι ΣΕΝΑΡΙΟ (1) Case 08: Επιλογή Διαφημιστικών Μέσων Ι ΣΕΝΑΡΙΟ (1) Το πρόβλημα της επιλογής των μέσων διαφήμισης (??) το αντιμετωπίζουν τόσο οι επιχειρήσεις όσο και οι διαφημιστικές εταιρείες στην προσπάθειά τους ν' αναπτύξουν

Διαβάστε περισσότερα

Γεώργιος Φίλιππας 23/8/2015

Γεώργιος Φίλιππας 23/8/2015 MACROWEB Προβλήματα Γεώργιος Φίλιππας 23/8/2015 Παραδείγματα Προβλημάτων. Πως ορίζεται η έννοια πρόβλημα; Από ποιους παράγοντες εξαρτάται η κατανόηση ενός προβλήματος; Τι εννοούμε λέγοντας χώρο ενός προβλήματος;

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Προϋποθέσεις Εφαρμογής

Διαβάστε περισσότερα

Μηχανική Μάθηση: γιατί;

Μηχανική Μάθηση: γιατί; Μηχανική Μάθηση Μηχανική Μάθηση: γιατί; Απαραίτητη για να μπορεί ο πράκτορας να ανταπεξέρχεται σε άγνωστα περιβάλλοντα Δεν είναι δυνατόν ο σχεδιαστής να προβλέψει όλα τα ενδεχόμενα περιβάλλοντα. Χρήσιμη

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Επεξεργασία Ερωτήσεων Αρχεία ευρετηρίου Κατάλογος συστήματος Αρχεία δεδομένων ΒΑΣΗ Ε ΟΜΕΝΩΝ Σύστημα Βάσεων εδομένων (ΣΒ ) Βάσεις Δεδομένων 2007-2008

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 Η Θεωρία Πιθανοτήτων είναι ένας σχετικά νέος κλάδος των Μαθηματικών, ο οποίος παρουσιάζει πολλά ιδιαίτερα χαρακτηριστικά στοιχεία. Επειδή η ιδιαιτερότητα

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΕΥΑΓΓΕΛΙΑΣ Π. ΛΟΥΚΟΓΕΩΡΓΑΚΗ Διπλωματούχου Πολιτικού Μηχανικού ΟΛΟΚΛΗΡΩΜΕΝΟ

Διαβάστε περισσότερα

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο Πρόβλημα ο Ασκήσεις Φροντιστηρίου 5 o Φροντιστήριο Δίνεται το παρακάτω σύνολο εκπαίδευσης: # Είσοδος Κατηγορία 0 0 0 Α 2 0 0 Α 0 Β 4 0 0 Α 5 0 Β 6 0 0 Α 7 0 Β 8 Β α) Στον παρακάτω κύβο τοποθετείστε τα

Διαβάστε περισσότερα

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη

Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης. Ειρήνη Καλδέλη ιπλωµατική Εργασία. Περίληψη Εκπαίδευση ταξινοµητών κειµένου για το χαρακτηρισµό άποψης Ειρήνη Καλδέλη ιπλωµατική Εργασία Περίληψη Εισαγωγή Τα τελευταία χρόνια η αλµατώδης ανάπτυξη της πληροφορικής έχει διευρύνει σε σηµαντικό βαθµό

Διαβάστε περισσότερα

είναι πρόβλημα μεγιστοποίησης όλοι οι περιορισμοί είναι εξισώσεις με μη αρνητικούς του σταθερούς όρους όλες οι μεταβλητές είναι μη αρνητικές

είναι πρόβλημα μεγιστοποίησης όλοι οι περιορισμοί είναι εξισώσεις με μη αρνητικούς του σταθερούς όρους όλες οι μεταβλητές είναι μη αρνητικές Ένα τυχαίο π.γ.π. maximize/minimize z=c x Αx = b x 0 Τυπική μορφή του π.γ.π. maximize z=c x Αx = b x 0 b 0 είναι πρόβλημα μεγιστοποίησης όλοι οι περιορισμοί είναι εξισώσεις με μη αρνητικούς του σταθερούς

Διαβάστε περισσότερα

Περιεχόμενα. Ανάλυση προβλήματος. Δομή ακολουθίας. Δομή επιλογής. Δομή επανάληψης. Απαντήσεις. 1. Η έννοια πρόβλημα Επίλυση προβλημάτων...

Περιεχόμενα. Ανάλυση προβλήματος. Δομή ακολουθίας. Δομή επιλογής. Δομή επανάληψης. Απαντήσεις. 1. Η έννοια πρόβλημα Επίλυση προβλημάτων... Περιεχόμενα Ανάλυση προβλήματος 1. Η έννοια πρόβλημα...13 2. Επίλυση προβλημάτων...17 Δομή ακολουθίας 3. Βασικές έννοιες αλγορίθμων...27 4. Εισαγωγή στην ψευδογλώσσα...31 5. Οι πρώτοι μου αλγόριθμοι...54

Διαβάστε περισσότερα

2 ΟΥ και 8 ΟΥ ΚΕΦΑΛΑΙΟΥ

2 ΟΥ και 8 ΟΥ ΚΕΦΑΛΑΙΟΥ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 2 ΟΥ και 8 ΟΥ ΚΕΦΑΛΑΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΔΟΜΗ ΕΠΑΝΑΛΗΨΗΣ 1) Πότε χρησιμοποιείται η δομή επανάληψης

Διαβάστε περισσότερα

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» 2 ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Προβλήματα ελάχιστης συνεκτικότητας δικτύου Το πρόβλημα της ελάχιστης

Διαβάστε περισσότερα

Επανυλοποίηση, βελτίωση, αξιολόγηση και τεκµηρίωση ελληνικού επισηµειωτή µερών του λόγου που χρησιµοποιεί µηχανική µάθηση

Επανυλοποίηση, βελτίωση, αξιολόγηση και τεκµηρίωση ελληνικού επισηµειωτή µερών του λόγου που χρησιµοποιεί µηχανική µάθηση ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Πτυχιακή Εργασία Επανυλοποίηση, βελτίωση, αξιολόγηση και τεκµηρίωση ελληνικού επισηµειωτή µερών του λόγου που χρησιµοποιεί µηχανική µάθηση Κωνσταντίνος

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα