Επισημείωση Συντακτικών Δέντρων και Πολυλεκτικών Εκφράσεων σε Σώματα Κειμένων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Επισημείωση Συντακτικών Δέντρων και Πολυλεκτικών Εκφράσεων σε Σώματα Κειμένων"

Transcript

1 ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΦΙΛΟΣΟΦΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΦΙΛΟΛΟΓΙΑΣ ΤΟΜΕΑΣ ΓΛΩΣΣΟΛΟΓΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΕΛΕΓΧΟΥ ΚΑΙ ΡΟΜΠΟΤΙΚΗΣ ΙΝΣΤΙΤΟΥΤΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ/ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ «ΑΘΗΝΑ» ΔΙΕΠΙΣΤΗΜΟΝΙΚΟ ΔΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΤΕΧΝΟΓΛΩΣΣΙΑ VIII» Επισημείωση Συντακτικών Δέντρων και Πολυλεκτικών Εκφράσεων σε Σώματα Κειμένων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΑΙΜΙΛΙΑ ΣΤΡΙΠΕΛΗ Επιβλέπων: Δρ. Παπαγεωργίου Χάρης Ερευνητής Β Ινστιτούτου Επεξεργασίας του Λόγου Συνεπιβλέποντες: Δρ. Μαρκαντωνάτου Στέλλα & Μαΐστρος Γιάννης Ερευνήτρια A, ΙΕΛ Επίκουρος Καθηγητής, Ε.Μ.Π. ΑΘΗΝΑ ΣΕΠΤΕΜΒΡΙΟΣ 2015

2 ii

3 Ευχαριστίες Θα ήθελα να ευχαριστήσω θερμά όλους όσους συνέβαλαν στην εκπόνηση της παρούσης διπλωματικής εργασίας. Αρχικά, θα ήθελα να ευχαριστήσω τον κύριο επιβλέποντα της εργασίας μου, Ερευνητή B του Ινστιτούτου Επεξεργασίας του Λόγου/Ερενητικού Κέντρου «Αθηνά», τον κ. Παπαγεωργίου Χάρη που εμπνεύστηκε το θέμα και μου έδωσε τη δυνατότητα να ασχοληθώ με κάτι τόσο σύγχρονο και ταυτόχρονα ενδιαφέρον. Επίσης, θα ήθελα να ευχαριστήσω θερμά τον επιστημονικό συνεργάτη-ερευνητή του ΙΕΛ, κ. Προκοπίδη Προκόπη για τη βοήθεια στην εκπόνηση της εργασίας, κυρίως όσον αφορά το υπολογιστικό της σκέλος. Επίσης, θα ήθελα να ευχαριστήσω την κ.μαρκαντωνάτου Στέλλα, Ερευνήτρια A στο Ινστιτούτο Επεξεργασίας του Λόγου, γιατί μέσα από την συνεργασία σε επίπεδο πρακτικής με βοήθησε ιδιαίτερα στο κομμάτι των πολυλεκτικών καθώς και τον κ. Μαΐστρο Γιάννη, Επίκουρο Καθηγητή του Εθνικού Μετσόβιου Πολυτεχνίου ως μέλος της τριμελούς επιτροπής. Ακόμη, ευχαριστίες θα ήθελα να απευθύνω στους συμφοιτητές μου, η δουλειά των οποίων στην επισημείωση συντακτικών δομών χρησιμοποιήθηκε ως ερευνητικό υλικό στην παρούσα εργασία. Τέλος, οφείλω ένα «ευχαριστώ» στην οικογένειά μου για τη στήριξή τους σε κάθε μου βήμα. iii

4 Περίληψη H παρούσα μεταπτυχιακή εργασία εντάσσεται στο χώρο της Υπολογιστικής Γλωσσολογίας και συγκεκριμένα αφορά στην επισημείωση γλωσσικών πόρων, στους οποίους οι προτάσεις αναπαρίστανται συντακτικά ως δέντρα εξαρτήσεων (dependency trees). Το γεγονός ότι αυτοί οι συντακτικά επισημειωμένοι πόροι χρησιμοποιούνται σε διάφορες εφαρμογές επεξεργασίας φυσικής γλώσσας (ΕΦΓ), όπως είναι η μηχανική μετάφραση, η αυτόματη περίληψη, η απάντηση ερωτήσεων, ο υποτιτλισμός, και η εξαγωγή πληροφορίας από κείμενα αποτελεί το βαθύτερο κίνητρο ενασχόλησης με το συγκεκριμένο θέμα. Η εργασία χωρίζεται σε δύο μέρη. Στο πρώτο μέρος περιγράφεται ο εμπλουτισμός ενός συντακτικού γλωσσικού πόρου για τα νέα ελληνικά, της Ελληνικής Τράπεζας Δέντρων Εξάρτησης (Greek Dependency Treebank, GDT), με χειρωνακτικά επισημειωμένο υλικό και η αξιοποίηση της νέας έκδοσής του για τη βελτίωση της απόδοσης ενός συντακτικού αναλυτή με βάση τις αναπαραστάσεις εξαρτήσεων (dependency parsing). Η επισημείωση βασίστηκε σε πολλές χειρωνακτικές διορθώσεις αυτόματα επισημειωμένου υλικού και σε τεχνικές εντοπισμού διαφορών μεταξύ διαφορετικών επισημειωτών για τη διόρθωση λαθών. Για τις ανάγκες της εργασίας μελετήθηκαν διάφορα σχήματα επισημείωσης, ενώ καταγράφηκαν δύσκολα συντακτικά φαινόμενα που δυσχεραίνουν το έργο των εκάστοτε επισημειωτών. Το νέο επισημειωμένο υλικό στη συνέχεια αξιοποιήθηκε για τη βελτίωση της απόδοσης ενός στατιστικού συντακτικού αναλυτή. Το αποτέλεσμα από το πρώτο πείραμα ήταν θετικό, και δείχνει ότι αυτή η προσέγγιση μπορεί να οδηγήσει σε ακόμη καλύτερα αποτελέσματα στο μέλλον. To δεύτερο μέρος της εργασίας αφορά στην αυτόματη εξαγωγή πολυλεκτικών εκφράσεων από αυτόματα συντακτικά αναλυμένα προτάσεις ενός σώματος κειμένων λεξικών μονάδων (tokens) από το ηλεκτρονικό αρχείο μιας ελληνικής εφημερίδας. Για την εξαγωγή χρησιμοποιήθηκε το εργαλείο mwetoolkit, με τη βοήθεια του οποίου εξήχθησαν υποψήφιες πολυλεκτικές δομές που αξιολογήθηκαν χειρωνακτικά. Οι εκφράσεις περιελάμβαναν υποστηρικτικά ρήματα και πολυλεκτικές προθέσεις. Η επισημείωση των πολυλεκτικών δομών έλαβε υπόψη της τις σύγχρονες θεωρητικές προσεγγίσεις για τα πολυλεκτικά και κατέληξε με τη βοήθεια της στατιστικής επεξεργασίας τους στη σύνταξη παράλληλα ενός γλωσσικού πόρου με υποστηρικτικά ρήματα της νέας ελληνικής. Ο πόρος αυτός μπορεί να χρησιμοποιηθεί σε πλήθος εφαρμογών ΕΦΓ, από τη βελτίωση των αποτελεσμάτων της συντακτικής ανάλυσης έως την καλύτερη εξαγωγή σημασιολογικών σχέσεων και την συμπίεση κειμένου. iv

5 Περιεχόμενα Ευχαριστίες... iii Περίληψη... iv Ευρετήριο Σχημάτων... ii Ευρετήριο Πινάκων... ii Εισαγωγή Γραμματικές Εξαρτήσεων (Dependency Grammars) Τράπεζες Δέντρων (Treebanks) Τύποι Συντακτικών Δέντρων Τράπεζες Δέντρων Φραστικής Δομής Τράπεζες Δέντρων Εξάρτησης Επισημείωση Δέντρων Εξάρτησης Σχήματα Επισημείωσης Prague Dependency Treebank Stanford Dependencies Εναρμονισμένα Σχήματα Επισημείωσης Universal Stanford Dependencies και Universal Dependency Treebanks Ελληνική Τράπεζα Δέντρων Εξάρτησης (Greek Dependency Treebank) Το σχήμα επισημείωσης στο GDT Συντακτική Ανάλυση με βάση τις Εξαρτήσεις (Dependency Parsing) Μετρικές Αξιολόγησης των συνακτικών αναλυτών που βασίζονται στις εξαρτήσεις Πείραμα εκπαίδευσης συντακτικών αναλυτών στο GDT Ερευνητική διαδικασία Πειράματα Λάθη κατά τη χειρωνακτική επισημείωση - Ποιοτική αξιολόγηση Πολυλεκτικές εκφράσεις Κατηγοριοποίηση των πολυλεκτικών εκφράσεων Λεξιλογικές συνάψεις Παγιωμένες εκφράσεις Υποστηρικτικά ρήματα της νέας ελληνικής Κριτήρια διάκρισης υποστηρικτικών ρημάτων Συντακτική δομή των υποστηρικτικών ρημάτων Πολυλεκτικές εκφράσεις και επεξεργασία φυσικής γλώσσας Έρευνες με αντικείμενο τα υποστηρικτικά ρήματα Εξαγωγή πολυλεκτικών με το εργαλείο mwetoolkit Περιγραφή της διαδικασίας εξαγωγής πολυλεκτικών εκφράσεων Αποτελέσματα Ποιοτική αξιολόγηση των αποτελεσμάτων Επίλογος Ξενόγλωσση Βιβλιογραφία Ελληνόγλωσση Βιβλιογραφία Ηλεκτρονικές Διευθύνσεις Παράρτημα Pattern των function words Απόσπασμα από το pattern των Υποστηρικτικών Ρημάτων Πίνακας των Υποστηρικτικών ρημάτων LVs Λειτουργικές πολυλεκτικές προθέσεις i

6 Ευρετήριο Σχημάτων Σχήμα 1: Η βασική παραδοχή στις αναπαραστάσεις με βάση τις σχέσεις εξάρτησης... 4 Σχήμα 2. Επίπεδα επισημείωσης στο PDT για την πρόταση "Byl by_sel do lesa." Σχήμα 3: Βασική δενδρική αναπαράσταση στο SD Σχήμα 4: Αναπαράσταση με άμεση εξάρτηση λέξεων που είναι φορείς σημασίας Σχήμα.5. Μη προβολική σχέση (Πηγή:Prokopidis et al, 2011) Σχήμα 6: Παραδείγματα ελληνικής δενδροτράπεζας Σχήμα 7: Οι συνδέσεις μεταξύ των λέξεων-κόμβων στους δύο γράφους Σχήμα 8: Περιβάλλον εργασίας Tred Σχήμα 9: Δείγμα από το εργαλείο mwetoolkit Ευρετήριο Πινάκων Πινακας 1 : Σημασιολογικοί ρόλοι στο GDT Πίνακας 2 : Οι σχέσεις εξάρτησης στην Ελληνική Τράπεζα Δέντρων Εξάρτησης Πίνακας 3 :Βασικές σχέσεις εξάρτησης στο GDT Πίνακας 4: Τα συνολικά δεδομένα και τα χαρακτηριστικά τους Πίνακας 5: Αποτελέσματα από την ανάλυση του GDT με το Mateparser Πίνακας 6: Συγκριτικά αποτελέσματα Πίνακας 7: Δεδομένα για την αυτόματη εξαγωγή multi-words Πίνακα 8. Δείγμα εξαγωγής υποψήφιων υποστηρικτικών ρημάτων με το mwetoolkit εργαλείο σε αρχείο excel Πίνακας 9. Συνολικά αποτελέσματα από την επισημείωση των υποψήφιων ρηματικών δομών Πίνακας 10: Αποτελέσματα από την επισημείωση των υποψήφιων υποστηρικτικών ρημάτων Πίνακας 11 : Τα δέκα πιο υψίσυχνα ουσιαστικά κατά φθίνουσα σειρά ii

7 Εισαγωγή Η ανάπτυξη ενός μεγάλου φάσματος εφαρμογών Επεξεργασίας Φυσικής Γλώσσας προϋποθέτει την επισημείωση γλωσσικών πόρων που αναπαρίστανται ως ένα συντακτικό δέντρο για τη βελτίωση της απόδοσης αυτόματων συντακτικών αναλυτών. Τα συντακτικά δέντρα που επιλέγονται περισσότερο τα τελευταία χρόνια είναι οι Τράπεζες Δέντρων Εξάρτησης, οι οποίες θεωρούνται κατάλληλες αναπαραστάσεις για γλώσσες με ελεύθερη σειρά των όρων τους. Μια από τις σημαντικότερες Τράπεζες Δέντρων Εξάρτησης είναι το Prague Dependency Treebank για την τσέχικη γλώσσα. Τράπεζα Δέντρων Εξάρτησης έχει δημιουργηθεί και για την ελληνική γλώσσα (Prokopidis et al, 2005, 2014), η οποία διαρκώς εμπλουτίζεται με νέο επισημειωμένο υλικό από το 2005 μέχρι σήμερα. Παράλληλα με τον εμπλουτισμό του γλωσσικού αυτού πόρου, μελετάται η επισημείωση δύσκολων συντακτικών φαινομένων και διεξάγονται πειράματα με στόχο τη βελτίωση της αυτόματης επισημείωσης από έναν συντακτικό αναλυτή. Με δεδομένα τα παραπάνω, στόχος του πρώτου μέρους της παρούσης εργασίας είναι κατά κύριο λόγο η αύξηση της τελευταίας έκδοσής του GDT και η βελτίωση, στη συνέχεια της απόδοσης του συντακτικού αναλυτή Mateparser, όπως αυτή παρουσιάστηκε στο πείραμα των Prokopidis & Papagerorgiou (2014). Ειδικότερα, στο κεφάλαιο 1 γίνεται μια αρχική θεωρητική προσέγγιση των Dependency Grammars ενώ στο κεφάλαιο 2 γίνεται λόγος για τις Τράπεζες Δένδρων και τα είδη τους, τα phrasal treebanks και τα dependency treebanks. Στο κεφάλαιο 3 γίνεται αναφορά στα επικρατέστερα σχήματα επισημείωσης ενώ στο κεφάλαιο 4 περιγράφεται η Ελληνική Τράπεζα Δέντρων Εξάρτησης (Greek Dependency Treebank). Στο κεφάλαιο 5 προσεγγίζονται τα ζητήματα συντακτικής ανάλυσης βάσει εξαρτήσεων (dependency parsing), οι μετρικές αξιολόγησης των συντακτικών αναλυτών που βασίζονται στις εξαρτήσεις (AMs) καθώς και το πείραμα για τη βελτίωση της απόδοσης των συντακτικών αναλυτών πάνω στην Ελληνική Τράπεζα Δέντρων στην έκδοση του Στο κεφάλαιο 6 παρουσιάζεται η ερευνητική διαδικασία που αφορά στην αύξηση του επισημειωμένου υλικού της τελευταίας έκδοσης του GDT και στην αξιολόγηση της απόδοσης του MateParser, του συντακτικού αναλυτή που είχε καλύτερη απόδοση στο πείραμα του 2014, ενώ στη συνέχεια γίνεται μια ποιοτική αξιολόγηση των συντακτικών φαινομένων που φαίνεται ότι επηρεάζουν τη χειρωνακτική επισημείωση στο GDT. Στο δεύτερο μέρος της εργασίας αξιοποιείται αρχικά η χρήση του συντακτικού αναλυτή που περιγράφεται στο πείραμα του πρώτου μέρους για την εξαγωγή συγκεκριμένων τύπων 1

8 πολυλεκτικών εκφράσεων (Multi Word Expressions, MWE), των υποστηρικτικών ρημάτων κατά κύριο λόγο και συμπληρωματικά των πολυλεκτικών προθέσεων. Το ενδιαφέρον για την υπολογιστική επεξεργασία των πολυλεκτικών εκφράσεων σχετίζεται με την ιδιωματικότητά τους και τη δυσκολία του υπολογιστή να αντιληφθεί τη σχέση της συνολικής σημασίας μιας πολυλεκτικής έκφρασης με τη διαφορετική σημασία των επιμέρους συστατικών της. Η συντακτική ιδιωματικότητα των πολυλεκτικών εκφράσεων μπορεί να προκαλέσει, επίσης, προβλήματα σε επίπεδο συντακτικής ανάλυσης. Δεν είναι σπάνιο οι πολυλεκτικές εκφράσεις να είναι η αιτία μιας λανθασμένης συντακτικής ανάλυσης πρότασης ή και άστοχων μεταφράσεων. Η μεγάλη δε πρόκληση για τις εφαρμογές στην επεξεργασία φυσικής γλώσσας (Natural Language Processing) είναι η αντιμετώπιση πολλών από τις πολυλεκτικές εκφράσεις ως μια ενότητα (single unit), από τη στιγμή που ο τεμαχισμός τους προκαλεί απώλεια πληροφορίας σε σημασιολογικό επίπεδο αλλά και υπερπαραγωγή σε συντακτικό επίπεδο. Συνεπώς, η ετερογένεια στο χαρακτήρα τους και η μορφολογική και συντακτική τους ευκαμψία (flexibility) καθιστά δύσκολη την αναγνώρισή τους και γενικά την επεξεργασία τους από τη μηχανή. Για την εξαγωγή χρησιμοποιήθηκε το mwetoolkit, ένα εργαλείο εξαγωγής υποψήφιων πολυλεκτικών εκφράσεων με βάση μορφοσυντακτικούς περιορισμούς ή στατιστική πληροφορία εξαχθείσα από μεγάλα σώματα κειμένων. Οι εκφράσεις που ταξινομήθηκαν ως πολυλεκτικές χειρωνακτικά μπορούν να χρησιμοποιηθούν για τη βελτίωση των αποτελεσμάτων του συντακτικού αναλυτή αλλά και σε μια σειρά εφαρμογών ΕΦΓ, όπως είναι η μηχανική μετάφραση, η εξαγωγή σημασιολογικών σχέσεων και η συμπίεση κειμένου. Αναλυτικότερα, στο δεύτερο μέρος της εργασίας, στο κεφάλαιο 7 γίνεται αρχικά μια σύντομη περιγραφή των πολυλεκτικών εκφράσεων και των ιδιοτήτων τους, ακολουθεί η ταξινόμηση των πολυλεκτικών εκφράσεων σε διάφορες κατηγορίες με κριτήρια κυρίως μορφοσυντακτικά και μια σύντομη αναφορά στις λεξιλογικές συνάψεις και παγιωμένες ή κατ άλλους στερεότυπες ρηματικές περιφράσεις. Στη συνέχεια, γίνεται ενδελεχής αναφορά στα υποστηρικτικά ρήματα της Ν.Ε., στα κριτήρια διάκρισής τους, στη συντακτική τους δομή. Αμέσως μετά παρουσιάζονται κάποιες έρευνες τόσο για τις πολυλεκτικές εκφράσεις γενικά στα πλαίσια επεξεργασίας της φυσικής γλώσσας καθώς και για τα υποστηρικτικά ρήματα. Ακολουθεί στο κεφάλαιο 8 η περιγραφή της διαδικασίας εξαγωγής των υποστηρικτικών ρημάτων, κατά βάση και των πολυλεκτικών προθέσεων, με το εργαλείο mwetoolkit, το σχήμα επισημείωσης που χρησιμοποιήθηκε για το φιλτράρισμα των υποψήφιων υποστηρικτικών ρημάτων και τέλος, η παράθεση των αποτελεσμάτων καθώς και μια ποιοτική αξιολόγησή τους. 2

9 1. Γραμματικές Εξαρτήσεων (Dependency Grammars) Οι συντακτικές αναπαραστάσεις στις οποίες κάθε λέξη μιας πρότασης εξαρτάται από μία άλλη, την κεφαλή της, έχουν μακρά παράδοση στη θεωρητική γλωσσολογία. Οι ρίζες αυτών των γραμματικών εξαρτήσεων (dependency grammars) πηγαίνουν πίσω πολλούς αιώνες στη γραμματική της σανσκριτικής γλώσσας του Panini και σε θεωρίες της γραμματικής της εποχής του Μεσαίωνα για να αναπτυχθούν ιδιαίτερα σα μια μορφή παρουσίασης σε συντακτικό επίπεδο από παραδοσιακούς γραμματιστές, κυρίως στην Ευρώπη, τα νεότερα χρόνια (Nivre, 2006). H γραμματική αυτή παράδοση συνεχίστηκε με το ερευνητικό έργο του Tesniere το 1959,που θεωρείται και η αφετηρία για τη μοντέρνα εκδοχή της γραμματικής εξαρτήσεων. Βέβαια, η κυριαρχία της μετασχηματιστικής γενετικής γραμματικής του Chomsky που χρησιμοποίησε τη φραστική δομή (constituency) ως βασικό συντακτικό εργαλείο έβαλε στο περιθώριο τη γραμματική εξαρτήσεων μέχρι τις αρχές του Παρ όλα αυτά, από το 1960 και για μια περίοδο δέκα περίπου χρόνων έγιναν μια σειρά από δημοσιεύσεις σχετικές με το συγκεκριμένο είδος γραμματικής ορμώμενες από τη χρήση αυτών των αναπαραστάσεων σε εφαρμογές της υπολογιστικής γλωσσολογίας, όπως είναι η μηχανική μετάφραση και άλλα είδη επεξεργασίας κειμένου. Σταδιακά, αναπτύχθηκε ένα πλούσιο θεωρητικό υπόβαθρο και ένα πλήθος γραμματικών θεωριών και φορμαλισμών εκτός της δομικής σύνταξης του Tesniere, όπως είναι οι Word Grammar, Fuctional Generative Description, Dependency Unification Grammar, Meaning Text Theory, Lexicase, Constraint Dependency Grammar, Fuctional Dependency Grammar, Extensible Dependency Grammar που μοιράζονται ένα βασικό κοινό ισχυρισμό σχετικά με τη συντακτική δομή της γλώσσας (Nivre, 2006, Mel čuk, 2009), που συνοπτικά παρουσιάζεται στα λόγια του Tesniere που ακολουθούν (Schneider, 1998): The sentence is an organized whole; its constituent parts are the words. Every word that functions as part of a sentence is no longer isolated as in the dictionary: themind the mind perceives connections between the word and its neighbors; the totality of these connections forms the scaffolding of the sentence. The structural connections establish relations of dependency among the words. Each such connection in principle links a superior term and an inferior term. The superior term receives the name governor; the inferior term receives the name dependent. Η παραπάνω αρχή αποτυπώνεται στο παρακάτω σχήμα (σχ.1): 3

10 Σχήμα 1: Η βασική παραδοχή στις αναπαραστάσεις με βάση τις σχέσεις εξάρτησης Οι σχέσεις εξάρτησης μιας πρότασης σχηματίζουν έναν γράφο. Ο γράφος αποτελείται από κόμβους που είναι τα λεξικά τεμάχια και τα τόξα του γράφου συνοδεύονται από ετικέτες που δηλώνουν τη σχέση εξάρτησης της κάθε λέξης με την κεφαλή της. Εναλλακτικά, μπορούμε να πούμε ότι βασική αρχή αυτών των αναπαραστάσεων είναι η παραδοχή ότι η συντακτική δομή αποτελείται από λεξικά στοιχεία που συνδέονται από δυαδικές ασύμμετρες σχέσεις που ονομάζονται dependencies (εξαρτήσεις) και όχι συστατικά. Εφόσον δεχτούμε α) ότι υπάρχει ένας τεχνητός κόμβος από τον οποίον εξαρτάται κάθε λέξη που δεν εξαρτάται από άλλη λέξη και β) ότι κάθε λέξη έχει μόνο μία κεφαλή, ο γράφος αυτός είναι μια δενδρική δομή. Η δενδρική αυτή αναπαράσταση, όπως θα δούμε παρακάτω, δεν είναι απολύτως αποδεκτή από όλους τους ερευνητές. Για την ώρα όμως, ας αποδεχτούμε ότι η συντακτική δομή αναπαρίσταται με τη χρήση δέντρων εξάρτησης (dependency trees) συνόλων κόμβων των οποίων οι αλληλοσυνδέσεις προσδιορίζουν δομικές σχέσεις. Μια σχέση εξάρτησης αναπτύσσεται μεταξύ μιας κεφαλής H (head) και ενός εξαρτώμενου όρου D (dependent), διαφορετικά ενός κυβερνήτη (governor) και ενός προσδιοριστή (modifier). Οι δηλώσεις που προσδιορίζουν τις σχέσεις κυβέρνησης και εξάρτησης, στις οποίες μπορεί να εμπλακεί η κάθε τάξη μονάδων, είναι γνωστές ως κανόνες εξάρτησης (dependency rules) (Mel čuk, 2009). Η δομή εξάρτησης μιας πρότασης, x με λέξεις x [x1 xn], είναι ο άμεσος γράφος του συνόλου των σχέσεων του x που περιέχει μια άκρη από i στο j εάν και μόνο εάν το xj εξαρτάται από το xi. Με αυτόν τον τρόπο, οι δομές εξαρτήσεων μπορούν να μεταφέρουν συγκεκριμένες όψεις της γλωσσολογικής δομής μιας πρότασης και να εκφράσουν τις γλωσσικές έννοιες με γραφικές παραστάσεις. Επιπλέον, η συντακτική σχέση που υπάρχει ανάμεσα σε μια κεφαλή H (head) και σε έναν εξαρτώμενο όρο D (dependent) μέσα σε μια δομή C (construction) υπακούει σε ποικίλα κριτήρια συντακτικού ή σημασιολογικού περιεχομένου (Nivre, 2006, Kubler et al, 2009) που μας βοηθούν να διακρίνουμε την κεφαλή από τον εξαρτώμενο όρο: 1. Η H καθορίζει τη συντακτική κατηγορία μιας δομής C και συχνά την αντικαθιστά. 2. Η H καθορίζει τη σημασιολογική κατηγορία της C; ο D δίνει μια σημασιολογική εξειδίκευση. 4

11 3. Η H είναι υποχρεωτική; O D είναι προαιρετικός. 4. Η H επιλέγει το D και ορίζει αν ο D είναι υποχρεωτικός ή προαιρετικός. 5. Η μορφή του D βασίζεται στην H (agreement or government) 6. H γραμμική θέση του D καθορίζεται μέσω της H. Η ποικιλία των παραπάνω κριτηρίων, συντακτικών και σημασιολογικών έχει σαν αποτέλεσμα άλλοι θεωρητικοί να ισχυρίζονται ότι η κεφαλή καλύπτει όλες σχεδόν τις σχέσεις εξάρτησης (Νivre, 2006) και άλλοι, όπως ο Mel čuk (2009) να μιλάνε για διαφορετικά είδη σχέσεων εξάρτησης. Σύμφωνα με τον Mel čuk (2009, 2011) υπάρχουν τρία είδη σχέσεων εξάρτησης μεταξύ των λεξικών τύπων σε μία πρόταση: η σημασιολογική, η συντακτική και η μορφολογική εξάρτηση. Η σημασιολογική εξάρτηση αφορά κατηγορήματα και ορίσματα. Τα ορίσματα ενός κατηγορήματος είναι σημασιολογικά εξαρτώμενα από το κατηγόρημα αυτό. Το όρισμα ενός κατηγορήματος μπορεί να είναι ένα άλλο κατηγόρημα με δικά του ορίσματα. Οι μορφολογικές εξαρτήσεις υφίστανται μεταξύ λέξεων ή τμημάτων λέξεων. Όταν μορφολογικά μία λέξη ή τμήμα αυτής επηρεάζει τη μορφή μιας άλλης λέξης, τότε η τελευταία εξαρτάται από την προηγούμενη. Η συμφωνία (agreement), η κυβέρνηση (government) και η αναλογία (congruence) αποτελούν τις τρεις βασικές υποκατηγορίες της μορφολογικής εξάρτησης (Mel čuk, 2009). Και στις τρεις περιπτώσεις ένας λεξικός τύπος (wordform) w 2 εξαρτάται μορφολογικά από έναν λεξικό τύπο (wordform) w 1 σύμφωνα με μια κλιτική κατηγορία c 2. O λεξικός τύπος w 1 ονομάζεται (controller), ενώ ο λεξικός τύπος w 2 στόχος (target) της μορφολογικής εξάρτησης (Μel cuk, 2009). Γενικά, όπως και στο σημασιολογικό είδος εξάρτησης, οι μορφολογικές σχέσεις μπορεί να επικαλύπτονται από τις συντακτικές και να στρέφονται προς την ίδια κατεύθυνση, μπορεί όμως, να κατευθύνονται αντίθετα ή να είναι ολότελα ανεξάρτητες από αυτές. Ενώ το σημασιολογικό είδος εξάρτησης (semantic dependency) συνδέεται απευθείας με τo νόημα (meaning) ώστε να γίνεται κατανοητό και η μορφολογικού τύπου εξάρτηση (morphological dependency) συνδέεται απεθείας με το φωνολογικό επίπεδο, ώστε και αυτό να γίνεται αντιληπτό, το είδος της συντακτικής εξάρτησης (syntactic dependency) δεν συνδέεται άμεσα με τη σημασία ούτε με τη μορφή, είναι πιο αφηρημένο, έμμεσο και αμφισβητήσιμο (Νivre, 2006). H συντακτική εξάρτηση είναι σύμφωνη με τη συντακτική δομή της πρότασης, η οποία βρίσκεται ανάμεσα στη σημασιολογική και μορφολογική δομή της. Σύμφωνα με τον Μel cuk (2011) το πέρασμα από τη σημασιολογική δομή στη μορφολογική απαιτεί τη βαθιά 5

12 συντακτική δομή (Deep-Syntactic structure = DSyntS)) και την επιφανειακή συντακτική δομή (Surface-Syntactic structure = SSyntS). Και οι δύο βασίζονται στη συντακτική εξάρτηση η οποία αποτυπώνεται ως ένα δέντρο εξαρτήσεων. Oι συντακτικές εξαρτήσεις συνδέουν πρώτον τα στοιχεία μιας φράσης (lexemes) και αποφασίζουν για την κατανομή (distribution) της φράσης μέσα σε μια πρόταση και δεύτερον ελέγχουν τη γραμμική (linear) θέση των συντακτικά εξαρτημένων όρων με τον κυβερνήτη τους. Για παράδειγμα στην ελληνική γλώσσα το επίθετο ακολουθεί το ουσιαστικό απ το οποίο κυβερνείται ενώ στην αγγλική βρίσκεται πριν από αυτό. Απαραίτητο είναι, ακόμη, για άλλους ερευνητές να υπάρξει διάκριση της συντακτικής εξάρτησης σε ενδοκεντρικό (endocentric) και εξωκεντρικό (exoncentric) επίπεδο (Nivre, 2006). Για παράδειγμα στην αγγλική πρόταση που ακολουθεί Economic news had little effect on [financial] markets η σχέση NMOD ανάμεσα στο ουσιαστικό markets και το επίθετο financial είναι μια ενδοκεντρική δομή, όπου η κεφαλή μπορεί να αντικαταστήσει όλη τη φράση financial markets χωρίς να επηρεάσει τη συντακτική δομή. Οι ενδοκεντρικές δομές μπορεί να ικανοποιούν όλα τα κριτήρια που απαριθμήθηκαν προηγουμένως, με εξαίρεση το τέταρτο, καθώς οι εξαρτημένοι όροι σε μια ενδοκεντρική δομή θεωρούνται προαιρετικοί και δεν επιλέγονται από τις κεφαλές τους. Αντίθετα, η σχέση PMOD ανάμεσα στην πρόθεση on και το ουσιαστικό markets είναι μια εξωκεντρική δομή, όπου η κεφαλή δεν μπορεί να αντικαταστήσει όλη τη φράση Economic news had little effect on financial [market]. Οι εξωκεντρικές (exocentric) δομές δεν πληρούν το πρώτο κριτήριο (Nivre, 2006). Να σημειωθεί, ακόμη, ότι οι σχέσεις υποκειμένου-αντικειμένου είναι καθαρά εξωκεντρικές, ενώ οι σχέσεις μεταξύ προσδιορισμού και προσδιοριζόμενου όρου από ουσιαστικό στο επίθετο είναι ενδοκεντρικές (Kubler et al., 2009). Η διάκριση επίσης, μεταξύ ενδοκεντρικής και εξωκεντρικής δομής είναι συναφής με τη διάκριση των σχέσεων μεταξύ κεφαλής-συμπληρώματος και κεφαλής-προσδιοριστή που συναντάμε σε άλλες συντακτικές θεωρίες. Η διάκριση, ακόμη, συμπληρωμάτων και προσδιορισμών, μπορεί να εξεταστεί και όσον αφορά το σθένος (valency). H βασική ιδέα είναι ότι το ρήμα επιβάλλει απαιτήσεις στις συντακτικές εξαρτήσεις του, ενώ οι εξαρτώμενοι όροι που ανταποκρίνονται στα ορίσματα ενός κατηγορήματος μπορεί να είναι είτε υποχρεωτικοί (obligatory) ή προαιρετικοί (optional) σε επίπεδο επιφανειακής δομής (Kubler et al., 2009). Eκτός από α) τις θεωρίες που βασίζονται σε μια απλή συντακτική παρουσίαση των σχέσεων εξάρτησης μεταξύ των λεξικών μονάδων (tokens) β) θεωρίες που χρησιμοποιούν διάφορα επίπεδα παρουσίασης, όπως μια επιφανειακή συντακτική παρουσίαση σε αναλυτικό επίπεδο 6

13 και μια πιο επιφανειακή σημασιολογική ανάλυση ή γ) θεωρίες που δέχονται ότι οι σχέσεις εξάρτησης δημιουργούνται μεταξύ λεξικών στοιχείων (lexical elements) παρά φράσεων και ότι οι κόμβοι της εξαρτημένης δομής είναι απλώς οι τύποι των λέξεων που υπάρχουν σε μία πρόταση, υπάρχουν θεωρίες που περιλαμβάνουν πιο αφηρημένες οντότητες, όπως λήμματα (lemmas) ή λεξήματα (lexemes). Ακόμη, είναι πιθανό τα στοιχεία να μην περιλαμβάνουν μόνο τύπους λέξεων, αλλά να ανταποκρίνονται σε μικρότερα τμήματα (units). Επίσης, οι περισσότερες θεωρίες ακολουθούν ένα σύνολο επιφανειακών γραμματικών λειτουργιών, όπως υποκείμενο, αντικείμενο, επιρρηματικός προσδιορισμός κ.α., ενώ άλλες χρησιμοποιούν σημασιολογικούς τύπους, όπως agent, patient, goal από τη θεωρία των θεματικών ρόλων (thematic roles), χωρίς να αποκλείτεται να αξιοποιούνται και οι δύο μορφές, δηλαδή οι γραμματικές λειτουργίες στο αναλυτικό επίπεδο και οι σημασιολογικοί ρόλοι σε άλλα, όπως στο τεκτογραμματικό επίπεδο αναπαράστασης της σχολής της Πράγας. Τέλος, αξίζει να σημειωθεί ότι εκτός από δομές κεφαλής-συμπληρώματος και κεφαλήςπροσδιοριστή που αναλύονται ξεκάθαρα στην γραμματική εξαρτήσεων, υπάρχουν δομές που είναι λιγότερο σαφώς προσδιορισμένες. Αυτές αφορούν λειτουργικές λέξεις, όπως άρθρα, συμπληρώματα και βοηθητικά ρήματα, αλλά και προθετικές φράσεις. Για τις δομές αυτές δεν υπάρχει μια ξεκάθαρη μεταχείριση από την πλευρά της γραμματικής εξαρτήσεων, αν θα πρέπει, δηλαδή, να αναλύονται σαν σχέση κεφαλής και εξαρτώμενου όρου ή ποιο ρόλο παίζει η κάθε λέξη. Μια άλλη ακόμη, προβληματική δομή για την γραμματική εξαρτήσεων είναι η παρατακτική σύνδεση (coordination), καθώς δεν είναι σαφές αν θα πρέπει να αναλύεται ως μια δυαδική ασύμμετρη σχέση μεταξύ της κεφαλής και του εξαρτώμενου όρου καθώς σε μια παρατακτική σύνδεση υπάρχουν πολλές κεφαλές που μπορούν να αντικαταστήσουν συνολικά μια δομή (Kubler et al, 2009). 2. Τράπεζες Δέντρων (Treebanks) Ο όρος τράπεζες δέντρων ή δενδροτράπεζες (treebanks) χρησιμοποιείται στον χώρο της Επεξεργασίας Φυσικής Γλώσσας για να δηλώσει μια σειρά από συντακτικά δέντρα που αναπαριστούν τη συντακτική ανάλυση πολλών προτάσεων, προτάσεων που συνήθως αποτελούνται από συνεχείς ακολουθίες αυθεντικών προτάσεων και κειμένων ενός ηλεκτρονικού corpus (Hajic, 2006). Η συντακτική ανάλυση μιας πρότασης (parsing) είναι το ενδιάμεσο στάδιο μεταξύ μιας επιφανειακής έκφρασης (γραπτής ή προφορικής) και της σημασιολογικής της αναπαράστασης. Η συντακτική ανάλυση αποδίδει μια συντακτική δομή σε μία έκφραση και αποτελεί σημαντικό βήμα για την κατανόησή της, αφού έχει προηγηθεί η διαδικασία της ακουστικής και μορφολογικής επεξεργασίας. 7

14 O όρος treebank καθιερώθηκε από τον Leech το 1980 (Nivre, 2006) με βάση την παραδοχή ότι ο πιο συνηθισμένος τρόπος αναπαράστασης της γραμματικής ανάλυσης μιας γλώσσας είναι η δενδρική δομή. Οι πρώτες τράπεζες δέντρων εμφανίστηκαν περίπου το 1970, όταν μια ομάδα σουηδών φοιτητών επισημείωσε χειρωνακτικά περίπου 300,000 λέξεις γραπτού και προφορικού λόγου της σουηδικής γλώσσας με τη μορφή συντακτικών δέντρων εξάρτησης (dependency parsing) και ένα μέρος με τη μορφή των φραστικών δομών (Nivre, 2008). Tα τελευταία, ωστόσο, δεκαπέντε χρόνια έχει παραχθεί ένας μεγάλος αριθμός συντακτικών δέντρων για πλήθος γλωσσών βασισμένος στο συνδυασμό της χειρωνακτικής αλλά και της αυτόματης πλέον επισημείωσης, ως προϊόν σύγκλισης της υπολογιστικής γλωσσολογίας και της γλωσσολογίας των σωμάτων κειμένων. Οι τράπεζες δένδρων δημιουργούνται συχνά πάνω σε ένα σώμα κειμένων που έχει επισημειωθεί με ετικέτες μορφολογικού περιεχομένου (part of speech tagging) και μπορεί να εμπλουτιστεί περαιτέρω με σημασιολογική ή άλλου είδους γλωσσολογική πληροφορία. Μια τράπεζα δέντρων μπορεί να είναι καθαρά προϊόν χειρωνακτικής επισημείωσης από ειδικούς (συνήθως γλωσσολόγους ή μεταπτυχιακούς φοιτητές γλωσσολογίας) που εκπαιδεύονται κατάλληλα υπό την καθοδήγηση ειδικών, ή μπορεί να είναι το αποτέλεσμα μιας ημιαυτόματης διαδικασίας που συνδυάζει την αυτόματη επισημείωση μιας πρότασης από έναν αυτόματο συντακτικό αναλυτή και τον έλεγχό της στη συνέχεια από έναν επισημειωτή. Ο σχεδιασμός μιας τράπεζας δέντρων αναδεικνύει πλήθος ζητημάτων προς επίλυση που σχετίζονται με το είδος του υλικού που πρέπει να επισημειωθεί αλλά και με τα σχήματα επισημείωσης που θα χρησιμοποιηθούν. Κατά το σχεδιασμό μιας τράπεζας δέντρων μπορούν να επισημειωθούν κείμενα είτε γραπτού είτε προφορικού λόγου. Ωστόσο, όπως είναι φυσικό, είναι πολύ μεγαλύτερος ο αριθμός των γραπτών κειμένων που έχουν επισημειωθεί, και για αυτόν τον λόγο, πολλά σχήματα επισημείωσης τείνουν να βασίζονται σε παραδείγματα και κείμενα γραπτού λόγου. Παρά ταύτα, υπάρχει ένα μικρός αριθμός παρόμοιων πόρων και για τον προφορικό λόγο, κυρίως για την αγγλική γλώσσα αλλά και για την γερμανική, την ιαπωνική και τη δανέζικη γλώσσα. Στο μέλλον, ο αριθμός πόρων για σώματα προφορικού λόγου αναμένεται να αυξηθεί σημαντικά (Nivre, 2006) Ένα άλλο ζήτημα που προκύπτει κατά το σχεδιασμό μιας τράπεζας δέντρων είναι η επιλογή επισημείωσης ενός ισόρροπου δείγματος διαφορετικών κειμενικών ειδών, προφορικών ή γραπτών ή η επικέντρωση σε ένα μόνο είδος. Το συνηθέστερο, βέβαια, είναι η δημιουργία μιας τράπεζας δέντρων να βασίζεται σε ήδη υπάρχοντα σώματα κειμένων (Νivre, 2008). Η πλειονότητα δε διαθέσιμων treebanks για τη γραπτή γλώσσα αφορά κείμενα εφημερίδων στα οποία οι ερευνητές έχουν συνήθως ευκολότερη πρόσβαση. Τέτοια περίπτωση αποτελεί το 8

15 Penn Treebank (Marcus et al., 1993) ένα τμήμα του οποίου αξιοποίησε κείμενα της εφημερίδας Wall Street Journal και αποτέλεσε πρότυπο για ένα ευρύ φάσμα παρόμοιων γλωσσικών πόρων Τύποι Συντακτικών Δέντρων Οι υπάρχουσες τράπεζες δέντρων (treebanks) ταξινομούνται σε δύο κατηγορίες με κριτήριο την γλωσσολογική θεωρία που ακολουθούν. Διακρίνονται στις τράπεζες δέντρων φραστικής δομής (constituency ή phrase-structure treebanks) και στις τράπεζες δέντρων εξάρτησης (dependency treebanks) Τράπεζες Δέντρων Φραστικής Δομής Oι τράπεζες δέντρων φραστικής δομής έχουν ως βάση γραμματικές ανεξάρτητες συμφραζομένων (context free grammars). Kάθε κόμβος μιας τράπεζας δέντρων φραστικών δομών έχει μία ετικέτα. Η ρίζα του δέντρου που τυπικά δηλώνεται ως S για την πρόταση διαιρείται σε δύο ή περισσότερα υποδέντρα, με ετικέτες που δηλώνουν ότι πρόκειται για μη τερματικά σύμβολα που δηλώνουν φραστικές δομές (ΟΦ για τις ονοματικές φράσεις, ΡΦ για τις ρηματικές φράσεις κ.α.). Τα υποδέντρα αυτά διαιρούνται με τη σειρά τους περαιτέρω μέχρι να καταλήξουν σε τερματικούς κόμβους που στην ουσία αποτελούν την επιφανειακή ακολουθία λέξεων της πρότασης. Οι κόμβοι που προηγούνται των τερματικών κόμβων ονομάζονται προ-τερματικοί κόμβοι και φέρουν ετικέτες με πληροφορίες μορφολογικού περιεχομένου (part of speech tags) για τις λέξεις των τερματικών κόμβων κάτω από αυτές. Ο αριθμός των κόμβων μιας τράπεζας δέντρων είναι συνήθως διπλάσιος ή τριπλάσιος του αριθμού των tokens της προς ανάλυση πρότασης (Ηajic, 2006) Τράπεζες Δέντρων Εξάρτησης Η άλλη κατηγορία αφορά τις τράπεζες δέντρων που βασίζονται σε δέντρα εξάρτησης. Οι αναλυτές δέντρων εξάρτησης δημιουργούν για κάθε πρόταση που δέχονται ως είσοδο δέντρα, όπου κάθε λέξη εξαρτάται από μια λέξη κεφαλή και παίρνει μια ετικέτα που δηλώνει τη σχέση της με αυτή τη λέξη κεφαλή. Αναλυτικότερα, στις τράπεζες δέντρων εξάρτησης οι κόμβοι φέρουν σύνθετες ετικέτες, που συνήθως είναι τουλάχιστον τρεις σε κάθε κόμβο. Αυτές είναι η λέξη, όπως εμφανίζεται στην 9

16 επιφανειακή δομή της πρότασης, μια ετικέτα που περιέχει πληροφορίες μορφολογικού περιεχομένου και μια ετικέτα που δηλώνει τη σχέση της με τη λέξη κεφαλή, που μπορεί να ονομάζεται και κόμβος κυβερνήτης (governor). Σε μια τράπεζα δέντρων εξάρτησης τα ρήματα τυπικά κυβερνούν τα συμπληρώματά τους (ορίσματα και προσαρτήματα), ενώ τα ουσιαστικά κυβερνούν τα επίθετα (attributes) και άλλους προσδιορισμούς (modifiers). Επίσης, ανάλογα με το σχήμα επισημείωσης της τράπεζας, οι υποτακτικοί σύνδεσμοι (conjunctions) κυβερνούν τις δευτερεύουσες προτάσεις που συνήθως τους ακολουθούν, οι προθέσεις το ουσιαστικό κεφαλή της φράσης στην οποία ανήκουν κ.α. Από τα παραπάνω γίνεται αντιληπτό ότι ο αριθμός των κόμβων σε μια δενδροτράπεζα εξάρτησης είναι ίσος με τα tokens μιας πρότασης (Hajic,2006). Οι τράπεζες δέντρων εξάρτησης μερικές φορές μπορεί να συνοδεύονται από πληροφορία σθένους που έχει ανακτηθεί ημιαυτόματα από λεξικά σθένους (valency lexica). 3. Επισημείωση Δέντρων Εξάρτησης Η χειρωνακτική επισημείωση μεγάλου αριθμού λέξεων σε μια τράπεζα δέντρων είναι μια σύνθετη διαδικασία που προϋποθέτει μια σειρά από εργασίες καθώς και έναν επαρκή αριθμό επισημειωτών. Μία από τις βασικότερες παραμέτρους που πρέπει να λαμβάνονται υπόψη κατά την επισημείωση μιας τράπεζας δένδρων είναι η ομοιογένεια στην επισημείωση του υλικού, ώστε να εξασφαλιστεί η ομοιόμορφη επισημείωση ίδιων ή παραπλήσιων γλωσσικών φαινομένων. Αυτό προϋποθέτει τη σύνταξη αναλυτικών οδηγιών, που μπορούν να χρησιμοποιηθούν για την εκπαίδευση των επισημειωτών και οι οποίες περιλαμβάνουν με σαφήνεια τις αρχές του σχήματος επισημείωσης αλλά και ποικίλα παραδείγματα τυπικών γλωσσικών φαινομένων ή και προβληματικών περιπτώσεων με την επισημείωσή τους (Nivre, 2008). Μια άλλη παράμετρος που πρέπει να λαμβάνεται υπόψη κατά τη δημιουργία μιας δενδροτράπεζας είναι η έκταση της αυτόματης και της χειρωνακτικής επισημείωσης. H χειρωνακτική επισημείωση ήταν η πρώτη μέθοδος που εφαρμόστηκε αλλά έχει το μειονέκτημα της χρονοβόρας και ταυτόχρονα δαπανηρής διαδικασίας (Nivre, 2008). Περαιτέρω, μπορεί να οδηγήσει σε μη συμβατές με τις οδηγίες επισημειώσεις, ειδικά όταν ο αριθμός των επισημειωτών είναι μεγάλος ώστε να αποκλίνουν μεταξύ τους στην αντιμετώπιση συγκεκριμένων φαινομένων. Από την άλλη πλευρά η αποκλειστικά αυτόματη επισημείωση πλεονεκτεί σε σχέση με τη χειρωνακτική, γιατί είναι πιο οικονομική αλλά και πιο ομοιόμορφη αν και η πολυπλοκότητα του σχήματος επισημείωσης μπορεί να οδηγήσει σε μεγάλο αριθμό λαθών. Κατ επέκταση, ο αυτόματος τρόπος προτιμάται μόνο όταν ο αριθμός των λέξεων προς επισημείωση είναι πολύ μεγάλος, ώστε η χειρωνακτική επισημείωση να 10

17 είναι ιδιαίτερα κοστοβόρα, όπως συνέβη για παράδειγμα με τις 200 εκατομμύρια λέξεις του σώματος κειμένων Bank of English (Nivre, 2008). Μια άλλη μέθοδος που εφαρμόζεται συχνά είναι ο συνδυασμός της αυτόματης επισημείωσης μεγάλων σωμάτων κειμένων με τη χειρωνακτική διόρθωση μικρότερων τμημάτων μετά την ολοκλήρωση της αυτόματης διαδικασίας (Nivre, 2008). Αυτή η μεθοδολογία εφαρμόστηκε στην ανάπτυξη του Penn Treebank και του Prague Dependency Treebank (Nivre, 2008). Mια παραλλαγή αυτής της μεθόδου είναι η επιλογή από έναν επισημειωτή της σωστής επισημείωσης ανάμεσα σε πολλές πιθανές αναλύσεις που έχουν παραχθεί από έναν μη ντετερμινιστικό αυτόματο αναλυτή. Ωστόσο, η μεθοδολογία αυτή παρουσιάζει προβλήματα καθώς έχει διαπιστωθεί ότι οι επισημειωτές εμφανίζουν την τάση να αποδέχονται τις προτεινόμενες αναλύσεις ακόμη και σε αμφίσημες περιπτώσεις (Nivre, 2008). Ένα άλλο ζήτημα για προβληματισμό είναι τι υλικό θα πρέπει να διορθωθεί από τους εκάστοτε επισημειωτές. Υπάρχει η δυνατότητα να διορθωθεί ένα σώμα κειμένων πρότασηπρόταση ή να γίνει μια εγκάρσια διόρθωση μιας συγκεκριμένης δομής σε όλη την έκταση του υλικού που μπορεί να βελτιώσει την ποιότητα της επισημείωσης, αν και η τελευταία προσέγγιση αποτελεί μια ιδιαίτερα δύσκολη στο σχεδιασμό και την υλοποίησή της διαδικασία (Nivre, 2008). Όπως συμπεραίνει κανείς από τις προηγούμενες επισημάνσεις, υπάρχουν διάφοροι τρόποι επισημείωσης που εξαρτώνται από την έκταση του σώματος που πρόκειται να επισημειωθεί, το κόστος της όλης διαδικασίας αλλά και την αποτελεσματικότητα της μεθόδου ως προς τη συνέπεια που πρέπει να χαρακτηρίζει το έργο των επισημειωτών αυτόματων ή μη Σχήματα Επισημείωσης Τα σχήματα επισημείωσης μιας τράπεζας δέντρων περιλαμβάνουν συνήθως τις κατευθυντήριες αρχές του σχήματος στον κατάλογο των ετικετών του και τα φαινόμενα που προσπαθούν να καλύψουν αυτές οι ετικέτες καθώς και κατευθυντήριες οδηγίες για την επισημείωση ιδιαίτερων συντακτικών φαινομένων. Πολλές τράπεζες δένδρων περιλαμβάνουν διάφορα επίπεδα επισημείωσης που καλύπτονται από διαφορετικά σχήματα. Το χαμηλότερο επίπεδο περιλαμβάνει την επισημείωση σε επίπεδο λέξης, που περιλαμβάνει το μέρος του λόγου της λέξης και τα μορφοσυντακτικά χαρακτηριστικά της, το λήμμα της και/ή τη μορφολογική της ανάλυση. Ωστόσο, η επισημείωση που έχει ιδιαίτερο εναδιαφέρον είναι 11

18 αυτή σε συντακτικό επίπεδο, καθώς αυτή είναι που διακρίνει τις τράπεζες δέντρων από άλλα επισημειωμένα σώματα κειμένων Prague Dependency Treebank Ένα από πιο σημαντικά σχήματα επισημείωσης που ακολουθούν τις αναπαραστάσεις με βάση τις εξαρτήσεις είναι το Prague Dependency Treebank (PDT). To PDT 2.0 είναι ένα επισημειωμένο σώμα της τσεχικής γλώσσας που αναπτύχθηκε στο Ινστιτούτο Εφαρμοσμένης Γλωσσολογίας του Πανεπιστημίου Charles της Πράγας. Βασίζεται στη μακρόχρονη παράδοση της γλωσσολογικής σχολής της Πράγας και αξιοποιήθηκε στο χώρο της έρευνας της υπολογιστικής γλωσσολογίας (Hajic, 2006). Τα κείμενα που το αποτελούν είναι άρθρα από περιοδικά και εφημερίδες του Τσέχικου Εθνικού Σώματος Κειμένων και φθάνουν τις δύο εκατομμύρια λέξεις. Σχήμα 2. Επίπεδα επισημείωσης στο PDT για την πρόταση "Byl by_sel do lesa." (αγγλικά. "He would have gone into the woods.") (Πηγή: Hajic et al., 2006). 12

19 Η επισημείωση των δεδομένων του PDT βασίστηκε στη θεωρία της Λειτουργικής Γενετικής Γραμματικής (FGD) και πραγματοποιήθηκε σε τρία επίπεδα. Παράλληλα, υπάρχουν σαφείς σύνδεσμοι μεταξύ των στοιχείων των διαφορετικών επιπέδων. Τα τρία επίπεδα που περιλαμβάνει το συγκεκριμένο σχήμα είναι τα εξής: Το μορφολογικό επίπεδο όπου επισημειώνονται όλες οι λεκτικές μονάδες (tokens) μορφολογικά αξιoποιώντας ένα σύνολο 13 διαφορετικών χαρακτηριστικών (π.χ. γένος, αριθμός, χρόνος, φωνή κτλ.). Στο μεσαίο επίπεδο, που ονομάζεται αναλυτικό, περιγράφεται η επιφανειακή δομή των προτάσεων με τη μορφή δέντρων εξάρτησης. Σε αυτά τα δέντρα, που περιλαμβάνουν έναν τεχνητό κόμβο-ρίζα, κάθε λεκτικός κόμβος έχει ακριβώς έναν κόμβο-κεφαλή. Κάθε κόμβος του αναλυτικού επιπέδου συνδέεται με τις λεξικές μονάδες του μορφολογικού επιπέδου σε αντιστοίχιση 1-προς-1, κάτι που συνεπάγεται ότι ο αριθμός των κόμβων στο αναλυτικό δέντρο είναι ίσος με τον αριθμό των λεξικών μονάδων συν ένα ακόμη κόμβο για τη ρίζα. Οι ακμές του δέντρου εξάρτησης δηλώνουν συντακτικές σχέσεις στην επιφανειακή δομή, ανάμεσα στους κόμβους. Όλες οι ακμές των δέντρων επισημειώνονται με αναλυτικές λειτουργίες (analytical functions) που περιγράφουν τον τύπο της σχέσης προς τον κόμβοκεφαλή. Ο κατάλογος των σχέσεων αυτών περιλαμβάνει τις σχέσεις predicate, subject, object, adverbial, attribute και complement. Τέλος, στο τεκτογραμματικό επίπεδο (tectogrammatical level) οι σχέσεις δεν περιορίζονται μόνο στις έννοιες, π.χ., του υποκειμένου ή του αντικειμένου, αλλά σε έννοιες, όπως actor, patient, addressee κ.α.. Η αναπαράσταση σε αυτό το επίπεδο αποτελεί έναν γράφο και όχι δέντρο εξαρτήσεων με σύνθετους κόμβους για τους οποίους δεν ισχύει η αντιστοίχιση 1- προς-1 με τους κόμβους του προηγούμενου επιπέδου. Μόνο οι κόμβοι που μεταφέρουν λεξική σημασία (lexical meaning) παρουσιάζονται στο τεκτογραμματικό επίπεδο, ενώ κόμβοι, όπως οι προθέσεις που δηλώνουν τόπο ή κατεύθυνση, διαγράφονται από τον γράφο και εμφανίζονται ως απλά χαρακτηριστικά των κόμβων με λεξική σημασία Stanford Dependencies Το Stanford Dependencies (SD), σχήμα επισημείωσης για την αγγλική γλώσσα αποτελεί ένα σχήμα που διαδόθηκε και χρησιμοποιήθηκε ιδιαίτερα και σε άλλες γλώσσες. Το SD που έλκει την καταγωγή του από τη θεωρία της Λεξικής Λειτουργικής Γραμματικής (LFG) ξεκίνησε αρχικά σαν ένας πρακτικός τρόπος απεικόνισης συντακτικών δομών της αγγλικής γλώσσας στοχεύοντας στην καλύτερη επεξεργασία της από τη μηχανή. Οι βασικές του αρχές υιοθετήθηκαν και από πλήθος άλλων γλωσσών, όπως κινεζικά, φιλανδικά, περσικά, 13

20 σύγχρονα εβραϊκά (McDonald et al., 2013). Καλύπτει ικανοποιητικά βασικές γραμματικές σχέσεις σύμφωνα με την παράδοση της αμερικάνικης γλωσσολογίας ακολουθώντας διάφορες προσεγγίσεις της γραμματικής εξαρτήσεων (Word Grammar, Functional Dependency Grammar) και αρχές της παραδοσιακής γραμματικής (Marneffe et al, 2013). Το συγκεκριμένο σχήμα επισημείωσης διαθέτει δύο βασικά πλεονεκτήματα: χαρακτηρίζεται από μια πλούσια τυπολογία των εξαρτημένων δομών ενώ παρέχει έναν απλό, κατανοητό και ομοιόμορφο συμβολισμό των dependency triples που βρίσκεται κοντά στην παραδοσιακή γραμματική (De Marneffe et al., 2013), συνδυασμός που φαίνεται πως εξυπηρετεί εφαρμογές, όπως είναι η μηχανική μετάφραση, η εξαγωγή πληροφορίας, αλλά και επιτρέπει την κατανόηση των αναπαραστάσεων αυτών από μη γλωσσολόγους. Ο όρος dependency triple αντιπροσωπεύει την εξάρτηση και περιμβάνει την κεφαλή-κυβερνήτη (governor), τον εξαρτημένο όρο (dependent) και τo όνομα της σχέσης. Το σχήμα των γραμματικών σχέσεων οργανώνεται ιεραρχικά, έχοντας ως ρίζα την πιο γενική σχέση (dependent). H ιεραρχία περιλαμβάνει 56 γραμματικές σχέσεις, από τις οποίες άλλες είναι γενικές για δομές όπου το είδος της σχέσης δεν είναι εύκολο να αποσαφηνιστεί αυτόματα (arg: argument, aux: auxiliary) και άλλες πιο ειδικές όταν η σχέση κεφαλής και κυβερνήτη είναι περισσότερο προφανής (subj, comp). Οι πρώτες πιο γενικές σχέσεις, δηλαδή, υποκατηγοριοποιούνται σε άλλες πιο ειδικές (πχ. η σχέση arg υποκατηγοριοποιείται σε subj και comp). Το SD περιλαμβάνει δύο εκδοχές: στη μια, κάθε λέξη της αρχικής πρότασης απεικονίζεται σαν ένας κόμβος με σχέσεις ανάμεσα σε αυτόν και στην κεφαλή του. Αντίθετα, στην άλλη εκδοχή, συγκεκριμένες λέξεις είναι πιθανόν να έχουν αφαιρεθεί και να έχουν προσαρτηθεί στις ετικέτες των σχέσεων, ενώ η αναπαράσταση δεν είναι κατ ανάγκη δενδρική. Έτσι η πρόταση Bills on ports and immigration were submitted by Senator Brownback, Republican of Kansas μπορεί να αναπαρασταθεί με δύο τρόπους: α) ως ένα κλασικό δέντρο εξάρτησης, όπου κάθε λέξη στην πρόταση εξαρτάται από την μια άλλη λέξη, ενώ μία λέξη αποτελεί τη ρίζα όλου του δέντρου (Σχήμα 3) και β) ως ένας γράφος όπου οι εξαρτήσεις που περιλαμβάνουν προθέσεις και συνδέσμους αφαιρούνται ώστε να δημιουργηθούν άμεσες εξαρτήσεις μεταξύ λέξεων που μεταφέρουν σημασία (Σχήμα 4). 14

21 Σχήμα 3: Βασική δενδρική αναπαράσταση στο SD Σχήμα 4: Αναπαράσταση με άμεση εξάρτηση λέξεων που είναι φορείς σημασίας Πηγή: Όπως φαίνεται και παραπάνω, το SD σχήμα περιλαμβάνει ένα μεγάλο αριθμό σχέσεων εξάρτησης που καλύπτουν φαινόμενα πολυλεκτικών δομών, ενώ βασίζεται στην αρχή της επιλογής λέξεων που μεταφέρουν σημασία ως κεφαλών. Αυτή η επιλογή θεωρείται (Marfenne & Manning, 2008) ότι συμβάλλει στην καλύτερη εξαγωγή σημασιολογικής πληροφορίας σε εφαρμογές ΕΦΓ αλλά και στην ισοδύναμη αναπαράσταση δομών που 15

22 επιφανειακά διαφέρουν μεταξύ γλωσσών. Περισσότερες λεπτομέρειες για το SD παρέχονται παρέχονται στην ενότητα όπου εξετάζεται η μετεξέλιξή του, το σχήμα Universal Stanford Dependencies (USD) Εναρμονισμένα Σχήματα Επισημείωσης Η ύπαρξη, πολλών διαφορετικών τραπεζών δέντρων εξάρτησης και η χρήση διαφορετικών σχημάτων επισημείωσης για κάθε γλώσσα ξεχωριστά οδήγησε πολλούς ερευνητές στην έρευνα για μεθόδους μετατροπής διαφορετικών δέντρων εξάρτησης στο ίδιο σχήμα. Με αυτό τον τρόπο οι εφαρμογές πολυγλωσσικής επεξεργασίας θα αντιμετώπιζαν με καλύτερο τρόπο διαφορές σε επιφανειακό επίπεδο μεταξύ γλωσσών, ενώ, επίσης, όμοιες αναπαραστάσεις θα οδηγούσαν σε πιο αξιόπιστες αξιολογήσεις των συντακτικών αναλυτών σε διάφορες γλώσσες. Με βάση τη λογική αυτή, μελετητές, αρχικά προχώρησαν στον εναρμονισμό 29 τραπεζών δέντρων εξάρτησης σε ένα σχήμα επισημείωσης παρόμοιο με αυτό του Prague Dependency Treebank (Zeman, et al ). Εντοπίστηκαν όλες οι συντακτικές δομές για τις οποίες υπήρχε τουλάχιστον μια τράπεζα δέντρων, όπου η επισημείωση διέφερε συστηματικά από άλλα δέντρα. Δημιουργήθηκε μια λίστα με ποικίλα συντακτικά φαινόμενα. Στη συνέχεια, για κάθε φαινόμενο, προτάθηκε μια κοινή αναπαράσταση και με τη βοήθεια αλγορίθμων έγινε μετατροπή των επισημειώσεων σε ένα νέο σχήμα, το HamletDt (Zeman et al, 2012). Η διαδικασία που ακολουθήθηκε αφορούσε τόσο μετατροπές σε συντακτικό επίπεδο, αλλά και επανονομασία των σχέσεων εξάρτησης. Η ποικιλία δε των μορφολογικών χαρακτηριστικών μεταξύ των διαφόρων treebanks οδήγησε στην ενοποίησή τους αντιστοίχως (Zeman et al., 2012). H μετατροπή έγινε αυτόματα με τη χρήση λογισμικού ανοιχτού κώδικα, ενώ τα φαινόμενα που μελετήθηκαν αφορούσαν την παρατακτική σύνδεση, τις προθετικές φράσεις και τις δευτερεύουσες προτάσεις, ομάδες ρημάτων (πχ. δομές βοηθητικών ρημάτων) τα άρθρα και τα σημεία στίξης. Πιο σύγχρονη εκδοχή από το προηγούμενο και ταυτόχρονα η μεγαλύτερη σε μέγεθος συλλογή, επισημειωμένη βάσει του USD, είναι το Hamlet 2.0. Σε αυτό, τη διαδικασία της εναρμόνισης ακολούθησε η μετατροπή στο σχήμα USD (Universal Dependencies) που εξετάζεται στην επόμενη ενότητα. Η μετατροπή στο USD/UD περιελάμβανε την επαναταξινόμηση κάποιων κόμβων και την απεικόνιση συγκεκριμένων ετικετών σε αυτές του USD (Rosa et al. 2014). 16

23 Universal Stanford Dependencies και Universal Dependency Treebanks Το σχήμα Standford Dependencies για τα αγγλικά αποτέλεσε σε συνδυασμό με το tagset του Petrov et al (2009) την αφετηρία για το Universal Stanford Dependencies Σχήμα (USD) και στη συνέχεια του σχήματος που χρησιμοποιείται για την ανάπτυξη των Universal Dependency Treebanks (De Marneffe et al, 2013). Όπως και στο SD (Standford Dependency) σχήμα, έτσι και στο USD/UD, βασική παραδοχή είναι ότι οι σχέσεις συνδέουν λέξεις που μεταφέρουν σημασία (content words) ενώ οι υπόλοιπες (άρθρα, προθέσεις, σύνδεσμοι) δεν μεσολαβούν ποτέ μεταξύ αυτών των λέξεων. Ακόμη, βασική παραδοχή του USD/UD σχήματος είναι η διάκριση μεταξύ ονοματικών όρων εξάρτησης και προτασιακών όρων εξάρτησης. Παραδείγματος χάριν, το USD/UD χρησιμοποιεί διαφορετικές ετικέτες για ονοματικά (nsubj) και προτασιακά (csubj) υποκείμενα. Αντίστοιχα, γίνεται διάκριση μεταξύ του dobj και ccomp, όπου το dobj χρησιμοποιείται για να δηλώσει το άμεσο ονοματικό αντικείμενο ενός ρήματος ενώ το ccomp για να δηλώσει την πρόταση-συμπλήρωμα του ρήματος της οποίας το υποκείμενο είναι διαφορετικό από το υποκείμενο της κύριας πρότασης. Στην ίδια λογική γίνεται διάκριση μεταξύ των σχέσεων ccomp και xcomp, η τελευταία εκ των οποίων χρησιμοποιείται για προτασιακά συμπληρώματα των οποίων το υποκείμενο είναι ίδιο με το υποκείμενο της πρότασης πυρήνα. Στο USD/UD οι προθέσεις δεν έχουν το ρόλο του «διαμεσολαβητή» ανάμεσα σε μία κεφαλή και έναν προσδιορισμό (modifier) (Silveira et al., 2014). Αντίθετα, κάθε λεκτικό στοιχείο που έχει την ιδιότητα του case-marking (prepositions, postpositions and clitic case markers) εξαρτάται από το ουσιαστικό το οποίο εισάγει (content words) ή το ακολουθεί. Έτσι, η ετικέτα nmod δηλώνει τη σχέση μεταξύ δύο βασικών λέξεων (content words) όπου η πρόθεση λειτουργεί σαν case και η οποία βασίζεται στο συμπλήρωμά της. Γενικά, οι προσδιοριστικές εκφράσεις αντιπροσωπεύπουν κάποιο είδος πλάγιου ορίσματος (oblique) ή προσδιορισμού (adjunct) που συμπληρώνοται από την ετικέτα case. Ο τρόπος με τον οποίο αντιμετωπίζονται οι προθέσεις στο USD/UD στοχεύει στην καλύτερη αντιστοίχιση παρόμοιων μηνυμάτων που μπορεί να εκφέρονται με διαφορετικές επιφανειακές λεκτικές ακολουθίες διαγλωσσικά αλλά και ενδογλωσσικά. Παρόμοια, από τις κεφαλές των προτάσεων εξαρτώνται οι υποτακτικοί σύνδεσμοι (markers). Όσον αφορά την επισημείωση του συνδετικού ρήματος, αυτό δεν αποτελεί την κεφαλή σε μία πρόταση αλλά αντίθετα εξαρτάται από το κατηγόρημά της. Η παραδοχή αυτή έχει σαν αφετηρία το γεγονός ότι σε πολλές γλώσσες το συνδετικό ρήμα σε αντίστοιχες συντακτικές δομές απουσιάζει. 17

24 Επιπρόσθετα, σε σχέση με το SD, το USD/UD σχήμα επιστρέφει στην γραμματική διάκριση μεταξύ άμεσου και έμμεσου αντικειμένου. Στην περίπτωση που υπάρχουν πολλά αντικείμενα, άμεσο είναι το όρισμα που δηλώνει τον πάσχοντα (patent/theme). Μια άλλη καινοτομία του USD/UD είναι η πλούσια ταξινομία σχέσεων για τη σύνθεση (compounding) για την οποία υπάρχουν τρεις διαφορετικές ετικέτες. Η πρώτη είναι η σχέση mwe (multi-word expression) για παγιωμένες εκφράσεις που χρησιμοποιούνται ως λειτουργικές λέξεις ή σύντομα επιρρηματικά στοιχεία. Η δεύτερη είναι η σχέση name για τα κύρια ονόματα που αποτελούνται από παραπάνω από ένα ονοματικά στοιχεία. Η τρίτη είναι η σχέση compound για να δηλώσει άλλους τύπους πολυλεκτικών λεξημάτων, όπως είναι η σύνθεση ουσιαστικών (phone book), ρημάτων και μορίων σε phrasal verbs (put up) ή αριθμητικών στοιχείων (3 million). Πέρα από αυτές τις σχέσεις, η σχέση goeswith χρησιμοποιείται για τη σύνδεση λεκτικών μονάδων σε μη καλογραμμένα κείμενα (π.χ. hand some αντί για handsome ), ή στις περιπτώσεις τυπογραφικών λαθών (από την αγγλική γλώσσα othe r αντί για other ). Η ετικέτα foreign χρησιμοποιείται για ακολουθίες ξένων λέξεων ενώ για διακοπές σε μεταγεγραμμένο προφορικό λόγο, όπου μόνο μέρος μιας λέξης εκφέρεται, χρησιμοποιείται η ετικέτα reparandum. Άλλες σχέσεις περιλαμβάνουν τις vocative για την κλητική προσφώνηση ή discourse για τα προσαρτήματα λόγου (interjections and fillers). Οι Mc.Donald et al. (2013) εκπαίδευσαν έναν cross-lingual parser βασισμένο σε τράπεζες δένδρων που είχαν επισημειωθεί με βάση το UD, πραγματοποιώντας στη συνέχεια αξιολογήσεις για διαφορετικές γλώσσες που ήταν δύσκολο να γίνουν στο παρελθόν εξαιτίας των διαφορών που υπήρχαν στα σχήματα επισημείωσης. Επίσης, πραγματοποίησαν πειράματα στα οποία εκπαίδευσαν "απολεξικοποιημένους" συντακτικούς αναλυτές, δηλαδή αναλυτές που είχαν εκπαιδευτεί σε επισημειωμένες προτάσεις από διαφορετικές γλώσσες, από τις οποίες είχαν αφαιρεθεί οι λέξεις και είχαν διατηρηθεί μόνον τα ομογενοποιημένα χαρακτηριστικά, όπως οι ετικέτες των σχέσεων και των μορφολογικών χαρακτηριστικών. Σε αυτά τα πειράματα έδειξαν ότι τα καλύτερα αποτελέσματα επιτεύχθησαν όταν ο αναλυτής εκπαιδευόταν σε προτάσεις που ανήκαν στην ίδια γλωσσική οικογένεια με τις προτάσεις αξιολόγησης, π.χ. όταν ο αναλυτής είχε εκπαιδευτεί σε ισπανικές προτάσεις και αξιολογείτο σε γαλλικές προτάσεις ή το αντίστροφο. 18

25 4. Ελληνική Τράπεζα Δέντρων Εξάρτησης (Greek Dependency Treebank) Η Ελληνική Τράπεζα Δέντρων εξάρτησης (Greek Dependency Treebank GDT) είναι ένας γλωσσικός πόρος για την ελληνική γλώσσα επισημειωμένος χειρωνακτικά στα επίπεδα της μορφολογίας, της σύνταξης και της σημασιολογίας. Δημιουργήθηκε από ερευνητές του Ινστιτούτου Επεξεργασίας Λόγου με τη βοήθεια μεταπτυχιακών φοιτητών του προγράμματος Τεχνογλωσσία του Πανεπιστημίου Αθηνών. To GDT περιλαμβάνει κείμενα που συλλέχθησαν στο πλαίσιο εθνικών και διεθνών ερευνητικών προγραμμάτων με στόχο την πολυγλωσσική και πολυμεσική εξαγωγή πληροφορίας. Τα κείμενα αυτά ανήκουν σε ποικίλες περιοχές και καλύπτουν ένα ευρύ φάσμα γλωσσικών φαινομένων και κειμενικών ειδών. Η αρχική έκδοση του GDT ( ) περιελάμβανε tokens (λέξεις και σημεία στίξης) και 2902 προτάσεις και αξιοποιήθηκε στα πλαίσια του CoNLL 2007 Shared Task on Dependency Parsing 1. Μια νεότερη εκδοχή της ελληνικής δενδροτράπεζας διαθέτει συνολικά tokens σε σύνολο 5676 προτάσεων και 249 κειμένων. Η δενδροτράπεζα περιλαμβάνει μοναδικούς τύπους, λήμματα και άπαξ λεγόμενα (εξαιρούνται ημερομηνίες, αριθμοί και κύρια ονόματα). Το μέσος μήκος πρότασης είναι 23,07 tokens (Prokopidis & Papageorgiou, 2014). Τα κείμενα που έχουν επισημειωθεί μέχρι σήμερα περιλαμβάνουν άρθρα από ειδησεογραφικά sites (50,11%) ομιλίες του Ευρωπαϊκού κοινοβουλίου (22,92) τουριστικές εκπομπές (16,95%) άρθρα από τις ελληνικές εκδόσεις των Wikipedia και Wikinews (10,02%) Στο GDT, όπως και στις περισσότερες τράπεζες δέντρων οι προτάσεις αναπαρίστανται ως δέντρα όπου κάθε λέξη αντιστοιχεί σε έναν κόμβο του δέντρου. Οι προτάσεις κυβερνώνται (headed) συνήθως από το ρήμα της κύριας πρότασης, που εξαρτάται από έναν τεχνητό κόμβο ρίζα και μπορεί να έχει από κανέναν, έναν, ή περισσότερους εξαρτημένους κόμβους. Τα περισσότερα δέντρα έχουν ως κεφαλή μια λέξη που έχει το ρόλο του κατηγορήματος (pred), ενώ άλλα tokens που εξαρτώνται από τη ρίζα περιλαμβάνουν τελικά σημεία στίξης ή 1 To CoNLL (Conference on Computational Natural Language Learning ) συμπεριλαμβάνει από το 1999 στη θεματική του ένα shared task, όπου συμμετέχοντες εκπαιδεύουν και δοκιμάζουν μεθόδους μηχανικής μάθησης σε δεδομένα. Στα shared tasks του 2006 και 2007 οι συμμετέχοντες έπρεπε να εκπαιδεύσουν και να δοκιμάσουν έναν αναλυτή σε δεδομένα (labeled data) από διαφορετικές γλώσσες (μεταξύ αυτών και η ελληνική) (multilingual dependency parsing) (Nivre, 2007). 19

Μοντέλα γλωσσικής επεξεργασίας: σύνταξη

Μοντέλα γλωσσικής επεξεργασίας: σύνταξη Μοντέλα γλωσσικής επεξεργασίας: σύνταξη Μάθημα: Εισαγωγή στις επιστήμες λόγου και ακοής Ιωάννα Τάλλη, Ph.D. Σύνταξη Είναι ο τομέας της γλώσσας που μελετά τη δομή των προτάσεων, δηλαδή ποια είναι η σειρά

Διαβάστε περισσότερα

ΤΕΧΝΟΓΛΩΣΣΙΑ VIII ΛΟΓΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΔΙΔΑΣΚΟΝΤΕΣ: ΜΑΪΣΤΡΟΣ ΓΙΑΝΗΣ, ΠΑΠΑΚΙΤΣΟΣ ΕΥΑΓΓΕΛΟΣ ΑΣΚΗΣΗ: ΔΙΟΡΘΩΣΗ ΕΚΦΡΑΣΕΩΝ (Β )

ΤΕΧΝΟΓΛΩΣΣΙΑ VIII ΛΟΓΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΔΙΔΑΣΚΟΝΤΕΣ: ΜΑΪΣΤΡΟΣ ΓΙΑΝΗΣ, ΠΑΠΑΚΙΤΣΟΣ ΕΥΑΓΓΕΛΟΣ ΑΣΚΗΣΗ: ΔΙΟΡΘΩΣΗ ΕΚΦΡΑΣΕΩΝ (Β ) ΤΕΧΝΟΓΛΩΣΣΙΑ VIII ΛΟΓΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΔΙΔΑΣΚΟΝΤΕΣ: ΜΑΪΣΤΡΟΣ ΓΙΑΝΗΣ, ΠΑΠΑΚΙΤΣΟΣ ΕΥΑΓΓΕΛΟΣ ΑΣΚΗΣΗ: ΔΙΟΡΘΩΣΗ ΕΚΦΡΑΣΕΩΝ (Β ) ΣΚΟΠΟΣ Σκοπός της άσκησης είναι ο σχεδιασμός και η υλοποίηση συστήματος διόρθωσης

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ: ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ: Η ΣΗΜΕΡΙΝΗ ΕΛΛΗΝΙΚΗ ΠΡΑΓΜΑΤΙΚΟΤΗΤΑ Ημερίδα παρουσίασης CLARIN-EL 1/10/2010 Πένυ Λαμπροπούλου Ινστιτούτο Επεξεργασίας Λόγου / Ε.Κ. "Αθηνά" ΧΑΡΤΟΓΡΑΦΗΣΗ ΧΩΡΟΥ ΓΤ ΓΙΑ ΚΑΕ Στο

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013 ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Τι είναι η γλωσσική τεχνολογία;

Διαβάστε περισσότερα

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el Σαράντος Καπιδάκης 1, Στέλιος Πιπερίδης 2, Πένυ Λαμπροπούλου 2, Μαρία Γαβριηλίδου 2 ( 1 Ιόνιο Πανεπιστήμιο, 2 Ε.Κ. Αθηνά / ΙΕΛ)

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.)

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.) ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.) «Διερμηνεία και Μετάφραση» Tων Τμημάτων: Φιλολογίας, Αγγλικής Γλώσσας και Φιλολογίας, Γαλλικής Γλώσσας και

Διαβάστε περισσότερα

ΟΔΗΓΙΕΣ ΓΙΑ ΤΗΝ ΕΚΠΟΝΗΣΗ ΤΗΣ ΥΠΟΧΡΕΩΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΟΥ ΜΑΘΗΜΑΤΟΣ

ΟΔΗΓΙΕΣ ΓΙΑ ΤΗΝ ΕΚΠΟΝΗΣΗ ΤΗΣ ΥΠΟΧΡΕΩΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Τ.Ξ.Γ.Μ.Δ. ΕΙΣΑΓΩΓΗ ΣΤΗ ΓΕΝΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ ΙΙ ΔΙΔΑΣΚΟΥΣΑ : Μ. ΤΣΙΓΚΟΥ ΟΔΗΓΙΕΣ ΓΙΑ ΤΗΝ ΕΚΠΟΝΗΣΗ ΤΗΣ ΥΠΟΧΡΕΩΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΟΥ ΜΑΘΗΜΑΤΟΣ 1. Γενικά για την εργασία: Η εργασία

Διαβάστε περισσότερα

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης Σοφιανόπουλος Σωκράτης Ινστιτούτο Επεξεργασίας του Λόγου Δομή παρουσίασης Τι είναι η Μηχανική Μετάφραση (Machine Translation) Ιστορική αναδρομή Είδη συστημάτων

Διαβάστε περισσότερα

Ο 19ος αιώνας Είδαμε ότι πρώτοι ιστορικο-συγκριτικοί επιστήμονες είχαν στόχο να εξηγήσουν τις ομοιότητες που παρατηρούσαν ανάμεσα στις γλώσσες. Είδαμε

Ο 19ος αιώνας Είδαμε ότι πρώτοι ιστορικο-συγκριτικοί επιστήμονες είχαν στόχο να εξηγήσουν τις ομοιότητες που παρατηρούσαν ανάμεσα στις γλώσσες. Είδαμε Ο 19ος αιώνας Είδαμε ότι πρώτοι ιστορικο-συγκριτικοί επιστήμονες είχαν στόχο να εξηγήσουν τις ομοιότητες που παρατηρούσαν ανάμεσα στις γλώσσες. Είδαμε επίσης ότι η ομοιότητα βασικών λέξεων οδήγησε στην

Διαβάστε περισσότερα

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΙΟΥ ΑΘ. ΚΡΟΝΤΣΟΥ ΘΕΜΑ: ΓΡΑΜΜΑΤΙΚΗ-ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ ΤΗΣ ΝΕΑΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΕΙΣΗΓΗΤΗΣ: ΙΩΑΝΝΗΣ ΡΕΦΑΝΙΔΗΣ

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΙΟΥ ΑΘ. ΚΡΟΝΤΣΟΥ ΘΕΜΑ: ΓΡΑΜΜΑΤΙΚΗ-ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ ΤΗΣ ΝΕΑΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΕΙΣΗΓΗΤΗΣ: ΙΩΑΝΝΗΣ ΡΕΦΑΝΙΔΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: ΓΡΑΜΜΑΤΙΚΗ-ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ ΤΗΣ ΝΕΑΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΔΗΜΗΤΡΙΟΥ ΑΘ. ΚΡΟΝΤΣΟΥ ΕΙΣΗΓΗΤΗΣ: ΙΩΑΝΝΗΣ ΡΕΦΑΝΙΔΗΣ Στόχοι της εργασίας Εντρύφηση στις βασικές αρχές της Επεξεργασίας

Διαβάστε περισσότερα

ΠΡΟΚΗΡΥΞΗ ΔΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗ «ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ» ΠΡΟΣΚΛΗΣΗ ΥΠΟΒΟΛΗΣ ΥΠΟΨΗΦΙΟΤΗΤΩΝ

ΠΡΟΚΗΡΥΞΗ ΔΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗ «ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ» ΠΡΟΣΚΛΗΣΗ ΥΠΟΒΟΛΗΣ ΥΠΟΨΗΦΙΟΤΗΤΩΝ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΦΙΛΟΣΟΦΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΦΙΛΟΛΟΓΙΑΣ ΤΟΜΕΑΣ ΓΛΩΣΣΟΛΟΓΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΗΜΑΤΩΝ ΕΛΕΓΧΟΥ

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Ιόνιο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΝΘΡΩΠΙΝΗΣ ΚΙΝΗΣΗΣ ΚΑΙ ΠΟΙΟΤΗΤΑΣ ΖΩΗΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΝΘΡΩΠΙΝΗΣ ΚΙΝΗΣΗΣ ΚΑΙ ΠΟΙΟΤΗΤΑΣ ΖΩΗΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΝΘΡΩΠΙΝΗΣ ΚΙΝΗΣΗΣ ΚΑΙ ΠΟΙΟΤΗΤΑΣ ΖΩΗΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ Οδηγός Εκπόνησης Διπλωματικής Εργασίας ΣΠΑΡΤΗ 2010-11 Περιεχόμενα 1.ΔΟΜΗ ΚΑΙ ΠΕΡΙΕΧΟΜΕΝΟ Της ΔΙΠΛΩΜΑΤΙΚΗΣ

Διαβάστε περισσότερα

Για την εξέταση των Αρχαίων Ελληνικών ως μαθήματος Προσανατολισμού, ισχύουν τα εξής:

Για την εξέταση των Αρχαίων Ελληνικών ως μαθήματος Προσανατολισμού, ισχύουν τα εξής: Τρόπος εξέτασης των πανελλαδικά εξεταζόμενων μαθημάτων Τα θέματα των πανελλαδικά εξεταζόμενων μαθημάτων λαμβάνονται από την ύλη που ορίζεται ως εξεταστέα για κάθε μάθημα κατά το έτος που γίνονται οι εξετάσεις.

Διαβάστε περισσότερα

ΕΙΔΗ ΔΕΥΤΕΡΕΥOΥΣΩΝ ΠΡOΤΑΣΕΩΝ Τη θεωρία της ύλης θα τη βρείτε: Βιβλίο μαθητή σελ και Βιβλίο Γραμματικής σελ

ΕΙΔΗ ΔΕΥΤΕΡΕΥOΥΣΩΝ ΠΡOΤΑΣΕΩΝ Τη θεωρία της ύλης θα τη βρείτε: Βιβλίο μαθητή σελ και Βιβλίο Γραμματικής σελ ΕΙΔΗ ΔΕΥΤΕΡΕΥOΥΣΩΝ ΠΡOΤΑΣΕΩΝ Τη θεωρία της ύλης θα τη βρείτε: Βιβλίο μαθητή σελ. 32-37 και Βιβλίο Γραμματικής σελ. 146-148 Tι πρέπει να γνωρίζω: Oνοματικές και επιρρηματικές προτάσεις (σελ. 32-34) Υπάρχουν

Διαβάστε περισσότερα

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ το πρόβλημα 14.11.2015 10o Συνέδριο Ελληνική Γλώσσα και Ορολογία 2 σενάριο 14.11.2015

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

Κεφάλαιο 6ο: Παρόν και μέλλον της Υπολογιστικής Γλωσσολογίας

Κεφάλαιο 6ο: Παρόν και μέλλον της Υπολογιστικής Γλωσσολογίας Κεφάλαιο 6ο: Παρόν και μέλλον της Υπολογιστικής Γλωσσολογίας Σύνοψη Στο τελευταίο αυτό κεφάλαιο του βιβλίου, αρχικά θα ανακαλέσουμε συνοπτικά το υλικό των προηγούμενων κεφαλαίων και θα δούμε τις συνδέσεις

Διαβάστε περισσότερα

Η ΔΙΔΑΣΚΑΛΙΑ ΤΟΥ ΛΕΞΙΛΟΓΙΟΥ ΣΤΟ ΔΗΜΟΤΙΚΟ ΣΧΟΛΕΙΟ

Η ΔΙΔΑΣΚΑΛΙΑ ΤΟΥ ΛΕΞΙΛΟΓΙΟΥ ΣΤΟ ΔΗΜΟΤΙΚΟ ΣΧΟΛΕΙΟ Περιεχόμενα ΠΡΟΛΟΓΟΣ 13 1. ΛΕΞΙΛΟΓΙΟ: ΕΙΣΑΓΩΓΙΚΕΣ ΠΑΡΑΤΗΡΗΣΕΙΣ ΚΑΙ ΔΙΔΑΚΤΙΚΕΣ ΠΡΟΤΑΣΕΙΣ 17 ΣΗΜΑΝΤΙΚΗ ΟΡΟΛΟΓΙΑ ΚΕΦΑΛΑΙΟΥ 17 1.1 Η αξία του λεξιλογίου και η θέση του στο γλωσσικό μάθημα 18 1.2 Εμπόδια στη

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 2 ο : Βασικές έννοιες Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Γλωσσική Τεχνολογία, Μάθημα 2 ο, Βασικές

Διαβάστε περισσότερα

Εισαγωγή στη Γλωσσολογία Ι

Εισαγωγή στη Γλωσσολογία Ι ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εισαγωγή στη Γλωσσολογία Ι Σύνταξη Διδάσκοντες: Επίκ. Καθ. Μαρία Λεκάκου, Λέκτορας Μαρία Μαστροπαύλου Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Συγγραφή ερευνητικής πρότασης

Συγγραφή ερευνητικής πρότασης Συγγραφή ερευνητικής πρότασης 1 o o o o Η ερευνητική πρόταση είναι ένα ιδιαίτερα σημαντικό τμήμα της έρευνας. Η διατύπωσή της θα πρέπει να είναι ιδιαίτερα προσεγμένη, περιεκτική και βασισμένη στην ανασκόπηση

Διαβάστε περισσότερα

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ ΤΕΧΝΙΚΕΣ ΕΡΕΥΝΑΣ (# 252) Ε ΕΞΑΜΗΝΟ 9 η ΕΙΣΗΓΗΣΗ ΣΗΜΕΙΩΣΕΙΣ ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ ΛΙΓΗ ΘΕΩΡΙΑ Στην προηγούμενη διάλεξη μάθαμε ότι υπάρχουν διάφορες μορφές έρευνας

Διαβάστε περισσότερα

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ. 1) Στάση του μαθητή/τριας κατά τη διάρκεια του μαθήματος: Δεν την κατέχει. Την κατέχει μερικώς. επαρκώς

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ. 1) Στάση του μαθητή/τριας κατά τη διάρκεια του μαθήματος: Δεν την κατέχει. Την κατέχει μερικώς. επαρκώς ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ Όνομα μαθητή/μαθήτριας:... Ισχύουσα Διάγνωση:... Στήριξη από ειδικό εκπαιδευτικό προσωπικό (ψυχολόγο, λογοθεραπευτή, εργοθεραπευτή, κτλ.):... Σχολικό Έτος:... Σχολείο:.... Τάξη/Τμήμα:...

Διαβάστε περισσότερα

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος. Γλωσσική Τεχνολογία Εισαγωγή 2015 16 Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/in/ Τι θα ακούσετε Εισαγωγή στη γλωσσική τεχνολογία. Ύλη και οργάνωση του μαθήματος. Προαπαιτούμενες γνώσεις και άλλα προτεινόμενα

Διαβάστε περισσότερα

Κεφάλαιο 3. Από τη λέξη στη φράση: φραστική δομή

Κεφάλαιο 3. Από τη λέξη στη φράση: φραστική δομή Κεφάλαιο 3 Από τη λέξη στη φράση: φραστική δομή Σύνοψη Στο κεφάλαιο αυτό εξετάζουμε την παραγωγή της φραστικής δομής. Έχοντας αναγνωρίσει ότι μια φράση αποτελείται από συστατικά, τα οποία καθορίζονται

Διαβάστε περισσότερα

Εισαγωγή στη Γλωσσολογία Ι

Εισαγωγή στη Γλωσσολογία Ι ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εισαγωγή στη Γλωσσολογία Ι Σύνταξη Διδάσκοντες: Επίκ. Καθ. Μαρία Λεκάκου, Λέκτορας Μαρία Μαστροπαύλου Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1 ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1 ΣΥΝΑΡΤΗΣΕΙΣ Η έννοια της συνάρτησης είναι θεμελιώδης στο λογισμό και διαπερνά όλους τους μαθηματικούς κλάδους. Για το φοιτητή είναι σημαντικό να κατανοήσει πλήρως αυτή

Διαβάστε περισσότερα

Τρόποι αναπαράστασης των επιστημονικών ιδεών στο διαδίκτυο και η επίδρασή τους στην τυπική εκπαίδευση

Τρόποι αναπαράστασης των επιστημονικών ιδεών στο διαδίκτυο και η επίδρασή τους στην τυπική εκπαίδευση Τρόποι αναπαράστασης των επιστημονικών ιδεών στο διαδίκτυο και η επίδρασή τους στην τυπική εκπαίδευση Κ. Χαλκιά Εθνικόν και Καποδιστριακόν Πανεπιστήμιον Αθηνών 2 Το διαδίκτυο: αποτελεί ένα νέο διδακτικό

Διαβάστε περισσότερα

Γεώργιος Φίλιππας 23/8/2015

Γεώργιος Φίλιππας 23/8/2015 MACROWEB Προβλήματα Γεώργιος Φίλιππας 23/8/2015 Παραδείγματα Προβλημάτων. Πως ορίζεται η έννοια πρόβλημα; Από ποιους παράγοντες εξαρτάται η κατανόηση ενός προβλήματος; Τι εννοούμε λέγοντας χώρο ενός προβλήματος;

Διαβάστε περισσότερα

Προηγµένη ιασύνδεση µε τοπεριβάλλον

Προηγµένη ιασύνδεση µε τοπεριβάλλον Προηγµένη ιασύνδεση µε τοπεριβάλλον! Επεξεργασία φυσικής γλώσσας # Κατανόηση φυσικής γλώσσας # Παραγωγή φυσικής γλώσσας! Τεχνητή όραση! Ροµποτική Κατανόηση Φυσικής Γλώσσας! Αναγνώριση οµιλίας (Speech recognition)!

Διαβάστε περισσότερα

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 www.iatrolexi.cti.gr 1 Ερευνητικό Ακαδημαϊκό Ινστιτούτο Τεχνολογίας Υπολογιστών (ΕΑΙΤΥ) Σελίδα 1 Ημερομηνία:

Διαβάστε περισσότερα

Η ΘΕΩΡΙΑ ΤΟΥ Χ --Η ΔΟΜΗ ΤΗΣ ΡΦ, ΠΡΦ, ΕΦ, ΟΦ

Η ΘΕΩΡΙΑ ΤΟΥ Χ --Η ΔΟΜΗ ΤΗΣ ΡΦ, ΠΡΦ, ΕΦ, ΟΦ Η ΘΕΩΡΙΑ ΤΟΥ Χ --Η ΔΟΜΗ ΤΗΣ ΡΦ, ΠΡΦ, ΕΦ, ΟΦ Ι. Η ανεπάρκεια των επίπεδων δομών. Η δομή της ΟΦ. Συμπληρώματα vs. Προσδιορισμοί ήτροποποιητές ΙΙ. Η δομή της ΡΦ, ΕΦ, ΠρΦ ΙΙΙ. Οι Αρχές της Θεωρίας του Χ' Ι.

Διαβάστε περισσότερα

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση Οι συµφράσεις είναι ακολουθίες όρων οι οποίοι συνεµφανίζονται σε κείµενο µε µεγαλύτερη συχνότητα από εκείνη της εµφάνισης

Διαβάστε περισσότερα

Επιµέλεια Θοδωρής Πιερράτος

Επιµέλεια Θοδωρής Πιερράτος Η έννοια πρόβληµα Ανάλυση προβλήµατος Με τον όρο πρόβληµα εννοούµε µια κατάσταση η οποία χρήζει αντιµετώπισης, απαιτεί λύση, η δε λύση της δεν είναι γνωστή ούτε προφανής. Μερικά προβλήµατα είναι τα εξής:

Διαβάστε περισσότερα

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 1 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 1 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Γιώργος Δημητρίου Μάθημα 1 ο Γλώσσα - Μετάφραση Γλώσσα προγραμματισμού = Αναπαράσταση αλγορίθμων Ευκολία χρήσης Ακρίβεια και πληρότητα περιγραφής, όχι διφορούμενη! Μία περιγραφή για όλες τις μηχανές Μετάφραση

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Επιχειρησιακές Επικοινωνίες

Επιχειρησιακές Επικοινωνίες ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Επιχειρησιακές Επικοινωνίες Ενότητα # 6: Ανάλυση Περιεχομένου Πρόδρομος Γιαννάς Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Άδειες

Διαβάστε περισσότερα

Τα Διδακτικά Σενάρια και οι Προδιαγραφές τους. του Σταύρου Κοκκαλίδη. Μαθηματικού

Τα Διδακτικά Σενάρια και οι Προδιαγραφές τους. του Σταύρου Κοκκαλίδη. Μαθηματικού Τα Διδακτικά Σενάρια και οι Προδιαγραφές τους του Σταύρου Κοκκαλίδη Μαθηματικού Διευθυντή του Γυμνασίου Αρχαγγέλου Ρόδου-Εκπαιδευτή Στα προγράμματα Β Επιπέδου στις ΤΠΕ Ορισμός της έννοιας του σεναρίου.

Διαβάστε περισσότερα

Εννοιολογική χαρτογράφηση: Διδακτική αξιοποίηση- Αποτελέσματα για το μαθητή

Εννοιολογική χαρτογράφηση: Διδακτική αξιοποίηση- Αποτελέσματα για το μαθητή Το λογισμικό της εννοιολογικής χαρτογράυησης Inspiration Η τεχνική της εννοιολογικής χαρτογράφησης αναπτύχθηκε από τον καθηγητή Joseph D. Novak, στο πανεπιστήμιο του Cornell. Βασίστηκε στις θεωρίες του

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής Κύρια σημεία Ερευνητική Μεθοδολογία και Μαθηματική Στατιστική Απόστολος Μπουρνέτας Τμήμα Μαθηματικών ΕΚΠΑ Αναζήτηση ερευνητικού θέματος Εισαγωγή στην έρευνα Ολοκλήρωση ερευνητικής εργασίας Ο ρόλος των

Διαβάστε περισσότερα

ΥΛΗ ΕΞΕΤΑΣΕΩΝ 2007 ΥΠΟΨΗΦΙΩΝ ΥΠΟΤΡΟΦΩΝ ΚΑΘΙΔΡΥΜΑΤΟΣ ΑΘΑΝΑΣΙΟΥ ΜΑΤΑΛΑ Α ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ

ΥΛΗ ΕΞΕΤΑΣΕΩΝ 2007 ΥΠΟΨΗΦΙΩΝ ΥΠΟΤΡΟΦΩΝ ΚΑΘΙΔΡΥΜΑΤΟΣ ΑΘΑΝΑΣΙΟΥ ΜΑΤΑΛΑ Α ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ ΥΛΗ ΕΞΕΤΑΣΕΩΝ 2007 ΥΠΟΨΗΦΙΩΝ ΥΠΟΤΡΟΦΩΝ ΚΑΘΙΔΡΥΜΑΤΟΣ ΑΘΑΝΑΣΙΟΥ ΜΑΤΑΛΑ Α ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ Μετά την αλλαγή των σχολικών εγχειριδίων το σχολικό έτος 2006-2007 και επειδή, λόγω της εφαρμογής κύκλων συνδιδασκαλίας

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Τμήμα Επιστημών της Θάλασσας Σύντομες οδηγίες συγγραφής της Πτυχιακής Εργασίας

Τμήμα Επιστημών της Θάλασσας Σύντομες οδηγίες συγγραφής της Πτυχιακής Εργασίας Τμήμα Επιστημών της Θάλασσας Σύντομες οδηγίες συγγραφής της Πτυχιακής Εργασίας Περίληψη (τυπική έκταση: 2-3 παράγραφοι) Η Περίληψη συνοψίζει την εργασία και τα κύρια ευρήματα αυτής με τέτοιον τρόπο, ώστε

Διαβάστε περισσότερα

Η γλώσσα ως σύστημα και ως χρήση. Ασπασία Χατζηδάκη, Επίκουρη καθηγήτρια ΠΤΔΕ

Η γλώσσα ως σύστημα και ως χρήση. Ασπασία Χατζηδάκη, Επίκουρη καθηγήτρια ΠΤΔΕ Η γλώσσα ως σύστημα και ως χρήση Ασπασία Χατζηδάκη, Επίκουρη καθηγήτρια ΠΤΔΕ 2009-10 Τι είναι γλώσσα; Γλώσσα είναι το σύστημα ήχων ( φθόγγων ) και εννοιών που χρησιμοποιούν οι ανθρώπινες κοινότητες για

Διαβάστε περισσότερα

ΠΡΟΚΗΡΥΞΗ ΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΣΤΗ «ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ» ΠΡΟΣΚΛΗΣΗ ΥΠΟΒΟΛΗΣ ΥΠΟΨΗΦΙΟΤΗΤΩΝ

ΠΡΟΚΗΡΥΞΗ ΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΣΤΗ «ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ» ΠΡΟΣΚΛΗΣΗ ΥΠΟΒΟΛΗΣ ΥΠΟΨΗΦΙΟΤΗΤΩΝ ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟ ΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΦΙΛΟΣΟΦΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΦΙΛΟΛΟΓΙΑΣ ΤΟΜΕΑΣ ΓΛΩΣΣΟΛΟΓΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΕΛΕΓΧΟΥ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ Ενότητα 9: Σημασιολογική οργάνωση του λόγου νοητό λεξικό Οκαλίδου Αρετή Τμήμα Εκπαιδευτικής και Κοινωνικής Πολιτικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Σχετικά με τη διδακτική προσέγγιση του γλωσσικού δανεισμού

Σχετικά με τη διδακτική προσέγγιση του γλωσσικού δανεισμού Σχετικά με τη διδακτική προσέγγιση του γλωσσικού δανεισμού Περιεχόμενα 1. Εισαγωγικά στοιχεία 1.1 Η τρέχουσα αντιμετώπιση του γλωσσικού δανεισμού 1.2 Η προσέγγιση του θέματος μέσα από το σχολείο 1.3 Σχετικά

Διαβάστε περισσότερα

ΕΠΙΜΟΡΦΩΤΙΚΗ ΗΜΕΡΙΔΑ «Η ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΜΑΘΗΤΗ ΣΥΜΦΩΝΑ ΜΕ ΤΑ ΝΕΑ ΠΡΟΓΡΑΜΜΑΤΑ ΣΠΟΥΔΩΝ»

ΕΠΙΜΟΡΦΩΤΙΚΗ ΗΜΕΡΙΔΑ «Η ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΜΑΘΗΤΗ ΣΥΜΦΩΝΑ ΜΕ ΤΑ ΝΕΑ ΠΡΟΓΡΑΜΜΑΤΑ ΣΠΟΥΔΩΝ» ΕΠΙΜΟΡΦΩΤΙΚΗ ΗΜΕΡΙΔΑ «Η ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΜΑΘΗΤΗ ΣΥΜΦΩΝΑ ΜΕ ΤΑ ΝΕΑ ΠΡΟΓΡΑΜΜΑΤΑ ΣΠΟΥΔΩΝ» ΕΙΣΗΓΗΣΗ: «Πρακτικές αξιολόγησης κατά τη διδασκαλία των Μαθηματικών» Γιάννης Χριστάκης Σχολικός Σύμβουλος 3ης Περιφέρειας

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑ ΠΡΟΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΓΕΡΜΑΝΙΚΗΣ ΓΛΩΣΣΑΣ ΚΑΙ ΦΙΛΟΛΟΓΙΑΣ ΦΙΛΟΣΟΦΙΚΗ ΣΧΟΛΗ -ΕΚΠΑ ΚΡΙΤΗΡΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΠΙΣΤΗΜΟΝΙΚΩΝ ΕΡΓΑΣΙΩΝ

ΠΡΟΓΡΑΜΜΑ ΠΡΟΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΓΕΡΜΑΝΙΚΗΣ ΓΛΩΣΣΑΣ ΚΑΙ ΦΙΛΟΛΟΓΙΑΣ ΦΙΛΟΣΟΦΙΚΗ ΣΧΟΛΗ -ΕΚΠΑ ΚΡΙΤΗΡΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΠΙΣΤΗΜΟΝΙΚΩΝ ΕΡΓΑΣΙΩΝ ΠΡΟΓΡΑΜΜΑ ΠΡΟΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΓΕΡΜΑΝΙΚΗΣ ΓΛΩΣΣΑΣ ΚΑΙ ΦΙΛΟΛΟΓΙΑΣ ΦΙΛΟΣΟΦΙΚΗ ΣΧΟΛΗ -ΕΚΠΑ ΚΡΙΤΗΡΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΕΠΙΣΤΗΜΟΝΙΚΩΝ ΕΡΓΑΣΙΩΝ ΠΛΕΓΜΑ ΓΙΑ ΤΗ ΒΑΘΜΟΛΟΓΗΣΗ ΤΩΝ ΓΡΑΠΤΩΝ ΕΡΓΑΣΙΩΝ Αξιολόγηση γραπτών

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΥΝΤΑΞΗ: ΟΡΘΟΛΟΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ (FORMAL SYNTAX)

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΥΝΤΑΞΗ: ΟΡΘΟΛΟΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ (FORMAL SYNTAX) ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΥΝΤΑΞΗ: ΟΡΘΟΛΟΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ (FORMAL SYNTAX) Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά

Διαβάστε περισσότερα

ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ ΑΠΘ. 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ

ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ ΑΠΘ. 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ Σπύρος Δόικας translatum@translatum.gr ΑΠΘ Τομέας Μετάφρασης του Τμήματος Γαλλικής Γλώσσας και

Διαβάστε περισσότερα

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ Α ΓΥΜΝΑΣΙΟΥ. Προτεινόμενος Προγραμματισμός κατά ενότητα

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ Α ΓΥΜΝΑΣΙΟΥ. Προτεινόμενος Προγραμματισμός κατά ενότητα ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: 202-203 ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ Α ΓΥΜΝΑΣΙΟΥ Προτεινόμενος Προγραμματισμός κατά ενότητα η Ενότητα Οι πρώτες μέρες σε ένα σχολείο Διδακτικές : 9

Διαβάστε περισσότερα

A systematic study of the universal properties and of the structure of cartographical language is still at an elementary stage. The fundamental basis

A systematic study of the universal properties and of the structure of cartographical language is still at an elementary stage. The fundamental basis A systematic study of the universal properties and of the structure of cartographical language is still at an elementary stage. The fundamental basis for such a study is seen in semiotics. (SALITCHEV,

Διαβάστε περισσότερα

Πληροφορίες τμημάτων & επιπέδων _v.1. Πληροφορίες τμημάτων & επιπέδων. τηλέφωνα επικοινωνίας: 211.403-7682 & 690.9012085 email: info@valores.

Πληροφορίες τμημάτων & επιπέδων _v.1. Πληροφορίες τμημάτων & επιπέδων. τηλέφωνα επικοινωνίας: 211.403-7682 & 690.9012085 email: info@valores. 2013 Πληροφορίες τμημάτων & επιπέδων ΒΑΣΙΚΟ Επίπεδο A Περιγραφή βασικού επιπέδου Α1 Ολοκληρώνοντας το επίπεδο Α1 της Ισπανικής γλώσσας, ο σπουδαστής θα είναι ικανός να κατανοήσει και να χρησιμοποιήσει

Διαβάστε περισσότερα

8.2 Εννοιολογική χαρτογράφηση

8.2 Εννοιολογική χαρτογράφηση 8.2 Εννοιολογική χαρτογράφηση Η εννοιολογική χαρτογράφηση (concept mapping) αποτελεί ένα μέσο για την αναπαράσταση των γνώσεων, των ιδεών, των εννοιών προς οικοδόμηση (Jonassen et al. 1998), των νοητικών

Διαβάστε περισσότερα

Η γλώσσα των μέσων κοινωνικής δικτύωσης: Υφομετρική ανάλυση με προεκτάσεις στην γλωσσική διδασκαλία

Η γλώσσα των μέσων κοινωνικής δικτύωσης: Υφομετρική ανάλυση με προεκτάσεις στην γλωσσική διδασκαλία Η γλώσσα των μέσων κοινωνικής δικτύωσης: Υφομετρική ανάλυση με προεκτάσεις στην γλωσσική διδασκαλία Γιώργος Κ. Μικρός Τμήμα Ιταλικής Γλώσσας και Φιλολογίας - ΕΚΠΑ Περίγραμμα ομιλίας Κοινωνικά Μέσα Δικτύωσης

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2010-2011 ΑΣΚΗΣΗ Συγκομιδή και δεικτοδότηση ιστοσελίδων Σκοπός της άσκησης είναι η υλοποίηση ενός ολοκληρωμένου συστήματος συγκομιδής και δεικτοδότησης ιστοσελίδων.

Διαβάστε περισσότερα

ヤ Διδασκαλία της Γλώσσας στις τάξεις Γ & Δ

ヤ Διδασκαλία της Γλώσσας στις τάξεις Γ & Δ ヤ Διδασκαλία της Γλώσσας στις τάξεις Γ & Δ Μαρία Θ. Παπαδοπούλου, PhD Σχολική Σύμβουλος 6ης Περιφέρειας Π.Ε. ν. Λάρισας Ελασσόνα, 19 Νοεμβρίου 2012 Επιμέρους τομείς στο γλωσσικό μάθημα 1. Προφορικός Λόγος

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΜΕΤΑΦΡΑΣΗΣ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ ΜΟΝΑ Α ΑΥΤΟΜΑΤΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΦΥΣΙΚΩΝ ΓΛΩΣΣΩΝ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΜΕΤΑΦΡΑΣΗΣ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ ΜΟΝΑ Α ΑΥΤΟΜΑΤΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΦΥΣΙΚΩΝ ΓΛΩΣΣΩΝ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΜΕΤΑΦΡΑΣΗΣ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ ΜΟΝΑ Α ΑΥΤΟΜΑΤΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΦΥΣΙΚΩΝ ΓΛΩΣΣΩΝ Ονοµατικά σύνολα της Νέας Ελληνικής: Εξάλειψη µορφολογικών αµφισηµιών

Διαβάστε περισσότερα

ΑΕΠΠ Ερωτήσεις θεωρίας

ΑΕΠΠ Ερωτήσεις θεωρίας ΑΕΠΠ Ερωτήσεις θεωρίας Κεφάλαιο 1 1. Τα δεδομένα μπορούν να παρέχουν πληροφορίες όταν υποβάλλονται σε 2. Το πρόβλημα μεγιστοποίησης των κερδών μιας επιχείρησης είναι πρόβλημα 3. Για την επίλυση ενός προβλήματος

Διαβάστε περισσότερα

«Δοκιμασία Εκφραστικού Λεξιλογίου σε τυπικά αναπτυσσόμενα παιδιά ηλικίας 6 8 ετών»

«Δοκιμασία Εκφραστικού Λεξιλογίου σε τυπικά αναπτυσσόμενα παιδιά ηλικίας 6 8 ετών» «Δοκιμασία Εκφραστικού Λεξιλογίου σε τυπικά αναπτυσσόμενα παιδιά ηλικίας 6 8 ετών» Γλώσσα: Το φυσικό εκείνο σύστημα επικοινωνίας που χρησιμοποιείται από τον άνθρωπο και έχει ως βάση του τον έναρθρο λόγο.

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ Γ. Κατηγορίες (Μέρη του Λόγου)

ΕΝΟΤΗΤΑ Γ. Κατηγορίες (Μέρη του Λόγου) ΓΛΩ 372 ΕΝΟΤΗΤΑ Γ. Κατηγορίες (Μέρη του Λόγου) Πρέπει να ονοματίσουμε τους διάφορους κόμβους με ταμπέλες που να παραπέμπουν στα μέρη του λόγου ή, πιο τεχνικά, στις συντακτικές κατηγορίες που εμφανίζονται

Διαβάστε περισσότερα

Software Production Company

Software Production Company Ανάπτυξη Υποδοµής Γλωσσικής Τεχνολογίας για το Βιοϊατρικό Τοµέα Neurosoft A.E. --- ΕΑΙΤΥ ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ» Προϋπολογισµός: 561.240 ιάρκεια: 18 µήνες ΕπιστηµονικόςΥπεύθυνος:

Διαβάστε περισσότερα

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005 ΕΚΕΦΕ «ηµόκριτος» Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών Εργαστήριο Τεχνολογίας Γνώσεων και Λογισµικού Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005 Το Εργαστήριο Τεχνολογίας Γνώσεων και Λογισµικού

Διαβάστε περισσότερα

Media Monitoring. Ενότητα 2: Η ανάλυση περιεχομένου. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ

Media Monitoring. Ενότητα 2: Η ανάλυση περιεχομένου. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ Media Monitoring Ενότητα 2: Η ανάλυση περιεχομένου Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ Ορισμός Μετατρέπει υλικό ποιοτικής κυρίως φύσης σε μορφή ποσοτικών/ποιοτικών δεδομένων Μπορεί να οριστεί ως

Διαβάστε περισσότερα

Γλωσσική Τεχνολογία. Μάθημα 3 ο : Βασικές Γλωσσολογικές Έννοιες Ι: Μορφολογία. Βασιλική Σιμάκη

Γλωσσική Τεχνολογία. Μάθημα 3 ο : Βασικές Γλωσσολογικές Έννοιες Ι: Μορφολογία. Βασιλική Σιμάκη 1 Γλωσσική Τεχνολογία Μάθημα 3 ο : Βασικές Γλωσσολογικές Έννοιες Ι: Μορφολογία 2 Επεξεργασία Φυσικής Γλώσσας Κυρίως γραπτή γλώσσα, κύριος στόχος η δημιουργία υπολογιστικών μοντέλων γλωσσολογικών θεωριών

Διαβάστε περισσότερα

Α. Ερωτήσεις Σωστού - Λάθους

Α. Ερωτήσεις Σωστού - Λάθους 2 Ο ΓΕΛ ΣΥΚΕΩΝ ΜΑΘΗΜΑ : ΤΕΧΝΟΛΟΓΙΑ Α ΛΥΚΕΙΟΥ ΚΑΘΗΓΗΤΗΣ : ΤΡΑΣΑΝΙΔΗΣ ΓΕΩΡΓΙΟΣ διπλ. Ηλ/γος Μηχ/κός ΠΕ 12 ΘΕΜΑΤΙΚΟ ΑΝΤΙΚΕΙΜΕΝΟ ΠΡΟΣ ΑΞΙΟΛΟΓΗΣΗ : ΜΕΤΑΒΛΗΤΕΣ ΣΧΕΣΗ ΜΕΤΑΞΥ ΜΕΤΑΒΛΗΤΩΝ-ΕΠΙΣΤΗΜΟΝΙΚΗ ΜΕΘΟΔΟΣ- ΕΙΔΗ

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Τεχνικές NLP Σχεδιαστικά Θέματα Natural Language Processing Επεξεργασία δεδομένων σε φυσική γλώσσα Κατανόηση φυσικής γλώσσας από τη μηχανή

Διαβάστε περισσότερα

Πρόλογος της γαλλικής έκδοσης

Πρόλογος της γαλλικής έκδοσης Πρόλογος της γαλλικής έκδοσης Η Λατινική γραμματική της σειράς Bescherelle είναι μια εύκολη και πλήρης γραμματική της λατινικής γλώσσας, με αντικειμενικό στόχο να δι ευκολύνει τη μελέτη, τη μετάφραση και

Διαβάστε περισσότερα

Αυτόματα. Παράδειγμα: πωλητής καφέ (iii) Παράδειγμα: πωλητής καφέ (iv) Εισαγωγή στην Επιστήμη των Υπολογιστών 6

Αυτόματα. Παράδειγμα: πωλητής καφέ (iii) Παράδειγμα: πωλητής καφέ (iv) Εισαγωγή στην Επιστήμη των Υπολογιστών 6 Εισαγωγή στην Επιστήμη των Υπολογιστών 3η ενότητα: Αυτόματα και Τυπικές Γραμματικές http://www.corelab.ece.ntua.gr/courses/ Αυτόματα Τρόπος κωδικοποίησης αλγορίθμων. Τρόπος περιγραφής συστημάτων πεπερασμένων

Διαβάστε περισσότερα

Ψηφίδες για τη Νεοελληνική Γλώσσα

Ψηφίδες για τη Νεοελληνική Γλώσσα [1] Ψηφίδες για τη Νεοελληνική Γλώσσα Παρουσίαση και ενδεικτικά παραδείγματα εκπαιδευτικής αξιοποίησης Συντάκτρια: Μαρία Αλεξίου (εκπαιδευτικός ΠΕ02, ΜΔΕ Θεωρητικής Γλωσσολογίας, συντονίστρια του ψηφιακού

Διαβάστε περισσότερα

1 Ανάλυση Προβλήματος

1 Ανάλυση Προβλήματος 1 Ανάλυση Προβλήματος 1.1 Η Έννοια Πρόβλημα Τι είναι δεδομένο; Δεδομένο είναι οτιδήποτε μπορεί να γίνει αντιληπτό από έναν τουλάχιστον παρατηρητή, με μία από τις πέντε αισθήσεις του. Τι είναι επεξεργασία

Διαβάστε περισσότερα

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Διπλωματική Εργασία με θέμα: Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού Καραγιάννης Ιωάννης Α.Μ.

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΡΣΗ ΑΜΦΙΣΗΜΙΑΣ ΛΕΞΕΩΝ (ΑΠΟΣΑΦΗΝΙΣΗ ΕΝΝΟΙΑΣ ΛΕΞΕΩΝ) WORD SENSE DISAMBIGUATION

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΡΣΗ ΑΜΦΙΣΗΜΙΑΣ ΛΕΞΕΩΝ (ΑΠΟΣΑΦΗΝΙΣΗ ΕΝΝΟΙΑΣ ΛΕΞΕΩΝ) WORD SENSE DISAMBIGUATION ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΡΣΗ ΑΜΦΙΣΗΜΙΑΣ ΛΕΞΕΩΝ (ΑΠΟΣΑΦΗΝΙΣΗ ΕΝΝΟΙΑΣ ΛΕΞΕΩΝ) WORD SENSE DISAMBIGUATION Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα.

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΟ MANAGEMENT ΣΗΜΕΙΩΣΕΙΣ ΕΡΓΑΣΤΗΡΙΟΥ. Ορισμοί

ΕΙΣΑΓΩΓΗ ΣΤΟ MANAGEMENT ΣΗΜΕΙΩΣΕΙΣ ΕΡΓΑΣΤΗΡΙΟΥ. Ορισμοί Ορισμοί Ηγεσία είναι η διαδικασία με την οποία ένα άτομο επηρεάζει άλλα άτομα για την επίτευξη επιθυμητών στόχων. Σε μια επιχείρηση, η διαδικασία της ηγεσίας υλοποιείται από ένα στέλεχος που κατευθύνει

Διαβάστε περισσότερα

Ιδιότητες και Τεχνικές Σύνταξης Επιστημονικού Κειμένου Σχολιασμός ερευνητικής πρότασης

Ιδιότητες και Τεχνικές Σύνταξης Επιστημονικού Κειμένου Σχολιασμός ερευνητικής πρότασης Ιδιότητες και Τεχνικές Σύνταξης Επιστημονικού Κειμένου Σχολιασμός ερευνητικής πρότασης Αναστασία Χριστοδούλου, Dr. Γεώργιος Δαμασκηνίδης Τμήμα Ιταλικής Γλώσσας & Φιλολογίας Θεσσαλονίκη, 2015 Ιδιότητες

Διαβάστε περισσότερα

Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση

Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση Πέρα όµως από την Γνωσιακή/Εννοιολογική ανάλυση της δοµής και του περιεχοµένου των σχολικών εγχειριδίων των Μαθηµατικών του Δηµοτικού ως προς τις έννοιες

Διαβάστε περισσότερα

Κεφάλαιο 3ο: Γραμματικοί φορμαλισμοί

Κεφάλαιο 3ο: Γραμματικοί φορμαλισμοί Σύνοψη Κεφάλαιο 3ο: Γραμματικοί φορμαλισμοί Παρουσιάζουμε σε αυτό το Κεφάλαιο δύο μεγάλες κατευθύνσεις στην Υπολογιστική Γλωσσολογία, των λεξικών γενετικών γραμματικών και του Λεξικού-Γραμματική. Στο πλαίσιο

Διαβάστε περισσότερα

Η βιβλιοθήκη της Ι.Μ. Ευαγγελισμού της Θεοτόκου

Η βιβλιοθήκη της Ι.Μ. Ευαγγελισμού της Θεοτόκου Ελένη Γαλιώτου Τμήμα Πληροφορικής, ρ ΤΕΙ Αθήνας 1-10-2010 1 Η βιβλιοθήκη της Ι.Μ. Ευαγγελισμού της Θεοτόκου Σκιάθου Ψηφιοποίηση Το ερευνητικό έργο «ΠΟΛΥΤΙΜΟ» Πρόσβαση στο περιεχόμενο των ιστορικών βιβλίων

Διαβάστε περισσότερα

Θεωρία Υπολογισμού και Πολυπλοκότητα Ασυμφραστικές Γλώσσες (3)

Θεωρία Υπολογισμού και Πολυπλοκότητα Ασυμφραστικές Γλώσσες (3) Θεωρία Υπολογισμού και Πολυπλοκότητα Ασυμφραστικές Γλώσσες (3) Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Μη Ασυμφραστικές Γλώσσες (2.3) Λήμμα Άντλησης για Ασυμφραστικές Γλώσσες Παραδείγματα

Διαβάστε περισσότερα

Περιεχόμενα. Ανάλυση προβλήματος. Δομή ακολουθίας. Δομή επιλογής. Δομή επανάληψης. Απαντήσεις. 1. Η έννοια πρόβλημα Επίλυση προβλημάτων...

Περιεχόμενα. Ανάλυση προβλήματος. Δομή ακολουθίας. Δομή επιλογής. Δομή επανάληψης. Απαντήσεις. 1. Η έννοια πρόβλημα Επίλυση προβλημάτων... Περιεχόμενα Ανάλυση προβλήματος 1. Η έννοια πρόβλημα...13 2. Επίλυση προβλημάτων...17 Δομή ακολουθίας 3. Βασικές έννοιες αλγορίθμων...27 4. Εισαγωγή στην ψευδογλώσσα...31 5. Οι πρώτοι μου αλγόριθμοι...54

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

2.5.1 Χρήση δεξιοτήτων αρχειοθέτησης για τη διατήρηση ενός καθιερωμένου συστήματος

2.5.1 Χρήση δεξιοτήτων αρχειοθέτησης για τη διατήρηση ενός καθιερωμένου συστήματος 2.5 Σύστημα αρχειοθέτησης, έγγραφα και βάσεις δεδομένων 2.5.1 Χρήση δεξιοτήτων αρχειοθέτησης για τη διατήρηση ενός καθιερωμένου συστήματος Να είναι σε θέση να διατηρήσει ένα καθιερωμένο, ηλεκτρονικό και

Διαβάστε περισσότερα

Εισαγωγή στη Γλωσσολογία Ι

Εισαγωγή στη Γλωσσολογία Ι ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εισαγωγή στη Γλωσσολογία Ι Εισαγωγικά: τι είναι γλώσσα, τι είναι γλωσσολογία Διδάσκοντες: Επίκ. Καθ. Μαρία Λεκάκου, Λέκτορας Μαρία Μαστροπαύλου Άδειες

Διαβάστε περισσότερα

Θεωρία Υπολογισμού και Πολυπλοκότητα Ασυμφραστικές Γλώσσες (1)

Θεωρία Υπολογισμού και Πολυπλοκότητα Ασυμφραστικές Γλώσσες (1) Θεωρία Υπολογισμού και Πολυπλοκότητα Ασυμφραστικές Γλώσσες (1) Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Ασυμφραστικές Γραμματικές (2.1) Τυπικός Ορισμός Σχεδιασμός Ασυμφραστικών Γραμματικών

Διαβάστε περισσότερα

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 2 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 2 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Γιώργος Δημητρίου Μάθημα 2 ο Αλφάβητα και Γλώσσες Αλφάβητο: Ένα μη κενό και πεπερασμένο σύνολο συμβόλων Γλώσσα: Ένα οποιοδήποτε υποσύνολο των συμβολοσειρών ενός αλφαβήτου (οι προτάσεις της γλώσσας, πχ.

Διαβάστε περισσότερα

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή

ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ ΠΕΡΙΛΗΨΗ. Εισαγωγή ΚΑΤΑΝΟΗΣΗ ΤΗΣ ΙΑΤΑΞΗΣ ΤΩΝ ΑΡΙΘΜΩΝ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΑΠΟΛΥΤΗΣ ΤΙΜΗΣ ΣΤΟΝ ΑΞΟΝΑ ΤΩΝ ΠΡΑΓΜΑΤΙΚΩΝ ΑΡΙΘΜΩΝ Αθανάσιος Γαγάτσης Τµήµα Επιστηµών της Αγωγής Πανεπιστήµιο Κύπρου Χρήστος Παντσίδης Παναγιώτης Σπύρου Πανεπιστήµιο

Διαβάστε περισσότερα

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ Ενότητα 9: Τεχνητή νοημοσύνη Δημοσθένης Πασχαλίδης Τμήμα Ιερατικών Σπουδών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

8 η Ενότητα. Κατάκτηση του σημασιολογικού τομέα

8 η Ενότητα. Κατάκτηση του σημασιολογικού τομέα 8 η Ενότητα Κατάκτηση του σημασιολογικού τομέα 1. Εισαγωγή Είχαμε πει στο μάθημα Εισαγωγή στη Γλωσσολογία, ότι ο τομέας της Σημασιολογίας χωρίζεται στη λεξική και στη δομική σημασιολογία. Όσον αφορά τη

Διαβάστε περισσότερα

Τίτλος Εργασίας Καινοτόμου Προγράμματος και Δράσης

Τίτλος Εργασίας Καινοτόμου Προγράμματος και Δράσης Τίτλος Εργασίας Καινοτόμου Προγράμματος και Δράσης Επώνυμο και Όνομα Πρώτου Εισηγητή (ΠΡΟΣΟΧΗ: πρώτα το Επώνυμο) Ιδιότητα, Εργασιακός Φορέας, Διεύθυνση email Επώνυμο και Όνομα Δεύτερου Εισηγητή (ΠΡΟΣΟΧΗ:

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ 12 η εβδομάδα Κεφάλαιο 11 Τεχνητή νοημοσύνη Τεχνητή νοημοσύνη 11.1 Νοημοσύνη και μηχανές 11.2 Αντίληψη 11.3 Συλλογισμός 11.4 Άλλοι τομείς της έρευνας 11.5 Τεχνητά νευρωνικά δίκτυα

Διαβάστε περισσότερα

1. Περιγραφητές επικοινωνιακών δραστηριοτήτων. 2. Τη γλωσσική «ύλη» του προγράμματος σπουδών

1. Περιγραφητές επικοινωνιακών δραστηριοτήτων. 2. Τη γλωσσική «ύλη» του προγράμματος σπουδών ΠΕΡΙ ΤΗΣ ΥΛΗΣ ΤΟΥ ΕΠΣ-ΞΓ Το ΕΠΣ-ΞΓ περιλαμβάνει δύο κατηγορίες δεδομένων: 1. Περιγραφητές επικοινωνιακών δραστηριοτήτων Πρόκειται για μια σειρά δηλώσεων ή περιγραφικών δεικτών που προσδιορίζουν ακριβώς

Διαβάστε περισσότερα

Παιδαγωγικές δραστηριότητες μοντελοποίησης με χρήση ανοικτών υπολογιστικών περιβαλλόντων

Παιδαγωγικές δραστηριότητες μοντελοποίησης με χρήση ανοικτών υπολογιστικών περιβαλλόντων Παιδαγωγικές δραστηριότητες μοντελοποίησης με χρήση ανοικτών υπολογιστικών περιβαλλόντων Βασίλης Κόμης, Επίκουρος Καθηγητής Ερευνητική Ομάδα «ΤΠΕ στην Εκπαίδευση» Τμήμα Επιστημών της Εκπαίδευσης και της

Διαβάστε περισσότερα

Μοντελοποίηση Υπολογισμού. Γραμματικές Πεπερασμένα Αυτόματα Κανονικές Εκφράσεις

Μοντελοποίηση Υπολογισμού. Γραμματικές Πεπερασμένα Αυτόματα Κανονικές Εκφράσεις Μοντελοποίηση Υπολογισμού Γραμματικές Πεπερασμένα Αυτόματα Κανονικές Εκφράσεις Προβλήματα - Υπολογιστές Δεδομένου ενός προβλήματος υπάρχουν 2 σημαντικά ερωτήματα: Μπορεί να επιλυθεί με χρήση υπολογιστή;

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 4 ο : Συντακτική ανάλυση. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 4 ο : Συντακτική ανάλυση. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 4 ο : Συντακτική ανάλυση Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Γλωσσική Τεχνολογία, Μάθημα 4 ο, Συντακτική

Διαβάστε περισσότερα

Η γλωσσική ανάπτυξη των παιδιών.

Η γλωσσική ανάπτυξη των παιδιών. Η γλωσσική ανάπτυξη των παιδιών. Κανείς δεν φαντάζεται ότι ο λόγος θα εμφανισθεί απότομα, στην τελική του μορφή μ ένα χτύπημα μιας μαγικής ράβδου, σαν μια μηχανή έτοιμη για χρήση. Η εγκατάσταση του πολύπλοκού

Διαβάστε περισσότερα

Τίτλος Εργασίας. Επώνυμο και Όνομα Πρώτου Εισηγητή (ΠΡΟΣΟΧΗ: πρώτα το Επώνυμο) Ιδιότητα, Εργασιακός Φορέας, Διεύθυνση

Τίτλος Εργασίας. Επώνυμο και Όνομα Πρώτου Εισηγητή (ΠΡΟΣΟΧΗ: πρώτα το Επώνυμο) Ιδιότητα, Εργασιακός Φορέας, Διεύθυνση Τίτλος Εργασίας Επώνυμο και Όνομα Πρώτου Εισηγητή (ΠΡΟΣΟΧΗ: πρώτα το Επώνυμο) Ιδιότητα, Εργασιακός Φορέας, Διεύθυνση email Επώνυμο και Όνομα Δεύτερου Εισηγητή (ΠΡΟΣΟΧΗ: πρώτα το Επώνυμο) Ιδιότητα, Εργασιακός

Διαβάστε περισσότερα