9ο Συνέδριο «Ελληνική Γλώσσα και Ορολογία», Αθήνα, 7-9 Νοεμβρίου 2013 Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων Τσιμπούρης Χαράλαμπος Υπ. Διδάκτορας Εργαστήριο Ενσύρματης Τηλ. Τμήμα Ηλ. Μηχ. & Τεχ. Υπολ. Πανεπιστήμιο Πατρών xtsimpouris [at] upatras [dot] gr Κυριάκος Σγάρμπας Επίκουρος Καθηγητής Εργαστήριο Ενσύρματης Τηλ. Τμήμα Ηλ. Μηχ. & Τεχ. Υπολ. Πανεπιστήμιο Πατρών sgarbas [at] upatras [dot] gr Υπό την αιγίδα της Επιτροπής Ερευνών του Πανεπιστημίου Πατρών, στα πλαίσια της βασικής έρευνας Καραθεοδωρής
Δομή Παρουσίασης Εισαγωγή Ανάλυση προβλήματος Μελέτη Εργαλεία & Βάση δεδομένων (corpus) Μεθοδολογία Αποτελέσματα Συμπεράσματα Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 2 / 17 ]
Ανάλυση προβλήματος 1.. ι) Παρασκευαστήρια καταστημάτων υγειονομικού ενδιαφέροντος, τα οποία αδειοδοτούνται σύμφωνα με το Αρθ-39 της Υγ_Δξις-ΑΙβ/8577/83 (ΦΕΚ-526/Β/83 ) και των οποίων τα παραγόμενα προϊόντα διατίθενται από τα καταστήματα αυτά μέσω λιανικής πώλησης. Αναγνώριση παραπομπής; Αναγνώριση κειμένου (παραπομπής); Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 3 / 17 ]
Ανάλυση προβλήματος..2 Συνδέσεις γειτονικών κόμβων που σχετίζονται με το ΦΕΚ 2317/Β/2008 Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 4 / 17 ]
Μελέτη Bayesian networks (Citation Matching) Συντακτική ανάλυση Κανονικές εκφράσεις Προτυποποίηση (XML) Ελληνικά; Πιθανή λύση Ακαδημαϊκή λύση + Καλύπτει περίεργες περιπτώσεις - Αρκετή δουλειά από expert + Σθεναρός μηχανισμός (Robust) Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 5 / 17 ]
Κανονικές εκφράσεις (regular expressions) Μία κανονική έκφραση χρησιμοποιείται για να περιγράψει μία κανονική γλώσσα. Η κανονική έκφραση αναπαριστά ένα "μοντέλο": συμβολοσειρές που ταιριάζουν σ αυτό το μοντέλο ανήκουν στην γλώσσα, που αυτό περιγράφει, όσες δεν ταιριάζουν, δεν ανήκουν στην γλώσσα αυτή. Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 6 / 17 ]
Βάση δεδομένων, Δομή.. 14 Αρχεία ~800 παραπομπές Δημιουργία διαδραστικού εργαλείου σε Apache, PHP & MySQL ΦΕΚ 2013/1990/1980, Υπουργικές αποφάσεις Προεδρικά ρ διατάγματα, κ.α. Επιβεβαίωση κανόνων, ποιοτική & ποσοτική οπτική αναπαράσταση Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 7 / 17 ]
Βάση δεδομένων,..παραδείγματα... κατά τα οριζόμενα στα άρθρα 5 και 7 του ν. 3982/2011. * την εφαρμογή των διατάξεων του άρθρου 7 του ν. 3982/2011, * με το άρθρο 5 παρ. 9 του ν. 3982/2011, * σύμφωνα με τις διατάξεις του ν. 3861/2010 (Α 112) * Κατά τα λοιπά εφαρμόζεται συμπληρωματικά η κοινή υπουργική απόφαση 158/25/ΦΓ9.1/2011 (Β 49) * εμπίπτουν στις διατάξεις του άρθρου 1 του ν. 6422/1934,... Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 8 / 17 ]
Μεθοδολογία, Πρώτη ανάλυση..... την εφαρμογή των διατάξεων του άρθρου 7 του ν. 3982/2011,...... (Ε.Ο.Π.Π.Ε.Π), ο οποίος συστάθηκε με την κ.υ.α. 119959/Η/2011 (Β 2351)...... από το καταργηθέν με το άρθρο 60 παρ. 1 του π.δ. 38/2010 Συμβούλιο...... απαλλοτριούμεναι δυνάμει του από 12.9.74 Π.Δ/τος (ΦΕΚ 238/Δ της 4.10.74) περί τροποποιήσεως...... (Αριθμ. βεβ. διαγραφής από το Μητρώο Ανθρώπινου Δυναμικού του Ελληνικού Δημοσίου 1103682191/ 27 12 2012) Με την υπ αριθμ. ΥΠΑΙΘΠΑ/ ΓΔΔΥ/ ΔΙΟΙΚ/ΤΔΠΙΔ/125214/ 11607/9857/3514/27 12 2012 απόφαση του Υπουργού Παιδείας... Έτος 2011 Nόμος 3982 Άρθρο 7 Έτος 2011 Κεντρική Υπουργ. Απόφαση Αρ. Απόφασης 119959/Η ΦΕΚ Τόμος Β? ΦΕΚ Αριθμός 2351 Συνεργασία με δικηγόρο για δύσκολες περιπτώσεις Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 9 / 17 ]
Μεθοδολογία, Επιλογή κατηγοριών.. Βασικές κατηγορίες παραπομπής: Αναγκαιότητα κατηγοριοποίησης προβλήματος; ΦΕΚ Προεδρικό διάταγμα Νόμος Υπουργική απόφαση Βασιλικό διάταγμα Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 10 / 17 ]
Μεθοδολογία, Δημιουργία κανόνων trial & error.. Βασικές κατηγορίες παραπομπής: ΦΕΚ Προεδρικό διάταγμα Νόμος Υπουργική απόφαση Βασιλικό διάταγμα 4 Κανόνες 1 Κανόνας 1 Κανόνας 1 Κανόνας 1 Κανόνας Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 11 / 17 ]
Μεθοδολογία,..Παράδειγμα ενεργοποιημένου κανόνα Υπουργική απόφαση: /(?<apofasi>(υ\.?α\.? Αποφ)[.\-]*(?<kwdikos>(.{0,4}[0-9]+[\/ ]?)*)\/(?<imerominia>[0-9]{1,2}[. -][0-9]{1,2}[. -][0-9]{2,4} [0-9]{2,4}))/ui Παραδείγματα ενεργοποίησης κανόνα Αποφ-Φ15/7816/616/05 Αποφ-3329/15-2-89 Αποφ-ΗΠ/13727/724/5-8-03 Αποφ-5905/Φ/15839/12-7-95 7 95 Αποφ-3513/80 Αποφ-Π1/4516/31-8-04 Υ.Α. 3046/304/1989 Υ.Α. Α2 2485/2004 Ωφέλιμη πληροφορία με παραγωγή Επισημείωσης (Named Entity Groups) Κωδικός απόφασης Ημερομηνία Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 12 / 17 ]
Αποτελέσματα, Προβλήματα δημιουργίας κανόνων 1.. Λανθασμένη γραφή ΦΕΚ ή προεδρικού διατάγματος Ελλειπή στοιχεία ή στοιχεία που εννοούνται από συμφραζόμενα, τόμος, ημερομηνία Κακή χρήση συμβόλων Λανθασμένη αρίθμηση Πληκτρολόγηση αποστρόφου με τρεις διαφορετικούς τρόπους [ ] (κωδικός 900), [ ] (κωδικός 8217) και [ ' ] (κωδικός 39) Υγ_Δξις-ΑΙβ/8577/83 ή Υγ_Δξις-Α1β/8577/83 Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 13 / 17 ]
Αποτελέσματα,..Προβλήματα δημιουργίας κανόνων 2 Διαφορετική σειρά των επί μέρους στοιχείων ΦΕΚ {ΑΡΙΘΜΟΣ} {ΤΕΥΧΟΣ} {ΗΜΕΡΟΜΗΝΙΑ} ΝΟΜΟΣ {ΗΜΕΡΟΜΗΝΙΑ} ΦΕΚ {ΑΡΙΘΜΟΣ} {ΤΕΥΧΟΣ} ΝΟΜΟΣ {ΗΜΕΡΟΜΗΝΙΑ} ΦΕΚ {ΤΕΥΧΟΣ} {ΑΡΙΘΜΟΣ} ΦΕΚ {ΑΡΙΘΜΟΣ} }{ΗΜΕΡΟΜΗΝΙΑ}{ΤΕΥΧΟΣ} Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 14 / 17 ]
Συμπεράσματα Αρχικός σκοπός: Μελέτη υπάρχουσας κατάστασης Δημιουργία ΒΔ Προβολή προβλημάτων Δημιουργία κανόνων Σαφής έλλειψη προτυποποίησης Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 15 / 17 ]
Μελλοντική κατεύθυνση έρευνας Προσπάθεια προτυποποίησης..σε συνεργασία με Δικηγόρους, νομοτεχνικούς & Μηχανικούς Δημιουργία συστήματος αυτόματης μετατροπής κειμένων σε διασυνδεδεμένο δίκτυο (HyperLinks)..δημιουργία αντίστοιχου world wide web νομικών κειμένων Δημιουργία Οδηγού επιβίωσης & κατάρτιση κοινού..για τη σωστή αναγνώριση και συγγραφή κειμένων σύμφωνα με τα πρότυπα Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 16 / 17 ]
Ερωτήσεις Σας ευχαριστώ για την προσοχή σας Τσιμπούρης Χαράλαμπος, Αναγνώριση παραπομπών σε ελληνικά νομικά κείμενα με χρήση κανόνων. [ 17 / 17 ]