Μετατροπή Μαθηματικών-σε-Ομιλία για παραγωγή Ψηφιακών Ακουστικών Βιβλίων στην Ελληνική Γλώσσα

Σχετικά έγγραφα
Ανάπτυξη καθολικά σχεδιασμένου ψηφιακού εκπαιδευτικού υλικού για τα Μαθηματικά της Ε τάξης Δημοτικού, για μαθητές γενικής και ειδικής εκπαίδευσης

Αυτόματη Ακουστικοποίηση Μαθηματικών Εκφράσεων στην Ελληνική Γλώσσα

Ανοικτά Ακαδημαϊκά Μαθήματα: Κανόνες Προσβασιμότητας Έκδοση 1.0

Σχεδιασμός στο Διαδίκτυο και ηλεκτρονική προσβασιμότητα e-inclusion

Διάγραμμα Μαθήματος. Σελίδα1 5

Μαθηματικά Λογισμικά και Γλώσσες Αναπαράστασης Γνώσης

Web 論 文. Performance Evaluation and Renewal of Department s Official Web Site. Akira TAKAHASHI and Kenji KAMIMURA

Υπηρεσίες Ακαδημαϊκών Βιβλιοθηκών για τυφλούς και άτομα με περιορισμένη όραση:

Τo πρόγραμμα «Διάγραμμα Ροής» και η διδακτική του αξιοποίηση στην Διδασκαλία του προγραμματισμού

Ανάπτυξη διαδικτυακής διαδραστικής εκπαιδευτικής εφαρμογής σε λειτουργικό σύστημα Android

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc.

Προσβασιμότητα Περιεχομένου στα Ανοικτά Μαθήματα

Maxima SCORM. Algebraic Manipulations and Visualizing Graphs in SCORM contents by Maxima and Mashup Approach. Jia Yunpeng, 1 Takayuki Nagai, 2, 1

ΜΑΘΗΜΑ 3 ΛΟΓΙΣΜΙΚΟ (SOFTWARE)

Μοντέλο Παροχής Υπηρεσιών Προσβασιμότητας για Φοιτητές με Αναπηρία

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

ΠΕΡΙΛΗΨΗ. Είναι γνωστό άτι καθημερινά διακινούνται δεκάδες μηνύματα (E~mail) μέσω του διαδικτύου

Γιώργος Χρ. Μακρής. Σύγχρονες Γλώσσες Σήμανσης του Διαδικτύου. Αναπαράσταση Μαθηματικών κειμένων στο διαδίκτυο. Η Γλώσσα MathML

Δράση Δ2: Προετοιμασία Παραγωγή Εκπαιδευτικού υλικού. Π.2.1: Εκπαιδευτικό υλικό. Διδάσκων: Γεώργιος Κουρουπέτρογλου, Καθηγητής

Αναλυτικές οδηγίες για τη δημιουργία προσβάσιμων εγγράφων PDF από προσβάσιμα έγγραφα MS-Word και MS- PowerPoint 2010

Βασίλειος Κοντογιάννης ΠΕ19

Ανοικτά Ακαδημαϊκά Μαθήματα στο Οικονομικό Πανεπιστήμιο Αθηνών Προσβασιμότητα

TCExam Ερευνητικό και Ακαδημαϊκό Ινστιτούτο Τεχνολογίας Υπολογιστών, 2

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

Έκδοση: 1.0. από και MS-

Μεθοδολογία Εκπαιδευτικής Έρευνας

Προσομοίωση Συστημάτων

Έρευνα για την προσβασιμότητα των τυφλών και των ατόμων με περιορισμένη όραση στους Δικτυακούς Τόπους των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών

Έκδοση: 1.0. με το. Ασημίνα

G. Kokkinankis, E. Dermatas, E. Coutsogeorgopoulos

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής

ΔΥΣΚΟΛΙΑ ΣΤΗΝ ΑΝΑΓΝΩΣΗ ΔΥΣΚΟΛΙΑ ΜΕ ΤΗΝ ΟΡΘΟΓΡΑΦΙΑ ΔΥΣΑΝΑΓΝΩΣΤΑ ΓΡΑΜΜΑΤΑ ΧΑΜΗΛΗ ΦΩΝΟΛΟΓΙΚΗ ΕΝΗΜΕΡΟΤΗΤΑ

Επιστήμη της Πληροφορικής. Εργασία του μαθητή Δημήτρη Τσιαμπά του τμήματος Α4

Εργαστηριακή εισήγηση. «ΜΑΘΗΣΙΣ: Μία Ευφυής Διαδικτυακή Τάξη Άλγεβρας»

κεφάλαιο Βασικές Έννοιες Επιστήμη των Υπολογιστών

ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ

Παρουσίαση Μαθηματικών Κειμένων στο Διαδίκτυο

ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΕΝΝΟΙΑΣ ΤΟΥ ΟΡΙΟΥ ΣΥΝΑΡΤΗΣΗΣ

21/02/17. Μετρήσεις. Μετρήσεις. Μετρήσεις ΕΠΑ 604: ΑΞΙΟΛΟΓΗΣΗ & ΜΕΤΡΗΣΕΙΣ ΣΤΗΝ ΠΡΟΣΧΟΛΙΚΗ ΑΓΩΓΗ

Paper 3 Reading and Understanding 1GK0/3F or 3H

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή

Επέκταση του Ελληνικού WordNet µε Όρους Πληροφορικής και Σηµασιολογικές Σχέσεις Βασισµένες σε Μοντέλο Κατανόησης Κειµένου

ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

FORTRAN & Αντικειμενοστραφής Προγραμματισμός ΣΝΜΜ 2016

Επιλεγμένο εκπαιδευτικό υλικό, καθολικά σχεδιασμένο για μαθητές με αναπηρία. ΕΛΛΗΝΟΓΕΡΜΑΝΙΚΗ ΑΓΩΓΗ Παλλήνη,

Από Θεωρίες Μάθησης σε Περιβάλλοντα Μάθησης

Επικοινωνιών στην Εκπαίδευση. Τεχνολογίες Πληροφορίας & (ΤΠΕ-Ε)

Τεχνολογία στην Εκπαίδευση Εισαγωγή. Χαρίκλεια Τσαλαπάτα 24/9/2012

Λογισμικό διδασκαλίας των μαθηματικών της Γ Τάξης Γυμνασίου

ΔΙΑΣΥΝΔΕΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΙΣΤΟΣΕΛΙΔΩΝ ΣΕ ΕΝΙΑΙΟ ΠΕΡΙΒΑΛΛΟΝ: ΕΦΑΡΜΟΓΗ ΣΤΟΝ ΙΣΤΟΤΟΠΟ ΤΗΣ ΣΧΟΛΗΣ ΧΗΜΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΕΜΠ

Η παραγωγή αναφορικών προτάσεων από κυπριόπουλα παιδιά με Γλωσσική Διαταραχή

Θέµατα αξιολόγησης εκπαιδευτικού λογισµικού

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΑΚΑΔΗΜΑΪΚΟΥ ΕΤΟΥΣ

Τεχνικές σχεδίασης προγραμμάτων, Προγραμματιστικά Περιβάλλοντα

Κεφάλαιο 7: Τεχνολογία Λογισμικού

ΕΝΙΑΙΟ ΠΕΙΡΑΜΑΤΙΚΟ ΛΥΚΕΙΟ ΒΑΡΒΑΚΕΙΟΥ ΣΧΟΛΗΣ Μουσών και Παπαδιαμάντη Π. Ψυχικό τηλ

Αρχιτεκτονική Υπολογιστών. ηµήτρης Γκιζόπουλος Καθηγητής

Προσβασιμότητα περιεχομένου στα ψηφιακά μαθήματα

Εκπαιδευτικό πολυμεσικό σύστημα διδασκαλίας των μαθηματικών (Εφαρμογή στη δευτεροβάθμια εκπαίδευση)

Σ.Ε.Π. (Σύνθετο Εργαστηριακό Περιβάλλον)

Πληροφοριακό Σύστημα διαρκούς παρακολούθησης Δοµών Eιδικής Αγωγής & Εκπαίδευσης (ΔΕΑΕ)

13 ο ΠΑΓΚΥΠΡΙΟ ΣΥΝΕΔΡΙΟ ΔΥΣΛΕΞΙΑΣ Σάββατο 6 Οκτωβρίου 2010 Εργαστήριο

ΟΔΗΓΙΕΣ ΜΟΡΦΟΠΟΙΗΣΗΣ ΕΡΓΑΣΙΩΝ

Εξισώσεις α βαθμού. Γνωστικό αντικείμενο: Μαθηματικά (ΔΕ) Δημιουργός: ΣΟΦΙΑ ΣΜΠΡΙΝΗ

Εύλογες προσαρμογές για την Απασχόληση Ανθρώπων με Αναπηρία

Εφαρμογές Ψηφιακών Ηλεκτρονικών

Πρακτικά όλα τα προβλήματα ασφαλείας οφείλονται σε λάθη στον κώδικα

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

10% του πληθυσμού των ανεπτυγμένων χωρών αποτελούν Άτομα με Αναπηρίες (ΑμεΑ)

Εξ αποστάσεως υποστήριξη του έργου των Εκπαιδευτικών μέσω των δικτύων και εργαλείων της Πληροφορικής

«Επικοινωνίες δεδομένων»

Φοιτήτρια: Τσαρκοβίστα Βικτώρια (Α.Μ ) Επιβλέπων καθηγητής: Χριστοδουλίδης Παύλος

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

Πρακτικές Εφαρμογές της Πληροφορικής στην Περιβαλλοντική Εκπαίδευση

Σχολή Μηχανικής και Τεχνολογίας. Πτυχιακή διατριβή

Οδηγίες δημιουργίας προσβάσιμων εγγράφων PDF από προσβάσιμα έγγραφα MS Word 2010

Πτυχιακή εργασία του φοιτητή Δούκα Κλεάνθη

Towards a more Secure Cyberspace

Σχεδίαση και Ανάλυση Τοπικών Δικτύων Υπολογιστών

Keywords λέξεις κλειδιά:

Διαφορές single-processor αρχιτεκτονικών και SoCs

Πληροφορική Γυμνασίου. Δρ. Κοτίνη Ισαβέλλα Σχ. Σύμβουλος Πληροφορικής Πέλλας, Ημαθίας και Πιερίας

Η αποτελεσματικότητα της καινούργιας θεραπείας για μαθησιακές δυσκολίες επιστημονικά αποδεδειγμένη

Η αβεβαιότητα στη μέτρηση.

Σύντοµες οδηγίες για τη δηµιουργία προσβάσιµων εγγράφων PDF από προσβάσιµα έγγραφα MS-Office 2010

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Μαλούτα Θεανώ Σελίδα 1

Συστήματα Πολυμέσων. Ανάπτυξη Πολυμεσικών Εφαρμογών Ι

Προσβασιμότητα των τυφλών και των ατόμων με περιορισμένη όραση στις ιστοσελίδες των ειδικών βιβλιοθηκών. Μαρία Μαγκλάση, Ράνια Σιάτρη

- Επιστημονικός Υπεύθυνος Ενέργειας: Θεόδωρος Γ. Εξαρχάκος Καθηγητής του Πανεπιστημίου Αθηνών Πρόεδρος του Παιδαγωγικού Ινστιτούτου «Αναμόρφωση / εκ

Σύστημα ψηφιακής επεξεργασίας ακουστικών σημάτων με χρήση προγραμματιζόμενων διατάξεων πυλών. Πτυχιακή Εργασία. Φοιτητής: ΤΣΟΥΛΑΣ ΧΡΗΣΤΟΣ

Σύντομες οδηγίες για τη δημιουργία προσβάσιμων εγγράφων PDF Νικόλαος Παπαθεοδώρου Γεώργιος Κουρουπέτρογλου

ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΠΟΛΥΜΕΣΑ- ΔΙΚΤΥΑ ΚΥΚΛΟΥ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΗΡΕΣΙΩΝ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΠΙΣΤΟΠΟΙΗΜΕΝΟΣ ΤΕΧΝΙΚΟΣ ΛΟΓΙΣΜΙΚΟΥ ΚΑΙ ΜΗΧΑΝΩΝ ΨΗΦΙΟΠΟΙΗΣΗΣ «Certified Software And Digitalization Technician» SYLLABUS. Έκδοση 1.

Πέργαµος: Το Σύστηµα Ψηφιακής Βιβλιοθήκης του Πανεπιστηµίου Αθηνών

Μοντελοποίηση τρισδιάστατου κόσμου σε πραγματικό κόσμο: το παράδειγμα του Kinect. ιδάσκων: Φ. Αζαριάδης Φοιτήτρια: Άρτεμις-Αγγελική Σφύρη

Transcript:

Μετατροπή Μαθηματικών-σε-Ομιλία για παραγωγή Ψηφιακών Ακουστικών Βιβλίων στην Ελληνική Γλώσσα Γεώργιος Κουρουπέτρογλου και Παρασκευή Ρήγα Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Εργαστήριο Φωνής και Προσβασιμότητας koupe@di.uoa.gr ΠΕΡΙΛΗΨΗ Σε αυτή την εργασία προτείνουμε μια μεθοδολογία βασισμένη στο πρότυπο DAISY- 3 για την παραγωγή και την ακουστική απόδοση Ψηφιακών Ακουστικών Βιβλίων (ΨΑΒ) τα οποία περιέχουν μαθηματικές εκφράσεις στην Ελληνική γλώσσα. Παρουσιάζουμε τη απαιτούμενη ροή διαδικασιών και εργασιών καθώς και όλα τα απαραίτητα εργαλεία λογισμικού. Ακολουθώντας αυτή τη ροή μπορεί κάποιος να παράγει με επιτυχία ΨΑΒ με μαθηματικά στην Ελληνική, δίνοντας στους μαθητές με εντυποαναπηρία ακουστική πρόσβαση σε πραγματικό χρόνο για όλο τα φάσμα των βιβλίων τους. Προτείνουμε επίσης μια μεθοδολογία αξιολόγησης της ακουστικής απόδοσης ΨΑΒ με μαθηματικά και παρουσιάζουμε τα αποτελέσματά της αφού εισάγουμε την ελληνική συλλογή μαθηματικών εκφράσεων UoAMathCorpus. Math-to-Text conversion for the production of Greek Digital Talking Books ABSTRACT In this work we propose a methodology for the production and rendering of Digital Talking Books (DTB), based on the DAISY-3 standard, that supports Mathematical content for the Greek language. We present the necessary workflow along with all the related software tools. By following this workflow one can successfully produce Greek DTB with mathematics and thus can provide to the print disabled real-time access to the whole spectrum of their STEM books. We also recommend a suitable evaluation methodology of the acoustic rendering for DTB with mathematics with the relative results after introducing the mathematical corpus UoAMathCorpus. Εισαγωγή Τα ακουστικά ή ομιλούντα βιβλία αποτελούν ηχογραφήσεις κειμένου και έκαναν την εμφάνισή τους περί το 1930 με κύριο αποδέκτη τα άτομα με εντυποαναπηρία. Στην εντυποαναπηρία περιλαμβάνονται οι αναπηρίες όρασης, η 1

κινητική αναπηρία στα άνω άκρα και κάποιες μαθησιακές δυσκολίες όπως η δυσλεξία. Στην παραδοσιακή μέθοδο παραγωγής αυτών των βιβλίων γίνεται ηχογράφηση του ομιλητή καθώς αναγιγνώσκει το έντυπο βιβλίο. Σήμερα το πρότυπο που ακολουθείται παγκοσμίως για την παραγωγή Ψηφιακών Ακουστικών Βιβλίων (ΨΑΒ) είναι το DAISY [1]. Το MathML Modular Extension [2] περιλαμβάνεται στην έκδοση 3 του εν λόγω προτύπου [3] και επιτρέπει το συνδυασμό κειμένου με μαθηματικά χάρη σε έναν νέο μηχανισμό που παρέχει πλήρη υποστήριξη για MathML. Τα ΨΑΒ τύπου DAISY που υποστηρίζουν πλήρως τα μαθηματικά αναφέρονται και ως πλήρως DAISY ΨΑΒ. Στην πλειοψηφία τους τα υπάρχοντα ακουστικά βιβλία είναι λογοτεχνικά, ενώ τα σχολικά βιβλία και πανεπιστημιακά συγγράμματα των θετικών επιστημών που περιέχουν μαθηματικές σχέσεις μετατρέπονται στην Ελλάδα μόνο με ηχογράφηση από φυσικό ομιλητή. Τα συστήματα αυτόματης μετατροπής Κειμένου-σε-Ομιλία (ΚσΟ) έχουν βελτιωθεί σημαντικά, με αποτέλεσμα να παράγουν ΨΑΒ με σχεδόν φυσική φωνή χωρίς τη μεσολάβηση ηχογράφησης από ομιλητή, όμως δεν είναι σε θέση σήμερα να κάνουν αυτόματα τη μετατροπή Μαθηματικών-σε-Ομιλία. Το Εργαστήριο Φωνής & Προσβασιμότητας του Πανεπιστημίου Αθηνών σχεδίασε και υλοποίησε ένα σύστημα αυτόματης ακουστικοποίησης Μαθηματικών συμβόλων και εκφράσεων σε Ελληνική συνθετική ομιλία, το οποίο μπορεί να χρησιμοποιηθεί και κατά την παραγωγή ΨΑΒ. Ως προς την αναπαραγωγή των ΨΑΒ σε μορφή DAISY απαιτείται ειδικό λογισμικό το οποίο μπορεί να αποκωδικοποιεί τις δομές και τη σημασιολογία της MathML ώστε να δώσει στο μαθητή τη δυνατότητα να πλοηγείται μέσα στο μαθηματικό περιεχόμενο. Το λογισμικό αυτό αναφέρεται στη βιβλιογραφία ως Advanced MathML player [4]. Σκοπός της παρούσας εργασίας είναι η παρουσίαση μιας μεθοδολογίας για την παραγωγή και απόδοση ΨΑΒ με Μαθηματικά στην Ελληνική γλώσσα καθώς και μια διαδικασία για την αξιολόγησή τους. Παρουσιάζουμε την απαιτούμενη ροή διαδικασιών και εργασιών, καθώς και το σύνολο των απαραίτητων εργαλείων λογισμικού για την παραγωγή και απόδοση των ΨΑΒ. Ακολουθώντας αυτή τη ροή μπορεί κάποιος να παράγει με επιτυχία ακουστικά βιβλία με μαθηματικά στην Ελληνική γλώσσα, δίνοντας στους μαθητές με εντυποαναπηρία ακουστική πρόσβαση σε πραγματικό χρόνο για όλο τα φάσμα των βιβλίων τους. 1. Προτεινόμενη μεθοδολογία Η ηχητική απόδοση των μαθηματικών εκφράσεων ενός εγγράφου δεν είναι τόσο απλή όσο η απόδοση απλού κειμένου. Απαιτεί τη συνεργασία διάφορων εφαρμογών λογισμικού. Την τελευταία δεκαετία αναπτύχθηκαν πολλές εφαρμογές με στόχο τη μετατροπή Μαθηματικών-σε-Ομιλία. Το AudioMath [5] χρησιμοποιεί MathML για να εκφέρει ακουστικά τα μαθηματικά, το MathTalk [6] είναι ένα σύστημα ομιλίας μαθηματικών εκφράσεων που χρησιμοποιεί αναγνώρισης ομιλίας, το MathSpeak, μια εφεύρεση του Δρ Nemeth, ενσωματώνει ένα σύνολο κανόνων για την ομιλία μαθηματικών εκφράσεων μη διφορούμενα, το οποίο αργότερα βελτιώθηκε [7, 8], και έγινε μέρος του προγράμματος MathPlayer [9]. Τα βήματα που απαιτούνται για να λάβουμε ένα σωστό ΨΑΒ DAISY με μαθηματικά βρίσκονται εφαρμόζοντας αντίστροφη μηχανική (reverse engineering). Ο μόνος προηγμένος MathML DAISY player που είναι διαθέσιμος σήμερα για την απόδοση μαθηματικών είναι ο ReadHear (πρώην gh Player) [10]. Ο ReadHear 2

συνεργάζεται με το MathPlayer για να εμφανίσει και να αποδόσει ακουστικά το μέρος του αρχείου DAISY που είναι γραμμένο σε MathML. Στην πλευρά του ανοικτού κώδικα, δεν βρίσκουμε ακόμα κάποιον editor για να παράγει πλήρη DAISY ΨΑΒ. Το DAISY Pipeline odt2braille είναι μια επέκταση ανοικτού κώδικα για το OpenOffice.org Writer το οποίο μπορεί να μετατρέψει τα αρχεία ODT σε DAISY-3 βιβλία, όμως, δεν μπορεί να παράγει DAISY με υποστήριξη για μαθηματικά [11]. Στην εμπορική πλευρά απ την άλλη, υπάρχουν δύο λύσεις διαθέσιμες για να δημιουργήσουμε DTB με μαθηματικό περιεχόμενο. Η εφαρμογή MS-Word έχει τη δυνατότητα να παράγει DAISY χρησιμοποιώντας το δωρεάν πρόσθετο Save-As-DAISY [12]. Πέρα από αυτό, για να γίνει και η απαιτούμενη μετατροπή των μαθηματικών εκφράσεων σε MathML, απαιτείται η χρήση του MathDaisy [13]. Το ChattyInfty 3 [14] παράγει DAISY-2 βιβλία που υποστηρίζουν τα μαθηματικά. Στην περίπτωσή του όμως όλες οι μαθηματικές εκφράσεις αντιμετωπίζονται ως εικόνες που συνοδεύονται από αρχεία ήχου. Προς το παρόν, το πρόγραμμα αυτό υποστηρίζει μόνο Ιαπωνικά και Αγγλικά. Η υποστήριξη της μητρικής γλώσσας του χρήστη σε ένα ομιλούν βιβλίο είναι δεδομένη αναγκαιότητα [4, 15, 16]. Το έργο AcceSciTech [17] σχεδιάζει να δημιουργήσει το πλαίσιο ZedAI, που θα παράγει τελικά EPUB 3, το οποίο καλύπτει το πλήρες DAISY. Με βάση τα παραπάνω, η μεθοδολογία που προτείνουμε για την παραγωγή ΨΑΒ DAISY με υποστήριξη για τα μαθηματικά παρουσιάζεται στο Σχήμα 1, από όπου προκύπτει ότι η ακουστική απόδοση των Μαθηματικών στα βιβλία DAISY είναι το αποτέλεσμα της διαδοχικής χρήσης ενός συνόλου εφαρμογών λογισμικού. Ξεκινώντας με ένα τυπωμένο βιβλίο Μαθηματικών, θα πρέπει αυτό να μεταγραφεί σε εμπλουτισμένο αρχείο εγγράφου (.docx) με MathML. Στη συνέχεια, θα μετατραπεί σε Πλήρες DAISY χρησιμοποιώντας ένα εργαλείο που υποστηρίζει μαθηματικά. Στο τέλος, το βιβλίο Μαθηματικών DAISY θα αποδοθεί ακουστικά από ένα συμβατό DAISY Reader, ο οποίος με τη σειρά του θα κάνει χρήση ενός Συνθέτη Ομιλίας. Δεδομένου ότι η MathML δε μεταβάλλεται κατά τη διάρκεια μετατροπής από αρχείο εγγράφου σε αρχείο DAISY, τα εργαλεία που μπορούν να επιβάλουν λάθη στην τελική ακουστική απόδοση είναι το εργαλείο συγγραφής MathML και το εργαλείο ακουστικής απόδοση MathML. Σχήμα 1 Προτεινόμενη μεθοδολογία για παραγωγή και ακουστική απόδοση ΨΑΒ τύπου DAISY με πλήρη υποστήριξη μαθηματικών στην Ελληνική γλώσσα 3

1.1 Ανάπτυξη corpus Μαθηματικές εκφράσεις. Σε μια πιλοτική μας μελέτη [18] χρησιμοποιήθηκαν οι μαθηματικές εκφράσεις που είχαν προταθεί στο σύστημα επεξεργασίας ήχου AsTeR [19]. Αποδείχθηκε πως το MathPlayer v.2 μπορεί να τις αποδώσει σωστά στην ελληνική γλώσσα. Για να ελέγξουμε περαιτέρω το MathPlayer, ή οποιοδήποτε σχετικό σύστημα, χρειαζόμαστε ένα ευρύτερο σύνολο των εκφράσεων (corpus). Αυτό το corpus πρέπει να φέρει τα ακόλουθα χαρακτηριστικά: Να περιλαμβάνει όλα τα σύμβολα και τους τύπους που βρίσκονται στην ύλη του εθνικού προγράμματος σπουδών, μέχρι και τη β βάθμια εκπαίδευση, Να έχει ένα κατάλληλο μέγεθος ώστε να μπορεί να χρησιμοποιηθεί αποδοτικά κατά τη διάρκεια της αξιολόγησης, Να είναι κατηγοριοποιημένο βάσει του μαθηματικού περιεχομένου, Να έχει διαβαθμίσεις στο επίπεδο πολυπλοκότητας. Για να δημιουργηθεί αυτό το corpus για τα ελληνικά εξετάστηκαν όλα τα σχολικά βιβλία μαθηματικών από το δημοτικό σχολείο ως το λύκειο για μαθηματικά σύμβολα και εκφράσεις. Οι εκφράσεις που βρέθηκαν κατατάσσονται στις ακόλουθες οκτώ κατηγορίες: (α) παράγωγοι, (β) κλάσματα, (γ) ολοκληρώματα, (δ) τα όρια, (ε) εκθέτες-δείκτες, (στ) σύνολα, (ζ) πίνακες, και (η) τριγωνομετρία. Παρόμοιες ταξινομήσεις μπορούν να βρεθούν και στην αξιολόγηση άλλων συστημάτων μετατροπής μαθηματικών σε ομιλία [5, 20]. Μετά από έλεγχο που έγινε, αποδεικνύεται πως το MathPlayer υποστηρίζει όλες τις κατηγορίες μαθηματικών που βρίσκονται στα ελληνικά σχολικά εγχειρίδια. Στη συνέχεια, πρέπει να κρατήσουμε ένα αντιπροσωπευτικό σύνολο από κάθε κατηγορία, γι 'αυτό αφαιρούνται οι περίσσιες εκφράσεις όταν έχουν παρόμοια δομή και διαφέρουν μόνο στις αριθμητικές τιμές ή στους τελεστές. Σε μια προσπάθεια να αυξηθεί η δομική πολυπλοκότητα των εκφράσεων, έγινε επιλογή κάποιων εκφράσεων οι οποίες χρησιμοποιούνται στο βιβλίο μαθηματικών όρων του Spiegel [21], σε κάποιες μαθηματικές δημοσιεύσεις και σε διαδικτυακό υλικό μαθηματικών. Επιλέχθηκαν συνολικά 130 εκφράσεις, οι οποίες ομαδοποιούνται σε δύο κύριες κατηγορίες ως προς την πολυπλοκότητα τους: Απλές εκφράσεις, που βρέθηκαν σε βιβλία, Πολύπλοκες εκφράσεις, που βρέθηκαν κυρίως σε επιστημονικές εργασίες. Επιπλέον, ένα υποσύνολο των εκφράσεων ξαναγράφτηκε χρησιμοποιώντας ένα μείγμα ελληνικών και αγγλικών στην ίδια έκφραση για να ελεγχτεί η ακουστική τους απόδοση. Εάν ο σύνθετης ομιλίας που χρησιμοποιείται υποστηρίζει και τις δύο γλώσσες, τότε θα πρέπει να αποδοθούν χωρίς προβλήματα. Το τελικό corpus που αναπτύχθηκε ονομάζεται UoAMathCorpus και είναι ελεύθερα διαθέσιμο [27]. Κείμενο με μαθηματικές εκφράσεις. Εκτός από τα παραπάνω σετ μαθηματικών εκφράσεων, συγκεντρώθηκε ένα ακόμη σύνολο με θεωρήματα έκτασης 8 σελίδων, με σκοπό να ελεγχτεί η απόδοση όταν περιπλέκονται κείμενο και μαθηματικά. Σε αυτές τις σελίδες μπορεί κανείς να βρει: Μόνο Ελληνικά στις μαθηματικές εκφράσεις και το κείμενο, Μίξη Ελληνικών και Αγγλικών στις μαθηματικές εκφράσεις και μόνο ελληνικά στο κείμενο. Οι μαθηματικές εκφράσεις και το κείμενο πρέπει να αποδοθούν όπως εμφανίζονται στο κείμενο του βιβλίου, αναφορικά με τη σειρά και το περιεχόμενο. 4

Πολλές φορές όταν γράφουμε μαθηματικά στα ελληνικά, χρησιμοποιούμε αγγλικά σύμβολα στη θέσω των Ελληνικών, όπως «x» αντί του «χ» (chi) και «y» αντί του «ψ» (psi). Εφόσον το σύστημα μετατροπής Κειμένου-σε-Ομιλία που χρησιμοποιείται υποστηρίζει και τις δύο γλώσσες, τότε το πρόγραμμα ακουστικής απόδοσης των μαθηματικών θα πρέπει επίσης να μην έχει πρόβλημα. 1.2 Επεξεργασία περιεχομένου Χρησιμοποιώντας το MathDaisy για να παράγουμε ΨΑΒ DAISY που υποστηρίζουν μαθηματικά, θα πρέπει το αρχικό αρχείο με τη MathML να είναι αρχείο εγγράφου (.docx). Ένα δημοφιλές πρόγραμμα επεξεργασίας WYSIWYG μαθηματικών που προτείνεται από το MathPlayer είναι το MathType [22]. Θα μπορούσαμε ακόμη να χρησιμοποιήσουμε κάποιο ανεξάρτητο εργαλείο συγγραφής MathML ή να παράξουμε τον κώδικα κάνοντας μετατροπή από LaTeX, χρησιμοποιώντας είτε ένα δωρεάν εργαλείο (π.χ. TeX4ht [23] για να παράγουμε XHTML + MathML) ή κάποιο εμπορικό εργαλείο (π.χ. GrindEQ [24]). Το μόνο διαθέσιμο εργαλείο που αναγνωρίζει μαθηματικά σε έντυπη μορφή ή PDF είναι το εμπορικό σύστημα ChattyInfty [14]. Μετά τη διόρθωση των λαθών του OCR χρησιμοποιώντας τον InftyEditor [15] και κώδικα LaTeX, μπορούμε να εξάγουμε το έγγραφο σε XHTML + MathML. Οι μαθηματικές εκφράσεις του corpus γράφτηκαν με το MathType 6.9. Η χρήση των εναλλακτικών εργαλείων λογισμικού που μόλις αναφέρθηκαν θα παρήγαγε μη ταυτόσημες γραμμές MathML κώδικα και συνεπώς διαφορετική ακουστική απόδοση κατά την αναπαραγωγή. Η μέθοδος αξιολόγησης που περιγράφεται στο επόμενο κεφάλαιο μπορεί να χρησιμοποιηθεί για να ελέγξει την ακουστική ορθότητα και αποτελεσματικότητα όταν χρησιμοποιούνται εναλλακτικοί τρόποι συγγραφής MathML. 1.3 Αξιολόγηση της ακουστικής απόδοσης Με το UoAMathCorpus [27] o ερευνητής είναι σε θέση να ελέγξει μία-μία την ορθότητα της παραγόμενης MathML για τις εκφράσεις και τα θεωρήματα. Αφού βεβαιωθεί πως η MathML είναι σωστή, μπορεί να προχωρήσει στην αξιολόγηση του εργαλείου απόδοσης της MathML (που στην περίπτωσή μας είναι το MathPlayer). Οι λεξιλογικοί κανόνες, που δείχνουν τις δομικές πληροφορίες της κάθε πιθανής έκφρασης, πρέπει να προσαρμοστούν ορθά στην ελληνική γλώσσα, όπως και τα μαθηματικά σύμβολα. Το UoAMathCorpus μπορεί να επαναχρησιμοποιηθεί για να ελεγχθούν μελλοντικές εκδόσεις του DAISY player και του MathPlayer ή ακόμη και νέα εργαλεία ακουστικής απόδοσης. Το UoAMathCorpus χρησιμοποιείται σε δύο γύρους των δοκιμών [26]: Στον πρώτο γύρο, ένας βλέποντας ερευνητής, χωρίς καμία απώλεια ακοής και με άριστη γνώση των μαθηματικών όρων και συμβόλων που περιλαμβάνονται, πρέπει να ακούσει κάθε έκφραση, ενώ διαβάζει τη δυσδιάστατη απεικόνισή της. Κατά τη διάρκεια αυτού του γύρου σημειώνει πάνω στη δυσδιάστατη απεικόνιση όλους τους τύπους των μαθηματικών σφαλμάτων που έχουμε ορίσει: Διαγραφές (Δ), Εισαγωγές (Ε) και Αντικαταστάσεις (Α). Υπάρχει επίσης ένα νέο είδος λαθών που ονομάζουμε Μεταφράσεις (Μ), όπου ένα μέρος της έκφρασης δεν μεταφράστηκε στην ελληνική γλώσσα. 5

Στο δεύτερο γύρο, ο ίδιος ερευνητής πρέπει να ακούσει την κάθε έκφραση, χρησιμοποιώντας ένα χαμηλότερο ρυθμό ομιλίας, χωρίς όμως να βλέπει τη δυσδιάστατη απεικόνισή. Σε αυτή την περίπτωση θα σημειώνει παράλληλα ο ίδιος την οπτική απεικόνιση. Στη συνέχεια, θα συγκρίνει την οπτική αναπαράσταση της αρχικής έκφρασης με αυτή που ο ίδιος αντιλήφθηκε και θα σημειώνει τα σφάλματα (Δ, Ε, Α, Μ) στην αρχική έκφραση. Ο ερευνητής θα κρατά σημειώσεις ταυτόχρονα με την ακουστική απόδοση των εκφράσεων και στους δύο γύρους, έτσι ώστε η ακουστική μνήμη του να μην επηρεάσει τα αποτελέσματα. Στον πρώτο γύρο σημειώνει τα σφάλματα πάνω στις εκφράσεις, ενώ στο δεύτερο αρχικά σημειώνει τις αντιληπτές εκφράσεις και στη συνέχεια εντοπίζει τα σφάλματα. Στην περίπτωση που ο ερευνητής είναι άτομο με χαμηλή όραση ή τύφλωση θα κρατά σημειώσεις σε έναν υπολογιστή ή σε μια μηχανή braille γραμμένες σε κάποιο μαθηματικό κώδικα, όπως ο Nemeth ή ο Marburg. Στη συνέχεια, θα τις ξαναγράψει σε MathML και θα κάνει τις μετρήσεις των σφαλμάτων χρησιμοποιώντας τη μέθοδο που περιγράφεται στο [25]. Αφού ο ερευνητής θα έχει επιβεβαιώσει την ορθότητα της ακουστικής απόδοσης της κάθε έκφρασης, και ως εκ τούτου των συστημάτων συγγραφής και ακουστικής απόδοσης MathML, μπορεί να γίνει μια πλήρης μελέτη αποτελεσματικότητας του συστήματος, με τη συμμετοχή των διαφόρων ομάδων χρηστών, όπως τα άτομα με χαμηλή όραση ή τα άτομα με δυσλεξία, χρησιμοποιώντας τη μέθοδο που περιγράφεται στο [18]. 2. Αποτελέσματα Ελέγχοντας την ακουστική απόδοση των μαθηματικών εκφράσεων του UoAMathCorpus, τα λάθη διπλασιάζονται όταν μεταβαίνουμε από την αρχική μεταφρασμένη έκδοση 2.1 του MathPlayer (που χρησιμοποιείται ως πρόσθετο στον Internet Explorer) στη μη ελεγμένη μεταφρασμένη έκδοση 3.0 του MathPlayer (που χρησιμοποιείται στο ReadHear) (Πίνακας 1). Ο αριθμός των σφαλμάτων δεν επηρεάζεται από τον αριθμό των υπο-εκφράσεων σε μια μαθηματική έκφραση. Επιπλέον, τα σφάλματα σε κάθε κατηγορία είναι επαναλαμβανόμενα και φθάνουν στο μέγιστο των 6 μοναδικών λαθών ανά κατηγορία. Στο δεύτερο γύρο ο ερευνητής εντόπισε ακόμη λιγότερα αφού ο ίδιος διόρθωσε υποσυνείδητα τα σφάλματα Μ. Πίνακας 2.1 Σφάλματα Διαγραφής (Δ), Εισαγωγής (Ε), Αντικατάστασης (Α) και Μετάφρασης (Μ) Κατηγορία Λάθη του MathPlayer 2.1 Λάθη του MathPlayer 3.0 Παράγωγοι 6M, 1Α 10Μ, 3Α, 1Δ Κλάσματα 0 3Δ Ολοκληρώματα 8Μ 10Μ, 12Α, 4Δ Όρια 1Μ, 1Δ 2M, 12Α, 1Δ Εκθέτες-Δείκτες 7M, 1Α 8M, 4Α, 1Δ Σύνολα 3M, 7Α 9Μ, 3Ε, 1Α, 5Δ Πίνακες 11Μ 18M, 4Δ Τριγωνομετρία 0 2Δ Τα σφάλματα Δ και Μ παράγονται πιθανότατα κατά την απόδοση της εφαρμογής ακουστικής μετατροπής στα ελληνικά, ενώ τα σφάλματα Ε και Α 6

παράγονται από την ίδια την εφαρμογή. Άρα, για να λάβουμε μια ορθή ακουστική απόδοση σε ένα βιβλίο DAISY-3 με πλήρη υποστήριξη μαθηματικών στα ελληνικά, θα πρέπει πρώτα να διορθωθούν τα αντίστοιχα μέρη της εφαρμογής ακουστικής απόδοσης. 3. Συμπεράσματα Παρουσιάσαμε μια ροή εργασιών για την παραγωγή Ψηφιακών Ομιλούντων Μαθηματικών Βιβλίων σε μορφή DAISY η οποία αποδεδειγμένα δίνει σωστά αποτελέσματα στα ελληνικά. Επίσης προτείναμε μια μεθοδολογία, σε συνδυασμό με το UoAMathCorpus [27], για την εξέταση της ορθότητας της απόδοσης Μαθηματικών-σε-Ομιλία ώστε να μπορούμε να αναθεωρήσουμε όλα τα εργαλεία λογισμικού που εμπλέκονται στη ροή εργασιών. Η προτεινόμενη μεθοδολογία αξιολόγησης μπορεί να χρησιμοποιηθεί ακόμη στη δοκιμή διαφορετικών επεξεργαστών MathML, προκειμένου να αυξηθεί το πλήθος των εναλλακτικών εφαρμογών που μπορούν να χρησιμοποιηθούν στη φάση παραγωγής των ΨΑΒ τύπου DAISY με Μαθηματικά. 5. Αναφορές [1] DAISY Consortium. www.daisy.org [2] D. Leas, E. Persoon, N. Soiffer, M. Zacherle «Daisy 3: a standard for accessible multimedia books» IEEE Multimedia, 4, pp 28 37 (2008) [3] R. Ausbrooks, S. Buswell, D. Carlisle, S. Dalmas, S. Devitt, A. Diaz, R. Miner «Mathematical Markup Language (MathML) version 2.0» W3C Recommendation. World Wide Web Consortium (2003) [4] K. Yamaguchi, M. Suzuki «On necessity of a new method to read out math contents properly in DAISY» Lecture Notes in Computer Science, 6180, pp 415-422 (2010) [5] H. Ferreira, D. Freitas «Enhancing the accessibility of mathematics for blind people: the AudioMath project» Lecture Notes in Computer Science, 3118, pp 678-685 (2004) [6] R. Stevens, A. Edwards, P. Harling «Access to mathematics for visually disabled students through multimodal interaction» Hum.-Comput. Interact. 12, pp 47 92 (1997) [7] M.D. Isaacson, S. Srinivasan, L. Lloyd «Development of an algorithm for improving quality and information processing capacity of MathSpeak synthetic speech renderings» J. Disabil. Rehabil. Assistive Technol. 5, pp 83 93 (2010) [8] M.D. Isaacson, L. Lloyd, D. Schleppenbach «Reducing multiple interpretations of mathematical expressions with MathSpeak» In: 1st International Conference on TechnologyBased Learning with Disability, Wright State University, Dayton, Ohio, pp 1-10 (2007) [9] N. Soiffer «MathPlayer v2. 1: web-based math accessibility» In: Proceedings of the 9th International ACM SIGACCESS Conference on Computers and Accessibility. ACM Press, New York, pp 257-258 (2007) [10] ReadHear Player. https://www.gh-accessibility.com/ 7

[11] C. Strobbe, J. Engelen, V. Spiewak «Generating DAISY books from OpenOffice.org» Lecture Notes in Computer Science, 6179, pp 5-11 (2010) [12] D. Archambault, V. Spiewak «OpenOffice.org save-as-daisy extension» In: AAATE 2009. edited by P.L Emiliani et al. IOS Press, pp 212-216 (2009) [13] Design Science. http://www.dessci.com/en/products/mathdaisy/ [14] InftyProject. http://www.inftyproject.org/en/index.html [15] K. Yamaguchi, M. Suzuki «Accessible authoring tool for DAISY ranging from mathematics to others» Lecture Notes in Computer Science 7382, pp 130-137 (2012) [16] M.V. Davydov, O. Lozytskyy, Y. Nikolskyy «Method of Automatic Formulas Reading in Ukrainian» Lviv Polytechnic National University MES of Ukraine, Ukraine (2013) [17] A. Bernier, D. Burger «AcceSciTech: a global approach to make scientific and technical literature accessible» Lecture Notes in Computer Science, 8011, pp 283-290 (2013) [18] H. Kacorri, P. Riga, G. Kouroupetroglou «EAR-math: evaluation of audio rendered mathematics» Lecture Notes in Computer Science 8514, pp 111-120 (2014) [19] T.V. Raman «ASTER-towards modality-independent electronic documents» Multimedia Tools Appl. 6, pp 141 151 (1998) [20] D. Fitzpatrick «Towards Accessible Technical Documents: Production of Speech and Braille Output from Formatted Documents» Doctoral dissertation, Dublin City University (1999) [21] M. Spiegel, S. Lipschutz, J. Liu Mathematical Handbook of Formulas and Tables, 3rd edn McGraw-Hill, New York (1968) [22] Design Science. http://www.dessci.com/en/products/mathtype/ [23] J. Polewczac «LaTeX, MathML, and TEX4HT: Tools for creating accessible documents» Mathematics, CSUN, Northridge (2005) [24] GrindEq. http://www.grindeq.com/ [25] H. Kacorri, P. Riga, G. Kouroupetroglou «Performance metrics and their extraction methods for audio rendered mathematics» Lecture Notes in Computer Science 8547, pp 614-621 (2014) [26] P. Riga, G. Kouroupetroglou, P.-P. Ioannidou «An Evaluation Methodology of Math-to-Speech in Νon-English DAISY Digital Talking Books», Lecture Notes in Computer Science 9758, pp 27-34 (2016). [27] UoAMathCorpus http://speech.di.uoa.gr/math/uoa-corpus.xht 8