Αυτόματη Ακουστικοποίηση Μαθηματικών Εκφράσεων στην Ελληνική Γλώσσα

Σχετικά έγγραφα
Μαθηματικά Λογισμικά και Γλώσσες Αναπαράστασης Γνώσης

Ανάπτυξη καθολικά σχεδιασμένου ψηφιακού εκπαιδευτικού υλικού για τα Μαθηματικά της Ε τάξης Δημοτικού, για μαθητές γενικής και ειδικής εκπαίδευσης

Παρουσίαση Μαθηματικών Κειμένων στο Διαδίκτυο

Προσβασιμότητα Περιεχομένου στα Ανοικτά Μαθήματα

Γιώργος Χρ. Μακρής. Σύγχρονες Γλώσσες Σήμανσης του Διαδικτύου. Αναπαράσταση Μαθηματικών κειμένων στο διαδίκτυο. Η Γλώσσα MathML

Μοντέλο Παροχής Υπηρεσιών Προσβασιμότητας για Φοιτητές με Αναπηρία

Ανοικτά Ακαδημαϊκά Μαθήματα: Κανόνες Προσβασιμότητας Έκδοση 1.0

Πολυμέσα. Ιστορική Αναδρομή Υπερκείμενο

Υπηρεσίες Ακαδημαϊκών Βιβλιοθηκών για τυφλούς και άτομα με περιορισμένη όραση:

2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ

Λογικός τύπος Τελεστές σύγκρισης Λογικοί τελεστές Εντολές επιλογής Εμβέλεια Μαθηματικές συναρτήσεις Μιγαδικός τύπος ΔΕΥΤΕΡΗ ΔΙΑΛΕΞΗ

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων

Η Ποιότητα της Συνθετικής Οµιλίας στην Ακουστική Αναπαράσταση της. Πληροφορίας

Μετατροπή Μαθηματικών-σε-Ομιλία για παραγωγή Ψηφιακών Ακουστικών Βιβλίων στην Ελληνική Γλώσσα

Δράση Δ2: Προετοιμασία Παραγωγή Εκπαιδευτικού υλικού. Π.2.1: Εκπαιδευτικό υλικό. Διδάσκων: Γεώργιος Κουρουπέτρογλου, Καθηγητής

Εύλογες προσαρμογές για την Απασχόληση Ανθρώπων με Αναπηρία

Σχεδιασμός στο Διαδίκτυο και ηλεκτρονική προσβασιμότητα e-inclusion

Word 3: Δημιουργία πίνακα

Οδηγίες σχεδίασης στο περιβάλλον Blender

Η-Υ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Εργαστήριο 2 Εντολές Εισόδου/Εξόδου Τελεστές. Δρ. Γιώργος Λαμπρινίδης 23/10/2015 Η - Υ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ 1

Εισαγωγή στην MathML. Αριστοτέλειο Πανεπιστήµιο Θεσσαλονίκης Σχολή Θετικών Επιστηµών Τµήµα Μαθηµατικών

Παράδειγμα «Ημίτονο και ζωγραφική!»: Έχει δει στα μαθηματικά τη γραφική παράσταση της συνάρτησης του ημιτόνου; Σας θυμίζει κάτι η παρακάτω εικόνα;

ΜΑΘΗΜΑ 3 ΛΟΓΙΣΜΙΚΟ (SOFTWARE)

Διάγραμμα Μαθήματος. Σελίδα1 5

Προγραμματισμός Διαδικτύου

Δημιουργία προσβάσιμων παρουσιάσεων με χρήση MS-PowerPoint 2010

ΓΛΩΣΣΑ ΑΛΦΑΒΗΤΟ ΤΥΠΟΙ ΔΕΔΟΜΕΝΩΝ ΣΤΑΘΕΡΕΣ ΜΕΤΑΒΛΗΤΕΣ

Γαβαλάς αµιανός

10% του πληθυσμού των ανεπτυγμένων χωρών αποτελούν Άτομα με Αναπηρίες (ΑμεΑ)

Ειδικά θέματα Πληροφορικής Κινηματογραφίας

Επιμορφωτικό Σεμινάριο Διδακτικής των Μαθηματικών με ΤΠΕ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Visual Flowchart Γενικά

«Η ΛΕΙΤΟΥΡΓΙΑ ΤΟΥ BarCode» ( Μια πρόταση για ένα μαθητικό project )

ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΗΣ

Έκδοση: 1.0. με το. Ασημίνα

ΠΕΡΙΛΗΨΗ. Είναι γνωστό άτι καθημερινά διακινούνται δεκάδες μηνύματα (E~mail) μέσω του διαδικτύου

Κεφ 2. Βασικές Έννοιες Αλγορίθμων

ΑΕΠΠ Ερωτήσεις θεωρίας

Εγχειρίδιο Χρήσης του «Μαθη.Συ.»

Κριτήρια Εργαλείου Αυτο-διάγνωσης

2 ΟΥ και 8 ΟΥ ΚΕΦΑΛΑΙΟΥ

ΣΧΗΜΑΤΑ-ΕΙΚΟΝΕΣ-ΕΞΙΣΩΣΕΙΣ

Υπουργείο Πολιτισμού, Παιδείας & Θρησκευμάτων Κέντρο Ελληνικής Γλώσσας

Ειδικές θεματικές οδηγίες για την ανάπτυξη προσβάσιμου εκπαιδευτικού υλικού για Ελληνικά Πολυτονικά Κείμενα

Αναφορά (1/2) Μπορούμε να ορίσουμε μια άλλη, ισοδύναμη αλλά ίσως πιο σύντομη, ονομασία για ποσότητα (μεταβλητή, σταθερή, συνάρτηση, κλπ.

Πρόλογος... 7 ΕΙΔΙΚΟΣ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ

Επικοινωνία:

University Centre Telč, Masaryk University

Τίτλος Πακέτου Certified Computer Expert-ACTA

Κεφάλαιο 7 ο Βασικές Έννοιες Προγραμματισμού (σελ )

3.1 Αριθμητικοί και Λογικοί Τελεστές, Μετατροπές Τύπου (Casting)

Εισαγωγη στην html. Η δομή μιας ιστοσελίδας (αρχείο html) Η βασική δομή ενός αρχείου html είναι η εξής: <html> <head>

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

Ανοιχτά Ακαδημαϊκά Μαθήματα στο ΠΑΜΑΚ

Προσβασιμότητα περιεχομένου στα ψηφιακά μαθήματα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Microsoft Office. Δρ. Νικόλαος Σγούρος

ΠΛΗΡΟΦΟΡΙΚΗ ΣΤΟ ΕΝΙΑΙΟ ΛΥΚΕΙΟ

Σχεδίαση με Ηλεκτρονικούς Υπολογιστές (ΗΥ)

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 11 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

ΒΑΣΙΚΕΣ ΑΡΧΕΣ ΨΗΦΙΑΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ. Κεφάλαιο 3

ΙΕΚ ΞΑΝΘΗΣ. Μάθημα : Στατιστική Ι. Υποενότητα : Σχεδιασμός Ερωτηματολογίου

Προσβασιµότητα στους διαδικτυακούς κόµβους

Ανοικτά Ακαδημαϊκά Μαθήματα στο Οικονομικό Πανεπιστήμιο Αθηνών Προσβασιμότητα

ΤΕΧΝΟΛΟΓΙΕΣ ΣΧΕΔΙΑΣΗΣ ΔΙΑΔΙΚΤΥΑΚΟΥ ΤΟΠΟΥ (Web Site Design Technologies)

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΟΙΚΟΝΟΜΙΑΣ ΥΠΟΔΟΜΩΝ, ΝΑΥΤΙΛΙΑΣ & ΤΟΥΡΙΣΜΟΥ ΑΠΟΦΑΣΗ ΕΠΙ ΔΗΛΩΣΗΣ ΣΗΜΑΤΟΣ ΑΠΟΦΑΣΗ ΕΞ 4288 /

Περιεχόμενα ΜΕΡΟΣ ΠΡΩΤΟ. Πρόλογος... 13

Microsoft PowerPoint 2007

Σου προτείνω να τυπώσεις τις επόμενες τέσσερις σελίδες σε ένα φύλο διπλής όψης και να τις έχεις μαζί σου για εύκολη αναφορά.

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Περιεχόμενα. 2 Αριθμητικά συστήματα

Γενικά Στοιχεία Ηλεκτρονικού Υπολογιστή

Υπηρεσίες για Φοιτητές µε Προβλήµατα Όρασης

K24 Ψηφιακά Ηλεκτρονικά 4: Σχεδίαση Συνδυαστικών Κυκλωμάτων

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

ΜΑΘΗΜΑ: Εργαλεία Ανάπτυξης εφαρμογών internet.

Ερωτήσεις πολλαπλής επιλογής - Κεφάλαιο 2. Α1. Ο αλγόριθμος είναι απαραίτητος μόνο για την επίλυση προβλημάτων πληροφορικής

ΜΑΘΗΜΑΤΑ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ ΠΑΡΑ ΟΣΕΙΣ ΑΣΚΗΣΕΙΣ ΚΑΘΗΓΗΤΕΣ/ΤΡΙΕΣ

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ ΚΕΦΑΛΑΙΟ 2 ο ΚΕΦΑΛΑΙΟ 7 ο ΕΡΩΤΗΣΕΙΣ ΓΕΝΙΚΑ ΠΕΡΙ ΑΛΓΟΡΙΘΜΩΝ

Ο Παλμογράφος στη Διδασκαλία της Τριγωνομετρίας. Εφαρμογές της Τριγωνομετρίας σε πραγματικά προβλήματα και ενδιαφέρουσες επεκτάσεις

Θεωρητικές Ασκήσεις. ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ. 1 ο Μέρος

Το Διαδικτυακό Προσαρμοστικό Συνεργατικό Περιβάλλον Μάθησης SCALE

Τετάρτη 5-12/11/2014. ΣΗΜΕΙΩΣΕΙΣ 3 ου και 4 ου ΜΑΘΗΜΑΤΟΣ ΕΙΔΙΚΟΤΗΤΑ: ΤΕΧΝΙΚΟΣ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ: ΑΡΧΙΤΕΚΤΟΝΙΚΗ Η/Υ Α ΕΞΑΜΗΝΟ

Εκπαιδευτικό Σενάριο: Αναλογίες. Βασίλης Παπαγεωργίου

ΥΠΟΧΡΕΩΤΙΚΕΣ ΓΝΩΣΕΙΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΡΟΣ ΙΙ

Έκδοση: 1.0. από και MS-

ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΚΑΙ ΔΙΚΤΥΩΝ

Λογισμικό διδασκαλίας των μαθηματικών της Γ Τάξης Γυμνασίου

Αναλυτικές οδηγίες για τη δημιουργία προσβάσιμων εγγράφων PDF από προσβάσιμα έγγραφα MS-Word & MS- PowerPoint 2007

ΑΝΑΠΑΡΑΣΤΑΣΗ ΚΕΙΜΕΝΟΥ

Εκπαιδευτικό πολυμεσικό σύστημα διδασκαλίας των μαθηματικών (Εφαρμογή στη δευτεροβάθμια εκπαίδευση)

να ακολουθήσουμε Έναρξη Όλα τα Προγράμματα και να ενεργοποιήσουμε την επιλογή Microsoft Word.

Εγχειρίδιο του πίνακα χαρακτήρων

ΠΛΗΡΟΦΟΡΙΚΗ Ι Εργαστήριο 1 MATLAB ΠΛΗΡΟΦΟΡΙΚΗ Ι ΕΡΓΑΣΤΗΡΙΟ 1. Θέμα εργαστηρίου: Εισαγωγή στο MATLAB και στο Octave

Εισαγωγή - Βασικές έννοιες. Ι.Ε.Κ ΓΛΥΦΑΔΑΣ Τεχνικός Τεχνολογίας Internet Αλγοριθμική Ι (Ε) Σχολ. Ετος A Εξάμηνο

Σήματα και Συστήματα. Διάλεξη 2: Στοιχειώδη Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Εισαγωγή στη JAVA. Εισαγωγή στη Java. Η Java είναι δημιούργημα της SUN MICROSYSTEMS.

Πρόσβαση στην NetLibrary.

Πρακτικές οδηγίες για την Επεξεργασία Κειμένου

Transcript:

Αυτόματη Ακουστικοποίηση Μαθηματικών Εκφράσεων στην Ελληνική Γλώσσα Γεώργιος Κουρουπέτρογλου 1, Hernisa Kacorri 1,2 και Παρασκευή Ρήγα 1 1 Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Εργαστήριο Φωνής και Προσβασιμότητας koupe@di.uoa.gr 2 The Graduate Center, City University of New York, USA ΠΕΡΙΛΗΨΗ Παρουσιάζουμε τα αποτελέσματα της σχεδίασης και υλοποίησης του συστήματος GR-MathPlayer για την αυτόματη ακουστικοποίηση Μαθηματικών συμβόλων και εκφράσεων στην Ελληνική γλώσσα. Το GR-MathPlayer αποτελεί ένα σύστημα Μαθηματικών-σε-Ομιλία που μετατρέπει σε Ελληνική συνθετική ομιλία απλές ή σύνθετες Μαθηματικές εκφράσεις μέχρι και πανεπιστημιακού επιπέδου, καθώς και σύμβολα θετικών επιστημών τα οποία περιλαμβάνονται σε Ελληνικά εκπαιδευτικά βιβλία. Automatic Acoustic Rendering of Math Expressions in the Greek Language ABSTRACT We present the results of the design and implementation of the GR-MathPlayer system for the automatic acoustic rendering of Math symbols and expressions in the Greek language. GR-MathPlayer is a Maths-to-Speech system which converts Greek speech synthesis of simple or complex Mathematical expressions up to university level, as well as symbols of science included in Greek textbooks. Εισαγωγή Οι τεχνολογίες ηλεκτρονικής προσβασιμότητας επιτρέπουν σήμερα ένα κείμενο, είτε στη συνήθη μορφή αρχείων (π.χ..pdf,.doc,.ppt) είτε στη μορφή Διαδικτυακού περιεχομένου (π.χ..html), να χρησιμοποιηθεί αποτελεσματικά, αποδοτικά και με ικανοποιητικό τρόπο από περισσότερους ανθρώπους (συμπεριλαμβανομένων και 9

των Ατόμων με Αναπηρία) σε περισσότερες καταστάσεις ή πλαίσια χρήσης. Η προσβασιμότητα των κειμένων είναι πολύ σημαντική για τους αναγνώστες με εντυποαναπηρία, δηλαδή εκείνους με οπτική ανικανότητα (άτομα με τύφλωση, χαμηλή όραση, δυσχρωματοψία, κλπ), μαθησιακές δυσκολίες (συμπεριλαμβανομένης και της δυσλεξίας) ή κινητική αναπηρία (όπως απώλεια δεξιότητας στα άνω άκρα που δεν επιτρέπει το χειρισμό ενός κειμένου με φυσικό τρόπο). Ενώ οι Υποστηρικτικές Τεχνολογίες πληροφορικής και η ηλεκτρονική προσβασιμότητα είναι εξαιρετικά χρήσιμες για τα άτομα με εντυποαναπηρία, και ιδιαίτερα εκείνους με τύφλωση, ώστε να ανταπεξέλθουν σε πολλούς τομείς της καθημερινής ζωής, η υποστήριξη των Μαθηματικών συμβόλων και εκφράσεων παραμένει ακόμη αρκετά περιορισμένη. Για παράδειγμα, παρά τη σημαντική πρόοδο στα συστήματα αυτόματης μετατροπής Κειμένου-σε-Ομιλία (ΚσΟ), ακόμα και στην Ελληνική γλώσσα, αυτά δεν υποστηρίζουν την αυτόματη μετατροπή Μαθηματικών-σε-Ομιλία. Αυτό αποτελεί ένα κρίσιμο πρόβλημα, επειδή, από τη μια τα Μαθηματικά είναι σημαντικά σε όλες τις βαθμίδες εκπαίδευσης, και ιδιαίτερα στις θετικές επιστήμες, και από την άλλη τα άτομα με τύφλωση αντιμετωπίζουν πολύ σημαντικά εμπόδια στη μελέτη τους. Υπάρχουν πολλοί τρόποι να αποδώσει κανείς ακουστικά μια μαθηματική έκφραση, καθώς αυτό που θα εκφωνηθεί και ο τρόπος με τον οποίο θα εκφωνηθεί ποικίλλουν ανάλογα τη γλώσσα, τη θεματική περιοχή στις θετικές επιστήμες και την εξειδίκευση ή εξοικείωση του ακροατή. Η εξοικείωση του χρήστη επηρεάζει το επίπεδο φλυαρίας του συστήματος, και συνεπώς την αμφισημία/μονοσημία, τα οποία θα πρέπει να μπορεί να τα ρυθμίζει ο χρήστης. Η εργασία αυτή στοχεύει να παρουσιάσει τα αποτελέσματα της σχεδίασης και υλοποίησης ενός συστήματος αυτόματης ακουστικοποίησης Μαθηματικών συμβόλων και εκφράσεων σε Ελληνική συνθετική ομιλία. Στην πραγματικότητα ο στόχος περιλαμβάνει την υποστήριξη της ακουστικοποίησης οποιουδήποτε κειμένου της Ελληνικής το οποίο περιέχει απλά ή σύνθετα Μαθηματικά, καθώς και σύμβολα θετικών επιστημών, μέχρι και πανεπιστημιακού επιπέδου. Στo πλαίσιo αυτής της εργασίας αναπτύχθηκε ένα πρότυπο στυλ ομιλίας των μαθηματικών εκφράσεων στην Ελληνική γλώσσα, το οποίο ενσωματώθηκε στο ελεύθερα διαθέσιμο λογισμικό MathPlayer 3.0. 1. Τεχνολογίες συγγραφής και δημοσίευσης μαθηματικών εγγράφων στο Διαδίκτυο Η επικοινωνία με τα μαθηματικά στο Διαδίκτυο είναι ένα αρκετά δύσκολο έργο. [1]. Η εμφάνιση του συστήματος TeX [2], που αναπτύχθηκε από τον Donald Knuth, έλυσε την πλειοψηφία των προβλημάτων που αφορούν στα τυπωμένα έγγραφα. Στο Διαδίκτυο όμως, η χρήση της HTML γλώσσας σε συνδυασμό με κάποια σύμβολα Unicode, αν και αποτελεί την απλούστερη μορφή εγγράφων και κάποιοι τη χρησιμοποιούν ακόμη και για τη συγγραφή μαθηματικών, δεν είναι μια προσβάσιμη λύση για τα μαθηματικά. Στην πάροδο των χρόνων αναπτύχθηκαν αρκετές γλώσσες επισημείωσης που επιτρέπουν την δημοσίευση επιστημονικών εγγράφων στο Διαδίκτυο (MINSE [3], SVG [4], WebTeX, TeX, HyperLaTeX [5] και MathML [6]). 10

Ξεκινώντας από (La)TeX τα συστήματα LaTeX2HTML [7] και TeX4ht [8] προσπάθησαν να παράγουν αρχικά HTML με ενσωματωμένες εικόνες GIF. Η έλλειψη όμως εναλλακτικού κειμένου, που θα μπορουσε να κάνει τις εικόνες αυτές ακουστικά προσβάσιμες, κάνει την ιστοσελίδα μη προσβάσιμη. Κάποιες άλλες εφαρμογές προσπαθούν να αποδώσουν οπτικά τις Μαθηματικές εκφράσεις μέσω applet (WebEQ [9]) ή plugin (TechExplorer [10] της IBM και ο MathPlayer [11] της Design Science). Στην πρώτη περίπτωση το περιεχόμενο φορτώνεται από έναν εξυπηρετητή και δεν απαιτείται καμία εγκατάσταση, ενώ στη δεύτερη μετατρέπεται απ ευθείας στο φυλλομετρητή όπου έχει εγκατασταθεί το plugin. Κάποια ερευνητικά συστήματα για την ακουστική απόδοση μαθηματικού περιεχομένου είναι το ASTeR [12], που παίρνει ως είσοδο TEX, και το MathTalk [13], που παρουσιάζει με απλούστερο τρόπο την πληροφορία. Και τα δύο χρησιμοποιούν βοηθητικούς ήχους πέρα από ομιλία. Αντίθετα, το TechRead [14-15] στηριζόταν μόνο στα προσωδιακά γνωρίσματα της συνθετικής ομιλίας, όμοια με το MathPlayer. 2. Γλώσσα επισημείωσης μαθηματικών MathML Η MathML, επέκταση της XML, αποτελεί μια προδιαγραφή της Κοινοπραξίας του Παγκόσμιου Ιστού (W3C) για την κωδικοποίηση των Μαθηματικών. Περιλαμβάνει την MathML Αναπαράστασης, για την περιγραφή της διάταξης των μαθηματικών εκφράσεων, και την MathML Περιεχομένου, για την επισημείωση της σημασίας και της δομής των Μαθηματικών. Η πρώτη αναφέρεται πρωτίστως στην οπτική ενώ η δεύτερη είναι πιο χρήσιμη για την ακουστική απόδοση των εκφράσεων [26]. Όπως είναι αναμενόμενο, οι περισσότερες εφαρμογές συγγραφής και παραγωγής MathML δίνουν στην έξοδό τους MathML Αναπαράστασης, οπότε θα πρέπει ένα σύστημα ακουστικοποίησης μαθηματικών να μπορεί να αποδώσει και τις δύο. Η MathML προβλέπει: Δυναμικό και διαδραστικό περιεχόμενο Δημοσίευση τεχνικών πληροφοριών σε ηλεκτρονική μορφή Ανταλλαγή μαθηματικών δεδομένων μεταξύ εφαρμογών Ερμηνεία των μαθηματικών εκφράσεων σε μη-οπτικά μέσα Εργαλεία μετατροπής μεταξύ άλλων κωδικοποιήσεων των μαθηματικών όπως LaTeX/TeX Το μαθηματικό υλικό που έχει δημιουργηθεί με τη χρήση της MathML μπορεί να αποδοθεί με πολλούς τρόπους ανάλογα με τις ανάγκες του κάθε αναγνώστη. Συγκεκριμένα, μπορεί να εμφανιστεί στην οθόνη ενός υπολογιστή, να εκτυπωθεί, να μεγεθυνθεί, να εκφωνηθεί μέσω εφαρμογών που υποστηρίζουν συνθετική ομιλία ή να μετατραπεί σε γραφή braille. Αυτή η πολυτροπικότητα κάνει τη γλώσσα ιδανική επιλογή όταν θέλουμε να ακολουθήσουμε τις Αρχές της Καθολικής Σχεδίασης. 3. Εργαλείο ακουστικοποίησης μαθηματικών MathPlayer Η εφαρμογή MathPlayer είναι ένα plugin για τον Microsoft Internet Explorer 9, τον Acrobat Reader και τον ghplayer (DAISY 3 player), που υποστηρίζει τη MathML και την αποδοσή της όχι μόνο με οπτικό αλλά και ακουστικό τρόπο. Τα υποστηρικτικά χαρακτηριστικά της είναι τα εξής οχτώ: 11

Ομοιομορφία των μαθηματικών με το υπόλοιπο κείμενο ως προς το μέγεθος γραμματοσειράς, χρώμα και ύψος της γραμμής Μεγέθυνση εκφράσεων τη κάθε μια ξεχωριστά Ακουστική απόδοση των μαθηματικών εκφράσεων Ολοκλήρωση με αναγνώστες οθόνης και άλλες υποστηρικτικές τεχνολογίες Συγχρονισμένος τονισμός των εκφράσεων με ομιλία Υποστήριξη εκτύπωσης σε braille και DotsPlus braille Πλοήγηση μέσα στη μαθηματική έκφραση μέσω πληκτρολογίου Υποστήριξη αντιγραφής των αναπαριστώμενων εκφράσεων και εισαγωγή τους σε κειμενογράφους και άλλες μαθηματικές εφαρμογές 3.1 Υποστήριξη της Ελληνικής γλώσσας Η υποστήριξη των χαρακτηριστικών του MathPlayer στην Ελληνική γλώσσα σημαίνει μόνο τροποποίηση των κανόνων απόδοσης των μαθηματικών εκφράσεων στην Ελληνική, καθώς ο κώδικας Nemeth ήδη υποστηρίζεται από το MathPlayer και τα άλλα χαρακτηριστικά του είναι ανεξάρτητα από τη γλώσσα. Στην επόμενη ενότητα δίνουμε τη μεθοδολογία που ακολουθήθηκε για την υποστήριξη της Ελληνικής γλώσσας, ώστε να είναι διαθέσιμη σήμερα η ακουστική απόδοση MathML στα Ελληνικά. 4. Κανόνες ακουστικής απόδοσης μαθηματικών εκφράσεων στην Ελληνική γλώσσα 4.1 Αρχιτεκτονική ακουστικής απόδοσης του MathPlayer H μετατροπή του δέντρου MathML σε κείμενο εμπλουτισμένο με ακουστικά χαρακτηριστικά, προκειμένου να εκφωνηθεί από ένα σύστημα μετατροπής ΚσΟ: α) κανονικοποίηση, β) παραγωγή κειμένου προς εκφώνηση και γ) προσαρμογή στα συστήματα μετατροπής ΚσΟ. Ως παράδειγμα για την επίδειξη της λειτουργίας των βημάτων αυτών επιλέγεται η Μαθηματική έκφραση 4.1 σε MathML που δίνεται στον Πίνακα 4.1. n 1 x (4.1) Στόχος της κανονικοποίησης είναι η αντιστοίχιση πολλαπλών ισοδύναμων τρόπων κωδικοποίησης της έκφρασης MathML σε ένα μοναδικό δέντρο. Η κανονικοποίηση υλοποιήθηκε με ένα σύνολο κανόνων που δημιουργούν μια αναπτυσσόμενη κωδικοποίηση MathML, η οποία είναι ισοδύναμη με το αρχικό δέντρο, αλλά μπορεί να έχει διαφορετική δομή. Οι κανόνες ομιλίας μετατρέπουν το κανονικοποιημένο MathML δέντρο σε μια άλλη μορφή που αναπαριστά την συμβολοσειρά προς εκφώνηση. Η μορφή αυτή από δω και στο εξής θα αναφέρεται ως δέντρο ομιλίας. Οι κόμβοι στο δέντρο ομιλίας είναι κυρίως κόμβοι συμβολοσειρών και κόμβοι που απαρτίζουν τις εντολές ΚσΟ. Πίνακας 4.1 MathML έκφρασης 4.1 και έξοδος MathPlayer 12

MathML Αναπαράστασης <math> <mrow> <msup> <mi>x</mi> <mrow> <mi>n</mi> <mo>+</mo> <mn>1</mn> </mrow> </msup> </mrow> </math> Έξοδος MathPlayer <bookmark mark='4104'/> <bookmark mark='8195'/> <bookmark mark='12291'/> x εκθέτης <silence msec='80'/> <pitch middle='8'> <bookmark mark='20483'/> n <silence msec='60'/> <bookmark mark='24579'/> και <silence msec='60'/> <bookmark mark='28675'/> 1 </pitch> <silence msec='100'/> τέλος εκθέτη Στο στάδιο προσαρμογής, με βάση τις ρυθμίσεις του συστήματος μετατροπής ΚσΟ, το δέντρο ομιλίας περνάει μέσα από ένα σύνολο κανόνων και οι προηγούμενοι κόμβοι ομιλίας μετατρέπονται σε εξαρτώμενες συμβολοσειρές για το συγκεκριμένο σύστημα ΚσΟ. 4.2 Παραγωγή ομιλίας στην Ελληνική γλώσσα Για την υποστήριξη της Ελληνικής γλώσσας από το MathPlayer στην παρούσα εργασία υλοποιήθηκαν: i) μετάφραση των Unicode χαρακτήρων που συνταντώνται στη MathML, ii) μετάφραση των μονάδων μέτρησης και iii) προσαρμογή των κανόνων απόδοσης των μαθηματικών δομών. Οι κανόνες παραγωγής ομιλίας, ουσιαστικά, προσπαθούν να ταιριάξουν σε κάθε ετικέτα MathML το παραγόμενο κείμενο προς εκφώνηση προσδιορίζοντας και άλλα ακουστικά χαρακτηριστικά. Κάθε κανόνας αποτελείται από το αριστερό του μέρος, που είναι το πρότυπο προς ταίριασμα, και το δεξί μέρος που ελέγχει την παραγόμενη ομιλία. Από τα 2.800 σύμβολα Unicode στα οποία έχει αντιστοιχίσει λεκτική περιγραφή το MathPlayer, τα 200 περίπου αρκούν για την πλειοψηφία των χρηστών. Ένας κανόνες απόδοσης ονομασίας σε σύμβολο Unicode έχει π.χ. τη μορφή: char? (unicode == 0x2264) => string{text="μικρότερο από ή ίσον με";}; Στην Ελληνική έχουν μεταφραστεί σε αυτή στην έκδοση 3 του MathPlayer οι οχτώ ομάδες που ακολουθούν: U+0021 U+03F6: Μπλοκ συνήθη χρησιμοποιημένων χαρακτήρων (π.χ. τα Λατινικά γράμματα, τα Ελληνικά γράμματα και οι αριθμοί). U+2200 U+228B: Μπλοκ διαφόρων μαθηματικών τελεστών (π.χ. διαφορικό, άθροισμα, μείον, ανήκει στο, ανάδελτα). U+22A2 U+22A9: Μπλοκ λογικών σχέσεων (π.χ. κάθετο, αληθές). 13

U+22C0 U+22C3: Μπλοκ n αδικών τελεστών (π.χ. τομή, ένωση). U+22E0 U+22F1: Μπλοκ αποσιωπητικών και άλλων χαρακτήρων (π.χ. αποσιωπητικά κατά τον μαθηματικό άξονα, μεγαλύτερο από αλλά όχι ισοδύναμο με). U+2100 U+2149: Μπλοκ δίγραμμων χαρακτήρων, καλλιγραφικών γραμμάτων και των γραμμάτων των οποίων δίνεται ο σκελετός του σχήματός τους με έντονη γραφή γραμμάτων Fraktur. U+F000 U+F251: Μπλοκ παραλλαγών κάποιων Λατινικών χαρακτήρων. U+2190 U+2199 and U+21D0 U+21D5: Μπλοκ διάφορων τύπων βελών (π.χ. βέλος προς τα αριστερά, διπλό βέλος προς τα πάνω). Ως προς τις μονάδες μέτρησης μεταφράζονται αυτές για τις οποίες υπάρχει αντίστοιχη ονομασία στα Ελληνικά π.χ. ft ( πόδι ). Η ακουστική απόδοση των Μαθηματικών εκφράσεων θα πρέπει να περιλαμβάνει επαρκή πληροφορία για την δομή της έκφρασης προκειμένου να αποφευχθεί η σύγχυση στον ακροατή. Για το λόγο αυτό η κανονικοποιημένη MathML περιλαμβάνει 27 ετικέτες που αποδίδουν σημασιολογία. Αυτές ομαδοποιούνται σε κάποιους κανόνες οι οποίοι επίσης μεταφράστηκαν και διαμορφώθηκαν κατάλληλα ώστε να υποστηρίζουν την Ελληνική. Για παράδειγμα για το ημίτονο ο κανόνας έγινε: // sin -> ημίτονο mi?(count(this)==3&&$0.unicode=='s'&&$1.unicode=='i'&&$2.unicode=='n' ) => structure( bookmark{ data=compute_bookmark(match.dfs, "Word", 0); }, string{ text="ημίτονο"; } ); 5. Υλοποίηση και έλεγχος Η υλοποίηση για τα Ελληνικά έγινε στην πραγματικότητα και για τα τρία βήματα της αρχιτεκτονικής που περιγράφεται στην Ενότητα 4.1, χρησιμοποιώντας τη γλώσσα κανόνων της Design Science που ονομάζεται Sevilla. Η εν λόγω γλώσσα επιτρέπει το ταίριασμα μετά από έλεγχο συγκεκριμένης συνθήκης. Πέρα από τις συμβολοσειρές που θα εκφωνηθούν από το σύστημα ΚσΟ και τις παύσεις που εισάγονται, επιτρέπει την αλλαγή στην τόνο, στην ταχύτητα, στην ένταση και στη φωνή της παραγόμενης ομιλίας. Οι τιμές των προσωδιακών χαρακτηριστικών έχουν ρυθμιστεί στα Ελληνικά, ύστερα από έλεγχο που έγινε σε ενδεικτικά παραδείγματα για κάθε κανόνα με τη βοήθεια χρηστών με απώλεια όρασης. Οι εκφράσεις-παραδείγματα που χρησιμοποιήθηκαν είναι οι ίδιες που χρησιμοποίησαν τα προγενέστερα συστήματα [12-15]. Οι κανόνες είναι υλοποιημένοι σε τρία αρχεία UTF-8 (unicode.tdl, units.tdl και simple-speech.tdl) κάτω από τον φάκελο «el». Οι θεματικές περιοχές που καλύπτει η παρούσα εργασία περιλαμβάνουν: 1) αριθμητική, άλγεβρα, λογική και σχέσεις, 2) μαθηματικό λογισμό και διανυσματικό λογισμό, 3) θεωρία συνόλων, 4) ακολουθίες και σειρές, 5) στοιχειώδεις κλασσικές συναρτήσεις, 6) στατιστική και 7) γραμμική άλγεβρα. 14

6. Συμπεράσματα Στο πλαίσιο αυτής της εργασίας παρουσιάσαμε τα αποτελέσματα της σχεδίασης και υλοποίησης του συστήματος GR-MathPlayer. Συγκεκριμένα εξηγήσαμε πώς αναπτύχθηκαν και εξετάστηκαν οι Ελληνικοί κανόνες για την ακουστικοποίηση μαθηματικών εκφράσεων που έχουν κωδικοποιηθεί σε MathML μέσα από το λογισμικό MathPlayer. Χρησιμοποιώντας την MathML ως γλώσσα αναπαράστασης των μαθηματικών εκφράσεων και τον MathPlayer μαζί με τις ήδη ανεπτυγμένες τεχνολογίες ανάγνωσης οθόνης, μετατροπής ΚσΟ, προσβάσιμης αναπαράστασης πινάκων, εικόνων και σχημάτων και αναγνώρισης κειμένου και μαθηματικών, είναι πλέον δυνατή η μετατροπή οποιουδήποτε βιβλίου και άλλου εγγράφου σε προσβάσιμη μορφή για τα άτομα με απώλεια όρασης. Στα άμεσα μελλοντικά μας σχέδια περιλαμβάνεται η μετάφραση όλων των συμβόλων Unicode στα οποία έχει αντιστοιχίσει λεκτική περιγραφή το MathPlayer ή έστω η απλή μεταγραφή τους στα Ελληνικά (π.χ. Hertz -> Χερτζ) για αυτά τα οποία δεν υπάρχει Ελληνική λέξη, ώστε να διαβάζονται σωστά από συνθέτες ομιλίας που πιθανώς δεν υποστηρίζουν ταυτόχρονα δύο γλώσσες. 7. Αναφορές [1] Math Typesetting for the Internet. The Math Forum - http://mathforum.org/typesetting [2] TeX Users Group (TUG) Homepage - http://www.tug.org [3] MathML Mathematical Markup Language - http://www.w3.org/math [4] The MINSE Project - http://lfw.org/math/top.html [5] SVG - Scalar Vector Graphics - http://www.w3c.org/graphics/svg/ [6] The HyperLatex Package - http://www.cs.uu.nl/~otfried/hyperlatex [7] Latex2HTML Homepage - http://saftsack.fs.uni-bayreuth.de/~latex2ht/ [8] TeX4ht Homepage - http://www.cis.ohio-state.edu/~gurari/tex4ht/mn.html [9] WebEQ Homepage - http://www.dessi.com/en/products/webeq/default.html [10] TechExplorer - http://www-3.ibm.com/software/network/techexplorer [11] MathPlayer Homepage - http://www.dessi.com/en/products/mathplayer/ [12] T.V. Raman Audio Systems for Technical Reading. PhD thesis, Department of Computer Science Cornell University, NY, USA (1994) [13] R.D. Stevens Principles for the Design of Auditory Interfaces to Present Complex Information to Blind People, PhD thesis Department of Computer Science, The University of York, Heslington, York, UK (1996) [14] D. Fitzpatrick «Mathematics: How and What to Speak» in Proc. ICCHP 2006 (10th. International Conference on Computers Helping People with Special Needs), LNCS 4061 edited by K Miesenberger et al, Linz, Austria. Springer, pp 1199-1206 (2006) [15] D. Fitzpatrick, A. Karshmer «Multi-modal mathematics: Conveying math using synthetic speech and speech recognition» in Proc. ICCHP 2004 (9th. International Conference on Computers Helping People with Special Needs), LNCS 3118 edited by K Miesenberger et al. Berlin. Springer, pp 644-647 (2004) [16] P. Sandhu The MathML Handbook Charles River Media, Inc. (2002) 15