Συνομιλία Παραδείγματα Προσδοκίες των χρηστών Φωνητικές Διεπαφές Υπαγορεύσεις VUI Persona Η τεχνολογία της διεπαφής Η διαδικασία αναγνώρισης

Σχετικά έγγραφα
Συστήματα αναγνώρισης ομιλίας και χρήση τους. Αναστάσιος Φραντζής

How to register an account with the Hellenic Community of Sheffield.

Τεχνολογίες Φωνής στο Ηλεκτρονικό Εμπόριο και τις Υπηρεσίες Διαμεταγωγής. ΕΥΤΕΧΝΟΣ, Εθνικό Καποδιστριακό Πανεπιστήμιο Αθηνών

Αυτόνομοι Πράκτορες. ΝΑΟ Μουσικός

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26

ΔΗ Μ Ι Ο ΥΡ Γ Ι Α W I K I με τ η χρήση τ η ς υπ ηρεσίας h t t p : / id ot.com /

Πώς μπορεί κανείς να έχει έναν διερμηνέα κατά την επίσκεψή του στον Οικογενειακό του Γιατρό στο Ίσλινγκτον Getting an interpreter when you visit your

Εφαρμογές των Η/Υ στη διδασκαλία της ξένης γλώσσας. Γεώργιος Μικρός Πανεπιστήμιο Αθηνών

PortSip Softphone. Ελληνικά Ι English 1/20

EL Eνωμένη στην πολυμορφία EL A8-0188/290. Τροπολογία

ΠΡΟΣΑΡΜΟΓΕΑΣ ΙΑΣΥΝ ΕΣΗΣ για το ipod KS-PD100 Πριν χρησιμοποιήσετε αυτόν τον προσαρμογέα

X Series - Ψηφιακά Ακουστικά Προϊόντα

Οδηγίες Αγοράς Ηλεκτρονικού Βιβλίου Instructions for Buying an ebook

Δημιουργία Λογαριασμού Διαχείρισης Business Telephony Create a Management Account for Business Telephony

Εισαγωγή στις Αρχές της Επιστήμης των ΗΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΓΙΑ ΛΟΓΙΣΜΙΚΟ CISCO JABBER ΥΠΗΡΕΣΙΑ ΠΛΗΡΟΦΟΡΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΥΠΣ-ΕΔ/76

Η συσκευή υποστηρίζει την αποστολή/λήψη μηνυμάτων. Πιέστε το πλήκτρο μηνυμάτων για να γράψετε ένα νέο. Επιλέξτε Μενού Μήνυμα Γράψε Μήνυμα στην

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

Vodafone Business Connect

Special edition of the Technical Chamber of Greece on Video Conference Services on the Internet, 2000 IRIS PHONE

MULTICOM 112. Οδηγίες χρήσης

Αναπτυξιακά ορόσημα λόγου

Εγκατάσταση λογισμικού και αναβάθμιση συσκευής Device software installation and software upgrade

Section 1: Listening and responding. Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016

Πρώτη είσοδος στην θυρίδα φωνητικού ταχυδρομείου

GPS NAVIGATION SYSTEM QUICK START USER MANUAL

ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ CD-PLUS/4+N

ΗΧ-GD30. Οδηγίες χρήσης και προγραμματισμού. Συσκευή τηλεφωνητή μέσω GSM και PSTN. Εγκατάσταση

ΣΥΝΤΟΜΟΣ ΟΔΗΓΟΣ ΧΡΗΣΗΣ MSN MESSENGER. Αρχικά πάμε στο μενού Programs και κλικάρουμε την επιλογή CHAT

LESSON 28 (ΜΑΘΗΜΑ ΕΙΚΟΣΙ ΟΚΤΩ) REF : 201/033/28. 2 December 2014

Κεφάλαιο 3 Πολυπλεξία

Newborn Upfront Payment & Newborn Supplement

Ηχογράφηση στο Audacity

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

Οδηγίες Προγραμματισμού- Λειτουργίας για το Ολοκληρωμένο WiFi Σύστημα Συναγερμού YL- WΜ2FX

Οδηγός Βήμα-Βήμα για να εγκαταστήσετε τα Windows 7 στον Η/Υ σας

ΥΠΗΡΕΣΙΑ ΠΛΗΡΟΦΟΡΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΟΜΕΑΣ ΔΙΚΤΥΩΝ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ. Οδηγός ενεργοποίησης, χρήσης και διαμόρφωσης της υπηρεσίας φωνοκιβωτίου

Οδηγίες χρήσης για εφαρμογή WiFi ΑC

Συστήματα Πολυμέσων. Ανάπτυξη Πολυμεσικών Εφαρμογών Ι

Πρακτική Εφαρμογή του Προγράμματος Σπουδών Επιπέδου Α' στην Διδασκαλία της Ελληνικής Γλώσσας. Στέφανος Παπαζαχαρίας

Υπηρεσία τηλεφωνητή. Μεταφορά σε νέα πλατφόρμα. Μάιος 2017

7 Present PERFECT Simple. 8 Present PERFECT Continuous. 9 Past PERFECT Simple. 10 Past PERFECT Continuous. 11 Future PERFECT Simple

Οδηγίες χρήσης για εφαρμογή WiFi ΑC

Interfox.gr. Κωδικοποίηση Κάμερας

LESSON 14 (ΜΑΘΗΜΑ ΔΕΚΑΤΕΣΣΕΡΑ) REF : 202/057/34-ADV. 18 February 2014

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΠΑΝΕΠΙΣΤΗΜΙΟ AΙΓΑIΟΥ & ΑΕΙ ΠΕΙΡΑΙΑ Τ.Τ. Τμήματα Ναυτιλίας και Επιχειρηματικών Υπηρεσιών & Μηχ. Αυτοματισμού ΤΕ. Εισαγωγή στη Python

η φυση μας εχει δωσει δυο αυτια σχεδιασμενα να δουλευουν μαζι

ΕΠΛ 001: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Εισαγωγή Επαφών από την κάρτα SIM

Ανάλυση, Στατιστική Επεξεργασία και Παρουσίαση Δεδομένων με χρήση Ανοικτών Λογισμικών Δρ. Φίλιππος Σοφός

BECAUSE WE REALLY WANT TO KNOW WHAT YOU THINK ABOUT SCHOOL AND YOUR GARDEN. Fairly true If I decide to learn something hard, I can.

Η Εγκατάσταση της Μονάδας AVerMedia και του Δέκτη TV στο Windows Media Center

Οδηγός του έργου L-PACK

Ύψος Συχνότητα Ένταση Χροιά. Ο ήχος Ο ήχος είναι μια μορφή ενέργειας. Ιδιότητες του ήχου. Χαρακτηριστικά φωνής

Κοινωνική Αλληλεπίδραση

Επείγουσα Ανάγκη για βοήθεια Συχνές ερωτήσεις

RobotArmy Περίληψη έργου

Basic Missions

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α. Διαβάστε τις ειδήσεις και εν συνεχεία σημειώστε. Οπτική γωνία είδησης 1:.

ΗΧ-GD30+ Συσκευή τηλεφωνητή μέσω GSM και PSTN

A8-0188/298. Morten Løkkegaard Απαιτήσεις προσβασιμότητας για τα προϊόντα και τις υπηρεσίες COM(2015)0615 C8-0387/ /0278(COD)

Αλγόριθμος. Αλγόριθμο ονομάζουμε τη σαφή και ακριβή περιγραφή μιας σειράς ξεχωριστών οδηγιών βημάτων με σκοπό την επίλυση ενός προβλήματος.

Βοηθήματα για Άτομα με Κινητικά Προβλήματα

ΕΡΩΤΗΜΑΤΟΛΟΓΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΑΘΗΣΗΣ-ΔΙΔΑΣΚΑΛΙΑΣ

Περιεχόμενα. Χρήση του τηλεχειριστηρίου σας Beo4, 3. Τα πλήκτρα του Beo4 με λεπτομέρειες, 4 Καθημερινή και προηγμένη λειτουργία με τα πλήκτρα του Beo4

Χρήσιμες Ρυθμίσεις του Windows 7 στον Η/Υ σας

Ζωντανή τάξη μαθήματος

ΠΛΗΡΟΦΟΡΙΚΗ: ΥΠΟΛΟΓΙΣΤΕΣ & ΤΕΧΝΟΛΟΓΙΕΣ ΔΙΑΔΙΚΤΥΟΥ

Επικοινωνία Ανθρώπου Υπολογιστή. Α1. Εισαγωγή στην ΕΑΥ και γενικές πληροφορίες για το µάθηµα

«DIGITAL STORY TELLING» PROJECT

Εγχειρίδιο Χρήστη ECAS

Μέρος A - Πολυμέσα. 1 η Διδακτική Ενότητα. Εισαγωγή στα πολυμέσα Προβλεπόμενες διδακτικές ώρες: 2

SilverPlatter WebSPIRS 4.1.

Χρήση της αναπαραγωγής ipod

Ποια cookies χρησιμοποιούμε στον ιστότοπό μας;

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ

ΠΛΑΤΦΟΡΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΒΙΝΤΕΟΔΙΑΛΕΞΕΩΝ ΔΗΛΟΣ delos.uoa.gr. Εγχειρίδιο Χρήσης Μελών ΔΕΠ

ΕΕΓΔ Οδηγίες προς τους μαθητές για τη χρήση του λογισμικού εξέτασης (EL)

Συλλογιστική εξαγωγής συμπερασμάτων από συγκεκριμένες υποθέσεις δοθείσα μεθοδολογία διαδικασία της σκέψης, πρέπει να «συλλογιστεί» υπόθεση/παραγωγή

ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ USE INSTRUCTIONS

Ξεκινώντας NSZ-GS7. Network Media Player. Οι εικόνες επί της οθόνης, οι λειτουργίες και οι προδιαγραφές μπορεί να αλλάξουν χωρίς προειδοποίηση.

ΔΡΑΣΤΗΡΙΟΤΗΤΕΣ. Κωδικός Τίτλος Επίπεδο

Οδηγός Διαχείρισης Ευρυζωνικής Τηλεφωνίας μέσω της ιστοσελίδας My Cyta

Αφήγηση Μαρτυρία. Μουσική. Ενίσχυση μηνύματος Μουσική επένδυση Ηχητικά εφέ

Παραθέσεις Μελετητή Google

Οδηγίες Χρήσης Εφαρμογής

Κέντρο υποστήριξης HP. Εισαγωγή. Τι χρειάζεται να γνωρίζετε. Λήψη και εγκατάσταση της λύσης Vista στα Windows 8. 1 of 5 1/7/2014 2:09 μμ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Can I open a bank account online? Ερώτηση αν μπορείτε να ανοίξετε τραπεζικό λογαριασμό μέσω του ίντερνετ

Οδηγίες προγραμματισμού για τα μοντέλα τηλεφωνικών κέντρων: TC-104C TC-106C TC108C

Εδώ και πάνω από 30 χρόνια, το όνομα Audio Service αντιπροσωπεύει την εξατομίκευση και την υψηλή ποιότητα στα ενδοωτιαία ακουστικά βαρηκοΐας.

Ελληνική Έκδ ση. Εισαγωγή. Περιεχόμενα της συσκευασίας. Σημαντικό! WC030 Sweex Webcam 300K with Microphone USB

ΕΡΩΤΗΜΑΤΟΛΟΓΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΑΘΗΣΗΣ-ΔΙΔΑΣΚΑΛΙΑΣ

ΚΥΠΡΙΑΚΟΣ ΣΥΝΔΕΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY 21 ος ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Δεύτερος Γύρος - 30 Μαρτίου 2011

Επικοινωνία Ανθρώπου Υπολογιστή

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

Transcript:

Χαντζάρα Ελένη

Συνομιλία Παραδείγματα Προσδοκίες των χρηστών Φωνητικές Διεπαφές Υπαγορεύσεις VUI Persona Η τεχνολογία της διεπαφής Η διαδικασία αναγνώρισης Ιστορικές διακρίσεις User-Centered Design Εφαρμογές Γενικές σχεδιαστικές οδηγίες Μελλοντικά Σχέδια 2

3

Άνθρωπος Αυτόματα και ασυναίσθητα περιμένουν να ακούσουν λέξεις που ταιριάζουν στο γενικότερο πλαίσιο συζήτησης Το πλαίσιο συζήτησης περιλαμβάνει επιτρεπτούς συνδυασμούς φωνημάτων, κανόνες σχετικά με τη δομή μιας πρότασης οι οποίοι καθορίζουν το είδος της λέξης που ακολουθεί Οι τυχόν παρανοήσεις διορθώνονται γρήγορα 4

Μηχανή Συγκρίνει και ταιριάζει την είσοδο του χρήστη με αποθηκευμένα μοντέλα ήχων, ομιλίας, λέξεων και προφορών Δεν έχει επίγνωση του πραγματικού κόσμου και στηρίζει τη λειτουργία της αποκλειστικά στο ακουστικό σήμα και στα bits που χρησιμοποιούν για την υλοποίηση της διεπαφής οι σχεδιαστές της Οι τυχόν παρανοήσεις μεταφέρουν το διάλογο ένα βήμα πίσω 5

6

SYSTEM: Please select one of the following: account balances, transaction history, transfers... USER: Account balances. SYSTEM: I m sorry. I did not understand your response. Please choose one of the following: You can say: account balances, transaction history... Ο χρήστης δίνει τη κατάλληλη απάντηση με σαφήνεια αλλά το σύστημα δεν την αναγνωρίζει Όταν ένα σύστημα ομιλίας αποτυγχάνει να αναγνωρίσει μια καλά σχηματισμένη απάντηση οι χρήστες μπορεί να νιώσουν απογοητευμένοι Σε τέτοια πιθανά λάθη το σύστημα θα πρέπει να χρησιμοποιεί καινούργιες και γρήγορες διορθωτικές δηλώσεις και να μην επαναλαμβάνει την αρχική ερώτηση 7

SYSTEM: What else can I help you with? [pause] USER: I need to get the balance on another account. SYSTEM : I m sorry. Please choose one of the following... Το σύστημα σε μια ανοιχτή ερώτηση λαμβάνει μια απροσδόκητη απάντηση και ανακατευθύνεται σε λάθος ειδοποίηση Ο χρήστης αντί να περιμένει τη παύση ώστε να ακούσει τις επιλογές του μενού, χρησιμοποιεί περιγραφικό τρόπο για να πει τι θέλει, παρασυρόμενος από τη φιλική προτροπή της διεπαφής Διαβρώνει την εμπιστοσύνη του χρήστη που έχει δημιουργηθεί με το σύστημα Ο χρήστης που μέχρι τώρα είχε πιστεί για τη νοημοσύνη της διεπαφής νοιώθει ηλίθιος 8

Σύστημα Hello and thank you for calling Best Choice Satellite (branding sound), the best choice for all your satellite television needs You can also contact us via our website, w-w-w dot best choice dot com. Our website offers complete information about setting up satellite service at your home and offers valuable installation coupons worth over $40 Σκέψεις του χρήστη So far, so good This is really annoying! I just spent 10 minutes on the website without solving my problem --Με τη χρήση ενός branding ήχου ως χαιρετισμό ο χρήστης καταλαβαίνει ότι αλληλεπιδρά με ένα αυτοματοποιημένο σύστημα --Οι διαφημιστικές δηλώσεις σε αυτό το σημείο συνήθως αγνοούνται 9

Σύστημα I can help you with the following five options. You can interrupt me and speak your choice at any time. Please select one of the following: Sign up for new service, add features to my service, move my existing service, problems with my satellite service, or ask a billing question Σκέψεις του χρήστη I m glad the guy behind the counter at the local satellite TV office doesn t talk this much.... Oh wait, which one do I want? Χρήστης Service problem!! --Οι οδηγίες που παρουσιάζονται πριν από το κύριο μενού συνήθως αγνοούνται από το χρήστη 10

Σύστημα I m sorry. I did not understand your response. I can help you with the following five options. You can interrupt me and speak your choice at any time. Please select one of the following: Sign up for new service, add features to my service, move my existing service, problems with my satellite service, or ask a billing question. Σκέψεις του χρήστη Huh? Better listen again to figure out exactly what to say Χρήστης Problems with my satellite service --Η απάντηση του χρήστη Service problem δεν αναγνωρίζεται από το σύστημα καθώς δεν επέλεξε με ακρίβεια την κατάλληλη επιλογή --Η φράση Service problem δεν είναι καταχωρημένη στη γραμματική ως συνώνυμη της φράσης Problems with my satellite service 11

Σύστημα Please say or enter your account number Χρήστης (mutters) Just a second... Σύστημα I m sorry. The number you entered is not a valid account number. Please say or enter your account number. Σκέψεις του χρήστη I guess she heard me. But I don t know my account number! Where am I going to find it? Σκέψεις του χρήστη Why did she think that was an account number? Anyone can tell that Just a second is not an account number! Whatever, I ll just try again. --Ο χρήστης δεν είναι σίγουρος αν απάντησε σωστά στο προηγούμενο βήμα. Χρειάζεται η απλή προσθήκη μιας λέξης ή φράσης, όπως "Εντάξει", πριν ζητήσει τον αριθμό λογαριασμού --Ο χρήστης δεν είναι έτοιμος να δώσει τη πληροφορία που του έχει ζητηθεί. Πληροφορίες που θα πρέπει ο χρήστης να απομνημονεύσει δε θα πρέπει να ζητούνται. Όταν αυτές είναι απαραίτητες θα πρέπει να δίνονται οδηγίες στο χρήστη για το που να τις αναζητήσει 12

Χρήστης 0-0-0-0-dash-4-3-5-7-2-2-7-6 Σύστημα I m sorry. The number you entered is not a valid account number. Please say or enter your account number Χρήστης 0... 0... 0... 4... 3... 5... 7... 2... Σκέψεις του χρήστη He reads what he believes to be his account number from his printed billing statement Give me a break. I just told you the account number This machine is idiotic. I m going to go extra slow so she can t mess up again --Το σύστημα αποτυγχάνει να αναγνωρίσει την είσοδο του χρήστη καθώς αναγνωρίζονται μόνο οκταψήφιοι αριθμοί λογαριασμού και δεν περιλαμβάνουν μηδενικά μπροστά και την παύλα Video 13

14

Ο τόνος της υπαγόρευσης να είναι αληθινός και ειλικρινής Η ροή του διαλόγου και η ανταπόκριση του συστήματος να μην αποσπά τη προσοχή του χρήστη Δηλώσεις υψηλής ποιότητας Να προσφέρουν τη κατάλληλη ποιότητα πληροφοριών Να είναι σχετικές με τη συζήτηση Να είναι σαφείς και αδιαμφισβήτητες Τα συστήματα να είναι έξυπνα, φιλικά και ανθρώπινα Να καταλαβαίνουν και να ανταποκρίνονται με τέτοιο τρόπο που ένα άτομο θα ανταποκρινόταν Να νομίζουν ότι συνομιλούν με ένα άλλο άτομο το οποίο διαθέτει νοημοσύνη και ευαισθησία, π.χ. όταν ένα τέτοιο σύστημα λέει παρακαλώ και ευχαριστώ να νομίζουν ότι το σύστημα είναι ευγενικό και φιλικό Η προσωπικότητα και η χρηστικότητα μιας φωνητικής διεπαφής είναι στενά συνδεδεμένες Video 15

Οι ηχογραφημένες δηλώσεις γίνονται από ηθοποιούς Η προηγούμενη εμπειρία τους στη χρήση της γλώσσας με άλλους ανθρώπους Τα συστήματα ομιλίας φαίνονται έξυπνα, φιλικά και αρκετά ανθρώπινα Καταλαβαίνουν αυτό που τους λένε και αντιδρούν με τρόπους που θα αντιδρούσε ένα άτομο Όταν ένας χρήστης αναφέρεται σε ένα τέτοιο σύστημα χρησιμοποιεί τη λέξη αυτός/αυτή παρά τη λέξη αυτό Οι άνθρωποι έχουνε τη τάση να αποδίδουνε προσωπικότητες σε αντικείμενα με τα οποία αλληλεπιδρούν (Η/Υ, VUIs) - Attribution theory 16

17

Είναι ένα σενάριο για τη διεξαγωγή μιας συζήτησης ανάμεσα σε ένα αυτοματοποιημένο σύστημα και ένα χρήστη Περιέχει όλες τις δηλώσεις, τις οποίες το αυτοματοποιημένο σύστημα θα χρησιμοποιήσει για το διάλογό του με το χρήστη καθώς και τη λογική για το ποιες δηλώσεις θα χρησιμοποιήσει για να απαντήσει σε κάποια είσοδο του χρήστη Βασίζεται στη τεχνολογία αναγνώρισης ομιλίας (ASR: Automatic Speech Recognition) 18

Προστίθενται στις συσκευές χειρός και τηλεφωνίας, σε συστήματα πλοήγησης στα οχήματα καθώς και σε εφαρμογές υπολογιστών 19

Τυχόν αποτυχίες στην αναγνώριση ομιλίας καθώς και απροσδόκητες απαντήσεις μπορεί να διαβρώσουν την εμπιστοσύνη προς το σύστημα Με τις υπαγορεύσεις λέει το σύστημα αυτό που θέλει στους χρήστες Αποτελούν το σύνολο των γλωσσικών χαρακτηριστικών που συμβάλουν στη προσωπικότητα της φωνητικής διεπαφής την οποία αντιλαμβάνονται οι χρήστες (persona) 20

Αναφέρεται στη προσωπικότητα της φωνητικής διεπαφής την οποία αντιλαμβάνονται οι χρήστες από τη συμπεριφορά της διεπαφής Οι παράγοντες που συμβάλλουν στην αντίληψη της προσωπικότητας αυτής είναι: το ύφος και ο τόνος της υπαγόρευσης η ροή του διαλόγου η ανταπόκριση του συστήματος. 21

Η έννοια του όρου persona είναι πηγή συνεχούς αντιπαράθεσης στη κοινότητα των φωνητικών διεπαφών πολλοί σχεδιαστές υποστηρίζουν ότι δεν υφίσταται άλλοι πιστεύουν ότι αποτελεί το πιο σημαντικό χαρακτηριστικό μιας εφαρμογής Για ένα χρήστη είναι αδύνατο να μην αναφέρεται σε ένα persona από τη στιγμή που συνδιαλέγεται μαζί του (Attribution theory) Υπάρχουν αποδείξεις ότι η προσωπικότητα και η χρηστικότητα μιας φωνητικής διεπαφής είναι στενά συνδεδεμένες 22

Η τεχνολογία που υποστηρίζει την φωνητική διεπαφή χρήστη είναι η αυτόματη αναγνώριση ομιλίας (ASR: Automatic Speech Recognition) Έχει συνήθως δυνατότητα ομιλίας IVR (Interactive voice response) Μπορεί να είναι ένας προσωπικός υπολογιστής, ένα σύστημα πλοήγησης αυτοκινήτου ή οποιαδήποτε άλλη φορητή συσκευή με δυνατότητα ομιλίας Αυτά τα συστήματα εξαρτώνται από την ίδια βασική τεχνολογία αναγνώρισης φωνητικής εισόδου 23

Το φωνητικό σήμα εισόδου: 1. συλλαμβάνεται 2. ψηφιοποιείται 3. κατακερματίζεται 4. συγκρίνεται με ένα σύνολο αποθηκευμένων ηχητικών μοντέλων από ήχους ομιλίας 5. οι ήχοι τότε δημιουργούν πιθανές λέξεις οι οποίες συγκρίνονται με τη γραμματική των λέξεων που θα πρέπει να έχουν αναγνωριστεί μέχρι εκείνο το σημείο του διαλόγου 24

Στη δεκαετία του 1980 και του 1990, μεγάλη έρευνα επικεντρώθηκε στη δημιουργία συστημάτων με πιο ανθρώπινο τρόπο αναγνώρισης ομιλίας Τέτοια συστήματα περιέχουν τεράστια ποσότητα γλωσσικών πληροφοριών σχετικά με τη δομή των λέξεων και των προτάσεων, καθώς και σημασιολογική πληροφορία Ακόμα και αυτά ήταν όμως ανεπαρκή για να μοντελοποιήσουν την ανθρώπινη συμπεριφορά για την αναγνώριση ομιλίας, έτσι ενσωματώθηκαν μοντέλα της δομής του διαλόγου και αντίληψης του κόσμου Η πολυπλοκότητα και υπολογιστικές απαιτήσεις των εν λόγω συστημάτων περιορίζουν τη χρήση τους στα εργαστήρια 25

Η είσοδος του χρήστη μέσω μικροφώνου πρέπει να αποφασιστεί το τι θα θεωρηθεί ως είσοδος καθώς το μικρόφωνο θα ηχογραφήσει εκτός από τις δηλώσεις του χρήστη, ήχους του περιβάλλοντος και θόρυβο (end pointing) μια λύση ώστε να βελτιωθεί αυτό το ζήτημα είναι να θέσουμε το όριο για την αναγνώριση του κάθε ήχου υψηλότερα, έτσι ώστε οι χαμηλού επιπέδου ήχοι όπως ο θόρυβος να μην εντοπίζονται Αυτή η λύση περιέχει μια συμβιβαστική μέθοδο καθώς οι χρήστες που μιλούν σιγά δεν θα ακούγονται από το σύστημα λόγω του υψηλού ορίου που έχει τεθεί 26

27

Το σήμα ψηφιοποιείται και διαιρείται σε ένα σύνολο από μικρά τμήματα για ανάλυση (κατακερματισμός) Κάθε τμήμα μετατρέπεται σε ένα χαρακτηριστικό διάνυσμα μια αριθμητική αναπαράσταση του σήματος ομιλίας που περιέχει πληροφορίες σχετικές με την αναγνώριση Η αλληλουχία των διανυσμάτων αποτελεί τη βάση για την αναγνώριση σε επίπεδο λέξεων 28

Τα στοιχεία που συμβάλουν στην αναγνώριση του μοντέλου είναι: Ακουστικά μοντέλα: προσδιορίζουν τη προφορά των φωνημάτων με μια απεικόνιση ακολουθιακών διανυσμάτων) Λεξικά: ένα σύνολο λέξεων και συναφών προφορών, των οποίων η αναπαράσταση γίνεται με τη χρήση του φωνητικού αλφάβητου. Για μια λέξη είναι πιθανό να υπάρχουν πολλαπλές προφορές οι οποίες εξαρτώνται από παράγοντες όπως η διάλεκτος ο ρυθμός του λόγου και το στυλ ομιλίας. Για να αναγνωριστεί μια προφορά θα πρέπει να έχει προστεθεί πρώτα στο λεξικό 29

Γραμματικές: μια λίστα με δηλώσεις τις οποίες το σύστημα αναμένεται να λάβει ως είσοδο σε κάθε κατάσταση αναγνώρισης. Όσο περισσότερες είναι οι λέξεις που υπάρχουν στη γραμματική και όσο περισσότερο όμοιες είναι ακουστικά, τόσο πιο δύσκολη γίνεται η αναγνώριση Ένα είδος γραμματικής ονομάζεται SLMs (Statistical Language Models). Επιτρέπουν στους χρήστες να δίνουν πιο ελεύθερη μορφή απάντησης στις ερωτήσεις αντί να επαναλαμβάνουν απλώς τις επιλογές των μενού που προσφέρονται από το σύστημα. Απαιτούν μεγάλες ποσότητες δεδομένων κάτι το οποίο τα καθιστά δαπανηρά και χρονοβόρα Video 30

Ένα άλλο είδος γραμματικής ονομάζεται slotted grammars στα οποία ο χρήστης μπορεί να δίνει ξεχωριστά κομμάτια πληροφορίας σε μια ενιαία έκφραση. Μοιάζει αρκετά με τη γραμματική των SLM αλλά έχει πολύ περιορισμένο φάσμα ευελιξίας της πληροφορίας εισόδου. Ο περιορισμός αυτός τη καθιστά κατάλληλη για εργασίες όπου οι απαντήσεις του χρήστη είναι στερεότυπες ή ακολουθούν κάποιο πρότυπο, όπως στη μεταφορά χρηματικών ποσών μεταξύ λογαριασμών ή για τη κράτηση εισιτηρίου. Video 31

Ένας αλγόριθμος αναζήτησης: προσπαθεί να αντιστοιχίσει τις ακολουθίες των διανυσμάτων οι οποίες αναπαριστούν την ομιλία του χρήστη με πιθανές λέξεις και προφορές στη γραμματική. 32

Τα συστήματα αναγνώρισης ομιλίας περιορίζονταν από την έλλειψη επεξεργασίας, ταχύτητας και χωρητικότητας Τη δεκαετία του 1990, τα συστήματα ομιλίας που λειτούργησαν περιορίζονταν από την έλλειψη επεξεργαστικής ισχύς. Διακρίνονται 2 κατηγορίες Speaker-dependent systems. Αναγνώριζαν ένα μόνο χρήστη. Επιπλέον απαιτούσαν εκπαίδευση ώστε να μπορούν να λειτουργήσουν σωστά. Το πλεονέκτημά τους ήταν ότι μπορούσαν να υποστηρίξουν μεγαλύτερα λεξιλόγια. Χρησιμοποιήθηκαν και ως συστήματα πιστοποίησης της ταυτότητας ενός χρήστη. Speaker-independent systems. Συστήματα που μπορούσαν να αναγνωρίσουν πολλαπλούς χρήστες. Όταν η υπολογιστική ισχύ ήταν περιορισμένη υπήρχε ένας συμβιβασμός ανάμεσα στο εύρος του λεξιλογίου και στο πλήθος των φωνών που μπορούσαν να αναγνωριστούν Σήμερα, η διάκριση αυτή έχει σχεδόν εξαφανιστεί 33

Μια δεύτερη διάκριση ήταν τα συστήματα που αναγνώριζαν απομονωμένες λέξεις και αυτά που αναγνώριζαν τη συνεχή ομιλία Τα συστήματα που αναγνώριζαν τη συνεχή ομιλία δεν χαρακτηρίζονταν από μεγάλη ακρίβεια καθώς έπρεπε να εντοπίσουν τα όρια της κάθε λέξης Η πλειονότητα των συστημάτων αναγνώρισης ομιλίας σήμερα εξακολουθούν να βασίζονται στην αναγνώριση απομονωμένων λέξεων (Αν και τα συστήματα μπορούν να αναγνωρίσουν τώρα πια φράσεις, όχι μόνο λέξεις) 34

Ο σχεδιασμός user centered τεχνολογιών αναγνώρισης φωνής είναι παρόμοιος αλλά δε ταυτίζεται με τις καθιερωμένες τεχνικές (UCD) Η διαδικασία είναι η εξής: Συλλογή πληροφοριών από τους χρήστες και τις επιχειρήσεις Σχεδιασμός ενός πρώτου Interface Δοκιμή με πραγματικούς χρήστες Τροποποίηση του σχεδιασμού Υπάρχουν διάφορες ανατροπές σε κάθε στάδιο 35

Κατά τη διάρκεια συλλογής των απαιτήσεων οι σχεδιαστές αντλούν πληροφορίες σχετικά με το κανάλι της φωνής Δεδομένου ότι οι περισσότερες τεχνολογίες ομιλίας αναπτύχθηκαν στα τηλεφωνικά κέντρα, οι εργαζόμενοι σε αυτά μπορούν να δώσουν πολύτιμες πληροφορίες σχετικά με τη κατάσταση του χρήστη, της ορολογίας που χρησιμοποιεί όταν πραγματοποιεί κάποια κλήση Ένα άλλο σημείο που χρίζει προσοχής είναι ποιο σύστημα αναγνώρισης ομιλίας θα χρησιμοποιηθεί 36

Όταν χρησιμοποιείται η φωνή, η είσοδος του χρήστη μπορεί να παρερμηνευθεί σε μεγάλο ποσοστό των περιπτώσεων Οι περισσότεροι αλγόριθμοι αναγνώρισης φωνής θεωρητικά διαθέτουν κοντά στο 100 τοις εκατό ως προς την ακρίβεια αναγνώρισης Στην πράξη τα ποσοστά σφάλματος κυμαίνονται από 10 έως 20 τοις εκατό και άνω 37

Διαφορετικές διάλεκτοι Προφορές Ο θόρυβος στο υπόβαθρο αποτελούν προκλήσεις για την αποτελεσματική αναγνώριση φωνής 38

39

Εμπορικά Προγράμματα Τηλεφωνία Συστήματα Φωνητικού Ταχυδρομείου (Voicemail) Στο αυτοκίνητο Στα μαχητικά αεροσκάφη Στις προσομοιώσεις Στους προσωπικούς υπολογιστές Αυτοματισμοί Σπιτιού (Home Automation) Σε ανθρώπους με αναπηρίες 40

Τα περισσότερα λογισμικά αναγνώρισης φωνής είναι εκπαιδευμένα να αναγνωρίζουν έναν συγκεκριμένο ομιλητή Είσοδος: Audio stream Έξοδος: Text Video 41

Είσοδος: Text Έξοδος: Audio stream 42

Acapela Java Speech API Λογογράφος κ.α. Υπάρχει πολύς δρόμος ακόμα. 43

Dragon Naturally Speaking Professional Είναι εξαιρετικά ακριβές Οι νέες τεχνολογίες BestMatchTM ΙΙΙ και BestMatch Plus, βελτίωσαν την ακρίβεια στην αναγνώριση Διαθέτει ένα λεξιλόγιο συνολικά 250.000 όρων Αναλύει έγγραφα αμέσως για να εντοπίσει και να προσθέσει νέες λέξεις, εξειδικευμένους όρους, αρκτικόλεξα, και κύρια ονόματα Μπορεί κανείς να προσθέσει νέους όρους και να δημιουργήσει νέα λεξιλόγια για διαφορετικές θεματικές ενότητες μέχρι και 160.000 λέξεις επιπλέον (π.χ. Dragon Naturally Speaking Medical) Video 44

Η τεχνολογία αναγνώρισης φωνής διαδέχτηκε τα συστήματα touch-tone IVR (Interactive Voice Response) Διευκόλυνε εργασίες και αλληλεπιδράσεις στις οποίες τα μάτια και τα χέρια είναι απασχολημένα Video 45

Επέτρεψε λειτουργίες που είναι δύσκολες με τη χρήση συστημάτων touch tone: εισαγωγή συμβολοσειρών που περιέχουν γράμματα και ψηφία επιλογή από μακροσκελείς λίστες επιλογών μεταφορά ποσών μεταξύ τραπεζικών λογαριασμών ταξιδιωτικές κρατήσεις 46

Είναι η πιο κοινή εφαρμογή IVR (Interactive Voice Response) Χρησιμοποιούνται για την αποθήκευση φωνητικών μηνυμάτων στις ηλεκτρονικές θυρίδες των χρηστών Λήψη των μηνυμάτων του προσωπικού μας τηλεφωνητή σε mp3 ή text μορφή σε κάποιο λογαριασμό ηλεκτρονικού ταχυδρομείου ή στο κινητό μας. Video 47

Δίνουν τη δυνατότητα στον οδηγό: κάνει κλήση σε επαφές που περιέχονται στο κινητό του τηλέφωνο να πάρει πληροφορίες για τη κίνηση και τον καιρό επιλέξει μουσικά κομμάτια με κριτήριο τον καλλιτέχνη ή το είδος μουσικής να μετατρέψει τα γραπτά μηνύματα που λαμβάνει στο κινητό κατά την ώρα της οδήγησης σε ακουστικό κείμενο ώστε να μην απασχολεί τα χέρια του 48

Οι φωνητικές διεπαφές συναντώνται και σε άλλες εφαρμογές οι οποίες επιτρέπουν τον οδηγό να ελέγξει μέσω φωνητικών εντολών το σύστημα πλοήγησης το ηχοσύστημα τον κλιματισμό Video 49

Σε αυτά τα προγράμματα αναγνώρισης φωνής έχουν λειτουργήσει με επιτυχία οι εξής λειτουργίες: Καθορισμός ραδιοσυχνοτήτων Χειρισμός του αυτόματου πιλότου Καθορισμό συντεταγμένων Καθορισμός παραμέτρων απελευθέρωσης οπλισμού Για τη επιτυχία των προγραμμάτων αυτών σημαντικό ρόλο έπαιξε η επιτυχημένη χρήση του περιορισμένου λεξιλογίου 50

Το πρόγραμμα φωνητικής αναγνώρισης των ΗΠΑ Advanced Fighter Technology Integration (AFTI)/F- 16 aircraft (F-16 VISTA) Το πρόγραμμα φωνητικής αναγνώρισης για τα γαλλικά αεροσκάφη Mirage Video 51

Στην εκπαίδευση ελεγκτών εναέριας κυκλοφορίας γίνεται προσομοίωση του διαλόγου μεταξύ των ελεγκτών και των πιλότων ελαττώνοντας έτσι το προσωπικό που απαιτείται για την εκπαίδευση Ο διάλογος αυτός είναι σε μεγάλο βαθμό δομημένος κάτι το οποίο ενισχύει την επιτυχία των συστημάτων αναγνώρισης φωνής Video 52

Nintendo Wii Project Natal Αναγνώριση ύφους τρόπου χρώματος χροιάς φωνής Video 53

Είναι διαθέσιμα εδώ και δεκαετίες Έχουν αναπτυχθεί έτσι ώστε δέχονται την είσοδο σε μια ελεύθερη μορφή από ένα χρήστη και όχι από μια προκαθορισμένη γραμματική λέξεων από οποιονδήποτε χρήστη Γι αυτό το λόγο τα προγράμματα αυτά θα πρέπει να εκπαιδεύονται στη φωνή του χρήστη Πρέπει να υπάρχει αρχικά μια επένδυση χρόνου ώστε το πρόγραμμα να μπορέσει να λειτουργήσει σωστά Χρονοβόρα και ακριβά 54

Έλεγχος του υπολογιστή / αλληλεπίδραση με το λειτουργικό σύστημα Υπαγόρευση κειμένου / επεξεργασία κειμένου Δημιουργία προφίλ φωνής Video 55

Τηλεχειριστήριο (Voice Remote Control) του οποίου οι εντολές ενεργοποιούνται από απόσταση. Οι χρήστες δίνουν φωνητικές εντολές για να ενεργοποιήσουν και να απενεργοποιήσουν οικιακές συσκευές, όπως τηλεόραση, κλιματιστικά, DVD, και στερεοφωνικά Video 56

Χωρίς τηλεκοντρόλ I sometimes talk to my fridge... Video 57

Βόις 58

Τα προγράμματα αναγνώρισης φωνής είναι ιδιαίτερα χρήσιμα για τους ανθρώπους που έχουν δυσκολία στο να χρησιμοποιήσουν τα χέρια τους ή που πάσχουν από κάποιο τραυματισμό ο οποίος εμποδίζει τη χρήση συμβατικών συσκευών εισόδου όπως το ποντίκι, το πληκτρολόγιο και το τηλεχειριστήριο. Video 59

Η αναγνώριση ομιλίας χρησιμοποιείται επίσης στη τηλεφωνία για κωφά άτομα με τη χρήση υπότιτλων στο τηλέφωνο. Nokia 9210i 60

61

Για τη διεξαγωγή ενεργειών οι οποίες δε γίνονται διαφορετικά π.χ. πληκτρολόγηση ονομάτων με τη χρήση του αριθμητικού πληκτρολογίου του τηλεφώνου Για δραστηριότητες όπου τα μάτια και τα χέρια είναι απασχολημένα Για χρήστες οι οποίοι έχουν περιορισμένη ικανότητα να χρησιμοποιήσουν τα χέρια τους Όταν ο χρόνος αναμονής για μια συνομιλία πρόσωπο με πρόσωπο είναι απαγορευτικός 62

Όταν οι χρήστες ανησυχούν για τη προστασία της ιδιωτικής τους ζωής και δεν είναι πρόθυμοι να δώσουν ορισμένες πληροφορίες δυνατά (π.χ. κωδικούς πρόσβασης, αριθμούς κοινωνικής ασφάλισης, αριθμούς λογαριασμών, ιατρικά δεδομένα και άλλες οικονομικές πληροφορίες) θα πρέπει να προσφέρουμε στους χρήστες μια εναλλακτική μέθοδο για την εισαγωγή τέτοιων πληροφοριών 63

Δε πρέπει να ανησυχούμε τόσο για τον αριθμό των επιλογών σε ένα μενού Η πρώτη σκέψη για ένα εύχρηστο μενού μιας φωνητικής διεπαφής είναι να μην επιβαρύνει τη βραχυπρόθεσμη μνήμη του χρήστη με πολλές ακουστικές πληροφορίες. Ο κανόνας 7 συν πλην 2 δεν φαίνεται να ισχύει στα μενού των φωνητικών διεπαφών (Hura, 2007b). Η χρήση ενός τέτοιου μενού δεν είναι έργο ανάκλησης της μνήμης αλλά μια διαδικασία επιλογής. Ο χρήστης δε χρειάζεται να απομνημονεύσει το μενού που ακούει, αλλά να το αξιολογήσει και να συγκρατήσει τις πιθανές επιλογές του. 64

Θα πρέπει να παρουσιάζουμε τις επιλογές του μενού της διεπαφής με τρόπο κατανοητό και εύκολο Οι επιλογές ενός μενού θα πρέπει να είναι περιγραφικές και διακριτές Τα περιγραφικά μενού παρέχουν στους χρήστες την αίσθηση Ξέρω τι είναι αυτό.., έτσι ώστε να αξιολογήσουν καλύτερα τις επιλογές τους χωρίς να επιβαρύνουν τη μνήμη τους Άλλοι παράγοντες που επηρεάζουν την ακουστική βραχυπρόθεσμη μνήμη είναι το μήκος λέξης, η συχνότητα και οικειότητα 65

Η persona δε θα πρέπει να εμποδίζει την αποτελεσματικότητα της διεπαφής Πάντα οι χρήστες θα αποδίδουν ένα persona σε μια φωνητική διεπαφή. Ορισμένοι σχεδιαστές υποστηρίζουν ότι οι διεπαφές θα πρέπει να λένε ότι ακριβώς και ένας άνθρωπος. Αυτός ο κανόνας δεν πρέπει να ακολουθείται πιστά καθώς οι χρήστες δε θα πρέπει να υπερεκτιμήσουν τις ικανότητες του συστήματος παρασυρόμενοι από τις προτροπές του. 66

Σωστή αντιμετώπιση των σφαλμάτων Τα σφάλματα που συμβαίνουν στη λειτουργία της διεπαφής θα πρέπει να αντιμετωπίζονται ανάλογα με τη φύση τους Για χρήστες που ξέρουν τι θέλουν θα πρέπει να τους δίνεται η δυνατότητα να το επαναλάβουν Σε χρήστες που δεν ήταν σε θέση να δώσουν μια καλή απάντηση να τους δίνονται επιπλέον πληροφορίες Να υπάρχουν ορόσημα Μια από τις δυσκολίες που αντιμετωπίζουν οι χρήστες σε μια φωνητική διεπαφή είναι να μείνουν προσανατολισμένοι Οι υποδείξεις θα πρέπει να αναγνωρίζουν τις επιλογές του χρήστη και να ενισχύουν την αίσθηση του τόπου. ΣΥΣΤΗΜΑ: Μπορείτε να πείτε: υπόλοιπο λογαριασμού, μεταφορά, κατάθεση ΧΡΗΣΤΗ: Μεταφορά. ΣΥΣΤΗΜΑ: Μεταφορά. Μπορείτε να πείτε:.. 67

Να χρησιμοποιούνται συμβουλές και υπενθυμίσεις Η παροχή οδηγιών προς τους χρήστες θα πρέπει να γίνονται σε μικρά κομμάτια και σε σημεία όπου είναι πιθανό να χρειαστεί. Είναι προτιμότερο ένα παράδειγμα από μια μακροσκελή επεξήγηση Έκδοση 1: Παρακαλώ εισάγετε την ημερομηνία γέννησής σας ως ένα οκταψήφιο αριθμό, με δύο ψηφία για την ημέρα που ακολουθείται από δύο ψηφία για το μήνα και τέσσερα ψηφία για το έτος. Έκδοση 2: Παρακαλώ εισάγετε την ημερομηνία γέννησής σας ως οκταψήφιο αριθμό. Έτσι, για τις 14 Μαρτίου1986, θα είναι 14031986. 68

Χρήση λέξεων για τη σύνδεση των δηλώσεων μέσα σε ένα διάλογο SYSTEM: Main menu. You can say: balances, transfers, transaction history, or loans. USER: Balances. SYSTEM: All right, balances. To get you that information, we need to get you logged in. First, please enter your account number. USER: 123 45 678. SYSTEM: Next, enter your password. USER: 54321. SYSTEM: Thanks. The balance on account 123-45-678 as of May 23, 2007 is.. Να επιτρέπεται η διόρθωση σφαλμάτων κατά το διάλογο SYSTEM: To confirm, you re looking for flights from Los Angeles to Boston on May 23rd. USER: No, to Austin. 69

Να γίνεται χρήση ορολογίας που είναι οικεία στους χρήστες Αποτελεί βασική κατευθυντήρια γραμμή για οποιοδήποτε αυτοματοποιημένο σύστημα Εάν οι χρήστες δεν καταλαβαίνουμε έναν όρο θα σπαταλήσουν το χρόνο τους για να ακούσουν ολόκληρη τη λίστα των επιλογών πάλι Ο χρήστης να έχει την επιλογή να απευθυνθεί σε ένα πραγματικό πράκτορα όταν διαπιστώνεται ότι αντιμετωπίζει πρόβλημα Όταν αποτύχει ο αυτοματοποιημένος διάλογος ο χρήστης αναζητά αμέσως ένα πραγματικό πρόσωπο Η προώθηση αυτή θα πρέπει να γίνεται τη σωστή στιγμή ώστε ο χρήστης να μην είναι εκνευρισμένος και απογοητευμένος όταν θα μιλήσει με τον αληθινό αντιπρόσωπο Βίντεο 70

71

Το ΜΙΤ της Βοστόνης αναπτύσσει ένα λογισμικό το οποίο θα ενσωματωθεί σε ένα smart phone και θα μετατρέπει τα ηχητικά κύματα σε δόνηση που θα γίνεται αισθητή από τον κωφό και φυσικά κάθε μία θα διαφοροποιείται ώστε να γίνεται διακριτή η λέξη, η έννοια. 72

Το YouTube Ανακοίνωσε ότι τα εκατομμύρια βίντεο που φιλοξενεί, θα αποκτήσουν αυτόματους υπότιτλους, κάτι που θα τα καταστήσει πιο προσβάσιμα σε κωφούς και άτομα με προβλήματα ακοής Η πρωτοβουλία της βασίζεται στις τελευταίες εξελίξεις στην τεχνολογία αναγνώρισης φωνής Αποτελεί του μεγαλύτερο online πείραμα του είδους του στον κόσμο. 73

Αναζήτηση πληροφοριών στο διαδίκτυο με χρήση φωνητικών εντολών 1-800-GOOG-411, Google Video 74