1 n-gram n-gram n-gram [11], [15] n-best [16] n-gram. n-gram. 1,a) Graham Neubig 1,b) Sakriani Sakti 1,c) 1,d) 1,e)



Σχετικά έγγραφα
(Statistical Machine Translation: SMT[1]) [2]

(Statistical Machine Translation: SMT [1])

[15], [16], [17] [6] [2] [5] Jiang [6] 2.1 [6], [10] Score(x, y) y ( 1) ( 1 ) b e ( 1 ) b e. O(n 2 ) Jiang [6] (word lattice reranking)

1530 ( ) 2014,54(12),, E (, 1, X ) [4],,, α, T α, β,, T β, c, P(T β 1 T α,α, β,c) 1 1,,X X F, X E F X E X F X F E X E 1 [1-2] , 2 : X X 1 X 2 ;

(String-to-Tree ) KJ [11] best 1-best 2. SMT 2. [9] Brockett [2] Mizumoto [10] Brockett [2] [10] [15] ê = argmax e P(e f ) = argmax e M m=1 λ

Buried Markov Model Pairwise

,.,,., [1], [3], [4], [5] [6]. [2]. ,,, Tree-to-String. 1,f) input 1 (Python) : if x % 5 == 0: output 2 (Comment): # y x 5

An Analysis of Problems in Grammatical Error Correction of ESL Writings Using a Large Learner Corpus of English

1,a) 1,b) 2 3 Sakriani Sakti 1 Graham Neubig 1 1. A Study on HMM-Based Speech Synthesis Using Rich Context Models

EM Baum-Welch. Step by Step the Baum-Welch Algorithm and its Application 2. HMM Baum-Welch. Baum-Welch. Baum-Welch Baum-Welch.

Stabilization of stock price prediction by cross entropy optimization

Applying Markov Decision Processes to Role-playing Game

SocialDict. A reading support tool with prediction capability and its extension to readability measurement

Automatic extraction of bibliography with machine learning

Twitter 6. DEIM Forum 2014 A Twitter,,, Wikipedia, Explicit Semantic Analysis,

{takasu, Conditional Random Field

CSJ. Speaker clustering based on non-negative matrix factorization using i-vector-based speaker similarity

An Automatic Modulation Classifier using a Frequency Discriminator for Intelligent Software Defined Radio

ΚΑΤΑΣΚΕΥΑΣΤΙΚΟΣ ΤΟΜΕΑΣ

MIDI [8] MIDI. [9] Hsu [1], [2] [10] Salamon [11] [5] Song [6] Sony, Minato, Tokyo , Japan a) b)

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΛΕΩΝΙΔΑΣ Α. ΣΠΥΡΟΥ Διδακτορικό σε Υπολογιστική Εμβιομηχανική, Τμήμα Μηχανολόγων Μηχανικών, Πανεπιστήμιο Θεσσαλίας.

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o

Discriminative Language Modeling Based on Risk Minimization Training

Faruqui [7] WordNet [15] FrameNet [2] PPDB [8]

Re-Pair n. Re-Pair. Re-Pair. Re-Pair. Re-Pair. (Re-Merge) Re-Merge. Sekine [4, 5, 8] (highly repetitive text) [2] Re-Pair. Blocked-Repair-VF [7]

Αντώνης Βεντούρης. Επίκουρος Καθηγητής Διδακτικής των Γλωσσών Τμήμα Ιταλικής Γλώσσας και Φιλολογίας Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

The State of the Art and Difficulties in Automatic Chinese Word Segmentation

Bayesian Variable Order n-gram Language Model based on Hierarchical Pitman-Yor Processes

: Active Learning 2017/11/12

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ. Λέκτορας στο Τμήμα Οργάνωσης και Διοίκησης Επιχειρήσεων, Πανεπιστήμιο Πειραιώς, Ιανουάριος 2012-Μάρτιος 2014.

Development of the Nursing Program for Rehabilitation of Woman Diagnosed with Breast Cancer

Query by Phrase (QBP) (Music Information Retrieval, MIR) QBH QBP / [1, 2] [3, 4] Query-by-Humming (QBH) QBP MIDI [5, 6] [8 10] [7]

Elements of Information Theory

Vol.7 No (Mar. 2014) Latent Dirichlet Allocation LDA Twitter LDA

A Vocabulary-Free Infinity-Gram Model for Chord Progression Analysis

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ

Bayesian Discriminant Feature Selection

ER-Tree (Extended R*-Tree)

Quick algorithm f or computing core attribute


Yoshifumi Moriyama 1,a) Ichiro Iimura 2,b) Tomotsugu Ohno 1,c) Shigeru Nakayama 3,d)


High order interpolation function for surface contact problem

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης

GPGPU. Grover. On Large Scale Simulation of Grover s Algorithm by Using GPGPU

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ

ΚΟΝΤΟΚΩΣΤΑΣ ΔΗΜΗΤΡΙΟΣ - ΒΙΟΓΡΑΦΙΚΟ

J. of Math. (PRC) 6 n (nt ) + n V = 0, (1.1) n t + div. div(n T ) = n τ (T L(x) T ), (1.2) n)xx (nt ) x + nv x = J 0, (1.4) n. 6 n

Η Διαδραστική Τηλεδιάσκεψη στο Σύγχρονο Σχολείο: Πλαίσιο Διδακτικού Σχεδιασμού

ΠΟΛΥΤΙΜΟ. Ερευνητικό έργο. της Ε. Γαλιώτου*

ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. ΘΕΜΑ: «ιερεύνηση της σχέσης µεταξύ φωνηµικής επίγνωσης και ορθογραφικής δεξιότητας σε παιδιά προσχολικής ηλικίας»

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΠΡΟΣΩΠΙΚΑ ΣΤΟΙΧΕΙΑ ΣΠΟΥΔΕΣ

Optimization, PSO) DE [1, 2, 3, 4] PSO [5, 6, 7, 8, 9, 10, 11] (P)

Fourier transform, STFT 5. Continuous wavelet transform, CWT STFT STFT STFT STFT [1] CWT CWT CWT STFT [2 5] CWT STFT STFT CWT CWT. Griffin [8] CWT CWT

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

No. 7 Modular Machine Tool & Automatic Manufacturing Technique. Jul TH166 TG659 A

Probabilistic Approach to Robust Optimization

: Monte Carlo EM 313, Louis (1982) EM, EM Newton-Raphson, /. EM, 2 Monte Carlo EM Newton-Raphson, Monte Carlo EM, Monte Carlo EM, /. 3, Monte Carlo EM

την τιμή της μέσης τιμής, μ, ή της διασποράς, σ, ενός πληθυσμού και σε στατιστικούς ελέγχους υποθέσεων για τη σύγκριση των μέσων τιμών, μ

The Algorithm to Extract Characteristic Chord Progression Extended the Sequential Pattern Mining

Βιογραφικό Σημείωμα. (τελευταία ενημέρωση 20 Ιουλίου 2015) 14 Ιουλίου 1973 Αθήνα Έγγαμος

A research on the influence of dummy activity on float in an AOA network and its amendments

Δομζσ επιλογήσ ςτο SCRATCH

Εικονικά Περιβάλλοντα Μάθησης για Παιδιά με Αυτισμό: Επισκόπηση Πεδίου και Προτάσεις Σχεδιασμού

HIV HIV HIV HIV AIDS 3 :.1 /-,**1 +332

n 1 n 3 choice node (shelf) choice node (rough group) choice node (representative candidate)

Η Αυτοματοποιημένη και μη-αυτοματοποιημένη αξιολόγηση συστήματος Στατιστικής Μηχανικής Μετάφρασης για το γλωσσικό ζεύγος Ελληνικά - Ιταλικά

ΤΕΙ ΘΕΣΣΑΛΙΑΣ. Αναγνώριση προσώπου με επιλογή των κατάλληλων κυρίων συνιστωσών. ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε ΚΑΒΒΑΔΙΑ ΑΛΕΞΑΝΔΡΟΥ.

Arbitrage Analysis of Futures Market with Frictions

The Study of Evolutionary Change of Shogi

Development of a Seismic Data Analysis System for a Short-term Training for Researchers from Developing Countries

Estimation, Evaluation and Guarantee of the Reverberant Speech Recognition Performance based on Room Acoustic Parameters

«ΟΜΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΚΑΙ ΣΤΑΤΙΚΗ ΣΤΕΡΕΩΣΗ ΙΣΤΟΡΙΚΟΥ ΙΕΡΟΥ ΝΑΟΥ»

Τοποθέτηση τοπωνυµίων και άλλων στοιχείων ονοµατολογίας στους χάρτες

Ένα µοντέλο Ισοδύναµης Χωρητικότητας για IEEE Ασύρµατα Δίκτυα. Εµµανουήλ Καφετζάκης

46 2. Coula Coula Coula [7], Coula. Coula C(u, v) = φ [ ] {φ(u) + φ(v)}, u, v [, ]. (2.) φ( ) (generator), : [, ], ; φ() = ;, φ ( ). φ [ ] ( ) φ( ) []

Ηλεκτρονικά σώματα κειμένων και γλωσσική διδασκαλία: Διεθνείς αναζητήσεις και διαφαινόμενες προοπτικές για την ελληνική γλώσσα

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Text Mining using Linguistic Information

GPU. CUDA GPU GeForce GTX 580 GPU 2.67GHz Intel Core 2 Duo CPU E7300 CUDA. Parallelizing the Number Partitioning Problem for GPUs

Topic Structure Mining based on Wikipedia and Web Search

ΠΣΤΥΙΑΚΗ ΔΡΓΑΙΑ. Μειέηε Υξόλνπ Απνζηείξσζεο Κνλζέξβαο κε Τπνινγηζηηθή Ρεπζηνδπλακηθή. Αζαλαζηάδνπ Βαξβάξα

Κύρια σημεία. Μεθοδολογικές εργασίες. Άρθρα Εφαρμογών. Notes - Letters to the Editor. Εργασίες στη Στατιστική Μεθοδολογία

Shortness Ambiguity TEAM Ungrammaticality

Topic Estimation for Microblogs Taking into Account the Relationships between Adjacent Tweets

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science.

Big Data/Business Intelligence

ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ. Δυναμικός Προγραμματισμός. Παντελής Μπάγκος

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Research of Han Character Internal Codes Recognition Algorithm in the Multi2lingual Environment

IF(Ingerchange Format) [7] IF C-STAR(Consortium for speech translation advanced research ) [8] IF 2 IF

1 h, , CaCl 2. pelamis) 58.1%, (Headspace solid -phase microextraction and gas chromatography -mass spectrometry,hs -SPME - Vol. 15 No.

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΣΤΥΛΙΑΝΗΣ Κ. ΣΟΦΙΑΝΟΠΟΥΛΟΥ Αναπληρώτρια Καθηγήτρια. Τµήµα Τεχνολογίας & Συστηµάτων Παραγωγής.

ΣΤΟΙΧΕΙΑ ΠΡΟΤΕΙΝΟΜΕΝΟΥ ΕΞΩΤΕΡΙΚΟΥ ΕΜΠΕΙΡΟΓΝΩΜΟΝΟΣ Προσωπικά Στοιχεία:

ΛΕΙΤΟΥΡΓΙΚΟΤΗΤΑΣ ΑΤΟΜΩΝ ΜΕ ΒΑΡΙΑ ΝΟΗΤΙΚΗ ΥΣΤΕΡΗΣΗ ΚΑΙ ΠΡΟΒΛΗΜΑΤΑ ΣΥΜΠΕΡΙΦΟΡΑΣ ΠΟΥ ΜΕΝΟΥΝ ΣΕ ΟΙΚΟΤΡΟΦΕΙΟ ΣΤΗΝ ΚΟΙΝΟΤΗΤΑ.

Vol.4-DCC-8 No.8 Vol.4-MUS-5 No.8 4// 3 3 Hanning (T ) 3 Hanning 3T (y(t)w(t)) dt =.5 T y (t)dt. () STRAIGHT F 3 TANDEM-STRAIGHT[] 3 F F 3 [] F []. :

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΒΑΣΙΛΕΙΟΥ Τ. ΤΑΜΠΑΚΑ

Διπλωματική Εργασία της φοιτήτριας του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών

Transcript:

1,a) Graham Neubig 1,b) Sakriani Sakti 1,c) 1,d) 1,e) 1. [11], [15] 1 Nara Institute of Science and Technology a) akabe.koichi.zx8@is.naist.jp b) neubig@is.naist.jp c) ssakti@is.naist.jp d) tomoki@is.naist.jp e) s-nakamura@is.naist.jp 1 n-gram 1-gram 2-gram the 61 (BOS) the 42, 47. (EOS) 41 and 43, and 32 of 42 of the 27 : 42 in the 21 1 n-gram n-gram n-gram n-best [16] n-gram n-gram L1 c 2012 Information Processing Society of Japan 1

2 n-best n-best n-best 1-best n-best 2. n-gram n-gram n-gram n-gram n-gram n-gram ( 1 ) n-gram ( 2 ) n-gram 1-best 1 ( 3 ) n-gram ( 4 ) n-gram 2 1 3. n-gram n-gram Ja En(Ref) kyo-chan -lrb- city bus -rrb- En(MT) kyoto chan -lrb- kyoto city bus -rrb- Rules SYMP ( x0:sym SYMP ( NP ( NN ( ) NN ( ) ) x1:sym ) ) x0 kyoto city bus x1 Eval 1 4 5 n-gram 3 n-gram (x) p(x, c = e) p(x, c = c) p(x) p( x, c = e) p( x, c = c) p( x) p(c = e) p(c = c) 1.0 1-best E k C k n-gram n-gram R k Ek n-best R k EV ( BLEU+1[5]) EV n-gram 1-best 3.1 n-gram F k F E k C k C k n-gram x E k # k (x) e k (x) # k (x) x / C k e k (x) = 0 (otherwise) e k ϕ e (x) = k e k(x) ϕ e n-gram 3.2 n-gram n-gram x n-gram c 2012 Information Processing Society of Japan 2

PMI PMI [1] P MI(x) = log p(x, c = e) p(x) p(c = e) p 3 p(x) n-gram x p(c = e) n-gram p(x, c = e) x PMI S(x) = p(x, c = e) log p(x, c = e) p(x) p(c = e) (1) n-gram (1) S(x) 3.3 n-gram n-gram F k F E k C k n-gram E k e k (x) C k c k (x) ϕ e(x) = k e k (x) ϕ c = k c k (x) n-gram n-gram p(c = e w = x) = ϕ e(x) ϕ e(x) + ϕ c(x) 1 n-gram 1 MacKay [6] n-gram x (2) S(x) n-gram S(x) = ϕ e(x) + αp e ϕ e(x) + ϕ c(x) + α x P e = ϕ e(x) x ϕ e(x) + x ϕ c(x) (2) α n-gram [13] (3) P = x c {e,c} #(w=x,c) k=0 (k + αp (c)) #(w=x) k=0 (k + α) (3) (3) P α P α P 4. n-gram [16] n-gram F = {F 1,..., F K } n-best Ê = {Ê 1,..., Ê K } R = {R 1,..., R K } Ê k = {Êk,1, Êk,2,..., Êk,I} ϕ(êk,i) w ϕ(êk,i) w n-best E k w 4.1 w [2] Ek Êk ϕ(êk) ϕ(ek ) w Ek Êk 0 F N 4.2 L1 [14] [12] L1 w L1 w 1 = i w i 0 L1 (FOBOS) [3] FOBOS 4.3 : ( 1 ) ϕ s : n-best ( 2 ) n-gram ϕ n : n-gram n-gram ( 3 ) ϕ l : c 2012 Information Processing Society of Japan 3

3 KFTT Train 330k 5.91M 6.09M Dev 1166 24.3k 26.8k Test 1160 26.7k 28.5k Ja En(Ref) En(MT) Eval he was the 1st seii taishogun of the muromachi shogunate. he was the first seii taishogun of the muromachi bakufu -lrb- japanese feudal government headed by a shogun -rrb-. 2 n-gram 4.4 n-best 1-best 1-best Êk R k {Êk, R k } n-best ϕ s 1-best 0 1 5. 2 n-gram x n-gram (4) W (x) = #(x, state = error) #(x) (4) #(x, state = error) n-gram #(x) n-gram n-gram 5.1 (KFTT)[7] 3 Travatar [8] Forest-to-String Nile *1 Egret *2 MERT [9] BLEU[10] 3 4 *1 http://code.google.com/p/nile/ *2 http://code.google.com/p/egret-parser/ ( 1 ) ( 2 ) ( 3 ) ( 4 ) ( 5 ) 2 n-best 100 10000 n-best 4.2 FOBOS L1 10 7-10 2 KFTT BLEU+1 100 n-gram 1-gram 3-gram n-best BLEU+1 RIBES[4] 2 n-gram n-gram n-gram 1 1 n-gram n-gram 1 n-gram 2 bakufu -lrb- japanese japanese feudal government 1 2 n-gram bakufu -lrb- japanese feudal government 1 n-gram 5.2 n-gram 2 30 30 n-gram c 2012 Information Processing Society of Japan 4

4 n-gram 3 3 oracle ref oracle ref oracle ref n-best ref 0.483 0.290 0.323 0.427 0.410 0.607 0.713 0.598 0.387 0.124 0.460 0.258 0.500 0.520 0.218 0.449 0.332 0.259 0.166 0.023 0.052 0.086 0.049 0.016 0.140 0.067 0.078 0.111 0.195 0.278 0.078 0.260 0.537 0.364 0.164 0.276 0.062 0.103 0.093 0.016 0.041 0.042 0.023 0.245 0.052 0.319 0.218 0.299 0.305 0.106 0.176 0.023 0.192 0.155 0.093 0 0.021 0.016 0.024 0.011 0 0 0.181 4 n-best 3 n-best 2 n-best n-gram n-best n-best n-gram n-best 1-best n-best 1-best n-best n-gram 5.3 n-gram n-gram 5 1-best 5 n-gram dev test 1.1 0.2 oracle 381.0 402.8 ref 368.0 378.6 oracle 135.4 151.9 ref 225.1 225.1 oracle 21.4 11.2 ref 19.7 7.7 n-best 6.2 4.0 ref 175.9 183.1 n-gram 4 n-gram n-best n-gram n-best n-gram n-gram 1-best 1-best n-gram n-gram 5.4 n-best n-gram BLEU RIBES 2 n-gram 6 BLEU RIBES BLEU RIBES c 2012 Information Processing Society of Japan 5

6 +BLEU +RIBES 0.598 0.529 0.332 0.216 0.067 0 0.164 0.285 0.245 0.125 0.192 0.289 0 0.086 RIBES BLEU 6. n-gram n-best n-gram n-best recall n-best 3 [7] Neubig, G.: The Kyoto Free Translation Task, http://www.phontron.com/kftt (2011). [8] Neubig, G.: Travatar: A Forest-to-String Machine Translation Engine based on Tree Transducers, Proc. ACL (2013). [9] Och, F. J.: Minimum Error Rate Training in Statistical Machine Translation, Proc. ACL (2003). [10] Papineni, K., Roukos, S., Ward, T. and Zhu, W.-J.: BLEU: a method for automatic evaluation of machine translation, Proc. ACL, pp. 311 318 (2002). [11] Popovic, M. and Ney, H.: Towards automatic error analysis of machine translation output, Computational Linguistics, pp. 657 688 (2011). [12] Roark, B., Saraclar, M. and Collins, M.: Discriminative n-gram language modeling, Computer Speech & Language, Vol. 21, No. 2, pp. 373 392 (2007). [13] Teh, Y. W., Jordan, M. I., Beal, M. J. and Blei, D. M.: Hierarchical Dirichlet processes, Journal of the American Statistical Association, Vol. 101, No. 476 (2006). [14] Tsuruoka, Y., Tsujii, J. and Ananiadou, S.: Stochastic Gradient Descent Training for L1-regularized Log-linear Models with Cumulative Penalty, Proc. ACL, pp. 477 485 (2009). [15] Vilar, D., Xu, J., D Haro, L. F. and Ney, H.: Error analysis of statistical machine translation output, Proc. LREC, pp. 697 702 (2006). [16] Neubig, G. Sakti, S. 20 (NLP2014) pp. 959-962 (2014). [1] Church, K. W. and Hank, P.: Word association norms, mutual information, and lexicography, Computational Linguistics, Vol. 10, pp. 22 29 (1990). [2] Collins, M.: Discriminative Training Methods for Hidden Markov Models: Theory and Experiments with Perceptron Algorithms, Proc. EMNLP, pp. 1 8 (2002). [3] Duchi, J. and Singer, Y.: Efficient Online and Batch Learning using Forward Backward Splitting, Journal of Machine Learning Research, Vol. 10 (2009). [4] Isozaki, H., Hirao, T., Duh, K., Sudoh, K. and Tsukada, H.: Automatic Evaluation of Translation Quality for Distant Language Pairs, Proc. EMNLP, pp. 944 952 (2010). [5] Lin, C.-Y. and Och, F. J.: Orange: a method for evaluating automatic evaluation metrics for machine translation, Proc. COLING, pp. 501 507 (2004). [6] Mackay, D. J. and Petoy, L. C. B.: A Hierarchical Dirichlet Language Model, Natural Language Engineering, Vol. 1 (1995). c 2012 Information Processing Society of Japan 6