1530 ( ) 2014,54(12),, E (, 1, X ) [4],,, α, T α, β,, T β, c, P(T β 1 T α,α, β,c) 1 1,,X X F, X E F X E X F X F E X E 1 [1-2] , 2 : X X 1 X 2 ;

Σχετικά έγγραφα
1 n-gram n-gram n-gram [11], [15] n-best [16] n-gram. n-gram. 1,a) Graham Neubig 1,b) Sakriani Sakti 1,c) 1,d) 1,e)

Stabilization of stock price prediction by cross entropy optimization


(Statistical Machine Translation: SMT[1]) [2]

No. 7 Modular Machine Tool & Automatic Manufacturing Technique. Jul TH166 TG659 A

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΠΡΟΣΩΠΙΚΑ ΣΤΟΙΧΕΙΑ ΣΠΟΥΔΕΣ

An Analysis of Problems in Grammatical Error Correction of ESL Writings Using a Large Learner Corpus of English

(String-to-Tree ) KJ [11] best 1-best 2. SMT 2. [9] Brockett [2] Mizumoto [10] Brockett [2] [10] [15] ê = argmax e P(e f ) = argmax e M m=1 λ

Faruqui [7] WordNet [15] FrameNet [2] PPDB [8]

Optimization, PSO) DE [1, 2, 3, 4] PSO [5, 6, 7, 8, 9, 10, 11] (P)

The State of the Art and Difficulties in Automatic Chinese Word Segmentation

ER-Tree (Extended R*-Tree)

Αντώνης Βεντούρης. Επίκουρος Καθηγητής Διδακτικής των Γλωσσών Τμήμα Ιταλικής Γλώσσας και Φιλολογίας Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Big Data/Business Intelligence

Η Διαδραστική Τηλεδιάσκεψη στο Σύγχρονο Σχολείο: Πλαίσιο Διδακτικού Σχεδιασμού

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He

Automatic Domain2Specific Term Extraction and Its Application in Text Cla ssification

Research on Economics and Management

ΕΜΜΕΛΗΣ ΑΠΑΓΓΕΛΙΑ. Γεωργίου Ε. Χατζηχρόνογλου

Twitter 6. DEIM Forum 2014 A Twitter,,, Wikipedia, Explicit Semantic Analysis,

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΛΕΩΝΙΔΑΣ Α. ΣΠΥΡΟΥ Διδακτορικό σε Υπολογιστική Εμβιομηχανική, Τμήμα Μηχανολόγων Μηχανικών, Πανεπιστήμιο Θεσσαλίας.

Εικονικά Περιβάλλοντα Μάθησης για Παιδιά με Αυτισμό: Επισκόπηση Πεδίου και Προτάσεις Σχεδιασμού

EM Baum-Welch. Step by Step the Baum-Welch Algorithm and its Application 2. HMM Baum-Welch. Baum-Welch. Baum-Welch Baum-Welch.

A summation formula ramified with hypergeometric function and involving recurrence relation

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o

CorV CVAC. CorV TU317. 1

[15], [16], [17] [6] [2] [5] Jiang [6] 2.1 [6], [10] Score(x, y) y ( 1) ( 1 ) b e ( 1 ) b e. O(n 2 ) Jiang [6] (word lattice reranking)

Τοποθέτηση τοπωνυµίων και άλλων στοιχείων ονοµατολογίας στους χάρτες

Nov Journal of Zhengzhou University Engineering Science Vol. 36 No FCM. A doi /j. issn


ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΠΡΟΣΩΠΙΚΑ ΣΤΟΙΧΕΙΑ ΣΠΟΥΔΕΣ

Buried Markov Model Pairwise

ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ

Probabilistic Approach to Robust Optimization

Area Location and Recognition of Video Text Based on Depth Learning Method

Approximation Expressions for the Temperature Integral

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

Research on model of early2warning of enterprise crisis based on entropy

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΣΤΥΛΙΑΝΗΣ Κ. ΣΟΦΙΑΝΟΠΟΥΛΟΥ Αναπληρώτρια Καθηγήτρια. Τµήµα Τεχνολογίας & Συστηµάτων Παραγωγής.

An Automatic Modulation Classifier using a Frequency Discriminator for Intelligent Software Defined Radio

{takasu, Conditional Random Field

ΜΕΘΟΔΟΙ ΥΠΟΛΟΓΙΣΜΟΥ ΤΗΣ ΖΕΝΙΘΕΙΑΣ ΤΡΟΠΟΣΦΑΙΡΙΚΗΣ ΥΣΤΕΡΗΣΗΣ ΣΕ ΜΟΝΙΜΟΥΣ ΣΤΑΘΜΟΥΣ GNSS

Arbitrage Analysis of Futures Market with Frictions

.,., Klas Eric Soderquist,!., (knowledge transfer). % " $&, " 295 " 72 " marketing 65,, ', (, (.

Η Αυτοματοποιημένη και μη-αυτοματοποιημένη αξιολόγηση συστήματος Στατιστικής Μηχανικής Μετάφρασης για το γλωσσικό ζεύγος Ελληνικά - Ιταλικά

High order interpolation function for surface contact problem

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ ΑΘΗΝΑ Ε - ΜΑΙL : mkap@aueb.gr ΤΗΛ: , ΚΑΠΕΤΗΣ ΧΡΥΣΟΣΤΟΜΟΣ. Βιογραφικό Σημείωμα

Automatic extraction of bibliography with machine learning

(Statistical Machine Translation: SMT [1])

ΔΗΜΗΤΡΗΣ ΔΗΜΗΤΡΙΟΥ ΣΥΝΤΟΜΟ ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ

Quick algorithm f or computing core attribute

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ

ΠΡΟΓΡΑΜΜΑ ΚΑΡΑΘΕΟΔΩΡΗΣ 2008

Ανάπτυξη λογισμικού για τη διενέργεια υπολογιστικών μελετών

ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΟΡΓΑΝΩΣΗ ΚΑΙ ΔΙΟΙΚΗΣΗ ΒΙΟΜΗΧΑΝΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΕΙΔΙΚΕΥΣΗ : LOGISTICS (ΕΦΟΔΙΑΣΜΟΣ ΚΑΙ ΔΙΑΚΙΝΗΣΗ ΠΡΟΪΝΤΩΝ)

The Study of Evolutionary Change of Shogi


Αξιολόγηση πληροφοριακών συστηµάτων και υπηρεσιών πληροφόρησης

Chapter 1 Introduction to Observational Studies Part 2 Cross-Sectional Selection Bias Adjustment

Q L -BFGS. Method of Q through full waveform inversion based on L -BFGS algorithm. SUN Hui-qiu HAN Li-guo XU Yang-yang GAO Han ZHOU Yan ZHANG Pan

Απόσπασμα από: «Οδηγός Συγγραφής Πτυχιακής Εργασίας. Αλεξάνδρα Οικονόμου, Βασίλης Παυλόπουλος & Πέτρος Ρούσσος

Motion analysis and simulation of a stratospheric airship

SocialDict. A reading support tool with prediction capability and its extension to readability measurement

Δράσεις για την ενίσχυση της δημιουργικότητας μέσω της μουσικής πληροφόρησης και της τηλεκπαίδευσης στη Φιλαρμονική Ένωση Κέρκυρας «Καποδίστριας»

«ΕΝΕΡΓΕΙΑ - ΠΕΡΙΒΑΛΛΟΝΤΙΚΗ ΡΥΠΑΝΣΗ»: ΜΕ ΤΗΝ ΤΕΧΝΙΚΗ ΤΗΣ ΧΑΡΤΟΓΡΑΦΗΣΗΣ ΕΝΝΟΙΩΝ

Study on the Strengthen Method of Masonry Structure by Steel Truss for Collapse Prevention

Εξόρυξη Γνώμης: Δημιουργία Ελληνικού Λεξικού Πόρου

(Synesthesia) (B) 22-25

Κατανομή των 183 επιτυχόντων

BCI On Feature Extraction from Multi-Channel Brain Waves Used for Brain Computer Interface

: Monte Carlo EM 313, Louis (1982) EM, EM Newton-Raphson, /. EM, 2 Monte Carlo EM Newton-Raphson, Monte Carlo EM, Monte Carlo EM, /. 3, Monte Carlo EM

Bundle Adjustment for 3-D Reconstruction: Implementation and Evaluation

Research on vehicle routing problem with stochastic demand and PSO2DP algorithm with Inver2over operator

Reading Order Detection for Text Layout Excluded by Image

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Βιογραφικό Σημείωμα. (τελευταία ενημέρωση 20 Ιουλίου 2015) 14 Ιουλίου 1973 Αθήνα Έγγαμος

OLS. University of New South Wales, Australia

VSC STEADY2STATE MOD EL AND ITS NONL INEAR CONTROL OF VSC2HVDC SYSTEM VSC (1. , ; 2. , )

ΕΠΙΧΕΙΡΗΣΙΑΚΗ EΡΕΥΝΑ & ΔΙΟΙΚΗΤΙΚΗ ΕΠΙΣΤΗΜΗ OPERATIONS RESEARCH & MANAGEMENT SCIENCE

ΔΗΜΟΤΙΚΕΣ ΕΚΛΟΓΕΣ 18/5/2014 ΑΚΥΡΑ

[4] 1.2 [5] Bayesian Approach min-max min-max [6] UCB(Upper Confidence Bound ) UCT [7] [1] ( ) Amazons[8] Lines of Action(LOA)[4] Winands [4] 1

A research on the influence of dummy activity on float in an AOA network and its amendments

Vol. 31,No JOURNAL OF CHINA UNIVERSITY OF SCIENCE AND TECHNOLOGY Feb

Kenta OKU and Fumio HATTORI

Εφαρμογή Υπολογιστικών Τεχνικών στην Γεωργία


United States of America

Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Τμήμα Μαθηματικών Π.Μ.Σ. Θεωρητικής Πληροφορικής και Θεωρίας Συστημάτων και Ελέγχου

: Active Learning 2017/11/12

( ) , ) , ; kg 1) 80 % kg. Vol. 28,No. 1 Jan.,2006 RESOURCES SCIENCE : (2006) ,2 ,,,, ; ;

Ενεργητική Μάθηση Με Χρήση Μηχανών ιανυσµάτων Υποστήριξης. Ανδρέας Βλάχος Πανεπιστήµιο του Εδιµβούργου

Δημήτριος Θ. Τόμτσης, Ph.D. Αναλυτικό Βιογραφικό Σημείωμα

X g 1990 g PSRB

Προετοιμάζοντας τον μελλοντικό δάσκαλο για το ψηφιακό σχολείο

Bayesian Discriminant Feature Selection

SVM. Research on ERPs feature extraction and classification

Security in the Cloud Era

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

1181 (real-timespeechdriven) 1 1 ( ) D FAP FAP (voiceactivationdetectionvad) D FaceGen 3- D XfaceEd MPEG-4 1 FAP 66 FAP ( ) FAP 84

Transcript:

ISSN1000-0054 CN11-2223/N ( ) 2014 54 12 JTsinghuaUniv(Sci& Technol), 2014,Vol.54, No.12 4/20 1529-1533,, (,, (), 100084) [1-2] :,,,,,,,, :, 0.3~ [3] 0.8BLEU,, : ; ; [4], ; :TP391.2 :A, :1000-0054(2014)12-1529-05, [5-8] Neuralreorderingmodelforhierarchical phrase-basedtranslations LIPeng,LIUYang,SUNMaosong (StateKeyLaboratoryofInteligentTechnologyandSystems, TsinghuaNationalLaboratoryforInformationScienceand Technology,DepartmentofComputerScienceandTechnology, TsinghuaUniversity,Beijing100084,China) Abstract:Thereorderingambiguityisoneofthemajorchalengesfor hierarchicalphrase-basedtranslation models.these models only considerlimitedcontextssothattheirabilityisreducedtoresolve reorderingambiguities.morecontexts wereintroducedintothese modelsusinganeuralreorderingmodelforhierarchicalphrase-based translations.reorderingistreatedasaclassificationprobleminthis model.thevector-spacerepresentationsarecomputedforphrases usingrecursiveauto-encoders.theserepresentationsarethenused asfeatures to predict the probabilities of various reorderings. Finaly,these probabilities are used as new features for the decoding.testsshowthatthismodelimprovesthebleuscoreby 0.3 0.8overthebaselinesforChinese-Englishtranslation,which indicatesthatthismodelgivesbeterreorderingthanthebaselines. Keywords:computer science and technology; neural network; reordering model;recursiveauto-encoders;hierarchical phrase-basedtranslation,, [3-4,6],, [911],; (recursiveautoencoder) [11],, :2014-09-22 : (2012AA011102); (61331013); (2014BAK101303) : (1987 ),(),, :,,E-mail:liuyang2011@tsinghua.edu.cn

1530 ( ) 2014,54(12),, E (, 1, X ) [4],,, α, T α, β,, T β, c, P(T β 1 T α,α, β,c) 1 1,,X X F, X E F X E X F X F E X E 1 [1-2] 2.2 1 2, 2 : X X 1 X 2 ;X 1X 2. [911] [11],, 2 ω1 ω2, c 1 c 2, (1) () X, p ω1ω2 : X 1 X 2 X 1X 2 X 1 p =f (1) (W (1) [c 1 ;c 2 ]+b (1) ). (1) X 2 X 1X 2 X, :W ;b (1) ;[c 1 ;c 2 ] c 1 c 2 ;f (1) ( ), 2 X 1 beautiful X X 1 X 2 ;X 1 X 2 tanh( ) c 1 c 2 c 1 c 2, (2) : +X beautiful [c 1 ;c 2 ]=f (2) (W (2) p+b (2) ). (2) X X 2 ;beautifulx 2 :W (2) ;b (2) ;f (2) ( ), tanh( ) c 1 c 1 c 2, c 2 ( ), p X X 1 X 2 ;X 2ofX 1 c 1 c 2, (3) c 1 c 1 c 2 c 2 :, 1, 2 ( c 1 -c 1 2 + c 2 -c 2 2 ). (3), 2, [11], 2.1 2, 2, [4], 1 1 [11] 1, X, F

,: 1531 1 X F X F 2.3 2) : (cross-entropyerror) 1, 1 [11], X F X F, 6 L-BFGS [12], 6 2 2 (backpropagationthroughstruc- F ( ) tures) [13],2 2 X ( ),2 X, X 2 X ( Bolivia presidentialandparliament ),,, (4), softmax(w o T α p o +b o T α ). (4) :W o T α b o T α T α 4,P o 4.1 ( 1 6 ) 123,, 0.32, 0.35, 4, GIGAWORD Xinhua 1X,4 (LDC2011T07), 3.986, ( 1), 4, SRILM [14] NIST2006 2X,14,NIST 2003-, 14,W o T α b o T α 2005 3, 2 : ( MT03~05 ) BLEU [15] 1) : 2 : [1-2] [4],,

1532 ( ) 2014,54(12), [4],, MERT, [16] 4.2 200 3,, 2,,, (, ), 2.12%,, 3, MT06 3,2, MERT 1X, 2X, 4, 14, 2 BLEU X F X, MT06 MT03 MT04 MT05 33638939, 91.40% 31.64 33.18 33.98 31.77 X E X, 31.93 33.52 33.95 31.81, 31.81 33.81 34.50 32.61, 3 /% /% X F X 20.36 69.67 77.00 F X F X F X F X F X F X X F X F F X F X F X 20.40 64.67 81.83 X 15.88 74.83 81.50 X1 X2 20.43 46.50 58.89 X1 X2 10.41 48.96 53.86 X1 X2 10.40 48.14 52.14 X1 X2 2.12 36.36 33.43 5 (References),, Linguistics,2005:263-270. [1] Chiang D.A hierarchicalphrase-based modelforstatistical machinetranslation [C]// Proceedingsofthe43rd Annual Meeting on Association for Computational Linguistics. Stroudsburg, PA, USA: Association for Computational [2] Chiang D. Hierarchical phrase-based translation [J]., ComputationalLinguistics,2007,33(2):201-228.

,: 1533 [3] He Z, Liu Q, Lin S. Improving statistical machine translationusinglexicalizedruleselection [C]//Proceedings of the 22nd International Conference on Computational Linguistics. Manchester, UK: Coling 2008 Organizing Commitee,2008:321-328. [4] HeZ, Meng Y,Yu H. Maximum entropy based phrase reorderingfor hierarchicalphrase-based translation [C]// Proceedingsofthe2010ConferenceonEmpiricalMethodsin Natural Language Processing. Massachusets, USA: AssociationforComputationalLinguistics,2010:555-563. [5] Zens R, Ney H. Discriminative reordering models for statistical machine translation [C]// Proceedings on the Workshopon Statistical Machine Translation.New York, USA: Association for Computational Linguistics, 2006: 55-63. [6] XiongD,Liu Q,Lin S. Maximum entropy based phrase reordering modelforstatistical machinetranslation [C]// Proceedings of the 21st International Conference on ComputationalLinguisticsandthe44thannualmeetingofthe Association for Computational Linguistics. Sydney, Australia: Association for Computational Linguistics, 2006:521-528. [7] XiongD,Zhang M,Aw A,etal.Linguisticalyannotated BTGforstatisticalmachinetranslation [C]//Proceedingsof the 22nd International Conference on Computational Linguistics.Manchester,UK:AssociationforComputational Linguistics,2008:1009-1016. [8] LiuQ,HeZ,Liu Y,etal.Maximum entropybasedrule selection model for syntax-based statistical machine translation [C]// Proceedings ofthe 2008 Conference on Empirical Methods in Natural Language Processing. Honolulu, Hawai, USA: Association for Computational Linguistics,2008:89-97. [9] Bengio Y, Ducharme R, Vincent P, et al. A neural probabilistic language model [J]. Journal of Machine Learning Research,2003,3:1137-1155. [10]ColobertR,WestonJ,Botou L,etal.Naturallanguage processing (almost)from scratch [J].Journalof Machine Learning Research,2011,12:2493-2537. [11]SocherR,PenningtonJ,HuangE H,etal.Semi-supervised recursiveautoencodersforpredictingsentimentdistributions [C]// Proceedings ofthe 2011 Conference on Empirical Methods in Natural Language Processing. Edinburgh, Scotland,UK:Associationfor ComputationalLinguistics, 2011:151-161. [12]LiuD C,NocedalJ.Onthelimited memorybfgs method for large scale optimization [J]. Mathematical Programming,1989,45(1-3):503-528. [13]GolerC,Kuchler A.Learningtask-dependentdistributed representationsbybackpropagationthroughstructure [C]// Proceedings of the International Conference on Neural Networks(ICNN 96).WashingtonDC,USA:IEEE,1996: 347-352. [14]StolckeA.SRILM-anextensiblelanguage modelingtoolkit [C]//ProceedingsoftheInternationalConferenceonSpoken Language Processing. Denver, Colorado, USA: ISCA, 2002:901-904. [15]PapineniK,RoukosS,WardT,etal.BLEU:A methodfor automatic evaluation of machine translation [C]// Proceedingsofthe40th Annual Meetingon Associationfor Computational Linguistics. Philadelphia, Pennsylvania, USA: Association for Computational Linguistics, 2002:311-318. [16]OchFJ.Minimumerrorratetraininginstatisticalmachine translation [C]//Proceedingsofthe41stAnnualMeetingon AssociationforComputationalLinguistics.Sapporo,Japan: AssociationforComputationalLinguistics,2003:160-167.