0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Applying Morphology Generation Models to Machine Translation" docx

Báo cáo khoa học:

Báo cáo khoa học: "Applying Morphology Generation Models to Machine Translation" docx

... Association for Computational LinguisticsApplying Morphology Generation Models to Machine TranslationKristina ToutanovaMicrosoft ResearchRedmond, WA, USAkristout@microsoft.comHisami SuzukiMicrosoft ... base MT system. In the second setting, weallow the model to use up to 100 translations, and to automatically select the best number to use. Asseen in Table 3, (n=16) translations were chosen ... by factoring the repre-sentation of words into a vector of morphologicalfeatures and allowing a phrase-based MT system to work on any of the factored representations, whichis implemented in...
  • 9
  • 416
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Phrase-Based Backoff Models for Machine Translation of Highly Inflected Languages" docx

... Phrase-Based Backoff Models for Machine Translation of Highly InflectedLanguagesMei YangDepartment of Electrical EngineeringUniversity of Washin g tonSeattle, WA, USAyangmei@ee.washington.eduKatrin ... dis-counting factor (generally between 0 and 1) that isapplied to the higher-order distribution. The nor-malization factor α(wi−1, wi−2) ensures that thedistribution sums to one. In (Bilmes ... shownin Table 1, together with the resulting percentageof out-of-vocabulary (OOV) words in the develop-ment and test sets (“type” refers to a unique wordin the vocabulary, “token” to an instance...
  • 8
  • 379
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Word Sense Disambiguation Improves Statistical Machine Translation" docx

... {c1–e3,c2–e4,c3–e1,c3–e2,c3–e5},which means that c1is aligned to e3, c2is aligned to 1In order to check this requirement, we extended Hiero to make word alignment information available to the decoder.36Input: rule R ... WSD To incorporate WSD into Hiero, we use the trans-lations proposed by the WSD system to help Hieroobtain a better or more probable derivation duringthe translation of each source sentence. To ... WSD model or its predictions into theirtranslation model; rather, they used the WSD pre-dictions either to constrain the options available to their decoder, or to postedit the output of their...
  • 8
  • 285
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bilingual Sense Similarity for Statistical Machine Translation" ppt

... assured to be the same. Therefore, we need to first map a vector into the space of the other vec-tor, so that the similarity can be calculated. Fung (1998) and Rapp (1999) map the vector one-dimension -to- one-dimension ... one-dimension -to- one-dimension (a context word is a dimension in each vector space) from one lan-guage to another language via an initial bilingual dictionary. We follow (Zhao et al., 2004) to do vector ... for the vector, since it is not necessary to do vector mapping as the vectors are in the same language. ),(coocecoocfCCsim computes the similarity between the context vectors when α...
  • 10
  • 594
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Quadratic-Time Dependency Parsing for Machine Translation" pdf

... m-word, m-pos to refer to head and modi-fier words and POS tags, and append a numericalvalue to shift the word offset either to the left or to the right (e.g., h-pos+1 is the POS to the right ... language models are key to state-of-the-art performance (Brants et al., 2007), andthe ability of phrase-based decoders to handlelarge-size, high-order language models with noconsequence on asymptotic ... cased and tok-enization abides to the PTB segmentation as usedin the Penn treebank version 3. For the MT set-ting, texts are all lower case, and tokenizationwas changed to improve machine translation...
  • 9
  • 514
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Re-Usable Tools for Precision Machine Translation∗" pdf

... LOGON MT demonstrator assemblesindependently valuable general-purposeNLP components into a machine trans-lation pipeline that capitalizes on outputquality. The demonstrator embodies an in-teresting ... to right, the corpus sub-division by input length, total numberof items, and average string length, ambiguity rate, grammat-ical coverage, and generation time, respectively.translation into ... zerocontribution, the BLEU score drops to 0.21.3 Stochastic Components To deal with competing hypotheses at all process-ing levels, LOGON incorporates various stochasticprocesses for disambiguation....
  • 4
  • 448
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Prediction of Learning Curves in Machine Translation" ppt

... vector of feature weights specific to predicting at anchor size j, and φ is a vector of size-independent configuration features, detailed below.We then perform inference using these models to predict ... train models to predict the BLEU score at m anchor sizess1, . . . , sm, based on a set of features globally char-acterizing the configuration of interest. We restrictour attention to linear models: µj= ... oftraining data required to achieve a satisfac-tory accuracy level can be very useful. In thiswork, we show how to predict what the learn-ing curve would look like if we were to manu-ally translate...
  • 9
  • 374
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Sentence Simplification by Monolingual Machine Translation" pdf

... prison and sentencedhim to twenty years to life , slightly less than the maximum possible of twenty-five years to life .SimpleWikipediahe was sentenced to twenty-five years to life in prison in ... years to life to life .PBMT-R the judge ordered that chapman should get psychiatric treatment in prison and sentenced him to twenty years to life , a little bit less than the highest possible to ... isused to perform the word alignments, which arelater combined into phrase alignments in the Mosespipeline (Och and Ney, 2003) to build the sentencesimplification model. GIZA++ utilizes IBM Models 1...
  • 10
  • 437
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Hypothesis Mixture Decoding for Statistical Machine Translation" ppt

... Template Approach to Statistical Machine Transla-tion. Computational Linguistics, 30(4): 417-449. Kishore Papineni, Salim Roukos, Todd Ward, and Weijing Zhu. 2002. BLEU: a method for automatic evaluation ... 22,660 entries is used to convert  and  into their stem forms  and  by replacing each word into its stem form. This feature is computed similarly to that of . ... are used to seek the final best translation from this new search space. Few assumptions are made by our approach about the underlying component systems, enabling us to leverage SMT models based...
  • 10
  • 389
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Noisy-Channel Approach to Question Answering" docx

... “legal” is related to “rule”, which in turn is related to “mandatory”; that “age” is related to “aged”; and that “Argentine” is related to “Argentina”. It is not difficult to see by now that ... generative story (Figure 1 lists some of the factors specific to this computation.) The readers familiar with the statistical machine translation (SMT) literature should recognize that steps 3 to 5 ... S that is likely to be an answer to Q and assigns a score to it. Once one has these two modules, one has a QA system because finding the answer to a question Q amounts to selecting the sub-string...
  • 8
  • 393
  • 0

Xem thêm

Từ khóa: Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngchuyên đề điện xoay chiều theo dạngNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ