0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Discriminative Modeling of Extraction Sets for Machine Translation" pptx

Báo cáo khoa học:

Báo cáo khoa học: "Discriminative Modeling of Extraction Sets for Machine Translation" pptx

... Association for Computational LinguisticsDiscriminative Modeling of Extraction Sets for Machine TranslationJohn DeNero and Dan KleinComputer Science DivisionUniversity of California, Berkeley{denero,klein}@cs.berkeley.eduAbstractWe ... sentences.Our extraction set model outperforms both un-supervised and supervised word aligners at pre-dicting word alignments and extraction sets. Wealso demonstrate that extraction sets are useful for end-to-end ... model.2.1 Extraction Sets from Word AlignmentsRule extraction is a standard concept in machine translation: word alignment constellations licenseparticular sets of overlapping rules, from whichsubsets...
  • 11
  • 420
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "THE SPECIFICATION OF TIME MEANING FOR MACHINE TRANSLATION" pot

... syntactic/morphological forms and time meanings, resulting in a non-arbitrary relation between form and meaning. Third, we show how the calculus can be used for the interlingual analysis of the tense forms of ... relevance of the event type of the basic proposition (of. Vendler's distinction of 38 states, activities, accomplishments, achievements). Part of this has already been incorporated in the formalism, ... stead of presenting those extensions me think it more useful to round off this paper with a demonstration of how the calculus can be used for the interlingual analysis of verbal tense forms....
  • 6
  • 359
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Non-Isomorphic Tree Mappings for Machine Translation" pptx

... chart is indexed by nodes of the input tree rather than spans of the input string:51. for each node c of T , in bottom-up order2. for each q ∈ Q, let βc(q) = 03. for each elementary tree ... naturally extend to train on pairs of forests (including packed forests obtained by chart pars-ing). The correct tree is presumed to be an element of the forest. This makes it possible to train ... Probabilistic TSG Formalism For expository reasons (and to fill a gap in the literature),first we formally present non-synchronous TSG. Let Q bea set of states. Let L be a set of labels that may...
  • 4
  • 269
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Discriminative Pruning of Language Models for Chinese Word Segmentation" ppt

... F-Measure of 96.33%, number of bigrams decreases by up to 90%. # of bigrams % of KLD KLD 100,000 100% Step-10K 25,000 25% Step-5K 15,000 15% Step-2K 10,000 10% Table 1. Comparison of Number of ... Num(10K)F-Measure(%)KLD DiscrimStep-10K Step-5KStep-2K Cut-off Figure 5. Performance Comparison of Different Pruning Methods First, we compare the performance of "KLD" and "Discrim". ... kinds of parameters are involved: bigram probability Pm(wy|wx) for seen bigram wxwy in training corpus, unigram probability Pm(w) and backoff coefficient αm(w) for any word w. For...
  • 8
  • 294
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Beam-Search Extraction Algorithm for Comparable Data" pptx

... define the fertility of a source word s as the number of target wordst ∈ T for which p(s|t) > ǫ. Target word cover-age and fertility are defined accordingly. A largenumber of ‘uncovered‘ source ... thenumber of extracted parallel sentence pairssignificantly, which leads to a BLEU im-provement of about 1 % on our Spanish-English data.1 IntroductionThe paper presents a novel algorithm for ex-tracting ... algorithm to a large number of sentences.We abandon target sentences early on during clas-sification if they fall outside the beam. For com-parison purposes, we run our novel extraction al-gorithm...
  • 4
  • 404
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Evaluation of METAL: the LRC Machine Translation System" ppt

... extensive use of transformations to modify structure or perform certain tests. Transformations may be used in the TEST, CONSTR, INTEr, and Transfer phases of the rules, transformations may ... optional enumeration of each constituent); a series of restrictions, which test the appropriateness of individual constituents on the right-hand side of the rule; TESTs, which enforce agreement ... underway. The present staff for the METAL project consists of seven full-ti~e and five half-tlme personnel. Application Environment Software has been developed to handle the formatting problems...
  • 8
  • 374
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Fast Decoding and Optimal Decoding for Machine Translation" doc

... fertility of e ), (the fertility of the NULLword), (the k French word produced by e in a),(the position of in f), (the position of the first fertileword to the left of e in a), (the ceiling of the ... success of any statistical machine translation system. The decoder’s job isto find the translation that is most likelyaccording to set of previously learnedparameters (and a formula for combin-ing ... Definition of the ProblemIf we observe a new sentence f, then an optimaldecoder will search for an e that maximizes P(ef)1The symbols in this formula are: (the length of e),(the length off),...
  • 8
  • 440
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "FUNCTIONAL UNIFICATION GRAMMAR: A FORMALISM FOR MACHINE TRANSLATION" doc

... parts: a formal description of the relevant facts about the language, and an interpreter of the formalism. The formal description is data whereas the interpreter is program. The formal description ... descriptions are independent of the leg of the machine they are used in and the programs are independent of the languages to which they are applied. For all the advantgages of the classical design, ... a class of formal devices that are slowly gaining acceptance in linguistics and which are based on the relations contracted by formal objects rather than by transformations of one formal object...
  • 4
  • 280
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Disambiguating Temporal–Contrastive Discourse Connectives for Machine Translation" docx

... connective word form2. its POS tag3. first word of argument 14. last word of argument 15. first word of argument 26. last word of argument 27. POS tag of the first word of argument 28. type of first ... disambiguation for translation. In addi-tion, we extracted separate training sets for each of the 8 temporal–contrastive connectives in questionand one training set for all them. The number of oc-currences ... experiments. The state of the art for recognizing explicit connectives in English is there-fore already high, at a level of 94% for disambiguat-ing the four main senses on the first level of thePDTB sense...
  • 6
  • 181
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Computing Lattice BLEU Oracle Scores for Machine Translation" potx

... qF}where the first three sets of constraints are the lin-earization of the definition of γw, made possibleby the positivity of Θ1and Θ2, and the last three sets of constraints are the path ... 26 28 30 32 34 36Figure 2: Performance of the LB-4g oracle for differ-ent combinations of p and r on WMT11 de2en task. for matching n-grams. The values of p and r werefound by grid search ... decoding for statistical machine transla-tion. In Proc. of the Conf. on EMNLP, pages 620–629, Stroudsburg, PA, USA.Marco Turchi, Tijl De Bie, and Nello Cristianini.2008. Learning performance of...
  • 10
  • 349
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018chuyên đề điện xoay chiều theo dạngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Chuong 2 nhận dạng rui roBT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)MÔN TRUYỀN THÔNG MARKETING TÍCH HỢP