0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Left-to-Right Target Generation for Hierarchical Phrase-based Translation" doc

Báo cáo khoa học:

Báo cáo khoa học: "Applying Morphology Generation Models to Machine Translation" docx

... achieved performance of the model im-proved; the best performance achieved by Method 2is .63 points higher than the performance of Method1. We should note that the oracle performance for Method ... Thus we do not need to do anything furtherto obtain input of the form necessary for applicationof the inflection model. For the phrase-based system, we generated theannotations needed by first ... chosen for Russian and as seen in Table 5, (n=2) were chosen for Arabic for this method.5.2 Method 2In this method, the base MT system is trained to pro-duce sequences of stems in the target...
  • 9
  • 416
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Randomised Language Modelling for Statistical Machine Translation" doc

... 1) for j = 1 to qc(x) do for i = 1 to k dohi(x) ← hash of event {x, j} under hiBF[hi(x)] ← 1end for end for end for return BF3.1 Log-frequency Bloom filterThe efficiency of our scheme for ... bound on qc(x) ∈ Strain for j = 1 to M AXQCOUNT do for i = 1 to k dohi(x) ← hash of event {x, j} under hiif BF[hi(x)] = 0 thenreturn j − 1end ifend for end for The probability of overestimating ... 3-grams,the actual error rate of the former is lower for mod-els with less memory. By testing for 2-grams priorto querying for the 3-grams, we can avoid perform-ing some queries that may otherwise have...
  • 8
  • 268
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Measure Word Generation for English-Chinese SMT Systems" ppt

... target information during the measure word generation process. We do not integrate our measure word generation module into the SMT decoder since there is only little target contextual information ... of Formula (3) involves the fea-tures listed in Table 2 where the Mo-ME model only employs target features and the Bi-ME model leverages both target features and source features. For target ... can heuristically identify head words for sub-trees. For the bilingual corpus, we also per-form word alignment to get correspondences be-tween source and target words. Then, the colloca-tion...
  • 8
  • 287
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bilingual Sense Similarity for Statistical Machine Translation" ppt

... a hierarchical phrase-based SMT system as our baseline; thus, the units involved in computation of sense similarities are hierar-chical rules. 2 Hierarchical phrase-based MT system The hierarchical ... in SMT for translation selection. However, WSD techniques for SMT do so indirectly, using source-side context to help select a particular translation for a source rule. source target ... combination over target features. That is to say, given a source feature weight for fi, each target feature weight is linked to it with some probability. So that we can calculate a transformed vector...
  • 10
  • 594
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Web-Scale Features for Full-Scale Parsing" doc

... errorreduction. Results are for dependency parsing on the dev set for iters:5,training-k:1.tal errors break down by gold head. For example,the 12.1% total error reduction for attachments of anIN ... leave, inhave NN IN time, for some NN IN money, for annual NNS IN reports, onTable 8: The highest-weight features (thresholded at a count of400) of the before-word schema for a noun head and prepositionargument ... n-grams of the form cha, hca,and hac. Aggregating over all h and a (of a givenPOS pair), we determine which context words c aremost frequent in each position. For example, for h =raising...
  • 10
  • 450
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Headline Generation using Character Cross-Correlation" doc

... probabilistic model for headline generation in which they divide head-line generation process into two steps; namely the step of distilling the information source from the observation of a document and ... 0.17252 for the same set of documents. 1 Introduction A headline is considered as a condensed summary of a document. It can be classified as the acme of text summarization. The necessity for ... step of generat-ing a title from the estimated information source, but it was for English documents. 1.1 Headline Length One of the tasks of the Document Understanding Conference of 2004 (DUC...
  • 5
  • 614
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Re-Usable Tools for Precision Machine Translation∗" pdf

... Boks 1080 Blindern; 0316 Oslo (Norway)♠Center for the Study of Language and Information, Stanford, CA 94305 (USA){ jtl@ifi.uio.no| oe@csli.stanford.edu}AbstractThe LOGON MT demonstrator assemblesindependently ... Norwegian Research Council program for building national infrastructure for languagetechnology (Fenstad et al., 2006). It is the goal for the program as well as for the project to in-clude various ... combination of di-verse grammatical frameworks, viz. LFG for Nor-wegian analysis and HPSG for English generation. While an in-depth introduction to MRS (for MT)is beyond the scope of this project note,...
  • 4
  • 448
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A CONNECTIONIST PARSER FOR STRUCTURE UNIFICATION GRAMMAR" docx

... grouping of information, thus expressing the information in- terdependencies. The language which SUG pro- vides for specifying these descriptions allows par- tiality both in the information about ... thereby also forgetting the predications over the nodes. This forgetting operation abstracts away from the existence of the forgotten node in the phrase structure. Once a node is forgotten it ... Unification Grammar is a formaliza- tion of accumulating information about the phrase structure of a sentence until this structure is com- pletely described. This information is specified in...
  • 8
  • 427
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Incremental Parsing Models for Dialog Task Structure" doc

... to improvedperformance for any method. One utterance ofcontext is best for shift-reduce and start-join; threeis best for the connection path method. The shift-reduce method performs the best. ... historyNbestFstart!completeconnection!pathsshift!reduceFigure 5: Performance of parse-based methods for subtask tree buildingFigure 5 shows the performance of the differentmethods for determining the subtask tree of the ... catalogordering domain that has been annotated for dialogacts and task/subtask information. We show thatall these methods outperform a baseline method for recovering the dialog structure.The rest...
  • 9
  • 467
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "SVD and Clustering for Unsupervised POS Tagging" docx

... map-free information-theoretic criterion—see Gao and Johnson (2008) for details. Although we find M-to-1 to be the most reliable criterion of the three, we include the other two criteria for completeness. ... Table 1 compares the per-formance of SVD2 to other leading models. Fol-lowing Gao and Johnson (2008), the number of induced tags is 17 for PTB17 evaluation and 50 for PTB45 evaluation. Thus, ... NVI scores (Reichart and Rappoport 2009) corres-ponding to the VI scores for SVD2 are 0.938 for PTB17 and 0.885 for PTB45. To examine the sensitivity of the algorithm to its four parameters,...
  • 5
  • 269
  • 0

Xem thêm

Từ khóa: chuyên đề điện xoay chiều theo dạngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Tìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXchuong 1 tong quan quan tri rui roGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015QUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ