0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Learning Source-Target Surface Patterns for Web-based Terminology Translation" pdf

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Word-Class Lattices for Definition and Hypernym Extraction" doc

... performance (around 60-70% F1-measure) is obtained only for specific do-mains (e.g., an ICT corpus) and patterns (Borg etal., 2009).Only few papers try to cope with the general-ity of patterns ... ratherfrom specific patterns like “X such as Y”. There-fore a direct comparison with these methods is notpossible. Nonetheless, we decided to implementHearst’s patterns for the sake of completeness. ... dataset is also used for training, experiments are performed with 10-fold cross validation. The results show very highprecision for WCL-1, WCL-3 (around 99%) andstar patterns (86%). As expected,...
  • 10
  • 567
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Sub-Word Units for Open Vocabulary Speech Recognition" doc

... likely pronunciation for each word. Itis straightforward to extend to multiple pronunciations by firstsampling a pronunciation for each word and then sampling asegmentation for that pronunciation.8Once ... b ax,d ae n. The latter is more useful for automaticallyrecovering the word’s orthographic form, identify-ing that an OOV was spoken, or improving perfor-mance of a spoken term detection system ... cre-ate sub-word units for a hybrid system. These unitsare variable-length phoneme sequences, although inprinciple our work can be use for other unit types.Previous methods for creating the sub-word...
  • 10
  • 441
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning with Unlabeled Data for Text Categorization Using Bootstrapping and Feature Projection Techniques" doc

... unlabeled data and a small amount of seed information to tell the learner about the specific task. In this paper, we consider seed information in the form of title words associated with categories. ... machine-labeled data. This paper provides solutions for these problems. For the first problem, we employ the bootstrapping framework. For the second, we use the TCFP classifier with robustness ... title words? Maybe unlabeled data don’t have any information for building a text classifier because they do not contain the most important information, their category. Thus we must assign the...
  • 8
  • 443
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Incremental Syntactic Language Models for Phrase-based Translation" pptx

... category for input “meets the”.A sample phrase structure tree is shown beforeand after the right-corner transform in Figures 2and 3. Our parser operates over a right-corner trans-formed probabilistic ... Association for Computational Linguistics, pages 620–631,Portland, Oregon, June 19-24, 2011.c2011 Association for Computational LinguisticsIncremental Syntactic Language Models for Phrase-based ... sen-tences in a similar left-to-right fashion, and aretherefore a good mechanism for incorporat-ing syntax into phrase-based translation. Wegive a formal definition of one such linear-time syntactic...
  • 12
  • 510
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Localized Prediction Model for Statistical Machine Translation" ppt

... blocks for for which.5604 Online Training of Maximum-entropyModelThe local model described in Section 3 leads to the fol-lowing abstract maximum entropy training formulation:(8)In this formulation, ... corresponding to la-bel . The symbol is short-hand for the feature-vector . This formulation is slightly differ-ent from the standard maximum entropy formulation typ-ically encountered in NLP applications, ... (SVM). However, Eq. 8 is moresuitable for non-separable problems (which is often thecase for SMT) since it directly models the conditionalprobability for the candidate labels.A related method...
  • 8
  • 578
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Refined Lexicon Models for Statistical Machine Translation using a Maximum Entropy Approach" pptx

... lexicon models lack from context infor-mation that can be extracted from the same paral-lel corpus. This additional information could be:Simple context information: information ofthe words surrounding ... surrounding the word pair;Syntactic information: part-of-speech in-formation, syntactic constituent, sentencemood;Semantic information: disambiguation in-formation (e.g. from WordNet), cur-rent/previous ... fact that thealgorithm for computing the-best lists is sub-optimal.Table 8: Preliminary translation results for theVerbmobil Test-147 for different contextual infor-mation and different...
  • 8
  • 427
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "ADP based Search Algorithm for Statistical Machine Translation" docx

... additional parameter into the recursion formula for DP. In the following, we will explain this method in detail. 2.3 Recursion Formula for DP In the DP formalism, the search process is described ... little meaningful information or the information is different from the input. Examples for each category are given in Table 3. Table 4 shows the statistics of the translation performance. When ... words we have to force the algorithm to cover all input string positions. Different strategies to solve this problem are possible: For example, we can in- troduce a reward for covering a position,...
  • 8
  • 480
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning to Translate with Multiple Objectives" doc

... recording the set of hypothesesthat maximizeskpkMk(h). For 0.6 < p1≤ 1 weget h = (0.9, 0.1), for p1= 0.6 we get (0.7, 0.6),and for 0 < p1< 0.6 we get (0.4, 0.8). At nosetting ... exponentiated-combinationkpkMk(h)q, for a suitable q > 0, does satisfy necessaryconditions for pareto optimality. However the proper tuning of qis not known a priori. See (Miettinen, 1998) for theorem proofs.3Algorithm ... h∗= shift(L)4: for each h in L do5: if (M(h∗)  M(h)): remove h from L6: else if (M(h)  M(h∗)): remove h from L; seth∗= h7: end for 8: Add h∗to Frontier Set F9: for each h in L...
  • 10
  • 624
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Syntactic Verb Frames Using Graphical Models" doc

... betweenpairs of SCFs) and a mapping from surface framesto the underlying predicate-argument structure. In-formation about verb subcategorization is useful for tasks like information extraction (Cohen and ... that for each verb, ithas an accurate distribution over that inventory. Wetherefore compare the lexicons based on their per-formance on a task that a good SCF lexicon shouldbe useful for: ... Data-driven methods for SCF acquisition can alleviate420these problems by building lexicons tailored tonew domains with less manual effort, and highercoverage and scalability.Unfortunately, high...
  • 10
  • 431
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning to Find Translations and Transliterations on the Web" doc

... system that outperforms previous work. 1 Introduction The phrase translation problem is critical to machine translation, cross-lingual information retrieval, and multilingual terminology (Bian ... translation for a given term, or to supplement a bilingual terminology bank (e.g., adding multilingual titles to existing Wikipedia); alternatively, they can be used as additional training data for ... and transliteration is important for cross-language tasks. For example, Knight and Graehl (1998) describe and evaluate a multi-stage machine translation method for back transliterating English...
  • 5
  • 531
  • 1

Xem thêm

Từ khóa: tài liệu báo cáo khoa họctài liệu báo cáo khoa học bản chất của khủng hoảng kinh tế thế giới pdftài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học công nghệ phục vụ nông nghiệp và phát triển nông thôn các tỉnh phía bắc 2006 2007 tài liệu phục vụ hội nghịbáo cáo khoa học tài chính côngBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Định tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thơ nôm tứ tuyệt trào phúng hồ xuân hươngQuản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)BT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namMÔN TRUYỀN THÔNG MARKETING TÍCH HỢP