0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Learning Transliteration Lexicons from the Web" pptx

Báo cáo khoa học:

Báo cáo khoa học: "Learning Transliteration Lexicons from the Web" pptx

... labeling. At the same time, we select samples of high confidence score from the rest and consider them correct E-C pairs. We then merge the labeled set with the high-confidence set in the PSM ... pairs from the Web at the same time. Conceptually, the adaptive learning is carried out as follows. We obtain bilingual snippets from the Web by iteratively submitting queries to the Web ... resulting from automatic speech recognition to bootstrap an initial PSM model. The task of labeling samples is basically to distinguish the qualified transliteration pairs from the rest. Unlike the...
  • 8
  • 341
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Constructing Transliteration Lexicons from Web Corpora" docx

... collected manually. One of the most important attributes of these term pairs is that the numbers of syllables in the source-language term and the target-language term are equal. The syllables of both ... are produced or until other criteria are met. The conversions used in the last round of the training phase are then used to extract large-scale transliterated-term pairs from query results. Two ... analyzes on the performance achieved by the extraction. Conclusions are drawn in Section 5. 2. The Proposed Approach An algorithm based on minimizing the edit distance between words with the same...
  • 4
  • 218
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Bilingual Lexicons from Monolingual Corpora" pot

... than any other word. Evaluat-ing against the union of these lexicons yielded 98.0p0.33, a significant improvement over the 92.3 us-ing only the Wiktionary lexicon. Of the true errors, the most ... corpora are from dif-ferent domains. Nonetheless, even in the more diffi-cult cases, a sizable set of high-precision translationscan be extracted. As an example of the performanceof the system, ... need to generate the observed feature vectorsof the source and target word types, fS(si) ∈ RdSand fT(tj) ∈ RdT. The feature vector of each wordtype is computed from the appropriate...
  • 9
  • 300
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Mining Parenthetical Translations from the Web by Word Alignment" potx

... pairs, where the translation of the in-parenthesis terms is a suffix of the pre-parenthesis text. The lengths and frequency counts of the suffixes have been used to determine what is the translation ... our modified version of the competitive link-ing algorithm, the link score of a pair of words is the sum of the φ2 scores of the words themselves, their prefixes and their suffixes. In addition ... C ≥ 2 E + K, where C is the length of the Chinese text, E is the length of the English text in the parentheses and K is a constant (we used K=6 in our experiments). The lengths C and E are...
  • 9
  • 612
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Extracting Hypernym Pairs from the Web" potx

... hypernym relations from the web. Wecompare our approach with hypernym ex-traction from morphological clues and from large text corpora. We show that the abun-dance of available data on the web enablesobtaining ... A, B and C are siblings of each otherHere, sibling refers to the relative position of the words in the hypernymy tree. Two words are sib-lings of each other if they share a parent.We compute ... WordNets are complete for the terms that they contain. This means that if twowords are present in the lexicon without the targetrelation being specified between them, then we as-sume that this...
  • 4
  • 395
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Event Durations from Event Descriptions" docx

... and the head of its object are extracted from the parse trees generated by the CONTEX parser. Similarly to the local context features, for both the subject head and the object head, their ... or object of the verb is plural. In “Iraq has destroyed its long-range missiles”, there is the time it takes to destroy one missile and the duration of the interval in which all the individ-ual ... )(1)()(EPEPAP−−=κ P(A) is the observed agreement among the an-notators, and P(E) is the expected agreement, which is the probability that the annotators agree by chance. In order to compute the kappa statistic...
  • 8
  • 381
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Common Grammar from Multilingual Corpus" potx

... αφArepresent the param-eters of a common grammar. We use the Dirichletprior because it is the conjugate prior for the multi-nomial distribution. In summary, the proposedmodel assumes the following ... eachlanguage is generated from a general model thatare common across languages, and each sentencein multilingual corpora is generated from the lan-guage dependent PCFG. The inference of the gen-eral ... andinfer them by point estimation instead of distribu-tion estimation. We find an approximate posteriordistribution that minimizes the Kullback-Leiblerdivergence from the true posterior. The variationaldistribution...
  • 5
  • 326
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Semantic Links from a Corpus of Parallel Temporal and Causal Relations" doc

... is the number of times the wordappeared in the keyword’s pattern, and N(w) is the number of times the word was in the corpus. The following features were derived from these scores:• Whether the ... 2008).Annotators used the labels:BEFORE The first event fully precedes the secondAFTER The second event fully precedes the firstNO-REL Neither event clearly precedes the otherOur causal annotation guidelines ... part-of-speech tags in the verb phrases of each event, e.g. took, take, VBDand began, to, trade, begin, trade, VBD,TO,VB.• The syntactic paths from the first event to the common ancestor to the second event,...
  • 4
  • 363
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Semantic Categories from Clickthrough Logs" pdf

... “singapore,” and thus the labelof “singapore” will be propagated to the pattern.On the other hand, the pattern “♯ map” is a neu-tral pattern which co-occurs with terms other than the Travel domain ... arepatterns. The strength of lines indicates related-ness between each node. The darker a node, the more likely it belongs to the Travel domain. Start-ing from “singapore,” the pattern “♯ ... whichsearch users click when they see the result oftheir search. The intentions of two distinct searchqueries are likely to be similar, if not identical,when they have the same clickthrough. Searchclickthrough...
  • 4
  • 316
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Tense Translation from Bilingual Corpora" docx

... state in VC-mode records the verb form expected by Vii n (n + 1), the infinite verb form of the last verb encountered (rn), and the verb form expected by the VC verb, if the VC consists of only ... + 1). So there are m • (n + 1) 2 states. As soon as a non-verb is encountered in VC-mode or the verb form of the previous verb does not fit the subcategorization requirements of the current ... (similar to the English auxiliary do). 3.5 Alignment Results The domain biases the corpus towards the fu- ture. So only 5 out of 6 German tenses and 12 out of 16 English tenses occurred in the...
  • 5
  • 279
  • 0

Xem thêm

Từ khóa: Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVchuyên đề điện xoay chiều theo dạngNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát hiện xâm nhập dựa trên thuật toán k meansTìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXQuản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ