0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "A Method for Effective and Scalable Mining of Named Entity Transliterations from Large Comparable Corpora" doc

Báo cáo khoa học:

Báo cáo khoa học: "A Method for Effective and Scalable Mining of Named Entity Transliterations from Large Comparable Corpora" doc

... In this paper, we detail an effective and scala-ble mining method, called MINT (MIning Named- entity Transliteration equivalents), for mining of NETEs from large comparable corpo-ra. MINT addresses ... Method for Effective and Scalable Mining of Named Entity Transliterations from Large Comparable Corpora Raghavendra Udupa K Saravanan A Kumaran Jagadeesh Jagarlamudi* Microsoft Research India ... accuracy of their transliterations is shown to correlate highly with the performance of the CLIR systems (Mandl and Womser-Hacker, 2005, Xu and Weischedel, 2005). Traditional methods for transliterations...
  • 9
  • 358
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Method for Measuring Machine Translation Confidence" docx

... other information such as on the right hand sidethe next two phrases are “ayda” and “tshyr” or the se-quence of source target POS on the right hand side is“RB VBP”. An example of this type of feature ... outputSourceyoutotallydifferent from zaid amr , and not to deprive yourselfin a basement of imitation and assimilation .We predict and visualizeHuman correctionyou are quite different from zaid and amr , so ... to constant C,the cut-off feature threshold n, and the number of iter-ations. The final weight is typically normalized by thenumber of training iterations and the number of train-ing instances....
  • 9
  • 543
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Method for Correcting Errors in Speech Recognition Using the Statistical Features of Character Co-occurrence" pptx

... length of a string, therefore obtaining 16655 strings. 3.2 Two Factors for Evaluation We evaluated the following two factors before and after correction: (1) the counting of errors, and (2) ... Unable to understand, and unable to imagine the actual utterance. 4. Results and Discussions 4.1 Decrease in the Number of Errors Table 4-1 shows the number of errors before and after correction. ... method is effective in improving the understanding of the recognition results. On the other hand, there were four level-down cases. Three of these cases were caused by the misdetection of...
  • 5
  • 588
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Method for Relating Multiple Newspaper Articles by Using Graphs, and Its Application to Webcasting" pptx

... describes methods for relating (thread- ing) multiple newspaper articles, and for visualizing various characteristics of them by using a directed graph. A set of articles is represented by a set of ... Introduction The vast quantity of information available today makes it difficult to search for and understand the information that we want. If there are many related documents about a topic, it ... lem of information overloading, but the articles they provide do not have links, or else must be manually linked at a high cost in terms of time and effort. This paper describes methods for...
  • 7
  • 419
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Method for Word Sense Disambiguation of Unrestricted Text" potx

... sense of one of the words. Pick one of the words, say W2, and using WordNet, form a similarity list for each sense of that word. For this, use the words from the synset of each sense and the ... word-word co- occurrences and (2)WordNet for measuring the semantic density for a pair of words. We report an average accuracy of 80% for the first ranked sense, and 91% for the first two ranked ... Internet and rank the senses W~ (s). A search performed on the Internet for each set of pairs as defined above, results in a value indicating the frequency of occurrences for Wl and the sense of...
  • 7
  • 378
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "a Method for Automatic Evaluation of Machine Translation" pot

... phe-nomenon, and not an artifact of a few toy examples.The primary programming task for a BLEU imple-mentor is to compare n-grams of the candidate withthe n-grams of the reference translation and countthe ... n-gramcounts for all the candidate sentences and divide bythe number of candidate n-grams in the test corpusto compute a modified precision score,pn, for theentire test corpus.pn=∑C ∈{Candidates}∑n-gram∈CCountclip(n-gram)∑C∈{Candidates}∑n-gram∈CCount(n-gram).4BLEU ... sub-set extracted at random from our 500 sentence testcorpus. We paired each source sentence with each of its 5 translations, for a total of 250 pairs of Chi-nese source and English translations....
  • 8
  • 336
  • 0
Tài liệu Báo cáo khoa học: A role for the intersubunit disulfides of seminal RNase in the mechanism of its antitumor action docx

Tài liệu Báo cáo khoa học: A role for the intersubunit disulfides of seminal RNase in the mechanism of its antitumor action docx

... isoforms, isoenzymes, monomeric forms;assay for selective cytotoxicity of the enzyme. Methods Enzymol.341, 248–263.13. Kunitz, M. (1946) A spectrophotometric method for the meas-urement of ... in the presence of 10 mMIAM, or (C) of 50 mMIAM. D and M mark the elution volumes of BS-RNase and monomeric BS-RNase, respectively.Ó FEBS 2003 Disulfides and antitumor action of BS-RNase (Eur. ... concentrations of PM. Inset, autoradiographic scans of the SDS/PAGE runs of 125I-labelled MSSAE detached by high salt from PM. D and M mark the electrophoretic mobilities of BS-RNase and monomeric...
  • 8
  • 604
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "a system for tutoring and computational linguistics experimentation" pptx

... present was built toserve as a platform for research in computationallinguistics and tutoring, and can be used for task-based evaluation of algorithms developed for otherdomains. We are currently ... scaffolding and potentially suggesting additional problems.The disadvantage is a lack of adaptivity and gen-erality: students often get the same remediation for the same error regardless of their ... algorithms to detect and recover from misun-derstandings.In dialogue management and generation, thekey issue we are planning to investigate is that of linguistic alignment. The analysis of the data...
  • 6
  • 492
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A TOOL FOR THE AUTOMATIC CREATION, EXTENSION OF LEXICAL KNOWLEDGE" pdf

... cal boundaries of the citation form and the inflected forms, and of the forms derived from these inflected forms, and so on rccursively. Our present understandi~ of Dutch morphophonology has ... morpho-syntactic codes of the verb form werkte (worked). (Records for citation forms contain pointers to the different forms belonging to their para- digm, and information relevant to all forms of a para- ... to a uniform representation of objects and their associated information. KRS has an explicit notion of meaning: each con- cept has a referent (comparable to the notion of ~on) and may have...
  • 5
  • 467
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Self-Training for Enhancement and Domain Adaptation of Statistical Parsers Trained on Small Datasets" ppt

... 2006b).The test and training sections consist of sentences from all of the genres that form the corpus. Thetraining division consists of 90% (9 of each 10 con-secutive sentences) of the data, and the ... create.Furthermore, the performance of these parsers de-creases as the distance between the genres of theirtraining and test data increases. Therefore, enhanc-ing the performance of parsers when trained ... four experi-ments, examining all combinations of in-domain and out -of- domain seed and self-training data.Our results show that self-training is of substantialbenefit for the problem. In particular,...
  • 8
  • 424
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnNghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Định tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Tìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Kiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Quản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)Đổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt nam