0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Using Similarity Scoring To Improve the Bilingual Dictionary for Word Alignment" doc

Báo cáo khoa học:

Báo cáo khoa học: "Using Similarity Scoring To Improve the Bilingual Dictionary for Word Alignment" doc

... example, if the maximumnumber is 2, then a word can align to 0, 1, or 2 wordsin the parallel sentence. In other settings, we en-forced a minimum score in the bilingual dictionary for a link to be ... score of the merged cluster is the aver-age similarity score of the -word cluster, av-eraged with the similarity scores between the single word and all words in the cluster. Thismeans that the ... computed using the following formula:This similarity scoring provides the basis for ournewly built dictionary. The algorithm proceeds asfollows: For any given source language word ,there are target...
  • 8
  • 363
  • 0
Báo cáo khoa học: Using directed evolution to improve the solubility of the C-terminal domain of Escherichia coli aminopeptidase P Implications for metal binding and protein stability pptx

Báo cáo khoa học: Using directed evolution to improve the solubility of the C-terminal domain of Escherichia coli aminopeptidase P Implications for metal binding and protein stability pptx

... and shuffled to produce amutant library, the members of which were then moni-tored for their ability to confer increased TMP resis-tance when fused to DHFR. The genes corresponding to resistant ... close to the N-terminus of the frag-ment ) it lies between the start of the fragment and the predicted start of the domain (Fig. 1). From the round 3 mutants, three were selected for further ... protein. For the native protein, the presence of the N-terminal domain and the oligomeric structure of the protein may be necessary to maintain the structureof the C-terminal domain in a conformation...
  • 10
  • 538
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Using Search-Logs to Improve Query Tagging" potx

... tagger to label the resultsnippets and then transfer the tags to the queries,producing a set of noisy labeled queries. These la-beled queries are then added to the training data and the tagger ... strate-gies for selecting which annotation to transfer andfind that using the result that was clicked by the usergives comparable performance to using just the topresult or to aggregating over the top-k ... sentences andalso the automatically generated query training set. The simplest way to match query tokens to snip-pet tokens is to allow a query token to match anysnippet token. This can be...
  • 5
  • 237
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Using Anaphora Resolution to Improve Opinion Target Identification in Movie Reviews" docx

... They are gathered and to be presentedin the context of one particular entity (=movie). The context or topic under which it occurs is there-fore typically clear to the reader and is thereforenot ... wewill refer to the configurations using these exten-sions with the numbers attributed to them above.5 Experimental Work To integrate AR in the OM algorithm, we add the antecedents of the pronouns ... al.,2005) is superior to the Person detection of the (MUC6 trained) CogNIAC implementation. Wetherefore filter out Person antecedent candidateswhich the Stanford NER detects for the imper-sonal...
  • 6
  • 477
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Using Deep Morphology to Improve Automatic Error Detection in Arabic Handwriting Recognition" pot

... by the HR system for a given segment scan. The conf is defined hereas the ratio of the number of hypotheses in the N-best list that the word appears in to the total numberof hypotheses. These ... among each other is called the lexeme.A lemma is a particular word form used to represent the lexeme word set – a citation form that standsin for the class (Habash, 2010). For instance, the lemma ... score) is word+ nw N-grams+lem. to the improvements gained in Table 3). The largestimprovement comes with the addition of the bigram(thus introducing context into the model), but the tri-gram...
  • 10
  • 521
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Using comparable corpora to solve problems difficult for human translators" pptx

... properties,nevertheless words in the similarity class tend to follow the POS of the original word, because of the similarity of their contexts of use. Further-more, dictionaries also tend to translate wordsusing ... dis-tributionally words can contain words irrelevant to the source word, we filter them to produce a morereliable similarity class S(s0) using the assump-tion that the similarity classes of similar wordshave ... and further expansionIn the next step we produce a translation class bytranslating all words from the similarity class into the target language using a bilingual dictionary (T (w) for the translation...
  • 8
  • 253
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Multiple Sources to Construct a Sentiment Sensitive Thesaurus for Cross-Domain Sentiment Classification" doc

... withat occur in the review dare set to di, their frequency in d. The subsequent kdimensions that correspond to the top ranked basedentries for the review d are weighted according to their ranking ... co-occurwith the features in the feature vector for the ele-ment v. If there are no features that co-occur withboth u and v, then the relatedness reaches its min-imum value of 0. On the other hand ... unigram or bigram wjin the review d. To find the suitable candidates to expand avector d for the review d, we define a ranking scorescore(ui, d) for each base entry in the thesaurus asfollows:score(ui,...
  • 10
  • 555
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using adaptor grammars to identify synergies in the unsupervised acquisition of linguistic structure" docx

... The category Word is adapted, whichmeans that the grammar learns the words that oc-cur in the training corpus. We present our adap-Sentence → WordsWords → Word Words → Word Words Word → PhonemesPhonemes ... subtree in the parses of the other strings in the training corpus. A final accept-reject step cor-rects for the difference in the probability of the sam-pled tree under the adaptor grammar and the ... except to make the collocation into a single word. 3.2 Unigram morphology adaptor grammarThis section investigates whether learning mor-phology together with word segmentation improves word segmentation...
  • 9
  • 643
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using linguistic principles to recover empty categories" ppt

... However, if the task is to insert empty nodes into a tree, then the method leads both to false positives and to false negatives. Suppose for example that the sentence When do you expect to finish? ... categories) for the insertion of a labeled empty category into the tree (and/or string), and the term resolution for the coindexation of the empty category with its antecedent(s), if any. The term ... functional information such as subject; similar information is accessed by the other rules used in the algorithm. Simple functions to identify passives, etc. are therefore called by the implemented...
  • 8
  • 423
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "USING BRACKETED PARSES TO EVALUATE A GRAMMAR CHECKING APPLICATION" ppt

... characteristics. The length of the sentences ranged between three words and 32 words. The median sentence length was 12 words, and the mean was 13.8 words, s Table 2 shows the aggregated out- comes for the ... hand-bracketed parses to examine both the inter- nal and external performance of a grammar checker. The internal performance refers to the behavior of the underlying system i.e, the toke- nizer, ... aspects of the standard that require deep under- standing, e.g. the stricture against using a word in any sense other than the approved one, or the re- quirement to begin paragraphs with the topic...
  • 8
  • 398
  • 0

Xem thêm

Từ khóa: bao cao khoa hoc ve yeu to anh huong den muc do hai long voi nguoi nop thuebáo cáo khoa họcbáo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnbáo cáo khoa học về cá trabáo cáo khoa học nghiên cứu chôm chômtrạng thái hiện sinh báo cáo khoa họcbiểu tượng văn học báo cáo khoa họctài liệu báo cáo khoa họccách trình bày báo cáo khoa họcbáo cáo khoa học toán họcBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansChuong 2 nhận dạng rui roKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)BÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015