0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Estimating Class Priors in Domain Adaptation for Word Sense Disambiguation" pdf

Báo cáo khoa học:

Báo cáo khoa học: "Estimating Class Priors in Domain Adaptation for Word Sense Disambiguation" pdf

... predominant sense is often indicativeof a change in domain, as different corpora drawnfrom different domains usually give different pre-dominant senses. For example, the predominant sense ... acrossdifferent domains, estimation of the sense priors (i.e., determining the proportions of the differ-ent senses of a word) occurring in a text corpusdrawn from a domain is important. McCarthy ... proba-bilities, or class membership estimates, for the in- stances in the target domain. These probabilitieswere then used by the machine learning methodsto estimate the sense priors of each word in thetarget...
  • 8
  • 268
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic error detection in the Japanese learners’ English spoken data" pdf

... classes, their root forms, three combinations of these (one preceding word and one following word/ two preceding words and one following word/ one preceding word and two following words), and the ... conducting experiments using our learner corpus, which contains information on learners’ errors. 1 Introduction One of the most important things in keeping up with our current information-driven ... forms, five combinations of these (the targeted word, the one preceding and one following/ the targeted word and the one preceding/ the targeted word and the one following/ the targeted word...
  • 4
  • 293
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Evaluating Response Strategies in a Web-Based Spoken Dialogue Agent" pdf

... included this extra information in its response, we predicted that it would perform better than LT. In Task 3 users were told to find the shortest train within a new departure interval. Since ... functionality, hints for talking to TOOT, and links to 4 task pages. Each task page contained a task scenario, the hints, instructions for calling TOOT, anal a web survey designed to ascertain the ... 10 rains. The second train leaves at 6:30 pm ever), da); and it takes 2 days 11 hours 30 rains. Do you want to continue and find a new set of trains? TOOT is implemented using a platform for...
  • 7
  • 273
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Noun-Phrase Analysis in Unrestricted Text for Information Retrieval" pptx

... improving precision: 1. Phrases can replace individual indexing words. For example, if both "dog" and "hot" are used for indexing, they will match any query in which both words ... useful for book indexing and automatic thesaurus extraction. 1 Introduction 1.1 Information Retrieval Information retrieval (IR) is an important applica- tion area of naturaManguage processing ... to create bet- ter indexing phrases for information re- trieval. In particular, we describe a hy- brid approach to the extraction of mean- ingful (continuous or discontinuous) sub- compounds...
  • 8
  • 289
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Reducing Wrong Labels in Distant Supervision for Relation Extraction" potx

... evalu-ation. In both cases, we used 400,000 articles for testing and the remaining 903,000 for training.7.3.1 Configuration of ClassifiersFollowing Mintz et al. (2009), we used a multi- class logistic classifier ... morethan 20 times in the corpus.7.2.1 EvaluationWe split the data into training data and test data.The training data was Xrs for 12 relations and thetest data was that for the remaining 12 relations. ... training example for each relation. In PROP,we used training articles for pattern prediction.87.3.2 Held-out Evaluation In the held-out evaluation, relation instances dis-covered from testing...
  • 9
  • 381
  • 0
Báo cáo khoa học: Trehalose and anhydrobiosis in tardigrades – evidence for divergence in responses to dehydration ppt

Báo cáo khoa học: Trehalose and anhydrobiosis in tardigrades – evidence for divergence in responses to dehydration ppt

... acetate in 0.15 m NaOH. Following10 min of isocratic elution with A, a linear gradient to100% B within 2 min and an isocratic step with B for 2 min was used for column cleaning, before the ... Bandelin Electronic, Berlin, Germany) in 100 lL of distilled water. After incubating at 95 °C for 60 min the homogenate was centrifuged (20 000 g at 4 °C for 15 min) and the supernatant was used for ... tardigradespecies during drying. Molecular chaperones may beparticularly important in protecting proteins againststress-induced denaturation [54]. In nematodes, as wellas in plants, the induction of...
  • 8
  • 465
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Keyword Extraction using Term-Domain Interdependence for Dictation of Radio News" ppt

... any other domains, domainj seems to be the domain of unit~. The system se- lects the domain which is the largest of all sim- ilarities in N of domains as the domain of the unit (formula (6)) ... vector of each domain is selected as domain of the unit. Finally, the system ex- tracts keywords in each unit using the feature vector of selected domain which is selected by domain identification. ... keyword path for se- lected domain 6 Discussion 6.1 Sorting newspaper articles according to their domains For using X 2 values in feature vectors, we have good result of domain identification...
  • 5
  • 414
  • 1
Báo cáo khoa học:

Báo cáo khoa học: "Information-theoretic Multi-view Domain Adaptation" potx

... co-clustering-based classification (CoCC) for adaptation learning.CoCC was extended from information-theoretic co-clustering (Dhillon et al., 2003), where in- domain constraints were added to word ... largely violated in the setting of domain adapta-tion where training and test data are drawn from dif-ferent distributions.Little research was done for multi-view domain adaptation. In this work, ... Kakade, 2008) is commonwithin a single domain, it is not well studied undercross -domain settings. Chen et al. (2011) proposed270CODA for adaptation based on co-training (Blumand Mitchell, 1998),...
  • 5
  • 275
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Scaling to Very Very Large Corpora for Natural Language Disambiguation" potx

... features employed for this problem: the set of words within a window of the target word, and collocations containing words and/or parts of 1 Thanks to Dan Roth for making both Winnow and Perceptron ... all one billion words were used for training. In order to avoid training biases that may result from merely concatenating the different data sources to form a larger training corpus, we constructed ... But for others, where space comes at a premium, obtaining the gains that come with a billion words of training data may not be viable without an effort made to compress information. In such...
  • 8
  • 265
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Extension of Earley''''s Algorithm for S-Attributed Grammars" pdf

... unification grammars in their respective attribution domains and functions (Correa, forthcoming), and the more general nature of attribute grammars in this regard, it is of interest to investigate ... languages. A language is a set of strings o~,er a finite set T of symbols. A grammar is a formal device for specifying which strings are in the set. In particular, a context-free grammar ... where N is a finite set of string categories; T a finite set of terminal symbols; P a finite set of productions or rewriting rules of the form X ~t~, Xe N, ae (NUT)*; and S a distinguished symbol...
  • 4
  • 266
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Nghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngTìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)BÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ