0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "AUTOMATIC ACQUISITION OF A LARGE SUBCATEGORIZATION DICTIONARY FROM CORPORA" doc

Báo cáo khoa học:

Báo cáo khoa học: "AUTOMATIC ACQUISITION OF A LARGE SUBCATEGORIZATION DICTIONARY FROM CORPORA" doc

... computer manuals. 3. Hand-coded lists are expensive to make, and in- variably incomplete. 4. A subcategorization dictionary obtained auto- matically from corpora can be updated quickly and easily ... learning a foreign language. A subcategorization frame is a statement of what types of syntactic arguments a verb (or ad- jective) takes, such as objects, infinitives, that- clauses, participial ... growth of the subcategorization dictionary can be had from Table 1. Table 1. Growth of subcategorization dictionary Words Verbs in Subcats Subcats Processed subcat learned learned (million) dictionary...
  • 8
  • 342
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Named Entity Tagged Corpus from World Wide Web" pot

... learning approach, which is moreattractive because it is trainable and adaptable, andsubsequently the porting of a machine learning sys-tem to another domain is much easier than that of a rule-based ... procedures and NE instances arefinally annotated with the appropriate NE categories.This automatically tagged corpus may have lowerquality than the manually tagged ones but its sizecan be almost ... 83.43Manual + Automatic 82.03 85.94 83.99Table 2: Performance of the decision list learningGenerally, the accuracy of automatically created NEtagged corpus is worse than that of hand-made cor-pus....
  • 4
  • 397
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of English Topic Signatures Based on a Second Language" potx

... sense-tagged corpus,the TWA Sense Tagged Data Set, manually pro-duced by Rada Mihalcea and Li Yang (Mihalcea,2003), from text drawn from the British NationalCorpus. We calculated a ‘supervised’ ... of the most influential newspaperin mainland China. It maintains a vast database of news stories, available to search by the public.Among other reasons, we chose this website be-cause its articles ... "interest"Table 1 :A sample of our topic signatures. Signature M wasextracted from a manually-sense-tagged corpus and A wasproduced by our algorithm. Words occurring in both A andM are marked in...
  • 6
  • 471
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Script Knowledge from a Text Collection" docx

... first explainwhat we mean by 'action', 'pair of actions', and'sequence of actions' in this paper. In this work,an action is defined as a tuple of a transitive ... Forexample, when we go to a restaurant, we usually'enter the restaurant', 'wait', 'sit down', 'get themenu and decide what to eat', 'order the dish','wait ... Institute of Technology4259 Nagatsuta-cho, Midori-ku,Yokohama, JAPANHiroshima City University3-4-1 Otsukahigashi,Asaminami-ku, Hiroshima,Manabu OkumuraPrecision and IntelligenceLaboratoryTokyo...
  • 4
  • 351
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "AUTOMATIC ACQUISITION OF SUBCATEGORIZATION FRAMES FROM UNTAGGED TEXT" doc

... AUTOMATIC ACQUISITION OF SUBCATEGORIZATION FRAMES FROM UNTAGGED TEXT Michael R. Brent MIT AI Lab 545 Technology Square Cambridge, Massachusetts 02139 michael@ai.mit.edu ABSTRACT This ... immediately to the right of a main verb. Adverbs and adverbial phrases (including days and dates) are ignored for the pur- poses of case adjacency. A noun-phrase that sat- isfies the Case Filter ... extracting lexical and especially collocational information from text has risen dra- matically in the last two years, as sufficiently large corpora and sufficiently cheap computation have...
  • 6
  • 416
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Ranked Qualia Structures from the Web" potx

... explore the impact of qualia struc-tures for natural language processing at a larger scale. The approach builds on ear-lier work based on the idea of matching spe-cific lexico-syntactic patterns conveying ... easier to validateexisting qualia structures than to create them from scratch, which already corroborates the usefulness of our automatic approach. The qualia structure foreach of the 10 randomly ... used. We present a quanti-tative evaluation of our approach and a comparison of the different ranking measures with respect to thisgold standard. Finally, we also provide an evaluationin which...
  • 8
  • 378
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Adjectival Subcategorization from Corpora" docx

... Proceedings of the 43rd Annual Meeting of the ACL, pages 614–621,Ann Arbor, June 2005.c2005 Association for Computational LinguisticsAutomatic Acquisition of Adjectival Subcategorization from CorporaJeremy ... recallrate. A new tool for linguistic annotation of SCFs in corpus data is also introducedwhich can considerably alleviate the pro-cess of obtaining training and test data for subcategorization acquisition. 1 ... into acquisition of verb subcategorization, we are notaware of any systems built for adjectives. Al-though adjectives are syntactically less multivalentthan verbs, and although verb subcategorization...
  • 8
  • 390
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Language Model based on Head-Dependent Relation between Words" pdf

... which is a key part of many natural language applications such as speech recognition and statistical ma- chine translation. In this paper, we present a language modeling based on a kind of simple ... associate a priori prob- ability to a sentence. It is a key part of many natural language applications such as speech recognition and statistical machine translation. Previous works for language ... dependency grammar. The grammar consists of head-dependent relations between words and can be learned automatically from a raw corpus using the reestimation algorithm which is also introduced...
  • 5
  • 334
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic construction of a hypernym-labeled noun hierarchy from text" docx

... would initially require a 50,000 x 50,000 array of values (or a trian- gular array of about half this size). With our current hardware, the largest array we can comfortably handle is about 100 ... they approximated this data by just looking at the nearest NP on each side of a particular NP. Roark and Charniak (1998) built on that work by actu- ally using conjunction and appositive data ... collected from the Wall Street Jour- nal corpus. Some of the data comes from the parsed files 2-21 of the Wall Street Journal Penn Treebank corpus (Marcus et al., 1993), and additional parsed...
  • 7
  • 418
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Induction of a CCG Grammar for Turkish" pptx

... Combinatory Categorial GrammarCombinatory Categorial Grammar (Ades and Steed-man, 1982; Steedman, 2000) is an extension tothe classical Categorial Grammar (CG) of Aj-dukiewicz (1935) and Bar-Hillel ... is added from “araba” to “uyudu˘gum”to emphasize that the predicate is intransitive and itmay have a locative adjunct. Similarly, a T.OBJECTlink is added from “kitap” to “okudu˘gum”. Similarlabels ... Principle of Head Categorial Uniqueness,heuristics to detect subordination and extraction playan important role.(8) Kitabı okuyan adam uyudu.Book+ACC read+PRESPART man slept.The man who read the...
  • 6
  • 373
  • 0

Xem thêm

Từ khóa: Báo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Nghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếTìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThơ nôm tứ tuyệt trào phúng hồ xuân hươngTăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Nguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)TÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ