0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Automatic Acquisition of Named Entity Tagged Corpus from World Wide Web" pot

Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Named Entity Tagged Corpus from World Wide Web" pot

... Automatic Acquisition of Named Entity Tagged Corpus from World Wide WebJoohui AnDept. of CSEPOSTECHPohang, Korea 790-784minnie@postech.ac.krSeungwoo LeeDept. of CSEPOSTECHPohang, ... the con-structed NE tagged corpus, we apply it to a learn-ing of NER system and compare the results with themanually tagged corpus. 2 Automatic Acquisition of an NE Tagged Corpus We only focus ... taggenerationS1(t)S2(t)S3(t)…NE tagged corpus Figure 1: Automatic generation of NE tagged corpus from the websiderations in this marking process because of theword ambiguity and boundary ambiguity of NE in-stances....
  • 4
  • 397
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of English Topic Signatures Based on a Second Language" potx

... mainly from the Mandarin portion of the Chinese Gigaword Corpus (CGC), producedby the LDC3, which contains 1.3GB of newswiretext drawn from Xinhua newspaper. Some Chi-nese translations of English ... instances of the fi-nancial sense of interest. One set was extracted from a hand -tagged corpus (Bruce and Wiebe,1994) and the other by our algorithm.3 Application on WSDTo evaluate the usefulness of ... WSD.The remainder of the paper is organised as fol-lows. Section 2 describes the process of acqui-sition of the topic signatures. Section 3 demon-strates the application of this resource on...
  • 6
  • 471
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Discovery of Named Entity Variants – Grammar-driven Approaches to Non-alphabetical Transliterations" pptx

... Taiwanshukai@gmail.comAbstractIdentification of transliterated names is aparticularly difficult task of Named Entity Recognition (NER), especially in the Chi-nese context. Of all possible variations of transliterated named entities, ... to the automaticextraction of diverging transliterations of foreign named entities by bootstrapping co-occurrence statistics from tagged and seg-mented Chinese corpus. Preliminary experi-ment ... and shows itspotential in NLP applications.1 Introduction Named Entity Recognition (NER) is one of the mostdifficult problems in NLP and Document Under-standing. In the field of Chinese NER,...
  • 4
  • 234
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "AUTOMATIC ACQUISITION OF A LARGE SUBCATEGORIZATION DICTIONARY FROM CORPORA" doc

... be obtained from text corpora, the only research that I am aware of that has dealt directly with the problem of the automatic acquisition of subcategorization frames is a series of papers by ... many of the uses of verbs in a text are captured by our subcate- gorization dictionary. For two randomly selected pieces of text from other parts of the New York Times newswire, a portion of ... discussed by Hearst (1992). SA sample of 100 uses of /n from the New York Times suggests that about 70% of uses are in post- verbal contexts, but, of these, only about 15% are sub- categorized...
  • 8
  • 342
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "AUTOMATIC ACQUISITION OF SUBCATEGORIZATION FRAMES FROM UNTAGGED TEXT" doc

... on the Case Filter of Rouvret and Vergnaud (1980). The completeness of the output list increases monotonically with the total number of occurrences of each verb in the corpus. False positive ... detected so far The SF acquisition program has been tested on a corpus of 2.6 million words of the Wall Street Journal (kindly provided by the Penn Tree Bank project). On this corpus, it makes 5101 ... is evaluated in terms of efficiency and accuracy. The most useful estimate of effi- ciency is simply the density of observations in the corpus, shown in the first column of Table 3. The SF...
  • 6
  • 416
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Ranked Qualia Structures from the Web" potx

... PatternSingular“a(x) x is made up of ” NPQTis made up of NP’C“a(x) x is made of NPQTis made of NP’C“a(x) x comprises” NPQTcomprises (of) ? NP’C“a(x) x consists of NPQTconsists of NP’CPlural“p(x) ... NP’CPlural“p(x) are made up of ” NPQTis made up of NP’C“p(x) are made of NPQTare made of NP’C“p(x) comprise” NPQTcomprise (of) ? NP’C“p(x) consist of NPQTconsist of NP’CTable 2: Clues ... a fixednumber of basic components”, ”data mining com-prises a range of data analysis techniques”, ”booksconsist of a series of dots”, or ”a conversation ismade up of a series of observable...
  • 8
  • 378
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Adjectival Subcategorization from Corpora" docx

... Proceedings of the 43rd Annual Meeting of the ACL, pages 614–621,Ann Arbor, June 2005.c2005 Association for Computational LinguisticsAutomatic Acquisition of Adjectival Subcategorization from CorporaJeremy ... acquisition. 1 IntroductionResearch into automatic acquisition of lexical in-formation from large repositories of unannotatedtext (such as the web, corpora of published text,etc.) is starting to produce ... enhancing the performance of ∗Part of this research was conducted while this author wasat the University of Edinburgh Laboratory for Foundations of Computer Science.state -of- art statistical systems...
  • 8
  • 390
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Language Model based on Head-Dependent Relation between Words" pdf

... (DEP) on a raw corpus extracted from KAIST corpus 3. The raw corpus consists of 1,589 sentences with 13,139 words, describing animal life in nature. We randomly divided the corpus into two ... Given a training corpus, the initial grammar is just a list of all pairs of unique words in the corpus. The initial pairs represent the ten- tative head-dependent relations of the words. And ... Institute of Science and Technology) corpus has been under construction since 1994. It consists of raw text collection(45,000,000 words), POS -tagged collection(6,750,000 words), and tree-tagged...
  • 5
  • 334
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "AUTOMATIC ACQUISITION OF THE LEXICAL SEMANTICS OF VERBS FROM SENTENCE FRAMES*" doc

... AUTOMATIC ACQUISITION OF THE LEXICAL SEMANTICS OF VERBS FROM SENTENCE FRAMES* Mort Webster and Mitch Marcus Department of Computer and Information Science University of Pennsylvania ... thank Beth Levin and the anonymotm reviewers of this paper for many helpful com- ments. We ~ b~efit~l greatly from disctumion of issues of verb acquisition in children with Lila Gleitman. ... class of DIE, one of the toplevel verb classes. Next, suppose it sees (7) John broke the window. and sees from observation that the referent of "John" is an agent, the referent of...
  • 8
  • 317
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of Script Knowledge from a Text Collection" docx

... Automatic Acquisition of Script Knowledge from a Text CollectionToshiaki FujikiHidetsugu NanbaInterdisciplinary Graduate School of Graduate School of Science and EngineeringInformation ... sequences (pairs) of actions from the text collection.3.Selecting typical sequences.We show the outline of our method in Figure1, where the process of automatic acquisition of script knowledge related ... objects. A 'pair of actions'consists of two actions that occur in time order. A'sequence of actions' can be defined as a transitiveclosure of all the pairs of actions.1. Cases...
  • 4
  • 351
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnbáo cáo khoa học về cá trabáo cáo khoa học nghiên cứu chôm chômtrạng thái hiện sinh báo cáo khoa họcbiểu tượng văn học báo cáo khoa họctài liệu báo cáo khoa họccách trình bày báo cáo khoa họcbáo cáo khoa học toán họccách làm báo cáo khoa họctrình bày báo cáo khoa họcBáo cáo quy trình mua hàng CT CP Công Nghệ NPVchuyên đề điện xoay chiều theo dạngNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thơ nôm tứ tuyệt trào phúng hồ xuân hươngBT Tieng anh 6 UNIT 2chuong 1 tong quan quan tri rui roGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015MÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ