0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "An Unsupervised System for Identifying English Inclusions in German Text" doc

Báo cáo khoa học:

Báo cáo khoa học: "An Unsupervised System for Identifying English Inclusions in German Text" doc

... Proceedings of the ACL Student Research Workshop, pages 133–138,Ann Arbor, Michigan, June 2005.c2005 Association for Computational LinguisticsAn Unsupervised System for Identifying English Inclusions ... German or English. The pipeline is composed ofa pre-processing module for tokenisation and POS-tagging as well as a lexicon lookup and Googlelookup module for identifying English inclusions. 4.1 ... low for all 3 domains and very poor for the EUdata. This confirms that the identification of English inclusions is more difficult for this domain, coincid-ing with the result of the lookup system. ...
  • 6
  • 333
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An annotation scheme for discourse-level argumentation in research articles" doc

... Pedersen, and Francine Chen. 1995. A trainable document summarizer. In Pro- ceedings of the 18th ACM-SIGIR Conference, Asso- ciation for Computing Machinery, Special Interest Group Information Retrieval, ... not experts in all of the sub- domains of the papers they annotated. The anno- tators went through a substantial amount of train- ing, including the reading of coding instructions for the two ... add considerable value to the information contained in the training material. Study III tries to answer the question whether the considerable training effort used in Studies I and II can be...
  • 8
  • 396
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An Unsupervised Model for Joint Phrase Alignment and Extraction" ppt

... Dan Klein. 2010. Discriminative mod-eling of extraction setsfor machine translation. In Pro-ceedings of the 48th AnnualMeeting of the Association for Computational Linguistics, pages 1453–1463.John ... number of words in each corpus for TM andLM training, tuning, and testing.7.1 Experimental SetupThe data for French, German, and Spanish are fromthe 2010 Workshop on Statistical Machine Transla-tion ... training reg-imen up to Model 4, and combine alignmentswith grow-diag-final-and. For the proposedmodels, we train for 100 iterations, and use the finalsample acquired at the end of the training...
  • 10
  • 641
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Unsupervised Model for Statistically Determining Coordinate Phrase Attachment" pptx

... backed-off model in [MG, in prep] trained on only 1380 train- ing phrases. The training corpus used in the study presented here consisted of 119629 train- ing phrases. Reducing this figure ... It is interesting to note that after reducing the volume of training data by half there was no drop in accuracy. In fact, accuracy remained exactly the same as the volume of data was in- creased ... ambiguous thereby invalidating it as an unambiguous train- ing example. By including annotated training data from the TreeBank set, this model could be modified to become a partially-unsupervised...
  • 5
  • 217
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "AN EXPERT SYSTEM FOR THE PRODUCTION OF PHONEME STRINGS FROM UNMARKED ENGLISH TEXT USING MACHINE-INDUCED RULES" pdf

... ~. Traininm Mode When UTTER is operating in training mode, the system allows the user to correct errors in transcription interactively by specifying the proper pronunciation for the incorrectly ... combinations of feature values should reduce the number of iterations required in the inference routine by eliminating redundant entries in the training set. This type of training set pruning ... time consuming process of running text through UTTER in training mode. An (2) Features are extracted for each of the entries in the training set. Features which cannot be extracted in isolation,...
  • 8
  • 493
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Online System for Corpus Management and Analysis in Support of Computing in the Humanities" pot

... as an initial set of applications whichare offered by the system. 1 IntroductionSince there is an ongoing shift towards computerbased studies in the humanities new challenges in maintaining ... like downloading a docu-ment for example. The Master Data include infor-mation about all objects managed by the system, for example users, groups, documents, resourcesand their interrelations. ... Frankfurt am Main,2Universit¨at BielefeldAbstractThis paper introduces eHumanities Desk-top- an online system for corpus manage-ment and analysis in support of Comput-ing in the Humanities....
  • 4
  • 338
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "AN INTERNATIONAL DELPHI POLL ON FUTURE TRENDS IN "INFORMATION LINGUISTICS"" doc

... Automatic Indexing by Syntactic Analysis in3 Improvement of Automatic Indexing by Semantic Approaches in4 Probabilistic Methods of Indexing in5 Indexing Functions in6 Automatic Indexing of ... participants are mainly involved in research (defined as: basic groundwork, mainly of theoretical interest, experimental environment) or in applica- tion/development (defined as: mainly of interest ... 8.9 2 3.6 indust, administ. - I I .8 puolic administration 8 8.9 4 7.1 public inf. systems 3 3.3 2 3.6 Most of the work in information linguistics so far has concentrated on English ~generally...
  • 6
  • 277
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Estimate of Referent of Noun Phrases in Japanese Sentences" docx

... ITTA. Indefinite noun phrase An indefinite noun phrase denotes an arbitrary member of the class of the noun phrase. For example, "INU(dog)" in the following sentence is an indefinite ... of noun phrases in determining the referents of noun phrases. As a result, on training sentences we ob- tained a precision rate of 82% and a recall rate of 85% in the determination of the referents ... us- ing heuristic rules which are made from information such as the three constraints mentioned in Section 3. Using these rules, our system takes possible referents and gives them points....
  • 5
  • 407
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Unsupervised Morpheme-Based HMM for Hebrew Morphological Disambiguation" pdf

... 2.4 (in contrast to 1.4 for En-glish). In Hebrew, several morphemes combine intoa single word in both agglutinative and fusionalways. This results in a potentially high number oftags for each ... the performancesof the baseline tagger used by Habash and Ram-bow – which selects the most frequent tag for agiven word in the training corpus – for Hebrew andArabic, shows some intriguing differences: ... trained individ-ually (such as training a language model from awritten corpus, and training the phones model for each word type, given transcripted wave file), andthen combined together (in...
  • 8
  • 309
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "an Unsupervised Web Relation Extraction System" pot

... patterns. 1 Introduction The most common preprocessing technique for text mining is information extraction (IE). It is defined as the task of extracting knowledge out of textual documents. In general, ... massive hu-man effort and hence prevent information extrac-tion from becoming more widely applicable. In order to minimize the huge manual effort in- volved with building information extraction ... but not eliminated hand-tagged training. Snowball (Agichtein and Gravano 2000) is an unsupervised system for learning relations from document collections. The system takes as input a set...
  • 8
  • 253
  • 0

Xem thêm

Từ khóa: Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát hiện xâm nhập dựa trên thuật toán k meansThơ nôm tứ tuyệt trào phúng hồ xuân hươngKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Quản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)BT Tieng anh 6 UNIT 2Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Nguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)Chiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015MÔN TRUYỀN THÔNG MARKETING TÍCH HỢP