0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "ALIGNING A PARALLEL ENGLISH-CHINESE CORPUS STATISTICALLY WITH LEXICAL CRITERIA" doc

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "WebCAGe – A Web-Harvested Corpus Annotated with GermaNet Senses" docx

... perfor-mance of WSD algorithms for languages such asEnglish for which hand-crafted sense-annotatedcorpora have been available (Agirre et al., 2007;Erk and Strapparava, 2012; Mihalcea et al., ... amount of data that canreasonably be annotated by hand.Leacock et al. (1998), Agirre and Lopez de La-calle (2004), and Mihalcea and Moldovan (1999)propose a set of methods for automatic harvestingof ... be language inde-pendent and should be applicable to as manylanguages as possible for which the neces-sary input resources are available.(2) The quality of the automatically generateddata...
  • 10
  • 419
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "ALIGNING A PARALLEL ENGLISH-CHINESE CORPUS STATISTICALLY WITH LEXICAL CRITERIA" doc

... available in machine-readable form. We have obtained and converted these materials by special arrangement. The materials contain high-quality literal translation. Statements in LegCo may ... be made using either English or Cantonese, and are tran- scribed in the original language. A translation to the other language is made later to yield com- plete parallel texts, with annotations ... ments, given a pair of parallel texts. Formally, 2Cantonese is one of the four major Han Chinese languages. Formal written Cantonese employs the same characters as Mandarin, with some additions....
  • 8
  • 339
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Collecting a Why-question corpus for development and evaluation of an automatic QA-system" pdf

... each paid reward.• Qualifications To improve the data quality, a HIT can also be attached to certain tests,“qualifications” that are either system-providedor created by the requester. An example ... both answers. We calculated the overall averageagreement ratio (Total Avg) and the average of thebest matches between two assignments within oneHIT (Best Match). We ran the test for two data ... the assign-ments have been completed.• Rewards At upload time, each HIT has to beassigned a fixed reward, that cannot be changedlater. Minimum reward is $0.01. Amazon.comcollects a 10% (or a...
  • 9
  • 610
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "GEMINI: A NATURAL LANGUAGE SYSTEM FOR SPOKEN-LANGUAGE UNDERSTANDING*" doc

... interpretation is available for each syntactic node. This is guaranteed by the seman- tic rule formalism and by the fact that every lexical item has a semantics associated with it. Table 2 contains ... example, the various categorial unification ap- proaches, such as Unification Categorial Gram- mar (Zeevat, Klein, and Calder, 1987)). Even when a syntactic skeleton is assumed, some approaches ... syntac- tic, semantic, and lexical rules are applied by a bottom-up all-paths constituent parser to populate a chart with edges containing syntactic, seman- tic, and logical form information....
  • 8
  • 376
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Creating a Multilingual Collocation Dictionary from Large Text Corpora" docx

... the collocation occurs (both col-location's keys occur on the same sentence, as theyare in a syntactical relation).When parallel corpora are available, also thetranslation equivalents of ... length-based and integrates a shal-low content analysis. It begins by individuating a paragraph in the target text which is a first candi-date as target paragraph, and which we call"pivot". ... two kinds of tests on the paragraphsin this span: a test of paragraph content, and a testof paragraphs relative size matching. The first testcompares the paragraphs' numbering (if present).The...
  • 4
  • 479
  • 0
Báo cáo khoa học: KCTD5, a putative substrate adaptor for cullin3 ubiquitin ligases docx

Báo cáo khoa học: KCTD5, a putative substrate adaptor for cullin3 ubiquitin ligases docx

... 12CA5 mAb against HA was from Roche(Indianapolis, IN, USA), anti-HA clone HA.11 was fromCovance (Berkely, CA, USA), anti-glutathione S-transferase(GST) and mAb against myc (9E10) were from Santa ... 403–410.29 Altschul SF, Madden TL, Schaffer AA, Zhang J,Zhang Z, Miller W & Lipman DJ (1997) GappedBLAST and PSI-BLAST: a new generation of proteindatabase search programs. Nucleic Acids Res ... Gene´tica Molecular, CSIC-Universidad de Valladolid, Spain2 Program of Inflammation, Inflammatory and Infectious Disease Center, and Program of Signal Transduction, Burnham Institute for MedicalResearch,...
  • 11
  • 402
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Creating a Gold Standard for Sentence Clustering in Multi-Document Summarization" potx

... DUC taskswhich range from single-/multi-document summa-rization to update summaries, where it is assumedthat the reader has already read earlier articlesabout an event and requires only an ... Hatzivas-siloglou et al. (2001) created a set of 10.535 man-ually marked pairs of paragraphs. Two human an-notator were asked to judge if the paragraphs con-tained ’common information’. They were ... same paragraph are clustered together whereasour approach is to find similar information be-tween documents. A gold standard for event identification wasbuilt by Naughton (2007). Ten annotators...
  • 9
  • 398
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Inducing a Semantically Annotated Lexicon via EM-Based Clustering" doc

... consisting of a class label, a selecting head, a grammatical relation, and a filler head. The class label is treated as hidden data in the EM- framework for statistical estimation. 2 EM-Based Clustering ... clustering approach, classes are derived directly from distributional data a sample of pairs of verbs and nouns, gathered by pars- ing an unannotated corpus and extracting the fillers of grammatical ... increase.as:s increase.aso:o fall.as:s pay.aso:o reduce.aso:o rise.as:s exceed.aso:o exceed.aso:s affect.aso:o grow.as:s include.aso:s reach.aso:s decline.as:s lose.aso:o act.aso:s...
  • 8
  • 245
  • 0
Báo cáo khoa học: FH8 – a small EF-hand protein from Fasciola hepatica docx

Báo cáo khoa học: FH8 – a small EF-hand protein from Fasciola hepatica docx

... andpurification of recombinant FH8, with the use ofconventional affinity tags, was not appropriate. As analternative, a construct was prepared with theH. Fraga et al. FH8 from Fasciola hepaticaFEBS ... Silva E, Castro A, Lopes A, Rodrigues A, Dias C,Conceic¸ a ˜o A, Alonso J, Costa JMC, Bastos M, Parra Fet al. (2004) A recombinant antigen recognized byFasciola hepatica-infected hosts. J Parasitol ... 4309–4316.24 Gopal B, Swaminathan CP, Bhattacharya A, Murthy MRN & Surolia A (1997) Thermodynamics ofmetal ion binding and denaturation of a calciumbinding protein from Entamoeba histolytica.Biochemistry...
  • 14
  • 356
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Synchronous Grammars for Semantic Parsing with Lambda Calculus" docx

... statistical machine translation ( SMT)community as a way of formalizing syntax-basedtranslation models between natural languages (NL).In generating multiple parse trees in a single deriva-tion, ... parsing is cast as a machine translation task,where an SCFG is used to model the translationof an NL into a formal meaning-representation lan-guage (MRL). Our algorithm, WASP, uses statisticalmodels ... multilingual GEOQUERYdata set. The 250-example data set is a subset of thelarger GEOQUERY corpus. All English questions inthis data set were manually translated into Spanish,Japanese and Turkish,...
  • 8
  • 336
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnchuyên đề điện xoay chiều theo dạngNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Thơ nôm tứ tuyệt trào phúng hồ xuân hươngChuong 2 nhận dạng rui roTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Kiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Quản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)chuong 1 tong quan quan tri rui roHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ