0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Using Bilingual Comparable Corpora and Semi-supervised Clustering for Topic Tracking" ppt

Báo cáo khoa học:

Báo cáo khoa học: "Using Bilingual Comparable Corpora and Semi-supervised Clustering for Topic Tracking" ppt

... Association for Computational LinguisticsUsing Bilingual Comparable Corpora and Semi-supervised Clustering for Topic TrackingFumiyo FukumotoInterdisciplinary GraduateSchool of Medicine and EngineeringUniv. ... basic motivation for using bilin-gual corpora: bilingual corpora helps to collec tmore information about the target topic. We there-fore extracted monolingual(Japanese) story pairs and added them ... value for bilingual story pair was 0.65, and that for monolingu al was 0.48. The difference of dates be-tween bilingual stories was ±4.235Table 2: Topic NameTDT ID Topic name OnT. TDT ID Topic...
  • 8
  • 254
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Using Bilingual Parallel Corpora for Cross-Lingual Textual Entailment" pptx

... Association for Computational Linguistics, pages 1336–1345,Portland, Oregon, June 19-24, 2011.c2011 Association for Computational LinguisticsUsing Bilingual Parallel Corpora for Cross-Lingual ... Using Parallel Corpora for CLTE Bilingual parallel corpora represent a possible solu-tion to overcome the inadequacy of the existing re-sources, and to implement a portable approach for CLTE. To ... Spanish-English parallel corpora released for the WMT101. We run TreeTagger (Schmid,1994) for tokenization, and used the Giza++ (Och and Ney, 2003) to align the tokenized corpora atthe word level....
  • 10
  • 284
  • 0

... models used only ti for Hebrew and ATB and ti and µi−1 for Arabic. Word bound-ary was predicted using tiin Arabic and Hebrew, and additionally using bi−1 and bi−2 for ATB. Theunconstrained ... segmentation for alignment(Chung and Gildea, 2009; Habash and Sadat, 2006),we find that the best segmentation for alignmentdoes not coincide with the gold-standard segmenta-tion and our bilingual ... morpheme alignment and segmentation in-formation.Before defining our model formally, we introducesome notation. Each possible morphological seg-mentation and alignment for a given sentence...
  • 10
  • 273
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "From Bilingual Dictionaries to Interlingual Document Representations"Raghavendra Udupa Micros pptx

... using only a bilingual dictionary. Wefirst use the bilingual dictionary to find candi-date document alignments and then use themto find an interlingual representation. Sincethe candidate alignments ... translation and ourapproach use bilingual dictionary while CCA and OPCA use a training corpus of aligned documents.Since the bilingual dictionary is learnt from Eu-roparl data set, for a fair ... sets. For comparisonpurposes, we trained and tested CCA on documentsfrom same domain (Wikipedia). It achieves 75% and 62% accuracies for the two data sets respectivelybut, as expected, it performed...
  • 6
  • 297
  • 0
Tài liệu Báo cáo khoa học: Globin gene family evolution and functional diversification in annelids ppt

Tài liệu Báo cáo khoa học: Globin gene family evolution and functional diversification in annelids ppt

... (http://phylogenomics.berkeley.edu/cgi-bin/muscle/input_muscle.py) and adjusted manually.Molecular phylogeny For the two sets of aligned globins (annelids on one hand and annelids, molluscs and arthropods on the other), Baye-sian ... Gil for collecting specimens ofG. dibranchiata, and Dr David Lincoln for collectingspecimens of A. ornata. We gratefully acknowledge thecaptain and crew of the NO L’Atalante, the pilots and groups ... diversity in sequence,quaternary structure and functions such as binding and transport of oxygen and hydrogen sulfide, and activity of superoxide dismutase and mono-oxygenase[8].Annelid noncirculating...
  • 12
  • 594
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bayesian Symbol-Refined Tree Substitution Grammars for Syntactic Parsing" pptx

... 1993), using a standard datasplit (sections 2–21 for training, 22 for development and 23 for testing). We also used section 2 as asmall training set for evaluating the performance ofour model ... SR-TSG model for different languages and for unsuper-vised grammar induction.AcknowledgementsWe would like to thank Liang Huang for helpfulcomments and the three anonymous reviewers for thoughtful ... used for various applications such as ma-chine translation (Galley et al., 2004; DeNeefe and Knight, 2009), sentence compression (Cohn and La-pata, 2009; Yamangil and Shieber, 2010), and ques-tion...
  • 9
  • 411
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Word representations: A simple and general method for semi-supervised learning" doc

... results and Ta-ble 3 shows the final NER F1 results. We compareto the state-of-the-art methods of Ando and Zhang(2005), Suzuki and Isozaki (2008), and for NER—Lin and Wu (2009). Tables 2 and 3 ... words. Clustering methods and 385distributional methods can overlap. For example,Pereira et al. (1993) begin with a cooccurrencematrix and transform this matrix into a clustering. 3.1 Brown clustering The ... preferable for certain tasks.Lin and Wu (2009) finds that the representationsthat are good for NER are poor for search queryclassification, and vice-versa. We apply clus-tering and distributed...
  • 11
  • 687
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Identification of Pro and Con Reasons in Online Reviews" ppt

... divided data into 80% for training, 10% for development, and 10% for test for our experiments. 5.1 Experiments on Dataset 1 Identification step: Table 3 and 4 show pros and cons sentences identification ... separates pro and con candidate sentences (CR and PR in Table 1) from sentences irrelevant to either of them (NR). The classification task then classifies candidates into pros (PR) and cons (CR). ... product?” For example, in hotel reviews, infor-mation such as “found 189 positive reviews and 65 negative reviews” may not fully satisfy the information needs of different users. More useful information...
  • 8
  • 461
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An Earley-style Predictive Chart Parsing Method for Lambek Grammars" ppt

... instantiation of span labels that it induces (for string matters), and its structure (for semantic matters). and (i-j) a span label. For a formula (m, T, t) resulting after first-order ... X -+ A B C D. For an atomic formula, the corresponding production will have an empty rhs, e.g. A 4 0 .6 The left and right hand side units of SLMG productions all take the form Aim] (i-j), ... not sufficient for Lambek calculus deductions. between residue formulae and excised hypothet- icals (one where both the residue and hypothet- ical record the dependency). For this proced-...
  • 8
  • 302
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Prosodic Aids to Syntactic and Semantic Analysis of Spoken English" ppt

... that the input move is lexically correct and tries to obtain a parse for it, employing syntactic and semantic relaxation techniques for handling ill-formed sentences (Huang 1988). If no acceptable ... understanding of spoken English, pitch and pause information have received the most attention due to ease of measurement and their relative importance (Cruttenden 1986, pp 3 & 36). Our efforts ... extract pitch and pause information from speech using specifically designed hardware with some software post-processing. The hard- ware performs frequency to amplitude transfor- mation and filtering...
  • 8
  • 444
  • 0

Xem thêm

Từ khóa: Báo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018chuyên đề điện xoay chiều theo dạngNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát hiện xâm nhập dựa trên thuật toán k meansSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXChuong 2 nhận dạng rui roBT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)Đổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀM