0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Automatic Adaptation of Annotation Standards: Chinese Word Segmentation and POS Tagging – A Case Study" potx

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Extraction of Lexico-Syntactic Patterns for Detection of Negation and Speculation Scopes" pdf

... state -of- the-art machinelearning systems. Additionally, the intuitive and linguistically motivated rules will allowfor manual adaptation of the rule set to newdomains and corpora.1 MotivationInformation ... 35.92, and 65.55 for clinical texts, papers, and abstracts respec-tively.Morante and Daelemans have also developed a metalearner for identifying the scope of negation(200 9a) . Results of the negation ... LinguisticsAutomatic Extraction of Lexico-Syntactic Patterns for Detection of Negation and Speculation ScopesEmilia ApostolovaDePaul UniversityChicago, IL USAemilia.aposto@gmail.comNoriko TomuroDePaul...
  • 5
  • 543
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic learning of textual entailments with cross-pair similarities" ppt

... designed an effective wayto automatically learn entailment rules from ex-amples and (b) our approach is highly accurate and exceeds the accuracy of the current state -of- the-art401models (Glickman ... on a intra-pair similarity between T and H but also on a cross-pair similarity between twopairs (T, H) and (T, H). The latter similaritymeasure along with aset of annotated examples ... examples al-lows a learning algorithm to automatically derivesyntactic and lexical rules that can solve complexentailment cases.In this paper, we define a new cross-pair similar-ity measure based...
  • 8
  • 413
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Construction of Polarity-tagged Corpus from HTML Documents" docx

... result.Classifier and data sets As a classifier, wechose Naive Bayes with bag -of- words features,because it is one of the most popular one in thistask. Negation was processed in a similar way asprevious ... keisan-ga yoininarucost computation-POST become easyIt becomes easy to compute cost.kantan-de jikan-ga setsuyakudekirueasy-POST time-POST can saveIt’s easy and can save time.soup-ha koku-ga ... domain adaptation technique, and it is one future work.Furthermore, we examined the variance of theaccuracy between different domains. We trainedNaive Bayes on each data set and investigate...
  • 8
  • 409
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Identification of Pro and Con Reasons in Online Reviews" ppt

... accuracy, precision, and recall of the system on each test set. We calculated numbers in each A and B column by assuming each anno-tator’s answers separately as a gold standard. In Table ... “preferential treatment given to large groups”, and “they don't offer salads of any kind” are hard to predict. Also, they seem rarely share common keyword features. We first automatically labeled ... restaurants such as family restaurants, Mexican restaurants, fast food chains, steak houses, and Asian restaurants. The average numbers of sentences in a review docu-ment are 35.49 and 25.89 respectively....
  • 8
  • 461
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Evaluation of Sentence-Level Fluency Andrew Mutton∗" pdf

... 2109 Australia NSW 2109 Australiamadras@ics.mq.edu.auAbstractIn evaluating the output of language tech-nology applications—MT, natural languagegeneration, summarisation—automatic eval-uation ... in applying SVMs here are, first, noting thathuman translations are generally good and machinetranslations poor, that binary training data can becreated by taking the human translations as posi-tive ... each.Connexor is a commercially available dependencyparser that returns head–dependant relations as wellas stemming information, part of speech, and so on.In the case of an ungrammatical sentence, Connexorreturns...
  • 8
  • 507
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Evaluation of Machine Translation Quality Using Longest Common Subsequence and Skip-Bigram Statistics" doc

... 0.83With Case Information (Case) Lower Case (NoCase) Lower Case & Stemmed (Stem)With Case Information (Case) Lower Case (NoCase) Lower Case & Stemmed (Stem)Table 1. Pearson’s ρ and Spearman’s ... unigram and bi-gram, i.e. N=2, for the purpose of explanation and call this BLEU-2. Using S1 as the reference and S2 and S3 as the candidate translations, S2 and S3 would have the same BLEU-2 ... large-scale machine translation evalua-tions. Recently, Turian et al. (2003) indicated that standard accuracy measures such as recall, preci-sion, and the F-measure can also be used in evalua-tion...
  • 8
  • 442
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic clustering of collocation for detecting practical sense boundary" ppt

... collocation. A target word for collocation is called the ‘central word , and a word in a collocation is referred to as the ‘contextual word . ‘Surrounding words’ mean the collocation for all contextual ... noise and trivial collocation. We call this process normalization, and it is specifically provided as [8]. The statistically unrelated words can be said that the words with high frequency appear ... word sense indexing function of x that gives an index to each sense of the word x. All contextual words xi±j of a central word x have their own contextual words in their collocation, and...
  • 4
  • 425
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Collection of Related Terms from the Web" pptx

... System configurationAutomatic acquisition of technical terms in a cer-tain domain has been studied as automatic termrecognition (Kageura and Umino, 1996; Kageura and Koyama, 2000), and the methods ... col-lect technical terms that are related to natural lan-guage processing, such as morphological analysis,parsing, information retrieval, and machine transla-tion. The target application of the method ... Automatic Collection of Related Terms from the WebSatoshi Sato and Yasuhiro SasakiGraduate School of InformaticsKyoto UniversitySakyo, Kyoto, 606-8501Japansato@i.kyoto-u.ac.jp, sasaki@pine.kuee.kyoto-u.ac.jpAbstractThis...
  • 4
  • 437
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "AUTOMATIC ACQUISITION OF SUBCATEGORIZATION FRAMES FROM UNTAGGED TEXT" doc

... immediately to the right of a main verb. Adverbs and adverbial phrases (including days and dates) are ignored for the pur- poses of case adjacency. A noun-phrase that sat- isfies the Case Filter ... examples are clear and unambiguous. • Observations made in clear cases generalize to all cases. • It is possible to distinguish the clear cases from the ambiguous ones with reasonable ac- ... extracting lexical and especially collocational information from text has risen dra- matically in the last two years, as sufficiently large corpora and sufficiently cheap computation have...
  • 6
  • 416
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Detection of Nonreferential It in Spoken Multi-Party Dialog" doc

... .58Table 1: Classification of it by two annotators in a corpus subset.4 Automatic Classification4.1 Training and Test Data Generation4.1.1 Segmentation We extracted all instances of it and the ... shallow feature generation meth-ods could propagate into the model that waslearned from the data. The advantage of this ap-proach is, however, that training and test data arehomogeneous. A ... extent of the reparandum(i.e. the words that are replaced by followingwords) is not part of the transcription.3.2 Annotation of ItWe performed an annotation with two external an-notators....
  • 8
  • 436
  • 0

Xem thêm

Từ khóa: Báo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Nghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Tìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Kiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ