0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Unsupervised Discourse Segmentation of Documents with Inherently Parallel Structure" pdf

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Discourse Segmentation of Documents with Inherently Parallel Structure" pdf

... to the problem of segmenting parallel parts of documents. The task of aligning each sentence of an abstractto one or more sentences of the body has beenstudied in the context of summarization ... that it neglects the discourse structureand the lexical cohesion phenomenon.3 ModelIn this section we describe our model for discourse segmentation of documents with inherently paral-lel ... rivaling those of a pre-viously proposed supervised technique.1 IntroductionMany documents consist of parts exhibiting a highdegree of parallelism: e.g., abstract and body of academic publications,...
  • 5
  • 376
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Extraction and Approximation of Numerical Attributes from the Web" pdf

... cases manual annotation of objects with numerical properties is possible, it is a hard andlabor intensive task, and is impractical for dealing with the vast amount of objects of interest. Hence,there ... of the methods aresuitable for retrieval of numerical attributes. How-ever, most of them do not exploit the numericalnature of the attribute data.Our research is related to a sub-domain of ... the variation of theextracted numerical attribute values using infor-mation in the textual context of these values.A significant body of recent research deals with extraction of various data...
  • 10
  • 465
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Multi-Modal Annotation of Quest Games in Second Life" pdf

... location of the exclaiming avatar to determine if the exclamation was a result of their location (in the zone with the dead body) or because of something said or done by another player. Location of ... events involving multiple avatars over a span of time and space. While the design of the RAT tool will support annotation of any event of interest with only slight modifications, for our purposes, ... surface character-istics of utterances. In particular, we ask our anno-tators what is the pragmatic function of each utterance within the dialogue, a decision that often depends upon how earlier...
  • 9
  • 394
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Co-training for Predicting Emotions with Spoken Dialogue Data" pdf

... with spoken dialogue data. Al-though a large set of dialogues have been collected, only 8% of them have been annotated (10 dialogues with a total of 350 utterances), due to the laborious annotation ... data consists of the student turns in a set of 10 spoken dialogues randomly selected from a corpus of 128 qualitative physics tutoring dialogues between a human tutor and University of Pittsburgh ... corresponds to its expertise class with the highest confidence. The maximum number of iterations and the number of examples added per iteration are parameters of the system. While iteration...
  • 4
  • 381
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Predicting the fluency of text with shallow structural features: case studies of machine translation and human-written text" doc

... distinguishedfrom machine translations with high fluency with accuracy of 61%. In pairwise comparison of sen-tences with different fluency, accuracy of predict-ing which of the two is better is 90%. Results ... number of wordscomprising a given type of phrase, divided by thenumber of phrases of this type. It was computedfor PP, NP, VP, ADJP, ADVP. Two versions of the features were computed—one with ... which factors are predic-tive of good fluency.The distribution of fluency scores in the datasetis rather skewed, with the majority of the sen-tences rated as being of average fluency 3 as canbe...
  • 9
  • 438
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Topic Modelling for Multi-Party Spoken Discourse" ppt

... interested. Of course, this requires both identification of the top-ics discussed, and segmentation into the periods of topically related discussion.Work on automatic topic segmentation of textand ... twolevels, with each segment being produced from alinear combination of the distributions associated with each topic. Consequently, our model can of- ten capture the content of a sequence of words ... numbers of segments we are deal-ing with, a baseline of segmenting the discourse into equal-length segments gives both Pkand WDabout 50%. In order to investigate the effect of thenumber of underlying...
  • 8
  • 366
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Semantic Role Induction with Global Role Ordering" doc

... relation of an argument to its head in the dependency parsetree, (ii) head: head word of the argument, and (iii)pos-head: Part -of- Speech tag of head.Algorithm 1 describes the generative story of ... most of the in-tervals tend to have only a few types of SRs and agiven SR tends to occur only in a few types of in-tervals. The concept of intervals is also related tothe linguistic theory of ... the notion of primaryroles, and each interval generates a sequence of secondary roles and syntactic constituentsusing local features. The global role orderingconsists of the sequence of primary...
  • 5
  • 398
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Search for The Optimal Segmentation for Statistical Machine Translation" doc

... unaddressedproblem of unsupervised determination of the optimal morphological segmentation for statistical machine translation (SMT)and propose a segmentation metric thattakes into account both sides of the ... one but bothsides of the parallel corpus. A posssible choice isthe post -segmentation alignment accuracy. How-ever, Elming et al. (2009) show that optimizing segmentation with respect to alignment ... scheme“EN” of Habash and Sadat (2006). In Lee (2004),the goal is to match the lexical granularities of thetwo languages by starting with a fine-grained seg-mentation of the Arabic side of the corpus...
  • 6
  • 445
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Translation Induction for Chinese Abbreviations using Monolingual Corpora" ppt

... example,Bill Gates tends to appear together with Microsoft.The co-occurrence may imply a relationship (e.g.,Bill Gates is the founder of Microsoft). By inspec-tion of the Chinese text, we found that ... 50M).Measure Valuenumber of English entities 5Mnumber of Chinese entities 4.7Mnumber of full-abbreviation relations 51Knumber of translation entries added 210Ktotal number of translation entries ... Compared with English abbreviations (which are mo stlyacronyms and trun cations), the formation of Chinese abbreviations is much more complex.Due to the richness of Chinese abbreviations,many of...
  • 9
  • 444
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Analyzing the Errors of Unsupervised Learning" docx

... a sequence of wordsand the output y is the corresponding sequence of part -of- speech tags.In the PCFG, the input x is a sequence of POStags and the output y is a binary parse tree with yieldx. ... of EM contain valuable information about the incor-rect biases of these models. However, EM is chang-ing hundreds of thousands of parameters at once in anon-trivial way, so we need a way of ... thesummation of (1) is associated with one of the Klabels. We can form a K ×K matrix M, where eachentry Mijis the distance between the parameters in-volving label i of θ and label j of θ....
  • 9
  • 489
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo khoa họcunsupervised discourse segmentation of documentstài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học công nghệ phục vụ nông nghiệp và phát triển nông thôn các tỉnh phía bắc 2006 2007 tài liệu phục vụ hội nghịbáo cáo khoa học tài chính côngBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Báo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Kiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)Chiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015MÔN TRUYỀN THÔNG MARKETING TÍCH HỢP