0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Learning Expressive Models for Word Sense Disambiguation" pot

Báo cáo khoa học:

Báo cáo khoa học: "Learning Expressive Models for Word Sense Disambiguation" pot

... 41–48,Prague, Czech Republic, June 2007.c2007 Association for Computational LinguisticsLearning Expressive Models for Word Sense Disambiguation Lucia Specia NILC/ICMC University of São ... verbs. 1 Introduction Word Sense Disambiguation (WSD) is concerned with the identification of the meaning of ambi-guous words in context. For example, among the possible senses of the verb “run” ... frequent translation are shown in Table 1. For the monolingual scenario, we use the sense tagged corpus and sense repositories provided for verbs in Senseval-3. There are 32 verbs with be-tween...
  • 8
  • 380
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Semantic Classes for Word Sense Disambiguation" pptx

... data for each word. This can be done be-cause the semantic classes are common to wordsunlike senses; for learning the properties of a givenclass, we can use the data from various words. For instance, ... parts of speech for a window ofn words to both sides of word (excluding the word 1Validation results showed that a window of two words toboth sides yieldsthe best performance for both local ... can be transformedto fine grained word senses using simpleheuristics, and applying the technique for recent SENSEVAL data sets shows that ourapproach can yield state of the art perfor-mance.1...
  • 8
  • 268
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Exploiting Parallel Texts for Word Sense Disambiguation: An Empirical Study" potx

... problem is par-ticular severe for WSD, since sense- tagged data must be collected separately for each word in a language. One source to look for potential training data for WSD is parallel texts, ... sample task of SENSEVAL-2. We rely on two sources to decide on the sense classes of w: (i) The sense definitions in WordNet 1.7, which lists seven senses for the noun channel. Two senses are ... of senses before and after sense lump-ing is 5.07 and 3.52 respectively. After sense lumping, we trained a WSD classi-fier for each noun w, by using the lumped senses in the manually sense- tagged...
  • 8
  • 380
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Similarity-Based Methods For Word Sense Disambiguation" docx

... long. However, a word is therefore modeled by the average behavior of many words, which may cause the given word& apos;s idiosyncrasies to be ig- nored. For instance, the word "red" ... scheme for deciding which word pairs require a similarity-based estimate, a method for combining information from simi- lar words, and, of course, a function measuring the similarity between words. ... that do not require building general word classes. Instead, estimates for the most similar words to a word w are com- bined; the evidence provided by word w' is weighted by a function...
  • 8
  • 312
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Flow Network Models for Word Alignment and Terminology Extraction from Bilingual Corpora" docx

... and French words, an empty English word, and an empty French word, • E comprises edges from the source to all the English words (including the empty one), edges from all the French words (including ... 2The empty words account for the fact that words may not be aligned with other ones, i.e. they are not exphcitely translated for example. 445 • from the source to the empty English word, the ... the set of English words with their positions, including empty words, to the set of French words with their positions, including empty words (in our framework, it is formally equivalent to...
  • 7
  • 379
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning PP attachment for filtering prosodic phrasing" potx

... information should be usedas features in training data: (i) lexical features(e.g. unigrams and bigrams of head words), and(ii) word cooccurrence strength values (the proba-bility that two words ... of the involved phrases, aswell as for combinations of these words. Cooccur-rence strength values may provide additional cluesto informational ties among words; when we in-vestigate the cooccurrences ... restrictsthe search to the appearance of two designatedwords at a maximal distance of 10 words, whichis the default. The search is performed for bothpossible orders of appearance of the two desig-3The...
  • 8
  • 357
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Exemplar-Based Models for Word Meaning In Context" pptx

... features for allthe senses of the target. For example, among thetop 20 features for coach, we get match and team (for the “trainer” sense) as well as driver and car (for the “bus” sense) . This ... a fundamental problem for distributional models. Typically, distributional models compute a single“type” vector for a target word, which contains co-occurrence counts for all the occurrences ... state-of-the-art prototype models. We perform an in-depth error analysis to identifystable parameters for this class of models. 2 Related WorkAmong distributional models of word, there aresome approaches...
  • 6
  • 415
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Log-linear Models for Word Alignment" ppt

... Model 5 training. For log-linear models, POS information and anadditional dictionary are used, which is not the case for GIZA++/IBM models. However, treated as amethod for performing symmetrization, ... features. Our experiments showthat log-linear models significantly outperform IBMtranslation models. We begin by describing log-linear models for word alignment. The design of feature functionsis ... showthat log-linear models significantly out-perform IBM translation models. 1 Introduction Word alignment, which can be defined as an object for indicating the corresponding words in a paralleltext,...
  • 8
  • 283
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A STOCHASTIC PROCESS FOR WORD FREQUENCY DISTRIBUTIONS" pot

... relations among words in lexical distributions. These empirical similarity relations, as observed for large corpora of words, impose additional criteria on the ad- equacy of models for word frequency ... (1975), have been put forward, all of which have Zipf's law as some special or limiting form. Unrelated to Zipf's law is the lognormal hypothesis, advanced for word fre- quency distributions ... phonotactically legal word initial kn and illegal word final k• sequences, at the same time avoiding full conditioning on two preced- ing segments, which, for four-letter words, would come uncomfortably...
  • 8
  • 409
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Exploring Entity Relations for Named Entity Disambiguation" pot

... challenges: Surface forms in text can be am-biguous, and the same entity can be referred to bydifferent surface forms. For example, the surfaceform “George Bush” may denote either of two for- mer U.S. ... a method for candi-date selection that is based on an inverted index ofsurface forms and entities (Section 3.2). Instead ofa bag-of-words approach we use co-occurring NEsin text for describing ... where the majority of surface forms is unam-biguous, but some surface forms are very ambigu-ous (Figure 1). This suggests that for a given set ofdistinct surface forms found in a document, many...
  • 6
  • 363
  • 0

Xem thêm

Từ khóa: Báo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longTìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinChuong 2 nhận dạng rui roTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Nguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘITÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ