0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Maximum Entropy Based Phrase Reordering Model for Statistical Machine Translation" docx

Báo cáo khoa học:

Báo cáo khoa học: "Maximum Entropy Based Phrase Reordering Model for Statistical Machine Translation" docx

... novel reordering model for phrase -based statistical machine transla-tion (SMT) that uses a maximum entropy (MaxEnt) model to predicate reorderingsof neighbor blocks (phrase pairs). The model ... memory.3 Maximum Entropy Based Reordering Model In this section, we discuss how to create a max-imum entropy based reordering model. As de-scribed above, we defined the reordering model Ωon the ... pages 521–528,Sydney, July 2006.c2006 Association for Computational LinguisticsMaximum Entropy Based Phrase Reordering Model for Statistical Machine TranslationDeyi XiongInstitute of Computing...
  • 8
  • 390
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Clustered Global Phrase Reordering Model for Statistical Machine Translation" docx

... theglobal phrase reordering model and its param-1It might be misleading to call our reordering model “global” since it is at most considers two phrases. A trulyglobal reordering model would ... a translation model and is atarget language model. In phrase -based statistical machine translation,the source sentenceis segmented into a sequenceof phrases , and each source phrase is trans-lated ... global phrase reordering model is formalized as follows:(4)We can replace the conventional word distance- based distortion probability in Equa-tion (1) with the global phrase reordering model in...
  • 8
  • 346
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bilingually Motivated Domain-Adapted Word Segmentation for Statistical Machine Translation" pptx

... 2009.c2009 Association for Computational LinguisticsBilingually Motivated Domain-Adapted Word Segmentation for Statistical Machine TranslationYanjun Ma Andy WayNational Centre for Language TechnologySchool ... LDC seg-menter2and Stanford segmenter version 2006-05-113. Both ICTCLAS and Stanford segmentersutilise machine learning techniques, with HiddenMarkov Models for ICT (Zhang et al., 2003) ... fields for the Stanford seg-menter (Tseng et al., 2005). Both segmenta-tion models were trained on news domain datawith named entity recognition functionality. TheLDC segmenter is dictionary-based...
  • 9
  • 236
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Comparative Study on Reordering Constraints in Statistical Machine Translation" potx

... statistical machine translation (Brown et al.,1990). It allows an independent modeling of tar-get language model P r (eI1) and translation model P r(fJ1|eI1). The target language model ... based lexicon as well as phrase- based models for this initialization. Our choice isthe IBM Model4 to make the results as comparableTable 1: Ratio of the number of permitted reorderings with the ... search al-gorithm for statistical machine translation based onthe ITG constraints and its extension for the gen-eration of word graphs. We have shown the trans-lation results for the Verbmobil...
  • 8
  • 410
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Maximum Entropy Based Restoration of Arabic Diacritics" ppt

... produces a more powerful model. 8 ConclusionWe presented in this paper a statistical model for Arabic diacritic restoration. The approach we pro-pose is based on the Maximum entropy framework,which ... lexical, segment -based, and morpholog-ical information. Table 2 also shows that, whensegment -based information is added to our sys-tem, a significant improvement is achieved: 25% for WER (18.8 ... duplicatethe aforementioned FST result for comparison us-ing the identical training and testing set we use for our experiments. We also propose some new vari-ations on the finite state machine modeling...
  • 8
  • 337
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Syllable Based Word Recognition Model for Korean Noun Extraction" potx

... that uses the syllable based word recognition model. It finds themost probable syllable-tag sequence ofthe input sentence by using automaticallyacquired statistical information from thePOS ... syllable-tag sequence of the input sentenceby using statistical information and extracts nounsby detecting the word boundaries. The statistical in-formation is automatically acquired from a POS ... suitable for the word recognition model. The corpus can be modified through the fol-lowing steps:Step 1 For a given Eojeol, segment word bound-aries and assign word tags to each word.Step 2 For...
  • 8
  • 368
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Maximum Entropy Model Learning of the Translation Rules" pot

... our target for the experiments included 1,375 English words and 1,195 Japanese words, and we prepared 1,375 fea- ture functions for model 1 and 2,744 for model 2 (56 part-of-speech for English ... algorithm. No- tice that the log-likelihood for the model 1+2 is always higher than the model 1. Thus, the model 1 + 2 is more'effective than the model 1 for learning the translation rules. ... of the model to S. This algorithm is called the Basic Feature Selection (Berger et al., 1996). Model 1: Co-occurrence Information The first model is defined with co-occurrence information...
  • 5
  • 195
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An ERP-based Brain-Computer Interface for text entry using Rapid Serial Visual Presentation and Language Modeling" ppt

... assumes the EEG -based informationand the language model information are statisticallyindependent given the class label) is used to combinethe RDA discriminant score and the language model score ... language model integrationwith RSVP is relatively straightforward, as we shalldemonstrate. See Roark et al. (2010) for methodsintegrating language modeling into grid scanning.2 RSVP based BCI ... June 2011.c2011 Association for Computational LinguisticsAn ERP -based Brain-Computer Interface for text entryusing Rapid Serial Visual Presentation and Language ModelingK.E. Hild◦,U. Orhan†,D....
  • 6
  • 551
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Graph-based Semi-Supervised Learning for Question-Answering" doc

... Summarization SSL.of the models. As more labeled data is introduced,Hybrid SVM models’ performance increase dras-tically, even outperforming the state-of-the artMRR performance on TREC04 datasets ... insemi-supervised learning (SSL) environment, withan emphasis on graph -based methods, can im-prove the performance of information extractionfrom data for tasks such as question classifica-tion (Tri et al., ... question posed by the user. The ma-jor categories of information extraction producedby our QA system characterizes features for ourTE model based on analysis of q/a pairs. Here wegive brief descriptions...
  • 9
  • 502
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A FrameNet-based Semantic Role Labeler for Swedish" pdf

... following tools:• An HMM -based POS tagger,• A rule -based chunker,• A rule -based time expression detector,• Two clause identifiers, of which one is rule- based and one is statistical, • The MALTPARSER ... chunk; for classification, it is the type of thelargest chunk or clause that starts at the leftmosttoken of the FE. For prepositional phrases, thepreposition is attached to the phrase type (for ... Lbefore, Ltarget, and Lafter, which correspondto the parts of the list that is before, at, and after the target word, respectively.Initialize chunk-open to FALSE for Lsubin {Lbefore,...
  • 8
  • 469
  • 0

Xem thêm

Từ khóa: Báo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thơ nôm tứ tuyệt trào phúng hồ xuân hươngChuong 2 nhận dạng rui roTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀM