1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên ứu và ứng dụng các phương pháp tách từ cho tiếng lào

61 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

n mLaoScript for Windows, Lao Word Pro, Lao Pad, Lao Unikey.... s d ng các phông ch SaysetthaUnicode, Saysettha OT, Chantabuli Lao, Chantabuli 95, v.v.... BÀI TOÁN TÁCH T TING LÀO 3.1 Bà

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Vixay PHOMMAVONG NGHIÊN CỨU VÀ ỨNG DỤNG CÁC PHƯƠNG PHÁP TÁCH TỪ CHO TIẾNG LÀO Chuyên ngành: KHOA HỌC MÁY TÍNH LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội - 2018 Tai ngay!!! Ban co the xoa dong chu nay!!! 17057204959821000000 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Vixay PHOMMAVONG NGHIÊN CỨU VÀ ỨNG DỤNG CÁC PHƢƠNG PHÁP TÁCH TỪ CHO TIẾNG LÀO Chuyên ngành: KHOA HỌC MÁY TÍNH Mã đề tài: 16BKHMT-KH08 LUẬN VĂN THẠC SĨ KHOA HỌC NHƢỜI HƢỚNG DẪN TS Nguyễn Thị Thu Hƣơng Hà Nội - 2018 LI C Với tất lòng, em xin gửi lời cảm ơn sâu sắc đến cô, giáo viên hướng dẫn TS.Nguyễn Thị Thu Hương , người tận tình hướng dẫn, bảo tạo điều kiện tốt giúp em hoàn thành luận văn Đồng thời em xin gửi lời cảm ơn chân thành đến tồn thể q thầy Trường Đại Học Báck khoa Hà Nội trang bị cho em kiến thức học tập nghiên cứu khoa học Cuối cùng,em xin gửi lời cảm ơn đến gia đình, bạn bè đồng nghiệp động viên cho em lời khuyên bổ ích suốt trình thực luận văn Học viên thực Luận văn (Ký ghi rõ họ tên) Vixay PHOMMAVONG MC LC LI C MC LC DANH MC CÁC BNG DANH MC CÁC HÌNH V  M U t v Lý ch tài Mm vi, ng nghiên cu ca lu Ni dung lu I THIU 1.1 X lý ngôn ng t    9 1.2 X lý ti .9 1.3.Bài toán tách t, tách t ting Lào, ti10 t toán tách t n ti10 1.5.Thc trng thách thc x lý ti11  TING LÀO 12 2.1 TÌM HIU TING LÀO 12 2.1.1 Gii thiu ting Lào 12 2.1.2 Ngun gc ca ting Lào ting Thái 13 2.1.3 Nhng yu t ng pháp ti14 2.2.Ting Lào bi cnh x lý ngôn ng t nhiên .23 2.2.1.Xây dng trình son thn ti. 23  TI  3.1 Bài toán tách t  25 3... 3.3 Biu dibn ting Lào .30 3.4 Biu din t n 30 3.6 Bài toán tách t ti35  ting Lào s dng biu th 3.6.2 Xây dng mơ hình cha theo cu trúc ba t37 n din t  3.6.4.Các gii pháp tách t ti 42   NG DNG TÁCH T CHO TI  4.1.La chn công c 49 4.2.So sánh ting Lào ting T 50 4.3 Th nghi 53 KT LU 54 TÀI LIU THAM KHO 55 DANH MC CÁC BNG Bng 2.1 Bng cu trúc âm tit thành phn 15 Bng 2.2.Bng cu trúc âm tit ba tng. 16 Bng 2.3 Bng ch ca ting Lào.19  Bng 3.2 Vai trò thành phn ca V1 V238  Bng 4.1 So sánh ch cái50 Bng 4.2 So sánh cu trúc âm tit51 Bng 4.3 So sánh cu trúc t 52 Bng 4.4 So sánh cu trúc câu52 Bng 4.5 bng so sánh ting 53  DANH MC HÌNH V Hình 2.1 Bàn phím gõ ting Lào24 Hình 3.1  th ng m t CRF28 Hình 3.2 Cu trúc d liu trie30  Hình 3.4 Cu trúc t ng Lào36      khi hàm is next word  M U t v Nghiên cu v x lý ngôn ng t nhiên bao gm nhi c quan tr ch máy (MT: Machine Translation), truy vn khai thác thông tin ( IR-IE: Information Retrieval and Extraction), h thng h        n (ATS: Automatic Text Summarization), nh ting nói (SR: Speech Recognition) v.v t c giúp máy tính hi c tri thc ca i n t (WS:Word Segmention) c quan trng x lý nhng ngôn nh ng Vit ,ting Trung Quc, ting Hàn , ting Thái v Làon t vinh ranh gii gia t câu, không g ting Anh ngôn ng Âu-Á khác, ting Lào không s dng khong cách làm du hinh ranh gii t Ranh gii gia t khơng có du hiu rõ ràng mà cn phi da vào yu t   c lân cn, v.v  ghép  Lý ch tài   ng t khoa hc công ngh ti CHDCND c Lào  th   trin, so sánh vi ctrong khi ASEAN, hay so sánh vi cláng ging Thái Lan unày d n chuyên  vc   XL tingLào Mcdù có nhiuhotng Tin hc  hóa,s dng internet truy n    mi khía  a cuc sng,  cLào vng thiu  trao ichuyên môn, hp tác nghiên cu khoa hc.Mt  nh mcatingLào  lý  bn   V v tách t,  T ng  Tuy nhiên, ting Lào rt ng Thái Lan Hit s cơng trình nghi tin mm ngun m x lý ting Thái Chúng hy kin thc hc hc trình thc hin lu ci t tách t ting Thái cho ti t hiu qu t 3.M, phm vi ng nghiên cu ca lu Mu c tài:  tài tìm hi ca h thng vit ting  , la ch th nghim cho ting Lào hin ti Nghiên cu q trình ng dng phn mn ngơn ng ting Thái cho ting Lào Phát trin phn mm áp dng cho ting Lào  có th x lý v nhp nhn mt cách thích hp Phm vi nghiên cu ca lu Phm vi c tài tp trung nghiên cu   n ting Lào.Vi mc tiêu nêu trên, lup trung nghiên cu v  1.) C lý thuyt v ngơn ng bao gm: loi hình ngơn ng ch yu ca ngôn ng ting Lào, cu trúc c t ting Lào, nghiên cu v t vng hing nhp nha t 2.) Cn t 3.) Các phn mm tách t n ting Thái ting Lào ng nghiên cu ca lu 1.) c x lý ngôn ng t  ng pháp ca h thng ch vi 2.) i quyt tốn tách t nói chung, gii quyt b tách t ting Lào nói riêng 4.Ni dung lu Lugm  : Trình bày tng quan XLNNTN, XL ting Lào, Thái, toán tách t ting Lào, thc trng thách thc x lý ting Lào : Trình bày v  lý thuyt tìm hiu ting Lào,  ng ,h thng ngôn ng , âm tit , t , câu hình hóa ba tng ca t ting Lào :Trình bày v toán tách t   pháp tách t ,mơ hình tách t tốn ng tip c: so khp t c i MM (Maximum Matching), xác su  u kin CRF (Conditio Random Field) ,vec  tr (Support Vector Machines) , mơ hình Markov n HMM (Hidden Markov Models)  liên quan, gii pháp tách t cho ting Lào  Trình bày v phn mm tách t ting Thái vi giao din web, vic s dng phn mm ngun m  tách t ting Lào, th nghi bit ting Lào ting Thái, so sánh ch cái, âm tit ,ph âm, nguyên âm ,th nghim phn mm, ng phát trin

Ngày đăng: 22/01/2024, 17:03

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w