1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tìm hiểu về hiện tượng phân giải đồng tham chiếu và xây dựng ứng dụng (2014)

62 117 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 62
Dung lượng 920,38 KB

Nội dung

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN -*** - NGUYỄN NGỌC ANH TÌM HIỂU VỀ HIỆN TƯỢNG PHÂN GIẢI ĐỒNG THAM CHIẾU VÀ XÂY DỰNG ỨNG DỤNG KHÓA LUẬN TỐT NGHIỆP Chuyên ngành: Tin học HÀ NỘI – 2014 TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN -*** - NGUYỄN NGỌC ANH TÌM HIỂU VỀ HIỆN TƯỢNG PHÂN GIẢI ĐỒNG THAM CHIẾU VÀ XÂY DỰNG ỨNG DỤNG KHÓA LUẬN TỐT NGHIỆP Chuyên ngành: Tin học Người hướng dẫn khoa học TS TRỊNH ĐÌNH VINH HÀ NỘI – 2014 LỜI CẢM ƠN Để hoàn thành khóa luận này, trước hết em xin gửi lời cảm ơn sâu sắc tới TS Trịnh Đình Vinh, tận tình hướng dẫn, bảo, định hướng, đóng góp ý kiến quý báu suốt trình thực Em xin chân thành cảm ơn thầy, cô giáo khoa Công nghệ thông tin, trường ĐH Sư Phạm Hà Nội quan tâm dạy dỗ giúp đỡ em suốt bốn năm học vừa qua thời gian em làm khóa luận Là sinh viên ngành Công nghệ thông tin, em tự hào khoa học, thầy giáo Em xin kính chúc thầy, cô mạnh khỏe, hạnh phúc thành công Chúc khoa Công nghệ thông tin ngày khang trang, vững mạnh, góp phần to lớn nghiệp đào tạo chuyên nghiệp trường Đại học sư phạm Hà Nội Là sinh viên lần đầu nghiên cứu khoa học, chắn khóa luận em khơng tránh khỏi thiếu sót, hạn chế Vì em mong đóng góp ý kiến thầy giáo bạn để khóa luận em hồn thiện Cuối cùng, em xin cảm ơn tới đại gia đình em, ln ln động viên, khích lệ tinh thần tạo điều kiện tốt cho em hồn thành khóa luận Hà Nội, tháng 06 năm 2014 Sinh viên Nguyễn Ngọc Anh LỜI CAM ĐOAN Tên em là: Nguyễn Ngọc Anh Sinh viên: K36 – CNTT, trường Đại học sư phạm Hà Nội Em xin cam đoan: Đề tài “Tìm hiểu tượng phân giải đồng tham chiếu xây dựng ứng dụng” kết tìm hiểu nghiên cứu riêng em, hướng dẫn TS Trịnh Đình Vinh Khóa luận hồn tồn khơng chép từ tài liệu có sẵn cơng bố khác Kết không trùng với tác giả khác Nếu sai em xin hoàn toàn chịu trách nhiệm Hà Nội, tháng 06 năm 2014 Sinh viên Nguyễn Ngọc Anh DANH MỤC CÁC TỪ VIẾT TẮT VÀ THUẬT NGỮ TIẾNG ANH STT Từ Giải nghĩa antecedent Tiền ngữ - từ/câu bị thay Anaphora Phân giải đồng tham chiếu NP – anaphora Phân giải đồng tham chiếu danh từ VP – anaphora Phân giải đồng tham chiếu động từ S – anaphora Phân giải đồng tham chiếu câu “One” anaphora Phân giải đồng tham chiếu số từ Prefer - Constraint Ràng buộc thêm (không bắt buộc) Tagger Gán nhãn từ loại Prefer - Constraint Ràng buộc thêm (không bắt buộc) DANH MỤC HÌNH ẢNH Hình ảnh Nội dung Trang Hình 1.1 Mơ hình bước xử lý tốn tượng phân giải dồng tham chiếu Hình 2.1 Mơ thuật tốn Hobbs 12 Hình 2.2 Cấu trúc từ điển danh từ để giải 20 “One” anaphora Hình 2.3 Cấu trúc từ điển danh từ 21 Hình 2.4 Cấu trúc từ điển động từ 22 Hình 3.1 Biểu đồ hệ thống 36 Hình 3.2 Sơ đồ xử lý hệ thống 37 Hình 3.3 Form giao diện chương trình 44 Hình 3.4 Form giao diện nhập đoạn văn 44 Hình 3.5 Form giao diện kết xử lý tượng đồng tham 45 chiếu DANH MỤC BẢNG Bảng Nội dung Trang Bảng 3.1 Lớp truy cập sở liệu danh từ 37 Bảng 3.2 Lớp truy cập sở liệu động từ 38 Bảng 3.3 Lớp từ 38 Bảng 3.4 Lớp câu 39 Bảng 3.5 Lớp chuẩn câu 39 Bảng 3.6 Lớp phát hiện tượng NP – anaphora 40 Bảng 3.7 Lớp phát hiện tượng VP – anaphora 40 Bảng 3.8 Lớp phát hiện tượng S – anaphora 40 Bảng 3.9 Lớp phát hiện tượng “One” anaphora 41 Bảng 3.10 Lớp xử lý tượng NP – anaphora 41 Bảng 3.11 Lớp xử lý tượng VP – anaphora 41 Bảng 3.12 Lớp xử lý tượng S – anaphora 42 Bảng 3.13 Lớp xử lý tượng “One” anaphora 42 Bảng 3.14 Kiểm thử NP – anaphora 46 Bảng 3.15 Kiểm thử VP – anaphora 47 Bảng 3.16 Kiểm thử S – anaphora 47 Bảng 3.17 Kiểm thử “One” anaphora 48 MỤC LỤC MỞ ĐẦU CHƯƠNG 1: HIỆN TƯỢNG PHÂN GIẢI ĐỒNG THAM CHIẾU 1.1 Khái niệm 1.2 Mô hình tổng quát 1.3 Phân loại 1.3.1 NP – anaphora 1.3.2 VP – anaphora 1.3.3 S – anaphora 1.3.4 “One” anaphora 1.4 Hiện tượng phân giải đồng tham chiếu văn tiếng Việt 1.5 Ứng dụng 10 1.5.1 Ứng dụng phân giải đồng tham chiếu hệ thống hội thoại 10 1.5.2 Ứng dụng phân giải đồng tham chiếu trích rút thơng tin 10 CHƯƠNG 2: CÁCH TIẾP CẬN HIỆN TƯỢNG PHÂN GIẢI ĐỒNG THAM CHIẾU 12 2.1 Cách tiếp cận NP – anaphora 12 2.1.1 Tiếp cận theo thuật toán Hobbs 12 2.1.2 Tiếp cận theo đa chiến lược 14 2.1.3 Hướng giải 16 2.2 Cách tiếp cận VP – anaphora 16 2.2.1 Cách tiếp cận 16 2.2.2 Hướng giải 17 2.3 Cách tiếp cận S – anaphora 17 2.3.1 Cách tiếp cận hướng giải cũ 17 2.3.2 Cách tiếp cận hướng giải 18 2.4 Cách tiếp cận “One” anaphora 18 2.4.1 Cách tiếp cận 18 2.4.2 Hướng giải 19 2.5 Xây dựng từ điển 20 2.5.1 Từ điển danh từ 21 2.5.2 Từ điển động từ 22 2.6 Sơ lược cấu trúc tiếng Việt 23 2.6.1 Danh từ cụm danh từ 23 2.6.2 Động từ cụm động từ 25 2.6.3 Các loại từ khác 28 2.6.4 Các dạng câu 31 CHƯƠNG 3: XÂY DỰNG ỨNG DỤNG 36 3.1 Phát biểu toán 36 3.2 Phân tích hệ thống 36 3.2.1 Biểu đồ 36 3.2.2 Sơ đồ xử lý 37 3.3 Thiết kế hệ thống 37 3.3.1 Thiết kế lớp 37 3.3.2 Thiết kế giao diện 43 3.4 Kết thử nghiệm 45 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 50 TÀI LIỆU THAM KHẢO 52 PHỤ LỤC 54 MỞ ĐẦU Lý chọn đề tài Trong thời đại khoa học phát triển, công nghệ thông tin đã, quan tâm nghiên cứu đến lĩnh vực xử lý ngôn ngữ tự nhiên nhằm đạt mục tiêu làm cho máy tính hiểu trả lời người, khiến máy tính ngày giống người Một hướng nghiên cứu quan trọng lĩnh vực xử lý ngôn ngữ tự nhiên hướng xây dựng hệ thống hội thoại tự động người máy Tuy chưa thể làm cho máy tính “giống người” năm qua, lĩnh vực đạt thành công bước đầu không với tiếng Anh mà cịn với số ngơn ngữ khác Phân giải đồng tham chiếu tượng tỉnh lược vấn đề mẻ lĩnh vực xử lý ngôn ngữ tự nhiên Chúng quan tâm nghiên cứu từ sớm mà thuật toán kinh điển đưa vào cài đặt hiệu thuật toán Hobbs nhà khoa học Jerry R Hobbs cơng bố vào năm 1976 Kể từ đến nay, nhiều cách tiếp cận - ý tưởng cài đặt thử nghiệm - nghiên cứu công bố không với ngôn ngữ nghiên cứu tiếng Anh mà cịn với nhiều ngơn ngữ khác tiếng Đức, tiếng Pháp, tiếng Nhật,… Trong số cách giải vấn đề đó, nhắc đến phương pháp Centering, Entity - Base, Contrants,… Độ xác thuật toán biến động tùy vào lĩnh vực liệu, nhìn chung đạt kết xác khoảng 70% đến 80% Mặc dù vậy, việc tìm kiếm giải pháp hồn chỉnh cho phân giải đồng tham chiếu tượng tỉnh lược tốn chưa có lời giải Các cách tiếp cận nhiều nhìn chung nhằm vào phân vùng nhỏ tượng đồng tham chiếu tỉnh lược - thường tập trung vào trường hợp nhỏ đồng tham chiếu đại từ, đồng tham  Lớp câu: public class LopCau Vai trò: Dùng để thể cấu trúc câu Thuộc tính private LopTu[] mangtu Mảng từ ngữ private int dodaicau Độ dài câu Phương thức public LopCau() Hàm tạo public int[] TimDaitu() Tìm tất đại từ câu public int[] TimDanhtuRieng() Tìm tất danh từ riêng câu public int[] TimPhanphuCuaDongtu() Tìm tất bổ ngữ động từ câu Public int[] TimDongtu() Tìm tất động từ câu Public int TimChuNgu() Hàm tìm kiếm chủ ngữ Bảng 3.4 Lớp câu  Lớp chuẩn câu: public class LopChuanCau Vai trò: Chuẩn câu gán thuộc tính cho từ câu Thuộc tính TruycapCSDL_Danhtu ketnoi Phương thức Public LopTu[] KhoiTao_mangtu() → Hàm chuẩn câu Bảng 3.5 Lớp chuẩn câu 39  Lớp phát hiện tượng NP – anaphora: public class PhatHien_NpAnaphora Vai trò: Kiểm tra xem câu có xảy tượng NP – anaphora khơng Thuộc tính Phương thức public bool KiemTra() Kiểm tra đồng tham chiếu đại từ câu (Inter) public bool KiemTra2() Kiểm tra đồng tham chiếu đại từ câu khác (Inter) Bảng 3.6 Lớp phát hiện tượng NP – anaphora  Lớp phát hiện tượng VP – anaphora: public class PhatHien_VpAnaphora Vai trò: Kiểm tra xem câu có xảy tượng VP – anaphora khơng Thuộc tính Phương thức public bool KiemTra() Kiểm tra đồng tham chiếu Vp Bảng 3.7 Lớp phát hiện tượng VP – anaphora  Lớp phát hiện tượng S – anaphora: public class PhatHien_SAnaphora Vai trò: Kiểm tra xem câu có xảy tượng S – anaphora khơng Thuộc tính Phương thức public bool KiemTra() Kiểm tra đồng tham chiếu S Bảng 3.8 Lớp phát hiện tượng S – anaphora 40  Lớp phát hiện tượng “One” anaphora: public class PhatHien_OneAnaphora Vai trò:Kiểm tra xem câu có xảy tượng S – anaphora khơng Thuộc tính Phương thức public bool KiemTra() Kiểm tra đồng tham chiếu One Bảng 3.9 Lớp phát hiện tượng “One” anaphora  Lớp xử lý tượng NP – anaphora: public class Xuly_NpAnaphora Vai trò: Xử lý tượng NP – anaphora Thuộc tính Phương thức public void XulyInter(LopCau cau) Xử lý đồng tham chiếu đại từ câu (Inter) public void XulyIntra() Xử lý đồng tham chiếu đại từ câu khác (Inter) Bảng 3.10 Lớp xử lý tượng NP – anaphora  Lớp xử lý tượng VP – anaphora: public class Xuly_VpAnaphora Vai trò: Xử lý tượng VP – anaphora Thuộc tính Phương thức public string XuLy() Xử lý đồng tham chiếu VP – anaphora Bảng 3.11 Lớp xử lý tượng VP – anaphora 41  Lớp xử lý tượng S – anaphora: public class Xuly_SAnaphora Vai trị: Xử lý tượng S – anaphora Thuộc tính Phương thức public string XuLy() Xử lý đồng tham chiếu S – anaphora Bảng 3.12 Lớp xử lý tượng S – anaphora  Lớp xử lý tượng “One” anaphora: public class Xuly_OneAnaphora Vai trò: Xử lý tượng “One” anaphora Thuộc tính Phương thức public string XuLy() Xử lý đồng tham chiếu “One” anaphora Bảng 3.13 Lớp xử lý tượng “One” anaphora 42 3.3.2 Thiết kế giao diện Giao diện chương trình gồm textbox button  Textbox bên trái hiển thị phân tích cú pháp câu đoạn văn sau tagger  Textbox phía bên phải nơi dùng để nhập đoạn văn cần xử lý  Textbox phía bên phải nơi dùng để hiển thị kết xử lý phân giải đồng tham chiếu chương trình Hình 3.3 Form giao diện chương trình 43 Mơ tả hoạt động hệ thống: Khi người dùng nhập đoạn văn vào textbox nhấn button “Xử lý”, chương trình lấy nội dung đoạn văn gán nhãn từ loại đoạn văn chương trình VnTagger Hình 3.4 Form giao diện nhập đoạn văn 44 Các từ câu sau gán nhãn hiển thị theo dạng phân tích cú pháp textbox Sau phân tích cú pháp chương trình phát hiện tượng đồng tham chiếu xuất đoạn văn xử lý Kết xử lý hiển thị textbox Hình 3.5 Form giao diện kết xử lý tượng đồng tham chiếu 3.4 Kết thử nghiệm NP – anaphora: Chương trình giải số vấn đề sau:  Giải đại từ ông ấy, anh ấy, cô Những đại từ tagger gán danh từ đại từ Do chương trình cần phải hậu xử lý sau tagger đại từ để chúng gán đại từ  Xử lý trường hợp đại từ thay đứng đầu câu, câu, cuối câu 45  Xử lý đại từ số nhiều họ, chúng tôi, cách nhóm danh từ tên riêng câu trước  Xử lý trường hợp đầu vào chương trình đoạn văn gồm nhiều câu, đại từ thay danh từ riêng câu cách xa  Xử lý trường hợp câu có đại từ nói đến đối tượng (ví dụ: anh ấy)  Xử lý trường hợp câu có đại từ nói đến đối tượng khác (anh cô ấy) đối tượng câu khác Dưới bảng kiểm thử chương trình: Câu vào Câu Nam lấy bánh bàn ăn Nam lấy bánh bàn ăn bánh Nam lấy bánh bàn Anh Nam lấy bánh bàn Nam ăn ăn bánh Tơ Ngọc Vân họa sĩ tiếng Anh Tô Ngọc Vân họa sĩ tiếng Tô vẽ giỏi nên người thích anh Ngọc Vân vẽ giỏi nên người Hơn nữa, anh thơng thích Tơ Ngọc Vân Hơn nữa, Tơ Ngọc Vân cịn thơng minh minh Lan bác sĩ Tuấn họa sĩ Anh Lan bác sĩ Tuấn họa sĩ Tuấn gặp gặp cô hôm qua Lan hôm qua Nam, Mai Lan sống Hà Nội Nam, Mai Lan sống Hà Tôi gặp họ hôm qua Nội Tôi gặp Nam, Mai Lan hôm qua Lan thấy cá bơi Lan thấy cá bơi hồ Chúng có màu vàng thật đẹp hồ Những cá có màu vàng thật đẹp Bảng 3.14 Kiểm thử NP – anaphora 46 VP – anaphora: Câu vào Lan học Tôi Câu Lan học Tôi học Nam học bổng Tuấn Nam học bổng Tuấn muốn muốn học bổng Dũng học giỏi thông minh Tôi Dũng học giỏi thông minh Tôi muốn muốn học giỏi thông minh Lan ăn kem Tràng Tiền Nhưng Lan ăn kem Tràng Tiền Nhưng không muốn không muốn ăn kem Tràng Tiền Vì trời mưa nên Lan nghỉ học Tuấn Vì trời mưa nên Lan nghỉ học Tuấn nghỉ học Bảng 3.15 Kiểm thử VP – anaphora S – anaphora: Câu vào Câu Bức tranh thuộc trường phái trừu Bức tranh thuộc trường phái trừu tượng Tôi nghĩ tượng Tôi nghĩ tranh thuộc trường phái trừu tượng Minh học giỏi Đó niềm tự hào Minh học giỏi Minh học giỏi gia đình niềm tự hào gia đình Lan mở triển lãm tranh Điều Lan mở triển lãm tranh Lan mở thật thú vị triển lãm tranh thật thú vị Nam bị ốm Tơi nghĩ điều ảnh Nam bị ốm Tôi nghĩ Nam bị ốm hưởng đến kết học tập Nam ảnh hưởng đến kết học tập Nam Trời mưa to Tôi không muốn điều Trời mưa to Tôi không muốn trời mưa to Bảng 3.16 Kiểm thử S – anaphora 47 “One” anaphora: Câu vào Câu Trung tâm nhập nhiều mẫu Trung tâm nhập nhiều mẫu điện thoại Cho xem điện thoại Cho xem khơng? điện thoại khơng? Cửa hàng có nhiều máy tính tốt Cửa hàng có nhiều máy tính tốt Tơi muốn mua Tơi muốn mua máy tính Ở có nhiều loại ô tô Bán Ở có nhiều loại ô tô Bán cho cho tơ Ở có nhiều ghế Tơi lấy Ở có nhiều ghế Tơi lấy cái ghế Bảng 3.17 Kiểm thử “One” anaphora Đánh giá kết Cách tiếp cận khóa luận dựa ý tưởng tổng hợp thuật tốn có tính khả thi độ xác khả thực hóa Tuy nhiên, thực tiễn chứng minh chúng khơng có khả thi độ xác cao tiếng Việt Chương trình đạt kết khả quan với câu văn chứa đồng tham chiếu đơn giản Với câu đơn giản nhập nhằng loại bỏ Với câu phức tạp hơn, xác chương trình bị giảm Các kết sai hay rơi vào trường hợp nhập nhằng ngữ nghĩa câu vấn đề ngơi nhân xưng Cách tiếp cận địi hỏi phải có từ điển chứa thơng tin ngữ nghĩa từ từ điển lại xây dựng thủ công nên số từ chưa nhiều Hơn nữa, chương trình xây dựng để xử lý đoạn văn đơn giản nên sở liệu từ điển chương trình tập trung từ ngữ thơng dụng, phổ biến 48 Chương trình sử dụng lại phần tách từ VnTagger, lấy kết làm đầu vào độ xác chương trình thu có phụ thuộc vào độ xác chương trình VnTagger Hơn thời gian kiểm thử không nhiều nên việc thực thử nghiệm để đưa đánh giá chương trình chưa xác 49 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Kết luận Đề tài “Tìm hiểu tượng phân giải đồng tham chiếu xây dựng ứng dụng” sau nghiên cứu viết chương trình thành cơng giúp máy tính hiểu phần ngơn ngữ tiếng Việt Từ giúp máy tính xử lý câu hội thoại đơn giản cách nhanh chóng mà khơng cần có can thiệp người Do việc nghiên cứu phát triển ứng dụng có tính thực tiễn cao đem lại nhiều hiệu việc xử lý văn tiếng Việt Ưu điểm khuyết điểm khóa luận Ưu điểm  Hiện tượng phân giải đồng tham chiếu văn tiếng Việt  Các cách tiếp cận tượng phân giải đồng tham chiếu: - NP – anphora - VP – anphora - S – anphora - “One” anphora  Tìm hiểu cấu trúc tiếng Việt  Xây dựng cài đặt ứng dụng có độ xác cao câu đơn giản Nhược điểm  Mục tiêu khóa luận hướng tới giải tượng phân giải đồng tham chiếu đoạn văn đơn giản, thời gian cho kiểm thử chưa nhiều chưa thể thực nghiệm hết tất dạng câu tiếng Việt  Việc xây dựng từ điển cấu trúc Semantic cịn phải làm thủ cơng, phức tạp  Mặc dù có kết tốt với trường hợp câu hội thoại đơn giản, nhiên tất cách tiếp cận khác, cách tiếp cận khóa luận sử dụng có giới hạn Ví dụ như:  Thuật tốn chưa tính đến nhập nhằng ngữ cảnh thực tế 50  Từ điển sử dụng thuật toán xây dựng hướng lĩnh vực khơng dựa tồn từ điển từ  Hệ thống chạy đơi cịn chậm  Chưa tập trung giải dạng đồng tham chiếu gặp Hướng giải cho tương lai Còn nhiều hướng phát triển mở rộng khóa luận Việc viết lại câu dạng tham chiếu gặp cịn phức tạp (khơng phải trọng tâm khóa luận), để nâng cao độ xác thuật toán nữa, cần phải kết hợp vào thuật tốn hướng phát triển mới, nghiên cứu việc tổ chức viết lại ngữ pháp câu dựa nội dung câu phía trước khơng phải dựa vào ngữ pháp câu phía trước Khóa luận mở rộng khơng thay cho danh từ, đại từ ghép mà cịn thay cho cụm danh từ - tính từ Sau áp dụng ràng buộc để tìm ứng viên tiền ngữ thích hợp nhất, tiền ngữ gắn chặt với thuộc tính ràng buộc Ví dụ: “cơ ấy” xác định “bác sĩ ” tất đồng tham chiếu sau đến “bác sĩ” yêu cầu nữ không xác định rõ giới tính Ngồi kiểm tra điều kiện ràng buộc danh từ, động từ kèm theo việc kiểm tra ràng buộc tính từ kèm với danh từ Do vậy, hướng phát triển tương lai khóa luận tập trung vào vấn đề sau:  Xây dựng, thử nghiệm thêm tập luật ràng buộc nhằm giảm tối đa nhập nhằng ngữ pháp  Xây dựng tập sở liệu hướng lĩnh vực khác  Nghiên cứu để áp dụng học máy tái cấu trúc câu dựa nội dung câu trước 51 TÀI LIỆU THAM KHẢO [1] Daniel Jurafsky, James H Martin Speech and language processing, Prentice Hall năm 2000 [2] Allen, Jame Natural language understanding, Addision Wesley năm 1995 [3] Lê Thanh Hương “Phân tích cú pháp tiếng Việt”, Luận văn tốt nghiệp thạc sĩ, ĐHBK Hà Nội năm 2000 [4] Diệp Quang Ban Ngữ pháp tiếng Việt, NXB Giáo Dục năm 1998 [5] Nguyễn Hữu Quỳnh Ngữ pháp tiếng Việt, NXB Từ điển Bách Khoa Hà Nội năm 2001 [6] Bộ giáo dục đào tạo Ngữ pháp tiếng Việt, sách Cao đẳng Sư phạm, NXB Giáo dục năm 2000 [7] Jaime G Carbonell Anaphora Resolution : A Multi – Strategy Approach 1988 [8] Alexander Gelbukh, Grigori Sidorov – On Cohenrence Maintenance in Human – Machine Dialogue with Contextual Ellipese - 2001 [9] David I Beaver – The Optimiztion of Discourse Anaphora – 2002 [10] Tatjana Scheffler – Ellipsis, Subsentential Speech and the Contextualism Discussion – 2005 [11] Regina Barzilay – Modeling Local Cohernce : An Entity – Base Approach – 2009 [12] Chương trình tách từ VnTagger tiến sĩ Lê Hồng Phương 52 PHỤ LỤC Yêu cầu cài đặt chương trình:  u cầu máy có DotNetFX40Client  Phần mềm Java Development Kit (JDK)  Coppy thư mục “tagger” từ đĩa CD vào ổ cài đặt hệ điều hành  Cài đặt “phangiai.msi” 54 ... 1: Hiện tượng phân giải đồng tham chiếu Chương 2: Cách tiếp cận tượng phân giải đồng tham chiếu Chương 3: Xây dựng ứng dụng CHƯƠNG 1: HIỆN TƯỢNG PHÂN GIẢI ĐỒNG THAM CHIẾU 1.1 Khái niệm Hiện tượng. .. 1.4 Hiện tượng phân giải đồng tham chiếu văn tiếng Việt 1.5 Ứng dụng 10 1.5.1 Ứng dụng phân giải đồng tham chiếu hệ thống hội thoại 10 1.5.2 Ứng dụng phân giải đồng tham chiếu. .. đề tài ? ?Tìm hiểu tượng phân giải đồng tham chiếu xây dựng ứng dụng ” để làm khóa luận tốt nghiệp 2 Mục đích nghiên cứu  Mục tiêu khóa luận nghiên cứu, tìm hiểu tượng phân giải đồng tham chiếu

Ngày đăng: 16/04/2018, 15:16

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] Allen, Jame. Natural language understanding, Addision Wesley năm 1995 [3] Lê Thanh Hương. “Phân tích cú pháp tiếng Việt”, Luận văn tốt nghiệp thạc sĩ, ĐHBK Hà Nội năm 2000 Sách, tạp chí
Tiêu đề: Phân tích cú pháp tiếng Việt
[1] Daniel Jurafsky, James H. Martin. Speech and language processing, Prentice Hall năm 2000 Khác
[4] Diệp Quang Ban. Ngữ pháp tiếng Việt, NXB Giáo Dục năm 1998 Khác
[5] Nguyễn Hữu Quỳnh. Ngữ pháp tiếng Việt, NXB Từ điển Bách Khoa Hà Nội năm 2001 Khác
[6] Bộ giáo dục và đào tạo. Ngữ pháp tiếng Việt, sách Cao đẳng Sư phạm, NXB Giáo dục năm 2000 Khác
[7] Jaime G Carbonell Anaphora Resolution : A Multi – Strategy Approach - 1988 Khác
[8] Alexander Gelbukh, Grigori Sidorov – On Cohenrence Maintenance in Human – Machine Dialogue with Contextual Ellipese - 2001 Khác
[9] David I Beaver – The Optimiztion of Discourse Anaphora – 2002 Khác
[10] Tatjana Scheffler – Ellipsis, Subsentential Speech and the Contextualism Discussion – 2005 Khác
[11] Regina Barzilay – Modeling Local Cohernce : An Entity – Base Approach – 2009 Khác
[12] Chương trình tách từ VnTagger của tiến sĩ Lê Hồng Phương Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w