BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG Họ tên tác giả luận văn NGUYỄN ĐÌNH LIÊN Tên đề tài luận văn PHƯƠNG PHÁP XỬ LÝ MỘT SỐ DẠNG CÂU HỎI TIẾNG VIỆT CHO CÔNG CỤ TÌM KIẾM THƯ VIỆN ĐIỆN TỬ Chuyên ngành: Luận văn Thạc sĩ Công nghệ thông tin Người hướng dẫn khoa học TS NGUYỄN TUẤN ĐĂNG Đồng Nai, Năm 2011 LỜI CẢM ƠN Trong thời gian gần năm thực luận văn này, ngồi nỗ lực thân, nhận nhiều giúp đỡ từ Thầy, đồng nghiệp, bạn bè gia đình tri thức khoa học động viên khích lệ mặt tinh thần Đây nguồn động lực vô to lớn giúp kịp hồn thành luận văn Nhân đây, tơi xin bày tỏ lòng biết ơn chân thành đến: Thầy TS Nguyễn Tuấn Đăng – người Thầy hướng dẫn tận tâm với học viên Chính Thầy có định hướng đắn suốt trình nghiên khoa học tôi, truyền đạt cho kiến thức chuyên ngành kinh nghiệm nghiên cứu khoa học Thầy quan tâm, động viên gặp khó khăn đồng thời tạo điều kiện thuận lợi cho suốt thời gian thực đề tài Thầy TS Trần Hành Thầy PGS.TS Trần Văn Lăng có dẫn thiết thực cho học viên việc lựa chọn thực đề tài luận văn Các thành viên nhóm NLKE thầy Nguyễn Tuấn Đăng làm chủ nhiệm Thông qua trao đổi bạn diễn đàn, thu thập nhiều kiến thức cho thân góp phần hoàn thành luận văn Các Thầy Ban Giám Hiệu đồng nghiệp Trung tâm Thông tin tư liệu trường Đại học Lạc Hồng tạo điều kiện mặt thời gian giúp tơi hồn tất luận văn Gia đình nguồn động lực lớn lao chỗ dựa tinh thần vững giúp vượt qua khó khăn ln vững tin vào thành công Đồng Nai, Tháng năm 2011 MỤC LỤC CHƯƠNG 1: TỔNG QUAN 1.1 ĐẶT VẤN ĐỀ 1.2 MỤC TIÊU ĐỀ TÀI 1.3 PHẠM VI NGHIÊN CỨU 1.4 NỘI DUNG NGHIÊN CỨU 1.5 ĐÓNG GÓP MỚI CỦA ĐỀ TÀI 1.6 BỐ CỤC LUẬN VĂN CHƯƠNG 2: MƠ HÌNH VÀ KIẾN TRÚC HỆ THỐNG 2.1 VẤN ĐỀ XÂY DỰNG CƠNG CỤ TÌM KIẾM THƯ VIỆN ĐIỆN T 2.2 CHỨC NĂNG HỆ THỐNG 2.3 KIẾN TRÚC HỆ THỐNG 2.3.1 Tiền xử lý câu hỏi 2.3.2 Phân tích cú pháp câu hỏi b ng UBG 2.3.3 Phát sinh câu truy vấn SQL 10 2.3.4 Xử lý kết truy vấn sở liệu 11 2.4 CÁC QUI TẮC CÚ PHÁP 12 2.5 PHÁT SINH TRUY VẤN TỪ CẤU TRÚC CÚ PHÁP 13 CHƯƠNG 3: PHÂN TÍCH CÚ PHÁP CÂU HỎI TIẾNG VIỆT BẰNG UNIFICATION-BASED GRAMMAR 15 3.1 LÝ THUYẾT UNIFICATION-BASED GRAMMAR 15 3.1.1 Giới thiệu Unification-Based Grammar 15 3.1.2 Cấu trúc đặc tính (Feature Structures) 17 3.1.3 Các phép toán cấu trúc đặc tính 19 A Phép So sánh (Subsumption) 19 B Phép hợp (Unification) 21 C Phép tổng quát (generalization) 22 3.1.4 3.2 Biểu diễn cấu trúc đặc tính Prolog 23 PHÂN TÍCH CÚ PHÁP CÂU HỎI TIẾNG VIỆT BẰNG UNIFICATION-BASED GRAMMAR 24 3.2.1 Xây dựng tập luật sinh 24 3.2.2 Tập câu hỏi mô tả b ng UBG 28 A Các câu hỏi tác giả 28 B Các câu hỏi sách tác giả 30 C Các câu hỏi tác giả nhà xuất 32 D Các câu hỏi sách 34 E Các câu hỏi nhà xuất 37 F Các câu hỏi sách nhà xuất 40 G Các câu hỏi năm xuất 41 H Các câu hỏi sách năm xuất 42 CHƯƠNG 4: XÂY DỰNG CHƯƠNG TRÌNH 45 4.1 XÂY DỰNG CÁC THÀNH PHẦN HỆ THỐNG 45 4.2 THÀNH PHẦN TIỀN X LÝ CÂU HỎI 45 4.2.1 Bước tách tham số câu 46 4.2.2 Bước loại bỏ ký tự thừa 46 4.2.3 Bước chuyển mã tiếng Việt 47 4.3 THÀNH PHẦN PHÂN TÍCH CÂU HỎI BẰNG UBG 50 4.3.1 Tách từ nhân diện từ loại 50 4.3.2 Chuyển câu hỏi cú pháp UBG 54 4.3.3 Phát sinh cú pháp 55 4.4 THÀNH PHẦN PHÁT SINH CÂU TRUY VẤN SQL 56 4.4.1 Tìm cấu trúc phù hợp 56 4.4.2 Phát sinh thực thi câu lệnh SQL 57 4.5 THÀNH PHẦN X LÝ KẾT QUẢ TRUY VẤN 58 4.5.1 Câu lệnh SQL trả giá trị 59 4.5.2 Lệnh SQL không trả giá trị 59 4.5.3 Tìm cấu trúc gần 59 4.5.4 Khơng tìm cấu trúc gần 60 4.6 CÀI ĐẶT CHƯƠNG TRÌNH 60 4.6.1 Công nghệ sử dụng 60 4.6.2 Cài đặt sử dụng hệ thống 61 CHƯƠNG 5: KẾT LUẬN 65 5.1 ĐÁNH GIÁ HỆ THỐNG 65 5.2 ĐỊNH HƯỚNG PHÁT TRIỂN 65 TÀI LIỆU THAM KHẢO PHỤ LỤC: CÁC CÂU HỎI KIỂM TRA HỆ THỐNG DANH MỤC CHỮ VIẾT TẮT UBG – Unification-Based Grammar: Văn phạm dựa hợp CFG – Context Free Grammar: Văn phạm phi ngữ cảnh BNF – Backus Naur Form: Ký pháp mô tả cú pháp ngôn ngữ EBNF – Extended Backus Naur Form: Ký pháp mô tả cú pháp ngôn ngữ mở rộng ANTLR – ANother Tool for Language Recognition: Bộ công cụ phân tích cú pháp LEX – Lexical Analyser: Bộ cơng cụ phân tích từ vựng YACC – Yet Another Compiler Compiler: Bộ cơng cụ phân tích cú pháp PROLOG – PROgramming in LOGic: Một ngơn ngữ lập trình SQL – Structured Query Language: Một ngơn ngữ truy vấn liệu có câu trúc CSDL: Cơ sở liệu DANH MỤC HÌNH Hình 2.1 – Mơ hình chức hệ thống Hình 2.2 – Mơ hình kiến trúc hệ thống Hình 2.3 – Sơ đồ q trình phân tích cú pháp câu hỏi b ng UBG 10 Hình 2.4 – Sơ đồ xác định thực thi câu truy vấn 12 Hình 2.5 – Sơ đồ chuyển câu hỏi câu truy vấn SQL 14 Hình 3.1 – Cấu trúc đặc tính có giá trị ngun tử 17 Hình 3.2 – Cấu trúc đặc tính có giá trị cấu trúc 18 Hình 3.3 – Biểu diễn cấu trúc đặc tính b ng đồ thị 18 Hình 3.4 – Đồ thị biểu diễn cấu trúc đặc tính có reentrancy 19 Hình 3.5 – Cấu trúc đặc tính có reentrancy 19 Hình 3.6 – Hai cấu trúc đặc tính gộp 20 Hình 3.7 – Cấu trúc đặc tính gộp cấu trúc đặc tính 20 Hình 3.8 – Hai cấu trúc đặc tính khơng có phép gộp 20 Hình 3.9 – Hợp cấu trúc đặc tính 21 Hình 3.10 – Hai cấu trúc đặc tính khơng hợp 21 Hình 3.11 – Tổng quát cấu trúc đặc tính 22 Hình 3.12 – Cấu trúc đặc tính có giá trị ngun tử 23 Hình 3.13 – Cấu trúc đặc tính có giá trị cấu trúc 24 Hình 3.14 – Cấu trúc đặc tính có reentrancy 24 Hình 4.1 – Các Mơ hình liệu hệ thống 45 Hình 4.2 – Lưu đồ thao tác loại bỏ ký tự thừa 47 Hình 4.3 – Biểu diễn thành phần Token 50 Hình 4.4 – Lưu đồ phân tích cú pháp câu hỏi b ng UBG 54 Hình 4.5 – Phát sinh cú pháp 56 Hình 4.6 – Phát sinh câu lệnh SQL 58 Hình 4.7 – Giao diện nhận câu hỏi 61 Hình 4.8 – Giao diện nhận câu hỏi gần 62 Hình 4.9 – Giao diện liệt kê dạng câu hỏi 63 Hình 4.10 – Giao diện gặp câu hỏi khác biệt 63 Hình 4.11 – Giao diện câu hỏi không trả thông tin 64 DANH MỤC BẢNG Bảng 2.1 – Mô tả trường thông tin Bảng 3.1 – Tập luật sinh 25 Bảng 3.2 – Các câu hỏi tác giả 28 Bảng 3.3 – Các câu hỏi sách tác giả 31 Bảng 3.4 – Các câu hỏi tác giả nhà xuất 32 Bảng 3.5 – Các câu hỏi sách 34 Bảng 3.6 – Các câu hỏi nhà xuất 37 Bảng 3.7 – Các câu hỏi sách nhà xuất 40 Bảng 3.8 – Các câu hỏi năm xuất 41 Bảng 3.9 – Các câu hỏi sách năm xuất 42 Bảng 4.1 – Bảng liệt kê số TOKEN 51 CHƯƠNG TỔNG QUAN 1.1 ĐẶT VẤN ĐỀ Trong năm gần đây, vấn đề nghiên cứu xây dựng cơng cụ tìm kiếm b ng truy vấn tiếng Việt cho thư viện triển khai đạt số kết ban đầu, qua cơng trình nghiên cứu: [1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12] Một số nhận định tổng quan tình hình nghiên cứu lĩnh vực trình bày [10] Một đặc điểm chung cơng trình nghiên cứu nói sử dụng văn phạm phi ngữ cảnh (CFG: Context-Free Grammar) để xử lý cú pháp cho câu hỏi tiếng Việt Mặc dù đơn giản mơ hình văn phạm CFG có nhiều hạn chế, đặc biệt vấn đề xử lý ràng buộc ngữ pháp Trong hướng nghiên cứu với cơng trình nói ([1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12]) với cách tiếp cận hoàn toàn khác, đề tài sử dụng mô hình văn phạm UBG (Unification-Based Grammar) để phân tích cú pháp cho câu hỏi tiếng Việt Trên nguyên tắc, mơ hình văn phạm UBG cho phép khắc phục nhiều nhược điểm CFG, vấn đề triển khai cài đặt UBG có khó khăn, phức tạp riêng 1.2 MỤC TIÊU ĐỀ TÀI Đề tài tập trung nghiên cứu vấn đề sử dụng mô hình văn phạm UBG để xây dựng phương pháp xử lý dạng câu hỏi tiếng Việt dùng cơng cụ tìm kiếm thư viện điện tử b ng truy vấn tiếng Việt Trên sở đó, đề 62 Tiếp theo giao diện chương trình nhận câu hỏi không cú pháp định nghĩa trước, chương trình thử tìm câu hỏi thay theo thơng tin nhận từ câu hỏi Hình 4.8 – Giao diện nhận câu hỏi gần Chương trình cần hướng dẫn người sử dụng cách đặt câu hỏi cho phù hợp với cú pháp định nghĩa sẵn hệ thống Công việc thể Hình 4.9 Các trường hợp khác nhận câu hỏi hoàn toàn khác biệt so với dạng câu hỏi khai báo sẵn hệ thống (Hình 4.10), câu hỏi cú pháp khơng có kết truy vấn liệu (Hình 4.11) tính đến 63 Hình 4.9 – Giao diện liệt kê dạng câu hỏi Hình 4.10 – Giao diện gặp câu hỏi khác biệt 64 Hình 4.11 – Giao diện câu hỏi không trả thông tin 65 CHƯƠNG KẾT LUẬN 5.1 ĐÁNH GIÁ HỆ THỐNG Từ tập luật sinh bảng 3.2, tiến hành xây dựng 64 luật cú pháp để đáp ứng tập 72 câu hỏi chuẩn xác định khảo sát, thiết lập chương trình dựa tập luật cú pháp nêu Khi kiểm tra lại hệ thống với tập 72 câu hỏi chuẩn, hệ thống chạy ổn định, không phát sinh lỗi cho kết đạt độ xác 100% Kết cho thấy hệ thống đáp ứng đầy đủ mục tiêu đề Ngồi chúng tơi tiến hành thử nghiệm hệ thống với 120 câu hỏi kiểm tra ngẫu nhiên Sau kiểm tra hệ thống với câu hỏi thử nghiệm, chúng tơi có đánh sau: - Các câu hỏi đề cập trực tiếp, n m dạng thức xác định hệ thống xử lý xác - Các câu hỏi có tính gián tiếp có chứa ẩn ý, hỏi vịng không trả kết - Các câu hỏi không xác định rõ ràng tham số tìm kiếm không trả kết 5.2 ĐỊNH HƯỚNG PHÁT TRIỂN Từ kết đạt đề tài, chúng tơi có số nhận định việc định hướng phát triển đề tài tương lai: - Nghiên cứu cải tiến qui tắc cú pháp linh hoạt - Bổ sung thêm dạng câu hỏi để nâng cao mức đáp ứng hệ thống, mở rộng thơng tin truy vấn 66 - Tìm kiếm giải pháp để phát tham số câu hỏi cách thông minh - Xây dựng cơng cụ kiểm tra tiếng Việt tích hợp vào chương trình để cảnh báo người dùng nhập sai cú pháp - Lưu lại câu hỏi không cú pháp thông báo đến người quản trị dạng câu hỏi lặp lại nhiều lần để bổ sung vào hệ thống 67 TÀI LIỆU THAM KHẢO Ti ng Vi t [1] Báo cáo khoa học nghiệm thu đề tài NCKH cấp Đại học Quốc gia TP HCM, Xây dựng công cụ tra cứu kho học liệu mở Việt nam với chức hỏi-đáp tiếng Việt, mã số: B2009-26-01 Hội đồng nghiệm thu đề tài ngày 16/08/2010, Trường Đại học Công nghệ thông tin Chủ nhiệm đề tài: TS Nguyễn Tuấn Đăng [2] Lương Q Tịnh Hà, Xây dựng cơng cụ tìm kiếm tài liệu học tập truy vấn ngôn ngữ tự nhiên kho học liệu mở Tiếng Việt, Luận văn Thạc sỹ ngành Công nghệ thông tin, Trường Đại học Công nghệ thông tin, Đại học Quốc gia TP HCM, 2009 [3] Nguyễn Vũ Huy, Một số phương pháp kỹ thuật nâng cao hiệu xử lý dạng câu hỏi tiếng Việt đơn giản cho cơng cụ tìm kiếm thư viện học liệu mở, Khóa luận tốt nghiệp đại học, hệ Cử nhân Tài năng, ngành Khoa học máy tính, Trường Đại học Cơng nghệ thơng tin, Đại học Quốc gia TP Hồ Chí Minh, 2010 [4] Lý Thiên Trang, Mơ hình cơng cụ tìm kiếm truy vấn tiếng Việt ứng dụng cho thư viện trường đại học, Luận văn Thạc sỹ ngành Công nghệ thông tin, Trường Đại học Công nghệ thông tin, Đại học Quốc gia TP HCM, 2009 68 Ti ng Anh [5] Dang Tuan Nguyen, Ha Quy-Tinh Luong, "A framework for building Vietnamese language query processing components in e-library searching systems", International Conference on Information Technology (ICIT 2009), October 28-30, 2009, Venice, Italy Proceedings of World Academy of Science, Engineering and Technology, pp 1354-1358, vol 58, October 2009 ISBN: 2070-3724 [6] Dang Tuan Nguyen, Ha Quy-Tinh Luong, Tuyen Thi-Thanh Do, "Building a Vietnamese language query processing framework for elibrary searching systems", International Journal of Computer Science and Information Security (IJCSIS), pp 092-096, vol 6, no 1, October 2009 ISSN: 1947-5500 [7] Dang Tuan Nguyen, Ha Quy-Tinh Luong, "Document searching system based on natural language query processing for Vietnam Open Courseware library", International Journal of Computer Science Issues (IJCSI), pp 7-13, vol 6, no 2, November 2009 ISSN (online): 16940784, ISSN (print): 1694-0814 [8] Dang Tuan Nguyen, Tuan Ngoc Pham, Quoc Tan Phan, "A Semantic Model for Building the Vietnamese Language Query Processing Framework in e-Library Searching Application", Proceedings of the 2nd International Conference on Machine Learning and Computing (ICMLC 2010), pp 179-183, February 9-11, 2010, Bangalore, India ISBN: 978-0-7695-3977-5 Editions IEEE 69 [9] Dang Tuan Nguyen, Huy Vu Nguyen, Quoc Tan Phan, "Using the Vietnamese Language Query Processing Framework to Build a Courseware Searching System", The 2010 International Conference on Telecom Technology and Applications (ICTTA 2010), Proceedings of the 2010 Second International Conference on Computer Engineering and Applications, vol 2, pp 117-121, March 19 - 21, 2010, Bali Island, Indonesia ISBN: 978-0-7695-3982-9 Editions IEEE [10] Dang Tuan Nguyen, Ha Quy-Tinh Luong, Quoc Tan Phan, "An eLibrary Searching System Based on the Vietnamese Language Query Processing Framework", The 2010 International Conference on Information and Emerging Technologies (ICIET 2010), Proceedings of the 2010 Second International Conference on Computer Engineering and Applications, vol 2, pp 517-520, March 19 - 21, 2010, Bali Island, Indonesia ISBN: 978-0-7695-3982-9 Editions IEEE [11] Dang Tuan Nguyen, An Hoai Vo, Phuc Tri Nguyen, "Semantic Model for Representing Vietnamese Questions in OpenCourseWare Retrieval System", Proceedings of the 2011 3rd International Conference on Machine Learning and Computing (ICMLC 2011), vol 4, pp 331-335, February 26-28, 2011, Singapore ISBN: 978-1-4244-9252-7 Editions IEEE [12] Dang Tuan Nguyen, An Hoai Vo, Phuc Tri Nguyen, "Understanding the Vietnamese Questions in OpenCourseWare Retrieval System", Proceedings of the 2011 3rd International Conference on Machine Learning and Computing (ICMLC 2011), vol 4, pp 327-330, February 26-28, 2011, Singapore ISBN: 978-1-4244-9252-7 Editions IEEE 70 [13] Vlado Keselj, “Question Answering Using Unification-based Grammar”, Advances in Artificial Intelligence, 14th Biennial Conference of the Canadian Society for Computational Studies of Intelligence, AI 2001 Ottawa, Canada, June 7–9, 2001, Proceedings, Springer-Verlag London, UK ©2001 ISBN: 3-540-42144-0 [14] Bob Neveln, Bob Alps (January 16, 2011), Unification-Based Grammar, [Online] http://www.proofcheck.org/ [15] Patrick Blackburn, Kristina Striegnitz (2002), Natural Language Processing Techniques in Prolog, [Online] http://cs.union.edu/~striegnk/courses/nlp-with-prolog/html/index.html 71 PHỤ LỤC CÁC CÂU HỎI KIỂM TRA HỆ THỐNG Các câu hỏi tác giả Hãy cho biết sách "Đồ họa máy tính" tác giả viết vậy? Hãy cho biết sách "Đồ họa máy tính" viết vậy? Hãy cho biết viết sách "Đồ họa máy tính" vậy? Hãy cho biết tác giả viết sách "Đồ họa máy tính" vậy? Hãy cho biết tác giả sách "Đồ họa máy tính" có tên vậy? Hãy cho biết tác giả sách "Đồ họa máy tính" vậy? Hãy cho biết tác giả sách "Đồ họa máy tính" vậy? Hãy cho biết sách "Đồ họa máy tính" có tác giả tên vậy? Hãy cho biết sách "Đồ họa máy tính" có tác giả vậy? 10 Hãy cho biết có tác giả viết sách thuộc chủ đề "Anh ngữ" vậy? 11 Hãy cho biết có viết sách thuộc chủ đề "Anh ngữ" vậy? 12 Hãy cho biết thuộc chủ đề "Anh ngữ" có tác giả viết sách vậy? 13 Hãy cho biết thuộc chủ đề "Anh ngữ" có viết sách vậy? 72 Các câu hỏi sách tác giả 14 Có phải tác giả "Hoàng Huệ" viết sách "Xử lý nước thải" khơng vậy? 15 Tác giả "Hồng Huệ" có phải viết sách "Xử lý nước thải" không vậy? 16 Tác giả "Hoàng Huệ" viết sách "Xử lý nước thải" có phải khơng vậy? 17 Có phải sách "Xử lý nước thải" tác giả "Hồng Huệ" viết khơng vậy? 18 Quyển sách "Xử lý nước thải" có phải tác giả "Hồng Huệ" viết không vậy? 19 Quyển sách "Xử lý nước thải" tác giả "Hồng Huệ" viết có phải không vậy? Các câu hỏi tác giả nhà xuất ản 20 Có phải tác giả "Charles Dickens" có sách nhà xuất "Lao động" phát hành không vậy? 21 Hãy cho biết sách tác giả "Charles Dickens" có nhà xuất "Lao động" phát hành không vậy? 22 Hãy cho biết sách viết tác giả "Charles Dickens" có nhà xuất "Lao động" phát hành không vậy? 23 Hãy cho biết nhà xuất "Lao động" có phát hành sách tác giả "Charles Dickens" không vậy? 24 Hãy cho biết nhà xuất "Lao động" có phát hành sách tác giả "Charles Dickens" viết không vậy? 25 Hãy cho biết sách phát hành nhà xuất "Lao động" có tác giả "Charles Dickens" khơng vậy? 73 Các câu hỏi nhà xuất ản 26 Hãy cho biết sách "Tin học đại cương" nhà xuất phát hành vậy? 27 Hãy cho biết sách "Tin học đại cương" nơi phát hành vậy? 28 Hãy cho biết nơi phát hành sách "Tin học đại cương" vậy? 29 Hãy cho biết nhà xuất phát hành sách "Tin học đại cương" vậy? 30 Hãy cho biết nhà xuất sách "Tin học đại cương" có tên vậy? 31 Hãy cho biết nơi nhà xuất sách "Tin học đại cương" vậy? 32 Hãy cho biết nhà xuất sách "Tin học đại cương" nơi vậy? 33 Hãy cho biết sách "Tin học đại cương" có nhà xuất tên vậy? 34 Hãy cho biết sách "Tin học đại cương" có nhà xuất nơi vậy? 35 Hãy cho biết có nhà xuất phát hành sách thuộc chủ đề "Cơ khí" vậy? 36 Hãy cho biết có nơi phát hành sách thuộc chủ đề "Cơ khí" vậy? 37 Hãy cho biết thuộc chủ đề "Cơ khí" có nhà xuất phát hành sách vậy? 38 Hãy cho biết thuộc chủ đề "Cơ khí" có nơi phát hành sách vậy? 74 Các câu hỏi sách nhà xuất ản 39 Có phải nhà xuất "Giáo dục" phát hành sách "Thiên nhiên Việt Nam" không vậy? 40 Nhà xuất "Giáo dục" có phải phát hành sách "Thiên nhiên Việt Nam" không vậy? 41 Nhà xuất "Giáo dục" phát hành sách "Thiên nhiên Việt Nam" có phải khơng vậy? 42 Có phải sách "Thiên nhiên Việt Nam" nhà xuất "Giáo dục" phát hành không vậy? 43 Quyển sách "Thiên nhiên Việt Nam" có phải nhà xuất "Giáo dục" phát hành không vậy? 44 Quyển sách "Thiên nhiên Việt Nam" nhà xuất "Giáo dục" phát hành có phải khơng vậy? Các câu hỏi sách 45 Hãy cho biết có sách tác giả "Hoàng Lê Minh" viết vậy? 46 Hãy cho biết tác giả "Hoàng Lê Minh" có viết sách vậy? 47 Hãy cho biết sách có tác giả "Hoàng Lê Minh" vậy? 48 Hãy cho biết tác giả "Hoàng Lê Minh" soạn giả sách nào? 49 Hãy cho biết có sách tác giả "Hoàng Lê Minh" vậy? 50 Hãy cho biết có sách nhà xuất "Đồng Nai" phát hành vậy? 75 51 Hãy cho biết nhà xuất "Đồng Nai" có phát hành sách vậy? 52 Hãy cho biết sách có nhà xuất "Đồng Nai" vậy? 53 Hãy cho biết nhà xuất "Đồng Nai" nhà phát hành sách nào? 54 Hãy cho biết có sách nhà xuất "Đồng Nai" vậy? 55 Hãy cho biết có sách thuộc chủ đề "Kế toán" vậy? 56 Hãy cho biết thuộc chủ đề "Kế tốn" có sách vậy? 57 Hãy cho biết có sách viết vào năm "2009" vậy? 58 Hãy cho biết vào năm "2009" có sách viết vậy? 59 Hãy cho biết có sách phát hành vào năm "2010" vậy? 60 Hãy cho biết vào năm "2010" có sách phát hành vậy? Các câu hỏi năm xuất ản 61 Hãy cho biết sách "Vật lý Phân tử" viết vào năm vậy? 62 Hãy cho biết vào năm sách "Vật lý Phân tử" viết vậy? 76 63 Hãy cho biết sách "Cơ học Lượng tử" phát hành vào năm vậy? 64 Hãy cho biết vào năm sách "Cơ học Lượng tử" phát hành vậy? Các câu hỏi sách năm xuất ản 65 Có phải sách "Tốn rời rạc" viết vào năm "2005" không vậy? 66 Quyển sách "Toán rời rạc" viết vào năm "2005" có phải khơng vậy? 67 Vào năm "2005" có phải sách "Toán rời rạc" viết khơng vậy? 68 Vào năm "2005" sách "Tốn rời rạc" viết có phải khơng vậy? 69 Có phải sách "Hệ tư tưởng Đức" phát hành vào năm "2005" không vậy? 70 Quyển sách "Hệ tư tưởng Đức" phát hành vào năm "2005" có phải khơng vậy? 71 Vào năm "2005" có phải sách "Hệ tư tưởng Đức" phát hành không vậy? 72 Vào năm "2005" sách "Hệ tư tưởng Đức" phát hành có phải không vậy? ... dụng mơ hình văn phạm UBG để xây dựng phương pháp xử lý dạng câu hỏi tiếng Việt dùng công cụ tìm kiếm thư viện điện tử b ng truy vấn tiếng Việt Trên sở đó, đề tài phát triển cơng cụ tìm kiếm b ng... kiếm b ng truy vấn tiếng Việt cho thư viện điện tử trường đại học, áp dụng cho trường Đại học Lạc Hồng Công cụ cho phép xử lý câu hỏi tiếng Việt có nội dung liên quan đến thơng tin mô tả tài liệu... CỦA ĐỀ TÀI Đề tài xây dựng phương pháp xử lý câu hỏi tiếng Việt cho cơng cụ tìm kiếm thư viện điện tử trường Đại học Lạc Hồng với số đặc thù riêng: - Xây dựng hoàn toàn văn phạm hạn chế dựa UBG