những nguyên tắc sáng tạo ứng dụng trong mô hình xử lý cú pháp và ngữ nghĩa cho câu hỏi tiếng việt trong hệ thống tìm kiếm thư viện

31 661 0
những nguyên tắc sáng tạo ứng dụng trong mô hình xử lý cú pháp và ngữ nghĩa cho câu hỏi tiếng việt trong hệ thống tìm kiếm thư viện

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN  BÀI BÁO CÁO MÔN HỌC PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC Đề tài: NHỮNG NGUYÊN TẮC SÁNG TẠO ỨNG DỤNG TRONG MƠ HÌNH XỬ LÝ CÚ PHÁP VÀ NGỮ NGHĨA CHO CÂU HỎI TIẾNG VIỆT TRONG HỆ THỐNG TÌM KIẾM THƯ VIỆN Giảng viên hướng dẫn: GS.TSKH HOÀNG KIẾM Học viên thực hiện: NGUYỄN TRÍ PHÚC Mã số: CH1101121 TP Hồ Chí Minh, tháng năm 2012 LỜI MỞ ĐẦU “Nhân chi sơ tính sáng tạo” Thật vậy, sáng tạo tài nguyên người Sáng tạo phương châm động lực phát triển cho xã hội từ người biết suy nghĩ Nhờ có tư sáng tạo,chúng ta cải tiến cơng nghệ, làm cho vấn đề gặp phải sống thực theo đơn giản phù hợp Sáng tạo chất người nhiên hẳn có nhiều người tự hỏi “Vì tơi có q cải tiến sáng tạo?”, “Làm để tạo nhiều cải tiến công việc?”… Để tạo ý tưởng, cải tiến cần phải có phương pháp luận (các nguyên tắc, phương pháp, lý thuyết) tư sáng tạo đổi Điều giúp có kỹ thực hành suy nghĩ để giải vấn đề đưa ý tưởng đổi sáng tạo Trong báo cáo này, tơi trình bày phương pháp luận tư sáng tạo, đổi kèm theo phân tích ứng dụng ngun tắc sáng tạo, đổi vào mơ hình xử lý cú pháp ngữ nghĩa cho câu hỏi tiếng Việt hệ thống tìm kiếm thư viện TP Hồ Chí Minh, tháng năm 2012 Nguyễn Trí Phúc MỤC LỤC DANH MỤC HÌNH DANH MỤC BẢNG PHẦN 1: PHƯƠNG PHÁP LUẬN VỀ TƯ DUY SÁNG TẠO VÀ ĐỔI MỚI 1.1 Khái niệm 1.2 Ý nghĩa 1.3 Nội dung 1.3.1 Năm phương pháp giải vấn đề khoa học phát minh, sáng chế 1.3.2 Bốn mươi nguyên tắc sáng tạo 1.3.3 Các phương pháp giải vấn đề tổng quát 10 PHẦN 2: ỨNG DỤNG NGUYÊN TẮC SÁNG TẠO VÀO MƠ HÌNH XỬ LÝ CÚ PHÁP VÀ NGỮ NGHĨA CHO CÂU HỎI TIẾNG VIỆT TRONG HỆ THỐNG TÌM KIẾM THƯ VIỆN 12 2.1 Tổng quan toán 12 2.1.1 Đặt vấn đề 12 2.1.2 Mục tiêu đề tài 12 2.1.3 Phạm vi nghiên cứu 12 2.2 Mơ hình hệ thống tìm kiếm tài liệu chuỗi truy vấn tiếng Việt 13 2.2.1 Kiến trúc hệ thống 13 2.2.2 Ontology học liệu mở 14 2.3 Mơ hình cú pháp 20 2.4 Mơ hình ngữ nghĩa 21 2.5 Phương pháp sinh mã truy vấn SPARQL 21 2.6 Cơ chế tạo sinh câu trả lời 22 2.7 Những nguyên tắc sáng tạo ứng dụng 22 2.7.1 Nguyên tắc phân nhỏ 22 2.7.2 Nguyên tắc tách khỏi 23 2.7.3 Nguyên tắc cục 23 2.7.4 Nguyên tắc kết hợp 23 2.7.5 Nguyên tắc chứa 23 2.7.6 Nguyên tắc dự phòng 24 2.7.7 Nguyên tắc giải thiếu thừa 24 2.7.8 Nguyên tắc chép 24 KẾT LUẬN 25 TÀI LIỆU THAM KHẢO 26 DANH MỤC HÌNH Hình 1: Mơ hình giải vấn đề tổng quát 10 Hình 1: Kiến trúc hệ thống tìm kiếm tài liệu dựa chế xử lý câu hỏi tiếng Việt 14 DANH MỤC BẢNG Bảng 1: Năm phương pháp giải vấn đề khoa học phát minh, sáng chế Bảng 2: Các thành phần hệ thống tìm kiếm tài liệu chuỗi truy vấn tiếng Việt 13 Bảng 3: Thống kê số lượng giáo trình thư viện học học liệu mở 15 Bảng 4: Tổng hợp thông tin mô tả học liệu mở cho thư viện 16 Bảng 5: Các class ontology học liệu mở 16 Bảng 6: Object properties ontology học liệu mở 17 Bảng7: Datatype properties ontology học liệu mở 18 Bảng 8: Mô tả quan hệ lớp ontology học liệu mở 20 Bảng 9: Các cấu trúc tổng quát câu hỏi tiếng Việt 21 Bảng 10:Chức thành phần mơ hình hệ thống 23 Bảng 11:Chức thành phần mơ hình hệ thống 24 PHẦN 1: PHƯƠNG PHÁP LUẬN VỀ TƯ DUY SÁNG TẠO VÀ ĐỔI MỚI 1.1 Khái niệm Phương pháp luận sáng tạo đổi phần ứng dụng Khoa học sáng tạo, bao gồm hệ thống phương pháp kĩ cụ thể giúp nâng cao suất hiệu quả, lâu dài tiến tới điều khiển tư sáng tạo người sử dụng 1.2 Ý nghĩa Suốt đời, người dùng suy nghĩ nhiều (có thể nói ngày) Từ việc trả lời câu hỏi bình thường “Hơm ăn gì? Mặc gì?Làm gì?Mua gì?Xem gì? Đi đâu? ” đến làm tập trường lớp, chọn ngành nghề đào tạo, lo sức khỏe, việc làm, thu nhập, hôn nhân, nhà ở, giải vấn đề nảy sinh công việc, quan hệ xã hội, gia đình, ni dạy cái… đòi hỏi phải suy nghĩ chắn muốn suy nghĩ tốt, định để “đời bể khổ” trở thành “bể sướng” Chúng ta đào tạo làm ngành nghề khác có lẽ có nghề chung, giữ nguyên suốt đời cần thiết cho tất người.Đó “nghề” suy nghĩ hành động giải vấn đề gặp phải suốt đời nhằm thỏa mãn nhu cầu đáng cá nhân mình, đồng thời thỏa mãn nhu cầu để xã hội tồn phát triển Nhìn góc độ này, Phương Pháp Luận Sáng Tạo Và Đổi Mới giúp trang bị loại nghề chung nói trên, góp phần bổ sung cho giáo dục, đào tạo nay, chủ yếu đào tạo nhà chuyên môn Nhà chun mơn giải tốt vấn đề chuyên môn nhiều không giải tốt vấn đề ngồi chun mơn, khơng thực hạnh phúc ý Các nghiên cứu cho thấy, phần lớn người thường suy nghĩ cách tự nhiên lại, ăn uống, hít thở mà suy nghĩ suy nghĩ xem hoạt động để cải tiến, làm suy nghĩ trở nên tốt người ta thường cải tiến dụng cụ, máy móc dùng sinh hoạt cơng việc Cách suy nghĩ tự nhiên nói có suất, hiệu thấp nhiều trả giá đắt cho định sai Tóm lại, cách suy nghĩ tự nhiên ứng với việc lao động xẻng Phương Pháp Luận Sáng Tạo Và Đổi Mới máy xúc với suất hiệu cao nhiều Nếu xem não người máy tính tinh xảo – đỉnh cao tiến hóa phát triển tự nhiên phần mềm (cách suy nghĩ) tự nhiên kèm với khai thác phần nhỏ tiềm não.Phương Pháp Luận Sáng Tạo Và Đổi Mới phần mềm tiên tiến giúp máy tính – não hoạt động tốt nhiều.Nếu cần “học ăn, học nói, học gói, học mở” “học suy nghĩ” cần thiết cho tất người Tóm lại, Phương Pháp Luận Sáng Tạo Và Đổi Mới đóng góp tích cực việc biến thơng tin thành tri thức, tri thức biết thành tri thức với ích lợi tồn diện, khơng riêng mặt kinh tế 1.3 Nội dung 1.3.1 Năm phương pháp giải vấn đề khoa học phát minh, sáng chế STT Phương pháp Dựng Vepol đầy đủ Chuyển sang Fepol Phá Vepol Xích Vepol Liên trường Bảng 1: Năm phương pháp giải vấn đề khoa học phát minh, sáng chế 1.3.2 Bốn mươi nguyên tắc sáng tạo Nhà khoa học Atshuler suốt trình làm việc đưa hệ thống nguyên tắc sáng tạo Nó cung cấp hệ thống cách xem xét vật; tăng tính nhanh nhạy việc tiếp thu đánh giá giá trị thông tin; đưa lựa chọn cách tiếp cận thích hợp để giải vấn đề Hệ thống nguyên tắc sáng tạo giúp cho xây dựng tác phong, suy nghĩ làm việc cách khoa học, sáng tạo; góp phần xây dựng tư biện chứng Dưới xin điểm qua 40 nguyên tắc đó: 1/ Nguyên tắc phân nhỏ:  Chia đối tượng thành thành phần độc lập  Làm đối tượng thành thành phần tháo ráp  Tăng mức độ phân nhỏ đối tượng 2/ Nguyên tắc “tách riêng”:  Tách thành phần gây phiền phất khỏi đôi tượng ngược lại Trách lấy phần cần thiết 3/ Nguyên tắc phẩm chất cục bộ:  Chuyển đối tượng (hay mơi trường bên ngồi, tác động bên ngồi) có cấu trúc đồng thành khơng đồng  Các phần khác đối tượng phải có chất khác  Mỗi phần đối tượng phải có chất khác 4/ Nguyên tắc phản đối xứng:  Chuyển đối tượng có hìng dạng, tính chất đối xứng thành phản đối xứng 5/ Nguyên tắc kết hợp:  Kết hợp đối tượng đồng đối tượng dùng cho hoạt động kế cận  Kết hợp mặt thời gian hoạt động đồng kế cận gian rỗi CPU, tận dụng tài nguyên hệ điều hành đa nhiệm, nhiều người dùng 6/ Nguyên tắc vạn năng:  Vật thể hoạt động đa chức loại bỏ số vật thể khác 7/ Nguyên tắc chứa  Để vật thể lòng vật thể khác, vật thể khác lại để lòng vật thể thứ ba  Chuyển vật thể thông qua khoảng trống vật thể khác 8/ Nguyên tắc phản trọng lượng  Bù trừ trọng lượng vật thể cách nối với vật thể khác mà có lực đẩy  Bù trừ trọng lượng vật thể tương tác với mơi trường cung cấp khí thủy động lực 9/ Nguyên tắc gây ứng suất sơ  Thực phản hoạt động trước tiên  Nếu vật thể chịu áp lực cung cấp cung cấp phản áp lực trước 10/ Nguyên tắc thực sơ  Trước tiên thực tất phần hoạt động  Sắp xếp vật thể cho chúng vào hoạt động khoảng thời gian hợp lí từ vị trí thích hợp 11/ Nguyên tắc dự phòng  Bù trừ cho tính khơng tin cậy vật thể biện pháp trả đũa trước tiên 12/ Nguyên tắc đẳng  Thay đổi điều kiện làm việc cho nâng lên hạ xuống 13/ Nguyên tắc đảo ngược  Thay cho hành động điều khiển chi tiết kĩ thuật toán, áp dụng hành động ngược lại  Làm cho phần chuyển động vật thể hoặt mơi trường bên ngồi vật thể trở nên bất động phần bất động trở thành chuyển động  Lật úp vật thể 14/ Ngun tắc cầu (trịn) hóa  Thay vật thể thẳng bề mặt phẳng thành mặt cong ; thay thể hình lập phương thành hình cầu  Sử dụng lăn, vật hình xoắn ốc  Thay chuyển động thẳng chuyển động quay ; tận dụng lực li tâm 15/ Nguyên tắc động  Tạo vật thể mơi trường tự động điều chỉnh tới chế độ tối ưu trạng  thái hoạt động 13  Chỉ xây dựng phân tích cú pháp tiếng Việt hạn chế mục tiêu đề tài  Giới hạn việc xử lý ngữ nghĩa cho dạng câu hỏi có liên quan trực tiếp đến việc truy vấn thông tin mô tả tài liệu, xác định mục tiêu đề tài  Không xử lý vấn đề thời, thức, thể, tình thái, hàm ý, phong cách, ngữ dụng vấn đề phức tạp khác nội dung câu hỏi  Chỉ tìm kiếm tài liệu dựa thông tin mô tả (tác giả, tựa đề, năm xuất bản, nhà xuất bản, chủ đề, từ khóa, loại) tài liệu Khơng tìm kiếm nội dung văn tài liệu 2.2 Mơ hình hệ thống tìm kiếm tài liệu chuỗi truy vấn tiếng Việt 2.2.1 Kiến trúc hệ thống Đề tài xây dựng kiến hệ thống với thành phần [Hình 2]: STT Thành phần Phân tích cú pháp Phân tích ngữ nghĩa Diễn dịch ngữ nghĩa Tạo sinh câu trả lời Bảng 2: Các thành phần hệ thống tìm kiếm tài liệu chuỗi truy vấn tiếng Việt 14 Hình 2: Kiến trúc hệ thống tìm kiếm tài liệu dựa chế xử lý câu hỏi tiếng Việt 2.2.2 Ontology học liệu mở Nguồn liệu để xây dựng ontology học liệu mở lấy từ web site chính: Trang http://voer.edu.vn http://www.ebook.edu.vn Số lượng tài liệu 506 16436 15 http://ebook.edu.net.vn 1179 Bảng 3: Thống kê số lượng giáo trình thư viện học học liệu mở Do thư viện nói sử dụng cách mơ tả khác học liệu mở, nên ta cần tổng hợp thông tinmô tả trang học liệu mở để có danh sách sau: STT Thơng tin mô tả học liệu mở Chủ đề Loại tài liệu Nguồn phát hành Tài liệu tham khảo Tác giả Từ khóa Dạng lưu trữ ISBN Kích thước 10 Mã số 11 Ngôn ngữ 12 Sơ lược 13 Số trang 14 Tiêu đề 16 15 Thởi gian xuất 16 Tài liệu trang Bảng 4:Tổng hợp thông tin mô tả học liệu mở cho thư viện Trên sở thông tin mô tả bảng trên, ta tiến hành xây dựng ontology lưu trữ thông tin mô tả học liệu mở Danh sách lớp ontology học liệu mở trình bày bảng sau: STT Class Name Class_tài_liệu Class_chủ_đề Class_loại_tài_liệu Class_nguồn_phát_hành Class_tài_liệu_tham_khảo Class_tác_giả Class_từ_khóa Bảng 5:Cácclass ontology học liệu mở 17 Danh sách object properties1 ontology học liệu mở trình bày bảng sau: Property Name Domain Range có_chủ_đề Class_tài_liệu Class_chủ_đề có_loại_tài_liệu Class_tài_liệu Class_loại_tài_liệu có_nguồn_phát_hành Class_tài_liệu Class_nguồn_phát_hành có_tài_liệu_tham_khảo Class_tài_liệu Class_tài_liệu_tham_khảo có_tác_giả Class_tài_liệu Class_tác_giả có_từ_khóa Class_tài_liệu Class_từ_khóa là_chủ_đề_của Class_chủ_đề Class_tài_liệu là_loại_tài_liệu_của Class_loại_tài_liệu Class_tài_liệu là_nguồn_phát_hành_của Class_nguồn_phát_hành Class_tài_liệu là_tài_liệu_tham_khảo_của Class_tài_liệu_tham_khảo Class_tài_liệu là_tác_giả_của Class_tác_giả Class_tài_liệu là_từ_khóa_của Class_từ_khóa Class_tài_liệu Bảng 6:Object properties ontology học liệu mở Danh sách datatype properties2 ontology học liệu mở trình bày bảng sau: Object property: Biểu diễn mối quan hệ object với object khác Datatype property: Biễu diễn mối quan hệ object với XML Schema Datatype value (ví dụ: integer, string) 18 Property Name Domain Range có_dạng_lưu_trữ Class_tài_liệu string có_ISBN Class_tài_liệu string có_kích_thước Class_tài_liệu string có_mã_số Class_tài_liệu string có_ngơn_ngữ Class_tài_liệu string có_sơ_lược Class_tài_liệu string có_số_trang Class_tài_liệu string có_thời_gian_xuất Class_tài_liệu string có_tiêu_đề Class_tài_liệu string tài_liệu_ở_trang Class_tài_liệu Funtional string funtional funtional Bảng7: Datatype properties ontology học liệu mở Quan hệ lớp ontology học liệu mở mô tả bảng sau: Class Name Conditions Property Class_tài_liệu Restriction có_chủ_đề only Class_chủ_đề có_loại_tài_liệu only Class_loại_tài_liệu có_nguồn_phát_hành only Class_nguồn_phát_hành có_tài_liệu_tham_khảo only Class_tài_liệu_tham_khảo 19 có_tác_giả only Class_tác_giả có_từ_khóa only Class_từ_khóa có_tiêu_đề only string có_ngơn_ngữ only string có_dạng_lưu_trữ only string có_mã_số only string có_ISBN only string có_kích_thước only string có_sơ_lược only string có_số_trang only string có_thời_gian_xuất_bản only string tài_liệu_ở_trang only string Class_chủ_đề là_chủ_đề_của only Class_tài_liệu Class_loại_tài_li là_loại_tài_liệu_của only Class_tài_liệu là_nguồn_phát_hành_của only Class_tài_liệu là_tài_liệu_tham_khảo_của only Class_tài_liệu là_tác_giả_của only Class_tài_liệu ệu Class_nguồn_ph át_hành Class_tài_liệu_th am_khảo Class_tác_giả 20 Class_từ_khóa là_từ_khóa_của only Class_tài_liệu Bảng 8: Mơ tả quan hệ lớp ontology học liệu mở 2.3 Mơ hình cú pháp Phân tích cú pháp bước trình xử lý câu hỏi tiếng Việt Trên sở kết trình phân tích cú pháp, bước sau thiết lập chế để phân tích ngữ nghĩa cho câu hỏi tiếng Việt Một cách tổng quát, nội dung câu hỏi chia thành hai thành phần: - Thành phần truy vấn (những thông tin hỏi) - Thành phần thông tin (những thông tin biết) Trừ câu hỏi thuộc loại đúng/sai, thông tin cần hỏi xác định thơng qua thông tin biết câu hỏi Trong phạm vi ứng dụng đề tài, thành phần có liên hệ với thơng qua Class_tài_liệu Ví dụ: Tác giả viết sách nhà xuất Nguyễn Thị Minh Khai phát hành? Trong câu hỏi ví dụ, thành phần truy vấn “tác giả”, thành phần thông tin “nhà xuất Nguyễn Thị Minh Khai” Các thành phần có quan hệ với thơng qua “sách” Do đó, từ thơng tin “nhà xuất Nguyễn Thị Minh Khai”, xác định sách nhà xuất Nguyễn Thị Minh Khai phát hành Kế tiếp, từ sách biết, tiếp tục xác định tác giả chúng Cuối cùng, có thơng tin đầy đủ để trả lời cho câu hỏi ví dụ Các bước truy vấn xác định thông tin mô tả sau: Nhà xuất Nguyễn Thị Minh Khai  sách nhà xuất Nguyễn Thị Minh Khai phát hành  tác giả sách nhà xuất Nguyễn Thị Minh Khai phát hành Cấu trúc tổng quát chung cho loại câu hỏi sau: thông tin cần hỏi (thuộc thành phần truy vấn) thông tin biết (thuộc thành phần thông tin) Tùy thuộc vào vị trí 21 đứng trước hay sau thành phần truy vấn so với thành phần thông tin, có hai dạng cấu trúc tổng quát cho câu hỏi trình bày bảng sau Cấu trúc Thành phần đứng trước câu hỏi Thành phần đứng sau câu hỏi Dạng Thành phần truy vấn Thành phần thông tin Dạng Thành phần thông tin Thành phần truy vấn Bảng 9:Các cấu trúc tổng qt câu hỏi tiếng Việt 2.4 Mơ hình ngữ nghĩa Q trìnhphân tích cú pháp cho câu hỏi tiếng Việt nhằm mục đích xác định cấu trúc cú pháp câu hỏi Sau đó, cú pháp chuyển cấu trúc nghĩa, biểu diễn dạng ngữ nghĩa Cây ngữ nghĩa bao gồm nhiều loại nút khác nhau, nút tổ chức thành cấu trúc Mỗi nút ngữ nghĩa có hai thành phần: nhãn nút giá trị nút Nhãn nút cho biết nút chứa thơng tin mơ tả cho nhiều tài liệu hỏi Giá trị nút cho biết cụ thể thông tin mô tả Đối với loại câu hỏi, hệ thống cần phải xác định xem loại câu hỏi có thành phần nào: có đầy đủ thành phần truy vấn thành phần thông tin, có thành phần thơng tin Từ yếu tố trên, mơ hình ngữ nghĩa dùng để biểu diễn ngữ nghĩa cho dạng câu hỏi mà nhiều thơng tin hỏi dựa thông tin khác biết câu hỏi Đồng thời, mơ hình ngữ nghĩa cho phép xử lý quan hệ “và”, “hoặc” đối tượng thành phần truy vấn thành phần thông tin 2.5 Phương pháp sinh mã truy vấn SPARQL Nguyên tắc sinh mã truy vấn SPARQL: mã truy vấn SPARQL gồm thành phần quan trọng: 22  Địa truy vấn ontology  Thành phần truy vấn ( với từ khóa Select )  Thành phần cung cấp thông tin ( với từ khóa Where) Trong địa truy vấn ontology cố định trước, để xây dựng mã truy vấn SPARQL để lấy thông tin từ ontology cần phải xác định thành phần truy vấn thông tin trông mã truy vấn: Sinh mã truy vấn từ ngữ nghĩa:  Thành phần truy vấn ( sau từ khóa Select ): xác định dựa vào node hỏi thuộc nhánh QUES ngữ nghĩa  Thành phần thơng tin ( sau từ khóa Where): xác định dựa vào node INFO thuộc ngữ nghĩa 2.6 Cơ chế tạo sinh câu trả lời Việc tạo sinh câu trả lời tiếng Việt dựa nguyên tắc: biểu diễn cấu trúc ngữ nghĩa câu trả lời sở tạo sinh câu trả lời tiếng Việt Cấu trúc ngữ nghĩa câu trả lời tiếng Việt xác định dựa cấu trúc ngữ nghĩa câu hỏi tiếng Việt tương ứng Mơ hình ngữ nghĩa dùng để biểu diễn cấu trúc ngữ nghĩa câu trả lời Việc tạo sinh câu trả lời tiếng Việt thực dựa mối quan hệ nút thành phần yếu tố tài liệu ngữ nghĩa.Vì câu trả lời tiếng Việt tạo sinh sau điền nút quan hệ nút ngữ nghĩa với thành phần tài liệu câu trả lời hoàn chỉnh 2.7 Những nguyên tắcsáng tạo ứng dụng 2.7.1 Ngun tắcphân nhỏ Mơ hình chia thành nhiều thành phần nhỏ thành phần phân tích cú pháp, thành phần phân tích ngữ nghĩa, thành phần diễn dịch ngữ nghĩa thành phần tạo sinh câu trả lời 23 2.7.2 Nguyên tắc tách khỏi Trong q trình phân tích cú pháp, hệ thống loại bỏ stop words không cần thiết để tiết kiệm không gian lưu trữ gia tăng tốc độ xử lý phân tích cú pháp Ví dụ: “ắt hẳn”, “chẳng lẽ”, “chung quy”, “cơ chừng” … 2.7.3 Nguyên tắc cục Mơ hỉnh hệ thống có nhiều thành phần thành phần có chức khác Tham khảo bảng bên Thành phần Chức Phân tích cú pháp Phân tích cú pháp câu hịi tiếng Việt Phân tích ngữ nghĩa Chuyển từ cấu trúc cú pháp sang cấu trúc nghĩa, biểu diễn dạng ngữ nghĩa Diễn dịch ngữ nghĩa Truy vấn thông tin trả thông tin cần thiết để thay thành phấn hỏi ngữ nghĩa Tạo sinh câu trả lời Tạo sinh câu trả lời từ ngữ nghĩa Bảng 10:Chức thành phần mơ hình hệ thống 2.7.4 Nguyên tắc kết hợp Để tiết kiệm thời gian cơng sức cho việc lập trình phân tích cú pháp câu hỏi tiếng Việt kết hợp sử dụng cơng cụ ANTLR hỗ trợ phân tích cú pháp việc định nghĩa ngữ pháp theo cấu trúc văn phạm phi ngữ cảnh EBNF 2.7.5 Nguyên tắc chứa Nguyên tắc ứng dụng hầu hết việc lập trình phần mềm.Đối với hệ thống không ngoại lệ.Nguyên tắc chứa ứng dụng nhiều q trình lập trình thực mơ hình hệ thống Ví dụ thành phần rút trích thơng tin từ trang web học liệu mở có chương trình làm nhiệm vụ rút trích Trong chương trình làm 24 nhiệm vụ rút trích gọi chương trình khác làm nhiệm vụ phân giải địa tên miền… 2.7.6 Ngun tắc dự phịng Trong q trình truy vấn dạng câu truy vấn không nhận diện cấu trúc câu ta sử dụng chức bổ sung dạng câu truy vấn trực tiếp Sau bổ sung dạng câu, hệ thống nhận diện trả lời câu hỏi với cấu trúc vừa bổ sung Dữ liệu ontology hệ thống lưu dạng file filename.owl Việc thiết kế dễ dàng cho việc backup lưu trữ 2.7.7 Nguyên tắc giải thiếu thừa Việc xử lý ngữ nghĩa tiếng Việt vấn đề khó nên đề tài giới hạn xử lý dạng câu truy vấn nêu mục 2.1.3 - Phạm vi nghiên cứu đề tài 2.7.8 Nguyên tắc chép Hệ thống sử dụng lại thư viện mở để tiết kiệm chi phí lập trình Tham khảo bảng bên Chức Thư viện HTMLParser Phân tích hỗ trợ rút tríchthơng tin trang HTML Jena Xây dựng, thao tác truy vấn ontology ANTLR Phân tích nhận diện nút thông tin cần thiết cho việc sinh mã truy vấn tạo câu trả lời dựa vào cú pháp ngữ nghĩa phát sinh Bảng 11:Chức thành phần mơ hình hệ thống 25 KẾT LUẬN Việc sử dụng nguyên tắc, phương pháp luận sáng tạo giúp cho việc giải toán tin học dễ dàng nhanh hơn, việc giải chúng phương pháp thuật tốn tối ưu Khơng lĩnh vực tin học mà nhiều lĩnh vực khác, việc áp dụng nguyên tắc phương pháp luận sáng tạo giúp cho việc giải vấn đề nhanh chóng, tối ưu khoảng thời gian ngắn đem lại hiệu cao Phương pháp luận tư sáng tạo đổi mơn khoa học sáng tạo Khi thầy Hồng Kiếm giảng phương pháp luận tư sáng tạo đổi mới, tơi có phương pháp làm chủ tư từ đưa sáng tạo nho nhỏ phục vụ cho đề tài nghiên cứu Tơi thấm thía câu nói thầy “Những vấn đề liên quan tới kĩ thuật khơng thật dễ khơng thật khó, có thời gian làm Nhưng có vấn đề phải qua trình nghiên cứu, sáng tạo giải chí khơng có lời giải đáp!” 26 TÀI LIỆU THAM KHẢO [1] Slides giảng “Phương pháp nghiên cứu khoa học tin học” – GS.TSKH Hoàng Kiếm [2] Atshuler, Giải toán phát minh sáng chế, Nhà xuất thống kê – 1991 [3] Hồng kiếm, Giải tóan máy tính I, II, III, Nhà xuất Giáo dục – 2001, 2002, 2004 [4] Dang Tuan Nguyen, An Hoai Vo, Phuc Tri Nguyen, "Semantic Model for Representing Vietnamese Questions in OpenCourseWare Retrieval System", Proceedings of the 2011 3rd International Conference on Machine Learning and Computing (ICMLC 2011), vol 4, pp 331-335, February 26-28, 2011, Singapore ISBN: 978-1-4244-9252-7 [5] Dang Tuan Nguyen, An Hoai Vo, Phuc Tri Nguyen, "Understanding the Vietnamese Questions in OpenCourseWare Retrieval System", Proceedings of the 2011 3rd International Conference on Machine Learning and Computing (ICMLC 2011), vol 4, pp 327-330, February 26-28, 2011, Singapore ISBN: 978-1-4244-9252-7 [6] Dang Tuan Nguyen, An Hoai Vo, Phuc Tri Nguyen, "Semantic Representation for Processing a Series of Vietnamese Questions in OpenCourseWare Retrieval System", The 2011 International Conference on Information and Knowledge Management (ICIKM 2011), July 15 - 17, 2011, Haikou, China [7] Dang Tuan Nguyen, An Hoai Vo, Phuc Tri Nguyen, “A Semantic Approach to Answer Vietnamese Questions in OpenCourseWare Retrieval System”, The 2011 International Conference on Software Technology and Engineering (ICSTE 2011), August 12-14, 2011, Kuala Lumpur, Malaysia [8] Dang Tuan Nguyen, An Hoai Vo, Phuc Tri Nguyen, "Answering a Series of Vietnamese Questions in Library Retrieval System", The 2011 The 2nd International Conference on Future Information Technology (ICFIT 2011), September 16-18, 2011, Singapore 27 [9] Thư viện giáo trình điện tử Bộ Giáo dục Đào tạo [Trực tuyến] http://ebook.edu.net.vn [10] Thư viện giáo trình điện tử EdusoftTeam.[Trực tuyến].http://www.ebook.edu.vn [11]Thư viện học liệu mở Việt nam [Trực tuyến].http://voer.edu.vn ... 12 PHẦN 2: ỨNG DỤNG NGUYÊN TẮC SÁNG TẠO VÀO MÔ HÌNH XỬ LÝ CÚ PHÁP VÀ NGỮ NGHĨA CHO CÂU HỎI TIẾNG VIỆT TRONG HỆ THỐNG TÌM KIẾM THƯ VIỆN 2.1 Tổng quan toán 2.1.1 Đặt vấn đề Trong lĩnh vực tìm kiếm... Cơ chế tạo sinh câu trả lời Việc tạo sinh câu trả lời tiếng Việt dựa nguyên tắc: biểu diễn cấu trúc ngữ nghĩa câu trả lời sở tạo sinh câu trả lời tiếng Việt Cấu trúc ngữ nghĩa câu trả lời tiếng... 12/ Nguyên tắc đẳng  Thay đổi điều kiện làm việc cho nâng lên hạ xuống 13/ Nguyên tắc đảo ngược  Thay cho hành động điều khiển chi tiết kĩ thuật toán, áp dụng hành động ngược lại  Làm cho

Ngày đăng: 27/08/2014, 18:22

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan