Nghiên cứu Web ngữ nghĩa và ứng dụng trong trợ giúp tìm kiếm văn bản nghiệp vụ hành chính Trong quản lý các văn bản hành chính, bên cạnh việc ứng dụng công nghệ thông tin (CNTT) vào công tác giảng dạy thì việc ứng dụng CNTT vào công tác quản lý cũng đóng vai trò không kém phần quan trọng trong việc nâng cao chất lượng quản lý các hành chính. Tối ưu hóa các quy trình quản lý là mục tiêu hàng đầu nhằm tạo điều kiện tốt nhất cho lực lượng nhân viên chuyên tâm nâng cao chất lượng.
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN NGUYỄN ĐOÀN ANH VŨ NGHIÊN CỨU WEB NGỮ NGHĨA VÀ ỨNG DỤNG TRONG TRỢ GIÚP TÌM KIẾM VĂN BẢN NGHIỆP VỤ HÀNH CHÍNH LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Đà Nẵng 2014 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN NGUYỄN ĐOÀN ANH VŨ NGHIÊN CỨU WEB NGỮ NGHĨA VÀ ỨNG DỤNG TRONG TRỢ GIÚP TÌM KIẾM VĂN BẢN NGHIỆP VỤ HÀNH CHÍNH CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: TS PHẠM ANH PHƯƠNG Đà Nẵng 2014 LỜI CẢM ƠN Để hồn thành luận văn tơi nhiều động viên giúp đỡ cá nhân tập thể Trước hết, cho xin bày tỏ lòng biết ơn sâu sắc đến TS Phạm Anh Phương hướng dẫn thực đề tài nghiên cứu Xin bày tỏ lịng biết ơn chân thành tới thầy cô giáo, người đem lại cho kiến thức vô quý giá, có ích năm học vừa qua Cũng xin gửi lời cám ơn chân thành tới Ban Giám hiệu, Phòng Đào tạo, Khoa sau đại học, Đại học Duy Tân, tạo điều kiện cho trình học tập nghiên cứu Cuối tơi xin gửi lời cám ơn đến gia đình, bạn bè đồng nghiệp, tập thể lớp Khoa học máy tính K7, người ln bên tơi, động viên khuyến khích tơi q trình thực đề tài nghiên cứu Học viên Nguyễn Đồn Anh Vũ i LỜI CAM ĐOAN Tên tơi Nguyễn Đồn Anh Vũ, học viên cao học lớp Khoa học máy tính K7, khóa 2012-2014 Tôi xin cam đoan luận văn thạc sĩ ‘‘Nghiên cứu Web ngữ nghĩa ứng dụng trợ giúp tìm kiếm văn nghiệp vụ hành chính’’ cơng trình nghiên cứu riêng tơi, số liệu kết nghiên cứu luận văn trung thực không trùng với đề tài khác Tôi xin cam đoan giúp đỡ cho việc thực luận văn cảm ơn thơng tin trích dẫn luận văn rõ nguồn gốc Học viên Nguyễn Đoàn Anh Vũ ii MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN .ii MỤC LỤC iii DANH MỤC CÁC TỪ VIẾT TẮT x DANH MỤC CÁC HÌNH x MỞ ĐẦU CHƯƠNG :TỔNG QUAN VỀ SEMANTIC WEB 1.1 LÝ THUYẾT VỀ SEMANTIC WEB 1.1.1 Giới thiệu semantic web 1.1.1.1 Semantic web gì? 1.1.1.2 Một ví dụ đơn giản semantic web 1.1.1.3 Sự khác semantic web web .4 1.1.1.4 Lợi ích semantic web 1.1.2 Kiến trúc semantic web 1.1.3 VAI TRÒ CÁC LỚP TRONG KIẾN TRÚC WEB NGHỮ NGHĨA 1.1.3.1 Vai trò Lớp định danh tài nguyên-URI Unicode 1.1.3.2 Vai trò Lớp XML XML Schema 1.1.3.3 Vai trò Lớp RDF - RDF Schema 1.1.4 Ontology 11 1.1.4.1 Định nghĩa ontology 11 1.1.4.2 Vai trò ontology 11 1.1.4.3 Các ứng dụng ontology 12 1.1.5 Các ngôn ngữ semantic web 13 1.1.5.1 XML 13 1.1.5.2 RDF 14 1.1.5.3 RDFS 15 1.2 LÝ THUYẾT VỀ SEARCH ENGINE 17 1.2.1 Các phận cấu thành hệ thống search engine 17 iii 1.2.1.1 Robot – Bộ thu thập thông tin 17 1.2.1.2 Index – Bộ lập mục .17 1.2.2 Search engine – Bộ tìm kiếm thơng tin .18 1.2.2.1 Search engine – Bộ tìm kiếm thơng tin 18 1.2.2.2.Nguyên lý hoạt động 19 1.3 LÝ THUYẾT VỀ TRA CỨU HỆ HỎI-ĐÁP .19 1.3.1 Lịch sử phát triển .19 1.3.2 Khái niệm hệ thống hỏi-đáp .20 1.3.3 Kiến trúc hệ thống hỏi-đáp 21 1.3.3.1 User Interface - Giao diện người dùng .22 1.3.3.2 Question Analyzer – Phân tích câu hỏi .22 1.3.3.3 Data Retrieval – Tìm kiếm liệu 23 1.3.3.4 Answer Extraction – Rút trích câu trả lời 23 1.3.3.5 Ranking – Chiến lược xếp hạng 24 1.3.3.6 Answer Verification – Xác minh câu trả lời .24 1.3.4 Hệ thống hỏi-đáp tiếng Việt .24 1.4 TÌM HIỂU VỀ CÁC LOẠI VĂN BẢN 25 1.4.1 Những yếu tố văn ngành giáo dục 25 1.4.1.1 Các lĩnh vực văn ngành giáo dục .25 1.4.1.2 Các loại văn quản lý hành 25 1.4.1.3 Cơ quan, đơn vị 26 1.4.1.4 Thời gian 26 1.4.1.5 Cá nhân liên quan 26 1.4.1.6 Nội dung văn 26 1.4.2 Nhận xét 26 1.5 KẾT LUẬN CHƯƠNG 27 CHƯƠNG 2: GIẢI PHÁP XÂY DỰNG HỆ THỐNG TÌM KIẾM VĂN BẢN 27 2.1 CÁC HỆ THỐNG TÌM KIẾM VĂN BẢN TRONG NGÀNH GIÁO DỤC .27 2.1.1 Giới thiệu chung .27 2.1.2 Phân loại 28 2.1.3 Các hệ thống phục vụ cho ngành giáo dục giới 28 2.1.3.1 Cổng thông tin Teachingwithdata.org 28 iv 2.1.3.2 Thư viện online trường đại học British Columbia .29 2.1.3.3 Website chương trình đào tạo tài trợ để thúc phát triển nông nghiệp SARE 29 2.1.3.4 Website tìm kiếm theo ngữ nghĩa tiếng Wolframalpha .30 2.1.4 Nhận xét chung hệ thống phục vụ cho ngành giáo dục giới .30 2.1.5 Các website hệ thống phục vụ cho ngành giáo dục nước 30 2.1.5.1 Hệ thống tìm kiếm Wada.vn 30 2.1.5.2 Cổng thông tin tuyển sinh thidaihoc.org 31 2.1.5.3 Website giáo dục đào tạo Việt Nam 31 2.1.5.4 Các trường đại học lớn nước 31 2.1.6 Nhận xét website, hệ thống phục vụ cho ngành giáo dục nước 31 2.1.7 Giới thiệu cơng trình nghiên cứu semantic web nước 32 2.1.7.1 Ontology xử lý ngôn ngữ tiếng Việt 32 2.1.7.2 Ontology khoa học công nghệ 32 2.1.7.3 Ứng dụng web ngữ nghĩa xây dựng hệ thống trợ giúp học tập cho học sinh bậc học phổ thông 33 2.1.8 Nhận xét chung cơng trình nghiên cứu semantic web nước 33 2.2 Ý TƯỞNG VỀ HỆ THỐNG TÌM KIẾM VĂN BẢN 33 2.3 CÁC NGÔN NGỮ XÂY DỰNG CÁC ONTOLOGY HỖ TRỢ TÌM KIẾM VĂN BẢN 34 2.3.1RDF (Resource Description Framework) 34 2.3.1.1Tổng quan RDF 34 2.3.1.2 Chia sẻ liệu RDF 35 2.3.2RDFS (RDF-Schema) 36 2.3.2.1Các lớp thuộc tính RDF/RDFS 36 2.3.2.2Ví dụ xây dựng Ontology với RDFS 37 2.3.3OWL (Ontology Web Language) 39 2.3.4DAML + OIL (DARPA Agent Markup Lanquage + Ontology Inference Layer) .41 2.4 BIỂU ĐỒ CA SỬ DỤNG 41 Hình 2.1 Biểu đồ Ca sử dụng 41 2.5 ĐẶC TẢ CA SỬ DỤNG .42 2.5.1 Login 42 Bảng 2.1 Đặc tả Login .42 v 2.5.2 Logout 42 Bảng 2.2 Đặc tả Logout 42 2.5.3 Import thông tin từ website 42 Bảng 2.3 Đặc tả Import thông tin từ website 43 2.5.4 Import thông tin tay 43 Bảng 2.4 Đặc tả Import thông tin tay .43 2.5.5 Xem thông tin 43 Bảng 2.5 Đặc tả xem thông tin 43 2.5.6 Cập nhật thông tin 44 Bảng 2.6 Đặc tả cập nhật thông tin 44 2.5.7 Xóa thơng tin .44 Bảng 2.7 Đặc tả xóa thông tin 44 2.5.8 Tìm kiếm thơng tin 45 2.6 PHƯƠNG PHÁP THU THẬP, TRÍCH RÚT THUỘC TÍNH TỰ ĐỘNG .45 Hình 2.2 Mơ hình tổng quan phương pháp trích rút tự động 46 Hình 2.3 Quy trình rút trích ontology từ WWW 47 2.7 CÔNG CỤ, MÔI TRƯỜNG, THƯ VIỆN VÀ NGÔN NGỮ 48 2.7.1 Công cụ xây dựng ontology - Protégé .48 2.7.1.1 Đặc điểm Protégé .48 2.7.1.2 Protégé sử dụng giao diện đồ họa 48 2.7.1.3 Protégé phát triển để tích hợp cơng cụ .49 2.7.2 Thư viện SemWeb 49 2.7.2.1 Giấy phép 49 2.7.2.2 Đặc điểm SemWeb .49 2.7.3 Giao diện lập trình ứng dụng OwlDotNetApi 51 2.7.3.1 Phiên 51 2.7.3.2 Chức 51 Hình 2.4 Mơ hình quan hệ nút cạnh 52 2.7.4 Hệ truy vấn SPARQL 52 vi 2.7.4.1 Cú pháp câu truy vấn: 52 2.7.4.2 Tạo câu truy vấn đơn giản 53 2.7.5 Môi trường thư viện phát triển ứng ụng cho semantic web .54 2.8 ĐẶC TẢ HỆ THỐNG TÌM KIẾM VĂN BẢN HÀNH CHÍNH 55 2.8.1 Dự kiến chức hệ thống 55 2.8.2 Mô tả hệ thống 55 2.8.2.1 Giao diện truy vấn .55 2.8.2.2 Phần kiến trúc bên 55 Hình 2.5 Mơ hình đề xuất cho hệ thống tìm kiếm văn hành 56 2.8.2.3 Cơ sở liệu .56 2.9 KẾT LUẬN CHƯƠNG 56 CHƯƠNG 3: THIẾT KẾ HỆ THỐNG VÀ TRIỄN KHAI ỨNG DỤNG 57 3.1 PHÂN TÍCH HỆ THỐNG TÌM KIẾM VĂN BẢN HÀNH CHÍNH .57 3.1.1 Các giai đoạn xây dựng hệ thống 57 Hình 3.1 Sơ đồ tổng quan hệ thống 58 3.1.1.1 Giai đoạn 1: Thiết kế ontology 58 3.1.1.2 Giai đoạn 2: Xây dựng ứng dụng .59 3.1.2 Phân tích chức tìm kiếm hệ thống .59 3.1.2.1 Duyệt theo ngữ nghĩa .59 3.1.2.2 Tìm kiếm theo từ khóa 59 3.1.2.3 Tìm kiếm nâng cao 59 3.2 CÁC QUYỀN CỦA HỆ THỐNG TÌM KIẾM VĂN BẢN TRONG NGÀNH GIÁO DỤC 60 Bảng 3.1 Các quyền hệ thống 60 3.3 THIẾT KẾ HỆ THỐNG TÌM KIẾM VĂN BẢN TRONG NGÀNH GIÁO DỤC 60 3.3.1 Biểu đồ Login 60 Hình 3.2 Biểu đồ Login 60 3.3.2 Biểu đồ Logout 61 Hình 3.3 Biểu đồ Logout 61 3.3.3 Biểu đồ Import thông tin từ website 61 Hình 3.4 Biểu đồ Import thơng tin từ website 61 vii 3.3.4 Biểu đồ Import thông tin thủ công tay 62 Hình 3.5 Biểu đồ Import tay 62 3.3.5 Biểu đồ Xem thông tin .62 Hình 3.6 Biểu đồ Xem thông tin .62 3.3.6 Biểu đồ Sửa thông tin 63 Hình 3.7 Biểu đồ Sửa thơng tin .63 3.3.7 Biểu đồ Xóa thơng tin .63 Hình 3.8 Biểu đồ Xóa thông tin 63 3.3.8 Biểu đờ Tìm kiếm thơng tin 64 Hình 3.9 Biểu đồ Tìm kiếm thơng tin .64 3.4 THIẾT KẾ ONTOLOGY .64 3.6.1 Các bước xây dựng ontology 64 3.6.2 Thiết kế mơ hình liệu ontology 67 Hình 3.10 Sơ đồ mô tả class Linh_vuc 68 Hình 3.11 Sơ đồ mơ tả class Loai_van_ban 69 Hình 3.12 Sơ đồ mơ tả class Co_quan 69 Hình 3.13 Sơ đồ mô tả class Thoi_gian 70 Hình 3.14 Sơ đồ mơ tả class Ca_nhan 71 Hình 3.15 Sơ đồ mơ tả class Noi_dung 71 Hình 3.16 Sơ đồ mô tả class Van_ban 72 72 Tổng quát ontology 72 Hình 3.17 Sơ đồ mơ tả tổng quát ontology .72 Hình 3.18 Ontology văn giáo dục xây dựng cơng cụ Protégé .73 3.5 CHƯƠNG TRÌNH THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 73 3.5.1 Trang chủ hệ thống 73 viii niệm, quan hệ, thuộc tính… Thơng thường, thuật ngữ danh từ trở thành lớp, tính từ thành thuộc tính, động từ quan hệ lớp Bước 4: Xây dựng lớp cấu trúc lớp phân cấp Đây hai bước quan trọng việc xây dựng ontology Bước định nghĩa lớp từ số thuật ngữ liệt kê bước 3, sau xây dựng cấu trúc lớp phân cấp theo quan hệ “lớp cha-lớp con” Lớp vị trí cao cấu trúc có mức độ tổng quát cao Vị trí lớp gốc, lớp trung gian cuối lớp Lớp lớp triển khai biểu thực thể Quan hệ thực thể lớp với lớp cha quan hệ “là-một”, có nghĩa thực thể lớp thực thể lớp cha Ta xây dựng cấu trúc lớp phân cấp theo ba hướng sau: - “Từ xuống” (top-down): bắt đầu lớp có mức độ tổng quát - cao nhất, sau triển khai dần đến lớp “Từ lên” (bottom-up): bắt đầu việc xác định lớp cho - cụ thể nhất, sau tổng quát hóa đến lớp gốc “Kết hợp” (combination): kết hợp hai hướng xây dựng Trước tiên chọn lớp bật miền quan tâm, sau tống quát hóa cụ thể hóa cấu trúc mong muốn Bước 5: Định nghĩa thuộc tính quan hệ cho lớp Các lớp xác định bước thuật ngữ phân biệt với tên gọi Để phục vụ cho việc biểu diễn tri thức, thuộc tính lớp cần định nghĩa Thuộc tính chia làm loại sau: - Về ý nghĩa: chia làm loại, thuộc tính bên (intrinsic property) thuộc tính bên ngồi (extrinsic property) Thuộc tính bên mơ tả tính chất bên vật như: chất, lượng, cấu tạo,… Thuộc tính bên - ngồi mơ tả biểu vật: màu sắc, hình dáng,… Về giá trị: chia làm loại gồm: thuộc tính đơn (simple property) thuộc tính phức (complex property) Thuộc tính đơn giá trị đơn như: chuỗi, số,… Thuộc tính phức chứa tham khảo đến đối tượng khác 66 Một lớp kế thừa tồn thuộc tính tất cha Vì định nghĩa thuộc tính cần xem định nghĩa lớp mức cao hay chưa Bước 6: Định nghĩa ràng buộc thuộc tính quan hệ lớp Các ràng buộc giới hạn giá trị mà thuộc tính nhận, có hai ràng buộc quan trọng thuộc tính lượng số (cardinality) kiểu (type) “Lượng số” quy định số giá trị thuộc tính nhận, thường là: đơn trị (single) đa trị (multiple) “Kiểu” mà thuộc tính nhận là: chuỗi, số, boolean, liệt kê kiểu thực thể Kiểu thực thể có liên quan đến hai khái niệm gọi là: miền (domain) khoảng (range) Miền dùng để lớp (hay lớp) mà thuộc tính thuộc Khoảng lớp (hay lớp) làm kiểu cho giá trị thuộc tính kiểu thực thể Bước 7: Tạo thực thể cho lớp Đây bước cuối vòng lặp xây dựng ontology Bước tạo thực thể cho lớp gán giá trị cho thuộc tính Các thực thể tạo nên nội dung sở tri thức vấn đề quan tâm lĩnh vực semantic web 3.6.2 Thiết kế mơ hình liệu ontology Từ bước xây dựng ontology nêu mục trên, tiến hành xây dựng ontology cho văn giáo dục sau : Bước 1: Xác định miền quan tâm phạm vi ontology - Miền quan tâm ontology: Văn ngành giáo dục - Phục vụ mục đích: tìm kiếm thông tin văn giáo dục - Phục vụ đối tượng: người có nhu cầu tìm kiếm thơng tin giáo dục xây dựng hệ thống thông tin giáo dục - Phạm vi ontology: ngành giáo dục nước Bước 2: Xem xét việc kế thừa ontology có sẵn Đối với ontology văn giáo dục, khơng có thừa kế từ ontology có sẵn Bước 3: Liệt kê thuật ngữ quan trọng ontology Văn bản, lĩnh vực, loại văn bản, quan, thời gian, nội dung văn bản, cá nhân Bước 4: Xây dựng lớp cấu trúc lớp phân cấp 67 Với toán ta xây dựng ontology định nghĩa văn ngành giáo dục có class : - Linh_vuc : class mô tả lĩnh vực mà văn cụ thể đề cập đến - Loai_van_ban : class mô tả loại văn đề cập đến - Thoi_gian : class mô tả yếu tố thời gian có liên quan đến văn - Co_quan : class mô tả quan liên quan văn bản, đồng thời kho liệu lưu trữ thông tin quan - Ca_nhan : class mơ tả cá nhân có liên quan văn bản, đồng thời kho liệu lưu trữ thông tin nhiều cá nhân - Noi_dung : class mô tả nội dung văn bản, nội dung văn phân loại nhờ vào class Kieu_noi_dung - Van_ban : class bao quát nhất, miêu tả cụ thể rõ ràng đối tượng văn Class chứa liệu liên quan đến tất class lại Bước + 6: Định nghĩa thuộc tính quan hệ cho lớp, định nghĩa ràng buộc thuộc tính quan hệ lớp Để trình bày rõ Class ontology văn giáo dục, miêu tả kèm theo sơ đồ mô Class liên quan Class Linh_vuc Class ta định nghĩa class miêu tả thuộc tính lĩnh vực liên quan đến văn nghành giáo dục : - Id_linh_vuc : class class Linh_vuc, thể ID lĩnh vực mà - văn liên quan Ten_linh_vuc : object property liên hệ class Linh_vuc class Van_ban Hình 3.10 Sơ đồ mơ tả class Linh_vuc Class Loai_van_ban 68 Class định nghĩa class liên quan đến vấn đề phân loại văn là: - Id_loai_van_ban : class class Loai_van_ban, thể ID phân loại - văn Ten_loai_van_ban : object property liên hệ class Loai_van_ban class Van_ban Hình 3.11 Sơ đồ mơ tả class Loai_van_ban Class Co_quan Class định nghĩa class liên quan đến đơn vị, quan cụ thể Class Co_quan có class sau : - Id_co_quan : class class Co_quan, thể ID quan có liên - quan văn Cap_bac : class thể cấp bậc quan Ten_co_quan : object property liên hệ class Co_quan class - Van_ban Nhiem_vu_co_quan : thể nhiệm cụ quan văn Hình 3.12 Sơ đồ mơ tả class Co_quan Class Thoi_gian 69 Class định nghĩa class mặt thời gian liên quan đến văn Class Thoi_gian có class sau : - Id_thoi_gian : class thể ID thời gian liên quan đến văn Loai_thoi_gian : object property liên hệ class Thoi_gian class Van_ban Hình 3.13 Sơ đồ mô tả class Thoi_gian Class Ca_nhan Class định nghĩa class mặt cá nhân liên quan đến văn Class Ca_nhan có class sau : - Id_ca_nhan : thể ID cá nhân có liên quan đến văn Ho_ten : object property liên hệ class Ca_nhan class Van_ban CMND : class thể chứng minh nhân dân thơng tin có liên - quan cá nhân Chuc_vu : thể thông tin chức vụ cá nhân Trinh_do : thể thơng tin trình độ học vấn cá nhân Ten_co_quan : object property liên hệ class Co_quan class - Ca_nhan Nhiem_vu_ca_nhan : class thể nhiệm vụ cá nhân có liên quan văn 70 Hình 3.14 Sơ đồ mô tả class Ca_nhan Class Noi_dung Class định nghĩa class nội dung văn Class Noi_dung bao gồm : - Trich_luoc_noi_dung : object property liên hệ class Noi_dung - class Van_ban Noi_dung_day_du : class thể nội dung đầy đủ văn Hình 3.15 Sơ đồ mơ tả class Noi_dung Class Van_ban Class Van_ban class đặc biệt ontology Class Van_ban chứa class con, Object Properties Data Properties để liên kết với class khác tạo thành ontology hoàn chỉnh văn ngành giáo dục Class Van_ban chứa Object Properties sau : - ID_van_ban : class thể ID văn cụ thể Ten_loai_van_ban : object property liên kết class Van_ban class - Loai_van_ban Ten_co_quan : object property liên kết class Van_ban class Co_quan Ten_linh_vuc : object property liên kết class Van_ban class Linh_vuc Loai_thoi_gian : object property liên kết class Van_ban class - Thoi_gian Trich_luoc_noi_dung : object property liên kết class Van_ban class - Noi_dung Ten_ca_nhan : object property liên kết class Van_ban class Ca_nhan 71 Hình 3.16 Sơ đồ mơ tả class Van_ban Tổng quát ontology Từ sơ đồ trên, có sơ đồ tổng quát thể liên kết class ontology sau : Hình 3.17 Sơ đồ mơ tả tổng qt ontology Bước 7: Tạo thực thể cho lớp Để xây dựng thực thể cho lớp, chung sử dụng công cụ Protégé 72 Hình 3.18 Ontology văn giáo dục xây dựng cơng cụ Protégé 3.5 CHƯƠNG TRÌNH THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 3.5.1 Trang chủ hệ thống Hình 3.19 Trang chủ hệ thống 73 3.5.2 Màn hình hiển thị tất kết tìm kiếm Hình 3.20 Màn hình hiển thị tất kết tìm kiếm Đối với kết thực nghiệm với hệ thống tìm kiếm văn hành đắc biệt ngành giáo dục, ứng dụng cho phép người dùng tìm kiếm văn mức tìm kiếm nâng cao đưa gợi ý cho người dùng có nhiều kết trùng 3.5.3 Màn hình hiển thị văn xác Hình 3.21 Màn hình hiển thị văn xác 74 đến văn Lần lượt ta nhập thơng tin cần tìm kiếm để kiểm tra Kết chương trình thể kết tìm kiếm văn liên quan đến nội dung cần kết cho độ xác cao 3.5.4 Màn hình hiển thị thơng tin tác giả Hình 3.23 Màn hình hiển thị thông tin tác giả Đây phần thể thông tin tên đề tài ,cán hướng dẫn đề tài học viên thực để tài 3.5.6 Đánh giá chương trình thử nghiệm Dựa ontology xây dựng, website cho phép người dùng tìm kiếm văn giáo dục xác Sử dụng ngôn ngữ truy vấn SPARQL truy vấn liệu Việc truy vấn khơng tìm theo liệu túy, mà dựa liệu có nghĩa, theo element định nghĩa RDF trước Chúng tơi xây dựng ontology website tìm kiếm văn giáo dục trường Cao đẳng Nghề Đà Nẵng Tuy nhiên, điều kiện thời gian khơng cho phép nên ontology hạn hẹp website hoạt động chưa thực ổn định 75 KẾT LUẬN Kết đạt luận văn Việc nghiên cứu, ứng dụng semantic web để xây dựng website tìm kiếm văn thu kết ban đầu đáng khích lệ Về mặt lý thuyết, nghiên cứu nêu nét đặc trưng, ưu web semantic Bên cạnh đó, dựa việc tìm hiểu ngơn ngữ, cơng cụ hỗ trợ lập trình web ngữ nghĩa, luận văn đưa ontology văn giáo dục, xây dựng website tìm kiếm văn theo chuẩn semantic web Đối với kết thực nghiệm với hệ thống tìm kiếm văn ngành giáo dục, ứng dụng cho phép người dùng tìm kiếm văn mức tìm kiếm nâng cao đưa gợi ý cho người dùng có nhiều kết trùng Với việc sử dụng hệ truy vấn SPARQL, việc truy vấn liệu khơng tìm theo liệu túy, mà dựa liệu có nghĩa, theo element định nghĩa RDF trước Hạn chế hệ thống Bên cạnh thành cơng đạt nghiên cứu cịn hạn chế, ontology mức độ nhỏ, chưa thật lớn phong phú Ta cần phải có liệu ontology đầy đủ để đánh giá mức độ xử lý tìm kiếm xác mức độ đáp ứng người dùng truy cập ứng dụng lúc Ngoài ra, cịn chưa có kết nối liệu trích rút từ WWW liệu ontology Chức trích rút thuộc tính tự động cịn nghiên cứu có nhiều điểm chưa thống nghiên cứu khác giới Bên cạnh đó, việc cài đặt máy local, chưa triển khai lên server Internet Hướng phát triển luận văn Trong tương lai luận văn tiếp tục phát triển để ứng dụng vào thực tiễn Để đạt mục đích cần phải xây dựng hệ thống bóc tách thơng tin 76 tự động, chương trình tự động dị tìm trang web mạng tiến hành bóc tách theo thuật tốn rẽ nhánh thơng minh Mở rộng phạm vi ontology nước để xây dựng website tìm kiếm văn chung cho nước Triển khai ứng dụng thực tế internet, phát triển website trở thành diễn đàn cho phép người sử dụng thêm sửa đổi thơng tin văn Trên toàn nghiên cứu lý thuyết ứng dụng semantic web để xây dựng hệ thống tìm kiếm văn 77 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Từ Minh Phương, Trịnh Hữu Kiên (2004), Công cụ hỗ trợ tạo ngữ nghĩa trang web sử dụng kỹ thuật tách thông tin từ văn [2] Đơng Thị Bích Thủy, Hồ Bảo Quốc (2000), Ứng dụng xử lý ngôn ngữ tự nhiên hệ thống tìm kiếm thơng tin tiếng Việt Khoa Cơng Nghệ Thông Tin – Đại học Khoa học tự nhiên TP.HCM [3] Võ Hoàng Nguyên, Hoàng Lê Quân (2009), Giới thiệu semantic web & ontology, Trường Đại học Bách khoa, TP Hồ Chí Minh [4] Lê Thuý Ngọc, Đỗ Mỹ Nhung (2004), Tìm hiểu search engine xây dựng ứng dụng minh hoạ cho search engine tiếng Việt, Trường đại học khoa học tự nhiên, TP Hồ Chí Minh [5] Nguyễn Thị Thu Trang (2009), Xây dựng hệ thống hỏi đáp tự động phục vụ tư vấn ghi danh trực tuyến, Trường Đại học Khoa học tự nhiên, TP Hồ Chí Minh Tiếng Anh [5] John Hebeler, Matthew Fisher, Ryan Blace, Andrew Perez-Lopez (2009), Semantic Web Programming, Wiley Publishing, Manhattan [6] Thomas B Passin (2004), Explorer's Guide to the Semantic Web, Manning Publications Co, United States [7] Sean Bechhofer, Ian Horrocks and Peter F Patel-Schneider, (2003), Tutorial on OWL, ISWC, Sanibel Island, Florida, USA [8] Sanjib K Sahu, Neeraj Seth, Sanjay Kumar Malik, Nupur Prakash, SAM Rizvi (2008), The Semantic Web Summary : - NextGeneration Search [9] Michael C.Dacota, Leo J Obrst, Kevin T Smith (2003), The Semantic Web, Wiley Publisher, ch 1,2, 78 Internet [10] http://www.w3schools.com/webweb_semantic.asp Trang viết semantic web w3schools [11] http://www.w3.org/TRrdf-sparql-query Hệ truy vấn SPARQL [12] http://razor.occams.info/codesemweb Trang chủ thư viện SemWeb [13] http://nlv.gov.vn/nghiep-vu-thu-vien/semantic-web-va-thu-vien-so.html [14] http://mach.vub.ac.be/~bpellens/OwlDotNetApi cơng cụ lập trình ứng dụng OWLDotNetApi [15] http://lenam.info/cac-bo-phan-cau-thanh-thong-search-engine/ [16] http://protégé.stanford.edu Trang chủ công cụ Protégé [16] http://www.w3.org/2001/sw/wiki/OWL Trang viết OWL w3schools 79 ... semantic web giúp chúng tơi giải vấn đề Vì vậy, tơi chọn đề tài luận văn tốt nghiệp ? ?Nghiên cứu Web ngữ nghĩa ứng dụng trợ giúp tìm kiếm văn nghiệp vụ hành chính? ?? Mục tiêu nghiên cứu - Nghiên cứu. .. xin cam đoan luận văn thạc sĩ ‘? ?Nghiên cứu Web ngữ nghĩa ứng dụng trợ giúp tìm kiếm văn nghiệp vụ hành chính? ??’ cơng trình nghiên cứu riêng tơi, số liệu kết nghiên cứu luận văn trung thực không... Ontology Web ngữ nghĩa - Ứng dụng để xây dựng hệ thống tìm kiếm văn nghiệp vụ hành Đối tượng phạm vi nghiên cứu • Đối tượng nghiên cứu: văn hành chính, ngành giáo dục, semantic web xử lý ngơn ngữ văn