1. Trang chủ
  2. » Luận Văn - Báo Cáo

thiết kế hệ hỗ trợ tìm kiếm công văn theo ngữ nghĩa trong một cơ quan nhà nước

83 43 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 83
Dung lượng 1,93 MB

Nội dung

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - LÊ MINH THƯ THIẾT KẾ HỆ HỖ TRỢ TÌM KIẾM CƠNG VĂN THEO NGỮ NGHĨA TRONG MỘT CƠ QUAN NHÀ NƯỚC LUẬN VĂN THẠC SĨ KỸ THUẬT TP HỒ CHÍ MINH – 2015 i LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu luận văn trung thực chƣa đƣợc công bố công trình khác Ngƣời làm cam đoan Lê Minh Thƣ ii LỜI CẢM ƠN Em xin chân thành gửi lời cảm ơn đến thầy cô giáo khoa Công nghệ thơng tin trƣờng Học viện bƣu viễn thơng sở Hồ Chí Minh giảng dạy, giúp đỡ em suốt trình học tập Trƣờng Em xin gửi lời cảm ơn sâu sắc tới thầy giáo, PGS.TS Đỗ Văn Nhơn, ngƣời trực tiếp hƣớng dẫn, bảo, giúp đỡ em hoàn thành luận văn Em xin chân thành cảm ơn! iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT vi DANH SÁCH BẢNG BIỂU vii DANH SÁCH HÌNH VẼ viii MỞ ĐẦU CHƢƠNG 1: TỔNG QUAN 1.1 Đặt vấn đề 1.1.1 Thực trạng nhu cầu xây dựng hệ hỗ trợ tìm kiếm cơng văn theo ngữ nghĩa .4 1.1.2 Tìm hiểu số phần mềm tìm kiếm cơng văn 1.1.2.1 Phần mềm e-Office 1.1.2.2 Văn Phòng Điện Tử NET 1.1.2.3 Phần mềm CloudOffice 1.1.3 Vấn đề tìm kiếm nội dung cơng văn biểu diễn ngữ nghĩa 1.1.4 Cấu trúc hệ thống tìm kiếm thơng tin 1.1.5 Một số nghiên cứu có liên quan 1.2 Mục tiêu giới hạn đề tài 1.3 Ý nghĩa đề tài 10 1.4 Phƣơng pháp nghiên cứu .11 CHƢƠNG 2: CƠ SỞ LÝ THUYẾT .12 2.1 Web ngữ nghĩa .12 2.1.1 Web ngữ nghĩa gì? 12 2.1.2 Kiến trúc web ngữ nghĩa 12 2.2 Ontology 15 2.2.1 Khái niệm Ontology 15 2.2.2 Các thành phần Ontology 15 2.2.3 Các bƣớc xây dựng Ontology 16 2.3 Công văn quản lý công văn 19 2.3.1 Khái niệm công văn 19 2.3.2 Bố cục công văn .19 iv 2.4 Một số công cụ thiết kế 20 2.4.1 RDF – tảng Semantic web 20 2.4.1.1 Tổng quan RDF 20 2.4.1.2 Lƣợc đồ RDF – RDF Schema 21 2.4.2 OWL 22 2.4.3 Jena Framework 24 2.4.4 Công cụ OWLAPI 25 2.4.5 Công cụ xây dựng Ontology - Protégé 26 CHƢƠNG 3: KHẢO SÁT VÀ THIẾT KẾ 28 3.1 Hiện trạng nhu cầu 28 3.1.1 Hoạt động tỉnh Đồng Tháp .28 3.1.2 Nhu cầu tìm kiếm cơng văn 29 3.2 Giải pháp quy trình xây dựng Ontology công văn 30 3.2.1 Giải pháp xây dựng ontology công văn 30 3.2.1.1 Mơ hình biểu diễn ngữ nghĩa 30 3.2.1.2 Mơ hình Ontology ngữ nghĩa cho tài liệu 32 3.2.2 Quy trình xây dựng Ontology công văn 36 3.2.2.1 Thu thập công văn 37 3.2.2.2 Rút trích keyphrase từ cơng văn .37 3.2.2.3 Chọn quan hệ ngữ nghĩa keyphrase 38 3.2.2.4 Xây dựng chuẩn hóa Ontology 39 3.3 Sơ đồ hệ thống 39 3.3.1 Xây dựng mơ hình liệu Ontology công văn .39 3.3.2 Tổ chức sở liệu Ontology công văn 42 3.3.3 Thuật giải tìm kiếm theo ngữ nghĩa 43 3.3.3.1 Phƣơng pháp kích hoạt lan truyền 43 3.3.2.2 Phƣơng pháp tìm kiếm theo ngữ nghĩa dựa ontology công văn .44 CHƢƠNG 4: CÀI ĐẶT VÀ THỬ NGHIỆM .47 4.1 Môi trƣờng ứng dụng .47 4.1.1 Spring Framework 47 4.1.1.1 Spring Framework 47 4.1.1.2 Spring MVC Framework 50 v 4.1.2 Angular JS 52 4.2 Chƣơng trình ứng dụng 54 4.2.1 Xây dựng ứng dụng 54 4.2.1.1 Mơ hình lớp 54 4.2.1.2 Mô tả lớp 55 4.2.2 Trang chủ hệ thống 56 4.2.3 Màn hình hiển thị kết tìm kiếm cơng văn .58 4.2.4 Chi tiết thông tin 59 4.3 Đánh giá thử nghiệm 60 4.3.1 Đánh giá trình thu thập thơng tin tự động 60 4.3.2 Đánh giá trình tìm kiếm 61 KẾT LUẬN VÀ KIẾN NGHỊ 66 Kết luận .66 Hạn chế 67 Hƣớng phát triển .67 DANH MỤC TÀI LIỆU THAM KHẢO 68 PHỤ LỤC A – HƢỚNG DẪN SỬ DỤNG CÔNG CỤ PROTÉGÉ 71 vi DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT Viết tắt Tiếng Anh Tiếng Việt ⊆ subset Tập ∅ the empty set Tập rỗng RKC,RCC,RKK Binary relation Quan hệ hai CK_ONTO Classed Keyphrase based Ontology IR MVC OWL Information Retrieval Model – View – Controller Web Ontology Language Ontology cho keyphrase đƣợc phân lớp Tìm kiếm thơng tin Mơ hình thiết kế Ngơn ngữ Ontology RDF Resource Description Framework Cơ cấu mô tả tài nguyên RDFS Resource Description Framework Lƣợc đồ cấu mô tả tài Scheme nguyên URI Uniform Resource Identifier Định dạnh tài nguyên URL Uniform Resource Locator Định vị tài nguyên thống W3C World Wide Web Consortium Tổ chức mạng toàn cầu WWW World Wide Web Mạng toàn cầu XML eXtensible Markup Language Ngôn ngữ đánh dấu mở rộng vii DANH SÁCH BẢNG BIỂU Bảng 2.1 Một số thuộc tính OWL 23 Bảng 3.1 Bảng thuộc tính quan hệ 40 Bảng 3.2 Bảng thuộc tính liệu 41 Bảng 4.1 Bảng thống kê đánh giá thực nghiệm tìm kiếm 63 cơng văn viii DANH SÁCH HÌNH VẼ Hình 2.1 Kiến trúc Web ngữ nghĩa 13 Hình 2.2 Quá trình phát triển Ontology 17 Hình 2.3 So sánh RDF RDFS 25 Hình 3.1 Quy trình xây dựng Ontology cơng văn 36 Hình 3.2 Trang cơng văn tỉnh Đồng Tháp 37 Hình 3.3 Thơng tin chi tiết cơng văn 38 Hình 3.4 Các ràng buộc thuộc tính quan hệ lớp 42 Hình 4.1 Mơ hình Spring đóng vai trị tầng Business 48 Hình 4.2 Mơ hình Spring tổ chức modules 48 Hình 4.3 Mơ hình Spring MVC 51 Hình 4.4 Mơ hình thành phần AngularJS 54 Hình 4.5 Mơ hình lớp 54 Hình 4.6 Giao diện trang chủ hệ thống 57 Hình 4.7 Trang tìm kiếm thơng tin cơng văn 58 Hình 4.8 Trang hiển thị kết tìm kiếm cơng văn 59 Hình 4.9 Trang hiển thị kết chi tiết cơng văn 59 Hình – PLA Giao diện Protégé 71 Hình – PLA Chọn kiểu định dạng Ontology 72 Hình – PLA Lƣu tập tin Ontology 72 Hình – PLA Tạo lớp 73 Hình – PLA Cấu trúc hiển thị lớp 73 Hình – PLA Tạo thuộc tính Ontology 73 MỞ ĐẦU Trong quan nhà nƣớc, bên cạnh việc ứng dụng công nghệ thông tin (CNTT) vào công tác chun mơn việc ứng dụng CNTT vào cơng tác quản lý, lƣu trữ đóng vai trị quan trọng việc nâng cao chất lƣợng, hiệu làm việc viên chức nhà nƣớc Tin học hóa cơng việc văn phòng mục tiêu hàng đầu quan nhà nƣớc Thực tế lƣợng công văn đến đƣợc ban hành ngày nhiều quan lại có văn riêng biệt Mặc dù tồn cơng văn đƣợc lƣu trữ dƣới dạng file mềm số hóa nhƣng đơn lƣu trữ chƣa đƣợc xếp theo hệ thống sở liệu chuẩn định Trong đó, website tìm kiếm công cụ hỗ trợ quản lý công văn chƣa đáp ứng đƣợc nhu cầu tìm kiếm cách xác nhanh chóng Các hệ thống tìm kiếm phần lớn dựa từ khóa mức độ phổ biến tài liệu Một danh sách từ khóa dạng biểu diễn sơ lƣợc nội dung cách biểu diễn mang mức độ thơng tin thấp Vấn đề khó khăn ngƣời sử dụng khả mô tả nhu cầu thơng tin số từ khóa biểu diễn chuyển nhu cầu thành dạng thức truy vấn phù hợp với hệ thống Đặc biệt ngƣời sử dụng kinh nghiệm khơng thể đặc tả từ khóa cho vấn đề cần tìm kiếm Đó lý khiến cho hệ thống tìm kiếm có kết trả lúc thỏa mãn yêu cầu ngƣời sử dụng, nhƣ độ xác khơng cao hay khơng tìm thấy đƣợc tài liệu liên quan chúng đƣợc mơ tả với từ khóa khác đồng nghĩa gần nghĩa với từ khóa mà ngƣời dùng cung cấp Vấn đề đặt để có đƣợc cơng cụ tìm kiếm theo ngữ nghĩa, hiểu đƣợc trả lời câu hỏi ngƣời dùng ngôn ngữ tự nhiên cách thân thiện Xuất phát từ nhu cầu thực tế khả nghiên cứu phát triển giải pháp nhƣ ứng dụng, tơi chọn đề tài “Thiết kế hệ hỗ trợ tìm kiếm công văn theo ngữ nghĩa quan nhà nƣớc” để đáp ứng đƣợc nhu cầu tìm kiếm 60 4.3 Đánh giá thử nghiệm Để tiến hành đánh giá thực nghiệm khả tìm kiếm ứng dụng, ta tiến hành so sánh thực tế ứng dụng mẫu mơ hình với phần tìm kiếm trang web tra cứu văn Đồng Tháp 4.3.1 Đánh giá q trình thu thập thơng tin tự động Bắt đầu từ đƣờng dẫn : http://apps.dongthap.gov.vn/vanban/result.jsp?&cboCoQuanBH=-1&cboLoaiVb=1&cboLinhVuc=11&txtNguoiKy=&txtNgayKy1=&txtNgayKy2=&txtNoiDung=&i dDonVi=dt&page=2 Ở đƣờng dẫn hỗ trợ từ cơng cụ tìm kiếm mặc định nhằm mục đích giới hạn số lƣợng cơng văn qt qua phải nằm lĩnh vực Khoa Học Kỹ Thuật Có tất 277 Cơng Văn thuộc lĩnh vực Hệ thống sử dụng để chạy thực nghiệm :  Laptop: HP Pavilion, core i5, Ram 4G  Internet : VNPT MB download Kết thực nghiệm :  Sau trình thu thập đƣợc khởi động, hệ thống phút 43 giây để quét hết danh sách tất đƣờng dẫn đến chi tiết công văn  Mất 17 phút 12 giây để quét hết nội dung tất công văn để tạo thành keypharse  Bỏ qua 13 công văn lỗi kết nối trình làm việc 61 Kết sau chạy chƣơng trình :  Số lƣợng Công văn : 263 công văn  Số lƣợng Ngƣời ký : 16 ngƣời  Số lƣợng Cơ Quan : quan  Số lƣợng Lĩnh Vực : lĩnh vực  Các thông tin mô tả liên quan khác : tƣơng ứng 263 trích yếu, 154 ngày ký, 263 số kí hiệu Từ ta tiến hành bổ sung thông tin keyphrase liên quan đến ngƣời ký nhƣ có chức vụ nhƣ nào? Thuộc quan nào? Và số thông tin cá nhân liên quan đến ngƣời nhƣ [email], [số điện thoại], [quê quán], Ngoài ra, đọc lƣớt qua nội dụng cơng văn ta xây dựng keyphrase có liên kết [Gửi đến quan], [liên quan đến], bổ sung nhóm [Vấn Đề], [Thuật Ngữ], [Hạ Tầng Kỹ Thuật],… Việc bổ sung phải diễn tay để đảm thơng tin an tồn xác Quy Trình Thời gian Quét danh sách đƣờng dẫn đến chi tiết phút 43 giây Kết 277 đƣờng dẫn công văn Quét nội dung đƣờng dẫn chi tiết 17 phút 12 263 công văn tạo keypharse quan hệ giây ontology 4.3.2 Đánh giá trình tìm kiếm Cũng giống nhƣ cơng cụ tìm kiếm bản, ứng dụng mẫu cung cấp khả tìm kiếm theo tên, theo nhóm quan hệ nhƣ: đƣợc ký bởi, đƣợc ban hành bởi, thuộc lĩnh vực, ngày ký,… Nhƣng điểm ƣu việt khả đề xuất từ khóa tìm kiếm cho ngƣời dùng dễ dàng nhanh chóng so với tìm kiếm cơng cụ bình thƣờng Ngồi khả truy vấn cịn trực quan dễ sử dụng cơng cụ khác Ví dụ : 62  [Đƣợc ký bởi] [Tên ngƣời ký]  [Đƣợc ban hành bởi] [Tên Cơ Quan]  [Thuộc lĩnh vực] [Tên lĩnh vực]  [Gửi đến] [Tên quan nhận] [dd/mm/yyyy] Để làm bật điểm trội việc sử dụng tự vựng tiến hành câu truy vấn mà công cụ bình thƣờng khơng có khả nhƣ sau: Câu truy vấn : [Đƣợc ký bởi] [Phó chánh văn phịng] Đối với loại câu truy vấn này, công cụ tìm kiếm thơng thƣờng khơng thể trả kết đơn giản khơng có cơng văn đƣợc ký đối tƣợng tên Phó Chánh Văn Phịng Nhƣng với phƣơng pháp tìm kiếm sử dụng có khả suy luận Phó Chánh Văn Phịng [Nguyễn Văn A] từ trả kết danh sách công văn đƣợc ký [Nguyễn Văn A] Câu truy vấn : [Đƣơc ký bởi] [nvthe@dongthap.gov.vn] Đây câu truy vấn mà liên quan đến thông tin cá nhân đối tƣợng ký công văn Tƣơng tự nhƣ trên, công cụ thơng thƣờng chẳng thể trả kết xác với yêu cầu ngƣời dùng Ở hệ thống tích hợp từ vựng việc từ thơng tin để suy luận email Nguyễn Văn Thể điều khơng khó khăn từ trả kết nhƣ mong muốn ngƣời dùng Câu truy vấn : [Đƣợc ban hành bởi] [Nguyễn Văn Phú] Trên thực tế cơng văn đƣợc ban hành quan, cơng cụ tìm kiếm thơng thƣờng kiểm tra theo cách Với hệ thống tích hợp trả kết công văn đƣợc ban hành Ủy Ban Nhân Dân Tỉnh nơi Nguyễn Văn Phú làm việc Câu truy vấn tự : Đối với loại truy vấn cơng cụ tìm kiếm thơng thƣờng trả kết cơng văn có chứa từ khóa cần tìm 63 Nhƣng hệ thống tích hợp khác, từ từ khóa tự đó, tiến hành xác định thơng tin (keyphrase) liên quan đến từ khóa sử dụng phƣơng pháp lan truyền để tìm cơng văn liên quan đến thơng tin mà khơng thiết phải chứa từ khóa Nếu kết hợp với nhiều từ khóa khác vùng tìm thấy thu gọn kết đáp ứng nhu cầu tìm kiếm ngƣời dùng Ngồi việc dùng để truy vấn tìm kiếm cơng văn hệ thống tích hợp từ vựng cịn mang nhiều lợi ích khác nhƣ khả đề xuất cơng văn liên quan đến công văn mà ngƣời dùng xem Trong khuôn khổ ứng dụng thực nghiêm mẫu nên việc đƣa nhiều ví dụ khác khó thực lƣợng từ vựng đƣợc xây dựng chƣa đủ lớn để thực nghiệm cần nhiều giải thuật thông minh để training hỗ trợ câu truy vấn tự nhiên từ ngƣời dùng Và điểm cần mở rộng phát triển đề tài lên cấp bậc Gọi S: số lƣợng công văn mà hệ thống tìm thấy đƣợc đánh giá có liên quan theo ngƣời dùng T: tổng số cơng văn tìm thấy hệ thống U: số cơng văn không đáp ứng nhu cầu ngƣời dùng Ti: thời gian đáp ứng yêu cầu ngƣời dùng (ms) S/T: độ xác tìm kiếm cơng văn Bảng 4.1: Bảng thống k đánh giá thực nghiệm tìm kiếm cơng văn 64 STT Y u cầu ngƣời dùng Những công văn đƣợc ký Nguyễn Văn Dƣơng Công văn ban hành Sở Khoa Học Và Công Nghệ vào tháng 01/2015 Cơng văn đƣợc ký ngƣời có chức giám đốc Sở Thông Tin Và Truyền Thông Những cơng văn đƣợc ký ngƣời có chức vụ Phó Chánh Văn Phịng Tìm kiếm cơng văn đƣợc ký ngƣời có số điện thoại 067 3873 988 (ở Nguyễn Ngọc Thƣơng) Cơng văn đƣợc ký ngƣời có email nnthuong@dongthap.gov.vn (Nguyễn Ngọc Thƣơng) đƣợc gửi đến Sở Thông Tin Truyền Thơng Tìm kiếm cơng văn đƣợc ban hành Sở Khoa Học Và Công Nghệ Tìm kiếm cơng văn đƣợc gửi đến Sở Khoa Học Từ khóa [ĐÃ KÝ BỞI] [NGUYỄN VĂN DƢƠNG] [BAN HÀNH BỞI] [SỞ KHOA HỌC VÀ CÔNG NGHỆ] [ĐÃ KÝ BỞI] [GIÁM ĐỐC] [SỞ THÔNG TIN VÀ TRUYỀN THÔNG] Ti(ms) T 38,16 30 S 22 U S/T 0,73 66,84 24 24 1,0 22,27 57 38 19 0,66 [ĐÃ KÝ BỞI] [PHÓ CHÁNH VĂN PHÕNG] 94,97 112 112 1,0 [ĐÃ KÝ BỞI] 51,17 57 57 1,0 [ĐÃ KÝ BỞI] 32,31 [GỬI ĐẾN CƠ QUAN] [SỞ THÔNG TIN VÀ TRUYỀN THÔNG] 25 19 0,76 [ĐƢỢC BAN HÀNH BỞI] [SỞ KHOA HỌC VÀ CÔNG NGHỆ] [GỬI ĐẾN CƠ QUAN] [SỞ KHOA HỌC VÀ CÔNG 988 484 470 14 0,97 16,96 15 1,0 15 65 10 11 12 13 14 15 16 17 18 Và Cơng Nghệ Tìm kiếm cơng văn ký Phạm Tấn Xiếu đƣợc gửi đến Sở Khoa Học Và Công Nghệ Công văn liên quan tới Hội Đồng KH&CN Những cơng văn có đề cập đến điện tốn đám mây Tìm kiếm cơng văn liên quan tới dự án ứng dụng phần mềm quản lý điều hành Tìm kiếm cơng văn liên quan tới Eoffice Tìm kiếm cơng văn liên quan tới Eoffice vệ tinh viễn thông địa tĩnh Việt Nam Công văn liên quan tới trạm BTS Công văn ban hành ngày 30/01/2015 Công văn ban hành tháng 01/2015 đƣợc ký Huỳnh Văn Quản Công văn vấn đề Internet NGHỆ] [GỬI ĐẾN CƠ QUAN] [SỞ KHOA HỌC VÀ CÔNG NGHỆ][ĐÃ KÝ BỞI][PHẠM TẤN XIẾU] [HỘI ĐỒNG KH&CN] 14,04 3 1,0 243,9 73 64 0,87 [LIÊN QUAN ĐẾN] [ĐIỆN TOÁN ĐÁM MÂY] [LIÊN QUAN TỚI DỰ ÁN][ỨNG DỤNG PHẦN MỀM QUẢN LÝ VÀ ĐIỀU HÀNH] [LIÊN QUAN TỚI] [EOFFICE] [LIÊN QUAN TỚI] < vệ tinh viễn thông địa tĩnh Việt Nam> 12,63 1 1,0 2,563 3 1,0 5,325 1 1,0 32,3 1 1,0 [TRẠM BTS] 3,189 2 1,0 86,81 4 1,0 [ĐƢỢC KÝ BỞI] [HUỲNH VĂN QUẢN] 106,8 2 1,0 52,29 78 49 29 0,62 66 KẾT LUẬN VÀ KIẾN NGHỊ Kết luận So với mục tiêu ban đầu đề ra, luận văn xây dựng đƣợc hệ hỗ trợ việc tìm kiếm cơng văn theo ngữ nghĩa tỉnh Đồng Tháp Hệ thống cho phép quản lý công văn theo ngữ nghĩa liên quan đến nội dung công văn, cho phép tìm kiếm cơng văn theo nhiều chức nhƣ: tìm theo từ khóa tự tìm theo từ khóa gợi ý hệ thống cung cấp Theo hệ thống khơng so trùng cách xác ngƣời dùng cung cấp mà hƣớng tới việc tìm kiếm ngƣời dùng nghĩ, nghĩa tìm cách đốn ý, hiểu nghĩa dựa khái niệm có liên quan đến từ khóa tìm kiếm để trả tập tài liệu kết với ý định tìm kiếm ngƣời dùng Về mặt lý thuyết: luận văn nghiên cứu trình bày kiến thức web ngữ nghĩa Đồng thời sâu vào việc tìm hiểu cách thức xây dựng thiết kế ontology Dựa việc tìm hiểu ngơn ngữ, cơng cụ hỗ trợ lập trình web ngữ nghĩa, luận văn đƣa đƣợc ontology công văn, xây dựng đƣợc website hỗ trợ tìm kiếm cơng văn theo chuẩn semantic web Về mặt thực tiễn: luận văn đem lại số kết kể đến nhƣ: + Khảo sát thực trạng nhu cầu tìm kiếm cơng văn tỉnh Đồng tháp, qua xây dựng đƣợc từ vựng công văn khoảng 1000 keyphrase + Áp dụng mơ hình, cơng cụ, giải pháp từ xây dựng hệ hỗ trợ tìm kiếm giúp ngƣời dùng tìm kiếm cơng văn cách nhanh chóng dễ dàng + Việc tìm kiếm theo ngữ nghĩa giúp ngƣời dùng có đƣợc kết gợi ý liên quan đến từ khóa cần tìm nội dung cần tìm khơng có hệ thống + Giao diện gần gũi, thân thiện với ngƣời sử dụng, cho kết xác đến 80% tập sở liệu thử nghiệm 67 Hạn chế Bên cạnh mặt làm đƣợc hệ thống cịn tồn số hạn chế định Một hạn chế lớn đề tài chƣa biểu diễn hết tri thức tất lĩnh vực công văn Ontology vốn đƣợc xây dựng cách thủ công ngƣời theo ý kiến chủ quan nên dễ dẫn tới nhiều trƣờng hợp thiếu sót hay dƣ thừa Những thiếu sót dẫn đến không cân ontology hay ảnh hƣởng đến kết suy diễn, tìm kiếm tự động Ngồi ra, lƣợng thông tin tiến hành thu thập thủ công nhiều dẫn đến từ vựng chƣa đƣợc phong phú Tuy nhiên, cách tiếp cận dựa ontology đƣợc xem cách tiếp cận đại phù hợp cho việc xử lý ngữ nghĩa tài nguyên tri thức ontology tài nguyên có giá trị Nếu tài nguyên từ vựng hay ontology đƣợc xây dựng tốt, mô tả đƣợc tƣơng đối đầy đủ tri thức lĩnh vực việc sử dụng chúng làm tăng độ xác khả vét cạn tìm kiếm thơng tin theo ngữ nghĩa Ngồi việc cài đặt ứng dụng mức localhost, chƣa thể triển khai lên hệ thống server Internet Hƣớng phát triển Trong tƣơng lai, luận văn tiếp tục phát triển để ứng dụng đƣợc vào thực tiễn Để xây dựng đƣợc mục đích cần phải áp dụng kỹ thuật phân tách từ để tăng khả thu thập thông tin liệu cách tự động mà không sử dụng biện pháp thủ công Mở rộng phạm vi ontology công văn tất lĩnh vực Triển khai ứng dụng thực tế Internet để phục vụ cho tất ngƣời 68 DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt [1] Dƣơng Ngọc Duy (2012), Xây dựng web ngữ nghĩa trợ giúp tra cứu từ Hán Việt, luận văn thạc sĩ kĩ thuật, Đại học Đà Nẵng, Đà Nẵng [2] Phạm Minh Đƣơng (2013), Xây dựng web ngữ nghĩa trợ giúp khai thác hiệu nguồn tài nguyên phục vụ đào tạo trường Đại học Trà Vinh, luận văn thạc sĩ kĩ thuật, Đại học Đà Nẵng, Đà Nẵng [3] Nguyễn Thị Thu Hằng (2011), Nghiên cứu web ngữ nghĩa ứng dụng vào xử lý thông tin du lịch, luận văn thạc sĩ kỹ thuật, Đại học Đà Nẵng, Đà Nẵng [4] Phạm Thanh Hùng (2011), Ứng dụng semantic web để phát triển hệ thống tư vấn việc làm, luận văn thạc sĩ kỹ thuật, Đại học Đà Nẵng, Đà Nẵng [5] Phạm Hoàng Linh (2013), Ứng dụng web ngữ nghĩa xây dựng hệ thống tìm kiếm văn ngành giáo dục, luận văn thạc sĩ kỹ thuật, Đại học Đà Nẵng, Đà Nẵng [6] Lƣơng Đỗ Long (2011), Ứng dụng web ngữ nghĩa lưu trữ quản lý tài số, luận văn thạc sĩ khoa học, Đại học công nghệ, Hà nội [7] Nguyễn Xuân Pha (2013), Ứng dụng web ngữ nghĩa xây dựng hệ thống tra cứu pháp luật Việt Nam, luận văn thạc sĩ khoa học, Đại học Đà nẵng, Đà nẵng [8] Huỳnh Thị Thanh Thƣơng (2012), Nghiên cứu mơ hình tổ chức kỹ thuật tìm kiếm có ngữ nghĩa kho tài nguyên học tập lĩnh vực CNTT, luận văn thạc sĩ Toán - Tin học, Đại học khoa học tự nhiên, Thành phố Hồ Chí Minh [9] Ngô Minh Vƣơng (2011), Truy hồi thông tin dựa ontology, luận án tiến sĩ kỹ thuật, Đại học Bách Khoa, TP HCM Tiếng Anh [10] A Abecker, L Stojanovic, J Schneider, A Maedche, S Libischer, R Suder, T Lumpp, G Breiter, J Dinger (2004) “The Role of Ontologies in Autonomic Computing System”, IBM Systems Journal, Vol 43, No 69 [11] Berthold, M R., et al (2009), “Pure Spreading Activation is Pointless”, In Proceedings of the 18th ACM International Conference on Information and Knowledge Management (CIKM-2009), pp 1915-1918 [12] Crestani, F 1997, “Application of Spreading Activation Techniques in Information Retrieval”, In Artificial Intelligence Review, Vol 11, No 6, pp 453– 482 [13] Gruber, T.R (1995) “Toward Principles for the Design of Ontologies Used for Knowledge Sharing”, International Journal Human-Computer Studies, 43(5-6) :907-928 [14] VanNhon Do, ThanhThuong T.Huynh, Truong An PhamNguyen (2013), “Sematic Representation and Search Techniques for Document Retrieval Systems”, ACIIDS 2013, Part I, LNAI 7802, pp476-486 [15] Natalya F Noy, Deborah L McGuinness Ontology Development 101: A Guide to Creating Your First Ontology Stanford University, Stanford, CA, 94305 [16] Eric Miller, R Guha, Rob Mc “Sematic Cool, Search”, http://www2003.org/cdrom/papers/referred/p799/ess.html [17] Mike Uschold, Michael Gruninger (1996) Ontologies: Principles, Methods and Applications, The University of Edinburgh Websites [18] Apache Jena, HP Labs Semantic Web Research http://jena.apache.org/ [19] Bản thể luận, Wiki http://vi.wikipedia.org/wiki/B%E1%BA%A3n_th%E1%BB%83_lu%E1%BA%AD n [20] Getting started with protégé-owl, Đại học Stanford, California http://protege.stanford.edu/doc/owl/getting-started.html [21] Giải pháp văn phịng điện tử khơng giấy tờ http://www.vanphongdientu.net/vi/ [22] Giới thiệu phần mềm https://www.cloudoffice.com.vn/ văn phòng điện tử Cloudoffice 70 [23] Giới thiệu phần mềm Bkav eoffice http://www.eoffice.com.vn/chuc-nang [24] Guy Lapalme, (2013), XML: Looking at the Forest Instead of the Trees http://www.iro.umontreal.ca/~lapalme/ForestInsteadOfTheTrees/HTML/ch07s01.ht ml#tab_RDF-Triples [25] Ignazio Palmisano & the OWL API team, The Rough Guide to the OWL API http:// www.owlapi.sourceforge.net/owled2011_tutorial.pdf [26] Mơ hình MVC, http://hoclaptrinh365.blogspot.com/2014/03/mo-hinh- mvc.html [27] Protégé, Đại học Stanford, California http://protege.stanford.edu/ [28] Resource Description Framework (RDF), W3C http://www.w3.org/RDF/ [29] RDF Schema 1.1, W3C http://www.w3.org/TR/rdf-schema/ [30] Tài liệu lập trình Spring Framework MVC tiếng Việt http://hoidapit.com.vn/Questions/ViewQuestions/2530/tai-lieu-lap-trinh-springframework-mvc-3-tieng-viet.html [31] Tổng Quan Web Semantic http://dbglory.wordpress.com/2009/10/17/web- semantic-k%E1%BB%B3-1-t%E1%BB%95ng-quan-web-semantic [32] Tổng Quan AgularJS http://freetuts.net/tong-quan-ve-angularjs-200.html [33] Trang cổng thông tin điện tử tỉnh https://dongthap.gov.vn/wps/portal/ctt [34] W3C Sematic Web Activity http://www.w3.org/2001/sw/ Đồng tháp 71 PHỤ LỤC A – HƢỚNG DẪN SỬ DỤNG CÔNG CỤ PROTÉGÉ Trong phần hƣớng dẫn sử dụng sử dụng chƣơng trình Protégé 5.0.0 với giao diện Protégé-OWL Chúng ta tìm hiểu cách để:  Tạo mở ontology  Lƣu ontology  Tạo lớp ràng buộc  Tạo thuộc tính quan hệ  Tạo cá thể Tạo mở ontology a Vừa khởi động Protégé thấy cửa sổ nhƣ sau: Hình Giao diện Protégé 5.0.0 72 Khi vừa khởi động chƣơng trình Protégé tạo ontology cho ngƣời dùng thao tác trực tiếp b Mở ontology có sẵn: mở từ file project file nguồn Vào File chọn nút Open chọn Ontology muốn mở Lƣu onto og Sau thực xong ontology, vào File chọn Save sử dụng tổ hợp phím Ctrl-S Một hộp thoại xuất chọn lựa kiểu định dạng thƣờng dùng, thông thƣờng lƣu trữ dƣới dạng OWL/XML Hình Chọn kiểu định dạng onto og Sau lựa chọn kiểu định dạng xong, hộp thoại thứ hai xuất cho phép ngƣời dùng đặt tên ontology Hình Lƣu tập tin onto og 73 Tạo ớp Tại giao diện Protégé, chọn tab Entities, tiếp tục chọn tab Class hierarchy, mặc định ontology tạo có lớp cha Thing Để tạo lớp ta chọn nút Add subclass , hộp thoại tạo tên lớp bật để ngƣời dùng đặt tên cho lớp có tên Father Hình 4: Tạo ớp Để tạo lớp lớp Father vừa tạo, ta chọn lớp Father chọn nút Add subclass , tiến hành nhƣ hình Để tạo lớp ngang hàng với lớp Father, ta chọn lớp Father chọn nút Add sibling class , hộp thoại tạo tên lớp ngang hàng với lớp Father hiển thị tƣơng tự nhƣ hình Ta có cấu trúc nhƣ sau Hình Cấu trúc câ hiển thị ớp Để xóa lớp đó, ta chọn nút Delete selected classes 74 Tạo thuộc t nh quan hệ Tại giao diện Protégé, ta chọn tab Object property hierarchy để thêm chỉnh sửa thuộc tính đối tƣợng ontology, chọn tab Data property hierarchy để thêm chỉnh sửa thuộc tính liệu ontology Hình Tạo thuộc t nh onto og ... vựng tài liệu cơng văn cố gắng quản lý đƣợc thông tin ngữ nghĩa liên quan đến nội dung công văn nhƣ hỗ trợ xử lý ngữ nghĩa tìm kiếm Việc xây dựng hệ hỗ trợ tìm kiếm cơng văn theo ngữ nghĩa mặt thực... lý ngữ nghĩa tìm kiếm - Các kỹ thuật, quy trình chung cho việc thiết kế, xây dựng hệ hỗ trợ tìm kiếm cơng văn theo ngữ nghĩa 1.3 Ý nghĩa đề tài Nhu cầu thực tiễn hệ thống tìm kiếm cơng văn theo. .. công văn; đồng thời giới thiệu sơ đồ hệ thống hỗ trợ việc tìm kiếm công văn theo ngữ nghĩa Chƣơng 4: Cài đặt thực nghiệm Trong chƣơng giới thiệu việc xây dựng ứng dụng hỗ trợ việc tìm kiếm cơng văn

Ngày đăng: 23/12/2020, 08:21

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w