1. Trang chủ
  2. » Giáo án - Bài giảng

Ứng dụng semantic web xây dựng hệ thống tra cứu cá rạn san hô ở biển việt nam

73 155 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 73
Dung lượng 3,51 MB

Nội dung

BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM VŨ THẾ THẢO ỨNG DỤNG SEMANTIC WEB XÂY DỰNG HỆ THỐNG TRA CỨU CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM LUẬN VĂN THẠC SĨ NGÀNH KỸ THUẬT HẢI PHÒNG, 2016 BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM VŨ THẾ THẢO ỨNG DỤNG SEMANTIC WEB XÂY DỰNG HỆ THỐNG TRA CỨU CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM LUẬN VĂN THẠC SĨ NGÀNH KỸ THUẬT NGÀNH: CÔNG NGHỆ THÔNG TIN MÃ SỐ: CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN Người hướng dẫn khoa học: TS Trần Thị Hương HẢI PHÒNG, 2016 LỜI CAM ĐOAN Tôi: Vũ Thế Thảo, học viên cao học lớp CNTT 2014_1, chuyên ngành Công nghệ Thông tin, khoá học 2014-2016, Trường Đại học Hàng Hải Việt Nam xin cam đoan: Các nội dung Luận văn Thạc sĩ tự thân làm sở tài liệu, số liệu khảo sát thực tế thân thu thập Các số liệu tham khảo khác sử dụng nghiên cứu thuộc quyền tác giả trích dẫn cách rõ ràng, minh bạch Ngƣời cam đoan Vũ Thế Thảo i LỜI CẢM ƠN Hoàn thành Luận văn Thạc sĩ này, trước hết xin bày tỏ lòng biết ơn sâu sắc tới TS Trần Thị Hương, người hướng dẫn khoa học tận tình hướng dẫn giúp đỡ suốt thời gian thực Luận văn Nhân dịp xin bày tỏ lòng biết ơn đến thầy cô Phòng đào tạo Sau đại học trường Đại học Hàng Hải Việt Nam, Viện Nghiên cứu Hải sản giúp đỡ suốt thời gian học tập hoàn thành Luận văn Thạc sĩ Tôi xin gửi lời cảm ơn chân thành đến ông chủ nhiệm đề tài, dự án: ThS Lại Duy Phương tác giả báo khoa học… cho phép sử dụng nguồn tư liệu để viết Luận văn Trong trình thực hoàn thành Luận văn, nhận giúp đỡ động viên Lãnh đạo Phòng Tổ chức, Hành chính, Viện Nghiên cứu Hải sản, tạo điều kiện giúp đỡ trình thu thập tư liệu xử lý số liệu Cuối xin cảm ơn gia đình, bạn bè, đồng nghiệp nguồn động viên, khích lệ vô giá suốt năm tháng phấn đấu, rèn luyện để có sản phẩm khoa học Hải Phòng, ngày tháng năm 2016 Học viên Vũ Thế Thảo ii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii BẢNG CHÚ GIẢI CHỮ VIẾT TẮT vi DANH MỤC BẢNG vii DANH MỤC HÌNH viii MỞ ĐẦU CHƢƠNG I TỔNG QUAN LÝ THUYẾT VỀ SEMANTIC WEB 1.1 Semantic web – web 3.0 1.1.1 Công nghệ web qua thời kỳ 1.1.2 Hạn chế web hệ đầu đời semantic web 1.1.3 Khái niện lợi ích semantic web 1.1.4 Kiến trúc phân tầng semmantic web 1.2 Tổng quan tình hình nghiên cứu thuộc lĩnh vực đề tài nước quốc tế 1.2.1 Nghiên cứu ứng dụng semantic web nước 1.2.2 Nghiên cứu ứng dụng semantic web quốc tế 1.3 Các công cụ công nghệ liên quan đến semantic web 10 1.3.1 RDF, RDFS tảng Web ngữ nghĩa 11 1.3.2 ONTOLOGY 21 1.3.3 SPARQL ngôn ngữ truy vấn liệu Web ngữ nghĩa 23 CHƢƠNG II CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM VÀ GIẢI PHÁP XÂY DỰNG ỨNG DỤNG TRA CỨU BẰNG SEMANTIC WEB 29 2.1 Cá rạn san hô, nhu cầu trạng tra cứu 29 2.1.1 Giới thiệu chung 29 iii 2.1.2 Các thuật ngữ, mô tả đặc điểm hình thái cá 30 2.1.3 Thông tin chi tiết mô tả loài cá rạn san hô biển Việt Nam 31 2.1.4 Nhu cầu tra cứu thông tin cá rạn san hô biển Việt Nam 33 2.1.5 Hiện trạng hệ thống tra cứu cá rạn san hô biển Việt Nam 34 2.2 Giải pháp xây dựng ứng dụng tra cứu cá rạn semantic web 35 2.2.1 Yêu cầu với hệ thống 35 2.2.2 Mô hình tổng thể ứng dụng 35 2.3 Biểu đồ Ca sử dụng ứng dụng 36 2.4 Sơ đồ hoạt động Ca sử dụng 37 2.5 Ngôn ngữ công cụ xây dựng 40 2.5.1 Ngôn ngữ thiết kế Web 40 2.5.2 Thư viện mã nguồn mở 40 2.5.3 Phần mềm xây dựng ontology 42 CHƢƠNG III XÂY DỰNG HỆ THỐNG TRA CỨU CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM 44 3.1 Quy trình xây dựng ứng dụng 44 3.2 Tổng hợp nguồn liệu 44 3.3 Xây dựng Ontology 44 3.4 Cài đặt phát triển hệ thống 56 3.5 Chương trình thử nghiệm, kết đánh giá 56 3.5.1 Thiết lập kết nối chương trình 56 3.5.2 Giao diện trang chủ chương trình 57 3.5.3 Giao diện hiển thị kết tìm kiếm 57 3.5.4 Giao diện hiển thị chi tiết đối tượng 58 3.6 Đánh giá kết hệ thống 58 KẾT LUẬN VÀ ĐỀ XUẤT 59 iv Kết luận 59 Đề xuất 60 TÀI LIỆU THAM KHẢO 61 v BẢNG CHÚ GIẢI CHỮ VIẾT TẮT TT Chữ viết tắt Chú giải NCHS Nghiên cứu Hải sản CRSH Cá rạn san hô HTTP Hyper Text Transfer Protocol RDF Resource Description Framework RDFS Resource Description Framework Schema OIL Ontology Inference Layer OWL Web Ontology Language URL Uniform Resource Identifier WWW World Wide Web 10 XML eXtensible Markup Language 11 HTML 12 NN & PTNT Hyper Text Markup Langguage Nông nghiệp Phát triển Nông thôn vi DANH MỤC BẢNG Bảng 1.1 Mô hình RDF 11 Bảng 1.2 Cú pháp RDF 15 Bảng Mối quan hệ lớp mô tả thuộc tính 51 vii DANH MỤC HÌNH Hình 1.1 So sách Web 1.0, Web 2.0 Web 3.0 Hình 1.2 Kiến trúc phân tầng Semantic Web qua thời kỳ Hình 1.3 Trang thông tin semantic web VN-KIM Hình 1.4 Trang tìm kiếm Swoogle Semantic Web Search Engine Hình 1.5 Trang tìm kiếm Falcons Hình 1.6 Trang tìm kiếm Swse 10 Hình 1.7 Trang tìm kiếm Watson 10 Hình 1.8 Mối quan hệ thành phần ba 12 Hình 1.9 Đồ thị RDF đơn giản 12 Hình 1.10 Minh họa kiểu Plain Literal 13 Hình 1.11 Kiểu Typed Literal biểu diễn tuổi 14 Hình 1.12 Mô tả Bag Container đơn giản 17 Hình 1.13 Mô tả Alt Container đơn giản 17 Hình 1.14 Mô tả RDF Collection 18 Hình 1.15 Các lớp thuộc tính 20 Hình 1.16 Những ràng buộc RDFS 21 Hình 2.1 Các loại vảy thông thường hình dạng, độ nhô miệng 30 Hình 2.2 Các số đo hình thái thông thường 31 Hình 2.3 Các thuâ ̣t ngữ chỉ bô ̣ phâ ̣n thể cá 31 Hình 2.4 Hình dạng đại diện họ cá sơn đá Holocentridae 32 Hình 2.5 Cá sơn đá đôi 33 Hình 2.6 Bản đồ nơi khảo sát, phát phân bố cá rạn san hô biển VN 33 Hình 2.7 Kết tìm kiếm cá hòm Google 34 viii - Lớp phân bố: Là lớp đối tượng địa điểm mà cá rạn sinh sống Việt Nam hay giới Trong địa điểm phân bố thuộc địa điểm khác cấp cao Hình 3.5 Cấu trúc phân lớp phân bố - Lớp tài nguyên: mô tả giá trị tài nguyên kinh tế, phục vụ cho nghiên cứu khoa học, giá trị Y học, làm thực phẩm, nuôi làm cảnh, hay xuất khẩu… 48 Hình 3.6 Cấu trúc phân lớp tài nguyên Với thông số xác định trên, từ ta phân cấp lớp ontology phần mềm Protégé 4.1 thể sau: Hình 3.7 Cấu trúc lớp (Classes) ontology 49 Hình 3.8 Cấu trúc phân lớp (ontograf) ontology Bƣớc 5: Xác định thuộc tính lớp Việc xác định thuộc tính lớp ta dựa vào lớp liệt kê Với thuộc tính, ta phải xác định xem mô tả cho lớp Ví dụ Cá có thuộc tính sau: có tên loài, có mô tả, có họ cá, có cá, có phân bố, có tên tiếng anh, có tên tiếng việt, có tên lating… Một số thuộc tính liệu xác định có ontology thể phần mềm Protégé 4.1 sau: Hình 3.9 Các thuộc tính liệu Data Properies 50 Thuộc tính có tên: mô tả tên đối tượng Ten cua CaRan Thuộc tính có mô tả: mô tả thông tin cá rạn sinh thái, hình thái, dinh dưỡng; mô tả thông tin phân bố thê giới, Việt Nam… Bƣớc 6: Xác định ràng buộc thuộc tính Việc xác định ràng buộc thuộc tính quan trọng định khả suy diễn mô hình ontology Các thuộc tính quan trọng với ràng buộc xây dựng sau: Hình 3.10 Các thuộc tính quan hệ ontology ontology Bảng Mối quan hệ lớp mô tả thuộc tính Tên thuộc OWL type Domain tính 51 Range Diễn giải CoTen String Mô tả tên thành Datatype CaRan Property SanHo phần cá rạn, san TaiNguyen hô, tài nguyên, biển BienDao đảo, phân bố PhanBo CoMoTa String Mô tả thông tin Datatype CaRan Property SanHo cá rạn, san hô, tài TaiNguyen nguyên, BienDao phân bố biển đảo, PhanBo CoMoTaHT Datatype CaRan Float Mô tả thông tin hình thái cá Property chiều dài, chiều rộng, tia vây, đặc trưng… CoMoTaST Datatype CaRan String Mô tả thông tin sinh thái cá Property hệ sinh thái sinh sống, sống đơn hay theo đàn, độ sau bắt gặp… CoMoTaDD Datatype CaRan String Mô tả thông tin dinh dưỡng cá Property thức ăn CoLanguage Datatype CaRan String Thông tin ngôn ngữ tên gọi cá rạn Property tên tiếng Anh, tiếng Việt, tên Lating CoPhanBo Datatype CaRan String 52 Thông tin khu Property vực phân bố PhanBo giới Việt nam CoRegion Datatype BienDao Property PhanBo String Mô tả thông tin tỉnh/thành phố thuộc Việt Nam CoDiaDanh Datatype BienDao Property PhanBo String Mô tả địa danh biển, đảo, bán đảo, vịnh CoGiaTriKinh Datatype Te Property TaiNguyen String Các thông tin giá trị kinh tế y học, nghiên cứu khoa học, xuất hay làm thực phẩm… CoNCKH Datatype TaiNguyen String Các thông tin loài cá rạn có giá trị kinh Property tế nghiên cứu khoa học CoXuatKhau Datatype TaiNguyen String Các thông tin loài cá rạn có giá trị kinh Property tế xuất CoNuoiCanh Datatype TaiNguyen String Các thông tin loài cá rạn có giá trị làm Property vật nuôi cảnh CoYHoc Datatype TaiNguyen String cá rạn có giá trị y học Property CoLamThucPh Datatype am Các thông tin loài TaiNguyen String Các thông tin loài cá rạn có giá trị làm Property thực phẩm 53 Bƣớc 7: Tạo thực thể Việc xây dựng thực thể cá rạn san hô dựa vào atlass ”Một số loài CRSH thường gặp biển Việt Nam” ThS Lại Duy Phương chủ biển Trong luận văn tác giả xây dựng 30 lớp 62 thực thể Hình 3.11 thống kê số lượng lớp thực thể ontology metrics 54 Toàn liệu ontology xây dựng lưu thành tệp tin: CaransanhoOntology.owl; Thông tin ontology định dạng RDF/XLM OWL/XML lưu sử dụng khai báo sau: 55 Thông tin đầy đủ lưu trữ địa sau: http://www.semanticweb.org/ontologies/2016/2/Ontology145682004771.owl 3.4 Cài đặt phát triển hệ thống Để cài đặt chương trình, tác giả dùng số công cụ ngôn ngữ lập trình sau: - Về thiết kế giao diện web: HTML5, CSS3, Jquery - Bộ Visual Studio 2010 - Ngôn ngữ lập trình C# ASP.Net Ngôn ngữ truy vấn liệu RDF: SPARQL 3.5 Chƣơng trình thử nghiệm, kết đánh giá 3.5.1 Thiết lập kết nối chƣơng trình Khai báo sử dụng thƣ viện OwlDotNetApi - Thư viện mã nguồn mở OwlDotNetApi Khai báo sử dụng OwlDotNetApi ngôn ngữ C# Visual Studio ta thực câu lệnh sau: using OwlDotNetApi; - Đọc file Ontology ngôn ngữ lập trình C# ta thực câu lệnh sau: static readonly IOwlParser parser = new OwlXmlParser(); static readonly IOwlGraph graph = parser.ParserOwl(“D:\Cao Học\Luận văn cao học\ CaransanhoOntology.owl”) Khai báo truy vấn thông tin - Sau xây dựng xong Ontology để truy vấn lấy thông tin đối tượng URL ta thực câu lệnh sau: SELECT ?P ?object WHERE { ?p ?object’} 56 3.5.2 Giao diện trang chủ chƣơng trình Hình 3.12 Giao diện trang chủ hệ thống Đây giao diện tra cứu hệ thống, thông qua chương trình người dùng tra cứu thông tin liên quan 3.5.3 Giao diện hiển thị kết tìm kiếm Hình 3.13 Giao diện hiển thị kết tìm kiếm 57 3.5.4 Giao diện hiển thị chi tiết đối tƣợng Hình 3.14 Giao diện hiển thị kết tìm kiếm 3.6 Đánh giá kết hệ thống Để đánh giá kết chương trình, tác giả thực việc so sánh số trang web tra cứu Thực việc tra cứu thông tin với từ khóa “cá ngựa chấm” trang google.com, kết trả nhiều đường link có chứa từ khóa (khoảng 247.000 kết quả), nhiên lượng thông tin nằm rải rác chưa đáp ứng thông tin mà người dùng muốn tìm Đối với hệ thống web ngữ nghĩa cá rạn san hô đạt số kết mà hệ web trước khả tìm kiếm vượt trội, cung cấp thông tin xác, đầy đủ ngữ nghĩa 58 KẾT LUẬN VÀ ĐỀ XUẤT Kết luận 1.1 Kết đạt đƣợc Xây dựng thành công hệ thống semantic web tra cứu thông tin CRSH biển Việt Nam, đạt yêu cầu cho người sử dụng việc tra cứu cách nhanh chóng, kịp thời xác mặt ngữ nghĩa Qua đó, đánh giá kết đạt mục tiêu ban đầu đặt cho luận văn sau: Về lý thuyết: - Nêu ưu nhược điểm thệ web trước đời ích lợi mà semantic web đem lại - Nghiên cứu nắm kiến trúc phân tầng web ngữ nghĩa tìm hiểu trình bầy sâu RDF/RDFS dùng để mô tả tài nguyên dạng đồ thị, định nghĩa lớp thuộc tính; RDF/XML dùng tạo liệu siêu liên kết; Ngôn ngữ SPRQL cách tạo câu truy vấn hay truy vấn liệu RDF; tìm hiểu Ontology định nghĩa, thành phần công cụ để xây; - Nghiên cứu ứng dụng số phần mềm, thư viện mã nguồn mở công cụ liên quan để xây dựng semantic web Về thực nghiệm: - Xây dựng chương trình ứng dụng tra cứu mục tiêu luận văn đặt Trong chương trình phân hai đối tượng admin user Đối với admin người quản trị hệ thống quản lý chương trình, thêm sửa xóa đối tượng Đối với người dùng (user) tìm kiếm thông tin cá rạn cách nhanh chóng, xác mặt ngữ nghĩa - Hoàn thành ontology đầy đủ thông tin cá rạn san hô Bộ cá rạn, Họ cá rạn, mô tả thông tin sinh thái, dinh dưỡng, phân bố, giá trị kinh tế 59 1.2 Một số hạn chế - Về lý thuyết dừng lại mức tổng hợp nghiên cứu tập trung vào yếu tố, thành phần liên quan đến nội dung đề tài Ứng dụng dừng lại mức minh họa chưa phong phú nội dung tổ chức liệu nên chưa đạt kết mà công nghệ Semantic đem lại Đề xuất Tiếp tục nghiên cứu tổng hợp nhiều semantic web Hoàn thiện bổ sung thêm ontology cá rạn nói riêng sở liệu nghề cá nói chung Các liệu ứng dụng dừng lại mức demo minh hoạ để sớm xây dựng trang semantic web hoàn chỉnh, tra cứu nhanh xác ngữ nghĩa Đề nghị áp dụng kết nghiên cứu Luận văn thành đề tài, làm cở sở liệu để tra cứu quản lý nghề cá 60 TÀI LIỆU THAM KHẢO A Tài liệu tiếng Việt Lê Đức Anh, 2000 Hệ thống đảo ven bờ Việt Nam, tài nguyên phát triển Nhà xuất Khoa học Tự nhiên Công nghệ, Hà Nội, 200 trang Nguyễn Kiêm Sơn, Đặng Ngọc Thanh, 2005 Về thành phần loài cá biển Việt Nam Báo cáo Hội thảo quốc gia sinh thái tài nguyên sinh vật lần thứ nhất, Viện Sinh thái Tài nguyên sinh vật, trang: 210-219 Nguyễn Văn Quân, Nguyễn Đức Thế, 2011 Hiện trạng đa dạng thành phần loài cá rạn san hô đảo nghiên cứu Báo cáo chuyên đề thuộc dự án “Điều tra tổng thể trạng đa dạng sinh học hệ sinh thái rạn san hô vùng ven đảo vùng biển Việt Nam, phục vụ phát triển bền vững” PGS.TS Đỗ Văn Khương làm chủ nhiệm Viện Tài nguyên Môi trường biển Lại Duy Phương, 2014 Đề tài NCKH cấp Viện Nghiên cứu Hải sản: Nghiên cứu, xây dựng hoàn thiện Atlas phân loại cá rạn san hô thường gặp biển Việt Nam Nguyễn Khắc Hường, 1991, 1992, 1993 Cá biển Việt Nam Tập I, tập II Phạm Khánh Thiện (2011), Ứng dụng web semantic để xây dựng hệ thống tra cứu thông tin văn hóa Tây Nguyên, Luận văn thạc sĩ kỹ thuật, Đại học Đà Nẵng B Tài liệu tiếng nƣớc Grigoris Antoniou and Frank van Harmelen – A semantic web primer Christopher D Walton – Agency and the semantic web Ivan Herman, ” tutorial on semantic web”, W3C, 2012 10 http://www.w3.org/standart/semanticweb/ 11 http://www.semanticweb.org 12 Berners-Lee, T The Semantic Web Layer Cake, (2007), Layer Cake 13 Gruber, T R., A Translation Approach 61 to Portable Ontology Specifications Knowledge Acquisition, 5(2):199-220, 1993 14 McGuinness, D L and van Harmelen, F OWL Web Ontology Language W3C Recommendation 10 February 2004 15 Ora Lassila, Ralph R Swick (1999), Resource Description Framework (RDF) Model and Syntax Specification, REC-Rdf-Syntax 16 Frank Manola, Eric Miller, Brian McBride (2004), RDF Primer, RdfPrimer 17 Grigoris Antoniou (2004), A Semantic Web Primer, Frank van Harmelen 28 Mike Dean, Guus Schreiber, Sean Bechhofer, Frank van Harmelen, Jim Hendler, Ian Horrocks, Deborah L McGuinness, Peter F Patel Schneider, Lynn Andrea Stein (2004), OWL Web Ontology Language Reference, REC-Owl-Ref 19 Swartout B, Patil R, Knight K, Russ T (1996), Toward distributed use of large-scale ontologies, Sparql-Query 20 A Maedche, B Motik, and L Stojanovic (2003), Managing multiple and distributed ontologies in the Semantic Web 21 Thomas R Gruber (1993), A Translation Approach to Portable Ontology Specifications, Knowledge Acquisition 22 N F Noy and D L McGuinness (2001), Ontology development 101: A guide o crea ing your firs on o ogy, Sparql-query 62 ... trạng hệ thống tra cứu cá rạn san hô biển Việt Nam 34 2.2 Giải pháp xây dựng ứng dụng tra cứu cá rạn semantic web 35 2.2.1 Yêu cầu với hệ thống 35 2.2.2 Mô hình tổng thể ứng dụng. .. dựng hệ thống tra cứu cá rạn san hô biển Việt Nam thực cần thiết Mục đích đề đề: Mục tiêu chung là: Ứng dụng Semantic web để xây dựng hệ thống tra cứu cá rạn san hô biển Việt Nam Mục tiêu... ngữ truy vấn liệu Web ngữ nghĩa 23 CHƢƠNG II CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM VÀ GIẢI PHÁP XÂY DỰNG ỨNG DỤNG TRA CỨU BẰNG SEMANTIC WEB 29 2.1 Cá rạn san hô, nhu cầu trạng tra cứu 29 2.1.1

Ngày đăng: 14/10/2017, 16:29

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w