1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng semantic web để xây dựng hệ thống tra cứu cá rạn san hô ở biển việt nam

73 328 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 73
Dung lượng 9,63 MB

Nội dung

BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM VŨ THẾ THẢO ỨNG DỤNG SEMANTIC WEB XÂY DỰNG HỆ THỐNG TRA CỨU CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM LUẬN VĂN THẠC SĨ NGÀNH KỸ THUẬT HẢI PHÒNG, 2016 BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM VŨ THẾ THẢO ỨNG DỤNG SEMANTIC WEB XÂY DỰNG HỆ THỐNG TRA CỨU CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM LUẬN VĂN THẠC SĨ NGÀNH KỸ THUẬT NGÀNH: CÔNG NGHỆ THÔNG TIN MÃ SỐ: CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN Người hướng dẫn khoa học: TS Trần Thị Hương HẢI PHÒNG, 2016 LỜI CAM ĐOAN Tôi: Vũ Thế Thảo, học viên cao học lớp CNTT 2014_1, chuyên ngành Công nghệ Thông tin, khoá học 2014-2016, Trường Đại học Hàng Hải Việt Nam xin cam đoan: Các nội dung Luận văn Thạc sĩ tự thân làm sở tài liệu, số liệu khảo sát thực tế thân tơi thu thập C ác số liệu tham khảo khác sử dụng nghiên cứu thuộc quyền tác giả trích dẫn cách rõ ràng, minh bạch Người cam đoan Vũ Thế Thảo i LỜI CẢM ƠN Hồn thành Luận văn Thạc sĩ này, trước hết tơi xin bày tỏ lòng biết ơn sâu sắc tới TS Trần Thị Hương, người hướng dẫn khoa học tận tình hướng dẫn giúp đỡ tơi suốt thời gian thực Luận văn Nhân dịp xin bày tỏ lòng biết ơn đến thầy Phòng đào tạo Sau đại học trường Đại học Hàng Hải Việt Nam, Viện Nghiên cứu Hải sản giúp đỡ tơi suốt thời gian học tập hồn thành Luận văn Thạc sĩ Tôi xin gửi lời cảm ơn chân thành đến ông chủ nhiệm đề tài, dự án: ThS Lại Duy Phương tác giả báo khoa học… cho phép sử dụng nguồn tư liệu để viết Luận văn Trong q trình thực hồn thành Luận văn, nhận giúp đỡ động viên Lãnh đạo Phòng Tổ chức, Hành chính, Viện Nghiên cứu Hải sản, tạo điều kiện giúp đỡ tơi q trình thu thập tư liệu xử lý số liệu Cuối xin cảm ơn gia đình, bạn bè, đồng nghiệp nguồn động viên, khích lệ vơ giá tơi suốt năm tháng phấn đấu, rèn luyện để có sản phẩm khoa học Hải Phòng, ngày tháng năm 2016 Học viên Vũ Thế Thảo ii MỤC LỤC LỜI CAM ĐOAN .i LỜI CẢM ƠN ii MỤC LỤC .iii BẢNG CHÚ GIẢI CHỮ VIẾT TẮT vi DANH MỤC BẢNG vii DANH MỤC HÌNH viii MỞ ĐẦU CHƯƠNG I TỔNG QUAN LÝ THUYẾT VỀ SEMANTIC WEB 1.1 Semantic web – web 3.0 1.1.1 Công nghệ web qua thời kỳ 1.1.2 Hạn chế web hệ đầu đời semantic web .4 1.1.3 Khái niện lợi ích semantic web 1.1.4 Kiến trúc phân tầng semmantic web 1.2 Tổng quan tình hình nghiên cứu thuộc lĩnh vực đề tài nước quốc tế .8 1.2.1 Nghiên cứu ứng dụng semantic web nước 1.2.2 Nghiên cứu ứng dụng semantic web quốc tế 1.3 Các công cụ công nghệ liên quan đến semantic web .10 1.3.1 RDF, RDFS tảng Web ngữ nghĩa .11 1.3.2 ONTOLOGY 21 1.3.3 SPARQL ngôn ngữ truy vấn liệu Web ngữ nghĩa .23 CHƯƠNG II CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM VÀ GIẢI PHÁP XÂY DỰNG ỨNG DỤNG TRA CỨU BẰNG SEMANTIC WEB 29 2.1 Cá rạn san hô, nhu cầu trạng tra cứu 29 2.1.1 Giới thiệu chung 29 iii 2.1.2 Các thuật ngữ, mơ tả đặc điểm hình thái cá 30 2.1.3 Thông tin chi tiết mơ tả lồi cá rạn san hô biển Việt Nam .31 2.1.4 Nhu cầu tra cứu thông tin cá rạn san hô biển Việt Nam .33 2.1.5 Hiện trạng hệ thống tra cứu cá rạn san hô biển Việt Nam 34 2.2 Giải pháp xây dựng ứng dụng tra cứu cá rạn semantic web .35 2.2.1 Yêu cầu với hệ thống .35 2.2.2 Mơ hình tổng thể ứng dụng .35 2.3 Biểu đồ Ca sử dụng ứng dụng 36 2.4 Sơ đồ hoạt động Ca sử dụng 37 2.5 Ngôn ngữ công cụ xây dựng 40 2.5.1 Ngôn ngữ thiết kế Web 40 2.5.2 Thư viện mã nguồn mở 40 2.5.3 Phần mềm xây dựng ontology 42 CHƯƠNG III XÂY DỰNG HỆ THỐNG TRA CỨU CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM 44 3.1 Quy trình xây dựng ứng dụng 44 3.2 Tổng hợp nguồn liệu 44 3.3 Xây dựng Ontology 44 3.4 Cài đặt phát triển hệ thống 56 3.5 Chương trình thử nghiệm, kết đánh giá .56 3.5.1 Thiết lập kết nối chương trình 56 3.5.2 Giao diện trang chủ chương trình .57 3.5.3 Giao diện hiển thị kết tìm kiếm 57 3.5.4 Giao diện hiển thị chi tiết đối tượng 58 3.6 Đánh giá kết hệ thống 58 KẾT LUẬN VÀ ĐỀ XUẤT 59 iv Kết luận 59 Đề xuất .60 TÀI LIỆU THAM KHẢO 61 BẢNG CHÚ GIẢI CHỮ VIẾT TẮT TT Chữ viết tắt NCHS CRSH HTTP Chú giải Nghiên cứu Hải sản Cá rạn san hô Hyper Text Transfer Protocol v 10 11 12 RDF RDFS OIL OWL URL WWW XML HTML NN & PTNT Resource Description Framework Resource Description Framework Schema Ontology Inference Layer Web Ontology Language Uniform Resource Identifier World Wide Web eXtensible Markup Language Hyper Text Markup Langguage Nông nghiệp Phát triển Nông thôn DANH MỤC BẢNG Bảng 1.1 Mơ hình RDF 11 Bảng 1.2 Cú pháp RDF 15 Bảng Mối quan hệ lớp mơ tả thuộc tính 51 vi DANH MỤC HÌNH Hình 1.1 So sách Web 1.0, Web 2.0 Web 3.0 Hình 1.2 Kiến trúc phân tầng Semantic Web qua thời kỳ Hình 1.3 Trang thông tin semantic web VN-KIM .8 Hình 1.4 Trang tìm kiếm Swoogle Semantic Web Search Engine Hình 1.5 Trang tìm kiếm Falcons Hình 1.6 Trang tìm kiếm Swse 10 Hình 1.7 Trang tìm kiếm Watson 10 vii Hình 1.8 Mối quan hệ thành phần ba 12 Hình 1.9 Đồ thị RDF đơn giản 12 Hình 1.10 Minh họa kiểu Plain Literal .13 Hình 1.11 Kiểu Typed Literal biểu diễn tuổi .14 Hình 1.12 Mơ tả Bag Container đơn giản 17 Hình 1.13 Mơ tả Alt Container đơn giản 17 Hình 1.14 Mô tả RDF Collection .18 Hình 1.15 Các lớp thuộc tính 20 Hình 1.16 Những ràng buộc RDFS 21 Hình 2.1 Các loại vảy thơng thường hình dạng, độ nhơ miệng 30 Hình 2.2 Các số đo hình thái thơng thường 31 Hình 2.3 Các thuật ngữ chỉ phận thể cá 31 Hình 2.4 Hình dạng đại diện họ cá sơn đá Holocentridae .32 Hình 2.5 Cá sơn đá đơi 33 Hình 2.6 Bản đồ nơi khảo sát, phát phân bố cá rạn san hơ biển VN 33 Hình 2.7 Kết tìm kiếm cá hòm Google .34 Hình 2.8 Mơ hình tổng thể ứng dụng 35 Hình 2.9 Biểu đồ Ca sử dụng admin 36 Hình 2.10 Biểu đồ Ca sử dụng user 37 Hình 2.11 Sơ đồ hoạt động mơ tả chức tìm kiếm thơng tin 37 Hình 2.12 Sơ đồ hoạt động mơ tả chức thêm đối tượng 38 Hình 2.13 Sơ đồ hoạt động mô tả chức sửa đối tượng 39 Hình 2.14 Sơ đồ hoạt động mơ tả chức xóa đối tượng 39 Hình 2.15 Giao diện Protégé 4.1 43 viii - Lớp phân bố: Là lớp đối tượng địa điểm mà cá rạn sinh sống Việt Nam hay giới Trong địa điểm phân bố thuộc địa điểm khác cấp cao Hình 3.5 Cấu trúc phân lớp phân bố - Lớp tài nguyên: mô tả giá trị tài nguyên kinh tế, phục vụ cho nghiên cứu khoa học, giá trị Y học, làm thực phẩm, nuôi làm cảnh, hay xuất khẩu… Hình 3.6 Cấu trúc phân lớp tài nguyên 48 Với thông số xác định trên, từ ta phân cấp lớp ontology phần mềm Protégé 4.1 thể sau: Hình 3.7 Cấu trúc lớp (Classes) ontology 49 Hình 3.8 Cấu trúc phân lớp (ontograf) ontology Bước 5: Xác định thuộc tính lớp Việc xác định thuộc tính lớp ta dựa vào lớp liệt kê Với thuộc tính, ta phải xác định xem mơ tả cho lớp Ví dụ Cá có thuộc tính sau: có tên lồi, có mơ tả, có họ cá, có cá, có phân bố, có tên tiếng anh, có tên tiếng việt, có tên lating… Một số thuộc tính liệu xác định có ontology thể phần mềm Protégé 4.1 sau: Hình 3.9 Các thuộc tính liệu Data Properies 50 Thuộc tính có tên: mơ tả tên đối tượng Ten cua CaRan Thuộc tính có mơ tả: mô tả thông tin cá rạn sinh thái, hình thái, dinh dưỡng; mơ tả thơng tin phân bố thê giới, Việt Nam… Bước 6: Xác định ràng buộc thuộc tính Việc xác định ràng buộc thuộc tính quan trọng định khả suy diễn mơ hình ontology Các thuộc tính quan trọng với ràng buộc xây dựng sau: Hình 3.10 Các thuộc tính quan hệ ontology ontology Bảng Mối quan hệ lớp mô tả thuộc tính Tên tính CoTen thuộc OWL type Datatype Domain Range Diễn giải CaRan String Mô tả tên thành 51 Property CoMoTa CoMoTaHT SanHo phần cá rạn, san TaiNguyen hô, tài nguyên, biển BienDao đảo, phân bố Datatype PhanBo CaRan Property SanHo cá rạn, san hô, tài TaiNguyen nguyên, BienDao phân bố Datatype String PhanBo CaRan Float Property Mô tả thông tin biển đảo, Mô tả thơng tin hình thái cá chiều dài, chiều rộng, tia vây, đặc CoMoTaST Datatype CaRan String Property trưng… Mô tả thông tin sinh thái cá hệ sinh thái sinh sống, sống đơn hay theo đàn, độ sau bắt CoMoTaDD CoLanguage Datatype CaRan String gặp… Mô tả thông tin Property dinh dưỡng cá Datatype thức ăn Thông tin ngôn CaRan String Property ngữ tên gọi cá rạn tên tiếng Anh, CoPhanBo CoRegion String tiếng Việt, tên Lating Thông tin khu Datatype CaRan Property PhanBo vực phân bố Datatype BienDao giới Việt nam Mô tả thông tin Property PhanBo String 52 tỉnh/thành phố CoDiaDanh Datatype BienDao Property PhanBo biển, đảo, bán TaiNguyen đảo, vịnh Các thông tin giá CoGiaTriKinh Datatype Te Property String thuộc Việt Nam Mô tả địa danh String trị kinh tế y học, nghiên cứu khoa học, xuất hay CoNCKH Datatype TaiNguyen String Property làm thực phẩm… Các thông tin lồi cá rạn có giá trị kinh tế nghiên cứu CoXuatKhau CoNuoiCanh CoYHoc Datatype String Property cá rạn có giá trị kinh Datatype tế xuất Các thông tin lồi TaiNguyen String Property cá rạn có giá trị làm Datatype String vật nuôi cảnh Các thông tin lồi String cá rạn có giá trị y học Các thơng tin lồi Property CoLamThucPh Datatype am TaiNguyen khoa học Các thơng tin lồi TaiNguyen TaiNguyen Property cá rạn có giá trị làm thực phẩm Bước 7: Tạo thực thể Việc xây dựng thực thể cá rạn san hơ dựa vào atlass ”Một số lồi CRSH thường gặp biển Việt Nam” ThS Lại Duy Phương chủ biển Trong luận văn tác giả xây dựng 30 lớp 62 thực thể 53 Hình 3.11 thống kê số lượng lớp thực thể ontology metrics Toàn liệu ontology xây dựng lưu thành tệp tin: CaransanhoOntology.owl; Thông tin ontology định dạng RDF/XLM OWL/XML lưu sử dụng khai báo sau: Thông tin đầy đủ lưu trữ địa sau: 55 http://www.semanticweb.org/ontologies/2016/2/Ontology145682004771.owl 3.4 Cài đặt phát triển hệ thống Để cài đặt chương trình, tác giả dùng số công cụ ngôn ngữ lập trình sau: - Về thiết kế giao diện web: HTML5, CSS3, Jquery - Bộ Visual Studio 2010 - Ngôn ngữ lập trình C# ASP.Net Ngơn ngữ truy vấn liệu RDF: SPARQL 3.5 Chương trình thử nghiệm, kết đánh giá 3.5.1 Thiết lập kết nối chương trình Khai báo sử dụng thư viện OwlDotNetApi - Thư viện mã nguồn mở OwlDotNetApi Khai báo sử dụng OwlDotNetApi ngôn ngữ C# Visual Studio ta thực câu lệnh sau: using OwlDotNetApi; - Đọc file Ontology ngơn ngữ lập trình C# ta thực câu lệnh sau: static readonly IOwlParser parser = new OwlXmlParser(); static readonly IOwlGraph graph = parser.ParserOwl(“D:\Cao Học\Luận văn cao học\ CaransanhoOntology.owl”) Khai báo truy vấn thông tin - Sau xây dựng xong Ontology để truy vấn lấy thơng tin đối tượng URL ta thực câu lệnh sau: SELECT ?P ?object WHERE { ?p ?object’} 3.5.2 Giao diện trang chủ chương trình 56 Hình 3.12 Giao diện trang chủ hệ thống Đây giao diện tra cứu hệ thống, thơng qua chương trình người dùng tra cứu thông tin liên quan 3.5.3 Giao diện hiển thị kết tìm kiếm Hình 3.13 Giao diện hiển thị kết tìm kiếm 3.5.4 Giao diện hiển thị chi tiết đối tượng 57 Hình 3.14 Giao diện hiển thị kết tìm kiếm 3.6 Đánh giá kết hệ thống Để đánh giá kết chương trình, tác giả thực việc so sánh số trang web tra cứu Thực việc tra cứu thông tin với từ khóa “cá ngựa chấm” trang google.com, kết trả nhiều đường link có chứa từ khóa (khoảng 247.000 kết quả), nhiên lượng thơng tin nằm rải rác chưa đáp ứng thông tin mà người dùng muốn tìm Đối với hệ thống web ngữ nghĩa cá rạn san hô đạt số kết mà hệ web trước khả tìm kiếm vượt trội, cung cấp thơng tin xác, đầy đủ ngữ nghĩa 58 KẾT LUẬN VÀ ĐỀ XUẤT Kết luận 1.1 Kết đạt Xây dựng thành công hệ thống semantic web tra cứu thông tin CRSH biển Việt Nam, đạt yêu cầu cho người sử dụng việc tra cứu cách nhanh chóng, kịp thời xác mặt ngữ nghĩa Qua đó, đánh giá kết đạt mục tiêu ban đầu đặt cho luận văn sau: Về lý thuyết: - Nêu ưu nhược điểm thệ web trước đời ích lợi mà semantic web đem lại - Nghiên cứu nắm kiến trúc phân tầng web ngữ nghĩa tìm hiểu trình bầy sâu RDF/RDFS dùng để mô tả tài nguyên dạng đồ thị, định nghĩa lớp thuộc tính; RDF/XML dùng tạo liệu siêu liên kết; Ngôn ngữ SPRQL cách tạo câu truy vấn hay truy vấn liệu RDF; tìm hiểu Ontology định nghĩa, thành phần công cụ để xây; - Nghiên cứu ứng dụng số phần mềm, thư viện mã nguồn mở công cụ liên quan để xây dựng semantic web Về thực nghiệm: - Xây dựng chương trình ứng dụng tra cứu mục tiêu luận văn đặt Trong chương trình phân hai đối tượng admin user Đối với admin người quản trị hệ thống quản lý chương trình, thêm sửa xóa đối tượng Đối với người dùng (user) tìm kiếm thơng tin cá rạn cách nhanh chóng, xác mặt ngữ nghĩa - Hồn thành ontology đầy đủ thông tin cá rạn san hô Bộ cá rạn, Họ cá rạn, mô tả thông tin sinh thái, dinh dưỡng, phân bố, giá trị kinh tế 59 1.2 Một số hạn chế - Về lý thuyết dừng lại mức tổng hợp nghiên cứu tập trung vào yếu tố, thành phần liên quan đến nội dung đề tài Ứng dụng dừng lại mức minh họa chưa phong phú nội dung tổ chức liệu nên chưa đạt kết mà công nghệ Semantic đem lại Đề xuất Tiếp tục nghiên cứu tổng hợp nhiều semantic web Hoàn thiện bổ sung thêm ontology cá rạn nói riêng sở liệu nghề cá nói chung Các liệu ứng dụng dừng lại mức demo minh hoạ để sớm xây dựng trang semantic web hoàn chỉnh, tra cứu nhanh xác ngữ nghĩa Đề nghị áp dụng kết nghiên cứu Luận văn thành đề tài, làm cở sở liệu để tra cứu quản lý nghề cá 60 TÀI LIỆU THAM KHẢO A Tài liệu tiếng Việt Lê Đức Anh, 2000 Hệ thống đảo ven bờ Việt Nam, tài nguyên phát triển Nhà xuất Khoa học Tự nhiên Công nghệ, Hà Nội, 200 trang Nguyễn Kiêm Sơn, Đặng Ngọc Thanh, 2005 Về thành phần loài cá biển Việt Nam Báo cáo Hội thảo quốc gia sinh thái tài nguyên sinh vật lần thứ nhất, Viện Sinh thái Tài nguyên sinh vật, trang: 210-219 Nguyễn Văn Quân, Nguyễn Đức Thế, 2011 Hiện trạng đa dạng thành phần loài cá rạn san hô đảo nghiên cứu Báo cáo chuyên đề thuộc dự án “Điều tra tổng thể trạng đa dạng sinh học hệ sinh thái rạn san hô vùng ven đảo vùng biển Việt Nam, phục vụ phát triển bền vững” PGS.TS Đỗ Văn Khương làm chủ nhiệm Viện Tài nguyên Môi trường biển Lại Duy Phương, 2014 Đề tài NCKH cấp Viện Nghiên cứu Hải sản: Nghiên cứu, xây dựng hoàn thiện Atlas phân loại cá rạn san hô thường gặp biển Việt Nam Nguyễn Khắc Hường, 1991, 1992, 1993 Cá biển Việt Nam Tập I, tập II Phạm Khánh Thiện (2011), Ứng dụng web semantic để xây dựng hệ thống tra cứu thông tin văn hóa Tây Nguyên, Luận văn thạc sĩ kỹ thuật, Đại học Đà Nẵng B Tài liệu tiếng nước 10 11 Grigoris Antoniou and Frank van Harmelen – A semantic web primer Christopher D Walton – Agency and the semantic web Ivan Herman, ” tutorial on semantic web”, W3C, 2012 http://www.w3.org/standart/semanticweb/ http://www.semanticweb.org 12 Berners-Lee, T The Semantic Web Layer Cake, (2007), Layer Cake 13 Gruber, T R., A Translation Approach to Portable Ontology Specifications Knowledge Acquisition, 5(2):199-220, 1993 14 McGuinness, D L and van Harmelen, F OWL Web Ontology Language W3C Recommendation 10 February 2004 15 Ora Lassila, Ralph R Swick (1999), Resource Description Framework (RDF) Model and Syntax Specification, REC-Rdf-Syntax 61 16 Frank Manola, Eric Miller, Brian McBride (2004), RDF Primer, RdfPrimer 17 Grigoris Antoniou (2004), A Semantic Web Primer, Frank van Harmelen 28 Mike Dean, Guus Schreiber, Sean Bechhofer, Frank van Harmelen, Jim Hendler, Ian Horrocks, Deborah L McGuinness, Peter F Patel Schneider, Lynn Andrea Stein (2004), OWL Web Ontology Language Reference, REC-Owl-Ref 19 Swartout B, Patil R, Knight K, Russ T (1996), Toward distributed use of large-scale ontologies, Sparql-Query 20 A Maedche, B Motik, and L Stojanovic (2003), Managing multiple and distributed ontologies in the Semantic Web 21 Thomas R Gruber (1993), A Translation Approach to Portable Ontology Specifications, Knowledge Acquisition 22 N F Noy and D L McGuinness (2001), Ontology development 101: A guide o crea ing your firs on o ogy, Sparql-query 62 ... dựng hệ thống tra cứu cá rạn san hô biển Việt Nam thực cần thiết Mục đích đề đề: Mục tiêu chung là: Ứng dụng Semantic web để xây dựng hệ thống tra cứu cá rạn san hô biển Việt Nam Mục tiêu... Hiện trạng hệ thống tra cứu cá rạn san hô biển Việt Nam 34 2.2 Giải pháp xây dựng ứng dụng tra cứu cá rạn semantic web .35 2.2.1 Yêu cầu với hệ thống .35 2.2.2 Mơ hình tổng thể ứng dụng. .. ngữ truy vấn liệu Web ngữ nghĩa .23 CHƯƠNG II CÁ RẠN SAN HÔ Ở BIỂN VIỆT NAM VÀ GIẢI PHÁP XÂY DỰNG ỨNG DỤNG TRA CỨU BẰNG SEMANTIC WEB 29 2.1 Cá rạn san hô, nhu cầu trạng tra cứu 29 2.1.1

Ngày đăng: 08/03/2018, 10:40

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w