Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 85 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
85
Dung lượng
2,65 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG TRẦN XUÂN TRƢỜNG XÂY DỰNG ONTOLOGY PHỤC VỤ TÌM KIẾM NGỮ NGHĨA ĐỘNG VẬT RỪNG TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng – Năm 2016 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG TRẦN XUÂN TRƢỜNG XÂY DỰNG ONTOLOGY PHỤC VỤ TÌM KIẾM NGỮ NGHĨA ĐỘNG VẬT RỪNG TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG Chuyên ngành: Hệ thống Thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Người hướng dẫn khoa học: TS NGUYỄN TRẦN QUỐC VINH Đà Nẵng – Năm 2016 LỜI CAM ĐOAN Tôi xin cam đoan: Những nội dung luận văn thực hướng dẫn trực tiếp thầy TS Nguyễn Trần Quốc Vinh Mọi tham khảo dùng luận văn trích dẫn rõ ràng trung thực tên tác giả, tên cơng trình, thời gian, địa điểm cơng bố Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Người cam đoan Trần Xuân Trƣờng MỤC LỤC MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nghiên cứu 3 Đối tƣợng phạm vi nghiên cứu Phƣơng pháp nghiên cứu Ý nghĩa khoa học thực tiễn Bố cục đề tài Tổng quan tài liệu nghiên cứu CHƢƠNG NGHIÊN CỨU TỔNG QUAN 1.1 TỔNG QUAN VỀ WEB NGỮ NGHĨA 1.1.1 Giới thiệu 1.1.2 Khái niệm 1.1.3 Nội dung xây dựng hệ thống web ngữ nghĩa 1.1.4 Kiến trúc phân tầng web ngữ nghĩa 11 1.2 RDF – NỀN TẢNG CỦA WEB NGỮ NGHĨA 17 1.2.1 Khái niệm 17 1.2.2 Mơ hình RDF 18 1.2.3 Đồ thị RDF 19 1.2.4 Namespace 19 1.2.5 Literal 19 1.2.6 Kiểu liệu có cấu trúc 20 1.2.7 RDFS (RDF Schema) 27 1.3 ONTOLOGY VÀ NGÔN NGỮ OWL 27 1.3.1 Định nghĩa ontology 27 1.3.2 Các lĩnh vực ứng dụng ontology 28 1.3.3 Vai trò ontology web ngữ nghĩa 28 1.3.4 Các thành phần ontology 29 1.3.5 Ngôn ngữ OWL 30 1.3.6 Hệ truy vấn SPARQL 32 1.4 ĐỘNG VẬT RỪNG TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG 34 1.4.1 Giới thiệu 34 1.4.2 Cấu trúc, thành phần loài động vật 34 1.4.3 Cấu trúc, thành phần loài trùng 36 1.5 MỘT SỐ NGHIÊN CỨU WEB NGỮ NGHĨA ĐÃ TRIỂN KHAI 38 1.6 KẾT CHƢƠNG 39 CHƢƠNG PHƢƠNG PHÁP VÀ PHẦN MỀM XÂY DỰNG ONTOLOGY 40 2.1 GIỚI THIỆU 40 2.2 PHƢƠNG PHÁP XÂY DỰNG ONTOLOGY 40 2.3 QUY TRÌNH XÂY DỰNG ONTOLOGY CHO DỮ LIỆU ĐỘNG VẬT RỪNG 44 2.4 MỘT SỐ PHẦN MỀM BIÊN TẬP ONTOLOGY 48 2.4.1 Phần mềm Sesame 48 2.4.2 Phần mềm Jena 50 2.4.3 Phần mềm Protégé 50 2.5 KẾT CHƢƠNG 53 CHƢƠNG XÂY DỰNG ONTOLOGY VÀ PHÁT TRIỂN ỨNG DỤNG 54 3.1 MƠ TẢ BÀI TỐN 54 3.2 ĐẶC TẢ DỮ LIỆU 54 3.3 QUY TRÌNH XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM 57 3.4 XÂY DỰNG ONOTLOGY VÀ PHẦN MỀM 58 3.4.1 Ontology động vật rừng 58 3.4.2 Phần mềm hỗ trợ khai thác tìm kiếm 65 3.5 KẾT CHƢƠNG 71 KẾT LUẬN VÀ KIẾN NGHỊ 72 TÀI LIỆU THAM KHẢO QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN (bản sao) DANH MỤC CÁC TỪ VIẾT TẮT CSDL Cơ sở liệu DAML DARPA Agent Markup Language DARPA Defense Advanced Research Projects Agency DTD Document Type Definition FOAF Friend Of A Friend HTML HyperText Markup Language HTTP Hypertext Transfer Protocol IE Information Extraction IR Information Retrieval IRI Internationalized Resource Identifier JSP JavaServer Pages NLP Natural Language Processing OIL Ontology Inference Layer QA Question Answering RDF Resource Description Framework RDFS Resource Description Framework Schema SGML Standard Generalized Markup Language SOAP Simple Object Access Protocol SQL Structured Query Language URI Uniform Resource Identifier URL Oxygen Uniform Resource Locator W3C World Wide Web Consortium WWW World Wide Web XML Extensible Markup Language XMLS Extensible Markup Language Schema DANH MỤC CÁC BẢNG Số hiệu Tên bảng bảng Trang 1.1 Phân bố thành phần loài động vật 35 1.2 Phân bố lớp động vật: thú, chim, bò sát 35 1.3 Cấu trúc thành phần lồi trùng phổ biến Sơn Trà 37 2.1 Một số thuật ngữ động vật 45 2.2 Thuật ngữ tập tính, sinh sản, thức ăn,… 46 DANH MỤC CÁC HÌNH Số hiệu Tên hình hình 1.1 Liên kết ngữ nghĩa nguồn khác Semantic Web Trang 1.2 Kiến trúc Web ngữ nghĩa 11 1.3 Đồ thị RDF 19 1.4 Mô tả việc chia nhỏ giá trị thuộc tính 21 1.5 Sử dụng nút rỗng 22 2.1 Lớp phân cấp lớp động vật 47 2.2 Thể hiện/ thực thể động vật 48 2.3 Giao diện protégé 5.0 52 3.1 Tình trạng phân bố khu hệ động vật Sơn Trà 55 3.2 Sách Đỏ phần Động vật 56 3.3 Website vncreatures.net 57 3.4 Giao diện phần mềm hỗ trợ khai thác tìm kiếm ontology 58 3.5 Giao diện ontology động vật 59 3.6 Cây phân cấp lớp động vật 60 3.7 Cây phân cấp lớp Bộ phận thể, Môi trƣờng sống 61 3.8 Cây phân cấp lớp Phân bố, Thức ăn 61 3.9 Thông tin mô tả cho lớp 62 3.10 Thuộc tính chung lớp Ví dụ lớp Khỉ 62 Số hiệu Tên hình hình Trang 3.11 Mơ tả cho quan hệ lớp 62 3.12 Các thuộc tính ontology động vật 63 3.13 Thông tin mô tả loài khỉ vàng 64 3.14 Xây dựng ontology cho loài Khỉ vàng 64 3.15 Biểu diễn từ đồng nghĩa ontology 65 3.16 Trang chủ phần mềm 67 3.17 Chức thêm xóa thuộc tính cho thể 67 3.18 Chức thêm loài động vật 67 3.19 Chức thêm lớp (Class) 68 3.20 Chức lƣu nội dung chỉnh sửa 68 3.21 Ô nhập từ tìm kiếm 68 3.22 Gợi ý tìm kiếm 69 3.23 Kết tìm kiếm lồi Khỉ vàng 69 3.24 Kết tìm kiếm lồi Chà vá chân nâu 70 3.25 Tìm kiếm kết phân cấp 70 61 Hình 3.7 Cây phân cấp lớp Bộ phận thể, Mơi trường sống Hình 3.8 Cây phân cấp lớp Phân bố, Thức ăn 62 Hình 3.9 Thơng tin mơ tả cho lớp Hình 3.10 Thuộc tính chung lớp Ví dụ lớp Khỉ Hình 3.11 Mơ tả cho quan hệ lớp - Thuộc tính (Property): dựa vào thơng tin mơ tả đặc tính, tính chất, hành vi, tập quán sinh hoạt, hoạt động, săn mồi, sinh lý,… lồi động vật, tơi đƣa thuộc tính đối tƣợng thuộc tính liệu, từ gán giá trị tạo mối quan hệ lớp động vật lớp khác 63 Hình 3.12 Các thuộc tính ontology động vật - Các thể (Individuals): dựa theo nghiên cứu trƣớc (nhƣ trích dẫn báo cáo) để chọn lựa động vật rừng đặc trƣng, quý thành phố Đà Nẵng để xây dựng ontology Chọn lớp (lớp con) phân cấp lớp động vật mà loài động vật đƣợc xếp vào để tạo thể cho lớp đó, dựa vào thơng tin mơ tả nguồn liệu loài động vật để gán thuộc tính phù hợp 64 Hình 3.13 Thơng tin mơ tả lồi khỉ vàng Hình 3.14 Xây dựng ontology cho loài Khỉ vàng 65 - Bên cạnh đó, cần thể đƣợc từ đồng nghĩa xây dựng ontology động vật Ví dụ, thuộc tính trọng lƣợng hiểu cân nặng, nên xác định thuộc tính trọng lƣợng cần gán từ cân nặng vào thuộc tính Hoặc lớp ―Động vật có dây sống‖ đƣợc hiểu ―động vật có xƣơng sống‖,… Phần mềm Protégé thể từ đồng nghĩa ký hiệu ― ‖: Hình 3.15 Biểu diễn từ đồng nghĩa ontology Ontology động vật đƣợc xây dựng tập trung vào lớp động vật có xƣơng sống, số lớp (bao gồm lớp - Class) xây dựng 295, số thuộc tính đối tƣợng (Object Property) 52, số liệu thuộc tính liệu 73, số loài chọn biểu diễn thử nghiệm 11, số tiên đề ontology 1402 Mỗi loài đƣợc chọn để xây dựng ontology đƣợc thể đầy đủ thuộc tính, mơ tả tài liệu tham khảo, đảm bảo tính đầy đủ xác từ nguồn tƣ liệu đƣợc sử dụng 66 3.4.2 Phần mềm hỗ trợ khai thác tìm kiếm Phần mềm hỗ trợ khai thác tìm kiếm ngữ nghĩa ontology động vật rừng thành phố Đà Nẵng đƣợc cài đặt internet, thuận tiện cho công đồng kế thừa, đóng góp phát triển ontology động vật Với việc cá nhân nghiên cứu xây dựng ontology xảy thiếu sót, chƣa xác, nhƣ hạn chế việc phân tích thơng tin mô tả, từ ngữ chuyên môn ngành sinh học Bên cạnh đó, khn khổ nghiên cứu tơi thực mơ tả số lồi động vật rừng q thành phố Đà Nẵng, cịn nhiều lồi động vật cần đƣợc mơ tả đƣa vào ontology để làm giàu phong phú liệu Việc cần cộng đồng nhiều cá nhân, tổ chức thực hiện, kế thừa tìm hiểu hƣớng dựa hƣớng phân tích thực hiện, để ontology động vật rừng thành phố Đà Nẵng ngày đầy đủ hoàn thiện Từ đó, việc xây dựng ứng dụng khai thác tìm kiếm ngữ nghĩa đƣợc hiệu thiết thực a Trang chủ Trang chủ hiển thị đầy đủ chức để ngƣời dùng hiểu đƣợc thành phần ontology động vật rừng Thanh công cụ đƣợc chia thành mục nhƣ Lớp (Classes), Thuộc tính (Properties), Thể (Individuals) Bên cạnh đó, mục Sự thay đổi chủ thể (Change by Entity) thể dự thay đổi, chỉnh sửa xảy ontology động vật Mục Lớp (Classes): hiển thị danh sách lớp, đƣợc trình bày trực quang, cụ thể phân cấp lớp, đồng thời hiển thị thông tin lớp đƣợc chọn xem 67 Hình 3.16 Trang chủ phần mềm b Chức phát triển ontology Bên cạnh việc ngƣời sử dụng khai thác, kế thừa ontology động vật rừng, phần mềm cung cấp chức hỗ trợ ngƣời sử dụng tiếp tục phát triển ontology động vật Với chức năng, chỉnh sửa, xóa thêm lớp, thuộc tính lồi động vật, đáp ứng đầy đủ yêu cầu xây dựng ontology Hình 3.17 Chức thêm xóa thuộc tính cho thể Hình 3.18 Chức thêm lồi động vật 68 Hình 3.19 Chức thêm lớp (Class) Hình 3.20 Chức lưu nội dung chỉnh sửa Các chức phát triển hỗ trợ cộng đồng, ngƣời nghiên cứu ontology động vật sau dễ dàng tiếp cận tiếp tục xây dựng mở rộng khơng cho ontology động vật rừng mà cịn tất động vật, thực vật khác địa bàn thành phố Đà Nẵng c Chức Tìm kiếm Dựa vào ontology động vật xây dựng, ngƣời dùng tìm kiếm thực thể ontology, lồi động vật mơ tả, lớp, thuộc tính Nhập lồi động vật cần tìm: Hình 3.21 Ơ nhập từ tìm kiếm 69 Phần mềm hiển thị gợi ý tìm kiếm: Hình 3.22 Gợi ý tìm kiếm Ngƣời dùng chọn vào gợi ý mong muốn thông tin kết đƣợc hiển thị Với thông tin lồi động vật, mơ tả ngữ nghĩa đƣợc thể đầy đủ: Hình 3.23 Kết tìm kiếm lồi Khỉ vàng 70 Hình 3.24 Kết tìm kiếm lồi Chà vá chân nâu Chức tìm kiếm phân cấp lớp đƣợc hỗ trợ để ngƣời sử dụng tìm xác lớp loài động vật thuộc lớp phân lớp Trong ví dụ dƣới đây, chọn lần vào gợi ý Khỉ phân lớp tự động xuất lớp khỉ lớp cha Động vật: Hình 3.25 Tìm kiếm kết phân cấp 71 3.5 KẾT CHƢƠNG Dựa nghiên cứu, tìm hiểu chƣơng 2, chƣơng tiến hành đặc tả liệu động vật rừng, tiến hành xây dựng chi tiết ontology động vật rừng phát triển chức phần mềm hỗ trợ khai thác, tìm kiếm động vật rừng thành phố Đà Nẵng Ontology động vật rừng phần mềm hỗ trợ khai thác tìm kiếm đƣợc xây dựng sử dụng, đáp ứng chức cần thiết Với thời gian nghiên cứu ngắn khơng có kế thừa từ nghiên cứu tƣơng tự trƣớc đó, nên việc xây dựng ontology động vật quy mô nhỏ, chƣa thật lớn phong phú Tuy vậy, nghiên cứu giúp tơi có đƣợc tảng kiến thức thực nghiệm bản, giúp ích cho việc nghiên cứu phát triển luận văn sau 72 KẾT LUẬN VÀ KIẾN NGHỊ Kết đạt đƣợc luận văn Việc nghiên cứu, ứng dụng semantic web để xây dựng ontology phục vụ tìm kiếm ngữ nghĩa động vật rừng địa bàn thành phố Đà Nẵng thu đƣợc kết ban đầu, đáng khích lệ, làm tảng kiến thức quan trọng cho ngƣời nghiên cứu để tiếp tục nghiên cứu chuyên sâu Về mặt lý thuyết, nghiên cứu tìm hiểu đƣợc nội dung kiến thức bản, nêu đƣợc nét đặc trƣng, ƣu web semantic Bên cạnh đó, tìm hiểu đƣợc phƣơng pháp, ngôn ngữ, công cụ hỗ trợ xây dựng ontology, đƣa đƣợc phƣơng pháp xây dựng ontology động vật rừng Đối với kết thực nghiệm, luận văn áp dụng kiến thức, phƣơng pháp tìm hiểu để xây dựng ontology cho liệu động vật rừng địa bàn thành phố Đà Nẵng xây dựng đƣợc phần mềm để hỗ trợ việc khai thác tìm kiếm ngữ nghĩa dựa ontology động vật xây dựng Việc phần mềm hỗ trợ khai thác tìm kiếm ontology động vật rừng địa bàn thành phố Đà Nẵng chạy internet, giúp cộng đồng tham khảo, thừa kế tiếp tục phát triển, làm phong phú thêm liệu cho ontology động vật, góp phần phổ biến rộng rãi thơng tin đa dạng sinh học thành phố Đà Nẵng Hạn chế Bên cạnh kết đạt đƣợc nghiên cứu cịn hạn chế, ontology quy mô nhỏ, chƣa thật lớn phong phú Ta cần phải có đƣợc liệu ontology đầy đủ để đánh giá mức độ xử lý tìm kiếm xác nhƣ mức độ đáp ứng đƣợc ngƣời dùng truy cập ứng dụng lúc Đồng thời, phần mềm ứng dụng chủ yếu hỗ trợ cộng đồng kế 73 thừa tiếp tục phát triển ontology động vật rừng, chức tìm kiếm cịn đơn giản, cần đƣa phƣơng pháp tìm kiếm hiệu Hƣớng phát triển Trong tƣơng lai luận văn tiếp tục phát triển để ứng dụng đƣợc vào thực tiễn Để đạt đƣợc mục đích cần phải tiếp tục xây dựng hoàn thiện ontology, làm phong phú liệu loài động vật Đồng thời dựa kinh nghiệm có để phát triển ontology cho thực vật Kiến nghị Để việc nghiên cứu xây dựng phát triển ontology động vật, nhƣ phần mềm hỗ trợ tìm kiếm ngữ nghĩa động vật ngày hoàn thiện đƣợc ứng dụng vào thực tiễn, tơi kính đề nghị Khoa Tin học – Trƣờng Đại học Sƣ Phạm Đại học Đà Nẵng tiếp tục quan tâm, hỗ trợ hƣớng dẫn sinh viên có hƣớng nghiên cứu tƣơng tự sau Trên toàn nghiên cứu lý thuyết vào việc xây dựng ontology phục vụ khai thác, tìm kiếm ngữ nghĩa động vật rừng địa bàn thành phố Đà Nẵng TÀI LIỆU THAM KHẢO Tiếng Việt: [1] TS Đinh Thị Phƣơng Anh (1997), Điều tra khu động – thực vật nhân tố ảnh hưởng, đề xuất phương án bảo tồn hợp lý khu bảo tồn thiên nhiên bán đảo Sơn Trà, Sở Khoa học Công nghệ thành phố Đà Nẵng [2] Nguyễn Quốc Đại (2009), Phương pháp xây dựng hệ thống hỏi đáp tiếng Việt dựa ontology, Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội [3] Phạm Thanh Hùng (2011), Ứng dụng semantic web để phát triển hệ thống tư vấn việc làm, Luận văn thạc sĩ kỹ thuật, Đại học Đà Nẵng [4] Lê Thanh Hƣơng (2011), Ontology Web ngữ nghĩa, Đại học Bách Khoa Hà Nội [5] Lƣơng Đỗ Long (2011), Luận văn thạc sĩ kỹ thuật Ứng dụng Web ngữ nghĩa lưu trữ quản lý tài liệu số, Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội [6] Trần Nguyên Ngọc (2012), Công nghệ XML Web ngữ nghĩa, Đại học kỹ thuật Lê Quý Đôn [7] Thái Tùng Quang, Nguyễn Quang Thành (2005), Luận văn thạc sĩ kỹ thuật Xây dựng hệ thống Elearning cho trường đại học, Đại học Kỹ thuật Cơng nghệ thành phố Hồ Chí Minh [8] Quyết định ban hành đề án số 41/2008/QĐ-UBND, ngày 21 tháng năm 2008 Ủy ban Nhân dân thành phố Đà Nẵng (2008), Xây dựng Đà Nẵng - Thành phố môi trường, Đà Nẵng [9] Sở Nông nghiệp Phát triển Nông thôn thành phố Đà Nẵng, Báo cáo tài nguyên rừng thành phố Đà Nẵng [10] Hà Quang Thụy, Phan Xn Hiếu, Đồn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009), Giáo trình khai phá liệu Web, Nhà xuất Giáo dục Việt Nam [11] Trƣờng Đại học Đà Lạt (2008), RDF2, Hệ thống học trực tuyến – Trƣờng Đại học Đà Lạt [12] Viện Khoa học Công nghệ Việt Nam - Bộ Khoa học Công nghệ (2007), Sách đỏ việt nam, phần I Động vật, Nhà xuất Khoa học tự nhiên công nghệ, Hà Nội Tiếng Anh: [13] Nicola Guarino, Daniel Oberle, and Steffen Staab, Guarino (2009), What Is an Ontology? Các website: [14] Hệ động vật rừng thành phố Đà Nẵng, tác giả Mai Hƣơng, Website Văn phịng thuộc Ban đạo thành phố Ứng phó biến đổi khí hậu nƣớc biển dâng thành phố Đà Nẵng, http://ccco.danang.gov.vn/98_80_1080/He_dong_vat_rung_thanh_p ho_Da_Nang.aspx, truy cập ngày 13/10/2015 [15] Stanford Center for Biomedical Informatics Research, http://protege.stanford.edu/support.php, ngày truy cập 22/9/2015 [16] Semantic Web thư viện số, tác giả Nguyễn Công Nhật, Thƣ viện Quốc gia Việt Nam, http://nlv.gov.vn/nghiep-vu-thu-vien/semantic-webva-thu-vien-so.html, truy cập ngày 10/3/2016 [17] Sinh vật rừng Việt Nam, Tra cứu Động vật rừng Việt Nam, http://www.vncreatures.net/tracuu.php?loai=1, truy cập từ ngày 30/11/2015 đến 30/5/2016 ... Thành phố đề đề án "Xây dựng Đà Nẵng - Thành phố môi trƣờng" [8] Vậy, với vấn đề nêu đề xuất xây dựng đề tài ? ?Xây dựng ontology phục vụ tìm kiếm ngữ nghĩa động vật rừng địa bàn thành phố Đà Nẵng? ??... thơng tin, liệu động vật rừng địa bàn thành phố Đà Nẵng tài liệu phƣơng pháp xây dựng ontology ứng dụng web ngữ nghĩa, đó: - Tài liệu thông tin, liệu động vật rừng địa bàn thành phố Đà Nẵng gồm: Báo... thuyết: Tìm hiểu lý thuyết: Web ngữ nghĩa, ontology, RDF Tìm kiếm, tổng hợp liệu động vật rừng địa bàn thành phố Đà Nẵng Nghiên cứu phƣơng pháp phần mềm xây dựng web ngữ nghĩa Nghiên cứu xây dựng ontology