1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng Ontology phục vụ tìm kiêm ngữ nghĩa động vật rừng trên địa bàn thành phố Đà Nẵng

26 174 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG TRẦN XUÂN TRƢỜNG XÂY DỰNG ONTOLOGY PHỤC VỤ TÌM KIẾM NGỮ NGHĨA ĐỘNG VẬT RỪNG TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG Chuyên ngành: Hệ thống Thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng – Năm 2016 Cơng trình hồn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS NGUYỄN TRẦN QUỐC VINH Phản biện 1: PGS TS Võ Trung Hùng Phản biện 2: PGS TS Lê Văn Sơn Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật họp Đại học Đà Nẵng vào ngày 31 tháng năm 2016 Có thể tìm hiểu luận văn tại: - Trung tâm Thơng tin-Học liệu, Đại học Đà Nẵng - Thư viện trường Đại học Sư phạm, Đại học Đà Nẵng MỞ ĐẦU Lý chọn đề tài Thành phố Đà Nẵng có lợi lớn địa hình thiên nhiên ban tặng cho nhiều sinh vật có giá trị, thành phố có giới đa dạng sinh học, nơi hội tụ đa dạng hệ sinh thái rừng, biển sơng; với 1.200km2 (kể huyện đảo Hồng Sa), diện tích rừng chiếm gần 50%, đường bờ biển 72km 1.000ha diện tích lưu vực sơng, hồ vùng trũng Hệ động vật rừng thành phố Đà Nẵng đặc trưng cho khu hệ động vật Nam Trường Sơn với lồi Voọc vá, Khỉ dài, Chồn dơi, Sóc vàng, Trĩ sao, Gà lơi Bắc Trường Sơn Tê tê, Gà tiền, Khỉ vàng,… Hiện nay, việc điều tra, thống kê hệ động vật rừng thành phố Đà Nẵng nhiều nhà khoa học, quan, tổ chức thực thông qua chương trình, dự án, đề tài, như: Điều tra khu động – thực vật nhân tố ảnh hưởng, đề xuất phương án bảo tồn hợp lý khu bảo tồn thiên nhiên bán đảo Sơn Trà, Báo cáo tài nguyên rừng thành phố Đà Nẵng,… Tuy nhiên, việc công bố nội dung điều tra, thống kê internet để cá nhân, tổ chức khác có nhu cầu tìm hiểu, tra cứu nhiều hạn chế Một số website cung cấp thông tin hệ động – thực vật thành phố Đà Nẵng như: website Sở Nông nghiệp phát triển Nông thôn TP Đà Nẵng, website Văn phòng thuộc Ban đạo thành phố Ứng phó biến đổi khí hậu nước biển dâng thành phố Đà Nẵng,… chủ yếu cung cấp tin tức, số liệu thống kê sơ lược, chưa có website cung cấp chức tra cứu chuyên sâu hệ động - thực vật nói chung động vật rừng nói riêng thành phố Đà Nẵng Hiện nay, công nghệ web 2.0 đạt thành tựu đáng kể việc nâng cao tính tương tác đẩy nhanh tốc độ xử lý đáp ứng yêu cầu người dùng Tuy nhiên xã hội thông tin đương đại nhu cầu người dùng không dừng lại việc cải thiện tốc độ mà phải cải thiện chất lượng xử lý trang web theo yêu cầu ngày nâng cao Web 3.0 đời nhằm đáp ứng yêu cầu chất lượng Với đặc điểm nâng cao khả chia sẻ tài nguyên tăng “sự hiểu biết” q trình xử lý liệu máy tính, Web ngữ nghĩa sâu vào phân tích định hướng liệu, đồng thời hỗ trợ phát triển ứng dụng Web ngữ nghĩa nhiều lĩnh vực khác Một lĩnh vực mạnh Web ngữ nghĩa xử lý tìm kiếm thơng tin Việc phân tích định hướng nội dung lưu trữ cho phép xây dựng sở liệu phục vụ tìm kiếm xác hơn, tinh gọn Do đó, xây dựng cơng cụ để tìm kiếm ngữ nghĩa động vật rừng thành phố Đà Nẵng nhu cầu cấp thiết, phù hợp với chủ trương Thành phố việc bảo tồn đa dạng sinh học rừng với mục tiêu Thành phố môi trường mà Thành phố đề đề án "Xây dựng Đà Nẵng - Thành phố môi trường" Vậy, với vấn đề nêu đề xuất xây dựng đề tài “Xây dựng ontology phục vụ tìm kiếm ngữ nghĩa động vật rừng địa bàn thành phố Đà Nẵng” làm đề tài tốt nghiệp luận văn cao học Trong đề tài này, nghiên cứu ứng dụng công nghệ Web ngữ nghĩa, đề xuất giải pháp xây dựng ontology dựa thông tin, liệu động vật rừng, từ xây dựng ứng dụng hỗ trợ tìm kiếm ngữ nghĩa động vật rừng phân bố thành phố Đà Nẵng cách dễ dàng tiện lợi, góp phần phổ biến rộng rãi thơng tin đa dạng sinh học Thành phố Mục tiêu nghiên cứu Xây dựng ontology cho liệu động vật rừng thành phố Đà Nẵng; Xây dựng ứng dụng tìm kiếm ngữ nghĩa cho liệu động vật rừng; Phổ biến thơng tin góp phần bảo tồn đa dạng sinh học rừng thành phố Đà Nẵng Đối tƣợng phạm vi nghiên cứu Đối tượng nghiên cứu vấn đề liên quan đến web ngữ nghĩa, phương pháp xây dựng lưu trũ liệu web ngữ nghĩa, nghiên cứu ontology, RDF OWL, liệu động vật rừng thành phố Đà Nẵng Phạm vi nghiên cứu liệu động vật rừng phân bố địa bàn thành phố, nghiên cứu RDF, SPARQL, ứng dụng biên tập ontology: (Sesame, Jena, Protégé,…) Phƣơng pháp nghiên cứu Phương pháp lý thuyết: Tìm hiểu lý thuyết: Web ngữ nghĩa, ontology, RDF Tìm kiếm, tổng hợp liệu động vật rừng địa bàn thành phố Đà Nẵng Nghiên cứu phương pháp phần mềm xây dựng web ngữ nghĩa Nghiên cứu xây dựng ontology cho liệu động vật rừng Phương pháp thực nghiệm: Xây dựng ontology; Triển khai thực tế internet Ý nghĩa khoa học thực tiễn Về mặt khoa học đề tài đóng góp phương pháp xây dựng ontology liệu động vật nói chung liệu động vật rừng địa bàn thành phố Đà Nẵng nói riêng, ứng dụng semantic web mặt tìm kiếm vấn đề đa ngữ ontology, công cụ hỗ trợ khai thác, phát triển tìm kiếm theo cơng nghệ web ngữ nghĩa Về thực tiễn đề tài mở hướng nghiên cứu ứng dụng tìm kiếm liệu lồi động vật Bố cục đề tài Luận văn trình bày bao gồm nội dung sau : Chương 1: Trong chương này, tơi trình bày sở lý thuyết web ngữ nghĩa, ngôn ngữ RDF, OWL nêu khái niệm ontology, đồng thời giới thiệu trích dẫn tổng quan thơng tin động vật rừng từ nghiên cứu động vật địa bàn thành phố Đà Nẵng Chương 2: Chương tơi tìm hiểu phương pháp xây dựng ontology, từ đưa phương pháp xây dựng ontology động vật rừng Đồng thời, tìm hiểu phần mềm ứng dụng việc biên tập khai thác ontology Chương 3: Dựa nghiên cứu, tìm hiểu chương 2, tơi tiến hành đặc tả liệu động vật rừng, tiến hành xây dựng chi tiết ontology động vật rừng phát triển chức phần mềm hỗ trợ khai thác, tìm kiếm động vật rừng thành phố Đà Nẵng Ngồi ra, để đánh giá tồn q trình nghiên cứu, phần cuối luận văn có nêu lên kết hướng phát triển cho đề tài CHƢƠNG NGHIÊN CỨU TỔNG QUAN 1.1 TỔNG QUAN VỀ WEB NGỮ NGHĨA 1.1.1 Giới thiệu 1.1.2 Khái niệm Web ngữ nghĩa phát triển Tim- Berners Lee, cha đẻ WWW, URIs, HTTP HTML Theo Ông, “Web ngữ nghĩa mở rộng Web tại, cho phép người dùng truy tìm, phối hợp, sử dụng lại trích lọc thơng tin cách dễ dàng xác” 1.1.3 Nội dung xây dựng hệ thống web ngữ nghĩa 1.1.4 Kiến trúc phân tầng web ngữ nghĩa 1.2 RDF – NỀN TẢNG CỦA WEB NGỮ NGHĨA 1.2.1 Khái niệm 1.2.2 Mơ hình RDF 1.2.3 Đồ thị RDF 1.2.4 Namespace 1.2.5 Literal 1.2.6 Kiểu liệu có cấu trúc 1.2.7 RDFS (RDF Schema) 1.3 ONTOLOGY VÀ NGÔN NGỮ OWL 1.3.1 Định nghĩa ontology Nhiều định nghĩa ontology xuất thập kỷ trước có lẽ định nghĩa mơ tả rõ chất ontology là: “An ontology is a formal, explicit specification of a shared conceptualization.” (Một ontology hình thức, đặc tả rõ ràng khái niệm chia sẻ) Trong ngữ cảnh này, conceptualization (khái niệm hoá) đề cập đến mơ hình trừu tượng vài tượng giới thực dùng để nhận dạng khái niệm liên quan đến tượng Explicit (rõ ràng) có nghĩa loại khái niệm sử dụng ràng buộc sử dụng chúng xác định cách rõ ràng, formal (hình thức) có nghĩa máy tính hiểu ontology 1.3.2 Các lĩnh vực ứng dụng ontology 1.3.3 Vai trò ontology web ngữ nghĩa 1.3.4 Các thành phần ontology Ontology sử dụng biểu mẫu trình bày tri thức giới hay phần Ontology thường miêu tả:  Cá thể: Các đối tượng bản, tảng  Lớp: Các tập hợp, hay kiểu đối tượng  Thuộc tính: Thuộc tính, tính năng, đặc điểm, tính cách, hay thơng số mà đối tượng có đem chia sẻ  Mối liên hệ: cách mà đối tượng liên hệ tới đối tượng khác Bộ từ vựng ontology xây dựng sở tầng RDF RDFS, cung cấp khả biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên Web có khả hỗ trợ lập luận 1.3.5 Cá thể (Individuals) – Thể 1.3.6 Lớp (Classes) - Khái niệm 1.3.7 Thuộc tính (Properties) 1.3.8 Mối quan hệ (Relation) 1.3.9 Ngơn ngữ OWL OWL (The Web Ontology Language) ngôn ngữ gần XML dùng để mô tả hệ sở tri thức OWL ngôn ngữ đánh dấu dùng để xuất chia sẻ liệu Internet thơng qua mơ hình liệu gọi “ontology” Ontology mô tả lĩnh vực (domain) diễn tả đối tượng lĩnh vực mối quan hệ đối tượng OWL phần mở rộng từ vựng RDF kế thừa từ ngôn ngữ DAML+OIL Web ontology – dự án hỗ trợ W3C OWL biểu diễn ý nghĩa thuật ngữ từ vựng mối liên hệ thuật ngữ để đảm bảo phù hợp với trình xử lý phần mềm 1.3.10 Hệ truy vấn SPARQL 1.3.11 Cú pháp câu truy vấn 1.3.12 Tạo câu truy vấn đơn giản 1.4 ĐỘNG VẬT RỪNG TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG 1.4.1 Giới thiệu 1.4.2 Cấu trúc, thành phần loài động vật Các loài phân bố số lồi khơng đồng lớp động vật, có thành phần lồi đa dạng, đặc biệt nguồn gen loài quý như: Gấu, Beo lửa, Mèo rừng, Sóc bay, Chồn dơi, Cầy mực, Cu li, Voọc vá chân nâu, khỉ vàng, Trĩ sao, Công, Gà tiền, Gà lôi lam, Mang trường sơn, Rái cá, Dơi chó tai ngắn số lồi bò sát, lưỡng cư khác Bảng 1.1 Phân bố thành phần lồi động vật TT Đơn vị thống kê Sơng Bắc-Sơng Nam Sơn Trà Bà Nà Số Bộ 23 25 26 Số Họ 60 64 80 Số Loài 205 135 256 Loài quý 34 15 44 Phân bố Taxon lớp động vật có xương sống cạn cho thấy khác phân bố không đồng Bảng 1.2 Phân bố lớp động vật: thú, chim, bò sát Bộ TT Lớp Họ Lồi Sơng Sơng Sơng Bắc- Sơn Bà Bắc- Bắc- Sơn Bà Sông Trà Nà Sông Trà Nà Sông Trà Nà Nam Nam Sơn Bà Nam Thú 8 23 18 26 55 36 Chim 14 15 16 37 34 46 150 106 178 Bò sát 2 8 Tổng số 25 25 26 64 64 80 214 24 61 17 165 256 Danh mục động vật rừng cần ưu tiên bảo tồn địa bàn thành phố giai đoạn 2014-2020 bao gồm loài động vật rừng nguy cấp, quý, loài động vật rừng thơng thường có giá trị kinh tế, mơi trường điển hình: Số lượng lồi động vật rừng nguy cấp, quý, hiếm: 75 loài; Số lượng loài động vật rừng thơng thường có giá trị kinh tế, mơi trường Tổng số: 21 lồi 1.4.3 Cấu trúc, thành phần loài trùng 1.5 MỘT SỐ NGHIÊN CỨU WEB NGỮ NGHĨA ĐÃ TRIỂN KHAI 1.6 KẾT CHƢƠNG Trong chương này, tơi trình bày sở lý thuyết web ngữ nghĩa, ngôn ngữ RDF, OWL, hệ truy vấn SPARQL nêu khái niệm ontology, đồng thời giới thiệu trích dẫn tổng quan thơng tin động vật rừng tham khảo từ số nghiên cứu động vật địa bàn thành phố Đà Nẵng tìm hiểu số nghiên cứu web ngữ nghĩa triển khai trước Từ đó, tơi có kiến thức lý thuyết, thông tin, liệu ban đầu hệ động vật rừng thành phố Đà 10 Ontology, gồm bước mô tả chi tiết đây: 2.3.1 Bƣớc 1: Xác định lĩnh vực phạm vi Ontology Lĩnh vực cần xây dựng ontology thông tin liên quan đến loài động vật rừng thành phố Đà Nẵng, mà cụ thể xem xét thông tin chi tiết hình dáng, màu sắc, phận thể, tập tính sinh sống, thức ăn, cách săn mồi,… bên cạnh thơng tin giá trị khoa học, kinh tế, thông tin bảo tồn đa dạng sinh học Luận văn chủ yếu tập trung vào xây dựng ontology cho số lồi động vật q hiếm, mơ tả thơng tin lồi Tri thức động vật rừng thành phố Đà Nẵng chia sẻ theo cách cho phép người dùng tìm lồi động vật 2.3.2 Bƣớc 2: Xem xét việc kế thừa ontology có sẵn Qua tìm hiểu, việc xây dựng ontology cho động vật nói chung ít, số nguồn ontology nước ngoài, xây dựng tiếng anh cho phép khai thác không cho phép kế thừa, phát triển Bên cạnh đó, ontology động vật Việt Nam chưa có nghiên cứu xây dựng Vì vậy, khơng có ontology sẵn có động vật để kế thừa, yêu cầu phải nghiên cứu xây dựng từ đầu Đây vấn đề trở ngại vấn đề nghiên cứu luận văn 2.3.3 Bƣớc 3: Liệt kê thuật ngữ quan trọng Ontology xây dựng sở khái niệm lĩnh vực cụ thể, xây dựng ontology cần thuật ngữ chuyên ngành để xây dựng thành lớp ontology tương ứng Danh sách số thuật ngữ động vật sau: 11 Bảng 2.4 Một số thuật ngữ động vật Động vật Có dây sống Chim Khơng có dây sống Thú Có túi Linh trưởng Lồi Có vú Máu nóng Máu lạnh Cá Đẻ trứng Sinh Ăn thịt Lưỡng cư Bò sát Bay Gặm nhấm Mỏ vịt Chim … Danh sách số thuật ngữ tập tính, sinh sản, thức ăn,… sau: Bảng 2.3 Thuật ngữ tập tính, sinh sản, thức ăn,… Thụ tinh Thụ tinh Bơi Chi Lơng Chạy Lưỡi Miệng Đi Móng vuốt Mắt Lá Đi Vây Quả Xương Cánh Địa y Tim Mang Bò Độ dài Bay Nhảy Hoa Chồi non Trọng lượng … 2.3.4 Bƣớc 4: Xác định lớp phân cấp lớp Đây hai bước quan trọng việc xây dựng ontology Bước định nghĩa lớp từ số thuật ngữ liệt kê bước 3, sau xây dựng cấu trúc lớp phân cấp theo quan hệ “lớp cha - lớp con” 12 Xây dựng cấu trúc phân lớp cho liệu động vật rừng thành phố Đà Nẵng thực theo cấu trúc từ xuống, bắt đầu lớp có mức độ tổng quát cao nhất, sau triển khai dần đến lớp lá, ví dụ phân cấp lớp động vật: Hình 2.1 – Lớp phân cấp lớp động vật 2.3.5 Bƣớc 5: Xác định thuộc tính Từ danh sách số thuật ngữ tập tính, sinh sản, thức ăn,…ở mục 2.5.3, xác định thuộc tính lớp Mỗi thuộc tính mơ tả cho nhiều lớp Ví dụ lớp Động vật có thuộc tính sau: Có mơ trường sống, có phân bố, có trọng lượng, có độ dài, có màu lơng, có cách săn mồi, Có tai, có mắt,… Bên cạnh đó, việc xem xét từ đồng nghĩa cho thuộc tính quan trọng, ví dụ: thuộc tính trọng lượng đồng nghĩa với cân nặng, độ dài đồng nghĩa với chiều dài, chi đồng nghĩa với tay, chân,… 13 2.3.6 Bƣớc 6: Xác định ràng buộc thuộc tính Từ thuộc tính xác định, ta xác định kiểu ràng buộc cho thuộc tính giá trị, max, min, chuỗi,… Ví dụ, thuộc tính có trọng lượng (cân nặng) kiểu số nhận giá trị từ 30kg đến 90kg, tương tự có độ dài (chiều dài); Có thân nhận giá trị kiểu chuỗi ký tự (string) ta mơ tả hình dạng thân, số đặc điểm thân, tương tự thuộc tính có mắt, có tai, có đi,…Thuộc tính có gia trị khoa học, có biện pháp bảo tồn,…cũng ràng buộc giá trị kiểu chuỗi ký tự để mô tả thuộc tính 2.3.7 Bƣớc 7: Tạo thể hiện/ thực thể Trong khuôn khổ luận văn này, tập trung nghiên cứu xây dựng ontology cho động vật rừng thành phố Đà Nẵng, chọn lọc số loài động vật quý để sử dụng làm thể (thực thể individuals) Danh sách số loài động vật quý sử dụng làm thể hiện: Hình 2.2 – Thể hiện/ thực thể động vật Trong đó: lồi Chà vá chân nâu (Voọc chà vá chân nâu), Chà vá chân đen (Voọc chà vá chân đen) đại diện cho Chi Chà vá (Voọc) 14 lồi Khỉ lợn, Khỉ vàng thuộc họ Khỉ, lồi Gấu chó thuộc họ Gấu, loài Báo hoa mai thuộc họ Mèo, loài Cầy mực thuộc họ Cầy, loài Tê tê vàng thuộc họ Tê tê,… 2.4 MỘT SỐ PHẦN MỀM BIÊN TẬP ONTOLOGY 2.4.1 Phần mềm Sesame 2.4.2 Phần mềm Jena 2.4.3 Phần mềm Protégé 2.5 KẾT CHƢƠNG Chương tơi tìm hiểu phương pháp xây dựng ontology, từ đưa phương pháp xây dựng ontology động vật rừng Đồng thời, tơi tìm hiểu phần mềm ứng dụng việc biên tập khai thác ontology CHƢƠNG XÂY DỰNG ONTOLOGY VÀ PHÁT TRIỂN ỨNG DỤNG 3.1 MÔ TẢ BÀI TỐN "Xây dựng ontology phục vụ tìm kiếm ngữ nghĩa động vật rừng thành phố Đà Nẵng” xây dựng ontology động vật rừng trọng tâm Việc nghiên cứu, xây dựng ontology yêu cầu luận văn Như phân tích Chương 2, ontology động vật không kế thừa từ nghiên cứu trước mà phải nghiên cứu xây dựng lại từ đầu, đồng thời thông tin liệu động vật rừng cần tham khảo từ ngành sinh học (các nghiên cứu động vật thành phố Đà Nẵng) Sau nghiên cứu xây dựng ontology, cần cung cấp tri thức để cộng đồng khai thác phát triển theo hướng tìm kiếm ngữ nghĩa động vật rừng thành phố Đà Nẵng 15 3.2 ĐẶC TẢ DỮ LIỆU Dữ liệu động vật rừng trích chọn từ nhiều nguồn tư liệu khác nhau, bảo đảm tính đầy đủ, xác, kế thừa hỗ trợ cho nhau, đó: - Báo cáo tổng kết đề tài cấp Thành phố Đà Nẵng “Điều tra khu động – thực vật nhân tố ảnh hưởng, đề xuất phương án bảo tồn hợp lý khu bảo tồn thiên nhiên bán đảo Sơn Trà” [1] nhờ tư vấn Thạc sĩ Nguyễn Văn Khánh, Trường Đại học Sư phạm, Đại học Đà Nẵng, nghiên cứu ngành sinh học, tham khảo để xác định loài động vật rừng thuộc loại quý địa bàn thành phố xuất rừng thuộc địa bàn thành phố năm trước để chọn minh họa xây dựng ontology - Từ đó, sử dụng nội dung, thơng tin mơ tả chi tiết loài động vật Sách đỏ Việt Nam [12], đồng thời tham khảo website có nguồn liệu động vật phong phú xác, thường nhà nghiên cứu tham khảo như: vncreatures.net (Sinh vật rừng Việt Nam) [17], wikipedia.org (Bách khoa toàn thư mở) để xây dựng ontology động vật rừng Ưu tiên chọn loài động vật rừng quý để xây dựng ontology Dữ liệu động vật rừng nguồn tư liệu, có dạng văn mơ tả thơng thường, ví dụ đây: - Báo cáo tổng kết đề tài cấp Thành phố Đà Nẵng “Điều tra khu động – thực vật nhân tố ảnh hưởng, đề xuất phương án bảo tồn hợp lý khu bảo tồn thiên nhiên bán đảo Sơn Trà” [1] - Sách đỏ Việt Nam, Phần I Động vật, Nhà xuất Khoa học Tự nhiên Công nghệ, năm 2007 - Website: vncreatures.net (Sinh vật rừng Việt Nam) 3.3 QUY TRÌNH XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM 16 Q trình xây dựng ontology phần mềm tìm kiếm động vật rừng thực qua giai đoạn chính: Giai đoạn 1: Xây dựng ontology cho liệu động vật rừng Sau q trình đặc tả liệu, tơi xây dựng ontology cách sử dụng công cụ Protégé để chuyển liệu chọn lọc dạng văn sang ontology, thực bước theo mục 2.3 Quy trình xây dựng ontology cho liệu động vật rừng Giai đoạn 2: xây dựng phần mềm hỗ trợ khai thác tìm kiếm ontology động vật Phần mềm hỗ trợ khai thác tìm kiếm ontology truy cập từ internet, giao diện cần trực quan, thể cụ thể lớp, thuộc tính thể (các loài động vật) đa xây dựng ontology 3.4 XÂY DỰNG ONOTLOGY VÀ PHẦN MỀM 3.4.1 Ontology động vật rừng Theo quy trình xây dựng ontology cho liệu động vật rừng xác định mục 2.3 liệu động vật đặc tả, tiến hành xây dựng ontology động vật rừng Trong thời gian có hạn để nghiên cứu xây dựng ontology, chọn thông tin số lồi động vật q trình bày phần 1.4.2 để biểu diễn Đặc trưng phân tích xây dựng ontology cho liệu động vật lớp Động vật phức tạp, gồm nhiều lớp con, chọn hướng phân tích phù hợp để xây dựng việc khó khăn, đòi hỏi phải thực nhiều lần phân cấp lớp hợp lý Kết ontology thể phần mềm protégé sau: - Giao diện chính: hiển thị thơng tin mô tả chung ontology; thông tin tác giả; thông tin thống kê ontology: số lớp (bao gồm lớp - Class) xây dựng 295, số thuộc tính đối tượng (Object 17 Property) 52, số liệu thuộc tính liệu 73, số lồi chọn biểu diễn 11, số tiên đề ontology 1402 Hình 3.1 – Giao diện ontology động vật 18 - Các lớp (Classes): Lớp ontology lớp Động vật, bên cạnh lớp như: Bộ phận thể, Môi trường sống, Phân bố, Thức ăn,… để tạo thành quan hệ với lớp Động vật Trong lớp Động vật, tập trung phân tích lớp động vật có dây sống (xương sống), động vật rừng quý Đà Nẵng đa số thuộc động vật có dây sống (xương sống) như: voọc, tê tê, khỉ vàng, gấu,… Trong lớp động vật có dây sống, chia thành lớp con: Máu lạnh máu nóng từ tiếp tục xác định lớp nhỏ hơn, tạo thành phân cấp lớp Mỗi lớp thêm thông tin mơ tả thơng tin tiếng Anh Mỗi lớp có thuộc tính mơ tả chung lớp thuộc tính riêng lớp lồi động vật Kết xây dựng lớp mô tả đây: Hình 3.2 – Cây phân cấp lớp động vật 19 - Thuộc tính (Property): dựa vào thơng tin mơ tả đặc tính, tính chất, hành vi, tập quán sinh hoạt, hoạt động, săn mồi, sinh lý,… lồi động vật, tơi đưa thuộc tính đối tượng thuộc tính liệu, từ gán giá trị tạo mối quan hệ lớp động vật lớp khác - Các thể (Individuals): dựa theo nghiên cứu trước (như trích dẫn báo cáo) để chọn lựa động vật rừng đặc trưng, quý thành phố Đà Nẵng để xây dựng ontology Chọn lớp (lớp con) phân cấp lớp động vật mà loài động vật xếp vào để tạo thể cho lớp đó, dựa vào thơng tin mơ tả nguồn liệu loài động vật để gán thuộc tính phù hợp Hình 3.3 – Xây dựng ontology cho lồi Khỉ vàng 20 - Bên cạnh đó, cần thể từ đồng nghĩa xây dựng ontology động vật Ví dụ, thuộc tính trọng lượng hiểu cân nặng, nên xác định thuộc tính trọng lượng cần gán từ cân nặng vào thuộc tính Hoặc lớp “Động vật có dây sống” hiểu “động vật có xương sống”,… Phần mềm Protégé thể từ đồng nghĩa ký hiệu “ ” 3.4.2 Phần mềm hỗ trợ khai thác tìm kiếm Phần mềm hỗ trợ khai thác tìm kiếm ngữ nghĩa ontology động vật rừng thành phố Đà Nẵng cài đặt internet, thuận tiện cho công đồng kế thừa, đóng góp phát triển ontology động vật Với việc cá nhân nghiên cứu xây dựng ontology xảy thiếu sót, chưa xác, hạn chế việc phân tích thông tin mô tả, từ ngữ chuyên môn ngành sinh học Bên cạnh đó, khn khổ nghiên cứu tơi thực mơ tả số lồi động vật rừng quý thành phố Đà Nẵng, nhiều lồi động vật cần mơ tả đưa vào ontology để làm giàu phong phú liệu Việc cần cộng đồng nhiều cá nhân, tổ chức thực hiện, kế thừa tìm hiểu hướng dựa hướng phân tích tơi thực hiện, để ontology động vật rừng thành phố Đà Nẵng ngày đầy đủ hồn thiện Từ đó, việc xây dựng ứng dụng khai thác tìm kiếm ngữ nghĩa hiệu thiết thực a Trang chủ Trang chủ hiển thị đầy đủ chức để người dùng hiểu thành phần ontology động vật rừng Thanh công cụ chia thành mục Lớp (Classes), Thuộc tính (Properties), Thể (Individuals) Bên cạnh đó, mục Sự thay 21 đổi chủ thể (Change by Entity) thể dự thay đổi, chỉnh sửa xảy ontology động vật Mục Lớp (Classes): hiển thị danh sách lớp, trình bày trực quang, cụ thể phân cấp lớp, đồng thời hiển thị thông tin lớp chọn xem b Chức phát triển ontology Bên cạnh việc người sử dụng khai thác, kế thừa ontology động vật rừng, phần mềm cung cấp chức hỗ trợ người sử dụng tiếp tục phát triển ontology động vật Với chức năng, chỉnh sửa, xóa thêm lớp, thuộc tính loài động vật, đáp ứng đầy đủ yêu cầu xây dựng ontology Các chức phát triển hỗ trợ cộng đồng, người nghiên cứu ontology động vật sau dễ dàng tiếp cận tiếp tục xây dựng mở rộng cho ontology động vật rừng mà tất động vật, thực vật khác địa bàn thành phố Đà Nẵng c Chức Tìm kiếm Dựa vào ontology động vật xây dựng, người dùng tìm kiếm thực thể ontology, loài động vật mơ tả, lớp, thuộc tính Nhập lồi động vật cần tìm: Hình 3.4 – Ơ nhập từ tìm kiếm Phần mềm hiển thị gợi ý tìm kiếm Người dùng chọn vào gợi ý mong muốn thông tin kết hiển thị Với thơng tin lồi động vật, mơ tả ngữ 22 nghĩa thể đầy đủ: Hình 3.5 – Kết tìm kiếm lồi Khỉ vàng Chức tìm kiếm phân cấp lớp hỗ trợ để người sử dụng tìm xác lớp loài động vật thuộc lớp phân lớp Trong ví dụ đây, chọn lần vào gợi ý Khỉ phân lớp tự động xuất lớp khỉ lớp cha Động vật 3.5 KẾT CHƢƠNG Dựa nghiên cứu, tìm hiểu chương 2, chương tiến hành đặc tả liệu động vật rừng, tiến hành xây dựng chi tiết ontology động vật rừng phát triển chức phần mềm hỗ trợ khai thác, tìm kiếm động vật rừng thành phố Đà Nẵng Ontology động vật rừng phần mềm hỗ trợ khai thác tìm kiếm xây dựng sử dụng, đáp ứng chức cần thiết Với thời gian nghiên cứu ngắn khơng có kế thừa từ nghiên cứu tương tự trước đó, nên việc xây dựng ontology động vật quy mô nhỏ, chưa thật lớn phong phú Tuy vậy, nghiên cứu giúp tơi có tảng kiến thức thực nghiệm bản, giúp ích cho việc nghiên cứu phát triển luận văn sau 23 KẾT LUẬN VÀ KIẾN NGHỊ KẾT QUẢ ĐẠT ĐƢỢC CỦA LUẬN VĂN Việc nghiên cứu, ứng dụng semantic web để xây dựng ontology phục vụ tìm kiếm ngữ nghĩa động vật rừng địa bàn thành phố Đà Nẵng thu kết ban đầu, đáng khích lệ, làm tảng kiến thức quan trọng cho người nghiên cứu để tiếp tục nghiên cứu chuyên sâu Về mặt lý thuyết, nghiên cứu tìm hiểu nội dung kiến thức bản, nêu nét đặc trưng, ưu web semantic Bên cạnh đó, tìm hiểu phương pháp, ngôn ngữ, công cụ hỗ trợ xây dựng ontology, đưa phương pháp xây dựng ontology động vật rừng Đối với kết thực nghiệm, luận văn áp dụng kiến thức, phương pháp tìm hiểu để xây dựng ontology cho liệu động vật rừng địa bàn thành phố Đà Nẵng xây dựng phần mềm để hỗ trợ việc khai thác tìm kiếm ngữ nghĩa dựa ontology động vật xây dựng Việc phần mềm hỗ trợ khai thác tìm kiếm ontology động vật rừng địa bàn thành phố Đà Nẵng chạy internet, giúp cộng đồng tham khảo, thừa kế tiếp tục phát triển, làm phong phú thêm liệu cho ontology động vật, góp phần phổ biến rộng rãi thơng tin đa dạng sinh học thành phố Đà Nẵng HẠN CHẾ Bên cạnh kết đạt nghiên cứu hạn chế, ontology quy mô nhỏ, chưa thật lớn phong phú Ta cần phải có liệu ontology đầy đủ để đánh giá mức độ xử lý tìm kiếm xác mức độ đáp ứng 24 người dùng truy cập ứng dụng lúc Đồng thời, phần mềm ứng dụng chủ yếu hỗ trợ cộng đồng kế thừa tiếp tục phát triển ontology động vật rừng, chức tìm kiếm đơn giản, cần đưa phương pháp tìm kiếm hiệu HƢỚNG PHÁT TRIỂN Trong tương lai luận văn tiếp tục phát triển để ứng dụng vào thực tiễn Để đạt mục đích cần phải tiếp tục xây dựng hoàn thiện ontology, làm phong phú liệu loài động vật Đồng thời dựa kinh nghiệm có để phát triển ontology cho thực vật KIẾN NGHỊ Để việc nghiên cứu xây dựng phát triển ontology động vật, phần mềm hỗ trợ tìm kiếm ngữ nghĩa động vật ngày hoàn thiện ứng dụng vào thực tiễn, tơi kính đề nghị Khoa Tin học – Trường Đại học Sư Phạm Đại học Đà Nẵng tiếp tục quan tâm, hỗ trợ hướng dẫn sinh viên có hướng nghiên cứu tương tự sau ... phương pháp tìm hiểu để xây dựng ontology cho liệu động vật rừng địa bàn thành phố Đà Nẵng xây dựng phần mềm để hỗ trợ việc khai thác tìm kiếm ngữ nghĩa dựa ontology động vật xây dựng Việc phần... động vật rừng từ nghiên cứu động vật địa bàn thành phố Đà Nẵng Chương 2: Chương tơi tìm hiểu phương pháp xây dựng ontology, từ đưa phương pháp xây dựng ontology động vật rừng Đồng thời, tơi tìm. .. cứu Xây dựng ontology cho liệu động vật rừng thành phố Đà Nẵng; Xây dựng ứng dụng tìm kiếm ngữ nghĩa cho liệu động vật rừng; Phổ biến thông tin góp phần bảo tồn đa dạng sinh học rừng thành phố Đà

Ngày đăng: 25/05/2019, 14:03

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w