XÂY DỰNG ONOTLOGY VÀ PHẦN MỀM

Một phần của tài liệu Xây dựng ontology phục vụ tìm kiếm ngữ nghĩa động vật rừng trên địa bàn thành phố đà nẵng (Trang 68)

7. Tổng quan tài liệu nghiên cứu

3.4. XÂY DỰNG ONOTLOGY VÀ PHẦN MỀM

3.4.1. Ontology động vật rừng

Theo quy trình xây dựng ontology cho dữ liệu động vật rừng đã xác định ở mục 2.3. và dữ liệu động vật đã đặc tả, tôi tiến hành xây dựng ontology động vật rừng. Trong một thời gian có hạn để nghiên cứu và xây dựng ontology, tôi đã chọn thông tin của một số loài động vật quý hiếm nhƣ trình bày ở phần 1.4.2. để biểu diễn.

Đặc trƣng khi phân tích và xây dựng ontology cho dữ liệu động vật là lớp Động vật rất phức tạp, gồm nhiều lớp con, vì vậy chọn hƣớng phân tích phù hợp để xây dựng là việc khó khăn, đòi hỏi phải thực hiện nhiều lần mới đƣợc một cây phân cấp lớp hợp lý.

Kết quả ontology đƣợc thể hiện bằng phần mềm protégé nhƣ sau:

- Giao diện chính: hiển thị thông tin mô tả chung của ontology; thông tin về tác giả; thông tin thống kê về ontology: số lớp (bao gồm lớp con - Class) đã xây dựng là 295, số thuộc tính đối tƣợng (Object Property) là 52, số dữ liệu thuộc tính dữ liệu là 73, số loài đã chọn biểu diễn là 11, số tiên đề trong ontology là 1402.

Hình 3.5. Giao diện chính ontology động vật

- Các lớp (Classes): Lớp chính của ontology là lớp Động vật, bên cạnh đó còn các lớp nhƣ: Bộ phận cơ thể, Môi trƣờng sống, Phân bố, Thức ăn,… để tạo thành các quan hệ với lớp Động vật. Trong lớp Động vật, tôi tập trung phân tích lớp con của động vật có dây sống (xƣơng sống), vì động vật rừng quý hiếm Đà Nẵng đa số thuộc động vật có dây sống (xƣơng sống) nhƣ: voọc, tê tê, khỉ vàng, gấu,… Trong lớp động vật có dây sống, đƣợc chia ra thành 2 lớp con: Máu lạnh và máu nóng và từ đó tiếp tục xác định các lớp con nhỏ hơn, tạo thành cây phân cấp lớp. Mỗi lớp đƣợc thêm thông tin mô tả hoặc thông tin tiếng Anh. Mỗi lớp còn có các thuộc tính mô tả chung của lớp và thuộc tính riêng của mỗi lớp con và mỗi loài động vật. Kết quả xây dựng lớp đƣợc mô tả dƣới đây:

Hình 3.7. Cây phân cấp các lớp Bộ phận cơ thể, Môi trường sống

Hình 3.9. Thông tin mô tả cho lớp

Hình 3.10. Thuộc tính chung của lớp. Ví dụ lớp Khỉ

Hình 3.11. Mô tả cho quan hệ các lớp

- Thuộc tính (Property): dựa vào thông tin mô tả các đặc tính, tính chất, hành vi, tập quán sinh hoạt, hoạt động, săn mồi, sinh lý,… của các loài động vật, tôi đƣa ra các thuộc tính đối tƣợng và thuộc tính dữ liệu, từ đó gán giá trị hoặc tạo mối quan hệ giữa lớp động vật và các lớp khác.

Hình 3.12. Các thuộc tính của ontology động vật

- Các thể hiện (Individuals): dựa theo các nghiên cứu trƣớc đây (nhƣ đã trích dẫn trong báo cáo) để chọn lựa các động vật rừng đặc trƣng, quý hiếm của thành phố Đà Nẵng để xây dựng ontology. Chọn đúng lớp (lớp con) trên cây phân cấp lớp động vật mà loài động vật đƣợc xếp vào để tạo các thể hiện cho các lớp đó, dựa vào thông tin mô tả trong các nguồn dữ liệu của loài động vật để gán các thuộc tính phù hợp.

Hình 3.13. Thông tin mô tả của loài khỉ vàng

- Bên cạnh đó, cần thể hiện đƣợc các từ đồng nghĩa khi xây dựng ontology động vật. Ví dụ, thuộc tính trọng lƣợng có thể hiểu là cân nặng, nên khi xác định thuộc tính trọng lƣợng cần gán từ cân nặng vào thuộc tính này. Hoặc lớp ―Động vật có dây sống‖ cũng đƣợc hiểu là ―động vật có xƣơng sống‖,… Phần mềm Protégé thể hiện từ đồng nghĩa bằng ký hiệu ― ‖:

Hình 3.15. Biểu diễn từ đồng nghĩa trong ontology

Ontology động vật đƣợc xây dựng tập trung vào lớp động vật có xƣơng sống, số lớp (bao gồm lớp con - Class) đã xây dựng là 295, số thuộc tính đối tƣợng (Object Property) là 52, số dữ liệu thuộc tính dữ liệu là 73, số loài đã chọn biểu diễn thử nghiệm là 11, số tiên đề trong ontology là 1402. Mỗi loài đƣợc chọn để xây dựng ontology đƣợc thể hiện đầy đủ các thuộc tính, mô tả trong các tài liệu tham khảo, đảm bảo tính đầy đủ và chính xác từ các nguồn tƣ liệu đƣợc sử dụng.

3.4.2. Phần mềm hỗ trợ khai thác và tìm kiếm

Phần mềm hỗ trợ khai thác và tìm kiếm ngữ nghĩa ontology động vật rừng thành phố Đà Nẵng đƣợc cài đặt trên internet, thuận tiện cho công đồng kế thừa, đóng góp và phát triển ontology động vật.

Với việc một cá nhân nghiên cứu và xây dựng ontology có thể xảy ra sự thiếu sót, chƣa chính xác, cũng nhƣ hạn chế trong việc phân tích các thông tin mô tả, từ ngữ chuyên môn trong ngành sinh học. Bên cạnh đó, trong khuôn khổ nghiên cứu này tôi thực hiện mô tả một số loài động vật rừng quý hiếm của thành phố Đà Nẵng, vì vậy còn rất nhiều loài động vật cần đƣợc mô tả và đƣa vào ontology để làm giàu và phong phú dữ liệu hơn nữa. Việc đó cần cộng đồng nhiều cá nhân, tổ chức cùng thực hiện, có thể kế thừa hoặc tìm hiểu hƣớng mới dựa trên hƣớng phân tích tôi đã thực hiện, để ontology động vật rừng thành phố Đà Nẵng ngày càng đầy đủ và hoàn thiện. Từ đó, việc xây dựng ứng dụng khai thác và tìm kiếm ngữ nghĩa càng đƣợc hiệu quả và thiết thực hơn.

a. Trang chủ

Trang chủ hiển thị đầy đủ các chức năng để ngƣời dùng có thể hiểu đƣợc các thành phần trong ontology động vật rừng. Thanh công cụ đƣợc chia thành các mục nhƣ các Lớp (Classes), các Thuộc tính (Properties), các Thể hiện (Individuals). Bên cạnh đó, mục Sự thay đổi các chủ thể (Change by Entity) thể hiện những dự thay đổi, chỉnh sửa đã xảy ra trên ontology động vật này.

Mục các Lớp (Classes): hiển thị danh sách các lớp, đƣợc trình bày trực quang, cụ thể sự phân cấp trong các lớp, đồng thời hiển thị thông tin về lớp đƣợc chọn xem.

Hình 3.16. Trang chủ phần mềm

b. Chức năng phát triển ontology

Bên cạnh việc ngƣời sử dụng có thể khai thác, kế thừa ontology động vật rừng, phần mềm còn cung cấp chức năng hỗ trợ ngƣời sử dụng tiếp tục phát triển ontology động vật này. Với chức năng, chỉnh sửa, xóa và thêm các lớp, các thuộc tính và các loài động vật, đáp ứng đầy đủ yêu cầu về xây dựng ontology.

Hình 3.17. Chức năng thêm và xóa thuộc tính cho thể hiện

Hình 3.19. Chức năng thêm lớp (Class)

Hình 3.20. Chức năng lưu nội dung đã chỉnh sửa

Các chức năng phát triển sẽ hỗ trợ cộng đồng, những ngƣời nghiên cứu về ontology động vật sau này có thể dễ dàng tiếp cận và tiếp tục xây dựng mở rộng không những cho ontology động vật rừng mà còn tất cả động vật, thực vật khác trên địa bàn thành phố Đà Nẵng.

c. Chức năng Tìm kiếm

Dựa vào ontology động vật đã xây dựng, ngƣời dùng có thể tìm kiếm các thực thể trong ontology, các loài động vật đã mô tả, các lớp, các thuộc tính.

Nhập loài động vật cần tìm:

Phần mềm sẽ hiển thị các gợi ý tìm kiếm:

Hình 3.22. Gợi ý tìm kiếm

Ngƣời dùng chọn vào gợi ý mong muốn và thông tin về kết quả sẽ đƣợc hiển thị. Với thông tin về loài động vật, các mô tả ngữ nghĩa đƣợc thể hiện đầy đủ:

Hình 3.24. Kết quả tìm kiếm loài Chà vá chân nâu

Chức năng tìm kiếm trên cây phân cấp lớp cũng đƣợc hỗ trợ để ngƣời sử dụng có thể tìm chính xác lớp con hoặc loài động vật thuộc lớp nào trên cây phân lớp. Trong ví dụ dƣới đây, khi chọn 2 lần vào gợi ý Khỉ thì cây phân lớp tự động xuất hiện lớp con khỉ trong lớp cha Động vật:

3.5. KẾT CHƢƠNG

Dựa trên những nghiên cứu, tìm hiểu ở chƣơng 2, chƣơng này tôi tiến hành đặc tả dữ liệu động vật rừng, tiến hành xây dựng chi tiết ontology động vật rừng và phát triển các chức năng của phần mềm hỗ trợ khai thác, tìm kiếm động vật rừng thành phố Đà Nẵng.

Ontology động vật rừng và phần mềm hỗ trợ khai thác và tìm kiếm đã đƣợc xây dựng và sử dụng, đáp ứng những chức năng cần thiết.

Với thời gian nghiên cứu ngắn và không có sự kế thừa từ nghiên cứu tƣơng tự trƣớc đó, nên việc xây dựng ontology động vật chỉ ở quy mô nhỏ, chƣa thật sự lớn và phong phú. Tuy vậy, nghiên cứu này đã giúp tôi có đƣợc nền tảng kiến thức và thực nghiệm cơ bản, giúp ích cho việc nghiên cứu phát triển luận văn sau này.

KẾT LUẬN VÀ KIẾN NGHỊ Kết quả đạt đƣợc của luận văn

Việc nghiên cứu, ứng dụng semantic web để xây dựng ontology phục vụ tìm kiếm ngữ nghĩa động vật rừng trên địa bàn thành phố Đà Nẵng đã thu đƣợc những kết quả ban đầu, đáng khích lệ, làm nền tảng kiến thức quan trọng cho ngƣời nghiên cứu để tiếp tục nghiên cứu chuyên sâu hơn.

Về mặt lý thuyết, nghiên cứu này đã tìm hiểu đƣợc các nội dung kiến thức cơ bản, nêu đƣợc những nét đặc trƣng, ƣu thế của web semantic. Bên cạnh đó, tìm hiểu đƣợc phƣơng pháp, ngôn ngữ, công cụ hỗ trợ xây dựng ontology, đƣa ra đƣợc phƣơng pháp xây dựng ontology động vật rừng.

Đối với kết quả thực nghiệm, luận văn đã áp dụng kiến thức, phƣơng pháp đã tìm hiểu để xây dựng ontology cho dữ liệu động vật rừng trên địa bàn thành phố Đà Nẵng và xây dựng đƣợc phần mềm để hỗ trợ việc khai thác và tìm kiếm ngữ nghĩa dựa trên ontology động vật đã xây dựng.

Việc phần mềm hỗ trợ khai thác và tìm kiếm ontology động vật rừng trên địa bàn thành phố Đà Nẵng chạy trên internet, giúp cộng đồng có thể tham khảo, thừa kế và tiếp tục phát triển, làm phong phú thêm dữ liệu cho ontology động vật, góp phần phổ biến rộng rãi thông tin về đa dạng sinh học của thành phố Đà Nẵng.

Hạn chế

Bên cạnh kết quả đạt đƣợc thì nghiên cứu vẫn còn những hạn chế, đó là ontology chỉ ở quy mô nhỏ, chƣa thật sự lớn và phong phú. Ta cần phải có đƣợc dữ liệu ontology đầy đủ để đánh giá mức độ xử lý tìm kiếm chính xác cũng nhƣ mức độ đáp ứng đƣợc bao nhiêu ngƣời dùng truy cập ứng dụng cùng một lúc.

thừa và tiếp tục phát triển ontology động vật rừng, chức năng tìm kiếm vẫn còn đơn giản, cần đƣa ra phƣơng pháp tìm kiếm hiệu quả hơn.

Hƣớng phát triển

Trong tƣơng lai luận văn này có thể tiếp tục phát triển để ứng dụng đƣợc vào thực tiễn. Để đạt đƣợc mục đích này cần phải tiếp tục xây dựng và hoàn thiện ontology, làm phong phú dữ liệu các loài động vật. Đồng thời dựa trên kinh nghiệm đã có để phát triển ontology cho thực vật.

Kiến nghị

Để việc nghiên cứu xây dựng và phát triển ontology động vật, cũng nhƣ phần mềm hỗ trợ tìm kiếm ngữ nghĩa động vật ngày càng hoàn thiện và đƣợc ứng dụng vào thực tiễn, tôi kính đề nghị Khoa Tin học – Trƣờng Đại học Sƣ Phạm và Đại học Đà Nẵng tiếp tục quan tâm, hỗ trợ và hƣớng dẫn các sinh viên có hƣớng nghiên cứu tƣơng tự sau này.

Trên đây là toàn bộ nghiên cứu về lý thuyết vào việc xây dựng ontology phục vụ khai thác, tìm kiếm ngữ nghĩa động vật rừng trên địa bàn thành phố Đà Nẵng.

TÀI LIỆU THAM KHẢO Tiếng Việt:

[1] TS. Đinh Thị Phƣơng Anh (1997), Điều tra khu động – thực vật và nhân tố ảnh hưởng, đề xuất phương án bảo tồn hợp lý khu bảo tồn thiên nhiên bán đảo Sơn Trà, Sở Khoa học và Công nghệ thành phố Đà Nẵng.

[2] Nguyễn Quốc Đại (2009), Phương pháp xây dựng hệ thống hỏi đáp tiếng Việt dựa trên ontology, Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội.

[3] Phạm Thanh Hùng (2011), Ứng dụng semantic web để phát triển hệ thống tư vấn việc làm, Luận văn thạc sĩ kỹ thuật, Đại học Đà Nẵng.

[4] Lê Thanh Hƣơng (2011), Ontology và Web ngữ nghĩa, Đại học Bách Khoa Hà Nội.

[5] Lƣơng Đỗ Long (2011), Luận văn thạc sĩ kỹ thuật Ứng dụng Web ngữ nghĩa trong lưu trữ và quản lý các tài liệu số, Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội.

[6] Trần Nguyên Ngọc (2012), Công nghệ XML và Web ngữ nghĩa, Đại học kỹ thuật Lê Quý Đôn.

[7] Thái Tùng Quang, Nguyễn Quang Thành (2005), Luận văn thạc sĩ kỹ thuật Xây dựng hệ thống Elearning cho trường đại học, Đại học Kỹ thuật Công nghệ thành phố Hồ Chí Minh.

[8] Quyết định ban hành đề án số 41/2008/QĐ-UBND, ngày 21 tháng 8 năm 2008 của Ủy ban Nhân dân thành phố Đà Nẵng (2008), Xây dựng Đà Nẵng - Thành phố môi trường, Đà Nẵng.

[9] Sở Nông nghiệp và Phát triển Nông thôn thành phố Đà Nẵng, Báo cáo tài nguyên rừng thành phố Đà Nẵng.

[10] Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009), Giáo trình khai phá dữ liệu Web, Nhà xuất bản Giáo dục Việt Nam.

[11] Trƣờng Đại học Đà Lạt (2008), RDF2, Hệ thống học trực tuyến – Trƣờng Đại học Đà Lạt.

[12] Viện Khoa học và Công nghệ Việt Nam - Bộ Khoa học và Công nghệ (2007), Sách đỏ việt nam, phần I. Động vật, Nhà xuất bản Khoa học tự nhiên và công nghệ, Hà Nội.

Tiếng Anh:

[13] Nicola Guarino, Daniel Oberle, and Steffen Staab, Guarino (2009), What Is an Ontology?

Các website:

[14] Hệ động vật rừng thành phố Đà Nẵng, tác giả Mai Hƣơng, Website Văn phòng thuộc Ban chỉ đạo thành phố Ứng phó biến đổi khí hậu và

nƣớc biển dâng thành phố Đà Nẵng,

http://ccco.danang.gov.vn/98_80_1080/He_dong_vat_rung_thanh_p

ho_Da_Nang.aspx, truy cập ngày 13/10/2015.

[15] Stanford Center for Biomedical Informatics Research,

http://protege.stanford.edu/support.php, ngày truy cập 22/9/2015.

[16] Semantic Web và thư viện số, tác giả Nguyễn Công Nhật, Thƣ viện Quốc gia Việt Nam, http://nlv.gov.vn/nghiep-vu-thu-vien/semantic-web-

va-thu-vien-so.html, truy cập ngày 10/3/2016.

[17] Sinh vật rừng Việt Nam, Tra cứu Động vật rừng Việt Nam,

http://www.vncreatures.net/tracuu.php?loai=1, truy cập từ ngày

Một phần của tài liệu Xây dựng ontology phục vụ tìm kiếm ngữ nghĩa động vật rừng trên địa bàn thành phố đà nẵng (Trang 68)

Tải bản đầy đủ (PDF)

(85 trang)