ONTOLOGY VÀ NGÔN NGỮ OWL

Một phần của tài liệu 28040_1712202001919457LVTranXuanTruong (Trang 37)

7. Tổng quan tài liệu nghiên cứu

1.3. ONTOLOGY VÀ NGÔN NGỮ OWL

1.3.1. Định nghĩa ontology

định nghĩa mô tả rõ nhất bản chất của ontology là: “An ontology is a formal,

explicit specification of a shared conceptualization.” [2] (Một ontology là

một hình thức, đặc tả rõ ràng khái niệm chia sẻ). Trong ngữ cảnh này,

conceptualization (khái niệm hoá) đề cập đến một mô hình trừu tƣợng của một vài hiện tƣợng trong thế giới thực dùng để nhận dạng các khái niệm liên quan đến hiện tƣợng đó. Explicit (rõ ràng) có nghĩa là loại khái niệm đƣợc sử dụng và các ràng buộc khi sử dụng chúng đƣợc xác định một cách rõ ràng, và

formal (hình thức) có nghĩa là máy tính có thể hiểu đƣợc ontology [7].

1.3.2. Các lĩnh vực ứng dụng ontology

Ontology đƣợc ứng dụng vào nhiều lĩnh vực nhƣ: tích hợp thông tin thông minh, các hệ thông thông tin cộng tác, phục hồi thông tin, thƣơng mại điện tử, quản lý tri thức và trong kỹ thuật tri thức, xử lý ngôn ngữ tự nhiên, và biểu diễn tri thức, E-learning, Web Portals Search engines, Các ứng dụng Metadata-driven, Rút trích thông tin, Data Text Web Mining, Information brokering.

1.3.3. Vai trò ontology và web ngữ nghĩa

Hiện tại, các ontology đã ứng dụng vào World Wide Web tạo ra Web ngữ nghĩa. Các cấu trúc ở mức khái niệm dùng xác định một ontology cơ sở cung cấp chìa khoá để máy tính có thể xử lý đƣợc dữ liệu trên Web ngữ nghĩa. Các ontology phục vụ nhƣ các giản đồ siêu dữ liệu, cung cấp khái niệm về từ vựng có thể kiểm soát đƣợc, mỗi ontology đƣợc xác định rõ ràng và máy tính có thể xử lý đƣợc ngữ nghĩa. Bằng cách xác định các nguyên lý trên lĩnh vực chia sẻ và thông thƣờng, các ontology giúp cho ngƣời và máy thông tin một cách chính xác - hỗ trợ việc trao đổi ngữ nghĩa chứ không chỉ cú pháp. Vì vậy sự thành công và phát triển của Web ngữ nghĩa phụ thuộc vào việc cấu trúc các ontology trên lĩnh vực đặc trƣng một cách nhanh chóng và ít tốn kém.

1.3.4. Các thành phần của ontology

Ontology đƣợc sử dụng nhƣ là một biểu mẫu trình bày tri thức về thế giới hay một phần của nó. Ontology thƣờng miêu tả:

 Cá thể: Các đối tƣợng cơ bản, nền tảng.

 Lớp: Các tập hợp, hay kiểu của các đối tƣợng.

 Thuộc tính: Thuộc tính, tính năng, đặc điểm, tính cách, hay các thông số mà các đối tƣợng có và có thể đem ra chia sẻ.

 Mối liên hệ: cách mà các đối tƣợng có thể liên hệ tới một đối tƣợng khác.

Bộ từ vựng ontology đƣợc xây dựng trên cơ sở tầng RDF và RDFS, cung cấp khả năng biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên Web và có khả năng hỗ trợ lập luận.

a. Cá thể (Individuals) – Thể hiện

Cá thể là thành phần cơ bản của một ontology. Các cá thể trong một ontology có thể bao gồm các đối tƣợng rời rạc nhƣ xe, con cọp…, cũng nhƣ các đối tƣợng trừu tƣợng nhƣ con số và từ.

b. Lớp (Classes) - Khái niệm

Lớp là những nhóm, bộ hoặc tập hợp các đối tƣợng. Một lớp có thể gộp nhiều lớp hoặc đƣợc gộp vào lớp khác. Một lớp gộp vào lớp khác đƣợc gọi là lớp con của lớp gộp. Điều quan trọng của quan hệ xếp gộp là tính kế thừa.

c. Thuộc tính (Properties)

Các đối tƣợng trong ontology có thể đƣợc mô tả thông qua việc khai báo các thuộc tính của chúng. Mỗi một thuộc tính đều có tên và giá trị của thuộc tính đó. Các thuộc tính đƣợc sử dụng để lƣu trữ các thông tin mà đối tƣợng có thể có. Ví dụ, đối với một cá nhân có thể có các thuộc tính: Họ_tên, ngày_sinh, quê_quán, số_cmnd… Giá trị của một thuộc tính có thể có các kiểu dữ liệu phức tạp.

d. Mối quan hệ (Relation)

Quan hệ giữa các đối tƣợng trong một ontology cho biết các đối tƣợng liên hệ với đối tƣợng khác nhƣ thế nào. Sức mạnh của ontolgy nằm ở khả năng diễn đạt quan hệ. Tập hợp các quan hệ cùng nhau mô tả ngữ nghĩa của domain. Tập các dạng quan hệ đƣợc sử dụng và cây phân loại thứ bậc của chúng thể hiện sức mạnh diễn đạt của ngôn ngữ dùng để biểu diễn ontology.

Ontology thƣờng phân biệt các nhóm quan hệ khác nhau. Ví dụ:

 Quan hệ giữa các lớp

 Quan hệ giữa các thực thể

 Quan hệ giữa một thực thể và một lớp

 Quan hệ giữa một đối tƣợng đơn và một tập hợp

 Quan hệ giữa các tập hợp [2], [4], [6], [7].

1.3.5. Ngôn ngữ OWL

OWL (The Web Ontology Language) là một ngôn ngữ gần nhƣ XML dùng để mô tả các hệ cơ sở tri thức. OWL là một ngôn ngữ đánh dấu dùng để xuất bản và chia sẻ dữ liệu trên Internet thông qua những mô hình dữ liệu gọi là ―ontology‖. Ontology mô tả một lĩnh vực (domain) và diễn tả những đối tƣợng trong lĩnh vực đó cùng những mối quan hệ giữa các đối tƣợng này. OWL là phần mở rộng về từ vựng của RDF và đƣợc kế thừa từ ngôn ngữ DAML+OIL Web ontology – một dự án đƣợc hỗ trợ bởi W3C. OWL biểu diễn ý nghĩa của các thuật ngữ trong các từ vựng và mối liên hệ giữa các thuật ngữ này để đảm bảo phù hợp với quá trình xử lý bởi các phần mềm.

OWL đƣợc xem nhƣ là một kỹ thuật trọng yếu để cài đặt cho Web ngữ nghĩa trong tƣơng lai. OWL đƣợc thiết kế đặc biệt để cung cấp một cách thức thông dụng trong việc xử lý nội dung thông tin của Web. Ngôn ngữ này đƣợc kỳ vọng rằng sẽ cho phép các hệ thống máy tính có thể đọc đƣợc thay thế cho con ngƣời. Vì OWL đƣợc viết bởi XML, các thông tin OWL có thể dễ dàng

trao đổi giữa các kiểu hệ thống máy tính khác nhau, sử dụng các hệ điều hành và các ngôn ngữ ứng dụng khác nhau. Mục đích chính của OWL là sẽ cung cấp các chuẩn để tạo ra một nền tảng để quản lý tài sản, tích hợp mức doanh nghiệp và để chia sẻ cũng nhƣ tái sử dụng dữ liệu trên Web. OWL đƣợc phát triển bởi nó có nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa hơn so với XML, RDF và RDFS, và vì OWL ra đời sau các ngôn ngữ này, nó có khả năng biểu diễn các nội dung mà máy có thể biểu diễn đƣợc trên Web.

Các phiên bản của OWL: Hiện nay có ba loại OWL : OWL Lite, OWL DL (description logic), và OWL Full.

OWL Lite: hỗ trợ cho những ngƣời dùng chủ yếu cần sự phân lớp theo thứ bậc và các ràng buộc đơn giản. Ví dụ: Trong khi nó hỗ trợ các ràng buộc về tập hợp, nó chỉ cho phép tập hợp giá trị của 0 hay 1. Điều này cho phép cung cấp các công cụ hỗ trợ OWL Lite dễ dàng hơn so với các bản khác.

OWL DL (OWL Description Logic): hỗ trợ cho những ngƣời dùng cần sự diễn cảm tối đa trong khi cần duy trì tính tính toán toàn vẹn (tất cả các kết luận phải đƣợc đảm bảo để tính toán) và tính quyết định (tất cả các tính toán sẽ kết thúc trong khoảng thời gian hạn chế). OWL DL bao gồm tất cả các cấu trúc của ngôn ngữ OWL, nhƣng chúng chỉ có thể đƣợc sử dụng với những hạn chế nào đó (Ví dụ: Trong khi một lớp có thể là một lớp con của rất nhiều lớp, một lớp không thể là một thể hiện của một lớp khác). OWL DL cũng đƣợc chỉ định theo sự tƣơng ứng với logic mô tả, một lĩnh vực nghiên cứu trong logic đã tạo nên sự thiết lập chính thức của OWL.

OWL Full muốn đề cập tới những ngƣời dùng cần sự diễn cảm tối đa và sự tự do của RDF mà không cần đảm bảo sự tính toán của các biểu thức. Ví dụ, trong OWL Full, một lớp có thể đƣợc xem xét đồng thời

nhƣ là một tập của các cá thể và nhƣ là một cá thể trong chính bản thân nó. OWL Full cho phép một ontology gia cố thêm ý nghiã của các từ vựng đƣợc định nghĩa trƣớc (RDF hoặc OWL).

Các phiên bản này tách biệt về các tiện ích khác nhau, OWL Lite là phiên bản dễ hiểu nhất và phức tạp nhất là OWL Full.

Mối liên hệ giữa các ngôn ngữ con của OWL:

 Mọi ontology hợp lệ dựa trên OWL Lite đều là ontology hợp lệ trên OWL DL;

 Mọi ontology hợp lệ dựa trên OWL DL đều là ontology hợp lệ trên OWL Full;

 Mọi kết luận hợp lệ dựa trên OWL Lite đều là kết luận hợp lệ trên OWL DL;

 Mọi kết luận hợp lệ dựa trên OWL DL đều là kết luận hợp lệ trên OWL Full.

1.3.6. Hệ truy vấn SPARQL

SPARQL là một ngôn ngữ để truy cập thông tin từ các đồ thị RDF/OWL. SPARQL cung cấp các tính năng sau: trích thông tin trong các dạng của URI, các nút trống hay giá trị nguyên thủy hoặc các kiểu đƣợc định nghĩa từ các giá trị nguyên thủy, trích thông tin từ các đồ thị con và xây dựng một đồ thị RDF mới dựa trên thông tin trong đồ thị truy vấn.

a. Cú pháp của câu truy vấn

Các giá trị đƣợc đặt trong dấu ―<>‖ dùng để chỉ một định danh URI. Các giá trị đƣợc đặt trong dấu (― ‖) là các giá trị literal.

Biến trong ngôn ngữ truy vấn có giá trị toàn cục. Biến thƣờng bắt đầu với kí tự ―?‖ hay kí tự ―$‖. SPARQL cung cấp một cơ chế viết tắt. Tiếp đầu ngữ (prefix) có thể đƣợc định nghĩa và một QName sẽ cung cấp một dạng viết làm cho URI có thể ngắn gọn.

Sau đây là một cách viết tắt cho triple pattern: PREFIX dc: <http:purl.orgdcelements1.1>

SELECT ?title WHERE{<http:example.orgbookbook1>dc:title?title} Ta có thể sử dụng một cách viết tắt:

PREFIX dc: <http:purl.orgdcelements1.1> PREFIX : <http:example.orgbook>

SELECT $title WHERE { :book1 dc:title $title }

b. Tạo một câu truy vấn đơn giản

Một câu truy vấn bao gồm 2 mệnh đề, mệnh đề SELECT và mệnh đề WHERE. Mệnh đề SELECT định danh các biến mà ứng dụng quan tâm và mệnh đề WHERE bao gồm các triple pattern. Một triple pattern là một RDF triple nhƣng mỗi thành phần (subject, predicate hay object) đều có thể là một biến truy vấn. Một basic graph pattern là một tập các triple pattern.

Ngôn ngữ SPARQL dựa trên nền tảng so sánh các graph pattern. Graph pattern đơn giản nhất là các triple pattern. Một câu truy vấn có thể có hoặc không, một hay nhiều kết quả.

Ví dụ : Ta có một RDF triple sau: <http:example.orgbookbook1 > <http:purl.orgdcelements1.1title> "SPARQL Tutorial" . Câu truy vấn SELECT ?title WHERE{<http:example.orgbookbook1> <http:purl.orgdcelements1.1title> ?title } Kết quả truy vấn Title "SPARQL Tutorial".

1.4. ĐỘNG VẬT RỪNG TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG 1.4.1. Giới thiệu

Rừng Đà Nẵng đƣợc coi là ―lá phổi của thành phố‖, bên cạnh ý nghĩa kinh tế, rừng còn có ý nghĩa phục vụ nghiên cứu khoa học, bảo vệ môi trƣờng sinh thái và phát triển du lịch. Thiên nhiên đã ƣu đãi ban cho thành phố các khu bảo tồn thiên nhiên đặc sắc nhƣ: Khu bảo tồn thiên nhiên Bà Nà, Khu bảo tồn thiên nhiên Sơn Trà và Khu văn hóa lịch sử môi trƣờng Nam Hải Vân.

Rừng tự nhiên của Đà Nẵng thuộc kiểu rừng kín xanh, mƣa ẩm nhiệt đới núi thấp và á nhiệt đới núi cao, trong đó rừng mƣa nhiệt đới núi thấp chiếm phần lớn diện tích với trạng thái rừng từ loại IIB đến IVB.

Hệ động vật rừng của Đà Nẵng đặc trƣng cho khu hệ động vật Nam Trƣờng Sơn với các loài Voọc vá, Khỉ đuôi dài, Chồn dơi, Sóc vàng, Trĩ sao, Gà lôi và các loài thuộc khu hệ động vật Bắc Trƣờng Sơn: Tê tê, Gà tiền, Khỉ vàng. Mặc dù sự phân bố loài không đồng đều trong các lớp động vật nhƣng thành phần thì đa dạng, đặc biệt là nguồn gen các loài quý hiếm nhƣ: Gấu, Beo lửa, Mèo rừng, Cu ly, Vọoc vá Chân nâu, Trĩ sao, Công, Gà tiền, Gà lôi lam, Mang Trƣờng Sơn và một số loài bò sát, lƣỡng cƣ quý khác.

1.4.2. Cấu trúc, thành phần loài động vật

Các loài này phân bố số loài không đồng đều trong các lớp động vật, nhƣng có thành phần loài đa dạng, đặc biệt là nguồn gen các loài quý hiếm nhƣ: Gấu, Beo lửa, Mèo rừng, Sóc bay, Chồn dơi, Cầy mực, Cu li, Voọc vá chân nâu, khỉ vàng, Trĩ sao, Công, Gà tiền, Gà lôi lam, Mang trƣờng sơn, Rái cá, Dơi chó tai ngắn và một số loài bò sát, lƣỡng cƣ khác.

Bảng 1.1. Phân bố thành phần loài động vật

TT Đơn vị thống kê Sông Bắc-Sông Nam Sơn Trà Bà Nà

1 Số Bộ 23 25 26

2 Số Họ 60 64 80

3 Số Loài 205 135 256

4 Loài quý hiếm

(Sách đỏ Việt Nam) 34 15 44

Phân bố các Taxon trong 3 lớp động vật có xƣơng sống ở cạn cho thấy sự khác nhau và phân bố không đồng đều.

Bảng 1.2. Phân bố 3 lớp động vật: thú, chim, bò sát TT Lớp Bộ Họ Loài Sông Bắc- Sông Nam Sơn Trà Sông Bắc- Sông Nam Sơn Trà Sông Bắc- Sông Nam Sơn Trà 1 Thú 9 8 8 23 18 26 55 36 61 2 Chim 14 15 16 37 34 46 150 106 178 3 Bò sát 2 2 2 4 8 8 9 24 17 Tổng số 25 25 26 64 64 80 214 165 256

Kết quả điều tra gần đây đã ghi nhận Đà Nẵng có các quần thể thú Linh trƣởng khá cao và tập trung chủ yếu ở 2 khu Bảo tồn thiên nhiên Sơn Trà và Bà Nà-Núi Chúa gồm các lòai Voọc vá chân nâu, Cu li, Khỉ mặt đỏ, Khỉ đuôi dài, Khỉ vàng.

những loài linh trƣởng đặc hữu quý hiếm của Việt Nam và Lào, đã đƣợc ghi nhận có ở bán đảo Sơn Trà qua điều tra, nghiên cứu của Van Peenen năm 1969, Louis Lippold năm 1973 và 1995, Đinh Thị Phƣơng Anh [1] và trong 4 năm 2007-2010, Vũ Ngọc Thành đã phát hiện, theo dõi và thống kê hiện có ít nhất 18 đàn với số lƣợng trên 300 cá thể. Đây là một trong số ít khu vực, nếu không nói là duy nhất ở Việt Nam có mật độ cá thể Vọoc vá chân nâu ở mức cao 4-5 cá thể/km2.

Đồng thời ở Khu Bảo tồn thiên nhiên Sơn Trà, TS.Vũ Ngọc Thành đã ghi nhận đƣợc loài Thằn lằn giả bốn vạch (Cyrtodactylus pseudoquadrivirgatus) thuộc họ Tắc kè (Gekkonidae) - một loài mới cho khoa học lần đầu tiên thu đƣợc mẫu ở vùng A Lƣới tỉnh Thừa Thiên Huế, công bố vào năm 2008 và lần thứ hai tìm thấy ở bán đảo Sơn Trà.

Danh mục động vật rừng cần đƣợc ƣu tiên bảo tồn trên địa bàn thành phố trong giai đoạn 2014-2020 bao gồm các loài động vật rừng nguy cấp, quý, hiếm và các loài động vật rừng thông thƣờng nhƣng có giá trị về kinh tế, môi trƣờng điển hình:

- Số lƣợng loài động vật rừng nguy cấp, quý, hiếm: 75 loài.

- Số lƣợng loài động vật rừng thông thƣờng nhƣng có giá trị về kinh tế, môi trƣờng. Tổng số: 21 loài.

(Nguồn trích dẫn: Báo cáo tài nguyên rừng thành phố Đà Nẵng, Sở Nông nghiệp và Phát triển Nông thôn) [14].

1.4.3. Cấu trúc, thành phần loài con trùng

Qua điều tra khảo sát đã thống kê đƣợc cấu trúc thành phần loài của côn trùng phổ biến ở Sơn Trà:

Bảng 1.3. Cấu trúc thành phần loài của côn trùng phổ biến ở Sơn Trà

TT Đơn vị thống kê Sông Bắc-Sông

Nam

Sơn Trà

1 Bộ Cánh diều - ISOPTERA 1 2

2 Bộ Chuồn chuồn – ODONATA 2 4

3 Bộ Bọ ngựa - MANTOIDEA 1 2 4 Bộ Gián - BLATTODEA 1 2 5 Bộ Cánh thẳng - ORTHOPTERA 4 10 6 Bộ Cánh nửa – HEMIPTERA 4 27 7 Bộ Cánh cứng – COLEOPTERA 5 20 8 Bộ Cánh úp – HOPLECOPTERA 1 2 9 Bộ Cánh phấn – LEPIDOPTERA 3 26 10 Bộ Cánh màng – HYMENOPTERA 2 5 11 Bộ Cánh – NEUROPTERA 1 1 12 Bộ Hai cánh – DIPTERA 1 1

Từ bảng trên cho thấy côn trùng phổ biến ở Sơn Trà gồm 12 bộ, thuộ 26 họ của 113 loài, trong đó có 5 loài thuộc nguồn gen quý hiếm.

Danh sách những loài côn trùng quý hiếm ở Sơn Trà: 1. Bọ ngựa (Mantis religiosa L.);

2. Bƣớm phƣợng cánh sau vàng (Troides andromache); 3. Bƣớm phƣợng đuôi kiếm (Pathyas antiphates); 4. Bƣớm phƣợng đốm vàng (Zetides bathycles); 5. Bƣớm phƣợng đen đuôi vàng (Leptocircus curius);

Năm loài Bƣớm kể trên ở nƣớc ta hiện nay rất hiếm, đang có nguy cơ

Một phần của tài liệu 28040_1712202001919457LVTranXuanTruong (Trang 37)

Tải bản đầy đủ (PDF)

(85 trang)