Phân cấp trên S chính là biểu đồ Hasse nhằm biểu diễn thứ tự bộ phận trong một miền nào đó. Do đó, trong các ví dụ sau chúng ta thường xem phân cấp như là đồ

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tích hợp thông tin không thuần nhất về ngữ nghĩa trong môi trường phân tán Luận văn ThS Công nghệ thông tin 1 01 10 (Trang 35 - 39)

VÀ PHÂN LỚP DỮ LIỆU PHÂN TÁN

Chương 2 ONTOLOGY TRONG TÍCH HỢP THÔNG TIN

S. Phân cấp trên S chính là biểu đồ Hasse nhằm biểu diễn thứ tự bộ phận trong một miền nào đó. Do đó, trong các ví dụ sau chúng ta thường xem phân cấp như là đồ

Ví dụ 2.3: Xét tập S = {Phanh đĩa, Xe máy, Hộp dầu} với một thứ tự bộ phận phản ánh quan hệ “part-of ” nói rằng Phanh đĩa là một phần (part-of) của Xe máy , Hộp dầu là một phần (part-of) của Xe máy , và Hộp dầu là một phần (part-of) của Phanh đĩa . Hơn nữa, mọi cái là thành phần (part-of) của chính nó.

Như vậy, quan hệ “part-of”, kí hiệu là  có thể được biểu diễn bởi tập sau (S,) = {(Phanh đĩa, Phanh đĩa),(Xe máy, Xe máy), (Hộp dầu, Hộp dầu),(Phanh đĩa, Xe máy),(Hộp dầu, Phanh đĩa),(Hộp dầu, Xe máy)} . Phân cấp tương ứng sẽ là: {(Phanh đĩa, Xe máy),(Hộp dầu, Phanh đĩa)}.

Ví dụ 2.4: Xét cơ sở dữ liệu về bảo hiểm với  = {is-a}. S 1 là tập các khái niệm trong bảng 2.3 và S 2 là tập các khái niệm trong bảng 2.4. Các ontology liên quan đến các bảng dữ liệu được biểu diễn như sau:

2.1.2.3 Tích hợp các ontology

Để có thể tích hợp được các ontology ta cần hiểu được mối quan hệ giữa các thuật ngữ trong cùng một ontology và các thuật ngữ thuộc các ontology khác nhau.

Do vậy, chúng ta cần mô tả mối quan hệ giữa các khái niệm trong hai phân cấp.

Định nghĩa 5 ([6]): (Ràng buộc tương tác) Cho (H i , i ), 1 i n là n phân cấp khác nhau và i j. Khi đó (x : i = y : j ) hoặc ( x : i y : j ) hoặc ( x : i y : j ) hoặc ( x : i y : j ) được gọi là các ràng buộc tương tác.

Ràng buộc tương tác là sự đối sánh của một khái niệm trong quan hệ này với khái niệm trong quan hệ khác. Trong bài toán quản lí các thiết bị xe máy, Lốp sau:1 = Lốp 2.75:2 chỉ ra rằng Lốp sau ở trong quan hệ D1 và Lốp 2.75 ở trong D2 cùng chỉ một loại thiết bị.

Định nghĩa 6 ([6]): ( Tích hợp ) Cho (H i , i ), 1 i n là n phân cấp khác nhau và IC là một tập hữu hạn các ràng buộc tương tác. Một phân cấp (H, ) được gọi là tích hợp của (H i , i ), 1 i n , nếu và chỉ nếu có n ánh xạ 1 , …, n từ các tập H 1 ,…, H n tương ứng vào tập H sao cho các điều kiện sau thỏa mãn:

1. (   i  1,..., n  ), xi y   i ( ) x  ( ).  i y ( bảo toàn thứ tự )

is-a is-a

Theft

Burglary Mugging Arson

Hình 2.2. Ontology liên quan đến bảng dữ liệu Claims 1

is-a

Robbery

Burglary Auto_accident Fire

Hình 2.3. Ontology liên quan đến bảng dữ liệu Claims 2

2. (   x H i )(   y H j ), ( : x i op y j : )  IC   i ( ) x opj ( ). y (bảo toàn ràng buộc tương tác). Trong đó op là một trong các phép toán

=,    , ,

 

Như vậy, tích hợp hai phân cấp sẽ cho ta một phân cấp mới và mỗi phần tử của phân cấp mới nhất thiết đã được liên kết với các phần tử của các phân cấp ban đầu. Thông thường, khi tích hợp hai phân cấp ta dựa trên các ràng buộc tương tác.

Các ràng buộc tương tác cho phép chúng ta xây dựng được các ánh xạ giữa các phần tử thuộc các phân cấp khác nhau.

Ví dụ 2.5 : Tích hợp hai phân cấp biểu diễn ở hình 2.2 và 2.3 dựa trên các ràng buộc tương tác Theft:1 = Robbery:2 và Arson:1 is-a Fire:2 . Phân cấp tích hợp bao gồm các khái niệm Theft, Burglary , Mugging , Arson , Auto_accident , Fire và các ánh xạ hỗ trợ tích hợp được xác định trong bảng 2.5:

 1  2

Burglary Burglary Robbery Robbery

Theft Theft Fire Fire

Mugging Mugging Auto_accident Auto_accident Arson Arson Burglary Burglary

Bảng 2.3 Các ánh xạ hỗ trợ tích hợp các ontology

Theft

Burglary Mugging Arson

Hình 2.4. Ontology tích hợp Claims 1 và Claims 2

Fire Auto_accident

2.1.3 Nguồn dữ liệu mở rộng với ontology

Trong phần 2.1.1 và 2.1.2, chúng ta đã trình bày định nghĩa về ontology và phương pháp tích hợp ontology. Phần này chúng ta sẽ trình bày về mối liên hệ giữa các nguồn dữ liệu với các ontology và các phép toán được cho phép bởi các nguồn dữ liệu.

Định nghĩa 7 ([6]): (Hàm chuyển đổi) Một hàm có dạng   1 2 2 : dom ( )  1  dom ( )  2 ánh xạ các giá trị của  1 đến các giá trị của  2 được gọi là một hàm chuyển đổi từ

 1 sang  2 . Tập các hàm chuyển đổi thỏa mãn các điều kiện sau:

Với mọi kiểu   i , j   tồn tại nhiều nhất một hàm chuyển đổi   i 2 j

Với mọi kiểu    tồn tại   2

Nếu ta có   i 2 j   j 2 k thì tồn tại hàm chuyển đổi   i 2 k sao cho

2 2 2

i k i j j k

        , trong đó là phép hợp hàm thông thường.

Hàm chuyển đổi cho phép chuyển đổi giá trị từ thuật ngữ này sang thuật ngữ khác giữa các ontology. Trong ví dụ về cơ sở dữ liệu thiết bị xe máy, để chuyển đổi giá trị từ VND sang USD , ta có thể có hàm chuyển đổi VND2USD .

Định nghĩa 8 ([6]): Cho H là một phân cấp và là một kiểu trong phân cấp đó.

Khi đó:

 

( ) ' | ' , ' ( )

H H

below      H     dom

biểu diễn tập các giá trị thuộc mức dưới của trong phân cấp H. Biểu diễn này giúp cho việc xác định trật tự của các thuật ngữ trong một ontology.

Định nghĩa 9 ([6]) : (Kiểu bao trùm tối thiểu) Với   1 , 2 là hai kiểu dữ liệu. Một kiểu dữ liệu được gọi là kiểu bao trùm tối thiểu của   1 , 2 nếu

  1    2   ( là kí kiệu bao trùm )

Ví dụ 2.6:

Xét một ontology biểu diễn lượng mưa.

Ta có Below (Precipitation) = {Rain,NoPre,Snow,LightRain, H ModerateRain,HeavyRain,LightSnow,ModerateSnow,HeavySnow}.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Tích hợp thông tin không thuần nhất về ngữ nghĩa trong môi trường phân tán Luận văn ThS Công nghệ thông tin 1 01 10 (Trang 35 - 39)

Tải bản đầy đủ (PDF)

(100 trang)