Nguồn dữ liệu mở rộng với ontology

Một phần của tài liệu TÍCH HỢP THÔNG TIN KHÔNG THUẦN NHẤT VỀ NGỮ NGHĨA TRONG MÔI TRƯỜNG PHÂN TÁN (Trang 38)

Trong phần 2.1.1 và 2.1.2, chúng ta đã trình bày định nghĩa về ontology và phương pháp tích hợp ontology. Phần này chúng ta sẽ trình bày về mối liên hệ giữa các nguồn dữ liệu với các ontology và các phép toán được cho phép bởi các nguồn dữ liệu.

Định nghĩa 7 ([6]): (Hàm chuyển đổi) Một hàm có dạng  12 2:dom( )1 dom( )2

ánh xạ các giá trị của 1 đến các giá trị của 2 được gọi là một hàm chuyển đổi từ

1

sang 2. Tập các hàm chuyển đổi thỏa mãn các điều kiện sau:

Với mọi kiểu  i, j tồn tại nhiều nhất một hàm chuyển đổi  i2 j

Với mọi kiểu  tồn tại  2

Nếu ta có  i2 j và  j2 k thì tồn tại hàm chuyển đổi  i2 k sao cho

2 2 2

i k i j j k

      , trong đó là phép hợp hàm thông thường.

Hàm chuyển đổi cho phép chuyển đổi giá trị từ thuật ngữ này sang thuật ngữ khác giữa các ontology. Trong ví dụ về cơ sở dữ liệu thiết bị xe máy, để chuyển đổi giá trị từ VND sang USD, ta có thể có hàm chuyển đổi VND2USD.

Định nghĩa 8 ([6]): Cho H là một phân cấp và là một kiểu trong phân cấp đó. Khi đó:

 

( ) ' | ' , ' ( )

H H

below     H    dom

biểu diễn tập các giá trị thuộc mức dưới của trong phân cấp H. Biểu diễn này giúp cho việc xác định trật tự của các thuật ngữ trong một ontology.

Định nghĩa 9 ([6]) :(Kiểu bao trùm tối thiểu) Với 1, 2là hai kiểu dữ liệu. Một kiểu dữ liệu được gọi là kiểu bao trùm tối thiểu của  1, 2 nếu

 12  ( là kí kiệu bao trùm )

Ví dụ 2.6:

Xét một ontology biểu diễn lượng mưa.

Ta có Below (Precipitation)H = {Rain,NoPre,Snow,LightRain, ModerateRain,HeavyRain,LightSnow,ModerateSnow,HeavySnow}.

Với X = Snow và Y = ModerateRain thì bao trùm tối thiểu của X và Y là

Precipitation.

Định nghĩa 10 ([6]):(Lược đồ) Cho {A ,A ,...,A }1 2 n là tập các thuộc tính của nguồn dữ liệu D và { , 1 2,..., }n là tập các kiểu dữ liệu tương ứng của các thuộc tính. Tập

1 1 2 2 n n

{A : , A : , ..., A : }   được gọi là lược đồ của nguồn dữ liệu D.

Định nghĩa 11 ([6]): (Tính tương thích, lược đồ chung nhỏ nhất) Hai lược đồ

1 1 1

1 {A : , A :1 1 2 2,..., A :n n }

S     và S2 {A :112, A :2 22,..., A :n n2 } được gọi là tương thích nếu 1

i

i2 có một kiểu chung nhỏ nhất i và tồn tại các hàm chuyển đổi

1

2

i i

   i22 i. Khi đó S {A :11, A :22,..., A :n n } được gọi là lược đồ chung nhỏ nhất.

Tính tương thích chỉ ra rằng nếu các nguồn dữ liệu có các lược đồ là tương thích với nhau thì ta có thể tích hợp các ontology liên quan đến các nguồn dữ liệu đó.

Precipitation

Rain NoPre Snow

Moderate Rain Light Rain Heavy Rain Moderate Snow Light

Snow Heavy Snow

Ví dụ 2.7:

Xét nguồn D1 (dữ liệu về thiết bị xe máy) có lược đồ S1 = {Thiết bị : String, Giá bán : Number, VAT : Number}, và lược đồ S2 = {Thiết bị : String, Giá bán : float, VAT : float}. Ta thấy S1 và S2 là tương thích vì kiểu Number và float có kiểu chung nhỏ nhất là Number. Ngoài ra, tồn tại hàm chuyển đổi Number2Number và float2Number nên lược đồ chung nhỏ nhất là S = {Thiết bị : String, Giá bán : Number, VAT : Number}.

Định nghĩa 12 ([6]): Một bộ ba (D,S,O) được gọi là nguồn dữ liệu mở rộng ontology nếu D là một nguồn dữ liệu (được biểu diễn dưới dạng bảng), O là một ontology, S {A :11, A :2 2,..., A :n n } là một lược đồ nguồn dữ liệu và thỏa mãn các điều kiện sau:

  1, 2,...,nO là các kiểu trong ontology O

DbelowO( )1 belowO( ) ...2  belowO( )n

Một phần của tài liệu TÍCH HỢP THÔNG TIN KHÔNG THUẦN NHẤT VỀ NGỮ NGHĨA TRONG MÔI TRƯỜNG PHÂN TÁN (Trang 38)