Các bộ dữ liệu đối với quan hệ NGƯỜI

Một phần của tài liệu (LUẬN văn THẠC sĩ) lý thuyết chuẩn hóa của cơ sở dữ liệu mờ và ngôn ngữ SQL mờ luận văn ths công nghệ thông tin 1 01 10 (Trang 36 - 38)

Sự phù hợp đối với thuộc tính THU NHẬP cho các bộ t2 và t3 được tính như sau:

C(Thu nhập[t2, t3]) = min{min {max {s(thấp, thấp )}, max{s(trung bình, thấp)}}, min {max{s( thấp, thấp), s( thấp, trung bình)}}}

= min {min {max{1}, max{0.2}}, min {max{1,0.2}}} = min {min {1, 0.2}, min {1}}

= min {0.2, 1} = 0.2

Trong mơ hình dữ liệu quan hệ truyền thống, cả d1 và d2 là tập một phần tử, và quan hệ tương tự giữa bất cứ bộ nào chỉ có thể là 0 hoặc 1. Ở đây, quan hệ đồng nhất được thay thế bởi mô tả s(x, y) mà quan hệ đồng nhất là một trường hợp đặc biệt. Để mô tả sự gần nhau giữa 2 bộ trên một tập các thuộc tính, định nghĩa về sự phù hợp được mở rộng trong tài liệu tham khảo [30] như sau:

Định nghĩa 2.3. Sự phù hợp của tập thuộc tính X cho bất kỳ 2 bộ t1 và t2 trong

C ( X [t1, t2] ) = minAk∈X {C( Ak [t1, t2] )}.

2.2.1.2. Sự phù hợp với độ đo khả năng

Mơ hình quan hệ dựa trên quan hệ tương tự cho phép giá trị tại mỗi thuộc tính là đa trị (một tập giá trị có thể) và có một quan hệ tương tự giữa các giá trị thuộc tính được định nghĩa trên miền trị thuộc tính. Tuy nhiên trên thực tế dữ liệu thường có một độ chắc chắn thể hiện khả năng có thể xảy ra của dữ liệu. Trong mơ hình dựa trên lý thuyết khả năng, mỗi giá trị của thuộc tính thường được gắn với một độ đo khả năng thể hiện khả năng có thể xảy ra của dữ liệu đó. Trong mơ hình dựa trên quan hệ tương tự, mặc dù cho phép một tập các giá trị có thể tại mỗi thuộc tính nhưng nó khơng thể hiện được độ chắc chắn xảy ra của mỗi giá trị đó. Để khắc phục, người ta thường kết hợp độ đo khả năng của dữ liệu trong lý thuyết khả năng vào mơ hình dựa trên quan hệ tương tự. Lúc này, mỗi giá trị trong mơ hình dựa trên quan hệ tương tự sẽ được gắn thêm một độ đo khả năng thể hiện khả năng có thể xảy ra của giá trị đó. Độ đo khả năng này là một số thực nằm trong đoạn [0, 1].

Giả sử F là một tập giá trị trên một thuộc tính. F có khn dạng như sau: F= {FPi | labelFi} với i=1,2,....N

Trong đó, LabelFi là giá trị (nhãn ngơn ngữ). FPi là các độ đo khả năng xảy ra của giá trị, FPi nằm trong đoạn [0, 1]. N là số lượng các cặp {FPi | labelFi}, N≥1.

Ví dụ 2.2. Với quan hệ mờ NGƯỜI = (TÊN, NĂNG LỰC, THU NHẬP) được

định nghĩa bởi ví dụ 2.1.

Theo định nghĩa mới, thuộc tính NĂNG LỰC sẽ có giá trị {0.8|kém,

0.3|rất kém}, nghĩa là giá trị kém có khả năng xảy ra cao hơn giá trị rất kém vì

Trên cơ sở định nghĩa mới về các bộ dữ liệu, luận văn đề xuất một định nghĩa mới về sự phù hợp giữa các bộ dữ liệu như sau:

Định nghĩa 2.4. Sự phù hợp của thuộc tính Ak được định nghĩa trên miền trị

Dk cho bất kỳ 2 bộ t1 và t2 trong quan hệ r, ký hiệu bởi C( Ak [t1, t2] )

C(Ak[t1,t2]) = maxx∈d1{maxy∈d2{min {s(x,y),degx,degy}}},

trong đó d1 là tập giá trị của thuộc tính Ak đối với bộ t1, d2 là tập giá trị của thuộc tính Ak đối với bộ t2, s(x, y) là một quan hệ tương tự giữa giá trị x và y, và s là một ánh xạ của mọi cặp phần tử trong miền Dk vào đoạn [0, 1],

degx là độ đo khả năng xảy ra của giá trị x, degy là độ đo khả năng xảy ra của

giá trị y.

Độ phù hợp mới giữa hai giá trị được xây dựng dựa trên các tiêu chí về quan hệ tương tự và độ đo khả năng xảy ra của dữ liệu.

Ví dụ 2.3. Với quan hệ mờ NGƯỜI = (TÊN, NĂNG LỰC, THU NHẬP)

được định nghĩa bởi ví dụ 2.1. Lúc này các bộ dữ liệu mới đối với quan hệ

NGƯỜI được định nghĩa như sau:

TÊN NĂNG LỰC THU NHẬP

d1 {Nam} {0.8/kém, 0.3/rất kém} {0.9/rất thấp} d2 {Quang} {0.9/trung bình} {0.8/thấp,0.3/trung bình} d3 {Hùng} {0.3/trung bình, 0.9/ tốt} {0.9/thấp}

d4 {Hà} {0.8/trung bình} {0.8/rất thấp}

Một phần của tài liệu (LUẬN văn THẠC sĩ) lý thuyết chuẩn hóa của cơ sở dữ liệu mờ và ngôn ngữ SQL mờ luận văn ths công nghệ thông tin 1 01 10 (Trang 36 - 38)

Tải bản đầy đủ (PDF)

(105 trang)