Lan truyền chắc chắn đối với các luật có nhiều giả thiết

Một phần của tài liệu Loại bỏ các mẫu tin nhân bản thừa trong cơ sở dữ liệu quan hệ (Trang 33 - 36)

M Ở ĐẦU

1.2.3. Lan truyền chắc chắn đối với các luật có nhiều giả thiết

1.2.3.1.Dấu hiệu không chắc chắn

Các hệ thống dùng luật không chính xác cần có sách thể hiện dấu hiệu

không chắc chắn. Chẳng hạn “hôm nay có thể nắng” là câu có độ không chắc

chắn do “có khả năng …”

Người ta dùng CF với các giá trị từ -1 đến +1 để thể hiện độ tin cậy

trong câu. Chẳng hạn CF(E) = CF(“hôm nay có khả năng nắng”) = 0.6. Tiếp

cận này đã thay xác suất hình thức p(E) bằng CF. Trong bảng các giá trị CF điển hình.

Loại không chắc chắn CF

Không xác định - 1.0

Hầu như không xác định - 0.8 Có khả năng không - 0.6 Có thể không - 0.4 Không biết - 0.2 đến + 0.2 Có thể + 0.4 Có khả năng + 0.6 Hầu như chắc chắn + 0.8 Xác định + 1 Bảng 1.14. Miêu tả các giá trị CF

Các nhân tố chắc chắn không phải là xác suất, mà là các độ đo không hình thức về sự tin tưởng vào một phần dấu hiệu. Chúng thể hiện mức độ mà

người ta tin rằng dấu hiệu là đúng. Để thể hiện độ tin cậy này trong hệ chuyên

gia, người ta viết dưới dạng chính xác và thêm giá trị CF phù hợp. Chẳng hạn

“hôm nay có khả năng sẽ nắng” hoặc “hôm nay sẽ nắng CF = 0.6”.

* Các luật không chắc chắn.

CF dùng cho câu và cho cả các luật để thể hiện dấu hiệu không chắc chắn

giữa dấu hiệu F trong giả thuyết của luật và giả thuyết H trong phần kết luận

của luật. Cấu trúc cơ bản của luật dùng trong mô hình chắc chắn có dạng IF E

THEN H CF(luật), trong đó CF(luật) thể hiện mức độ tin cậy H khi có E. Tức khi đúng thì người ta tin H theo CF(H, E) = CF(luật).

Ví dụ:

Luật: IF có mây xanh cao, E THEN sẽ nắng, H với CF = 0.8 sẽ được

tham chiếu đến bảng miêu tả để hiểu rằng “nếu có mây xanh cao thì hầu như

1.2.3.2. Lan truyền chắc chắn đối với các luật có nhiều giả thuyết.

Trong trường hợp có nhiều giả thuyết, nhân tố chắc chắn đối với kết luận

của luật được lập theo cách tương tự như cách dùng trong hệ thống PROSPECTOR. Như nhóm MYCIN thì người ta giả sử có độc lập điều kiện

của dấu hiệu theo dạng AND hay OR khi xét độ tin cậy vào giả thuyết.

1.2.3.3. Các luật AND

Mô hình chắc chắn dùng các luật có dạng:

IF E1 AND E2 AND … En THEN H CF(luật)

CF( H, E1 AND E2 AND … En) = Min{CF(Ei)}*CF(luật)

Ví dụ:

IF trời tối AND gió mạnh dần THEN sẽ mưa CF = 0.8

Giả thuyết rằng CF(trời tối) = 1.0 và CF(gió mạnh dần) = 0.7 thì CF(sẽ mưa) = min{1.0, 0.7}*0.8 = 0.56; có nghĩa “có khả năng mưa”.

1.2.3.4. Các luật OR

Các luật này trong mô hình có dạng:

IF E1 OR E2 OR … OR En THEN H CF(luật)

CF(E1 OR E2 OR … OR En) = Max{CF(Ei)}*CF(luật)

Ví dụ:

IF trời tối OR gió mạnh dần THEN sẽ mưa CF = 0.9

Giả thuyết rằng CF(trời tối) = 1.0 và CF(gió mạnh dần) = 0.7 thì

CHƯƠNG 2: LOẠI BỎ CÁC MẪU TIN NHÂN BẢN THỪA

Một phần của tài liệu Loại bỏ các mẫu tin nhân bản thừa trong cơ sở dữ liệu quan hệ (Trang 33 - 36)

Tải bản đầy đủ (PDF)

(79 trang)