Lan truyền chắc chắn

a. Lan truyền chắc chắn đối với các luật có giả thiết đơn

Lan truyền nhân tố chắc chắn liên quan việc thiết lập mức độ tin cậy vào kết luận của luật trong trƣờng hợp dấu hiệu trong giả thiết là không chắc chắn. Đối với luật có phần giả thiết đơn, ta tính CF(H,E) = CF(E) * CF(luật).

Ví dụ 2.3: theo ví dụ trên nếu CF(E) = 0.5 thì CF(H,E) = 0.5*0.8 = 0.4. Điều này có nghĩa là “ có thể mƣa”

b. Lan truyền chắc chắn đối với các luật có nhiều giả thiết

Trong trƣờng hợp có nhiều giả thiết, nhân tố chắc chắn đối với kết luận của luật đƣợc thiết lập theo cách tƣơng tự nhƣ cách dùng trong hệ thống

PROSSPECTOR. Nhƣ nhóm MYCIN thì ngƣời ta giả sử có độc lập điều kiện của dấu hiệu theo dạng AND hay OR khi xét độ tin cậy vào giả thuyết.

Các luật AND

Mô hình chắc chắn dùng các luật có dạng: IF E1 AND E2 AND ... En THEN H CF(luật)

CF(H,E1 AND E2 AND... AND En) = min {CF(Ei)} * CF(luật)

Các luật OR

Các luật trong mô hình này có dạng:

IF E1 OR E2 OR ... OR En THEN H CF(luật)

CF(E1 OR E2 OR... OR En) = max{CF (Ei)} * CF(luật)

c. Lan truyền chắc chắn đối với các luật cùng kết luận

Trong một vài ứng dụng ngƣời ta viết thành nhiều luật về cùng một kết luận. Chẳng hạn để tin rằng trời sắp mƣa, ngƣời ta căn cứ vào ý kiến của nhà dự báo khí tƣợng hay nông dân.

Luật 1: IF “nhà dự báo nói sắp mƣa”, E1 THEN “Sắp mƣa”, H với CF(luật 1) = 0.8 Luật 2: IF “nông dân nói sắp mƣa”, E2 THEN “Sắp mƣa”, H với CF(luật 2) = 0.8 Hai luật dựa trên hai nguồn, có cùng giá trị CF. Về tâm lý, khi có nhiều nguồn khẳng định một kết luận, ngƣời ta sẽ cảm thấy tin tƣởng hơn, chẳng hạn tin hơn vào trời sẽ mƣa nếu đƣợc khẳng định của cả dự báo thời tiết và nông dân. Nhóm MYCIN dùng ý tƣởng này trong kỹ thuật “dấu hiệu thu thập nhiều lên” để kết hợp các giá trị tin cậy và phản bác của các luật về cùng một kết luận.

Chẳng hạn:

Luật 1: IF E1 THEN H và Luật 2: IF E2 THEN H

Dạng nguyên bản của đẳng thức dùng trong kỹ thuật này do Shortliffe và Bachanan đƣa ra năm 1975 là:

MB(H, E1 &E2) =0 nếu MD (H, E1 & E2) =1 hoặc

MB(H, E1 &E2) = MB(H, E1)+ MB(H, E2)*(1 - MB(H, E1)) nếu ngƣợc lại MD(H, E1 &E2) =0 nếu MB (H, E1 & E2) =1 hoặc

MD(H, E1 &E2) = MD(H, E1)+ MD(H, E2)*(1 - MD(H, E1)) nếu ngƣợc lại Các khẳng định rằng các dấu hiệu bổ sung E2 sẽ làm tăng các giá trị do dấu hiệu E1 xác định. Các MD và MB đƣợc cập nhật sẽ cho phép tính nhân tố tin cậy theo CF = MB-MD.

Trong một vài ứng dụng, nên tính đến MD và MB nhƣ các trợ giúp khi có thêm thông tin. Nhƣng trong vài ứng dụng khác, chỉ quản lý một bản ghi về giá trị CF đƣợc cập nhật. Đối với các ứng dụng này, ngƣời ta có thể dùng các đẳng thức:

CFkết hợp = CF1 + CF2 (1-CF1) khi cả hai CFi là dƣơng; CFkết hợp = CF1 + CF2 (1+CF1) khi cả hai CFi là âm và CFkết hợp = CF1 + CF2 /(1-min{|CF1|, |CF2|})

Các đẳng thức tính MD, MB, CF trong mô hình chắc chắn có thuộc tính hoán đổi, tiệm cận.

Hoán đổi

Tính chất hoán đổi cho phép thay trật tự sử dụng luật. Mô hình chắc chắn cần tính chất này để thu thập các dấu hiệu theo trật tự tùy ý. Tức là nếu có nhiều luật thu thập thông tin thì giá trị tổng hợp CF không lệ thuộc vào thứ tự xử lý.

Tiệm cận

Ngƣời ta cần tính chất tiệm cận bởi hai lý do. Trƣớc hết, nó phản ánh cách mà bác sĩ thu thập độ tin cậy về giả thuyết nào đó từ nhiều nguồn thông tin. Trong nhiều nguồn khẳng định giả thuyết thì ngƣời ta cảm thây tin ở một nguồn nào đó, và ứng với nó là độ tin cậy cao hơn. Thứ hai, tính chất này đảm bảo tổng hợp các độ tin cậy không vƣợt quá 1 mà chỉ tiệm cận 1.

Giả sử tiếp tục sử dụng hai luật trên về dự báo mƣa. Ngƣời ta thấy có các trƣờng hợp xảy ra nhƣ sau:

Trƣờng hợp 1:

Cả ngƣời nông dân và nhà dự báo đều chắc chắn về mƣa. CF(E1) = CF(E2) = 1. Theo đẳng thức tính CF tổng hợp ta thu đƣợc:

CF1 = CF1 (H,E1) = CF(E1)*CF(luật 1) = 1.0*0.8 = 0.8 CF2 = CF2 (H,E2) = CF(E2)*CF(luật 2) = 1.0*0.8 = 0.8

CFkết hợp (CF1, CF2) = CF1+ CF2*(1- CF1) = 0.96

Trƣờng hợp này cho biết cách tăng nhân tố chắc chắn nhờ dấu hiệu của cả hai luật đối với cùng một giả thuyết. Thực tế cũng cho thấy khi có nhiều khẳng định thì ngƣời ta tin tƣởng hơn.

Trƣờng hợp 2:

Nhà dự báo khẳng định mƣa còn nông dân thì không. Tức là: CF(E1) =1; CF(E2) = -1. Theo đẳng thức tính CF tổng hợp ta có: CF1 = CF1 (H,E1) = CF(E1)*CF(luật 1) = 1.0*0.8 = 0.8

CF2 = CF2 (H,E2) = CF(E2)*CF(luật 2) = -1.0*0.8 = -0.8 CFkết hợp (CF1, CF2) = (CF1+ CF2)/(1- min{|CF1|, |CF2|) = 0

Trƣờng hợp 3

Nhà dự báo và ngƣời nông dân tin rằng không mƣa với độ tin cậy khác nhau. CF(E1) =-0.8; CF(E2) = -0.6

CF1 = CF1 (H,E1) = CF(E1)*CF(luật 1) = -0.8*0.8 = -0.64 CF2 = CF2 (H,E2) = CF(E2)*CF(luật 2) = -0.6*0.8 = -0.48 CFkết hợp (CF1, CF2) = CF1+ CF2*(1+ CF1) = 0.81

Kết quả cho thấy độ tin cậy càng giảm khi có nhiều dâu hiệu phản bác. Trƣờng hợp 4:

Các nguồn có cùng độ tin cậy về mƣa, nhƣng có một nguồn cho rằng không mƣa. Chẳng hạn CF(mƣa) = 0.8 do nhiều nguồn nên:

CFkết hợp (CF1, CF2, ...) → 0.999 = CFcũ

CF này thể hiện độ tin cậy tổng hợp về mƣa từ các nguồn thông tin cũ. Nếu có nguồn mới có độ tin cậy CFmơi = -0.8. Thì theo công thức tính CFtổng hợp.

CFkết hợp (CFcũ, CFmới) = (CFcũ + CFmới) / (1- min{|CFcũ|, |CFmới|) = 0.995

Kết quả cho thấy một dấu hiệu phản bác không tác động nhiều lắm so với nhiều dấu hiệu khẳng định.

d. Lan truyền chắc chắn đối với các luật phức tạp

Chẳng hạn IF E1 AND E2 OR E3 AND E4 THEN H CF = CF (luật). Ngƣời ta quản lý lan truyền đối với các luật loại này bằng cách tính đối với luật AND và luật OR, chẳng hạn luật trên có:

CF(H) = max {min{CF(E1), CF(E2)}, min {CF(E3), CF(E4)}}*CF(luật)

Để tìm ra các luật trong khai phá luật kết hợp cơ bản dựa vào độ hỗ trợ Sup và độ tin cậy Conf, nhƣng những tham số này phải đƣợc xác định qua kinh nghiệm hay qua phƣơng pháp chuyên gia. Dù bằng cách nào thì độ khả tín của các luật cũng ở mức độ tham khảo nào đó. Để tăng độ tin cậy vào các luật đã tìm đƣợc chúng ta có thể dùng phƣơng pháp hỗ trợ thêm của hệ chuyên gia.

Các kĩ thuật thể hiện tri thức

Tổng quan về lý thuyết chắc chắn