LÝ THUYẾT CHẮC CHẮ N

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Loại bỏ mẩu tin nhân bản thừa trong cơ sở dữ liệu quan hệ (Trang 29 - 32)

Trong thực tế có rất nhiều tình huống chúng ta phải rút ra những kết luận tốt từ những bằng chứng nghèo nàn và không chắc chắn thông qua việc sử dụng những suy diễn không chắc chắn. Đây không phải là nhiệm vụ không thể thực hiện được, trái lại chúng ta có thể thực hiện rất thành công trong nhiều lĩnh vực trong cuộc sống, chẳng hạn những chuẩn đoán y học đúng đắn và đề xuất cách điều trị thích hợp từ những triệu chứng không rõ ràng, phân tích những trục trặc của xe ô tô dựa vào biểu hiện của nó, nhận ra bạn bè chỉ qua giọng nói hoặc điệu bộ của họ...

Lý thuyết chắc chắn đảm bảo tiếp cận thực tế cho lý thuyết xác xuất trong quản lý lập luận không chắc chắn trong hệ chuyên gia.

Đối với dấu hiệu không chắc chắn, người ta gán một nhân tố chắc chắn CF(Certainty Factor) để thể hiện độ tin cậy vào dấu hiệu đó. Số này chạy từ -1, ứng với sai hoàn toàn, đến +1, ứng với đúng hoàn toàn. Số dương thể hiện sự tin cậy, số âm thể hiện sự không tin cậy.

Có hai loại không chắc chắn: một là dữ liệu ban đầu cho không chắc chắn, không đủ, không đáng tin cậy,... hai là các luật sử dụng không hợp logic, suy luận ngược từ kết luận về điều kiện, hay còn gọi là suy luận theo kiểu phỏng đoán. Vì vậy, ở đây ta cũng có hai loại hệ số CF là hệ số chắc chắn cho dữ kiện(fact) và hệ số chắc chắn cho luật(rule). Để dễ phân biệt ta kí hiệu CFf dùng cho dữ kiện và CFr dùng cho luật.

1.3.1 H s chc chn dành cho d kin

Dữ kiện ở đây bao gồm dữ liệu ban đầu, dữ kiện suy luận được. CFf ∈ [-1,1]

CFf càng tiến về 1 thể hiện sự tin tưởng dữ kiện là đúng càng mạnh.

CFf càng tiến về -1 thể hiện sự tin tưởng dữ kiện là không đúng càng mạnh.

chống lại dữ kiện. Vì vậy, nếu lấy dữ kiện này để suy luận thì độ chính xác sẽ rất thấp. Do vậy, người ta đưa ra một giới hạn(threshold) nhằm tránh suy luận với thông tin không chắc chắn như vậy (ví dụ: 0.01). Nghĩa là nếu có dữ kiện nào có CF nhỏ hơn giới hạn thì sẽ không được sử dụng trong quá trình suy luận.

1.3.2 H s chc chc chn dành cho lut

Hệ số này thể hiện sự tin tưởng của chuyên gia vào độ tin cậy của luật. Cấu trúc cơ bản của luật dùng trong mô hình chắc chắn có dạng IF E THEN H CF(luật), trong đó CF(luật) thể hiện mức độ tin cậy H khi có E. Tức là khi E là đúng thì người ta tin H theo CF(H,E) = CF(luật).

Ví dụ:

Luật 1: IF có mây đen, E THEN sẽ mưa, H với CF = 0.8 sẽ được tham chiếu đến bảng miêu tả để hiểu rằng “nếu có mây đen thì hầu như chắc chắn trời mưa(CF=0.8)”.

1.3.3 Các quy tc tính toán trên CF

1.3.3.1 Quy tc kết hp các CFf ca các điu kin

Thông thường, một luật thường có tiền đề(vế trái) tạo thành từ những kết nối AND/OR của nhiều điều kiện. Khi một luật được sử dụng, các CF liên kết với mỗi điều kiện của tiền đề sẽ được kết hợp với nhau để tạo ra một độ chắc chắn cho toàn bộ tiền đề(toàn bộ vế trái của luật) theo công thức sau:

CF(<điều kiện 1> AND <điều kiện 2>)=Min[CF(<điều kiện 1>),CF(<điều kiện 2>)] CF(<điều kiện 1> OR <điều kiện 2>) = Max[CF(<điều kiện 1>), CF(<điều kiện 2>)] Ví dụ:

CF(bệnh nhân bị sốt) = 0.9 CF(bệnh nhân bị hắt hơi) = 0.6

⇒ CF(bệnh nhân bị sốt OR bệnh nhân bị hắt hơi) = 0.9

1.3.3.2 Quy tc tính CF cho d kin suy ra t lut

Khi hệ thống sử dụng các luật không chắc chắn(nghĩa là đi kèm theo một hệ số CFr) để suy ra kết luận thì các hệ số CF của tiền đề cũng sẽ được truyền từ tiền đề sang kết luận thông qua luật theo quy tắc sau:

CFf(<kết luận>) = CFr(<luật>)*CFf(<điều kiện>) Ví dụ:

CF(bệnh nhân bị sốt) = 0.8

CF(IF bệnh nhân bị sốt THEN bệnh nhân bị cúm) = 0.5 ⇒ CF(bệnh nhân bị cúm) = 0.4

1.3.3.3 Quy tc kết hp nhiu CF ca các kết lun t nhiu lut

Khi có nhiều luật cùng đưa ra một kết luận(vế phải) giống nhau, thì các giá trị CF đạt được từ các luật này sẽ được kết hợp theo quy tắc:

Nếu kết luận từ luật 1 có giá trị CF1, kết luận từ luật 2 có giá trị CF2 thì: CFkết hợp = CF1 + CF2*(1 - CF2), khi CF1 và CF2 cùng dương CFkết hợp = CF1 + CF2*(1 + CF2), khi CF1 và CF2 cùng âm

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Loại bỏ mẩu tin nhân bản thừa trong cơ sở dữ liệu quan hệ (Trang 29 - 32)

Tải bản đầy đủ (PDF)

(72 trang)