Tập thô và công thức Bayes

Một phần của tài liệu Tiểu luận công nghệ tri thức và ứng dụng Khai thác dữ liệu Bayes và Tập thô (Trang 32)

V) Lý thuyết tập thô (Rough Set Theory)

6)Tập thô và công thức Bayes

Những đối tượng nằm ở vùng biên của tập thô thường mang những giá trị không chắc chắn và cần có một phương pháp phân tích, thống kê để có thể xây dựng thuật toán quyết định phù hợp cho các đối tượng này. Trong thống kê, công thức Bayes luôn chứng tỏ là công cụ hữu hiệu để phân tích và dự đoán dữ liệu. Việc áp dụng công thức Bayes vào lý thuyết tập thô, được cha đẻ Tập thô là Pawlak giới thiệu, đã giải quyết được một số vấn đề khó khăn còn tồn đọng và gia tăng mức độ chính xác của thuật toán quyết định

Xem xét một ví dụ sau:

Đối tượng Bệnh Tuổi Giới tính Kiểm tra Support Certainty

1 có già nam + 400 0.92

2 có trung niên nữ + 80 0.56

3 không già nam – 100 1.00

4 có già nam – 40 0.08

5 không trẻ nữ – 220 1.00

6 có trung niên nữ – 60 0.44

Bảng 5.5: Bảng chuẩn đoán kết quả Bệnh tật

Giá trị Support thể hiện tần số xuất hiện của đối tượng x có giá trị thuộc tính điều kiện là A(x) và giá trị thuộc tính quyết định là D(x) trong tập dữ liệu.

( , ) = | ( ) ∩ ( )| (5.6)

Giá trị Certainty factor của Bảng 2.8 thể hiện mức độ chắc chắn của luật quyết định suy ra từ dữ liệu. Thực chất, giá trị Certainty factor chính là xác suất hậu nghiệm dự đoán khả năng xảy ra của thuộc tính quyết định D khi đối tượng có giá trị thuộc tính là A(x).

( , ) = ( | ) = ( , )

32

Dựa vào các giá trị Bảng 5.5, có thể xây dựng các luật quyết định như sau:

if: (Bệnh=có) and (Tuổi=già) and (Giới tính=nam) then Kiểm tra= 92% +

8% −

if: (Bệnh=có) and (Tuổi=trung niên) and (Giới tính=nữ) then Kiểm tra= 56% +

44% −

if: (Bệnh=không) and (Tuổi=già) and (Giới tính=nam) then Kiểm tra=100%

if: (Bệnh=không) and (Tuổi=trẻ) and (Giới tính=nữ) then Kiểm tra=100%

Thuật toán quyết định này thể hiện mức độ chính xác của các luật để người dùng có thể hạn chế rủi ro mắc phải trong việc đưa ra các quyết định không chắc chắn.

Một phần của tài liệu Tiểu luận công nghệ tri thức và ứng dụng Khai thác dữ liệu Bayes và Tập thô (Trang 32)