Sử dụng thuộc tính có giá trị liên tụ c

Một phần của tài liệu Bài giảng Nhập môn trí tuệ nhân tạo (Trang 94)

Thuật toán trình bày ở trên yêu cầu thuộc tính nhận giá trị rời rạc trong một tập hữu hạn. Trong nhiều trường hợp, thuộc tính có thể nhận giá trị liên tục dưới dạng số thực. Chẳng hạn, nhiệt độđược cho dưới dạng sốđo thực như trong ví dụ sau (ởđây nhiệt độ tính bằng độ F):

Nhiệt độ 45 56 60 74 80 90 Chơi tennis không không có có có không

Để sử dụng thuộc tính như vậy cần tạo ra những thuộc tính rời rạc mới cho phép phân chia thuộc tính rời rạc thành các khoảng giá trị. Với mỗi thuộc tính liên tục A, cách thường được sử

dụng là tạo ra thuộc tính rời rạc Ac sao cho Ac = true nếu A > c và Ac = false nếu A ≤ c, trong đó c là giá trị ngưỡng.

Vấn đề đặt ra là xác định ngưỡng c như thế nào. Trước hết, c cần được chọn sao cho Ac

đem lại độ tăng thông tin lớn nhất. Để tìm được c như vậy, ta sắp xếp các ví dụ theo thứ tự tăng dần của thuộc tính A, sau đó xác định những trường hợp hai ví dụ nằm cạnh nhau có nhãn khác nhau. Giá trị trung bình của thuộc tính A của hai thuộc tính như vậy sẽ được sử dụng làm giá trị

dự kiến của c, trong ví dụ trên là (56+60)/2 = 58 và (80+90)/2 = 85 . Sau đó tính độ tăng thông tin cho từng giá trị dự kiến và chọn c đem lại độ thăng thông tin lớn nhất, trong ví dụ trên là độ

thăng thông tin của Nhiệt_độ58 và Nhiệt_độ85.

Phương pháp trên có thể mở rộng bằng cách cha giá trị thuộc tính thành nhiều khoảng với nhiều ngưỡng, thay vì chỉ sử dụng một ngường như ta vừa thấy.

Một phần của tài liệu Bài giảng Nhập môn trí tuệ nhân tạo (Trang 94)

Tải bản đầy đủ (PDF)

(105 trang)