Thuat giai ILA Cac He Co So Tri Thuc Thuật giải ILA ñược ñánh giá mạnh hơn hai thuật giải về phương pháp học quy nạp trước ñây là ID3 Xác ñịnh dữ liệu 1 Tập mẫu ñược liệt kê trong một bảng, với mỗi dò[.]
Thuật giải ILA ñược ñánh giá mạnh hai thuật giải phương pháp học quy nạp trước ñây ID3 Xác ñịnh liệu Tập mẫu ñược liệt kê bảng, với dòng tương ứng mẫu, cột thể thuộc tính mẫu Tập mẫu có m mẫu, mẫu gồm k thuộc tính, có thuộc tính ñịnh Tổng số n giá trị thuộc tính định số lớp tập mẫu Tập luật R có giá trị khởi tạo ∅ Tất dịng bảng ban đầu chưa ñược ñánh dấu (kiểm tra) Áp dụng thuật giải ILA qua bước: Bước 1: Chia bảng m mẫu ban ñầu thành n bảng Mỗi bảng ứng với giá trị thuộc tính phân lớp “hay thuộc tính định” tập mẫu (* thực bước ñến cho bảng con*) Bước 2: Khởi tạo biến đếm kết hợp thuộc tính j, j = cho biết số thuộc tính xét Bước 3: Với bảng ñang khảo sát, phân chia danh sách thuộc tính theo tổ hợp phân biệt, tổ hợp ứng với j thuộc tính phân biệt Bước 4: Với tổ hợp thuộc tính, tính số lượng giá trị thuộc tính xuất theo tổ hợp thuộc tính dịng chưa ñược ñánh dấu bảng ñang xét (mà ñồng thời khơng xuất với tổ hợp thuộc tính bảng cịn lại) Gọi tổ hợp (trong bảng con) có số lần xuất nhiều tổ hợp lớn Bước 5: Nếu tổ hợp lớn ∅, tăng j lên quay lại bước Bước 6: Đánh dấu dòng thoả tổ hợp lớn bảng ñang xử lý theo lớp Bước 7: Thêm luật vào tập luật R, với vế trái tập giá trị thuộc tính ứng với tổ hợp lớn (kết hợp thuộc tính tốn tử AND) vế phải giá trị thuộc tính định tương ứng Bước 8: Nếu tất dịng đánh dấu phân lớp, tiếp tục thực từ bước cho bảng lại Ngược lại (nếu chưa đánh dấu hết dịng) quay lại bước Nếu tất bảng xét kết thúc, kết thu ñược tập luật cần tìm Thuật giải ILA đánh giá mạnh hai thuật giải phương pháp học quy nạp trước ñây ID3 Ví dụ minh hoạ thuật giải Mẫu số Size Color Shape Decision medium blue brick yes small red wedge no small red sphere yes large red wedge no large green pillar yes large red pillar no large green sphere yes Bước 1: Bảng Mẫu số Mẫu số cũ Size Color Shape Decision 1 medium blue brick yes small red sphere yes large green pillar Yes large green sphere Yes Bảng Mẫu số Mẫu số cũ Size Color Shape Decision small red wedge No large red wedge No large red pillar No Thuật giải ILA ñược ñánh giá mạnh hai thuật giải phương pháp học quy nạp trước ñây ID3 Với j=1, danh sách tổ hợp thuộc tính gồm có {Size}, {Color}, {Shape} Với tổ hợp {Size}, giá trị thuộc tính “medium” xuất bảng thứ khơng có bảng thứ hai, ñó giá trị tổ hợp lớn “medium” Bởi giá trị thuộc tính “small” “large” xuất hai bảng con, nên khơng xét bước Với tổ hợp {Size} giá trị thuộc tính “medium” Xét tiếp cho tổ hợp {Color} giá trị tổ hợp lớn 2, ứng với thuộc tính “green”, cịn thuộc tính “blue” Với tổ hợp {Shape}, ta có “brick” xuất lần, “sphere” hai lần Đến ñây nhận thấy có hai thuộc tính: “green” “sphere” hai thuộc tính {Color} {Shape} có số lần xuất lớn Thuật tốn mặc định chọn trường hợp thứ ñể xác ñịnh luật tổ hợp lớn Dịng đánh dấu ñã phân lớp ta có luật dẫn sau: Rule 1: IF color IS green THEN decision IS yes mẫu cịn lại (chưa đánh dấu) bảng (tức dòng 2) Áp dụng tương tự trên, ta thấy giá trị thuộc tính “medium” {Size}, “blue” {Color}, “brick” "sphere" {Shape} ñều xuất lần Bởi số lần xuất giống nhau, thuật giải áp dụng luật mặc ñịnh chọn trường hợp thuộc tính {Size} Ta có thêm luật sau: Rule 2: IF size IS medium THEN decision IS yes Tiếp tục áp dụng bước ñến dòng lại (tức dòng 2) Giá trị thuộc tính "sphere" {Shape} xuất lần, ta có luật thứ ba: Rule 3: IF shape IS sphere THEN decision IS yes Như vậy, tất dòng bảng ñã ñược ñánh dấu, ta chuyển qua xử lý tiếp bảng Thuộc tính "wedge" {Shape} xuất hai lần dòng bảng không xuất bảng Đánh dấu dòng với luật dẫn thứ tư sau: Rule 4: IF shape IS wedge THEN decision IS no Thuật giải ILA ñược ñánh giá mạnh hai thuật giải phương pháp học quy nạp trước ñây ID3 ILA tăng j = j + bảng thứ dòng tất mẫu tổ hợp j = ñều xuất bảng Khởi tạo tổ hợp thuộc tính {Size Color}, {Size Shape}, {Color Shape} Các tổ hợp thứ thứ ba thoả mãn điều kiện khơng xuất bảng với cặp thuộc tính có dịng Theo luật mặc định, ta chọn luật theo trường hợp thứ Đánh dấu dịng này, ta có thêm luật dẫn thứ 5: Rule 5: IF size IS large AND color IS red THEN decision IS no Tổng hợp luật ... Bảng Mẫu số Mẫu số cũ Size Color Shape Decision 1 medium blue brick yes small red sphere yes large green pillar Yes large green sphere Yes Bảng Mẫu số Mẫu số cũ Size Color Shape Decision small... hợp thuộc tính {Size Color}, {Size Shape}, {Color Shape} Các tổ hợp thứ thứ ba thoả mãn điều kiện khơng xuất bảng với cặp thuộc tính có dịng Theo luật mặc định, ta chọn luật theo trường hợp thứ... {Color} giá trị tổ hợp lớn 2, ứng với thuộc tính “green”, cịn thuộc tính “blue” Với tổ hợp {Shape}, ta có “brick” xuất lần, “sphere” hai lần Đến ñây nhận thấy có hai thuộc tính: “green” “sphere”