Rút gọn các luật từ cây quyết định

Một phần của tài liệu 27828 (Trang 61 - 62)

Nhƣ đã giới thiệu mục đích và nhiện vụ chính của Khai phá dƣ liệu là tìm ra, phát hiện ra đƣợc các qui luật, các mô hình từ trong cơ sở dữ liệu. Mô hình thu đƣợc từ kết quả khai phá dữ liệu có thể ở dạng cây hoặc các luật dƣới dạng “IF…THEN”. Ở đây hai mô hình trên là tƣơng đƣơng, chúng có thể chuyển đổi qua lại giữa các mô hình trên.

Từ mô hình cây để rút ra các luật dƣới dạng mệnh đề “IF…THEN” tƣơng ứng chúng ta duyệt cây bắt đầu từ nút gốc của cây và đi dọc theo các nhánh qua các nút trong cây để đi đến các nút lá của cây. Mỗi lần duyệt nhƣ vậy sẽ cho ta một luật tƣơng ứng, mỗi nhánh đi đến nút lá của cây cho một luật tƣơng ứng. Thuộc tính quyết định chính là nút lá, nằm sau từ khoá THEN; Còn các thuộc tính ứng viên là các nút trong của cây theo nhánh đi đến nút lá này, chính là biểu thức điều kiện, biểu thức này nằm sau từ khoá IF và trƣớc THEN, biểu thức điều kiện này có thể đƣợc liên kết với nhau bởi toán tử logic AND.

Ví dụ1: Các luật đƣợc rút ra từ cây quyết định trong Hình 2.12 Cây quyết định đi chơi tennis sử dụng thuật toán ID3

IF(Quangcảnh=Nắng) and(Độẩm = Cao) THENChơiTennis = Không

IF(Quangcảnh=Nắng) and(Độẩm = TB) THEN ChơiTennis = Có

IF(Quangcảnh= Âm u) THENChơiTennis = Có

IF(Quangcảnh=Mƣa) and(Gió = Mạnh) THENChơiTennis = Không

IF(Quangcảnh=Mƣa) and(Gió = Nhẹ) THENChơiTennis = Có

Ví dụ2: Các luật đƣợc rút ra từ cây quyết định trong Hình 2.15 Cây kết quả sử dụng thuật toán C4.5, nhƣ sau:

IF(Loạixe=Gia đình) and (Tuổi ≤ 33) THEN Mức độ nguy hiểm = Cao

IF(Loạixe=Gia đình) and (Tuổi > 33) THEN Mức độ nguy hiểm = Thấp

IF(Loạixe = Thể thao) THENMức độ nguy hiểm = Cao

Một phần của tài liệu 27828 (Trang 61 - 62)