“Chúng ta có thể rút ra được quy tắc phân lớp từ cây quyết định? nếu có thì như thế nào?”. Tri thức biểu diễn trong cây quyết định có thể được rút ra và biểu diễn dưới hình thức của quy tắc phân lớp IF-THEN [4]. Một quy tắc được tạo ra thay thế cho một đường dẫn từ gốc tới một nút lá. Mỗi một cặp thuộc tính-giá trị theo một hướng đi cụ thể hình thành phần đầu của quy tắc (phần “IF”). Nút lá chứa lớp dự đoán, hình thành phần sau của quy tắc (phần “THEN”). Quy tắc IF-THEN có thể làm cho người đọc dễ hiểu, đặc biệt trong trường hợp cây lớn.
Ví dụ cây quyết định trong hình 3.2 có thể được chuyển đổi thành quy tắc phân lớp có dạng IF-THEN bằng cách lần theo đường dẫn từ gốc đến từng nút lá trong cây. Quy tắc thu được từ hình 3.2 như sau:
55
IF tuoi=”<=30” AND sinh_vien=”sai” THEN mua_may_tinh=”sai” IF tuoi=”<=30” AND sinh_vien=”đúng” THEN mua_may_tinh=”đúng”
IF tuoi=”30…40” THEN mua_may_tinh=”sai”
IF tuoi=”>40” AND ty_le_tien_gui=”rất tốt” THEN mua_may_tinh=”sai” IF tuoi=”>40” AND ty_le_tien_gui=”tốt” THEN mua_may_tinh=”đúng”
Hình 3.4 Luật thu được từ hình 3.2
Một quy tắc có thể được thu gọn bằng cách loại bỏ một số điều kiện ở phần đầu của quy tắc, điều này không làm cải tiến độ chính xác ước lượng của quy tắc. Với mỗi lớp, các quy tắc trong một lớp sau đó có thể được xếp loại theo độ chính xác ước lượng của chúng. Vì thế khả năng một mẫu thử đã cho sẽ không thỏa mãn phần đầu của mọi quy tắc, một quy tắc mặc định được gán cho đa số các lớp, thông thường cũng được thêm vào tập quy tắc kết quả.