4.1. Cài đặt
Chương trình được xây dựng dựa trên: - Ngôn ngữ: Java
- Công cụ: NetBeans 8.1 Các bước thực hiện:
- Bước 1: Thu thập dữ liệu.
- Bước 2: Xử lý dữ liệu và lưu trữ dữ liệu trên file. Gồm 2 bộ dữ liệu: huấn luyện (250 đối tượng) và kiểm tra (50 đối tượng).
- Bước 3: Cài đặt thuật toán ID3 và tạo ra cây quyết định. - Bước 4: Tạo luật được sinh ra từ cây quyết định.
- Bước 5: Đánh giá độ chính xác của thuật toán.
Sau quá trình huấn luyện, số luật sinh ra là 42. Cây quyết định được tạo ra từ bộ dữ liệu huấn luyện (gồm 250 đối tượng):
Và các luật tương đương:
Hình 4.2: Các luật được rút ra từ cây quyết định
4.2. Thử nghiệm và đánh giá
Chúng tôi kiểm tra trên một tập gồm 50 đối tượng
Số đối tượng đúng: 41. Số đối tượng sai: 9. Tỉ lệ đúng: 41/50 = 0.82
Ứng dụng của cây quyết định hỗ trợ cán bộ tính dụng ngân hàng
Dựa trên những luật thu được, ta có thể tham khảo để ra quyết định cho một khách hàng nào đó vay hoặc không cho vay tiền.
Xét 3 khách hàng sau:
Bảng 4.1: Thông tin khách hàng
Khách hàng A B C
Tuổi Gia Tre TrungNien
Giới tính Nam Nam Nam
Hộ khẩu ThanhPho ThiTran ThiTran Thu nhập Cao Thap TrungBinh
Kết hôn Co Co Khong
Số con KhongCon BonCon BonCon
Xe ô tô Co Khong Co
Tài khoản tiết kiệm Khong Co Co Tài khoản hiện tại Co Khong Khong Tài sản thế chấp Co Khong Khong Trường hợp khách hàng A, dựa trên luật:
If ( ThuNhap = Cao && HoKhau = ThanhPho && GioiTinh = Nam && Tuoi = Gia) then ChoVay = Yes.
Vì vậy, khách hàng A được ngân hàng cho vay. Trường hợp khách hàng B, dựa trên luật:
If ( ThuNhap = Thap) then ChoVay = No.
Vì vậy, khách hàng B không được ngân hàng cho vay. Trường hợp khách hàng C, dựa trên luật:
If ( ThuNhap = TrungBinh && TaiKhoanTheChap = Khong && SoCon = BonCon) then ChoVay = No.