Sử dụng cây quyết định để phân loại khách hàng

Một phần của tài liệu Tiểu luận môn CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀ HỖ TRỢ RA QUYẾT ĐỊNH TÍN DỤNG NGÂN HÀNG (Trang 41)

ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀO BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH TÍN DỤNG NGÂN HÀNG

3.3.Sử dụng cây quyết định để phân loại khách hàng

Qui trình tín dụng cơ bản trên mà bất kì các ngân hàng thương mại nào cũng phải tuân theo. Bài toán đặt ra làm sao để ra quyết định tín dụng ở Bước 3 để không mắc phải 2 sai lầm mắc phải là:

• Đồng ý cho vay với một khách hàng không tốt.

• Từ chối cho vay với một khách hàng tốt.

Đề giải quyết bài toán này, chúng ta dựa trên những dữ liệu có sẵn để hỗ trợ ra quyết định.

Trong nghiên cứu này, chúng tôi tập trung vào công tác tín dụng tiêu dùng, đặc biệt là trong việc mua nhà giá thấp của khách hàng với tập dữ liệu thu thập được. Dựa vào tập dữ liệu này sẽ xây dựng mô hình cây quyết định, từ cây quyết định ta rút ra các luật quyết định. Dựa vào các luật quyết định đó ta sẽ phân lớp được tập dữ liệu mới (dữ liệu về khách hàng xin vay tiêu dùng, nhưng chưa được phân lớp) và tập dữ liệu sau khi được phân lớp sẽ hỗ trợ cán bộ tín dụng ra quyết định cho khách hàng vay hay không?

Các bước thực hiện giải quyết bài toán:

- Thu thập và tiền xử lý dữ liệu: Tiến hành thu thập dữ liệu khách hàng theo các thuộc tính sau: Tuổi, Giới tính, Hộ khẩu, Thu nhập, Kết hôn, Số con, Xe

Ôtô, Tài khoản tiết kiệm, Tài khoản hiện tại, Tài sản thế chấp, và Cho vay. Dữ liệu khách hàng được mô tả chi tiết qua Bảng 3.1:

Bảng 3.1: Bảng thuộc tính của tập dữ liệu huấn luyện

Thứ tự Thuộc tính Giá trị Ý nghĩa

1 Tuoi Tre, TrungNien, Gia Trẻ, Trung niên, Già 2 GioiTinh Nam, Nu Nam, Nữ

3 HoKhau NongThon, ThiTran, NgoaiO, ThanhPho Nông thôn, Thị trấn, Ngoại ô, Thành phố

4 ThuNhap Thap, TrungBinh, Cao Thấp, Trung bình, Cao 5 KetHon Co, Khong Có, Không

6 SoCon KhongCon, MotCon, HaiCon, BaCon, BonCon Không con, Một con, Hai con, Ba con, Bốn con

7 XeOto Co, Khong Có, Không 8 TaiKhoanTietKiem Co, Khong Có, Không 9 TaiKhoanHienTai Co, Khong Có, Không 10 TaiSanTheChap Co, Khong Có, Không

11 ChoVay Yes, No Có (Yes), Không (No) Sau quá trình thu thập, tiến hành hậu xử lý giữ liệu như: kiểm tra và chỉnh sửa lại các giá trị của thuộc tính để đồng bộ các dữ liệu. Tiếp theo, chia dữ liệu thu thập được thành 2 tập: dữ liệu huấn luyện và dữ liệu thử nghiệm.

- Khai thác dữ liệu và rút ra tri thức: Chọn mô hình cây quyết định để tìm ra các luật hỗ trợ ra quyết định cho vay. Tiến hành huấn luyện tập dữ liệu huấn luyện. Ví dụ:

+ Luật 1: IF(SoCon = MotCon) AND (ThuNhap = Cao) AND (TaiKhoanTheChap = Co) THEN (ChoVay = Yes).

+ Luật 2: IF(SoCon = BonCon) AND (ThuNhap = Thap) AND (TaiKhoanTheChap = Khong) THEN (ChoVay = No).

+ …

- Phân tích và kiểm định kết quả: Tiến hành kiểm tra và đánh giá độ chính xác trên tập dữ liệu huấn luyện.

- Sử dụng các tri thức phát hiện được:Từ những luật xây dựng được, tiến hành xây dựng ứng dụng hỗ trợ ra quyết định trong việc cho khách hàng được vay hay không?

Chương 4

Một phần của tài liệu Tiểu luận môn CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG CÂY QUYẾT ĐỊNH VÀ HỖ TRỢ RA QUYẾT ĐỊNH TÍN DỤNG NGÂN HÀNG (Trang 41)