Phân lớp sử dụng cây quyết định áp dụng thuật toán C4.5

Một phần của tài liệu Khai thác và phân tích dữ liệu ngân hàng nhằm phát hiện rủi ro và hỗ trợ ra quyết định trong quản trị (Trang 58)

3. Phân lớp và dựbáo rủi ro từ kho dữ liệu VIB

3.2 Phân lớp sử dụng cây quyết định áp dụng thuật toán C4.5

Hình 22: Chọn thuật toán C4.5

Thiết lập thông số

Trong giải thuật cây quyết định J48 (C4.5) được cung cấp bởi Weka có 3 tham số quan trọng

 confidenceFactor: Nhân tố sử dụng cho việc cắt tỉa (Nếu giá trị này càng nhỏ thì cây sinh ra sẽ được cắt càng nhiều).

 minNumObj: Số thể hiện tối thiểu trên một nút lá trong cây.

 unPruned: nếu là True thì cây sinh ra sẽ được cắt tỉa và ngược lại.

Sau khi điều chỉnh thông số, ta chọn các giá trị tham số cho kết quả tốt nhất như sau:

 Chọn phương pháp test: Cross Validation

 Tham số thuật toán: minNumObj=10

 confidenceFactor=0.2

 unpruned=False

Kết quả của xây dựng hình phân lớp bằng cây quyết định trên tập dữ liệu training 14158 mẫu.

Thời gian xây dựng mô hình 3.49 s

Số lá của cây 117

Số nút của cây 154

Số mẫu phân lớp đúng 9388 /14158= 66.3088 % Số mẫu phân lớp sai 4770 /14158= 33.6912 %

Bảng 2: Bảng kết quả xây dựng mô hình cây quyết định C4.5

Hình 23: Mô hình xây dựng bằng C4.5

Ma trận kết quả test trên tập 14158 mẫu

a b c d e a = Nhóm 1 7635 8 1434 21 9 b = Nhóm 5 9 165 7 0 0 c = Nhóm 2 3343 16 1241 30 5 d = Nhóm 4 54 1 73 14 0 e = Nhóm 3 51 1 37 3 1

Các luật đáng chú ý được rút ra từ mô hình như sau

+ If khách hàng “Đã từng nợ quá hạn” AND “Có quan hệ với 2 tổ chức tín dụng”

AND “Xếp hạng tín dụng AA” AND “Mục đích vay trả góp bất động sản” THEN Nợ xấu (nhóm 5)

+ If khách hàng “Luôn trả nợ đúng hạn”AND “Thời gian quan hệ với VIB dưới 5 năm ” AND “Số tiền vay lớn hơn 50 triệu ” AND “Mục đích vay sửa nhà” AND “Vị trí công tác: Cấp quản lý” AND “Thời gian lưu trú>14 năm” AND “Xếp hạng tín dụng BBB” THEN luôn trả đúng hạn (nhóm1)

+ If khách hàng “Thời gian quan hệ với VIB dưới 3 năm” AND “Số tiền vay nhỏ hơn 30 triệu” AND “Mục đích vay sửa nhà” AND “Vị trí công tác: Công nhân” AND “Thời gian công tác trong lĩnh vực chuyên môn dưới 1 năm” AND “Thời gian lưu trú >14 năm” AND “Thu nhập thấp hơn 14 triệu” THEN Thuộc nhóm nợ cần chú ý (nhóm 2)

+ If khách hàng “Thời gian quan hệ với VIB dưới 3 năm” AND “Số tiền vay trên 300 triệu” AND “Mục đích vay đầu tư khác” AND “Vị trí công tác: nhân viên” AND “Nguồn trả nợ từ lương và kinh doanh” AND “Thời gian lưu trú >5 năm” AND “Thu nhập thấp hơn 14 triệu” THEN Thuộc nhóm nợ cần chú ý (nhóm 2)

Một phần của tài liệu Khai thác và phân tích dữ liệu ngân hàng nhằm phát hiện rủi ro và hỗ trợ ra quyết định trong quản trị (Trang 58)

Tải bản đầy đủ (PDF)

(68 trang)