.5 trên tập mẫu

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Khai thác và phân tích dữ liệu ngân hàng nhằm phát hiện rủi ro và hỗ trợ ra quyết định trong quản trị (Trang 60 - 62)

Các luật đáng chú ý được rút ra từ mô hình như sau

+ If khách hàng “Đã từng nợ quá hạn” AND “Có quan hệ với 2 tổ chức tín dụng”

AND “Xếp hạng tín dụng AA” AND “Mục đích vay trả góp bất động sản” THEN Nợ xấu (nhóm 5)

+ If khách hàng “Luôn trả nợ đúng hạn”AND “Thời gian quan hệ với VIB dưới 5 năm ” AND “Số tiền vay lớn hơn 50 triệu ” AND “Mục đích vay sửa nhà” AND “Vị trí công tác: Cấp quản lý” AND “Thời gian lưu trú>14 năm” AND “Xếp hạng tín dụng BBB” THEN luôn trả đúng hạn (nhóm1)

+ If khách hàng “Thời gian quan hệ với VIB dưới 3 năm” AND “Số tiền vay nhỏ hơn 30 triệu” AND “Mục đích vay sửa nhà” AND “Vị trí công tác: Công nhân” AND “Thời gian công tác trong lĩnh vực chuyên môn dưới 1 năm” AND “Thời gian lưu trú >14 năm” AND “Thu nhập thấp hơn 14 triệu” THEN Thuộc nhóm nợ cần chú ý (nhóm 2)

+ If khách hàng “Thời gian quan hệ với VIB dưới 3 năm” AND “Số tiền vay trên 300 triệu” AND “Mục đích vay đầu tư khác” AND “Vị trí công tác: nhân viên” AND “Nguồn trả nợ từ lương và kinh doanh” AND “Thời gian lưu trú >5 năm” AND “Thu nhập thấp hơn 14 triệu” THEN Thuộc nhóm nợ cần chú ý (nhóm 2)

3.3 Phân lớp sử dụng thuật toán SVM

Vẫn sử dụng dữ liệu đã được tiền xử lý ở bước trên tuy nhiên đối với thuật toán SVM ta phải thêm một bước xử lý dữ liệu đối với các thuộc tính kiểu Nominal. Phải chuyển đổi dữ liệu kiểu Nomial sang kiểu Numeric. Xử lý dữ liệu kiểu Nominal sang kiểu Numeric để phù hợp với bài toán phân lớp SVM bằng cách mở tệp dữ liệu traning và sử dụng chức năng chuyển đổi dữ liệu từ Nominal sang Binary như sau:

Sử dụng chức năng Filter dữ liệu trên Weka Explore chọn Nominal to Binary, Sau khi chuyển đội từ bộ dữ liệu với 29 thuộc tính trở thành bộ dữ liệu có 100 thuộc tính với duy nhất kiểu Numeric để sử dụng trong thuật toán SVM

Hình 24: Chuyển đổi dữ liệu từ Nominal sang Binary

Chọn các tham số cho thuật toán:

Chọn phương pháp test: Cross Validation =10

Tham số thuật toán: SVM type= C-SVM (Classification) Sử dụng hàm nhân: Gaussian RBF

gama=0.5

cost(C) =0.5

Kết quả của xây dựng hình phân lớp bằng cây quyết định trên tập dữ liệu training 14158 mẫu.

Thời gian xây dựng mô hình 476s

Số mẫu phân lớp đúng 9591/14158= 67.7426% Số mẫu phân lớp sai 4567/14158= 32.2574%

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Khai thác và phân tích dữ liệu ngân hàng nhằm phát hiện rủi ro và hỗ trợ ra quyết định trong quản trị (Trang 60 - 62)

Tải bản đầy đủ (PDF)

(68 trang)