Đầu vào:
Tập thơng tin khách hàng và lịch sử trả nợ của các khách hàng bao gồm
o Tập huấn luyện (Training Set) nhằm mục đích xây dựng mơ hình
o Tập kiểm thử (Testing Set) nhằm mục đích kiểm chứng mơ hình
Tập thơng tin khách hàng mới cần dự báo
Áp dụng mơ hình Dữ liệu trên corebank Dữ liệu Huấn luyện Dữ liệu
Kiểm thử Kiểm thử mơ hình Mơ hình phân lớp
Xây dựng mơ hình
Khách hàng mới
Nợ Tốt Nợ Xấu
Đầu ra:
Đưa ra mơ hình phân lớp dự báo, các chỉ số đánh giá mơ hình, các luật rút ra từ mơ hình giúp phân loại các khách hàng mới.
Ví dụ:
Đầu vào:
o Thơng tin khách hàng về khách hàng vay vốn: Mục đích vay mua nhà, cĩ thu nhập trên 11 triệu, đang thuê nhà, làm tại cơng ty phần mềm, chức vụ chuyên viên, thời gian đã cơng tác trong lĩnh vực chuyên mơn dưới 3 năm
Đầu ra:
o Dự báo khách hàng cĩ khả năng rơi vào nhĩm nợ cần chú ý (nhĩm 2)
Mục tiêu của bài tốn là xây dựng mơ hình chứa các tập luật ràng buộc về dữ liệu. Mơ hình này sẽ là cơ sở tri thức, mà dựa vào đĩ cĩ thể phân loại được khách hàng mới dựa vao thơng tin đầu vào của khách vay.
Việc dự báo chính xác sẽ giúp ngân hàng giảm thiểu các rủi ro cĩ thể cĩ từ các khách hàng cĩ khả năng khơng trả được nợ
2.3. Quy trình phân lớp xây dựng mơ hình
Để cĩ thể xây dựng được mơ hình như yêu cầu bài tốn ở mục 2.3 ta phải thực hiện thứ tự theo các bước như sau [14]:
a. Xây dựng mơ hình từ tập huấn luyện – Training data