Module Loan:
Loan_Limit: Định mức được vay
Loan_Col: Tài sản đảm bảo
Loan_Dict: Bảng tham chiếu giá trị tài sản
Loan_Info: Thơng tin chi tiết khoản vay Module CIF:
CIF_Info: Thơng tin khách hàng (họ tên, nơi ở, khu vực…)
CIF_Acct: Thơng tin tài khoản (ATM, VISA, E-Parter, Credit, debit…)
CIF_Service: Thơng tin dịch vụ liên quan đến tài khoản (Thanh tốn trực tuyến, biến động số dư, thanh tốn viện phí, thu hộ tự động…)
Dữ liệu được chiết xuất từ hệ thống ngân hàng sẽ tập trung vào các phạm vi:
Tập trung vào khách hàng cá nhân.
Thu thập các khoản vay cĩ cả nhĩm nợ tốt và xấu.
Thu thập các loại khoản vay về đầu tư bất động sản, mua ơ tơ, kinh doanh hộ cá thể, và tiêu dùng cá nhân đây là các loại vay thường xuyên được khách hàng lựa chọn.
3.6. Biến đổi dữ liệu, tính tốn sinh ra các bảng Bảng khách hàng Bảng khách hàng
Tên trƣờng Loại dữ liệu Mơ tả
MA_KHACH_HANG Kiểu ký tự Số định đanh trên Corebanking của khách hàng (CIF NO).
HO_TEN Kiểu ký tự Họ tên khách hàng
NGHE_NGHIEP Kiểu ký tự Nghề nghiệp của khách hàng XEP_LOAI_KHACH_HANG Kiểu ký tự Xếp loại khách hàng (Tốt, Trung
Binh, Xấu). Trong luận văn này lấy tất cả khách hàng đều cĩ được ngân hàng xếp loại Tốt.
GIOI_TINH Kiểu ký tự Giới tính (Nam, Nữ)
TUOI Kiểu số Tuổi
THU_NHAP_ON_DINH Kiểu ký tự Thu nhập cĩ ổn định khơng (Cĩ, khơng). Trong luận văn lấy tất cả khách hàng đều cĩ thu
nhập ổn định.
TT_HON_NHAN Kiểu ký tự Tình trạng hơn nhân (Đã kết hơn, chưa kết hơn)
CON_CAI Kiểu số Số con (1,2,3 ..)
CU_TRU Kiểu ký tự Tình trạng cư trú (Khu vực Trung tâm thành phố, KV1 thành phố, nơng thơn …)
Bảng hợp đồng vay: Bảng tổng hợp bản ghi hợp đồng vay, bảng này chứa hầu hết các thơng tin hợp đồng cho vay
Tên trƣờng Loại dữ liệu Mơ tả
MA_KHACH_HANG Kiểu ký tự Số định đanh trên Corebanking của khách hàng.
SO_HOP_DONG_VAY Kiểu ký tự Số hợp đồng cho vay
SO_TIEN_VAY Kiểu số Số tiền vay
MUC_DICH_VAY Kiểu ký tự Mục đích vay
GT_DAM_BAO
Kiểu ký tự Giá trị đảm bảo khoản vay (VD: Bất động sản, tín chấp bằng lương …)
CHI_SO_NHOM_NO
Kiểu ký tự Nhĩm nợ của khoản vay Tốt (nhĩm 1,2), Xấu (nhĩm 3,4,5..).
Bảng định mức hợp đồng vay: Bảng này quản lý chi tiết định mức cấp khoản vay căn cứ vào thu nhập, thời gian vay của hợp đồng vay.
Tên trƣờng Loại dữ liệu Mơ tả
MA_KHACH_HANG Kiểu ký tự Số định đanh trên Corebanking của khách hàng.
SO_HOP_DONG_VAY Kiểu ký tự Số hợp đồng cho vay DINH_MUC_DUOC_VAY Kiểu số Định mức được vay
3.7. Làm sạch dữ liệu
Xử lý outliers
Loại bỏ những khoản vay kỳ hạn dưới 1 năm
Loại bỏ những giao dịch liên quan đến thế chấp thương mại, bảo lãnh hải quan
Loại bỏ các trường hợp cho vay ưu đãi với cán bộ nhân viên Ngân hàng Xử lý sai logic dữ liệu
Xử lý null value & missing value
Giảm bớt dữ liệu
3.7.1.
Giảm bớt về biểu diễn các thuộc tính của dữ liệu, giảm bớt kích thước dữ liệu nhưng vẫn đảm bảo thu được các kết quả khai phá dữ liệu tương đương
Gom nhĩm dữ liệu là một trong những cách phổ biến để giảm kích thước dữ liệu:
Gom thơng tin địa chỉ theo các khu vực
Gom các hình thức nghề nghiệp
Gom nhĩm tuổi
Gom nhĩm định mức các khoản vay
3.8. Lựa chọn dữ liệu