Mơ hình thu thập dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai thác và phân tích dữ liệu nhằm quản lý rủi ro trong giao dịch tín dụng (Trang 44 - 47)

Module Loan:

 Loan_Limit: Định mức được vay

 Loan_Col: Tài sản đảm bảo

 Loan_Dict: Bảng tham chiếu giá trị tài sản

 Loan_Info: Thơng tin chi tiết khoản vay Module CIF:

 CIF_Info: Thơng tin khách hàng (họ tên, nơi ở, khu vực…)

 CIF_Acct: Thơng tin tài khoản (ATM, VISA, E-Parter, Credit, debit…)

 CIF_Service: Thơng tin dịch vụ liên quan đến tài khoản (Thanh tốn trực tuyến, biến động số dư, thanh tốn viện phí, thu hộ tự động…)

Dữ liệu được chiết xuất từ hệ thống ngân hàng sẽ tập trung vào các phạm vi:

 Tập trung vào khách hàng cá nhân.

 Thu thập các khoản vay cĩ cả nhĩm nợ tốt và xấu.

 Thu thập các loại khoản vay về đầu tư bất động sản, mua ơ tơ, kinh doanh hộ cá thể, và tiêu dùng cá nhân đây là các loại vay thường xuyên được khách hàng lựa chọn.

3.6. Biến đổi dữ liệu, tính tốn sinh ra các bảng Bảng khách hàng Bảng khách hàng

Tên trƣờng Loại dữ liệu Mơ tả

MA_KHACH_HANG Kiểu ký tự Số định đanh trên Corebanking của khách hàng (CIF NO).

HO_TEN Kiểu ký tự Họ tên khách hàng

NGHE_NGHIEP Kiểu ký tự Nghề nghiệp của khách hàng XEP_LOAI_KHACH_HANG Kiểu ký tự Xếp loại khách hàng (Tốt, Trung

Binh, Xấu). Trong luận văn này lấy tất cả khách hàng đều cĩ được ngân hàng xếp loại Tốt.

GIOI_TINH Kiểu ký tự Giới tính (Nam, Nữ)

TUOI Kiểu số Tuổi

THU_NHAP_ON_DINH Kiểu ký tự Thu nhập cĩ ổn định khơng (Cĩ, khơng). Trong luận văn lấy tất cả khách hàng đều cĩ thu

nhập ổn định.

TT_HON_NHAN Kiểu ký tự Tình trạng hơn nhân (Đã kết hơn, chưa kết hơn)

CON_CAI Kiểu số Số con (1,2,3 ..)

CU_TRU Kiểu ký tự Tình trạng cư trú (Khu vực Trung tâm thành phố, KV1 thành phố, nơng thơn …)

Bảng hợp đồng vay: Bảng tổng hợp bản ghi hợp đồng vay, bảng này chứa hầu hết các thơng tin hợp đồng cho vay

Tên trƣờng Loại dữ liệu Mơ tả

MA_KHACH_HANG Kiểu ký tự Số định đanh trên Corebanking của khách hàng.

SO_HOP_DONG_VAY Kiểu ký tự Số hợp đồng cho vay

SO_TIEN_VAY Kiểu số Số tiền vay

MUC_DICH_VAY Kiểu ký tự Mục đích vay

GT_DAM_BAO

Kiểu ký tự Giá trị đảm bảo khoản vay (VD: Bất động sản, tín chấp bằng lương …)

CHI_SO_NHOM_NO

Kiểu ký tự Nhĩm nợ của khoản vay Tốt (nhĩm 1,2), Xấu (nhĩm 3,4,5..).

Bảng định mức hợp đồng vay: Bảng này quản lý chi tiết định mức cấp khoản vay căn cứ vào thu nhập, thời gian vay của hợp đồng vay.

Tên trƣờng Loại dữ liệu Mơ tả

MA_KHACH_HANG Kiểu ký tự Số định đanh trên Corebanking của khách hàng.

SO_HOP_DONG_VAY Kiểu ký tự Số hợp đồng cho vay DINH_MUC_DUOC_VAY Kiểu số Định mức được vay

3.7. Làm sạch dữ liệu

Xử lý outliers

 Loại bỏ những khoản vay kỳ hạn dưới 1 năm

 Loại bỏ những giao dịch liên quan đến thế chấp thương mại, bảo lãnh hải quan

 Loại bỏ các trường hợp cho vay ưu đãi với cán bộ nhân viên Ngân hàng Xử lý sai logic dữ liệu

 Xử lý null value & missing value

Giảm bớt dữ liệu

3.7.1.

Giảm bớt về biểu diễn các thuộc tính của dữ liệu, giảm bớt kích thước dữ liệu nhưng vẫn đảm bảo thu được các kết quả khai phá dữ liệu tương đương

Gom nhĩm dữ liệu là một trong những cách phổ biến để giảm kích thước dữ liệu:

 Gom thơng tin địa chỉ theo các khu vực

 Gom các hình thức nghề nghiệp

 Gom nhĩm tuổi

 Gom nhĩm định mức các khoản vay

3.8. Lựa chọn dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai thác và phân tích dữ liệu nhằm quản lý rủi ro trong giao dịch tín dụng (Trang 44 - 47)

Tải bản đầy đủ (PDF)

(68 trang)