Phương pháp làm sạch dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng mô hình logistic trong xây dựng mô hình đo lường xác suất không trả được nợ của khách hàng doanh nghiệp theo basel II tại NHTMCP công thương việt nam (Trang 51 - 52)

CHƯƠNG 2 PHƯƠNG PHÁP NGHIÊN CỨU THIẾT KẾ LUẬN VĂN

2.2. Phương pháp thu thập dữ liệu

2.2.1.2. Phương pháp làm sạch dữ liệu

a) Kiểm tra dữ liệu từ chi nhánh và TTCNTT:

- Dữ liệu tại warehouse và hệ thống hiện tại: Kiểm tra mức độ đầy đủ của warehouse và hệ thống hiện tại.

- Dữ liệu được lưu lại trong hồ sơ giấy: các chi nhánh (theo danh sách khảo sát) được yêu cầu cung cấp báo cáo tài chính của ba năm, báo cáo xếp hạng tín dụng và hồ sơ cho vay cho những năm được yêu cầu báo cáo tài chính để đảm bảo thu thập đầy đủ thông tin.

Mức độ đầy đủ của tất cả các file (bản mềm và bản cứng) từ mỗi chi nhánh sẽ được kiểm tra qua file “Control sheet”. File Control sheet bao gồm các trang được chia theo năm, mỗi trang đều có tên của chi nhánh để tiện cho việc kiểm tra.

Quá trình làm sạch dữ liệu giai đoạn 1, sau khi nhận file từ chi nhánh đến khi hoàn thiện dữ liệu, kéo dài 2 tháng.

- Chất lượng dữ liệu: Thu thập dữ liệu phải thống nhất với báo cáo chấm điểm, đề xuất xin vay và báo cáo tài chính. Vì vậy thông tin được điền vào các mẫu phải được kiểm tra lại.

Sau khi kiểm tra các file, các thông tin phải được tổng kết lại dựa trên các chỉ tiêu từ nguồn dữ liệu.

Dữ liệu cần tổng kết Nguồn dữ liệu

Ngành Đề xuất xin vay/ Báo cáo xếp hạng tín dụng

Ngành theo INCAS Báo cáo xếp hạng tín dụng Loại hình công ty Báo cáo xếp hạng tín dụng Tình trạng báo cáo tài chính Báo cáo tài chính

Bảng cân đối kế toán Báo cáo tài chính Báo cáo thu nhập Báo cáo tài chính

Báo cáo lưu chuyển tiền tệ Báo cáo tài chính

Các thông tin khác (Số lao động, vv) Báo cáo tài chính/ Đề xuất xin vay

I. Dòng tiền Báo cáo tài chính

II. Khả năng quản lý và kinh nghiệm Báo cáo xếp hạng tín dụng/Đề xuất xin vay III.1. Quan hệ tín dụng Báo cáo xếp hạng tín dụng/Đề xuất xin vay III.2. Quan hệ phi tín dụng, khác Báo cáo xếp hạng tín dụng/Đề xuất xin vay IV. Môi trường kinh doanh Báo cáo xếp hạng tín dụng/Đề xuất xin vay V. Các chỉ tiêu khác Báo cáo xếp hạng tín dụng/Đề xuất xin vay

Trong trường hợp thông tin chính xác, phải ghi chú và giải thích cho từng trường hợp trong file “Tổng hợp kết quả”. Đối với thông tin đầy đủ và chính xác, cột kiểm tra được để trống. Trên thực tế khi dữ liệu không trùng khớp thì phải liên lạc trực tiếp với chi nhánh (trung bình 3 chi nhánh một ngày). Tất cả các thông tin được xác nhận lại sẽ được điều chỉnh trong file “Thu thập thông tin khách hàng”

để phản ánh các thông tin khách hàng đã thu thập là chính xác.

b) Kiểm tra dữ liệu sau khi tạo biến (giai đoạn 2)

Việc kiểm tra dữ liệu sau khi tổng hợp thông tin thu thập nhằm xem xét tính hợp lý trong báo cáo tài chính và biến tài chính. Bên cạnh đó giai đoạn này cũng kiểm tra tính hợp lý giữa các chỉ số tài chính, biến tài chính và thông tin phi tài chính.

Các nguyên tắc làm sạch dữ liệu xem Phụ lục 02 – Minh họa logic kiểm tra dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng mô hình logistic trong xây dựng mô hình đo lường xác suất không trả được nợ của khách hàng doanh nghiệp theo basel II tại NHTMCP công thương việt nam (Trang 51 - 52)

Tải bản đầy đủ (PDF)

(111 trang)