Trong đó:
Vùng nguồn dữ liệu: được tổng hợp từ các hệ thống: ngân hàng lõi, OF- oracle finance, ATM – hệ thống thẻ tài khoản, CRS- xếp hạng tín dụng, BT- branch teller, VIB4U ngân hàng điện tử...
Vùng dữ liệu đệm: Chứa các dữ liệu tạm để tổng hợp lên kho dữ liệu, sau khi dữ liệu được tổng hợp vùng dữ liệu này sẽ được giải phóng vào thời điểm khóa ngày hôm sau
Vùng dữ liệu chuyên đề: được tổng hợp thành các chuyên đề mà ngân hàng đang hoạt động gồm: GL các thông tin kế toán, Deposit- khu vực dữ liệu huy động, Loan- Khu vực dữ liệu về các khoản vay cầm cố, Treasury- dữ liệu về nguồn vốn....
Kho dữ liệu KM là giải pháp tổng thể tuy nhiên đối với bài toán phân lớp dự báo rủi ro được nêu ra ở chương 3 thì dữ liệu trên kho dữ liệu là chưa đủ. Hiện tại trên kho dữ liệu chỉ có phần dữ liệu về lịch sử giao dịch tín dụng và các thông tin về khả năng trả nợ các thông tin về khách hàng và một thông tin về khả năng trả nợ của khách hàng vẫn nằm trên hệ thống core banking và hệ thống xếp hạng tín dụng. Chính vì vậy trước khi thực hiện bài toán phải có bước chuyển đổi dữ liệu từ hệ thống XHTD vào kho dữ liệu
2.Tích hợp dữ liệu vào kho dữ liệu
Việc tích hợp dữ liệu vào kho dữ liệu được xây dựng bằng công cụ Oracle data warehouse builder 10G, sau khi thiết kế lược đồ dữ liệu dữ liệu và thiết kế sơ đồ ánh xạ dữ liệu trên công cụ Oracle dataware house builder, sử dụng chính công cụ này để sinh code PLSQL để chuyển vào công cụ ETL quản lý và thực thi để chuyển dữ liệu từ nguồn sang kho dữ liệu
2.1 Thiết kế lược đồ dữ liệu
Việc thiết kế lược đồ dữ liệu cho bài toán phân lớp dự báo rủi ro tín dụng là các thiết kế bổ xung các thông tin cần thiết cho bài toán nhưng chưa có trong lược đồ của kho dữ liệu đó là thông tin về trạng thái nợ của khách hàng, thông tin về khách hàng…