CHƯƠNG I TỔNG QUAN
2. Thực trạng dữ liệutại ngân hàngTMCP Công ThươngViệt Nam
2.2. Thực trạng khả năng phát triển và ứngdụng nền tảng công nghệBig Data
Kiến trúc hạ tầng công nghệ của ngân hàng TMCP Công Thương Việt Nam hiện sử dụng nguồn dữ liệu lưu thơng đa phần đến từ nguồn có cấu trúc, trong đó có một phần nhỏ khối lượng dữ liệu là bán cấu trúc và phi cấu trúc. Tiến trình chọn lọc, tổng hợp, xử lý và phân tích các nguồn dữ liệu được thực hiện đồng bộ và nhất quán trong hệ thống ngân hàng. Các quy trình hoạt động và xử lý dữ liệu được tự động hóa, có các quy chuẩn
và nguyên tắc trong thiết kế mơ hình dữ liệu và khối OLAP đa chiều. Nguồn dữ liệu được lưu trữ tập trung trong hệ cơ sở dữ liệu quan hệ, chưa có tiến trình xử lý các luồng
dữ liệu phân tán trong thời gian thực. Nguồn thông tin nội bộ được lưu trữ chủ yếu trên hạ tầng on-premise1, có các dự án nghiên cứu và chuyển đổi hạ tầng dữ liệu lên nền tảng
Cloud Computing. Tuy nhiên, do một số vấn đề bảo mật thơng tin nhạy cảm và tính chất
đặc biệt của ngành tài chính ngân hàng, các dự án chuyển tiếp và thay đổi hạ tầng lưu trữ từ on-premise sang on-demand2 vẫn chưa được nghiên cứu triển khai thành công.
Ngân hàng Công Thương hiện đang thực hiện tái cấu trúc hệ sinh thái dựa trên nền tảng tích hợp cơng nghệ Big Data. Một số ứng dụng công cụ Big Data vào trong hoạt động ngân hàng đã được triển khai thực hiện và sử dụng phổ biến trên tồn hệ thống ngân hàng, ví dụ như kỹ thuật xử lý OLTP và kỹ thuật xử lý OLAP, hệ thống lưu trữ In- memory DB, khung kiến trúc EDW, ngơn ngữ lập trình R, ngơn ngữ lập trình Python, một số cơng cụ hỗ trợ phân tích mơ tả và phân tích dự đốn dựa trên nền tảng ứng dụng BI và Data Mining... Ngân hàng Công Thương Việt Nam sử dụng hạ tầng lưu trữ trung gian tương tác giữa hệ thống máy chủ và các hệ thống phần mềm khác trong ngân hàng,
đảm bảo việc quản trị hiệu suất hoạt động và tránh quá tải trên đường truyền dữ liệu, hạn chế các trường hợp xảy ra rủi ro dữ liệu và rò rỉ hệ thống.
1 On-premise: Thuật ngữ ám chỉ hạ tầng cơ sở đặt tại tổ chức doanh nghiệp, mang hàm ý chương trình hoặc
phần mềm được cài đặt trên phần cứng cùng các server, và được quản lý bởi nhân viên IT của công ty
2 On-demand: Thuật ngữ ám chỉ việc lưu trữ hoặc cài đặt các hệ thống hay chương trình phần mềm trên nền
tảng Cloud Computing. Mọi hoạt động cũng như xử lý bảo mật đều được thực hiện trên nền tảng và giao diện internet thay vì hạ tầng kiến trúc nội bộ truyền thống.
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Cơng Thương Việt Nam Khóa luận tốt nghiệp
Đặc điểm nổi bật trong kiến trúc hạ tầng công nghệ ngân hàng TMCP Công Thương
Việt Nam nằm ở kiến trúc hệ thống cơ sở dữ liệu ngân hàng EDW.
Hình 2-1 Kiến trúc hệ thống EDWcủa ngân hàng TMCP Công Thương ViệtNam (Nguồn: Vietinbank)
Dữ liệu đổ vào hệ thống EDW đến từ 22 hệ thống nguồn trong nội bộ ngân hàng như CBS, FTP, LOS, ATMs, Internet Banking, Credit Scoring... bao gồm nhiều lĩnh vực nghiệp vụ như cho vay, huy động vốn, tài trợ thương mại, quản trị rủi ro, quản trị tài chính. Thơng qua các quy trình ETL, dữ liệu chuyển tiếp đến vùng xử lý trung gian Staging/ ODS, sau đó tiếp tục đổ vào Data Warehouse thơng qua quy trình ETL. Tất cả nguồn dữ liệu lưu trữ tại Data Warehouse đều được chuẩn hóa dưới dạng 3NF, phân chia thành các module dữ liệu nhỏ hơn và chuyển tiếp lưu trữ trong Data Mart thơng qua quy trình ETL. Tại Data Mart, các module dữ liệu được phân quyền truy xuất đến các phòng ban tùy theo mảng nghiệp vụ và đặc điểm danh mục báo cáo.
Phân tích tín dụng
Chuyển tiền Ngân hàng điện tử Khối tài chính Tài chính
Phân tích sổ cái GL (General Ledger)
Quản lý tài sản Nợ - Có
Khối quản lý rủi ro
Phân tích AML Phân tích chống rửa tiền AML (Anti Money Laundring)
Phân tích Rủi ro
Rủi ro tín dụng Rủi ro Hoạt động Rủi ro thị trường Phân tích tuân thủ Phân tích tuân thủ
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Sau Data Mart, dữ liệu tiếp tục được vận chuyển đến User Access Layer. Tại tầng này, các module dữ liệu trong Data Mart được chia thành các vùng thông tin theo chủ đề dưới dạng Universe (Semantic Layer - Lớp ngữ nghĩa) thông qua ứng dụng Information Design Tool. Cụ thể, tầng User Access bao gồm các ứng dụng BI hỗ trợ người dùng nghiệp vụ và các phòng ban chức năng tạo lập báo cáo và khai thác thông tin trên hệ thống EDW.
FoWcr5 θ =UbkFoWer5 Auditing * BAOLQ đ Sj ô08 * DQS HOQT it A-1LCM Data Federabon b - MIS
4 CPR-KhAch hảng doanh nςh∙ep
® - CRD-Thé
* FlN-KhS τ⅛chrtι
~ - HQO-Trv sõ đirti
' HRM-Tfi tuẻ nợuõn nhân Lrt
CPR 4frãch hãng doanh nghtêp CRD-Thé
FlN-KhSTarchrti HQO-Trv SÒ Chrih HRM-Tri luẻ nguSn nhán Llt OPO-KhS vãn hành OTH-Khác
RMD-KhS quán tn rủ ro RTl-Khadi háng cá nhãn TRS-Mrti doanh '.õn vã TT
Hình 2-2 Một số chủ đề báo cáo nghiệp vụ dựng sẵn trên công cụ BI Launchpad [61]
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Cơng Thương Việt Nam Khóa luận tốt nghiệp
Hình 2-3 Kết nối các nguồn dữ liệu trên BI Platform với công cụ SAP Crystal Report [61]
Ngân hàng Công Thương lưu trữ thống nhất tất cả nguồn thông tin cá nhân và dữ liệu lịch sử giao dịch của khách hàng tại duy nhất một hệ thống quản lý chung. Các nguồn thông tin về cùng một khách hàng lưu trữ trên nhiều hệ thống nghiệp vụ khác nhau đều được tích hợp lại trong hệ thống Core Sunshine thông qua mã CIF1, hạn chế được tối đa tình trạng silo thơng tin và trùng lắp dữ liệu khi triển khai công nghệ CTI2. Đặc biệt ngân hàng Công Thương xây dựng hệ thống cảnh báo sớm rủi ro tín dụng khách
hàng EWS (Early Warning System), tích hợp và đánh giá mức độ rủi ro thơng qua ba hệ
thống công nghệ thông tin: Hệ thống EDW, Hệ thống xếp hạng tín dụng nội bộ và Hệ
1 CIF (Customer Information File - Mã số định danh khách hàng): Mỗi khách hàng khi giao dịch với ngân
hàng sẽ sử dụng số CIF duy nhất, thường là một dãy gồm 8 chữ số.
2 CTI (Computer Telephony Integration) là một thuật ngữ chung cho bất kỳ công nghệ nào cho phép kết hợp
điện thoại với máy tính cá nhân. Thuật ngữ này được sử dụng chủ yếu để mô tả các ứng dụng tương tác dựa trên máy tính giúp người dùng sử dụng hiệu quả hơn, mặc dù nó cũng có thể phụ thuộc vào các chức năng như định tuyến cuộc gọi tự động dựa trên máy chủ.