Nghiên cứu đề cập đến thực trạng ứng dụng và những thách thức cơ bản của Big Data đối với các NHTM tại Việt Nam và đưa ra các giải pháp khuyến nghị theo hướng tích hợp dữ liệu có cấu trúc truyền thống từ kho dữ liệu với các hệ thống nội bộ và dữ liệu phi cấu trúc trên Big Data.
Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam Đào Mỹ Hằng Đặng Thu Hoài Học viện Ngân hàng Ngân hàng Đại chúng Ngày nhận: 16/09/2020 Ngày nhận sửa: 06/10/2020 Ngày duyệt đăng: 21/10/2020 Dữ liệu có tầm ảnh hưởng quan trọng hoạt động kinh doanh ngân hàng thương mại (NHTM)- lĩnh vực kinh doanh ngành dịch vụ đặc thù dựa sở thông tin Sự xuất liệu lớn (Big Data) bối cảnh kỷ nguyên số NHTM kỳ vọng nguồn tài nguyên khổng lồ mang đến nhìn đa chiều giúp ngân hàng đưa định sáng suốt Tuy nhiên, việc ứng dụng Big Data tốn khó với nhiều thách thức NHTM Việt Nam Nghiên cứu đề cập đến thực trạng ứng dụng thách thức Big Data NHTM Việt Nam đưa giải pháp khuyến nghị theo hướng tích hợp liệu có cấu trúc truyền thống từ kho liệu với hệ thống nội liệu phi cấu trúc Big Data Từ khóa: Dữ liệu lớn (Big Data), thách thức, ngân hàng thương mại Challenges in applying Big Data for the Vietnam commercial banks Abstract: Data has an important influence on the business operations of each commercial bank Commercial banks expect that the appearance of Big Data in the context of the digital era is a huge resource that can provide a multidimensional view to help banks make informed decisions However, applying Big Data is difficult for commercial banks in Vietnam The study discusses the application status and fundamental challenges of Big Data to commercial banks in Vietnam and recommends solutions Keywords: Big Data, Challenges, Commercial Banks Hang My Dao Email: myhang@hvnh.edu.vn Banking Academy of Vietnam Hoai Thu Dang Email: danghoai.bav@gmail.com PvcomBank Tạp chí Khoa học & Đào tạo Ngân hàng Số 224+225- Tháng 1&2 2021 80 © Học viện Ngân hàng ISSN 1859 - 011X ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI Giới thiệu Trong bối cảnh cạnh tranh khốc liệt thị trường tài chính- ngân hàng (TC- NH), NHTM bước ứng dụng chuyển đổi số với trọng tâm khách hàng (KH) nhằm không ngừng mang đến trải nghiệm tốt cho KH Để làm điều đó, NHTM cần có chiến lược để hiểu nhóm nhu cầu KH, từ có định phù hợp sách quản trị hoạt động Tại Việt Nam, tính đến tháng 01/2020, có khoảng 68 triệu người (khoảng 70% dân số) dùng internet, 65 triệu người (67% dân số) dùng mạng xã hội 146 triệu lượt kết nối điện thoại (khoảng 150% dân số) (theo We are Social, 2020, “Digital 2020 global digital yearbook”), thông tin người dùng internet lưu giữ lại thành liệu theo đơn vị bit Báo cáo nhận định, gia tăng nguồn liệu hoàn tồn làm rung chuyển ngành dịch vụ TC- NH theo hướng tích cực liệu thu thập, phân tích, giải thích liên quan đến xu hướng tài chính, từ vẽ nên tranh chi tiết xu hướng tiêu dùng điều mà KH tìm kiếm Đây sở quan trọng để NHTM cá nhân hóa dịch vụ đến KH, đáp ứng mong muốn KH tối ưu định hướng sách sản phẩm, đặc biệt nhóm sản phẩm có tính số hóa cao, đồng thời xác định rủi ro kịp thời thời điểm có thay đổi phù hợp điều hành, quản trị hoạt động kinh doanh ngân hàng để đạt mục tiêu lớn Tuy nhiên, việc khai thác, ứng dụng triển khai Big Data đặt nhiều thách thức cho nhà quản trị NHTM phận công nghệ thông tin (CNTT), đặc biệt với NHTM với mức vốn nhỏ Để Big Data trở thành nguồn lực ngân hàng, NHTM cần trả lời câu hỏi: (i) Làm để khai thác giá trị từ nguồn liệu Big Data cách hiệu quả? (ii) Dữ liệu có tương thích tích hợp với phân hệ hay không? (iii) Thực trạng điều kiện ngân hàng đâu, có phù hợp để ứng dụng triển khai khơng? Để trả lời câu hỏi đó, nội dung trình bày theo trình tự Tổng quan Big Data, thực trạng ứng dụng Big Data NHTM Việt Nam, thách thức Big Data giải pháp khuyến nghị NHTM Tổng quan Big Data 2.1 Khái niệm Big Data Big Data dùng để tập liệu với kích thước vượt khả lưu trữ, quản lý phân tích phần mềm sở liệu điển hình (Manyika, 2011) Big Data hình thành từ việc sử dụng ngày tăng công cụ điện tử hệ thống thông tin, tổ chức cá nhân hình thành đời thường hình thức khác nhau, bao gồm nguồn liệu chủ yếu sau: (i) liệu hành chính; (ii) liệu hoạt động thương mại; (iii) liệu từ thiết bị cảm biến thiết bị chụp ảnh vệ tinh, cảm biến đường, cảm biến khí hậu; (iv) liệu từ thiết bị theo dõi; (v) liệu từ hành vi (như tìm kiếm trực tuyến); (vi) liệu từ thông tin ý kiến, quan điểm cá nhân phương tiện thông tin xã hội Cụ thể, liệu Big Data chia thành loại theo hình thức sau: - Dữ liệu có cấu trúc (Structured): liệu lưu trữ, truy cập xử lý theo hình thức cố định truyền thống, loại liệu phổ biến tổ chức - Dữ liệu khơng có cấu trúc (Unstructured): Số 224+225- Tháng 1&2 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 81 Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam liệu khơng có khn mẫu cấu trúc cố định, không phù hợp lưu trữ quản lý với cấu trúc thông thường hệ quản trị sở liệu truyền thống Loại liệu có khối lượng lớn, khơng có cấu trúc thay đổi nhanh, đặt nhiều thách thức xử lý quản trị liệu để khai thác giá trị từ Ví dụ liệu từ mạng xã hội Facebook, Twitter, Instagram,… nguồn liệu khơng có cấu trúc kết hợp từ văn bản, ảnh, video - Dữ liệu bán cấu trúc (Semi-structured): Dữ liệu kiểu bán cấu trúc bao gồm tất mẫu liệu Chúng ta thấy liệu bán cấu trúc mẫu khơng định nghĩa với bảng với mối quan hệ hệ quản trị quan hệ liệu quan hệ (DBMS- Relational Database Management System) Loại liệu thường thể tập tin ngôn ngữ đánh dấu mở rộng (XML- Extensible Markup Language), có chức truyền liệu mô tả nhiều loại liệu khác 2.2 Đặc tính Big Data Big Data có đặc trưng sau (mơ hình 5Vs Big Data- theo Issues with big data, Gartner, 2018): - Khối lượng liệu (Volume): Đây đặc điểm tiêu biểu Big Data, khối lượng kích thước liệu lớn Kích cỡ Big Data ngày tăng lên, dự kiến đến năm 2025 IDC dự đoán số liệu 175 zettabytes (1021 bytes) tương ứng với khoảng 59% công suất công nghiệp cung cấp ổ cứng (HDD) toàn cầu (theo David Reinsel cộng sự, 2018), nên tổ chức cần sử dụng công nghệ “đám mây” đáp ứng khả lưu trữ Big Data - Tốc độ (Velocity): Tốc độ hiểu theo hai khía cạnh: (i) Khối lượng liệu 82 gia tăng nhanh; (ii) Xử lý liệu nhanh mức thời gian thực (real time) tính mili giây Công nghệ xử lý Big Data ngày cho phép xử lý tức trước chúng lưu trữ vào sở liệu - Đa dạng (Variety): Big Data cho phép liên kết phân tích nhiều dạng liệu khác nhau, ví dụ kết nối thơng tin người dùng tảng mạng xã hội khác - Độ tin cậy/ xác (Veracity): Đây tính chất phức tạp Big Data phương tiện truyền thông xã hội, mạng xã hội ngày phổ biến với đa dạng người dùng tương tác chia sẻ nên việc xác định độ tin cậy xác liệu ngày phức tạp - Giá trị (Value): Giá trị đặc điểm quan trọng Big Data, bắt đầu triển khai xây dựng Big Data việc phải làm xác định giá trị thông tin mang lại nào, liệu tự thân không sinh giá trị, xử lý khai phá hợp lý chúng phát huy lợi ích Dựa cân đối nguồn lực định triển khai Big Data hay không 2.3 Tầm quan trọng ứng dụng Big Data ngân hàng thương mại Big Data với nguồn liệu khổng lồ, cập nhật phút, có vai trị lớn lĩnh vực ngân hàng với ứng dụng cụ thể như: phân tích, phân loại hài lịng hành vi KH; phân tích phát cảnh báo, ngăn chặn hành vi rủi ro, giả mạo; tối ưu hóa hoạt động xử lý liệu trình vận hành, phân tích hỗ trợ định Tiếp cận, nghiên cứu khai thác Big Data mang đến nhiều lợi ích cho ngân hàng kinh doanh như: tiết giảm chi phí; tăng thời gian phát triển tối ưu hóa Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2 2021 ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI sản phẩm; đồng thời hỗ trợ ban lãnh đạo, cán ngân hàng đưa định hợp lý hơn; tiết kiệm thời gian xử lý thông tin KH phòng chống rủi ro gian lận… Nghiên cứu Manyika, J (2017) cho thấy, khoảng 30% tất cơng việc NHTM tự động hóa thơng qua cơng nghệ chìa khóa cho vấn đề nằm Big Data Điều giúp NHTM tiết kiệm đáng kể chi phí giảm rủi ro cách loại bỏ chi phối yếu tố người số quy trình quan trọng Thực tế, thân NHTM có nguồn liệu lớn từ KH qua giao dịch hệ thống ngân hàng lõi (corebanking system) Nhưng bó hẹp lịch sử giao dịch chưa đủ để NHTM hiểu nhu cầu KH, thời đại người ngày phụ thuộc vào Internet, nguồn liệu lớn phản ánh rõ mong muốn, thói quen hành vi KH lại nằm mạng xã hội Facebook, Twitter, Instagram,… thông tin sử dụng Internet Theo Oracle (2016), 84% giám đốc điều hành ngân hàng khảo sát đồng ý KH tìm kiếm trải nghiệm phù hợp, cá nhân ngân hàng cung cấp cho người dùng họ cần, ngân hàng thúc đẩy doanh thu hàng năm cao 18% Do vậy, vấn đề cấp thiết đặt cần kết nối liệu với để hình thành nhìn tổng quan KH (3600 view) Khi ứng dụng Big Data, NHTM sử dụng liệu từ mạng xã hội để ngân hàng đưa chiến lược kinh doanh sát với nhu cầu nhóm KH mục tiêu Kết nghiên cứu Analytics, M (2016) cho thấy việc sử dụng Big Data để đưa định tiết kiệm tới 15- 20% ngân sách tiếp thị ngân hàng Có thể nói, khai thác Big Data hội tuyệt vời để không tiết kiệm chi phí mà cịn tạo thêm doanh thu thông qua chiến lược tiếp thị nhắm đến mục tiêu Đồng thời, từ nguồn thông tin dồi từ Internet mạng xã hội, ngân hàng tương tác chặt chẽ với KH, cải thiện dịch vụ KH cách nhanh chóng, giảm ảnh hưởng độ trễ thời gian Bởi hệ thống truyền thống nhận phản hồi KH bộc lộ nhiều hạn chế, cần cải thiện dần hệ thống thiết kế với công nghệ xử lý Big Data công nghệ xử lý ngôn ngữ tự nhiên Hơn nữa, cơng nghệ Big Data sử dụng để lưu trữ liệu trước chúng đưa vào kho chứa liệu (Data Warehouse) Sự kết hợp công nghệ Big Data có tốc độ xử lý mức thời gian thực với kho liệu giúp cho ngân hàng thoát khỏi việc không khai thác hết giá trị liệu độ trễ thời gian Do Big Data ứng dụng cơng nghệ giúp kiểm sốt chặt chẽ cập nhật liệu liên tục ưu việt liệu truyền thống điểm: liệu đa dạng hơn, lưu trữ liệu lớn hơn, truy vấn nhanh độ xác cao (theo Cornelia Hammer cộng sự, 2017) Tóm lại, Big Data hội đồng thời thách thức đặt cho NHTM thời đại số Một làm chủ Big Data từ việc trích xuất thơng tin xác hơn, hữu ích với chi phí thấp NHTM có hội thành công lớn bối cảnh cạnh tranh ngày khắc nghiệt nhu cầu phát sinh đa dạng từ KH 2.4 Cách tiếp cận Big Data Hiện có nhiều cách tiếp cận triển khai giải pháp Big Data tổ chức, nhiên dựa sở tảng cơng nghệ, có ba cách tiếp cận phổ biến áp dụng (i) cách tiếp cận truyền thống, (ii) cách tiếp cận tiến hóa (iii) cách tiếp Số 224+225- Tháng 1&2 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 83 Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam cận theo phương pháp lai (Nasser & Tariq, 2015) Các ngân hàng cân nhắc tùy vào điều kiện thực tế quy mô, nguồn lực tại, mục tiêu mà đơn vị có chiến lược khác Cụ thể: Thứ cách tiếp cận truyền thống mang tính cách mạng, nghĩa ngân hàng thiết lập mơi trường tính toán Big Data chuyển tất liệu sang tảng mới, ví dụ Hadoop Vì tất q trình xử lý, phân tích, báo cáo lập mơ hình thực mơi trường với đầy đủ thông tin, liệu thông qua ứng dụng cơng nghệ phân tích (Business Intelligence & Analytics) để chuyển liệu thô thành mảng thơng tin hữu ích tồn cảnh q khứ, dự đoán tương lai tổ chức hướng đến xây dựng giải pháp kinh doanh thông minh Thứ hai cách tiếp cận tiến hóa Big Data xử lý tảng Business Intelligence (BI) truyền thống Dữ liệu thu thập phân tích thơng qua cơng cụ có cấu trúc khơng có cấu trúc sau đầu chuyển tiếp đến kho liệu Các tiện ích báo cáo lập mơ hình truyền thống truy cập suy nghĩ ghi trực tuyến từ nguồn truyền thông xã hội Tuy nhiên, cách tiếp cận tiến hóa đáp ứng nhiều u cầu mơi trường Big Data, có hầu hết vấn đề BI cổ điển, trở thành nút cổ chai thông tin trực tuyến từ nguồn Big Data phân tích sức mạnh biến đổi BI kho liệu Thứ ba phương pháp lai mà công nghệ Big Data truyền thống sử dụng liệu phân phối hai tảng, ví dụ cách tiếp cận giải pháp Hana từ SAP (công ty dẫn đầu thị trường phần mềm ứng dụng doanh nghiệp giới, có trụ sở Đức) Đây giải pháp phân tích tích hợp liệu, tính tốn, tảng 84 chạy cơng nghệ điện tốn nhớ đệm (In-memory computing), cơng nghệ chạy đồng thời hệ thống xử lý giao dịch trực tuyến (OLTP- Online Transaction Processing system), hệ thống xử lý phân tích trực tuyến (OLAP- Online Analytical Processing system) xử lý nhớ đệm máy tính, cho phép chuyển đổi dịng liệu thành cột liệu để gia tăng khả xử lý liệu cho hệ thống, tối ưu hiệu suất phân tích liệu ứng dụng cho tập đoàn lớn toàn cầu Unilever, Colgate Palmolive… Thực trạng ứng dụng Big Data ngân hàng thương mại Việt Nam Theo kết khảo sát Vietnam Report (2019) với NHTM hoạt động Việt Nam gần 3/4 (75%) số ngân hàng hỏi cho biết ưu tiên cho hoạt động nghiên cứu áp dụng công nghệ hệ thống quản lý, phục vụ KH; 3/5 (60%) NHTM dự định đầu tư nâng cao hệ thống quản trị doanh nghiệp tiên tiến Trên thực tế, khu vực dịch vụ TC - NH Việt Nam có phản ứng nhanh so với khu vực khác việc chủ động nghiên cứu ứng dụng khoa học - công nghệ Cách mạng công nghiệp 4.0 vào hoạt động kinh doanh quản trị Theo thống kê từ Vietnam Report (2019) 59% doanh nghiệp dự kiến sử dụng công cụ Big Data để thúc đẩy chuyển đổi số hiệu Đối với NHTM lớn có số động thái tiêu biểu như: - Năm 2020 TPBank thức đưa vào sử dụng hai giải pháp công nghệ Big Data FIS triển khai bao gồm cấu phần chính: Kho liệu Data Lake xây dựng dựa tảng mở Hortonworks Data Platform (HDP)- lưu trữ Big Data từ nhiều nguồn, bao gồm nhóm liệu thơ, phi Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2 2021 ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI Biểu đồ Top chiến lược ưu tiên NHTM năm 2019- 2020 Nguồn: Vietnam Report (2019), Khảo sát NHTM Việt Nam cấu trúc Nền tảng xây dựng mơ hình học máy Watson Studio Local, kết hợp thiết bị IBM Integrated Analytics System (IIAS) tối ưu cho việc phân tích liệu với tốc độ cao, giảm thời gian huấn luyện mơ hình (đây hợp đồng hoàn thành Big Data cho NHTM Việt Nam) - Năm 2019 Vietcombank ký hợp tác với FIS triển khai thực Dự án “Mua sắm phần mềm quản trị nhân (HRM)” gồm phân hệ chính: Quản lý thơng tin nhân sự, Quản lý chi phí tiền lương, Quản lý tuyển dụng, Quản lý đào tạo, Quản lý đánh giá cán Quản lý nhân tài - VietinBank đã xây dựng chiến lược lộ trình quản lý khai thác tài sản liệu trước thức ứng dụng Big Data trọng củng cố xây dựng tảng hạ tầng liệu bao gồm dự án Kho liệu doanh nghiệp (EDW- Enterprise Data Warehouse) triển khai xây dựng vòng năm bao gồm tích hợp 200 hệ thống nguồn, BI, Quản lý liệu tập trung (MDM- Master Data Management) - MB hợp tác với Infosys, Amigo triển khai kho liệu tập trung công cụ báo cáo quản trị… Mặt khác, bối cảnh thời gian gần xâm nhập công nghệ vào lĩnh vực tài (Fintech- Cơng nghệ tài chính) ngày sâu rộng, ví dụ ví Momo với lượng người dùng năm 2019 tăng từ 10 triệu (đầu 2019) lên 15 triệu (cuối 2019), với 100.000 điểm chấp nhận toán (momo.vn) cho thấy tiện lợi kèm với xu hướng tiêu dùng, toán online KH tạo nguồn liệu lớn quan trọng tiết lộ hành vi KH, nên 81,8% NHTM Việt Nam dự định hợp tác với công ty Fintech lĩnh vực nghiên cứu liệu tài có bao gồm Big Data (Vietnam Report, 2019) Cụ thể áp dụng Big Data chiến lược kinh doanh đặt KH trọng tâm, nghiên cứu “Ứng dựng liệu lớn hoạt động quản trị quan hệ KH NHTM Việt Nam” năm 2019, TS Phan Thanh Đức cộng sử dụng phương pháp BDMM (Big Data Maturity Model) mô hình Hortonworks (Hortonworks, 2019) để đo lường giám sát trạng thái liệu, xác định mức độ trưởng thành Big Data NHTM Việt Nam Thông qua khảo sát 36 NHTM, câu hỏi nhóm nghiên cứu sử dụng nhằm xác định mức độ trưởng thành Big Data NHTM Việt Nam gồm phần chính: (1) Định hướng chiến lược, (2) Dữ liệu Phân tích Số 224+225- Tháng 1&2 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 85 Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam Biểu đồ Kế hoạch mở rộng hội hợp tác với công ty Fintech NHTM Việt Nam 2019- 2020 Nguồn: Vietnam Report, (2019), Khảo sát NHTM Việt Nam liệu, (3) Công nghệ Cơ sở hạ tầng, (4) Tổ chức Kỹ & (5) Quản lý Quy trình Kết thu được: 72% NHTM (26 ngân hàng) dừng mức độ 1Nhận thức, 25% NHTM (9 ngân hàng) có mức độ trưởng thành liệu lớn mức độ 2- Khai phá, 3% NHTM (1 ngân hàng) đánh giá mức độ 3- Tối ưu, mức độ 4- Chuyển đổi chưa có NHTM đạt Trong đó, nhóm ngân hàng nhỏ chủ yếu nằm mức độ 1- Nhận thức: Ngân hàng quan tâm đến ứng dụng Big Data bắt đầu có nghiên cứu phân tích liệu, phân tích Big Data Theo khảo sát sơ từ số cán công tác NHTM nhỏ cơng tác đại hóa ngày trọng hơn, thể qua danh mục kế hoạch mua sắm CNTT, tỉ trọng chi phí phân bổ cho đầu tư dự án CNTT- vận hành- đại hóa ngân hàng chi phí hoạt động hàng năm có xu hướng tăng Các dự 86 án trọng xây dựng phần hệ thống chuẩn hóa quy trình nâng cao lực quản trị hệ thống quản trị nội (Management Information System- MIS) bao gồm cấu phần tình hình kinh doanh; tình hình nhân sự; quản trị rủi ro; hệ thống báo cáo thống kê; hệ thống quản lý KH… với kỳ vọng hướng đến tương lai tích hợp liệu hệ thống xây dựng thành kho liệu tích hợp ứng dụng Big Data Tuy nhiên với hạn chế quy mơ, nguồn chi cịn hạn hẹp hạn chế từ sở hạ tầng nhân lực triển khai nên hệ thống liệu NHTM nhỏ cịn ít, lưu trữ độc lập, chưa có tính liên kết chưa phủ đủ mảng liệu cần quản lý tự động, ví dụ có NHTM thực theo dõi nhân sự, tiền lương, KPI file Excel tổng hợp từ đơn vị gửi lên; chưa có đủ ứng dụng ngân hàng điện tử Mobile banking; chức chuyển tiền nhanh 24/7 liên ngân hàng; chưa có hệ thống theo dõi thơng tin KH sử dụng tiện ích ngân hàng điện tử… Vì để hướng đến ứng dụng Big Data chặng đường dài với nhóm ngân hàng Như nhận thấy, so với quy mô tổng thể hệ thống ngân hàng Việt Nam, việc nghiên cứu, chủ động ứng dụng Big Data cịn nhiều khó khăn tiềm ứng dụng chủ yếu vấn NHTM lớn- nhóm mạnh sẵn có khoa học- cơng nghệ Cịn nhóm NHTM nhỏ với mơ hình hoạt động theo truyền thống chủ đạo với hạn chế quy mơ nên cịn giai đoạn nghiên cứu sơ khai Thách thức ứng dụng Big Data ngân hàng thương mại Việt Nam Về nguồn lực tài Theo Vietnam Report (2019), việc yêu cầu nguồn vốn đầu tư lớn khó khăn lớn Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2 2021 ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI tổ chức tiếp cận ứng dụng công nghệ Hầu hết doanh nghiệp Việt Nam muốn sử dụng Big Data phải thông qua công ty cung cấp dịch vụ nước ngồi với chi phí quyền đội ngũ tư vấn chuyên nghiệp dẫn đến chi phí cao Tính riêng sở hạ tầng - chi phí trả trước, chi phí tảng Big Data Hadoop Spark chia tỷ lệ tương ứng với lượng lưu trữ, tính tốn sức mạnh xử lý mà NHTM sử dụng, ví dụ cụm Hadoop khuyến nghị máy chủ Intel tầm trung, có giá từ 4.000 - 6.000 USD cho không gian đĩa 3TB 6TB, cụm Hadoop petabyte có giá khoảng triệu USD Chi phí nhân triển khai, ví dụ chi trả cho chuyên gia Hadoop toàn thời gian tiêu tốn từ 70.000 150.000 USD/năm, mức giá sử dụng nhân th ngồi trung bình từ 81 - 100 USD/giờ Ngồi cịn có chi phí khác chi phí quản lý bảo trì, chi phí kết nối mạng, chi phí cho nhà cung cấp proxy, chi phí bảo quản liệu… Các NHTM lớn có đủ vốn đầu tư, song họ phải cân nhắc đặt tốn chi phí, lợi nhuận ưu tiên chiến lược kế hoạch phát triển năm Còn NHTM nhỏ việc đầu tư cịn thận trọng để cân đối chi phí hoạt động vận hành đầu tư dài hạn cho đại hóa hướng đến Big Data Về nguồn nhân lực Hiện để triển khai ứng dụng khai phá Big Data tạo nên giá trị từ liệu yêu cầu nhân có chất lượng cao việc tuyển dụng cạnh tranh, không Việt Nam mà NHTM khu vực Asean cạnh tranh để chiêu mộ tài nên nguồn nhân lực khan NHTM đặc biệt khó khăn với NHTM nhỏ, nơi mà sức hấp dẫn quy mô, thương hiệu thấp Các NHTM đối mặt với vấn đề thiếu người tài để tận dụng sức mạnh Big Data, thiếu kiến thức thống kê, khai phá liệu công nghệ sử dụng Big Data như: hệ xử lý phân tán, công nghệ ảo hóa, cơng nghệ điện tốn đám mây, sở liệu bên nhớ (IMDS - In-memory Database system) Mặt khác, nhà quản lý NHTM thường xuất phát từ nghiệp vụ, phát triển hệ thống phần riêng biệt theo nhu cầu phát sinh, chủ yếu vấn đề liên quan đến kinh doanh, nên cần có tư vấn từ phận CNTT để xác định đủ định hướng sâu sắc xây dựng chiến lược phát triển đồng hệ thống cơng nghệ số hóa đầy đủ dài hạn Vì vậy, muốn triển khai ứng dụng tận dụng cách tối ưu hóa tiềm Biểu đồ Top khó khăn doanh nghiệp gặp phải tiếp cận ứng dụng công nghệ Nguồn: Vietnam Report, (2019), Báo cáo Vietnam CEO Insight 2019 Số 224+225- Tháng 1&2 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 87 Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam Biểu đồ Đánh giá kỹ nhân viên thời đại số Nguồn: Vietnam Report, (2019), Báo cáo Vietnam CEO Insight 2019 Big Data nhà quản trị cần có bước chuẩn bị thật kỹ lưỡng chiến lược phát triển đặc biệt yếu tố người, dù công nghệ có tiên tiến đến đâu người yếu tố cốt lõi vận hành thay Về công nghệ Với khối lượng liệu khổng lồ vậy, rõ ràng việc lưu trữ xử lý Big Data thách thức không nhỏ Hạ tầng CNTT doanh nghiệp Việt Nam nói chung NHTM nói riêng cịn chưa đủ mạnh để khai thác cách tối ưu hết tiện ích Big Data Ngồi ra, Big Data có nhiều đặc điểm tạo nên thách thức mặt công nghệ kỹ thuật, bao gồm thu thập liệu, hiệu chỉnh, lọc nhiễu, tích hợp liệu yêu cầu thiết kế lưu trữ thông minh, xử lý truy vấn với tốc độ nhanh nhất, mô hình hóa phân tích đầu với u cầu dành cho phân tích theo nhu cầu (báo cáo ad-Hoc) báo cáo chuyên sâu ngày phức tạp, đáp ứng nhu cầu kịp thời cho nhà quản trị Những công nghệ công cụ hỗ trợ cần thiết, bao gồm: hệ sinh thái Hadoop; sở liệu NoSQL (Not only SQL) thu nhỏ theo chiều ngang hàng trăm hàng nghìn máy chủ; sở liệu nhớ (IMDB) với ưu điểm nhanh so với sở liệu đĩa tối ưu hóa, lựa chọn quan trọng cho việc sử dụng phân tích Big Data tạo kho liệu Đồng thời, việc xử lý kỹ thuật, lựa chọn 88 cơng nghệ, cập nhật thuật tốn đảm bảo tính riêng tư, bảo mật liệu với khối lượng lớn xu hướng lưu trữ “đám mây” ngày tăng vấn đề hóc búa với phận CNTT NHTM Về liệu Thực tế liệu NHTM Việt Nam manh mún chưa làm cách đạt yêu cầu, chưa có phân loại rõ ràng liệu có cấu trúc phi cấu trúc nên việc tích hợp liệu địi hỏi chuẩn hoá liệu đầu vào đầu ra, ví dụ trường hợp NHTM triển khai hệ thống từ đối tác CNTT khác chưa có chuẩn mực từ đầu dẫn đến khó khăn cho việc hợp liệu sử dụng tảng khác Oracle SQL Ngoài ra, theo nghiên cứu nước “Tương lai kinh tế số Việt Nam hướng tới năm 2030 2045” (CSIRO, 2019), “Dữ liệu lớn: Cách thức khai thác hội từ liệu? Trường hợp Amazon” (Nguyễn Anh Duy, 2019),… thực trạng tâm lý hành vi người tiêu dùng Việt Nam hay thay đổi thường có sở thích, xu hướng ngắn hạn chi phối cộng đồng số người có tầm ảnh hưởng (Influencer), vậy, việc phân tích nhu cầu KH để đưa vào áp dụng thách thức với NHTM, nhận định sai xu hướng nhu cầu thị trường Big Data trở thành dao hai lưỡi Do đó, NHTM đối mặt với việc xác định thời gian liệu hợp lệ, Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2 2021 ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI trả lời câu hỏi nên giữ thơng tin sở liệu thời điểm liệu khơng cịn phù hợp với phân tích để đảm bảo chất lượng thông tin đầu Mặt khác, NHTM cần lưu ý khai thác liệu KH cần tuân thủ quy định pháp luật, ví dụ theo Nghị định số 117/2018/NĐ-CP “Về việc giữ bí mật, cung cấp thơng tin KH tổ chức tín dụng, chi nhánh ngân hàng nước ngồi” có hiệu lực từ 01/11/2018 Đây thách thức quan trọng việc quan tâm đến bảo mật thông tin KH ngày tăng, mà ngân hàng lại có xu hướng sử dụng lưu trữ đám mây hợp tác nhiều với tổ chức fintech Không vậy, ngân hàng với mạng lưới điểm giao dịch lớn trải dài khắp đất nước có số ngân hàng có chi nhánh nước ngồi có quy mô nhân viên tương đối lớn, thực nhiều loại giao dịch với khách hàng ngày nên ngân hàng cần ý vấn đề xây dựng quy trình kiểm soát, phân quyền truy cập hệ thống đào tạo nhân nội nhận diện bảo mật thơng tin khách hàng Từ phân tích với thực tế tội phạm an ninh mạng ngày nhiều, với trình độ tinh vi đến từ khắp nơi giới với kết nối mạng thông thường, ngân hàng cần thận trọng việc đảm bảo yếu tố bảo mật liệu từ hệ thống đến nhân sự, đối tác, không đảm bảo yếu tố này, ngân hàng đối mặt với rủi ro khủng hoảng truyền thơng, hình ảnh thương hiệu hoạt động kinh doanh Tóm lại, bốn nhóm thách thức nêu phản ánh thực tế NHTM Việt Nam cần thời gian để chuẩn bị tìm kiếm giải pháp phù hợp để ứng dụng Big Data Nếu việc áp dụng triển khai Big Data lộ trình rõ ràng, thực khơng cách, người triển khai khơng đủ lực nảy sinh nhiều vấn đề từ thiết kế, lưu trữ đến quản lý truy cập liệu, an toàn bảo mật Khuyến nghị giải pháp ngân hàng thương mại Việt Nam Để ứng dụng Big Data NHTM với mục tiêu dài hạn cần chuẩn bị kỹ nhiều yếu tố, cần có quan điểm quản trị đắn, xác định rõ nhu cầu, mục tiêu với cân nhắc nguồn lực, từ có lộ trình với mức độ ưu tiên riêng cho cấu phần chiến lược tổng thể Thông qua trao đổi với chuyên gia có kinh nghiệm thực tế việc triển khai dự án Kho liệu Doanh nghiệp, chuyển đổi số hướng đến ứng dụng Big Data Trí tuệ nhân tạo từ ngân hàng Vietinbank, BIDV, Công ty ví điện tử Momo, Cơng ty Trusting Social, Vintech chia sẻ khác Hội thảo Quản lý liệu thơng lĩnh vực ngân hàng, tài tháng 9/2020, nhóm tác giả khuyến nghị NHTM áp dụng theo bước cấp độ “High level” phân tích cân nhắc lợi ích trước triển khai Big Data, góp phần đảm bảo dự án Big Data hướng: Bước Xác định tình kinh doanh thực tế cần cải thiện: NHTM cần đặt câu hỏi chi tiết vấn đề để đảm bảo ưu tiên cho vấn đề cần cải thiện đưa hợp lý với điều kiện thực Bước Hiểu quy trình kinh doanh sản phẩm: Cách thức hoạt động, quy trình đặc trưng sản phẩm NHTM có khác biệt, việc nắm rõ quan trọng triển khai dự án Bước Hiểu cách phân loại mức độ phân tích cần thiết: Để NHTM có nhìn hồn chỉnh thị trường cách cạnh tranh hiệu địi hỏi khung phân tích mạnh mẽ bao gồm phân tích mơ tả, phân tích dự đốn phân tích theo quy định Số 224+225- Tháng 1&2 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 89 Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam Bước Tiến hành khám phá chi tiết: Các NHTM cần tìm trình bị ảnh hưởng liệu thực bắt đầu với quy trình kinh doanh liên quan trực tiếp đến việc tạo doanh thu, sau quy trình hỗ trợ tối ưu hóa Bước Xác định u cầu liệu: Dựa nhu cầu tình hình hoạt động kinh doanh quản trị, điểm liệu chính, số liệu điểm đánh dấu cần xác định Bước Thiết kế kiến trúc liệu mạnh mẽ: Kiểu kiến trúc liệu tốt kiến trúc có khả mở rộng giải yêu cầu NHTM thập kỉ tới, liệu tăng dần lên yêu cầu phân tích thời gian thực Dashboard sáng tạo Bước Triển khai ứng dụng: Khi tầm nhìn rõ ràng đặt với cam kết thực từ bên có bao gồm đối tác triển khai giúp giảm bớt rào cản hướng đến mục tiêu chung dựa nguyên tắc Ngoài ra, để chuẩn bị tảng đối mặt với thách thức phân tích, viết đưa bốn nhóm giải pháp sau: Một là, giải pháp tài chính: Để phù hợp với nguồn lực tài chính, NHTM nên tận dụng hỗ trợ cơng nghệ điện tốn đám mây Hiện nay, nhà cung cấp giải pháp Big Data đám mây xây dựng sẵn mơ hình phân tích mang lại khả tổ chức chi trả cho nguồn lực siêu tính tốn theo phương thức chi tiêu tùy theo khả Ngoài ra, để giảm thiểu phần chi phí cho việc thu thập làm liệu, NHTM nên đẩy mạnh hợp tác với cơng ty tài cơng nghệ fintech, hướng đến xây dựng mơ hình chuỗi cung ứng gắn kết chặt chẽ với nhu cầu KH Khi đó, chuỗi cung ứng dịch vụ ưu việt tạo sở liệu thống nhất, minh bạch hiệu 90 giai đoạn, từ KH phát sinh nhu cầu hoàn tất thực cung ứng dịch vụ Hai là, giải pháp công nghệ bao gồm kết cấu hạ tầng thông tin nhằm đáp ứng tảng công nghệ để ứng dụng Big Data Muốn sử dụng khai thác Big Data cách hiệu điều cần thiết phải xây dựng sở hạ tầng đủ để thu thập lưu trữ liệu, cung cấp quyền truy cập bảo mật thông tin lưu trữ chuyển tiếp, bao gồm: hệ thống lưu trữ máy chủ; phần mềm quản lý, tích hợp liệu; phần mềm phân tích liệu số thành phần khác NHTM nên lựa chọn giải pháp Big Data có tảng kết nối tận dụng liệu từ hệ thống để khơng lãng phí sở hạ tầng, liệu nguồn lực thực trước Ba là, nhóm giải pháp nguồn nhân lực có đủ lực sáng tạo, tảng cơng nghệ Cách mạng cơng nghiệp 4.0 nói chung ứng dụng Big Data nói riêng Các nhà quản trị cần tham khảo mơ hình thành cơng giới có hoạch định rõ chiến lược phát triển dài hạn đại hóa NHTM Ngồi việc tuyển dụng nhân có kinh nghiệm trình độ đại hóa ngân hàng, ứng dụng Big Data cần ưu tiên chiến lược phát triển nhân nội để xây dựng nguồn nhân lực mạnh với chi phí hợp lý, phổ cập tham gia khóa đào tạo phân tích liệu, lập trình sở liệu Đối với phận nghiệp vụ, cần tiếp cận thêm ngơn ngữ lập trình ứng dụng xử lý phân tích liệu R, Python, SQL để chủ động xử lý liệu có nhìn bao qt hệ thống liệu Đối với phận CNTT, yêu cầu đặt tiếp cận nhanh chóng tiếp thu xu hướng công nghệ giới thiết kế sở liệu, xử lý truy vấn, tích hợp liệu ví dụ cơng cụ quản lý liệu phân tán (Hadoop, Dryad), Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2 2021 ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI Biểu đồ 5: Giải pháp Data Lake kết nối liệu truyền thống liệu phi cấu trúc ngân hàng Nguồn: Analytics, M (2016), The age of analytics: Competing in a data-driven world hệ sở liệu không cấu trúc NoQuery, công cụ xử lý (MapReduce)… Bốn là, giải pháp liệu Tuy nhà cung cấp đám mây mang lại số lợi ích an ninh so với trung tâm liệu thông thường NHTM bảo vệ giám sát liệu tập trung hơn, nhiên mang lại rủi ro mà liệu có thêm tổ chức trung gian nắm giữ Vì vậy, NHTM cần áp dụng tiêu chuẩn cao đối tác, tuyển dụng quản lý người, hệ thống; đặc biệt quan tâm đến việc xây dựng trung tâm dự phịng liệu (khơi phục liệu sau thảm họa); nâng cấp hệ thống an ninh, bảo mật mức cao; đảm bảo việc mở rộng phạm vi hoạt động (nếu có) ổn định, an tồn, mang lại hiệu lâu dài Kết luận Nhờ khả kết hợp nhiều công nghệ, kỹ thuật phương pháp đại, tối ưu, Big Data dần thể rõ tầm quan trọng NHTM tương lai Tuy nhiên NHTM cần thận trọng việc ứng dụng để phù hợp với thực tiễn, khắc phục hạn chế, thách thức đảm bảo an tồn thơng tin thơng qua xây dựng lộ trình triển khai phù hợp dựa khuyến nghị tiếp cận theo bước cấp độ “High level”, số giải pháp đúc kết dựa thực tế từ chuyên gia triển khai ứng dụng thành công vào ngân hàng, fintech Một làm chủ, tận dụng, kết hợp hệ thống liệu Big Data Số 224+225- Tháng 1&2 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 91 Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam NHTM có hội thành công lớn bối cảnh cạnh tranh ngày hưởng lợi nhiều từ việc trích xuất thơng tin cách xác, hữu ích Từ tảng ban đầu phân tích này, nhóm nghiên cứu hướng đến nghiên cứu cụ thể theo nhóm ngân hàng tương đồng quy mô ứng dụng cơng nghệ mới, từ đưa giải pháp hữu ích để xây dựng kinh tế số, giúp tổ chức ngân hàng mang đến trải nghiệm dịch vụ tốt tới khách hàng ■ Tài liệu tham khảo Analytics, M (2016) The age of analytics: competing in a data-driven world McKinsey Global Institute Research Banking Academy, (2017), Big Data for Banking and Financial Industry, Science and technics publishing house, ISBN: 9786046709305 Cornelia Hammer, Diane C Kostroch, Gabriel Quiros, (2017), Big Data: Potential, Challenges, and Statistical Implications, ISBN/ISSN:9781484310908 Cơ quan Nghiên cứu Khoa học Công nghiệp Khối thịnh vượng chung Úc (CSIRO), (2019), Tương lai kinh tế số Việt Nam hướng tới năm 2030 2045 Cục Thông tin Khoa học Công nghệ Quốc gia, (2015), Tổng luận Dữ liệu lớn xu hướng đổi sáng tạo dựa liệu số Domo, (2020), Data never sleeps 7.0 (www.domo.com) Đào Văn Hùng, (2019), Phát triển khu vực tài chính- ngân hàng bối cảnh Cách mạng công nghiệp lần thứ tư, Tạp chí Cộng sản số 6/2019 Fred Zimmerman, (2015), Hadoop Business Case: A Cost Effective Queryable Data Archive/Storage Platform Gärtner, B., & Hiebl, M R (2018) Issues with big data. The Routledge Companion to Accounting Information Systems (S 161-172) New York: Routledge Gordon, J., Perrey, J., & Spillecke, D (2013) Big data, analytics and the future of marketing and sales McKinsey: Digital Advantage Hortonworks, (2019), Data Strategy Scorecard Survey Học viện Ngân hàng, (2019), Kỷ yếu Hội thảo Hệ thống thông tin quản lý kỷ nguyên số, NXB Thanh Niên, ISBN: 9786049756801 Mary Aleksandrova, (2020) Big Data in the Banking Industry: The Main Challenges and Use Cases McKinsey Global Institute Research Manyika, J (2011) Big data: The next frontier for innovation, competition, and productivity McKinsey Global Institute Research Manyika, J (2017) A future that works: AI, automation, employment, and productivity McKinsey Global Institute Research, Tech Rep, 60 Nasser T & Tariq RS, (2015), Big Data Challenges, Journal of Computer Engineering & Information Technology Volume Issue Ngô Kim Thanh, (2020), Ứng dụng liệu lớn kinh tế số Nghị định số 117/2018/NĐ-CP Về việc giữ bí mật, cung cấp thông tin khách hàng tổ chức tín dụng, chi nhánh ngân hàng nước ngồi, ban hành ngày 11/09/2018 Nguyễn Anh Duy, Nguyễn Phúc Quỳnh, (2019), Dữ liệu lớn: Cách thức khai thác hội từ liệu? Trường hợp Amazon, Tạp chí Phát triển & Hội nhập số 46 Oracle, (2016), The Era I Enterprise: Ready for Anything, Financial Services- Report Phan Thanh Đức cộng sự, (2019), Ứng dụng liệu lớn hoạt động quản trị quan hệ khách hàng NHTM Việt Nam, Tạp chí Khoa học & Đào tạo Ngân hàng số 203 Philip Russom, (2015), Hadoop for the Enterprise: Making DataManagement Massively Scalable, Agile, Feature-Rich, and Cost-Effective Reinsel, D., Gantz, J., Rydning, J., (2018), Data Age 2025: The Digitization of the World from Edge to Core, IDC Vietnam Report, (2019), Báo cáo Vietnam CEO insight 2019: chuyển đổi số hội doanh nghiệp Việt Nam We are Social, (2020), Digital 2020 global digital yearbook 92 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2 2021 ... (2) Dữ liệu Phân tích Số 224+22 5- Tháng 1&2 202 1- Tạp chí Khoa học & Đào tạo Ngân hàng 85 Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam Biểu đồ Kế hoạch mở rộng hội hợp tác với. .. 224+22 5- Tháng 1&2 202 1- Tạp chí Khoa học & Đào tạo Ngân hàng 81 Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam liệu khơng có khn mẫu cấu trúc cố định, không phù hợp lưu trữ quản lý với. .. 202 1- Tạp chí Khoa học & Đào tạo Ngân hàng 87 Ứng dụng liệu lớn - thách thức ngân hàng thương mại Việt Nam Biểu đồ Đánh giá kỹ nhân viên thời đại số Nguồn: Vietnam Report, (2019), Báo cáo Vietnam