CHƯƠNG I TỔNG QUAN
1, Mơ hình năng lực trưởng thành dữ liệu BDBA
1.1. Lý thuyết xây dựng mơ hình BDBA
Trong triển khai Big Data có nhiều yếu tố ảnh hưởng đến khả năng thành công cũng như thất bại của dự án [10] [39] [41] [56]. Dựa trên lý thuyết về BDMM, cụ thể là năm
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
KẾT LUẬN CHƯƠNG 1
Chương I đã làm rõ khái niệm cơ bản về Big Data và đưa ra những nghiên cứu và minh chứng thể hiện giá trị của những actionable insight mang lại thông qua việc ứng dụng Big Data vào hoạt động quản trị quan hệ khách hàng trong ngành dịch vụ ngân hàng. Đồng thời, khái niệm BDMM được tiến hành tìm hiểu và đưa vào khóa luận như một nền tảng lý thuyết để xây dựng bộ câu hỏi đánh giá mức độ trưởng thành dữ liệu trong các dự án triển khai và nghiên cứu Big Data tại ngân hàng TMCP Công Thương Việt Nam.
Khóa luận tốt nghiệp Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị
Nhân tố trường thành BDMM Mơ hình IBM Mơ hình Radcliffe Mơ hình TDWI Mơ hình CSC Mơ hình Hortonwork Mơ hình BDBA Định hướng chiến lược Chiến lược Business Strategy Vision & Strategy
- Intent Sponsorship Chiến
lược Quy trình - Value & Metric - Process - ^Quy trình "Dư liệu Quản lý______ - Analytic & Visualisation
Analytic - Data &
Analytic Quán _lý_____ Phân tích - Trust & Privacy; Data Management Data Management Data Phân tích ~To chức Con người - People & Organization
Organization People Organization
& Skill Con người Văn hóa Culture & Execution - Văn hóa
Quản trị Governance Governance Governance - Processes &Management Quản trị Công nghệ thông tin Quản lý thông tin
Information Data Source -
Technology Technology & Infrastructure Công nghệ thông tin ~Hặ tầng công nghệ Architecture - Infrastructure Trần Phương Lan - K17HTTTB 24
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Cơng Thương Việt Nam Khóa luận tốt nghiệp
mơ hình IBM, Radcliffe, TDWI, CSC, Hortonworks1 nghiên cứu trong giới hạn đề tài khóa luận, mơ hình BDBA được thiết kế dựa trên năm nhân tố: (1) Định hướng chiến lược, (2) Dữ liệu, (3) Tổ chức, (4) Quản trị và (5) Công nghệ thông tin.
Nội dung bộ câu hỏi khảo sát được thiết kế với mục đích bổ khuyết và bao qt tồn bộ nội dung các lĩnh vực có tầm ảnh hưởng đến chiến lược triển khai Big Data và mức độ trưởng thành dữ liệu. Các câu hỏi được điều chỉnh và tái cấu trúc để phù hợp hơn trong bối cảnh thị trường và hạ tầng công nghệ thông tin tại Việt Nam, trước nhất trong giới hạn thời gian thực hiện nghiên cứu khóa luận, mơ hình BDBA sẽ tập trung vào ngành dịch vụ tài chính ngân hàng Việt Nam.
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Cơng Thương Việt Nam Khóa luận tốt nghiệp
Đầu tiên về định hướng chiến lược, cụ thể là về chiến lược và quy trình. Các dự án Big Data cần được sự ủng hộ và đầu tư của đội ngũ lãnh đạo tổ chức trong việc đặt ra mục tiêu, xác định định mức thành công, tái cấu trúc quy trình hoạt động và đưa ra câu hỏi nghiệp vụ cũng như yêu cầu triển khai công nghệ phù hợp trong bối cảnh hoạt động và định hướng phát triển của tổ chức. Ngân quỹ cũng như các khoản đầu tư về nguồn lực kết hợp với chính sách từ phía những nhà quản trị cấp cao trong tổ chức cần mang lại sự ảnh hưởng và có tác động mạnh mẽ đến hiệu suất triển khai và kết quả nghiên cứu của đội dự án Big Data.
Thứ hai về dữ liệu, cụ thể là về hoạt động quản lý và phân tích dữ liệu. Các dự án Big Data nhấn mạnh khả năng điều hành và xử lý đồng loạt các nguồn dữ liệu phân tán dựa trên khung thời gian thực. Một số nguồn dữ liệu quan trọng và là đặc trưng của Big Data như tệp dữ liệu lớn (hơn 20 TB), những phân tích chuyên sâu nghiệp vụ, các biểu đồ kết quả trực quan, dữ liệu từ mạng xã hội, dữ liệu hình ảnh, âm thanh, thơng tin vị trí địa lý, thơng tin dự báo hành vi, các bản ghi lưu trữ lịch sử truy cập và xác nhận danh tích người dùng... Khả năng dữ liệu của tổ chức được đánh giá dựa trên sự đa dạng trong nguồn dữ liệu thu thập và lưu trữ, các kĩ thuật phân tích và cơng nghệ sử dụng, mức độ ảnh hưởng của các tri thức khai phá từ nguồn dữ liệu thô đến hoạt động kinh doanh nghiệp vụ và quá trình ra các quyết định chiến lược trong tổ chức.
Thứ ba về tổ chức, cụ thể là các vấn đề trong đào tạo con người và xây dựng văn
hóa tổ chức. Các kĩ thuật xử lý, làm sạch, quản lý, thống kê và biểu diễn khối lượng lớn
dữ liệu được yêu cầu trong đào tạo và phát triển các kĩ năng dành cho nhân viên phân tích, nhà khoa học dữ liệu hoặc các chuyên gia phát triển hệ thống thơng tin. Văn hóa tổ chức cần thay đổi và thích nghi với sự phát triển công nghệ Big Data, thay đổi từ cách tiếp cận truyền thống HiPPO1 chuyển sang định hướng dữ liệu. Dữ liệu được xử lý và phân tích hỗ trợ mọi quyết định trong hoạt động điều hành và kinh doanh sản xuất, là công cụ hỗ trợ mọi cấp độ quản lý nhằm tăng khả năng vượt qua các rào cản thị trường và mang lại những giá trị khác biệt cho tổ chức.
Thứ tư về quản trị, việc triển khai Big Data cần quan tâm đến các vấn đề về kinh phí và nguồn ngân sách dự trù, các chính sách liên quan đến vấn đề bảo mật và sử dụng thông tin nhạy cảm; tri thức, kinh nghiệm và kĩ năng trong triển khai ứng dụng công nghệ Big Data; sự thay đổi trong tổ chức nhân sự và đào tạo kĩ năng nhân viên trong khai thác và sử dụng các cơng cụ phân tích Big Data...
1 HiPPO (Highest Paid Person’s Opinion): thuật ngữ dùng để chỉ cách thức đưa ra quyết định trong những
trường hợp khó khăn, dựa trên các ý tưởng cá nhân đưa ra trong các cuộc họp thảo luận mở, thay vì dựa trên nguồn
dữ liệu phân tích hay thống kê số liệu cụ thể.
Phân vùng đánh giá Số lượng câu hỏi (câu)
Định hướng chiến lược Chiến lược 6
Quy trình 6 Dữ liệu Quản lý 10 Phân tích 7 Tổ chức Con người 7 Văn hóa 4 Quản trị 5 Công nghệ 5 Tổng 50
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Cơng Thương Việt Nam Khóa luận tốt nghiệp
Cuối cùng về công nghệ thông tin, các dự án Big Data yêu cầu xây dựng nền tảng cơ sở hạ tầng thích hợp để xử lý các nguồn dữ liệu trong Big Data, như hệ cơ sở dữ liệu NoSQL; khả năng thu thập và truy vấn các luồng dữ liệu song song, phi cấu trúc thông quan các cụm Hadoop; sửa đổi, cải tiến khung cấu trúc Data Warehouse, Data Mart và tái cấu trúc các thuật tốn phân tích để thực hiện tích hợp, truy vấn xử lý đồng bộ các nguồn dữ liệu mới từ Big Data... Nền tảng điện tốn đám mây là trọng tâm chính trong các giải pháp công nghệ và chiến lược phát triển hạ tầng cơ sở dành cho Big Data và các phân tích Big Data. Nhìn chung, trong lĩnh vực cơng nghệ, tổ chức cần xây dựng khối kiến trúc thơng tin thống nhất, tích hợp nhiều chương trình và cơng cụ phân tích nâng cao, thiết kế hệ quản lý cơ sở dữ liệu phù hợp với các mục tiêu phát triển và chiến lược triển khai Big Data ứng với từng giai đoạn và cấp độ trong ngữ cảnh phù hợp.
Tổng quan mơ hình BDBA được thiết kế như sơ đồ sau:
Đầu vào Phân vùng đánh giá
Cơng nghệ thơng tin Định hướng chiến Con người Van hóa Mức độ trưởng thành
(Hiện tại - Hướng
Đầu ra
Hình 1-1 Mơ hình BDBA
Cụ thể, trước khi tiến hành nghiên cứu triển khai một dự án Big Data, tổ chức cần xác định rõ ràng mục tiêu chiến lược và mức độ ưu tiên giải quyết các bài toán nghiệp vụ cũng như các vấn đề liên quan đến dữ liệu. Đặc biệt cần xác định rõ khả năng hỗ trợ và nguồn lực đầu tư dành cho các kế hoạch phát triển cơng nghệ Big Data. Lượng hóa mức độ trưởng thành hiện tại (as-is maturity) và ước tính điểm số hướng tới (to-be maturity) dành cho các chiến lược phát triển dữ liệu cũng như các dự án công nghệ ngắn
hạn thông qua bộ câu hỏi BDBA. Kết quả đánh giá được xem như nguồn thông tin tham
khảo hỗ trợ xây dựng đề án kinh doanh, thực thi kế hoạch hành động và triển khai dự án
POC hay các dự án thử nghiệm. Thông tin phản hồi và kết quả của các dự án được thu thập và lưu trữ dùng cho việc tái đánh giá mơ hình BDBA.
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Cơng Thương Việt Nam Khóa luận tốt nghiệp
1.1. Nội dung và cách thức đánh giá của mơ hình BDBA
Năm phân vùng đánh giá của mơ hình BDBA bao gồm: (1) Định hướng chiến lược, (2) Dữ liệu, (3) Tổ chức, (4) Quản trị và (5) Cơng nghệ. Trong đó, phân vùng Định hướng chiến lược chia làm hai phần: Chiến lược và Quy trình; phân vùng Dữ liệu chia làm hai phần: Quản lý và Phân tích; phân vùng Tổ chức chia làm hai phần: Con người và Văn hóa.
Mỗi phân vùng là một tập các câu hỏi1, với tổng số lượng 50 câu chia thành 5 phân vùng được thiết kế và xây dựng trên giao diện Excel.
Chiến lược Hiện tại Hướng tới
O O Việc nghiên cứu tìm hiểu Big Data tạm giới hạn ở một số đối tượng nhắn viên.
O O Được chấp nhận và ủng hộ mạnh mẽ từ phía bộ phận IT hoặc một
số đơn vị kinh doanh độc lập.
X Mức độ chấp nhận và ủng hộ việc nghiên cứu triển khai
I các dự án Big Data: <♦.' D O ĐƯỢc chấp nhận và ủng hộ mạnh mẽ từ ít nhất một người trongban đièu hành, thường là CTO, CDO hoặc CIO.
O Được chấp nhận và ủng hộ mạnh mẽ bởi phần đông ban điều hànhtổ chức.
O O ĐƯỢc chấp nhận và ủng hộ mạnh mẽ bởi phần đông các nhà quàntrị điều hành và không điều hành.
i ► I Djnh hướng chiến lược Dữ liệu Tổ chức Quàn trị Cong nghệ Kết quả đánh giá I Moti ... (+) : Id I
Quán lý Hiện tại Hướng tới
A 0 A 0 Dữ liệu kinh doanh (lịch sử giao dịch, doanh thu bán hàng, điểm
tín dụng,...).
B 0 B 0 Dữ liệu lịch sừ lưu trữ (các tệp dạng XML, CSV, JSON...).
□ C 0 Dữ liệu từ các trang mạng xã hội (Facebook, Twitter, Instagram...).
D 0 D 0 Dữ liệu vị trí địa lý.
E 0 E 0 Dữ liệu nhân khẩu học.
ì TổchứCsửdụnq nhữnq dữ liệu:
P P Dữ liệu từ máy móc, thiết bị (dữ liệu cảm biến, thiết bị nhận dạng
P 0 P 0 sóng vơ tuyến RFIDS, dữ liệu từ thiết bị di động,...).
G 0 G 0 Dữ liệu đa phương tiện (hình ành, âm thanh, video...).
□ H 0 Dữ liệu lịch sử truy cập (weblog, clickstream,...).
I ► ị Đỉnh hướng chiến lược I Dữ liệu I
Tổ chức Quàn trị Công nghệ Kết quả đánh
giá I Mơ tí -
©“
: Id I
Hình 1-3 Giao
diện câu hỏi mơ hình BDBA - dạ ng c â hỏi chọn nhiều đáp án
Có hai dạng câu hỏi: (1) Câu hỏi chọn một đáp án và (2) Câu hỏi chọn nhiều đáp án. Tổng số điểm cho từng câu hỏi là 5 điểm.
Với dạng câu hỏi (1), mỗi câu được cung cấp năm đáp án lựa chọn tương đương với năm cấp độ trưởng thành tăng dần:
■ Đáp án a - 1 điểm - ứng với cấp độ ứng dụng Big Data đơn giản nhất; ■ Đáp án e - 5 điểm - ứng với cấp độ ứng dụng Big Data cao nhất.
1 Xem thêm phụ lục 1 - mơ hình BDBA “Bộ câu hỏi đánh giá mức độ trưởng thành dữ liệu”.
Trần Phương Lan - K17HTTTB 28
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Cơng Thương Việt Nam Khóa luận tốt nghiệp
CÂU HỎI ĐÁNH GIÁ
Hình 1-2 Giao diện bộ câu hỏi mơ hình BDBA - dạng câu hỏi chọn một đáp án
Với dạng câu hỏi (2), số điểm từng đáp án sẽ được tính bằng tổng số điểm chia cho số lượng các đáp án trong câu hỏi đó.
CÃU HỎI ĐÁNH GIÁ
Kết quả đánh giá được sắp xếp và phân loại vào năm cấp độ trưởng thành1:
1 - Khởi động: (0.6 - 1.9 điểm)
Tổ chức có sự tìm hiểu ban đầu về nền tảng công nghệ Big Data và những ứng dụng phân tích Big Data. Tuy nhiên, các tri thức tìm hiểu và những giá trị thu được thông qua quá trình nghiên cứu phụ thuộc hoàn toàn vào sự nỗ lực của từng cá nhân. Tổ chức chưa có các văn bản chính thức và nguồn tài nguyên phân bổ rõ ràng trong triển khai các dự án Big Data. Hơn hết, Big Data gần như không nhận được sự ủng hộ hay hỗ trợ của các nhà lãnh đạo cấp cao.
Các quy trình phân tích ứng dụng Big Data tập trung giải quyết những bài toán nghiệp vụ cụ thể theo yêu cầu của từng bộ phận hay phòng ban chức năng. Nguồn dữ liệu là có cấu trúc, thông tin được lưu trữ và sử dụng độc lập, khơng có sự tích hợp hay chia sẻ trong nội bộ tổ chức. Nhân viên có các kĩ năng phân tích ở mức đơn giản, có thể sử dụng dữ liệu mô tả lại các hoạt động và sự kiện xảy ra hàng ngày trong tổ chức. Nhiều nguồn thông tin chưa có tiêu chuẩn xác thực rõ ràng, thường xuyên xảy ra tình trạng silo thơng tin và q tải bộ nhớ trong hệ thống.
2 - Sơ khai: (2 - 3 điểm)
Tổ chức bắt đầu triển khai thực hiện các dự án POC và dự án Big Data thử nghiệm tại các bộ phận hay phòng ban chức năng. Ngân sách phát triển Big Data chủ yếu được trích xuất từ quỹ đầu tư phát triển công nghệ, dưới sự ủng hộ và hỗ trợ của các nhà quản lý bậc trung. Ở giai đoạn này, Big Data được xem như nền tảng công nghệ mới tiềm năng, giá trị những phân tích Big Data được nhận định và chứng thực thông qua các dự án POC và dự án triển khai thử nghiệm.
Big Data là nguồn thông tin tham khảo hỗ trợ một số quyết định trong quy trình tác nghiệp và hoạt động quản lý tại các bộ phận phòng ban nghiệp vụ. Nguồn dữ liệu chủ yếu là có cấu trúc, có sự thu thập thêm nguồn nội dung phi cấu trúc theo phương pháp thủ công truyền thống. Đội ngũ các nhà khoa học phân tích dữ liệu phần lớn đến từ nguồn lực bên ngoài tổ chức, một số ít nhân viên kỹ thuật nội bộ có năng lực chuyên môn cao. Các phân tích Big Data chủ yếu dùng để mô tả và giải thích kết quả hoạt động kinh doanh. Chưa có quy trình kiểm định và quản trị vòng đời dữ liệu. Thông tin được chia sẻ giới hạn trong từng phòng ban độc lập. Chưa có sự lưu trữ và tích hợp dữ liệu trên nền tảng Cloud Computing.
Cách thức đánh giá năng lực trưởng thành dữ liệu trong mơ hình BDBA ứng theo từng điểm số của mỗi câu trả lời. Dựa trên phương pháp tính điểm trung bình, BDBA đánh giá mức độ trưởng thành của từng phân vùng và đưa ra kết quả tổng kết thực trạng dữ liệu và tình trạng triển khai nền tảng Big Data tại tổ chức thực hiện đánh giá, ở cả hai giai đoạn hiện tại và tương lai trong hai năm.
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Cơng Thương Việt Nam Khóa luận tốt nghiệp
3 - Thực nghiệm: (3.1 - 4 điểm)
Tổ chức thực hiện nghiên cứu và triển khai các dự án Big Data trong phạm vi một số đơn vị kinh doanh. Nguồn ngân sách đầu tư cho các dự án được phân bổ định kỳ theo nhu cầu của từng đơn vị. Big Data bắt đầu nhận được sự quan tâm của các nhà lãnh đạo cấp cao, có ít nhất một người trong ban điều hành tổ chức ủng hộ và hỗ trợ đầu tư cho các nghiên cứu phân tích và phát triển công nghệ Big Data.
Big Data hỗ trợ tất cả các quy trình hoạt động trong tổ chức. Công nghệ và các phân tích Big Data có sự tác động đến một số quy trình ra quyết định cấp đơn vị. Nguồn dữ liệu sử dụng trong hệ thống chủ yếu là nguồn có cấu trúc, những nguồn dữ liệu bán cấu trúc và phi cấu trúc được sử dụng trong phân tích khai phá dữ liệu với kỳ vọng có thể đem lại vị thế cạnh tranh cho các dòng sản phẩm dịch vụ hay các chiến dịch kinh doanh