Kinh Tế - Quản Lý - Báo cáo khoa học, luận văn tiến sĩ, luận văn thạc sĩ, nghiên cứu - Kinh Tế - Economic Quản trị dữ liệu chủ da miền: nâng cao quản trị dữ liệu cho các tô chức doanh nghiệp Ngô Thùy Linh - Phan Thanh Đức Khoa Hệ thống thông tin quàn lý, Học viện Ngân hàng Ngày nhận: 17052021 Ngày nhận bàn sửa: 26052021 Ngày duyệt đăng: 25062021 Tóm tắt: Dữ liệu ngày nay đã trở thành một trong những tài sản quan trọng của các tổ chức, doanh nghiệp. Tuy nhiên, thách thức đặt ra với các nhà quản lý là làm thế nào để có thể khai thác, sử dụng và quản lý dữ liệu một cách hiệu quả và thông minh khỉ có quả nhiều nguồn dữ liệu bên trong và bên ngoài tố chức. Giải pháp quản lý dữ liệu chủ đa miền dựa vào việc quản lý tống thê dữ liệu trên đa miền sẽ giúp các tổ chức có cái nhìn thong nhất và chỉnh xác về các thực thê quan trọng, từ đó cung cấp các thông tin tài chính phù hợp, đáng tin cậy. Bài báo này tập trung làm rõ các khải niệm, tầm quan trọng cùa việc quản lý dữ liệu chủ đa miền và một số cách tiếp cận khỉ xây dựng quản lý dữ liệu chủ da miên. Từ khóa: Dữ liệu chủ, Quản trị dữ liệu chủ, Quản lý dữ liệu chủ đa miền Multi-domain master data management: improving data governance for enterprises Abstract: Today data has become one of the important assets of organizations and businesses. However, one challenge faced by managers is how to effectively and intelligently exploit, use and manage data when the organization is exposed to a large number of both internal and external data sources. A multi-domain master data management solution based on the overall management of data across multiple domains will help organizations develop a unified and accurate view of important entities, thereby providing suitable and reliable financial information. This article attempts to clarify the concepts and the importance of multi-domain master data management, and propose feasible approaches when building multi-domain master data management. Keywords: Master Data, Master Data Management, Multi-Domain Master Data Management Ngo, Thuy Linh Email: linhnthvnh.edu.vn Phan, Thanh Duc Email: ducpthvnh.edu.vn Organization of all: Faculty of Management Information System, Banking Academy of Vietnam Tạp chí Khoa học Đào tạo Ngân hàng Học viện Ngân hàng số 229-Tháng 6. 2021 72 ISSN 1859 - 011X NGÔ THÙY LINH - PHAN THANH ĐỨC 1. Đặt vấn đề Một khảo sát của Gartner (2019) cho thấy răng chât lượng dữ liệu kém đã dần đèn chi phí của các tổ chức tăng lên tới 11,8 triệu USD. Một trong những nguyên nhân dẫn đến chất lượng dừ liệu kém là chưa tích hợp được thông tin từ các nguồn dữ liệu khác nhau trong tổ chức. Nhiều tổ chức hiện nay đã nhận ra giá trị và tầm quan trọng của việc quản lý dữ liệu chủ (Master Data Management- MDM) và coi MDM là một giải pháp cho thách thức này. Các tổ chức thường bắt đầu triển khai MDM và dừng ở việc tập trung vào một miền dữ liệu (a data domain), sau đó mới mở rộng đến các miền khác trong mô hình quản lý dừ liệu đa mien (a multi- domain model). Trong quá trình thực hiện, hầu hết các tổ chức gặp một số khó khăn trong việc thực hiện đầy đủ và nhất quán các mục tiêu quản trị dữ liệu chủ trên nhiều miền (Mark Allen Dalton Cervo, 2015). Sự khó khăn này bắt nguồn từ việc không có cái nhìn tổng thể về các thành phần, chức năng và cả các dịch vụ để có thể quản trị dữ liệu chủ một cách chính xác và hiệu quả. Một số tổ chức nhìn nhận việc quản trị này về bản chất chỉ là việc tích hợp dừ liệu đơn thuần. Đây sẽ trở thành một sai lầm khi các dữ liệu theo thời gian ngày càng trở nên đa dạng và phức tạp, bởi vì ngoài việc tích họp dữ liệu thì tổ chức còn cần phải đưa ra các trách nhiệm của bộ phận, phòng ban đối với dữ liệu và cần phải quan tâm đến việc quản lý chất lượng dữ liệu để có thể tiếp cận thành công quản trị dữ liệu trên nhiều miền. Phần tiếp theo của bài báo sẽ trình bày các vấn đề có liên quan đến dữ liệu chủ, miền dữ liệu, quản lý dừ liệu chủ, dừ liệu chủ đa miền và một số cách tiếp cận xây dựng quản trị đa miền nhằm nâng cao việc quản trị dữ liệu cho các tô chức, doanh nghiệp. 2. Dữ liệu chủ và miền dữ liệu Mồi một miền dữ liệu phản ánh đến một tập các thực thể quan trọng mà các tổ chức, doanh nghiệp thường quan tâm như: tập các khách hàng, các sản phẩm, các nhà cung câp, các nhân viên, tài chính, chính sách... (Mark Allen Dalton Cervo, 2015). Trong mồi miền dữ liệu có thể có một hoặc nhiều thực thể, thực thể có thể là một đối tượng, cá nhân, đơn vị, địa điểm... phải là duy nhất trong một miền nhất định và thường có các thuộc tính kèm theo. Ví dụ, trong miền Khách hàng, một doanh nghiệp đối tác hoặc một cá nhân có hợp đồng với doanh nghiệp có thể được coi là một thực thể, mồi thực thể khách hàng có một số thuộc tính như: họ tên, số điện thoại, e-mail, giới tính... Tùy vào từng loại hình, lĩnh vực kinh doanh của từng tổ chức mà có các miền dữ liệu với các thực thể khác nhau. Chẳng hạn có một số miền dữ liệu tương ứng với từng lĩnh vực như sau: - Lĩnh vực sản xuất: Khách hàng, Sản phẩm, Nhà cung cấp, Nguyên vật liệu, Địa điểm... - Lĩnh vực chăm sóc sức khỏe: Bệnh nhân, Nhà cung cấp, Sản phẩm, Khiếu nại, Triệu chứng lâm sàng, Bảo hiểm... - Lĩnh vực tài chính: Khách hàng, Tài khoản, Sản phẩm, Địa điểm, Bảo hiểm... - Lĩnh vực giáo dục: Sinh viên, Khoa bộ môn, Địa điểm, Tài liệu, Khóa học... Trên thực tế, mức độ ưu tiên về dữ liệu của các thực thể là khác nhau, dữ liệu nào có mức độ ưu tiên cao sẽ được lưu trữ trong vùng bộ nhớ được truy cập nhanh hơn, trong hệ tài nguyên tốt hơn, quan tâm về chất lượng dừ liệu của thực thể đó hơn, có cơ chế kiểm soát chất lượng dừ liệu tốt hơn. Do đó khái niệm “Dừ liệu chủ” (Master data) đã ra đời để mô tả, phản ánh đến những dữ liệu quan trọng cần được quan tâm nhiều hơn trong tổ chức. Theo John R. Talburt Yinle Zhou (2015), dừ liệu chủ Số 229- Tháng 6. 2021- Tạp chí Khoa học Đào tạo Ngân hàng 73 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp của một tổ chức được định nghĩa là dữ liệu được lưu giữ bởi tổ chức đó, mô tả các thực thể độc lập và liên quan chính đến các hoạt động của tổ chức. Một định nghĩa khác về dữ liệu chủ là dữ liệu mô tả vê các thực thê quan trọng đối với các hoạt động và phân tích của tổ chức, cách dừ liệu này tương tác và chia sẻ sẽ cung cấp ngữ cảnh cho dữ liệu giao dịch (Mark Allen Dalton Cervo, 2015). Hay dữ liệu chủ là dữ liệu mô tả các thực thể lõi của tổ chức với tập các thuộc tính và định danh là nhất quán và chính xác (Keith Gordon, 2013). Ví dụ sau đây sẽ mô tả rõ hơn về dữ liệu chủ, dữ liệu về các thực thể khách hàng được lưu trữ ở các hệ thống Kinh doanh và Ke toán của công ty X (David Loshin, 2009) Các thông tin liên quan đến thực thể khách Hình 1. Dữ liệu về khách hàng được lưu trữ ở 2 hệ thống khác nhau Nguồn: David Loshin (2009) Bảng 1. Dữ liệu chủ miền khách hàng của Hệ thống Kinh doanh Customer Master Data ID Cust FirstName MiddleName LastName TelNum Address City KH002 An Van Le 090234567 25 Ly Thai To Ha Noi Nguồn: David Loshin (2009) Nguồn: David Loshin (2009) Bang 2. Dữ liệu chu miền khách hàng của Hệ thống Kế toán Customer Master Data ID First Last Add City Zip Tel ID0070 An Le 12 Chua Boc Ha Noi 100000 0909789456 74 Tạp chí Khoa học Đào tạo Ngân hàng- số 229- Tháng 6. 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC hàng được lưu trữ ở hai hệ thống này bao gồm: Hệ thống “Kinh doanh” lưu trừ các thông tin khách hàng bao gồm: Tên (FirstName), Tên đệm (MiddleName), Họ (LastName), Số điện thoại (TelNum), Địa chỉ (Address). Dữ liệu chủ miền khách hàng của hệ thống Kinh doanh được biểu diễn như ở Bảng 1. Hệ thống “Kế toán” lưu trừ các thông tin của khách hàng bao gồm: Tên (First), Họ (Last), Địa chỉ (Add), Thành phố (City), Mã bưu chính (ZIP), số điện thoại (Tel). Dữ liệu chủ miền khách hàng của hệ thống Kế toán được thể hiện ở Bảng 2. Các miền dữ liệu cũng như các dữ liệu khác bên trong tổ chức đều có thể chia thành 2 loại: dữ liệu hoạt động (operational data) và dữ liệu không hoạt động (nonoperational data). “Dừ liệu hoạt động” là tập họp dữ liệu theo thời gian thực để hồ trợ yêu cầu của tổ chức trong các hoạt động hàng ngày của họ. “Dữ liệu không hoạt động” thường được thu thập trong kho dữ liệu với tần suất ít hơn và được sử dụng cho hệ thống kinh doanh thông minh (Dalton Cervo Mark Allen, 2011). Dữ liệu chủ về bản chất là các dữ liệu “không hoạt động”, cụ thể hon, cấu trúc dữ liệu chủ được mô tả ở Hình 2. Cấu trúc dữ liệu chủ gồm 3 lóp: dữ liệu tham chiếu, dữ liệu cấu trúc giao dịch, dữ liệu cấu trúc doanh nghiệp. Hình 2. Cấu trúc 3 lóp dữ liệu chủ Nguồn: Keith Gordon (2013) - Dữ liệu tham chiếu (Reference Data): Dữ liệu thường được mô tả bởi các giá trị được sử dụng để phân biệt các dữ liệu khác nhau, chẳng hạn như phân biệt giữa dừ liệu chủ và dừ liệu giao dịch. - Dữ liệu cấu trúc giao dịch (Transaction structure data) đại diện cho những người tham gia trực tiếp trong một giao dịch, chẳng hạn như nhà cung cấp, khách hàng và sản phẩm. Thông tin về một giao dịch không thể được ghi lại trừ khi thông tin chi tiết của những người tham gia này đã tồn tại trong cơ sở dữ liệu. - Dữ liệu cấu trúc doanh nghiệp (Enterprise structure data) là dữ liệu mô tả cấu trúc của doanh nghiệp, ví dụ dữ liệu mô tả về cơ cấu tổ chức hoặc cơ cấu tài chính. Neu coi dữ liệu chủ được biểu diễn dưới dạng các danh từ của dừ liệu và thông tin thì dữ liệu giao dịch là các động từ. Chúng mô tả các hoạt động diễn ra hàng ngày trong tổ chức, doanh nghiệp như việc bán hàng, doanh số bán hàng, hay các bệnh nhân được phép xuất viện hay nhập viên tại bệnh viện... Bất kể các miền dữ liệu được xác định như thế nào, khái niệm dữ liệu chủ cần được xác định rõ ràng và phân biệt với các loại dữ liệu khác. Việc xác định dữ liệu chủ phụ thuộc quan điểm của từng tổ chức và dựa vào các thực thể quan trọng trong các miền dừ liệu của tổ chức đó. 3. Quản lý dữ liệu chủ Mặc dù được định nghĩa là dữ liệu chủ nhưng dừ liệu này vẫn có thể được lưu trữ phân tán ở các hệ thống ứng dụng khác nhau và do đó có thể dẫn đến các silo thông tin (các thông tin biệt lập). Điều này phản ánh một thực trạng tại nhiều doanh nghiệp là dữ liệu về một thực thể hay dữ liệu chủ của một miền dữ liệu được lưu trữ ở nhiều cơ sở dừ liệu khác nhau trong các hệ thống Số 229- Tháng 6. 2021- Tạp chí Khoa học Đào tạo Ngân hàng 75 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp khác nhau, nhưng thông tin phản ánh về chúng lại không đồng nhất. Việc lưu trừ dừ liệu chủ ở các hệ thống khác nhau gây khó khăn trong việc tổng hợp, phân tích và xử lý thông tin. Ví dụ được mô tả ở Hình 1, rõ ràng với dữ liệu chủ miên khách hàng được lưu trữ ở hệ thống “Kinh doanh” và hệ thống “Kế toán” là khác nhau. Thực tế là cùng một thực thể khách hàng Lê Văn An nhưng thông tin về khách hàng này được biểu diễn khác nhau ở 2 hệ thống: hệ thống “Kinh doanh” khách hàng An Van Le với mã khách hàng là KH002, có số điện thoại 0902345678, địa chỉ 25 Lý Thái Tổ, Hà Nội khác với khách hàng An Le (mã ID0070) trong hệ thống “Kế toán” với địa chỉ tại 12 Chùa Bộc, Hà Nội, có số điện thoại 0909789456. Mặc dù đây là một khách hàng duy nhất Lê Văn An, nhưng khi bộ phận quản lý muốn đưa ra các quyết định liên quan đến kế hoạch chăm sóc khách hàng và giới thiệu sản phẩm thì họ không biết được số điện thoại nào khách hàng hay sử dụng cũng như địa chỉ mà khách hàng thường xuyên có mặt ở đâu để có thể thực hiện các chiến dịch quảng cáo, marketing sản phẩm,... Vậy thông tin nào chính xác nhất khi mô tả về dữ liệu chủ miền khách hàng là vấn đề mà doanh nghiệp cần quan tâm, cũng như có một cái nhìn thống nhất về dữ liệu chủ khách hàng tại một nơi duy nhất, thay vì thông tin nằm rải rác ở nhiều hệ thống. Nhìn rộng hơn, với doanh nghiệp sản xuất và kinh doanh sản phẩm có nhiều bộ phận phòng ban thì dữ liệu chủ xuất hiện và được lưu giữ ở các hệ thống tách biệt nhau như ở Hình 3 (Keith Gordon, 2013). Như mô tả ở Hình 3, dữ liệu chủ các miền dữ liệu: khách hàng, sản phâm, phòng ban, nhà cung cẩp xuất hiện ở các quy trình trong các bộ phận, phòng ban khác nhau (Bảng 3). Dữ liệu chủ các miền dữ liệu được lưu trữ một cách rời rạc ở các hệ thống thông tin được cung cấp bởi các hãng khác nhau như mô tả ở hai ví dụ trên (Hình 1, Hình 3) sẽ dần đến tình trạng: dữ liệu của cùng một thực thể trong một miền dữ liệu sẽ rất khác biệt và khi đó chất lượng dữ liệu không được đảm bảo ảnh hưởng đến việc 76 Tạp chí Khoa học Đào tạo Ngân hàng- Số 229- Tháng 6. 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC Bảng 3. Dữ liệu chủ xuất hiện ờ các hệ thống khác nhau Dữ liệu chủ Được lưu trữ ở các hệ thống trong các phòng ban Sản phẩm 8 hệ thống Khách hàng 7 hệ thống Phòng ban 3 hệ thống Nhà cung cấp 3 hệ thống Nguồn: Keith Gordon (2013) ra quyết định của tổ chức, cùng nhiều vấn đề khác nữa liên quan đến điều hành, quản lý khi chất lượng dữ liệu kém... Chính vì vậy, cần phải Quản lý dữ liệu chủ (Master Data Management- MDM) để đảm bảo chất lượng thông tin chính xác nhất cho các thực thể quan trọng trong tổ chức. Định nghĩa về quản lý dữ liệu chủ của David Loshin (2009) cho biết: Quản lý dữ liệu chủ là tập hợp các hoạt động quản lý “dữ liệu tốt nhất”, mà có thể điều phối các bên liên quan chính, những người tham gia và khách hàng doanh nghiệp trong việc kết hợp với các ứng dụng kinh doanh, các phương pháp quản lý thông tin và công cụ quản lý dữ liệu để thực thi các chính sách, thủ tục, dịch vụ và cơ sở hạ tầng hồ trợ cho việc nắm bắt, tích hợp và sau đó chia sẻ việc sử dụng dữ liệu chủ, đảm bảo dữ liệu này là chính xác, kịp thời, nhất quán. Một định nghĩa nữa về quản lý dừ liệu chủ “đó là khuôn khổ của các quy trình và công nghệ nhằm tạo ra và duy trì một môi trường có thẩm quyền, đáng tin cậy, bền vững, chính xác và an toàn mà có thể mô tả một phiên bản duy nhất và toàn diện, chính xác của dữ liệu chủ và các mối quan hệ của nó. Định nghĩa được đưa ra bởi Gartner (2013): quản lý dữ liệu chủ là tập các quy tắc dựa trên công nghệ cho phép các bộ phận nghiệp vụ và công nghệ thông tin làm việc cùng nhau để giúp tổ chức có được một phiên bản duy nhất và chính xác nhất về dừ liệu chủ (Keith Gordon, 2013). Các định nghĩa này nêu rõ hai thành phần chính của việc quản lý dừ liệu chủ được mô tả ở Hình 4. Hai thành phần của MDM: Thành phần Chính sách (Policies) bao gồm các chính sách đại diện cho quản trị dữ liệu của MDM, thành phần Công nghệ (Technologies) bao gồm các công nghệ hồ trợ MDM. Chính sách xác định các vai trò và trách nhiệm trong quy trình MDM. Ví dụ: nếu một công ty giới thiệu một sản phẩm mới, các chính sách xác định ai chịu trách nhiệm tạo mục nhập mới trong sổ đăng ký sản phẩm chính, các tiêu chuẩn cho tạo định danh sản phẩm, những người hoặc bộ phận nào cần được thông báo và những hệ thống dữ liệu khác cần được cập nhật. Tuân thủ quy định cùng với sự riêng tư và bảo mật thông tin cũng là những vấn đề quan trọng (John R. Talburt Yinle Zhou, 2015). Thành phần công nghệ của MDM cần xác định hai việc chính, đó là: Quy trình xác định thực thể (Entity Resolution Process) và Quản lý thông tin xác thực thực thể (Entity Identity Information Management- EIIM). - Quy trình xác định thực thể (ER) sẽ xác định các thực thể quan trọng trong tổ chức, quy trình này diễn ra khi hai hệ thống thông tin đang cùng tham chiếu đến một hoặc nhiều thực thể trong thế giới thực. Quy trình Hình 4. Các thành phần của MDM Nguồn: John R. Taỉburt Yinle Zhou (2015) SÔ'''' 229- Tháng 6. 2021- Tạp chí Khoa học Đào tạo Ngân hàng 77 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp Customer Master Data Bảng 4. Dữ liệu chủ miền khách hàng sau khi được quăn lý bôi MDM ID First Middle Last TelNum Address City Zip ID0010 An Van Le 0902345678 12 Chua Boo Ha Noi 100000 Nguồn: David Loshin (2009) này sẽ “sắp xếp” chọn lọc thông tin về các thực thể, xảy ra khi có nhiều nguồn thông tin cùng tham chiếu đến tập các thực thể, sẽ chọn ra thông tin có độ ưu tiên, chính xác cao. Ví dụ, một bệnh nhân được đưa vào bệnh viện ở các thời điểm khác nhau, mỗi lần ở các khoa khác nhau là khoa nội trú và ngoại trú. ER sẽ so sánh thông tin nhập viện ở mồi thời điểm và đưa ra quyết định hồ sơ nhập viện nào cho cùng một bệnh nhân và hồ sơ nào dành cho bệnh nhân khác. - Quân lý thông tin nhận dạng thực thể (EIIM) là bộ sưu tập và quản lý thông tin nhận dạng với mục tiêu duy trì tính toàn vẹn danh tính chủ thể theo thời gian (Zhou Talburt, 201 la). Tính toàn vẹn danh tính thực thể yêu cầu mồi thực thể phải được mô tả trong một hệ thống là duy nhất. Các thực thể riêng biệt phải được ...
Trang 1Quản trị dữ liệu chủ da miền: nâng cao quản trị dữ liệu
cho các tô chức doanh nghiệp
Ngô Thùy Linh - Phan Thanh Đức Khoa Hệ thống thông tin quàn lý, Học viện Ngân hàng
Ngày nhận: 17/05/2021
Ngày nhận bàn sửa: 26/05/2021
Ngày duyệt đăng: 25/06/2021
Tóm tắt: Dữ liệu ngày nay đã trở thành một trong những tài sản quan trọng của các
tổ chức, doanh nghiệp Tuy nhiên, thách thức đặt ra với các nhà quản lý là làm thế nào để có thể khai thác, sử dụng và quản lý dữ liệu một cách hiệu quả và thông minh khỉ có quả nhiều nguồn dữ liệu bên trong và bên ngoài tố chức Giải pháp quản lý
dữ liệu chủ đa miền dựa vào việc quản lý tống thê dữ liệu trên đa miền sẽ giúp các
tổ chức có cái nhìn thong nhất và chỉnh xác về các thực thê quan trọng, từ đó cung cấp các thông tin tài chính phù hợp, đáng tin cậy Bài báo này tập trung làm rõ các khải niệm, tầm quan trọng cùa việc quản lý dữ liệu chủ đa miền và một số cách tiếp cận khỉ xây dựng quản lý dữ liệu chủ da miên.
Từ khóa: Dữ liệu chủ, Quản trị dữ liệu chủ, Quản lý dữ liệu chủ đa miền
Multi-domain master data management: improving data governance for enterprises
Abstract: Today data has become one of the important assets of organizations and businesses However, one challenge faced by managers is how to effectively and intelligently exploit, use and manage data when the organization is exposed to a large number of both internal and external data sources A multi-domain master data management solution based on the overall management of data across multiple domains will help organizations develop a unified and accurate view of important entities, thereby providing suitable and reliable financial information This article attempts to clarify the concepts and the importance of multi-domain master data management, and propose feasible approaches when building multi-domain master data management.
Keywords: Master Data, Master Data Management, Multi-Domain Master Data Management
Ngo, Thuy Linh
Email: linhnt@hvnh.edu.vn
Phan, Thanh Duc
Email: ducpt@hvnh.edu.vn
Organization of all: Faculty of Management Information System, Banking Academy of Vietnam
Trang 21 Đặt vấn đề
Một khảo sát của Gartner (2019) cho thấy
răng chât lượng dữ liệu kém đã dần đèn chi
phí của các tổ chức tăng lên tới 11,8 triệu
USD Một trong những nguyên nhân dẫn
đến chất lượng dừ liệu kém là chưa tích hợp
được thông tin từ các nguồn dữ liệu khác
nhau trong tổ chức Nhiều tổ chức hiện
nay đã nhận ra giá trị và tầm quan trọng
của việc quản lý dữ liệu chủ (Master Data
Management- MDM) và coi MDM là một
giải pháp cho thách thức này Các tổ chức
thường bắt đầu triển khai MDM và dừng
ở việc tập trung vào một miền dữ liệu (a
data domain), sau đó mới mở rộng đến các
miền khác trong mô hình quản lý dừ liệu đa
mien (a multi- domain model) Trong quá
trình thực hiện, hầu hết các tổ chức gặp một
số khó khăn trong việc thực hiện đầy đủ
và nhất quán các mục tiêu quản trị dữ liệu
chủ trên nhiều miền (Mark Allen & Dalton
Cervo, 2015) Sự khó khăn này bắt nguồn
từ việc không có cái nhìn tổng thể về các
thành phần, chức năng và cả các dịch vụ để
có thể quản trị dữ liệu chủ một cách chính
xác và hiệu quả Một số tổ chức nhìn nhận
việc quản trị này về bản chất chỉ là việc tích
hợp dừ liệu đơn thuần Đây sẽ trở thành
một sai lầm khi các dữ liệu theo thời gian
ngày càng trở nên đa dạng và phức tạp, bởi
vì ngoài việc tích họp dữ liệu thì tổ chức
còn cần phải đưa ra các trách nhiệm của
bộ phận, phòng ban đối với dữ liệu và cần
phải quan tâm đến việc quản lý chất lượng
dữ liệu để có thể tiếp cận thành công quản
trị dữ liệu trên nhiều miền Phần tiếp theo
của bài báo sẽ trình bày các vấn đề có liên
quan đến dữ liệu chủ, miền dữ liệu, quản
lý dừ liệu chủ, dừ liệu chủ đa miền và một
số cách tiếp cận xây dựng quản trị đa miền
nhằm nâng cao việc quản trị dữ liệu cho các
tô chức, doanh nghiệp
2 Dữ liệu chủ và miền dữ liệu
Mồi một miền dữ liệu phản ánh đến một tập các thực thể quan trọng mà các tổ chức, doanh nghiệp thường quan tâm như: tập các khách hàng, các sản phẩm, các nhà cung câp, các nhân viên, tài chính, chính sách (Mark Allen & Dalton Cervo, 2015) Trong mồi miền dữ liệu có thể có một hoặc nhiều thực thể, thực thể có thể là một đối tượng,
cá nhân, đơn vị, địa điểm phải là duy nhất trong một miền nhất định và thường có các thuộc tính kèm theo Ví dụ, trong miền Khách hàng, một doanh nghiệp đối tác hoặc một cá nhân có hợp đồng với doanh nghiệp có thể được coi là một thực thể, mồi thực thể khách hàng có một số thuộc tính như: họ tên, số điện thoại, e-mail, giới tính Tùy vào từng loại hình, lĩnh vực kinh doanh của từng tổ chức mà có các miền dữ liệu với các thực thể khác nhau Chẳng hạn
có một số miền dữ liệu tương ứng với từng lĩnh vực như sau:
- Lĩnh vực sản xuất: Khách hàng, Sản phẩm, Nhà cung cấp, Nguyên vật liệu, Địa điểm
- Lĩnh vực chăm sóc sức khỏe: Bệnh nhân,
Nhà cung cấp, Sản phẩm, Khiếu nại, Triệu chứng lâm sàng, Bảo hiểm
- Lĩnh vực tài chính: Khách hàng, Tài
khoản, Sản phẩm, Địa điểm, Bảo hiểm
- Lĩnh vực giáo dục: Sinh viên, Khoa bộ
môn, Địa điểm, Tài liệu, Khóa học
Trên thực tế, mức độ ưu tiên về dữ liệu của các thực thể là khác nhau, dữ liệu nào có mức độ ưu tiên cao sẽ được lưu trữ trong vùng bộ nhớ được truy cập nhanh hơn, trong hệ tài nguyên tốt hơn, quan tâm về chất lượng dừ liệu của thực thể đó hơn, có
cơ chế kiểm soát chất lượng dừ liệu tốt hơn
Do đó khái niệm “Dừ liệu chủ” (Master data) đã ra đời để mô tả, phản ánh đến những dữ liệu quan trọng cần được quan tâm nhiều hơn trong tổ chức Theo John R Talburt & Yinle Zhou (2015), dừ liệu chủ
Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 73
Trang 3Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp
của một tổ chức được định nghĩa là dữ liệu
được lưu giữ bởi tổ chức đó, mô tả các thực
thể độc lập và liên quan chính đến các hoạt
động của tổ chức Một định nghĩa khác về
dữ liệu chủ là dữ liệu mô tả vê các thực thê
quan trọng đối với các hoạt động và phân
tích của tổ chức, cách dừ liệu này tương tác
và chia sẻ sẽ cung cấp ngữ cảnh cho dữ liệu
giao dịch (Mark Allen & Dalton Cervo,
2015) Hay dữ liệu chủ là dữ liệu mô tả các thực thể lõi của tổ chức với tập các thuộc tính và định danh là nhất quán và chính xác (Keith Gordon, 2013)
Ví dụ sau đây sẽ mô tả rõ hơn về dữ liệu chủ,
dữ liệu về các thực thể khách hàng được lưu trữ ở các hệ thống Kinh doanh và Ke toán của công ty X (David Loshin, 2009)
Các thông tin liên quan đến thực thể khách
Hình 1 Dữ liệu về khách hàng được lưu trữ ở 2 hệ thống khác nhau
Nguồn: David Loshin (2009)
Bảng 1 Dữ liệu chủ miền khách hàng của Hệ thống Kinh doanh
Customer Master Data
ID Cust FirstName MiddleName LastName TelNum Address City
Nguồn: David Loshin (2009)
Nguồn: David Loshin (2009)
Bang 2 Dữ liệu chu miền khách hàng của Hệ thống Kế toán
Customer Master Data
74 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6 2021
Trang 4hàng được lưu trữ ở hai hệ thống này bao
gồm:
Hệ thống “Kinh doanh” lưu trừ các thông
tin khách hàng bao gồm: Tên (FirstName),
Tên đệm (MiddleName), Họ (LastName),
Số điện thoại (TelNum), Địa chỉ (Address)
Dữ liệu chủ miền khách hàng của hệ thống
Kinh doanh được biểu diễn như ở Bảng 1
Hệ thống “Kế toán” lưu trừ các thông tin
của khách hàng bao gồm: Tên (First), Họ
(Last), Địa chỉ (Add), Thành phố (City),
Mã bưu chính (ZIP), số điện thoại (Tel)
Dữ liệu chủ miền khách hàng của hệ thống
Kế toán được thể hiện ở Bảng 2
Các miền dữ liệu cũng như các dữ liệu khác
bên trong tổ chức đều có thể chia thành 2
loại: dữ liệu hoạt động (operational data)
và dữ liệu không hoạt động (nonoperational
data) “Dừ liệu hoạt động” là tập họp dữ
liệu theo thời gian thực để hồ trợ yêu cầu
của tổ chức trong các hoạt động hàng ngày
của họ “Dữ liệu không hoạt động” thường
được thu thập trong kho dữ liệu với tần suất
ít hơn và được sử dụng cho hệ thống kinh
doanh thông minh (Dalton Cervo & Mark
Allen, 2011) Dữ liệu chủ về bản chất là các
dữ liệu “không hoạt động”, cụ thể hon, cấu
trúc dữ liệu chủ được mô tả ở Hình 2
Cấu trúc dữ liệu chủ gồm 3 lóp: dữ liệu
tham chiếu, dữ liệu cấu trúc giao dịch, dữ
liệu cấu trúc doanh nghiệp
Hình 2 Cấu trúc 3 lóp dữ liệu chủ
Nguồn: Keith Gordon (2013)
- Dữ liệu tham chiếu (Reference Data): Dữ liệu thường được mô tả bởi các giá trị được
sử dụng để phân biệt các dữ liệu khác nhau, chẳng hạn như phân biệt giữa dừ liệu chủ
và dừ liệu giao dịch
- Dữ liệu cấu trúc giao dịch (Transaction structure data) đại diện cho những người tham gia trực tiếp trong một giao dịch, chẳng hạn như nhà cung cấp, khách hàng
và sản phẩm Thông tin về một giao dịch không thể được ghi lại trừ khi thông tin chi tiết của những người tham gia này đã tồn tại trong cơ sở dữ liệu
- Dữ liệu cấu trúc doanh nghiệp (Enterprise structure data) là dữ liệu mô tả cấu trúc của doanh nghiệp, ví dụ dữ liệu mô tả về cơ cấu
tổ chức hoặc cơ cấu tài chính
Neu coi dữ liệu chủ được biểu diễn dưới dạng các danh từ của dừ liệu và thông tin thì dữ liệu giao dịch là các động từ Chúng
mô tả các hoạt động diễn ra hàng ngày trong tổ chức, doanh nghiệp như việc bán hàng, doanh số bán hàng, hay các bệnh nhân được phép xuất viện hay nhập viên tại bệnh viện
Bất kể các miền dữ liệu được xác định như thế nào, khái niệm dữ liệu chủ cần được xác định rõ ràng và phân biệt với các loại
dữ liệu khác Việc xác định dữ liệu chủ phụ thuộc quan điểm của từng tổ chức và dựa vào các thực thể quan trọng trong các miền
dừ liệu của tổ chức đó
3 Quản lý dữ liệu chủ
Mặc dù được định nghĩa là dữ liệu chủ nhưng dừ liệu này vẫn có thể được lưu trữ phân tán ở các hệ thống ứng dụng khác nhau và do đó có thể dẫn đến các silo thông tin (các thông tin biệt lập) Điều này phản ánh một thực trạng tại nhiều doanh nghiệp
là dữ liệu về một thực thể hay dữ liệu chủ của một miền dữ liệu được lưu trữ ở nhiều
cơ sở dừ liệu khác nhau trong các hệ thống
Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 75
Trang 5Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp
khác nhau, nhưng thông tin phản ánh về
chúng lại không đồng nhất
Việc lưu trừ dừ liệu chủ ở các hệ thống khác
nhau gây khó khăn trong việc tổng hợp,
phân tích và xử lý thông tin Ví dụ được mô
tả ở Hình 1, rõ ràng với dữ liệu chủ miên
khách hàng được lưu trữ ở hệ thống “Kinh
doanh” và hệ thống “Kế toán” là khác
nhau Thực tế là cùng một thực thể khách
hàng Lê Văn An nhưng thông tin về khách
hàng này được biểu diễn khác nhau ở 2 hệ
thống: hệ thống “Kinh doanh” khách hàng
An Van Le với mã khách hàng là KH002,
có số điện thoại 0902345678, địa chỉ 25 Lý
Thái Tổ, Hà Nội khác với khách hàng An
Le (mã ID0070) trong hệ thống “Kế toán”
với địa chỉ tại 12 Chùa Bộc, Hà Nội, có số
điện thoại 0909789456 Mặc dù đây là một
khách hàng duy nhất Lê Văn An, nhưng khi
bộ phận quản lý muốn đưa ra các quyết định
liên quan đến kế hoạch chăm sóc khách
hàng và giới thiệu sản phẩm thì họ không
biết được số điện thoại nào khách hàng hay
sử dụng cũng như địa chỉ mà khách hàng
thường xuyên có mặt ở đâu để có thể thực
hiện các chiến dịch quảng cáo, marketing
sản phẩm, Vậy thông tin nào chính xác
nhất khi mô tả về dữ liệu chủ miền khách
hàng là vấn đề mà doanh nghiệp cần quan
tâm, cũng như có một cái nhìn thống nhất
về dữ liệu chủ khách hàng tại một nơi duy
nhất, thay vì thông tin nằm rải rác ở nhiều
hệ thống
Nhìn rộng hơn, với doanh nghiệp sản xuất
và kinh doanh sản phẩm có nhiều bộ phận
phòng ban thì dữ liệu chủ xuất hiện và được
lưu giữ ở các hệ thống tách biệt nhau như ở
Hình 3 (Keith Gordon, 2013)
Như mô tả ở Hình 3, dữ liệu chủ các miền
dữ liệu: khách hàng, sản phâm, phòng ban,
nhà cung cẩp xuất hiện ở các quy trình
trong các bộ phận, phòng ban khác nhau
(Bảng 3)
Dữ liệu chủ các miền dữ liệu được lưu
trữ một cách rời rạc ở các hệ thống thông tin được cung cấp bởi các hãng khác nhau như mô tả ở hai ví dụ trên (Hình 1, Hình 3) sẽ dần đến tình trạng: dữ liệu của cùng một thực thể trong một miền dữ liệu sẽ rất khác biệt và khi đó chất lượng dữ liệu không được đảm bảo ảnh hưởng đến việc
76 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6 2021
Trang 6Bảng 3 Dữ liệu chủ xuất hiện ờ các
hệ thống khác nhau
Dữ liệu chủ Được lưu trữ ở các hệ
thống trong các phòng ban
Nhà cung cấp 3 hệ thống
Nguồn: Keith Gordon (2013)
ra quyết định của tổ chức, cùng nhiều vấn
đề khác nữa liên quan đến điều hành, quản
lý khi chất lượng dữ liệu kém Chính vì
vậy, cần phải Quản lý dữ liệu chủ (Master
Data Management- MDM) để đảm bảo
chất lượng thông tin chính xác nhất cho các
thực thể quan trọng trong tổ chức
Định nghĩa về quản lý dữ liệu chủ của
David Loshin (2009) cho biết: Quản lý dữ
liệu chủ là tập hợp các hoạt động quản lý
“dữ liệu tốt nhất”, mà có thể điều phối các
bên liên quan chính, những người tham gia
và khách hàng doanh nghiệp trong việc
kết hợp với các ứng dụng kinh doanh, các
phương pháp quản lý thông tin và công cụ
quản lý dữ liệu để thực thi các chính sách,
thủ tục, dịch vụ và cơ sở hạ tầng hồ trợ cho
việc nắm bắt, tích hợp và sau đó chia sẻ
việc sử dụng dữ liệu chủ, đảm bảo dữ liệu
này là chính xác, kịp thời, nhất quán Một
định nghĩa nữa về quản lý dừ liệu chủ “đó là
khuôn khổ của các quy trình và công nghệ
nhằm tạo ra và duy trì một môi trường có
thẩm quyền, đáng tin cậy, bền vững, chính
xác và an toàn mà có thể mô tả một phiên
bản duy nhất và toàn diện, chính xác của dữ
liệu chủ và các mối quan hệ của nó Định
nghĩa được đưa ra bởi Gartner (2013): quản
lý dữ liệu chủ là tập các quy tắc dựa trên
công nghệ cho phép các bộ phận nghiệp
vụ và công nghệ thông tin làm việc cùng
nhau để giúp tổ chức có được một phiên
bản duy nhất và chính xác nhất về dừ liệu
chủ (Keith Gordon, 2013)
Các định nghĩa này nêu rõ hai thành phần chính của việc quản lý dừ liệu chủ được mô
tả ở Hình 4
Hai thành phần của MDM: Thành phần Chính sách (Policies) bao gồm các chính sách đại diện cho quản trị dữ liệu của MDM, thành phần Công nghệ (Technologies) bao gồm các công nghệ hồ trợ MDM Chính sách xác định các vai trò và trách nhiệm trong quy trình MDM Ví dụ: nếu một công
ty giới thiệu một sản phẩm mới, các chính sách xác định ai chịu trách nhiệm tạo mục nhập mới trong sổ đăng ký sản phẩm chính, các tiêu chuẩn cho tạo định danh sản phẩm, những người hoặc bộ phận nào cần được thông báo và những hệ thống dữ liệu khác cần được cập nhật Tuân thủ quy định cùng với sự riêng tư và bảo mật thông tin cũng là những vấn đề quan trọng (John R Talburt
& Yinle Zhou, 2015)
Thành phần công nghệ của MDM cần xác định hai việc chính, đó là: Quy trình xác định thực thể (Entity Resolution Process)
và Quản lý thông tin xác thực thực thể (Entity Identity Information Management- EIIM)
- Quy trình xác định thực thể (ER) sẽ xác định các thực thể quan trọng trong tổ chức, quy trình này diễn ra khi hai hệ thống thông tin đang cùng tham chiếu đến một hoặc nhiều thực thể trong thế giới thực Quy trình
Hình 4 Các thành phần của MDM
Nguồn: John R Taỉburt & Yinle Zhou (2015)
SÔ' 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 77
Trang 7Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp
Customer Master Data
Bảng 4 Dữ liệu chủ miền khách hàng sau khi được quăn lý bôi MDM
Nguồn: David Loshin (2009)
này sẽ “sắp xếp” chọn lọc thông tin về các
thực thể, xảy ra khi có nhiều nguồn thông
tin cùng tham chiếu đến tập các thực thể, sẽ
chọn ra thông tin có độ ưu tiên, chính xác
cao Ví dụ, một bệnh nhân được đưa vào
bệnh viện ở các thời điểm khác nhau, mỗi
lần ở các khoa khác nhau là khoa nội trú và
ngoại trú ER sẽ so sánh thông tin nhập viện
ở mồi thời điểm và đưa ra quyết định hồ sơ
nhập viện nào cho cùng một bệnh nhân và
hồ sơ nào dành cho bệnh nhân khác
- Quân lý thông tin nhận dạng thực thể
(EIIM) là bộ sưu tập và quản lý thông tin
nhận dạng với mục tiêu duy trì tính toàn
vẹn danh tính chủ thể theo thời gian (Zhou
& Talburt, 201 la) Tính toàn vẹn danh tính
thực thể yêu cầu mồi thực thể phải được mô
tả trong một hệ thống là duy nhất Các thực
thể riêng biệt phải được mô tả riêng cho
trong hệ thống (Maydanchik, 2007) Toàn
vẹn danh tính chủ thể là một yêu cầu cơ bản
cho các hệ thống MDM
Quay trở lại ví dụ mô tả trên Hình 1, sau
khi xác minh với khách hàng tên Lê Văn
An thì bộ phận chăm sóc khách hàng biết
được rằng: ông Lê Văn An có địa chỉ 12
Chùa Bộc là địa chỉ tạm trú và địa chỉ ở
25 Lý Thường Kiệt là nơi đăng ký địa chỉ
thường trú, số điện thoại 0902345678 là
số điện thoại khách hàng thường xuyên sử
dụng Do đó mọi giao dịch sẽ được thực
hiện với ông An ở 12 Chùa Bộc, liên hệ
qua số điện thoại 0902345678 Một số bộ
phận, phòng ban (phụ trách liên quan đến
mảng khách hàng) của doanh nghiệp X mong muốn được lấy thông tin về khách hàng một cách chính xác và đảm bảo nhất
Dữ liệu chủ về miền khách hàng sau khi được quản lý bởi MDM và được biểu diễn như Bảng 4
Miền dữ liệu khách hàng có thực thể khách hàng Lê Văn An (Bảng 4) sau khi được quản lý bởi MDM có mã định danh ID0010 duy nhất với các thuộc tính: Tên, Đệm,
Họ, Số điện thoại, Địa chỉ, Thành phố, Mã bưu chính; ngoài thực thể này thì miền dữ liệu khách hàng còn có nhiều khách hàng khác và các đối tác cũng được quản lý bởi MDM
Như vậy quản lý dừ liệu chủ không chi là vấn đề về công nghệ, không chỉ là vấn đề tích hợp dữ liệu mà còn liên quan đến trách nhiệm quản lý dữ liệu, trách nhiệm của các bộ phận phòng ban liên quan rồi chính sách, chiến lược của tổ chức Khi tổ chức, doanh nghiệp triển khai MDM, thì các
bộ phận nghiệp vụ và bộ phận công nghệ thông tin làm việc cùng nhau sẽ đảm bảo được tính đồng nhất, độ chính xác, tính bền vững của dữ liệu chủ được chia sẻ trong tổ chức đó Do đó tổ chức cũng tránh được các cuộc tranh luận vô tận, tốn thời gian về việc trả lời câu hỏi “dữ liệu của hệ thống trong phòng ban nào là đúng?”, điều này có thể dần đến các quyết định kém hiệu quả ảnh hưởng tới chiến lược của tổ chức
Dữ liệu chủ đa miền
Quản lý dữ liệu chủ sẽ cung cấp công cụ
78 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6 2021
Trang 8Bảng 5 Một số nhân tố xác định các miền cần đến MDM
GIÁ TRỊ KINH DOANH
Giá trị kinh doanh là một yếu tố quan trọng khi quyết định những miền nào cần phải có MDM Một lý do tại sao hầu hết các công ty bắt đầu với MDM khách hàng là vì không ccó gì nghi ngờ giá trị chính xác về thông tin khách hàng mang lại cho doanh nghiệp Một phiên bản duy nhất và chính xác về khách hàng có thể liên quan trực tiếp đến sự sông còn của một tổ chức Như vậy, mọi miền cần được đánh giá từ quan điểm giá trị kinh daonh để xác định lợi ích của việc áp dụng MDM cho tổ chức đó
SỐ LƯỢNG
Số lượng liên quan trực tiếp đến việc cần thiết có MDM Nếu một công
ty chỉ cộ hai hoặc ba đối tác, thì không có khả năng hưởng lợi từ MDM đến miền đối tác Nhưng với một ví dụ khác, nếu một công ty kinh doạnh với hàng ngàn đại lý, thì việc thực hiện giải pháp MDM cho các miền đối tác rất có ý nghĩa
TÍNH THAY ĐỔI Nếu dữ liệu không thay đổi và các tập thuộc tính của dữ liệu liên quan
đến các thực thể không biến đổi thì không cần thiết phải cần đến MDM KHẢ NẤNG DỪNG LẠI
Càng nhiều miền có trong một tổ chức thì việc sử dụng MDM càng cần thiêt để có sự nhât quán, tin cậy, chính xác của các luồng thông tin trong tổ chức đó.
ĐỌ PHỨC TẠP
Độ phức tạp của các thuộc tính và dữ liệu liên quan đến một miền là
cơ sở để thực thi giải pháp MDM Lấy miền sản phẩm làm ví dụ: Các sản phẩm trong một công ty có thể rất phức tạp, với số lượng lớn các thuộc tính liên quan Từ thực tế đó việc triển khai MDM cho miền sản phẩm trong công ty là rất lớn
Nguồn:Mark Allen & Dalton Cervo (2015)
và quy trình quản lý dữ liệu chủ, đảm bảo
dữ liệu chủ không chỉ nhất quán mà còn
chính xác Quản lý dữ liệu chủ theo miền
(Master Data Management domain) phản
ánh một miền dữ liệu cụ thể mà tại đó việc
xác định và kiểm soát dữ liệu chủ được
tập trung Trong tổ chức không chỉ có một
miền dữ liệu mà còn nhiều miền dữ liệu
quan trọng khác nữa, do đó họ không chỉ
tập trung quản lý dừ liệu chủ trên một miền
mà còn hướng tới quản lý trên nhiều miền
Quản lý dữ liệu chủ đa miền có liên quan
đến việc quản lý tổng thể dữ liệu chủ trên
nhiều miền Vậy liệu tất cả các miền có cần
đến MDM, nhân tố nào ảnh hưởng đến việc
xác định miền dữ liệu cần MDM tập trung
quan tâm đến? Bảng 5 mô tả một số nhân tố
chính trong việc định hướng miền dữ liệu
cho MDM trong mô hình đa miền
Để việc quản lý dừ liệu và cung cấp thông
tin một cách hiệu quả cũng như tăng cao khả năng cạnh tranh cho các tổ chức, doanh nghiệp thì các giải pháp MDM đa miền cần
có sự tham gia và cộng tác hiệu quả của bộ phận nghiệp vụ chịu trách nhiệm về chất lượng dữ liệu và bộ phận công nghệ thông tin có nhiệm vụ quản trị dữ liệu MDM đa miền cần hoạt động như một cầu nối tạo động lực cho việc cộng tác cho hai bộ phận
đó trong tổ chức Điều này dễ hiểu đối với tình huống tổ chức doanh nghiệp nào cần chuyển đổi từ cơ sở hạ tầng hệ thống cũ sang hệ thống mới đòi hỏi phải có các yêu cầu liên quan đến bảo mật, quyền riêng tư, các quy định, chính sách Để đối mặt và giải quyết được các thách thức này cần có
sự kết hợp chặt chẽ giữa các phòng ban nghiệp vụ và phòng ban công nghệ Một minh họa về giải pháp MDM đa miền được
mô tả ở Hình 5
Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 79
Trang 9Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp
Nguồn:Mark Allen & Dalton Cervo (2015)
Với giải pháp MDM đa miền được mô tả ở
Hình 5, cần đến 4 bộ phận hồ trợ cho việc
triển khai MDM thành công, đó là: sự hồ
trợ từ cấp điều hành, từ ban chỉ đạo, bộ
phận quản lý chưcmg trình, bộ phận quản lý
các thay đổi và rủi ro Với mỗi miền dữ liệu
1, 2, , n cần phải bảo đảm chất lượng dữ
liệu, đồng bộ hóa dữ liệu, chính sách quản
lý dữ liệu, quản lý dữ liệu tham chiếu, xác
định thực thể, quản lý Đọc- Ghi- Cập nhật-
Xóa dữ liệu (CRƯD) Giải pháp MDM thể
hiện trên Hình 5 cho thấy một số chức năng
được dùng chung và có thể được sử dụng
bởi nhiều miền dữ liệu Ví dụ, chương trình
quản trị dữ liệu có phạm vi và quyền hạn
rộng hơn, không chỉ tập trung vào dữ liệu
chủ Tương tự, việc bảo mật dừ liệu có thê
sẽ tập trung vào các chính sách và quản lý
liên quan đến truy cập dữ liệu và bảo vệ dữ
liệu chủ Vì MDM được áp dụng trên nhiều miền, nên các chức năng, các công cụ và quy trình liên quan tới các miền trở nên dề
sử dụng hơn Một số chức năng, chang hạn như quản lý chất lượng dữ liệu là vô cùng rộng Bởi vì nếu chất lượng dữ liệu của một miền tốt thực sự thì có thể tái sử dụng dữ liệu này trên nhiều miền, nhưng chúng vần
có các yêu cầu cụ thể theo miền cho các hoạt động như mô tả dữ liệu, làm sạch dữ liệu, chuẩn hóa dữ liệu
Như vậy giải pháp MDM được thiết lập
để giải quyết các vấn đề: dừ liệu trùng lặp, phân mảnh, không nhất quán trên nhiều nguồn Các hệ thống thông tin thường sẽ
hồ trợ một nghiệp vụ cụ thể và khi đó dữ liệu chủ yếu duy trì cho nghiệp vụ này Có rất ít sự kết nối dữ liệu giữa các hệ thống với nhau vì thiếu quy trình tổng thể trong
80 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6 2021
Trang 10Hình 6 Các chức năng của MDM đa miền
Nguồn:Mark Allen & Dalton Cervo (2015)
tổ chức Và hệ quả là dữ liệu có chất lượng
kém, không chính xác bởi vì có nhiều nguồn
thông tin cùng mô tả, đại diện cho một thực
thể MDM sẽ đóng vai trò hỗ trợ thiết lập
và quản lý các luật để xác định các thành
phần dữ liệu chung, được sử dụng để khớp
các thực thể từ nhiều nguồn, cũng như đưa
các kỳ thuật để làm sạch và củng cố thông
tin từ các nguồn đó Từ đó tạo ra một phiên
bản duy nhất và chính xác nhất về thực thể
Hình 6 biếu diễn các chức năng của MDM
đa miền như: quản trị dữ liệu, quản trị chất
lượng dữ liệu, đồng bộ và tích hợp dữ liệu,
quản lý dữ liệu tham chiếu, bảo mật dữ
liệu, kiến trúc dữ liệu
4 Một số cách tiếp cận xây dựng dữ liệu
chủ đa miền
Không có một cách tiếp cận duy nhất nào
có thể phù hợp cho tất cả các yêu cầu của
MDM đa miền ở mọi tổ chức, doanh nghiệp
Như đã trình bày ở Bảng 5, có nhiều yếu
tố ảnh hưởng đến việc xác định miền dữ liệu của một tổ chức có cần đến MDM hay không, riêng một miền dữ liệu cũng đã đòi hỏi nhiều công nghệ để vận hành Hơn nữa việc triển khai MDM không chỉ đơn thuần chỉ là thêm một ứng dụng mới mà có thể sẽ ảnh hưởng đến các dữ liệu quan trọng đang được lưu trữ trong các hệ thống hiện có Từ góc độ công nghệ, hiện nay không có giải pháp duy nhất nào có thể đồng thời thỏa mãn các yêu cầu của các tổ chức, doanh nghiệp Do đó, khi đánh giá các sản phẩm MDM đa miền, cần phải hiểu những gì nhà cung cấp mang lại cho doanh nghiệp
MDM đa miền có thể phát triển từ nhiều tình huống khác nhau có thể xảy ra trong doanh nghiệp, vì vậy khó có một chiến lược hoặc kế hoạch toàn diện nào cho các
tổ chức, doanh nghiệp Chẳng hạn trong Ngân hàng X bộ phận Telesales sau khi gọi điện cho khách hàng A tư vấn về sản phẩm bảo hiểm thì họ được khách hàng này phản hồi là đã từng đến giao dịch tại chi nhánh
Sô' 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 81