Kinh Tế - Quản Lý - Báo cáo khoa học, luận văn tiến sĩ, luận văn thạc sĩ, nghiên cứu - Kinh Tế - Economic Quản trị dữ liệu chủ da miền: nâng cao quản trị dữ liệu cho các tô chức doanh nghiệp Ngô Thùy Linh - Phan Thanh Đức Khoa Hệ thống thông tin quàn lý, Học viện Ngân hàng Ngày nhận: 17052021 Ngày nhận bàn sửa: 26052021 Ngày duyệt đăng: 25062021 Tóm tắt: Dữ liệu ngày nay đã trở thành một trong những tài sản quan trọng của các tổ chức, doanh nghiệp. Tuy nhiên, thách thức đặt ra với các nhà quản lý là làm thế nào để có thể khai thác, sử dụng và quản lý dữ liệu một cách hiệu quả và thông minh khỉ có quả nhiều nguồn dữ liệu bên trong và bên ngoài tố chức. Giải pháp quản lý dữ liệu chủ đa miền dựa vào việc quản lý tống thê dữ liệu trên đa miền sẽ giúp các tổ chức có cái nhìn thong nhất và chỉnh xác về các thực thê quan trọng, từ đó cung cấp các thông tin tài chính phù hợp, đáng tin cậy. Bài báo này tập trung làm rõ các khải niệm, tầm quan trọng cùa việc quản lý dữ liệu chủ đa miền và một số cách tiếp cận khỉ xây dựng quản lý dữ liệu chủ da miên. Từ khóa: Dữ liệu chủ, Quản trị dữ liệu chủ, Quản lý dữ liệu chủ đa miền Multi-domain master data management: improving data governance for enterprises Abstract: Today data has become one of the important assets of organizations and businesses. However, one challenge faced by managers is how to effectively and intelligently exploit, use and manage data when the organization is exposed to a large number of both internal and external data sources. A multi-domain master data management solution based on the overall management of data across multiple domains will help organizations develop a unified and accurate view of important entities, thereby providing suitable and reliable financial information. This article attempts to clarify the concepts and the importance of multi-domain master data management, and propose feasible approaches when building multi-domain master data management. Keywords: Master Data, Master Data Management, Multi-Domain Master Data Management Ngo, Thuy Linh Email: linhnthvnh.edu.vn Phan, Thanh Duc Email: ducpthvnh.edu.vn Organization of all: Faculty of Management Information System, Banking Academy of Vietnam Tạp chí Khoa học Đào tạo Ngân hàng Học viện Ngân hàng số 229-Tháng 6. 2021 72 ISSN 1859 - 011X NGÔ THÙY LINH - PHAN THANH ĐỨC 1. Đặt vấn đề Một khảo sát của Gartner (2019) cho thấy răng chât lượng dữ liệu kém đã dần đèn chi phí của các tổ chức tăng lên tới 11,8 triệu USD. Một trong những nguyên nhân dẫn đến chất lượng dừ liệu kém là chưa tích hợp được thông tin từ các nguồn dữ liệu khác nhau trong tổ chức. Nhiều tổ chức hiện nay đã nhận ra giá trị và tầm quan trọng của việc quản lý dữ liệu chủ (Master Data Management- MDM) và coi MDM là một giải pháp cho thách thức này. Các tổ chức thường bắt đầu triển khai MDM và dừng ở việc tập trung vào một miền dữ liệu (a data domain), sau đó mới mở rộng đến các miền khác trong mô hình quản lý dừ liệu đa mien (a multi- domain model). Trong quá trình thực hiện, hầu hết các tổ chức gặp một số khó khăn trong việc thực hiện đầy đủ và nhất quán các mục tiêu quản trị dữ liệu chủ trên nhiều miền (Mark Allen Dalton Cervo, 2015). Sự khó khăn này bắt nguồn từ việc không có cái nhìn tổng thể về các thành phần, chức năng và cả các dịch vụ để có thể quản trị dữ liệu chủ một cách chính xác và hiệu quả. Một số tổ chức nhìn nhận việc quản trị này về bản chất chỉ là việc tích hợp dừ liệu đơn thuần. Đây sẽ trở thành một sai lầm khi các dữ liệu theo thời gian ngày càng trở nên đa dạng và phức tạp, bởi vì ngoài việc tích họp dữ liệu thì tổ chức còn cần phải đưa ra các trách nhiệm của bộ phận, phòng ban đối với dữ liệu và cần phải quan tâm đến việc quản lý chất lượng dữ liệu để có thể tiếp cận thành công quản trị dữ liệu trên nhiều miền. Phần tiếp theo của bài báo sẽ trình bày các vấn đề có liên quan đến dữ liệu chủ, miền dữ liệu, quản lý dừ liệu chủ, dừ liệu chủ đa miền và một số cách tiếp cận xây dựng quản trị đa miền nhằm nâng cao việc quản trị dữ liệu cho các tô chức, doanh nghiệp. 2. Dữ liệu chủ và miền dữ liệu Mồi một miền dữ liệu phản ánh đến một tập các thực thể quan trọng mà các tổ chức, doanh nghiệp thường quan tâm như: tập các khách hàng, các sản phẩm, các nhà cung câp, các nhân viên, tài chính, chính sách... (Mark Allen Dalton Cervo, 2015). Trong mồi miền dữ liệu có thể có một hoặc nhiều thực thể, thực thể có thể là một đối tượng, cá nhân, đơn vị, địa điểm... phải là duy nhất trong một miền nhất định và thường có các thuộc tính kèm theo. Ví dụ, trong miền Khách hàng, một doanh nghiệp đối tác hoặc một cá nhân có hợp đồng với doanh nghiệp có thể được coi là một thực thể, mồi thực thể khách hàng có một số thuộc tính như: họ tên, số điện thoại, e-mail, giới tính... Tùy vào từng loại hình, lĩnh vực kinh doanh của từng tổ chức mà có các miền dữ liệu với các thực thể khác nhau. Chẳng hạn có một số miền dữ liệu tương ứng với từng lĩnh vực như sau: - Lĩnh vực sản xuất: Khách hàng, Sản phẩm, Nhà cung cấp, Nguyên vật liệu, Địa điểm... - Lĩnh vực chăm sóc sức khỏe: Bệnh nhân, Nhà cung cấp, Sản phẩm, Khiếu nại, Triệu chứng lâm sàng, Bảo hiểm... - Lĩnh vực tài chính: Khách hàng, Tài khoản, Sản phẩm, Địa điểm, Bảo hiểm... - Lĩnh vực giáo dục: Sinh viên, Khoa bộ môn, Địa điểm, Tài liệu, Khóa học... Trên thực tế, mức độ ưu tiên về dữ liệu của các thực thể là khác nhau, dữ liệu nào có mức độ ưu tiên cao sẽ được lưu trữ trong vùng bộ nhớ được truy cập nhanh hơn, trong hệ tài nguyên tốt hơn, quan tâm về chất lượng dừ liệu của thực thể đó hơn, có cơ chế kiểm soát chất lượng dừ liệu tốt hơn. Do đó khái niệm “Dừ liệu chủ” (Master data) đã ra đời để mô tả, phản ánh đến những dữ liệu quan trọng cần được quan tâm nhiều hơn trong tổ chức. Theo John R. Talburt Yinle Zhou (2015), dừ liệu chủ Số 229- Tháng 6. 2021- Tạp chí Khoa học Đào tạo Ngân hàng 73 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp của một tổ chức được định nghĩa là dữ liệu được lưu giữ bởi tổ chức đó, mô tả các thực thể độc lập và liên quan chính đến các hoạt động của tổ chức. Một định nghĩa khác về dữ liệu chủ là dữ liệu mô tả vê các thực thê quan trọng đối với các hoạt động và phân tích của tổ chức, cách dừ liệu này tương tác và chia sẻ sẽ cung cấp ngữ cảnh cho dữ liệu giao dịch (Mark Allen Dalton Cervo, 2015). Hay dữ liệu chủ là dữ liệu mô tả các thực thể lõi của tổ chức với tập các thuộc tính và định danh là nhất quán và chính xác (Keith Gordon, 2013). Ví dụ sau đây sẽ mô tả rõ hơn về dữ liệu chủ, dữ liệu về các thực thể khách hàng được lưu trữ ở các hệ thống Kinh doanh và Ke toán của công ty X (David Loshin, 2009) Các thông tin liên quan đến thực thể khách Hình 1. Dữ liệu về khách hàng được lưu trữ ở 2 hệ thống khác nhau Nguồn: David Loshin (2009) Bảng 1. Dữ liệu chủ miền khách hàng của Hệ thống Kinh doanh Customer Master Data ID Cust FirstName MiddleName LastName TelNum Address City KH002 An Van Le 090234567 25 Ly Thai To Ha Noi Nguồn: David Loshin (2009) Nguồn: David Loshin (2009) Bang 2. Dữ liệu chu miền khách hàng của Hệ thống Kế toán Customer Master Data ID First Last Add City Zip Tel ID0070 An Le 12 Chua Boc Ha Noi 100000 0909789456 74 Tạp chí Khoa học Đào tạo Ngân hàng- số 229- Tháng 6. 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC hàng được lưu trữ ở hai hệ thống này bao gồm: Hệ thống “Kinh doanh” lưu trừ các thông tin khách hàng bao gồm: Tên (FirstName), Tên đệm (MiddleName), Họ (LastName), Số điện thoại (TelNum), Địa chỉ (Address). Dữ liệu chủ miền khách hàng của hệ thống Kinh doanh được biểu diễn như ở Bảng 1. Hệ thống “Kế toán” lưu trừ các thông tin của khách hàng bao gồm: Tên (First), Họ (Last), Địa chỉ (Add), Thành phố (City), Mã bưu chính (ZIP), số điện thoại (Tel). Dữ liệu chủ miền khách hàng của hệ thống Kế toán được thể hiện ở Bảng 2. Các miền dữ liệu cũng như các dữ liệu khác bên trong tổ chức đều có thể chia thành 2 loại: dữ liệu hoạt động (operational data) và dữ liệu không hoạt động (nonoperational data). “Dừ liệu hoạt động” là tập họp dữ liệu theo thời gian thực để hồ trợ yêu cầu của tổ chức trong các hoạt động hàng ngày của họ. “Dữ liệu không hoạt động” thường được thu thập trong kho dữ liệu với tần suất ít hơn và được sử dụng cho hệ thống kinh doanh thông minh (Dalton Cervo Mark Allen, 2011). Dữ liệu chủ về bản chất là các dữ liệu “không hoạt động”, cụ thể hon, cấu trúc dữ liệu chủ được mô tả ở Hình 2. Cấu trúc dữ liệu chủ gồm 3 lóp: dữ liệu tham chiếu, dữ liệu cấu trúc giao dịch, dữ liệu cấu trúc doanh nghiệp. Hình 2. Cấu trúc 3 lóp dữ liệu chủ Nguồn: Keith Gordon (2013) - Dữ liệu tham chiếu (Reference Data): Dữ liệu thường được mô tả bởi các giá trị được sử dụng để phân biệt các dữ liệu khác nhau, chẳng hạn như phân biệt giữa dừ liệu chủ và dừ liệu giao dịch. - Dữ liệu cấu trúc giao dịch (Transaction structure data) đại diện cho những người tham gia trực tiếp trong một giao dịch, chẳng hạn như nhà cung cấp, khách hàng và sản phẩm. Thông tin về một giao dịch không thể được ghi lại trừ khi thông tin chi tiết của những người tham gia này đã tồn tại trong cơ sở dữ liệu. - Dữ liệu cấu trúc doanh nghiệp (Enterprise structure data) là dữ liệu mô tả cấu trúc của doanh nghiệp, ví dụ dữ liệu mô tả về cơ cấu tổ chức hoặc cơ cấu tài chính. Neu coi dữ liệu chủ được biểu diễn dưới dạng các danh từ của dừ liệu và thông tin thì dữ liệu giao dịch là các động từ. Chúng mô tả các hoạt động diễn ra hàng ngày trong tổ chức, doanh nghiệp như việc bán hàng, doanh số bán hàng, hay các bệnh nhân được phép xuất viện hay nhập viên tại bệnh viện... Bất kể các miền dữ liệu được xác định như thế nào, khái niệm dữ liệu chủ cần được xác định rõ ràng và phân biệt với các loại dữ liệu khác. Việc xác định dữ liệu chủ phụ thuộc quan điểm của từng tổ chức và dựa vào các thực thể quan trọng trong các miền dừ liệu của tổ chức đó. 3. Quản lý dữ liệu chủ Mặc dù được định nghĩa là dữ liệu chủ nhưng dừ liệu này vẫn có thể được lưu trữ phân tán ở các hệ thống ứng dụng khác nhau và do đó có thể dẫn đến các silo thông tin (các thông tin biệt lập). Điều này phản ánh một thực trạng tại nhiều doanh nghiệp là dữ liệu về một thực thể hay dữ liệu chủ của một miền dữ liệu được lưu trữ ở nhiều cơ sở dừ liệu khác nhau trong các hệ thống Số 229- Tháng 6. 2021- Tạp chí Khoa học Đào tạo Ngân hàng 75 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp khác nhau, nhưng thông tin phản ánh về chúng lại không đồng nhất. Việc lưu trừ dừ liệu chủ ở các hệ thống khác nhau gây khó khăn trong việc tổng hợp, phân tích và xử lý thông tin. Ví dụ được mô tả ở Hình 1, rõ ràng với dữ liệu chủ miên khách hàng được lưu trữ ở hệ thống “Kinh doanh” và hệ thống “Kế toán” là khác nhau. Thực tế là cùng một thực thể khách hàng Lê Văn An nhưng thông tin về khách hàng này được biểu diễn khác nhau ở 2 hệ thống: hệ thống “Kinh doanh” khách hàng An Van Le với mã khách hàng là KH002, có số điện thoại 0902345678, địa chỉ 25 Lý Thái Tổ, Hà Nội khác với khách hàng An Le (mã ID0070) trong hệ thống “Kế toán” với địa chỉ tại 12 Chùa Bộc, Hà Nội, có số điện thoại 0909789456. Mặc dù đây là một khách hàng duy nhất Lê Văn An, nhưng khi bộ phận quản lý muốn đưa ra các quyết định liên quan đến kế hoạch chăm sóc khách hàng và giới thiệu sản phẩm thì họ không biết được số điện thoại nào khách hàng hay sử dụng cũng như địa chỉ mà khách hàng thường xuyên có mặt ở đâu để có thể thực hiện các chiến dịch quảng cáo, marketing sản phẩm,... Vậy thông tin nào chính xác nhất khi mô tả về dữ liệu chủ miền khách hàng là vấn đề mà doanh nghiệp cần quan tâm, cũng như có một cái nhìn thống nhất về dữ liệu chủ khách hàng tại một nơi duy nhất, thay vì thông tin nằm rải rác ở nhiều hệ thống. Nhìn rộng hơn, với doanh nghiệp sản xuất và kinh doanh sản phẩm có nhiều bộ phận phòng ban thì dữ liệu chủ xuất hiện và được lưu giữ ở các hệ thống tách biệt nhau như ở Hình 3 (Keith Gordon, 2013). Như mô tả ở Hình 3, dữ liệu chủ các miền dữ liệu: khách hàng, sản phâm, phòng ban, nhà cung cẩp xuất hiện ở các quy trình trong các bộ phận, phòng ban khác nhau (Bảng 3). Dữ liệu chủ các miền dữ liệu được lưu trữ một cách rời rạc ở các hệ thống thông tin được cung cấp bởi các hãng khác nhau như mô tả ở hai ví dụ trên (Hình 1, Hình 3) sẽ dần đến tình trạng: dữ liệu của cùng một thực thể trong một miền dữ liệu sẽ rất khác biệt và khi đó chất lượng dữ liệu không được đảm bảo ảnh hưởng đến việc 76 Tạp chí Khoa học Đào tạo Ngân hàng- Số 229- Tháng 6. 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC Bảng 3. Dữ liệu chủ xuất hiện ờ các hệ thống khác nhau Dữ liệu chủ Được lưu trữ ở các hệ thống trong các phòng ban Sản phẩm 8 hệ thống Khách hàng 7 hệ thống Phòng ban 3 hệ thống Nhà cung cấp 3 hệ thống Nguồn: Keith Gordon (2013) ra quyết định của tổ chức, cùng nhiều vấn đề khác nữa liên quan đến điều hành, quản lý khi chất lượng dữ liệu kém... Chính vì vậy, cần phải Quản lý dữ liệu chủ (Master Data Management- MDM) để đảm bảo chất lượng thông tin chính xác nhất cho các thực thể quan trọng trong tổ chức. Định nghĩa về quản lý dữ liệu chủ của David Loshin (2009) cho biết: Quản lý dữ liệu chủ là tập hợp các hoạt động quản lý “dữ liệu tốt nhất”, mà có thể điều phối các bên liên quan chính, những người tham gia và khách hàng doanh nghiệp trong việc kết hợp với các ứng dụng kinh doanh, các phương pháp quản lý thông tin và công cụ quản lý dữ liệu để thực thi các chính sách, thủ tục, dịch vụ và cơ sở hạ tầng hồ trợ cho việc nắm bắt, tích hợp và sau đó chia sẻ việc sử dụng dữ liệu chủ, đảm bảo dữ liệu này là chính xác, kịp thời, nhất quán. Một định nghĩa nữa về quản lý dừ liệu chủ “đó là khuôn khổ của các quy trình và công nghệ nhằm tạo ra và duy trì một môi trường có thẩm quyền, đáng tin cậy, bền vững, chính xác và an toàn mà có thể mô tả một phiên bản duy nhất và toàn diện, chính xác của dữ liệu chủ và các mối quan hệ của nó. Định nghĩa được đưa ra bởi Gartner (2013): quản lý dữ liệu chủ là tập các quy tắc dựa trên công nghệ cho phép các bộ phận nghiệp vụ và công nghệ thông tin làm việc cùng nhau để giúp tổ chức có được một phiên bản duy nhất và chính xác nhất về dừ liệu chủ (Keith Gordon, 2013). Các định nghĩa này nêu rõ hai thành phần chính của việc quản lý dừ liệu chủ được mô tả ở Hình 4. Hai thành phần của MDM: Thành phần Chính sách (Policies) bao gồm các chính sách đại diện cho quản trị dữ liệu của MDM, thành phần Công nghệ (Technologies) bao gồm các công nghệ hồ trợ MDM. Chính sách xác định các vai trò và trách nhiệm trong quy trình MDM. Ví dụ: nếu một công ty giới thiệu một sản phẩm mới, các chính sách xác định ai chịu trách nhiệm tạo mục nhập mới trong sổ đăng ký sản phẩm chính, các tiêu chuẩn cho tạo định danh sản phẩm, những người hoặc bộ phận nào cần được thông báo và những hệ thống dữ liệu khác cần được cập nhật. Tuân thủ quy định cùng với sự riêng tư và bảo mật thông tin cũng là những vấn đề quan trọng (John R. Talburt Yinle Zhou, 2015). Thành phần công nghệ của MDM cần xác định hai việc chính, đó là: Quy trình xác định thực thể (Entity Resolution Process) và Quản lý thông tin xác thực thực thể (Entity Identity Information Management- EIIM). - Quy trình xác định thực thể (ER) sẽ xác định các thực thể quan trọng trong tổ chức, quy trình này diễn ra khi hai hệ thống thông tin đang cùng tham chiếu đến một hoặc nhiều thực thể trong thế giới thực. Quy trình Hình 4. Các thành phần của MDM Nguồn: John R. Taỉburt Yinle Zhou (2015) SÔ'''' 229- Tháng 6. 2021- Tạp chí Khoa học Đào tạo Ngân hàng 77 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp Customer Master Data Bảng 4. Dữ liệu chủ miền khách hàng sau khi được quăn lý bôi MDM ID First Middle Last TelNum Address City Zip ID0010 An Van Le 0902345678 12 Chua Boo Ha Noi 100000 Nguồn: David Loshin (2009) này sẽ “sắp xếp” chọn lọc thông tin về các thực thể, xảy ra khi có nhiều nguồn thông tin cùng tham chiếu đến tập các thực thể, sẽ chọn ra thông tin có độ ưu tiên, chính xác cao. Ví dụ, một bệnh nhân được đưa vào bệnh viện ở các thời điểm khác nhau, mỗi lần ở các khoa khác nhau là khoa nội trú và ngoại trú. ER sẽ so sánh thông tin nhập viện ở mồi thời điểm và đưa ra quyết định hồ sơ nhập viện nào cho cùng một bệnh nhân và hồ sơ nào dành cho bệnh nhân khác. - Quân lý thông tin nhận dạng thực thể (EIIM) là bộ sưu tập và quản lý thông tin nhận dạng với mục tiêu duy trì tính toàn vẹn danh tính chủ thể theo thời gian (Zhou Talburt, 201 la). Tính toàn vẹn danh tính thực thể yêu cầu mồi thực thể phải được mô tả trong một hệ thống là duy nhất. Các thực thể riêng biệt phải được ...
Quản trị dữ liệu chủ da miền: nâng cao quản trị dữ liệu cho các tô chức doanh nghiệp Ngô Thùy Linh - Phan Thanh Đức Khoa Hệ thống thông tin quàn lý, Học viện Ngân hàng Ngày nhận: 17/05/2021 Ngày nhận bàn sửa: 26/05/2021 Ngày duyệt đăng: 25/06/2021 Tóm tắt: Dữ liệu ngày nay đã trở thành một trong những tài sản quan trọng của các tổ chức, doanh nghiệp Tuy nhiên, thách thức đặt ra với các nhà quản lý là làm thế nào để có thể khai thác, sử dụng và quản lý dữ liệu một cách hiệu quả và thông minh khỉ có quả nhiều nguồn dữ liệu bên trong và bên ngoài tố chức Giải pháp quản lý dữ liệu chủ đa miền dựa vào việc quản lý tống thê dữ liệu trên đa miền sẽ giúp các tổ chức có cái nhìn thong nhất và chỉnh xác về các thực thê quan trọng, từ đó cung cấp các thông tin tài chính phù hợp, đáng tin cậy Bài báo này tập trung làm rõ các khải niệm, tầm quan trọng cùa việc quản lý dữ liệu chủ đa miền và một số cách tiếp cận khỉ xây dựng quản lý dữ liệu chủ da miên Từ khóa: Dữ liệu chủ, Quản trị dữ liệu chủ, Quản lý dữ liệu chủ đa miền Multi-domain master data management: improving data governance for enterprises Abstract: Today data has become one of the important assets of organizations and businesses However, one challenge faced by managers is how to effectively and intelligently exploit, use and manage data when the organization is exposed to a large number of both internal and external data sources A multi-domain master data management solution based on the overall management of data across multiple domains will help organizations develop a unified and accurate view of important entities, thereby providing suitable and reliable financial information This article attempts to clarify the concepts and the importance of multi-domain master data management, and propose feasible approaches when building multi-domain master data management Keywords: Master Data, Master Data Management, Multi-Domain Master Data Management Ngo, Thuy Linh Email: linhnt@hvnh.edu.vn Phan, Thanh Duc Email: ducpt@hvnh.edu.vn Organization of all: Faculty of Management Information System, Banking Academy of Vietnam Tạp chí Khoa học & Đào tạo Ngân hàng © Học viện Ngân hàng ISSN 1859 - 011X số 229-Tháng 6 2021 72 NGÔ THÙY LINH - PHAN THANH ĐỨC 1 Đặt vấn đề 2 Dữ liệu chủ và miền dữ liệu Một khảo sát của Gartner (2019) cho thấy Mồi một miền dữ liệu phản ánh đến một răng chât lượng dữ liệu kém đã dần đèn chi tập các thực thể quan trọng mà các tổ chức, phí của các tổ chức tăng lên tới 11,8 triệu doanh nghiệp thường quan tâm như: tập các USD Một trong những nguyên nhân dẫn khách hàng, các sản phẩm, các nhà cung đến chất lượng dừ liệu kém là chưa tích hợp được thông tin từ các nguồn dữ liệu khác câp, các nhân viên, tài chính, chính sách nhau trong tổ chức Nhiều tổ chức hiện (Mark Allen & Dalton Cervo, 2015) Trong nay đã nhận ra giá trị và tầm quan trọng mồi miền dữ liệu có thể có một hoặc nhiều của việc quản lý dữ liệu chủ (Master Data thực thể, thực thể có thể là một đối tượng, Management- MDM) và coi MDM là một cá nhân, đơn vị, địa điểm phải là duy nhất giải pháp cho thách thức này Các tổ chức trong một miền nhất định và thường có thường bắt đầu triển khai MDM và dừng các thuộc tính kèm theo Ví dụ, trong miền ở việc tập trung vào một miền dữ liệu (a Khách hàng, một doanh nghiệp đối tác data domain), sau đó mới mở rộng đến các hoặc một cá nhân có hợp đồng với doanh miền khác trong mô hình quản lý dừ liệu đa nghiệp có thể được coi là một thực thể, mồi thực thể khách hàng có một số thuộc mien (a multi- domain model) Trong quá tính như: họ tên, số điện thoại, e-mail, giới trình thực hiện, hầu hết các tổ chức gặp một tính Tùy vào từng loại hình, lĩnh vực kinh số khó khăn trong việc thực hiện đầy đủ doanh của từng tổ chức mà có các miền dữ và nhất quán các mục tiêu quản trị dữ liệu liệu với các thực thể khác nhau Chẳng hạn chủ trên nhiều miền (Mark Allen & Dalton có một số miền dữ liệu tương ứng với từng Cervo, 2015) Sự khó khăn này bắt nguồn lĩnh vực như sau: từ việc không có cái nhìn tổng thể về các - Lĩnh vực sản xuất: Khách hàng, Sản phẩm, thành phần, chức năng và cả các dịch vụ để Nhà cung cấp, Nguyên vật liệu, Địa điểm có thể quản trị dữ liệu chủ một cách chính xác và hiệu quả Một số tổ chức nhìn nhận - Lĩnh vực chăm sóc sức khỏe: Bệnh nhân, việc quản trị này về bản chất chỉ là việc tích Nhà cung cấp, Sản phẩm, Khiếu nại, Triệu hợp dừ liệu đơn thuần Đây sẽ trở thành chứng lâm sàng, Bảo hiểm một sai lầm khi các dữ liệu theo thời gian - Lĩnh vực tài chính: Khách hàng, Tài khoản, Sản phẩm, Địa điểm, Bảo hiểm ngày càng trở nên đa dạng và phức tạp, bởi vì ngoài việc tích họp dữ liệu thì tổ chức - Lĩnh vực giáo dục: Sinh viên, Khoa bộ còn cần phải đưa ra các trách nhiệm của môn, Địa điểm, Tài liệu, Khóa học bộ phận, phòng ban đối với dữ liệu và cần Trên thực tế, mức độ ưu tiên về dữ liệu của phải quan tâm đến việc quản lý chất lượng các thực thể là khác nhau, dữ liệu nào có dữ liệu để có thể tiếp cận thành công quản trị dữ liệu trên nhiều miền Phần tiếp theo mức độ ưu tiên cao sẽ được lưu trữ trong của bài báo sẽ trình bày các vấn đề có liên vùng bộ nhớ được truy cập nhanh hơn, quan đến dữ liệu chủ, miền dữ liệu, quản trong hệ tài nguyên tốt hơn, quan tâm về lý dừ liệu chủ, dừ liệu chủ đa miền và một chất lượng dừ liệu của thực thể đó hơn, có số cách tiếp cận xây dựng quản trị đa miền cơ chế kiểm soát chất lượng dừ liệu tốt hơn nhằm nâng cao việc quản trị dữ liệu cho các tô chức, doanh nghiệp Do đó khái niệm “Dừ liệu chủ” (Master data) đã ra đời để mô tả, phản ánh đến những dữ liệu quan trọng cần được quan tâm nhiều hơn trong tổ chức Theo John R Talburt & Yinle Zhou (2015), dừ liệu chủ Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 73 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp của một tổ chức được định nghĩa là dữ liệu 2015) Hay dữ liệu chủ là dữ liệu mô tả các được lưu giữ bởi tổ chức đó, mô tả các thực thực thể lõi của tổ chức với tập các thuộc thể độc lập và liên quan chính đến các hoạt tính và định danh là nhất quán và chính xác động của tổ chức Một định nghĩa khác về (Keith Gordon, 2013) dữ liệu chủ là dữ liệu mô tả vê các thực thê Ví dụ sau đây sẽ mô tả rõ hơn về dữ liệu chủ, quan trọng đối với các hoạt động và phân dữ liệu về các thực thể khách hàng được lưu tích của tổ chức, cách dừ liệu này tương tác trữ ở các hệ thống Kinh doanh và Ke toán và chia sẻ sẽ cung cấp ngữ cảnh cho dữ liệu của công ty X (David Loshin, 2009) giao dịch (Mark Allen & Dalton Cervo, Các thông tin liên quan đến thực thể khách Hình 1 Dữ liệu về khách hàng được lưu trữ ở 2 hệ thống khác nhau Nguồn: David Loshin (2009) Bảng 1 Dữ liệu chủ miền khách hàng của Hệ thống Kinh doanh Customer Master Data ID Cust FirstName MiddleName LastName TelNum Address City KH002 Ha Noi An Van Le 090234567 25 Ly Thai To Nguồn: David Loshin (2009) Bang 2 Dữ liệu chu miền khách hàng của Hệ thống Kế toán Customer Master Data ID First Last Add City Zip Tel ID0070 0909789456 An Le 12 Chua Boc Ha Noi 100000 Nguồn: David Loshin (2009) 74 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC hàng được lưu trữ ở hai hệ thống này bao - Dữ liệu tham chiếu (Reference Data): Dữ gồm: Hệ thống “Kinh doanh” lưu trừ các thông liệu thường được mô tả bởi các giá trị được tin khách hàng bao gồm: Tên (FirstName), sử dụng để phân biệt các dữ liệu khác nhau, chẳng hạn như phân biệt giữa dừ liệu chủ Tên đệm (MiddleName), Họ (LastName), Số điện thoại (TelNum), Địa chỉ (Address) và dừ liệu giao dịch Dữ liệu chủ miền khách hàng của hệ thống - Dữ liệu cấu trúc giao dịch (Transaction Kinh doanh được biểu diễn như ở Bảng 1 Hệ thống “Kế toán” lưu trừ các thông tin structure data) đại diện cho những người của khách hàng bao gồm: Tên (First), Họ tham gia trực tiếp trong một giao dịch, (Last), Địa chỉ (Add), Thành phố (City), chẳng hạn như nhà cung cấp, khách hàng Mã bưu chính (ZIP), số điện thoại (Tel) và sản phẩm Thông tin về một giao dịch Dữ liệu chủ miền khách hàng của hệ thống không thể được ghi lại trừ khi thông tin chi Kế toán được thể hiện ở Bảng 2 tiết của những người tham gia này đã tồn Các miền dữ liệu cũng như các dữ liệu khác bên trong tổ chức đều có thể chia thành 2 tại trong cơ sở dữ liệu - Dữ liệu cấu trúc doanh nghiệp (Enterprise loại: dữ liệu hoạt động (operational data) structure data) là dữ liệu mô tả cấu trúc của và dữ liệu không hoạt động (nonoperational doanh nghiệp, ví dụ dữ liệu mô tả về cơ cấu data) “Dừ liệu hoạt động” là tập họp dữ tổ chức hoặc cơ cấu tài chính liệu theo thời gian thực để hồ trợ yêu cầu Neu coi dữ liệu chủ được biểu diễn dưới của tổ chức trong các hoạt động hàng ngày dạng các danh từ của dừ liệu và thông tin thì dữ liệu giao dịch là các động từ Chúng của họ “Dữ liệu không hoạt động” thường mô tả các hoạt động diễn ra hàng ngày được thu thập trong kho dữ liệu với tần suất trong tổ chức, doanh nghiệp như việc bán ít hơn và được sử dụng cho hệ thống kinh hàng, doanh số bán hàng, hay các bệnh doanh thông minh (Dalton Cervo & Mark nhân được phép xuất viện hay nhập viên tại Allen, 2011) Dữ liệu chủ về bản chất là các bệnh viện dữ liệu “không hoạt động”, cụ thể hon, cấu Bất kể các miền dữ liệu được xác định như trúc dữ liệu chủ được mô tả ở Hình 2 thế nào, khái niệm dữ liệu chủ cần được Cấu trúc dữ liệu chủ gồm 3 lóp: dữ liệu xác định rõ ràng và phân biệt với các loại tham chiếu, dữ liệu cấu trúc giao dịch, dữ dữ liệu khác Việc xác định dữ liệu chủ phụ liệu cấu trúc doanh nghiệp thuộc quan điểm của từng tổ chức và dựa vào các thực thể quan trọng trong các miền dừ liệu của tổ chức đó 3 Quản lý dữ liệu chủ Hình 2 Cấu trúc 3 lóp dữ liệu chủ Mặc dù được định nghĩa là dữ liệu chủ nhưng dừ liệu này vẫn có thể được lưu trữ Nguồn: Keith Gordon (2013) phân tán ở các hệ thống ứng dụng khác nhau và do đó có thể dẫn đến các silo thông tin (các thông tin biệt lập) Điều này phản ánh một thực trạng tại nhiều doanh nghiệp là dữ liệu về một thực thể hay dữ liệu chủ của một miền dữ liệu được lưu trữ ở nhiều cơ sở dừ liệu khác nhau trong các hệ thống Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 75 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp khác nhau, nhưng thông tin phản ánh về trữ một cách rời rạc ở các hệ thống thông chúng lại không đồng nhất tin được cung cấp bởi các hãng khác nhau Việc lưu trừ dừ liệu chủ ở các hệ thống khác như mô tả ở hai ví dụ trên (Hình 1, Hình nhau gây khó khăn trong việc tổng hợp, 3) sẽ dần đến tình trạng: dữ liệu của cùng một thực thể trong một miền dữ liệu sẽ phân tích và xử lý thông tin Ví dụ được mô rất khác biệt và khi đó chất lượng dữ liệu tả ở Hình 1, rõ ràng với dữ liệu chủ miên không được đảm bảo ảnh hưởng đến việc khách hàng được lưu trữ ở hệ thống “Kinh doanh” và hệ thống “Kế toán” là khác nhau Thực tế là cùng một thực thể khách hàng Lê Văn An nhưng thông tin về khách hàng này được biểu diễn khác nhau ở 2 hệ thống: hệ thống “Kinh doanh” khách hàng An Van Le với mã khách hàng là KH002, có số điện thoại 0902345678, địa chỉ 25 Lý Thái Tổ, Hà Nội khác với khách hàng An Le (mã ID0070) trong hệ thống “Kế toán” với địa chỉ tại 12 Chùa Bộc, Hà Nội, có số điện thoại 0909789456 Mặc dù đây là một khách hàng duy nhất Lê Văn An, nhưng khi bộ phận quản lý muốn đưa ra các quyết định liên quan đến kế hoạch chăm sóc khách hàng và giới thiệu sản phẩm thì họ không biết được số điện thoại nào khách hàng hay sử dụng cũng như địa chỉ mà khách hàng thường xuyên có mặt ở đâu để có thể thực hiện các chiến dịch quảng cáo, marketing sản phẩm, Vậy thông tin nào chính xác nhất khi mô tả về dữ liệu chủ miền khách hàng là vấn đề mà doanh nghiệp cần quan tâm, cũng như có một cái nhìn thống nhất về dữ liệu chủ khách hàng tại một nơi duy nhất, thay vì thông tin nằm rải rác ở nhiều hệ thống Nhìn rộng hơn, với doanh nghiệp sản xuất và kinh doanh sản phẩm có nhiều bộ phận phòng ban thì dữ liệu chủ xuất hiện và được lưu giữ ở các hệ thống tách biệt nhau như ở Hình 3 (Keith Gordon, 2013) Như mô tả ở Hình 3, dữ liệu chủ các miền dữ liệu: khách hàng, sản phâm, phòng ban, nhà cung cẩp xuất hiện ở các quy trình trong các bộ phận, phòng ban khác nhau (Bảng 3) Dữ liệu chủ các miền dữ liệu được lưu 76 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC Bảng 3 Dữ liệu chủ xuất hiện ờ các chủ (Keith Gordon, 2013) hệ thống khác nhau Các định nghĩa này nêu rõ hai thành phần chính của việc quản lý dừ liệu chủ được mô Dữ liệu chủ Được lưu trữ ở các hệ tả ở Hình 4 thống trong các phòng ban Hai thành phần của MDM: Thành phần Chính sách (Policies) bao gồm các chính Sản phẩm 8 hệ thống sách đại diện cho quản trị dữ liệu của MDM, thành phần Công nghệ (Technologies) bao Khách hàng 7 hệ thống gồm các công nghệ hồ trợ MDM Chính sách xác định các vai trò và trách nhiệm Phòng ban 3 hệ thống trong quy trình MDM Ví dụ: nếu một công ty giới thiệu một sản phẩm mới, các chính Nhà cung cấp 3 hệ thống sách xác định ai chịu trách nhiệm tạo mục nhập mới trong sổ đăng ký sản phẩm chính, Nguồn: Keith Gordon (2013) các tiêu chuẩn cho tạo định danh sản phẩm, những người hoặc bộ phận nào cần được ra quyết định của tổ chức, cùng nhiều vấn thông báo và những hệ thống dữ liệu khác đề khác nữa liên quan đến điều hành, quản cần được cập nhật Tuân thủ quy định cùng lý khi chất lượng dữ liệu kém Chính vì với sự riêng tư và bảo mật thông tin cũng là vậy, cần phải Quản lý dữ liệu chủ (Master những vấn đề quan trọng (John R Talburt Data Management- MDM) để đảm bảo & Yinle Zhou, 2015) chất lượng thông tin chính xác nhất cho các Thành phần công nghệ của MDM cần xác thực thể quan trọng trong tổ chức định hai việc chính, đó là: Quy trình xác Định nghĩa về quản lý dữ liệu chủ của định thực thể (Entity Resolution Process) David Loshin (2009) cho biết: Quản lý dữ và Quản lý thông tin xác thực thực thể liệu chủ là tập hợp các hoạt động quản lý (Entity Identity Information Management- “dữ liệu tốt nhất”, mà có thể điều phối các EIIM) - Quy trình xác định thực thể (ER) sẽ xác bên liên quan chính, những người tham gia định các thực thể quan trọng trong tổ chức, và khách hàng doanh nghiệp trong việc quy trình này diễn ra khi hai hệ thống thông kết hợp với các ứng dụng kinh doanh, các tin đang cùng tham chiếu đến một hoặc nhiều thực thể trong thế giới thực Quy trình phương pháp quản lý thông tin và công cụ quản lý dữ liệu để thực thi các chính sách, Hình 4 Các thành phần của MDM thủ tục, dịch vụ và cơ sở hạ tầng hồ trợ cho việc nắm bắt, tích hợp và sau đó chia sẻ Nguồn: John R Taỉburt & Yinle Zhou (2015) việc sử dụng dữ liệu chủ, đảm bảo dữ liệu này là chính xác, kịp thời, nhất quán Một định nghĩa nữa về quản lý dừ liệu chủ “đó là khuôn khổ của các quy trình và công nghệ nhằm tạo ra và duy trì một môi trường có thẩm quyền, đáng tin cậy, bền vững, chính xác và an toàn mà có thể mô tả một phiên bản duy nhất và toàn diện, chính xác của dữ liệu chủ và các mối quan hệ của nó Định nghĩa được đưa ra bởi Gartner (2013): quản lý dữ liệu chủ là tập các quy tắc dựa trên công nghệ cho phép các bộ phận nghiệp vụ và công nghệ thông tin làm việc cùng nhau để giúp tổ chức có được một phiên bản duy nhất và chính xác nhất về dừ liệu SÔ' 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 77 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp Bảng 4 Dữ liệu chủ miền khách hàng sau khi được quăn lý bôi MDM Customer Master Data ID First Middle Last TelNum Address City Zip ID0010 An Van Le 0902345678 12 Chua Boo Ha Noi 100000 Nguồn: David Loshin (2009) này sẽ “sắp xếp” chọn lọc thông tin về các mảng khách hàng) của doanh nghiệp X thực thể, xảy ra khi có nhiều nguồn thông mong muốn được lấy thông tin về khách tin cùng tham chiếu đến tập các thực thể, sẽ hàng một cách chính xác và đảm bảo nhất chọn ra thông tin có độ ưu tiên, chính xác Dữ liệu chủ về miền khách hàng sau khi cao Ví dụ, một bệnh nhân được đưa vào được quản lý bởi MDM và được biểu diễn bệnh viện ở các thời điểm khác nhau, mỗi lần ở các khoa khác nhau là khoa nội trú và như Bảng 4 ngoại trú ER sẽ so sánh thông tin nhập viện Miền dữ liệu khách hàng có thực thể khách ở mồi thời điểm và đưa ra quyết định hồ sơ hàng Lê Văn An (Bảng 4) sau khi được quản lý bởi MDM có mã định danh ID0010 nhập viện nào cho cùng một bệnh nhân và duy nhất với các thuộc tính: Tên, Đệm, hồ sơ nào dành cho bệnh nhân khác Họ, Số điện thoại, Địa chỉ, Thành phố, Mã - Quân lý thông tin nhận dạng thực thể bưu chính; ngoài thực thể này thì miền dữ liệu khách hàng còn có nhiều khách hàng (EIIM) là bộ sưu tập và quản lý thông tin khác và các đối tác cũng được quản lý nhận dạng với mục tiêu duy trì tính toàn vẹn danh tính chủ thể theo thời gian (Zhou bởi MDM & Talburt, 201 la) Tính toàn vẹn danh tính Như vậy quản lý dừ liệu chủ không chi là thực thể yêu cầu mồi thực thể phải được mô vấn đề về công nghệ, không chỉ là vấn đề tả trong một hệ thống là duy nhất Các thực tích hợp dữ liệu mà còn liên quan đến trách thể riêng biệt phải được mô tả riêng cho trong hệ thống (Maydanchik, 2007) Toàn nhiệm quản lý dữ liệu, trách nhiệm của vẹn danh tính chủ thể là một yêu cầu cơ bản các bộ phận phòng ban liên quan rồi chính cho các hệ thống MDM sách, chiến lược của tổ chức Khi tổ chức, Quay trở lại ví dụ mô tả trên Hình 1, sau doanh nghiệp triển khai MDM, thì các khi xác minh với khách hàng tên Lê Văn An thì bộ phận chăm sóc khách hàng biết bộ phận nghiệp vụ và bộ phận công nghệ được rằng: ông Lê Văn An có địa chỉ 12 thông tin làm việc cùng nhau sẽ đảm bảo Chùa Bộc là địa chỉ tạm trú và địa chỉ ở được tính đồng nhất, độ chính xác, tính bền 25 Lý Thường Kiệt là nơi đăng ký địa chỉ vững của dữ liệu chủ được chia sẻ trong tổ thường trú, số điện thoại 0902345678 là chức đó Do đó tổ chức cũng tránh được số điện thoại khách hàng thường xuyên sử các cuộc tranh luận vô tận, tốn thời gian về dụng Do đó mọi giao dịch sẽ được thực việc trả lời câu hỏi “dữ liệu của hệ thống hiện với ông An ở 12 Chùa Bộc, liên hệ trong phòng ban nào là đúng?”, điều này có qua số điện thoại 0902345678 Một số bộ thể dần đến các quyết định kém hiệu quả phận, phòng ban (phụ trách liên quan đến ảnh hưởng tới chiến lược của tổ chức Dữ liệu chủ đa miền Quản lý dữ liệu chủ sẽ cung cấp công cụ 78 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC Bảng 5 Một số nhân tố xác định các miền cần đến MDM GIÁ TRỊ KINH DOANH Giá trị kinh doanh là một yếu tố quan trọng khi quyết định những miền nào cần phải có MDM Một lý do tại sao hầu hết các công ty bắt đầu với MDM khách hàng là vì không ccó gì nghi ngờ giá trị chính xác về thông tin khách hàng mang lại cho doanh nghiệp Một phiên bản duy nhất và chính xác về khách hàng có thể liên quan trực tiếp đến sự sông còn của một tổ chức Như vậy, mọi miền cần được đánh giá từ quan điểm giá trị kinh daonh để xác định lợi ích của việc áp dụng MDM cho tổ chức đó SỐ LƯỢNG Số lượng liên quan trực tiếp đến việc cần thiết có MDM Nếu một công ty chỉ cộ hai hoặc ba đối tác, thì không có khả năng hưởng lợi từ MDM đến miền đối tác Nhưng với một ví dụ khác, nếu một công ty kinh doạnh với hàng ngàn đại lý, thì việc thực hiện giải pháp MDM cho các miền đối tác rất có ý nghĩa TÍNH THAY ĐỔI Nếu dữ liệu không thay đổi và các tập thuộc tính của dữ liệu liên quan đến các thực thể không biến đổi thì không cần thiết phải cần đến MDM KHẢ NẤNG DỪNG LẠI Càng nhiều miền có trong một tổ chức thì việc sử dụng MDM càng cần thiêt để có sự nhât quán, tin cậy, chính xác của các luồng thông tin trong tổ chức đó ĐỌ PHỨC TẠP Độ phức tạp của các thuộc tính và dữ liệu liên quan đến một miền là cơ sở để thực thi giải pháp MDM Lấy miền sản phẩm làm ví dụ: Các sản phẩm trong một công ty có thể rất phức tạp, với số lượng lớn các thuộc tính liên quan Từ thực tế đó việc triển khai MDM cho miền sản phẩm trong công ty là rất lớn Nguồn:Mark Allen & Dalton Cervo (2015) và quy trình quản lý dữ liệu chủ, đảm bảo tin một cách hiệu quả cũng như tăng cao dữ liệu chủ không chỉ nhất quán mà còn khả năng cạnh tranh cho các tổ chức, doanh chính xác Quản lý dữ liệu chủ theo miền nghiệp thì các giải pháp MDM đa miền cần (Master Data Management domain) phản có sự tham gia và cộng tác hiệu quả của bộ ánh một miền dữ liệu cụ thể mà tại đó việc phận nghiệp vụ chịu trách nhiệm về chất xác định và kiểm soát dữ liệu chủ được lượng dữ liệu và bộ phận công nghệ thông tập trung Trong tổ chức không chỉ có một tin có nhiệm vụ quản trị dữ liệu MDM đa miền dữ liệu mà còn nhiều miền dữ liệu miền cần hoạt động như một cầu nối tạo quan trọng khác nữa, do đó họ không chỉ tập trung quản lý dừ liệu chủ trên một miền động lực cho việc cộng tác cho hai bộ phận mà còn hướng tới quản lý trên nhiều miền đó trong tổ chức Điều này dễ hiểu đối với Quản lý dữ liệu chủ đa miền có liên quan tình huống tổ chức doanh nghiệp nào cần đến việc quản lý tổng thể dữ liệu chủ trên chuyển đổi từ cơ sở hạ tầng hệ thống cũ nhiều miền Vậy liệu tất cả các miền có cần sang hệ thống mới đòi hỏi phải có các yêu đến MDM, nhân tố nào ảnh hưởng đến việc cầu liên quan đến bảo mật, quyền riêng tư, xác định miền dữ liệu cần MDM tập trung các quy định, chính sách Để đối mặt và quan tâm đến? Bảng 5 mô tả một số nhân tố giải quyết được các thách thức này cần có chính trong việc định hướng miền dữ liệu sự kết hợp chặt chẽ giữa các phòng ban cho MDM trong mô hình đa miền nghiệp vụ và phòng ban công nghệ Một Để việc quản lý dừ liệu và cung cấp thông minh họa về giải pháp MDM đa miền được mô tả ở Hình 5 Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 79 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp Nguồn:Mark Allen & Dalton Cervo (2015) Với giải pháp MDM đa miền được mô tả ở liệu chủ Vì MDM được áp dụng trên nhiều Hình 5, cần đến 4 bộ phận hồ trợ cho việc triển khai MDM thành công, đó là: sự hồ miền, nên các chức năng, các công cụ và trợ từ cấp điều hành, từ ban chỉ đạo, bộ quy trình liên quan tới các miền trở nên dề phận quản lý chưcmg trình, bộ phận quản lý sử dụng hơn Một số chức năng, chang hạn các thay đổi và rủi ro Với mỗi miền dữ liệu như quản lý chất lượng dữ liệu là vô cùng 1, 2, , n cần phải bảo đảm chất lượng dữ rộng Bởi vì nếu chất lượng dữ liệu của một liệu, đồng bộ hóa dữ liệu, chính sách quản miền tốt thực sự thì có thể tái sử dụng dữ lý dữ liệu, quản lý dữ liệu tham chiếu, xác liệu này trên nhiều miền, nhưng chúng vần định thực thể, quản lý Đọc- Ghi- Cập nhật- có các yêu cầu cụ thể theo miền cho các Xóa dữ liệu (CRƯD) Giải pháp MDM thể hiện trên Hình 5 cho thấy một số chức năng hoạt động như mô tả dữ liệu, làm sạch dữ được dùng chung và có thể được sử dụng liệu, chuẩn hóa dữ liệu bởi nhiều miền dữ liệu Ví dụ, chương trình Như vậy giải pháp MDM được thiết lập quản trị dữ liệu có phạm vi và quyền hạn để giải quyết các vấn đề: dừ liệu trùng lặp, rộng hơn, không chỉ tập trung vào dữ liệu phân mảnh, không nhất quán trên nhiều chủ Tương tự, việc bảo mật dừ liệu có thê nguồn Các hệ thống thông tin thường sẽ sẽ tập trung vào các chính sách và quản lý hồ trợ một nghiệp vụ cụ thể và khi đó dữ liên quan đến truy cập dữ liệu và bảo vệ dữ liệu chủ yếu duy trì cho nghiệp vụ này Có rất ít sự kết nối dữ liệu giữa các hệ thống với nhau vì thiếu quy trình tổng thể trong 80 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC Hình 6 Các chức năng của MDM đa miền Nguồn:Mark Allen & Dalton Cervo (2015) tổ chức Và hệ quả là dữ liệu có chất lượng tố ảnh hưởng đến việc xác định miền dữ kém, không chính xác bởi vì có nhiều nguồn liệu của một tổ chức có cần đến MDM hay thông tin cùng mô tả, đại diện cho một thực không, riêng một miền dữ liệu cũng đã đòi thể MDM sẽ đóng vai trò hỗ trợ thiết lập hỏi nhiều công nghệ để vận hành Hơn nữa và quản lý các luật để xác định các thành việc triển khai MDM không chỉ đơn thuần phần dữ liệu chung, được sử dụng để khớp chỉ là thêm một ứng dụng mới mà có thể sẽ các thực thể từ nhiều nguồn, cũng như đưa ảnh hưởng đến các dữ liệu quan trọng đang các kỳ thuật để làm sạch và củng cố thông được lưu trữ trong các hệ thống hiện có Từ tin từ các nguồn đó Từ đó tạo ra một phiên góc độ công nghệ, hiện nay không có giải bản duy nhất và chính xác nhất về thực thể pháp duy nhất nào có thể đồng thời thỏa Hình 6 biếu diễn các chức năng của MDM mãn các yêu cầu của các tổ chức, doanh đa miền như: quản trị dữ liệu, quản trị chất nghiệp Do đó, khi đánh giá các sản phẩm lượng dữ liệu, đồng bộ và tích hợp dữ liệu, MDM đa miền, cần phải hiểu những gì nhà quản lý dữ liệu tham chiếu, bảo mật dữ cung cấp mang lại cho doanh nghiệp liệu, kiến trúc dữ liệu MDM đa miền có thể phát triển từ nhiều tình huống khác nhau có thể xảy ra trong 4 Một số cách tiếp cận xây dựng dữ liệu doanh nghiệp, vì vậy khó có một chiến chủ đa miền lược hoặc kế hoạch toàn diện nào cho các tổ chức, doanh nghiệp Chẳng hạn trong Không có một cách tiếp cận duy nhất nào có thể phù hợp cho tất cả các yêu cầu của Ngân hàng X bộ phận Telesales sau khi gọi MDM đa miền ở mọi tổ chức, doanh nghiệp điện cho khách hàng A tư vấn về sản phẩm Như đã trình bày ở Bảng 5, có nhiều yếu bảo hiểm thì họ được khách hàng này phản hồi là đã từng đến giao dịch tại chi nhánh Sô' 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 81 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp Data Governance and Producers and Consumers of Master Data Quality Stewardship of System n Daỉhboards Master Data j? Batch-mode Master Data Synchronization Multi-domain MDM hub Real-time Real-time Master Data Master Data Synchronization Synchronization Enterprise Service Bus (ESB) Hình 10 MDM đa miền kiểu kết hợp Nguồn:Mark Allen & Dalton Cervo (2015) dừ liệu từ trung tâm MDM thay vì dừ liệu ở các phòng ban, và xác định chương trình được duy trì cục bộ Hình 9 mô tả một kiến quản lý nào đang được thực hiện Không trúc kiểu bền vững xem xét đầy đủ các yêu cầu này sẽ dần Kiểu 3: MDM kiểu kết hợp đến tình trạng: các chương trình hiện có Cách tiếp cận này kết hợp giữa MDM kiểu ảnh hưởng, tác động qua lại lần nhau và tích hợp và kiểu bền vững để khắc phục liên quan đến các điều chỉnh ưu tiên Các những hạn chế của hai mô hình đó Trong phòng ban nghiệp vụ và bộ phận giao dịch kiểu kết họp, không chỉ các trường thuộc là những nơi tạo lập và sử dụng thường tính định danh được lưu trữ trong trung tâm xuyên dừ liệu chủ Khi đó có thể các giao MDM, mà một bản sao của nhiều thuộc dịch sẽ cần đến dữ liệu chủ từ nhiều miền, tính liên quan đến một thực thể cũng được chẳng hạn miền kế hoạch thực hiện và đơn duy trì tại đó sẽ tăng tốc truy vấn đến trung đặt hàng có thể có tác động đáng kê đến các tâm MDM Ngoài ra, vì thông tin là bản sao hoạt động kinh doanh ở bộ phận bán hàng nên các hệ thống hiện tại có thể tiếp tục sử và marketing Có thể bước đầu MDM được dụng phiên bản dừ liệu của riêng mình Do thực hiện thành công sẽ mang lại nhiều đó với cách tiếp cận này, trung tâm MDM là một hệ thống tham chiếu, tích họp từ lợi ích cho hoạt động doanh nghiệp và nhiều nguồn, và áp dụng quy trình xác định các hoạt động phân tích, nhưng cũng kéo các thực thể và các chức năng đảm bảo chất theo các thay đổi về dữ liệu và quy trình lượng dữ liệu và cung cấp một phiên bản có thể bị gián đoạn nếu như chúng không chính xác duy nhất về dừ liệu chủ Hình 10 được quản lý tốt Báo giá, đơn đặt hàng, trình bày mô hình MDM đa miền kết họp yêu cầu, thanh toán, và cung cấp dịch vụ Khi tổ chức lên kế hoạch thực hiện giải liên quan đến các quy trình chính có thê dề pháp MDM đa miền, cần phải có đủ thời bị gián đoạn khi dữ liệu chủ thay đối phụ gian để tìm hiểu các cách tiếp cận triển khai thuộc vào MDM Và tất nhiên, nếu không MDM, cũng như kiểm tra sự ảnh hưởng, tác được xử lý tốt, những thay đổi đó có thể động qua lại của các nghiệp vụ kinh doanh ảnh hưởng tiêu cực đến sự hài lòng và lòng trung thành của khách hàng, do đó có thể 84 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC ảnh hưởng đến lợi nhuận của công ty và trở phận công nghệ thông tin sẽ thúc đẩy các tổ thành một vấn đề không mong muốn Như chức, doanh nghiệp đạt được mục tiêu cũng vậy, khi tiến hành quản lý tất cả các miền như lợi thế cạnh tranh trên thị trường dữ liệu với giải pháp MDM đa miền, điều Đối với các doanh nghiệp quy mô lớn, quan trọng là phải kiểm kê, đánh giá các quy trình nghiệp vụ, khu vực tiêu dùng và chăng hạn các ngân hàng thương mại thì vòng đời của dừ liệu chủ Giải pháp MDM MDM là một giải pháp không thể thiếu nếu đa miền cần phải là cầu nối tạo ra sự cộng muốn quản lý được các nguồn dữ liệu lớn, tác giữa các bộ phận có trách nhiệm liên quan và các bộ phận đóng vai trò trực tiếp đa dạng và thường xuyên biến động Các trong quản lý dữ liệu thông qua các phòng ngân hàng đã có đến hàng triệu khách hàng ban nghiệp vụ cũng như phòng ban công tiềm năng và có số vốn tài chính lớn Hoạt nghệ thông tin động tại các ngân hàng có liên quan đến nhiều doanh nghiệp, quản lý hàng triệu tài 5 Kết luận khoản và vô số sản phẩm tài chính, xử lý Dừ liệu là một tài sản của tổ chức, dữ liệu giao dịch với hàng ngàn đại lý và duy trì chủ là chìa khóa cho hoạt động kinh doanh, mối quan hệ với hàng ngàn nhà cung cấp và đòi hỏi cần phải có sự quản lý thích đáng các công ty khác (ví dụ: nhà đấu giá, công MDM là giải pháp cho việc quản lý dữ ty thẩm định, phá sản, tòa án và ủy thác, và liệu, tuy nhiên MDM không chỉ là vấn đề công nghệ, mà còn liên quan đến khả năng các cơ quan thu nợ) Các ngân hàng cũng quản trị và ảnh hưởng đến các quy trình sở hữu hoặc sử dụng dịch vụ của các công kinh doanh của doanh nghiệp Phạm vi ty bảo hiểm, giao dịch với hàng ngàn luật của MDM khá lớn do nó là sự tích hợp của sư đại diện cho họ hoặc khách hàng khi xảy các thành phần, các chức năng và dịch vụ ra tranh chấp, và thuê hàng ngàn nhân viên cần thiết đê tạo, duy trì và quản lý, chia sẻ Với những mô tả đó thì có thể xác định vô các dừ liệu quan trọng Bên cạnh đó, việc số các miền dữ liệu mà một ngân hàng cần lập kế hoạch cho một chương trình MDM phải có: triển vọng, khách hàng, phương đa miền cho tổ chức, doanh nghiệp trên tiện, nhà sản xuất, tài khoản tài chính, sản thực tế gặp nhiều thách thức Chiến lược phẩm tài chính, đại lý, liên hệ, nhà cung và cách tiếp cận phù hợp chỉ ra rằng đó là cấp, luật sư và nhân viên Rõ ràng là khối cơ sở thích họp để hoàn thiện đầy đủ, thực lượng thông tin lớn thì số lượng thuộc tính hiện thành công các chiến lược và mục tiêu và các hệ thống dữ liệu duy trì tất cả thông MDM trên toàn doanh nghiệp Đây là chìa tin sẽ lớn và phức tạp Các ngân hàng sẽ khóa để cung cấp dữ liệu đáng tin cậy kịp hưởng lợi ích từ giải pháp MDM đa miền thời để giúp doanh nghiệp đạt được lợi thế khi loại trừ được các vấn đề về dư thừa cạnh tranh dữ liệu và sự không nhất quán trên nhiều Trong MDM đa miền, điều quan trọng là nguồn dừ liệu Vì vậy với tổ chức doanh phải xác định: nên sử dụng cách tiếp cận MDM nào phù hợp với các thành phần, nghiệp có quy mô lớn như các ngân hàng chức năng và dịch vụ trên các miền dữ liệu rất thích hợp để triển khai MDM Hơn thế nữa, sự cộng tác chặt chẽ giữa các bộ phận kinh doanh, nghiệp vụ và bộ Bài báo đã trình bày khái niệm cơ bản của dữ liệu chủ, quản lý dừ liệu chủ, dừ liệu chủ đa miền, và các cách tiếp cận để xây dựng quản trị dừ liệu chủ đa miền Từ đó, chỉ ra vai trò và tầm quan trọng của việc quản trị dữ liệu chủ đa miền trong các tổ chức, doanh nghiệp hiện nay Việc xây dựng và Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 85 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp quản trị dữ liệu chủ đa miền đã góp phần động kinh doanh để kịp thời đưa ra các quyết định mang tính chiến lược trong bối nâng cao quản trị rủi ro cho doanh nghiệp, giúp doanh nghiệp có cái nhìn chính xác cảnh của cách mạng công nghiệp 4.0 đang nhất về các thực thể quan trọng trong hoạt diễn ra mạnh mẽ như hiện nay ■ Tài liệu tham khảo David Loshin, 2009, “Master Data Management", Elsevier Inc Dalton Cervo & Mark Allen, “Master data management in practice”, 2011, John Wiley & Sons, Inc Gartner, 2019, “How to Get Started With Master Data Management John R Talburt, Yinle Zhou, 2015, “Master Data Management and Information Integration", Elsevier Inc Keith Gordon, 2013, “Principles ofdata management”, BCS Learning and Development Ltd Mark Allen & Dalton Cervo, 2015, “Multi - Domain Master Data Management”, Elsevier Inc Maydanchik, A., 2007 “Data Quality Assessment” Technics Publications Zhou, Y„ Talburt, J.R., 2011a “Entity identity information management” International Conference on Information Quality 2011 86 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6 2021