1. Trang chủ
  2. » Mẫu Slide

QUẢN TRỊ DỮ LIỆU CHỦ ĐA MIỀN: NÂNG CAO QUẢN TRỊ DỮ LIỆU CHO CÁC TỔ CHỨC DOANH NGHIỆP

13 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Quản Trị Dữ Liệu Chủ Đa Miền: Nâng Cao Quản Trị Dữ Liệu Cho Các Tổ Chức Doanh Nghiệp
Tác giả Ngô Thùy Linh, Phan Thanh Đức
Trường học Học viện Ngân hàng
Chuyên ngành Quản trị dữ liệu
Thể loại tạp chí
Năm xuất bản 2021
Thành phố Hà Nội
Định dạng
Số trang 13
Dung lượng 1,69 MB

Nội dung

Kinh Tế - Quản Lý - Báo cáo khoa học, luận văn tiến sĩ, luận văn thạc sĩ, nghiên cứu - Kinh Tế - Economic Quản trị dữ liệu chủ da miền: nâng cao quản trị dữ liệu cho các tô chức doanh nghiệp Ngô Thùy Linh - Phan Thanh Đức Khoa Hệ thống thông tin quàn lý, Học viện Ngân hàng Ngày nhận: 17052021 Ngày nhận bàn sửa: 26052021 Ngày duyệt đăng: 25062021 Tóm tắt: Dữ liệu ngày nay đã trở thành một trong những tài sản quan trọng của các tổ chức, doanh nghiệp. Tuy nhiên, thách thức đặt ra với các nhà quản lý là làm thế nào để có thể khai thác, sử dụng và quản lý dữ liệu một cách hiệu quả và thông minh khỉ có quả nhiều nguồn dữ liệu bên trong và bên ngoài tố chức. Giải pháp quản lý dữ liệu chủ đa miền dựa vào việc quản lý tống thê dữ liệu trên đa miền sẽ giúp các tổ chức có cái nhìn thong nhất và chỉnh xác về các thực thê quan trọng, từ đó cung cấp các thông tin tài chính phù hợp, đáng tin cậy. Bài báo này tập trung làm rõ các khải niệm, tầm quan trọng cùa việc quản lý dữ liệu chủ đa miền và một số cách tiếp cận khỉ xây dựng quản lý dữ liệu chủ da miên. Từ khóa: Dữ liệu chủ, Quản trị dữ liệu chủ, Quản lý dữ liệu chủ đa miền Multi-domain master data management: improving data governance for enterprises Abstract: Today data has become one of the important assets of organizations and businesses. However, one challenge faced by managers is how to effectively and intelligently exploit, use and manage data when the organization is exposed to a large number of both internal and external data sources. A multi-domain master data management solution based on the overall management of data across multiple domains will help organizations develop a unified and accurate view of important entities, thereby providing suitable and reliable financial information. This article attempts to clarify the concepts and the importance of multi-domain master data management, and propose feasible approaches when building multi-domain master data management. Keywords: Master Data, Master Data Management, Multi-Domain Master Data Management Ngo, Thuy Linh Email: linhnthvnh.edu.vn Phan, Thanh Duc Email: ducpthvnh.edu.vn Organization of all: Faculty of Management Information System, Banking Academy of Vietnam Tạp chí Khoa học Đào tạo Ngân hàng Học viện Ngân hàng số 229-Tháng 6. 2021 72 ISSN 1859 - 011X NGÔ THÙY LINH - PHAN THANH ĐỨC 1. Đặt vấn đề Một khảo sát của Gartner (2019) cho thấy răng chât lượng dữ liệu kém đã dần đèn chi phí của các tổ chức tăng lên tới 11,8 triệu USD. Một trong những nguyên nhân dẫn đến chất lượng dừ liệu kém là chưa tích hợp được thông tin từ các nguồn dữ liệu khác nhau trong tổ chức. Nhiều tổ chức hiện nay đã nhận ra giá trị và tầm quan trọng của việc quản lý dữ liệu chủ (Master Data Management- MDM) và coi MDM là một giải pháp cho thách thức này. Các tổ chức thường bắt đầu triển khai MDM và dừng ở việc tập trung vào một miền dữ liệu (a data domain), sau đó mới mở rộng đến các miền khác trong mô hình quản lý dừ liệu đa mien (a multi- domain model). Trong quá trình thực hiện, hầu hết các tổ chức gặp một số khó khăn trong việc thực hiện đầy đủ và nhất quán các mục tiêu quản trị dữ liệu chủ trên nhiều miền (Mark Allen Dalton Cervo, 2015). Sự khó khăn này bắt nguồn từ việc không có cái nhìn tổng thể về các thành phần, chức năng và cả các dịch vụ để có thể quản trị dữ liệu chủ một cách chính xác và hiệu quả. Một số tổ chức nhìn nhận việc quản trị này về bản chất chỉ là việc tích hợp dừ liệu đơn thuần. Đây sẽ trở thành một sai lầm khi các dữ liệu theo thời gian ngày càng trở nên đa dạng và phức tạp, bởi vì ngoài việc tích họp dữ liệu thì tổ chức còn cần phải đưa ra các trách nhiệm của bộ phận, phòng ban đối với dữ liệu và cần phải quan tâm đến việc quản lý chất lượng dữ liệu để có thể tiếp cận thành công quản trị dữ liệu trên nhiều miền. Phần tiếp theo của bài báo sẽ trình bày các vấn đề có liên quan đến dữ liệu chủ, miền dữ liệu, quản lý dừ liệu chủ, dừ liệu chủ đa miền và một số cách tiếp cận xây dựng quản trị đa miền nhằm nâng cao việc quản trị dữ liệu cho các tô chức, doanh nghiệp. 2. Dữ liệu chủ và miền dữ liệu Mồi một miền dữ liệu phản ánh đến một tập các thực thể quan trọng mà các tổ chức, doanh nghiệp thường quan tâm như: tập các khách hàng, các sản phẩm, các nhà cung câp, các nhân viên, tài chính, chính sách... (Mark Allen Dalton Cervo, 2015). Trong mồi miền dữ liệu có thể có một hoặc nhiều thực thể, thực thể có thể là một đối tượng, cá nhân, đơn vị, địa điểm... phải là duy nhất trong một miền nhất định và thường có các thuộc tính kèm theo. Ví dụ, trong miền Khách hàng, một doanh nghiệp đối tác hoặc một cá nhân có hợp đồng với doanh nghiệp có thể được coi là một thực thể, mồi thực thể khách hàng có một số thuộc tính như: họ tên, số điện thoại, e-mail, giới tính... Tùy vào từng loại hình, lĩnh vực kinh doanh của từng tổ chức mà có các miền dữ liệu với các thực thể khác nhau. Chẳng hạn có một số miền dữ liệu tương ứng với từng lĩnh vực như sau: - Lĩnh vực sản xuất: Khách hàng, Sản phẩm, Nhà cung cấp, Nguyên vật liệu, Địa điểm... - Lĩnh vực chăm sóc sức khỏe: Bệnh nhân, Nhà cung cấp, Sản phẩm, Khiếu nại, Triệu chứng lâm sàng, Bảo hiểm... - Lĩnh vực tài chính: Khách hàng, Tài khoản, Sản phẩm, Địa điểm, Bảo hiểm... - Lĩnh vực giáo dục: Sinh viên, Khoa bộ môn, Địa điểm, Tài liệu, Khóa học... Trên thực tế, mức độ ưu tiên về dữ liệu của các thực thể là khác nhau, dữ liệu nào có mức độ ưu tiên cao sẽ được lưu trữ trong vùng bộ nhớ được truy cập nhanh hơn, trong hệ tài nguyên tốt hơn, quan tâm về chất lượng dừ liệu của thực thể đó hơn, có cơ chế kiểm soát chất lượng dừ liệu tốt hơn. Do đó khái niệm “Dừ liệu chủ” (Master data) đã ra đời để mô tả, phản ánh đến những dữ liệu quan trọng cần được quan tâm nhiều hơn trong tổ chức. Theo John R. Talburt Yinle Zhou (2015), dừ liệu chủ Số 229- Tháng 6. 2021- Tạp chí Khoa học Đào tạo Ngân hàng 73 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp của một tổ chức được định nghĩa là dữ liệu được lưu giữ bởi tổ chức đó, mô tả các thực thể độc lập và liên quan chính đến các hoạt động của tổ chức. Một định nghĩa khác về dữ liệu chủ là dữ liệu mô tả vê các thực thê quan trọng đối với các hoạt động và phân tích của tổ chức, cách dừ liệu này tương tác và chia sẻ sẽ cung cấp ngữ cảnh cho dữ liệu giao dịch (Mark Allen Dalton Cervo, 2015). Hay dữ liệu chủ là dữ liệu mô tả các thực thể lõi của tổ chức với tập các thuộc tính và định danh là nhất quán và chính xác (Keith Gordon, 2013). Ví dụ sau đây sẽ mô tả rõ hơn về dữ liệu chủ, dữ liệu về các thực thể khách hàng được lưu trữ ở các hệ thống Kinh doanh và Ke toán của công ty X (David Loshin, 2009) Các thông tin liên quan đến thực thể khách Hình 1. Dữ liệu về khách hàng được lưu trữ ở 2 hệ thống khác nhau Nguồn: David Loshin (2009) Bảng 1. Dữ liệu chủ miền khách hàng của Hệ thống Kinh doanh Customer Master Data ID Cust FirstName MiddleName LastName TelNum Address City KH002 An Van Le 090234567 25 Ly Thai To Ha Noi Nguồn: David Loshin (2009) Nguồn: David Loshin (2009) Bang 2. Dữ liệu chu miền khách hàng của Hệ thống Kế toán Customer Master Data ID First Last Add City Zip Tel ID0070 An Le 12 Chua Boc Ha Noi 100000 0909789456 74 Tạp chí Khoa học Đào tạo Ngân hàng- số 229- Tháng 6. 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC hàng được lưu trữ ở hai hệ thống này bao gồm: Hệ thống “Kinh doanh” lưu trừ các thông tin khách hàng bao gồm: Tên (FirstName), Tên đệm (MiddleName), Họ (LastName), Số điện thoại (TelNum), Địa chỉ (Address). Dữ liệu chủ miền khách hàng của hệ thống Kinh doanh được biểu diễn như ở Bảng 1. Hệ thống “Kế toán” lưu trừ các thông tin của khách hàng bao gồm: Tên (First), Họ (Last), Địa chỉ (Add), Thành phố (City), Mã bưu chính (ZIP), số điện thoại (Tel). Dữ liệu chủ miền khách hàng của hệ thống Kế toán được thể hiện ở Bảng 2. Các miền dữ liệu cũng như các dữ liệu khác bên trong tổ chức đều có thể chia thành 2 loại: dữ liệu hoạt động (operational data) và dữ liệu không hoạt động (nonoperational data). “Dừ liệu hoạt động” là tập họp dữ liệu theo thời gian thực để hồ trợ yêu cầu của tổ chức trong các hoạt động hàng ngày của họ. “Dữ liệu không hoạt động” thường được thu thập trong kho dữ liệu với tần suất ít hơn và được sử dụng cho hệ thống kinh doanh thông minh (Dalton Cervo Mark Allen, 2011). Dữ liệu chủ về bản chất là các dữ liệu “không hoạt động”, cụ thể hon, cấu trúc dữ liệu chủ được mô tả ở Hình 2. Cấu trúc dữ liệu chủ gồm 3 lóp: dữ liệu tham chiếu, dữ liệu cấu trúc giao dịch, dữ liệu cấu trúc doanh nghiệp. Hình 2. Cấu trúc 3 lóp dữ liệu chủ Nguồn: Keith Gordon (2013) - Dữ liệu tham chiếu (Reference Data): Dữ liệu thường được mô tả bởi các giá trị được sử dụng để phân biệt các dữ liệu khác nhau, chẳng hạn như phân biệt giữa dừ liệu chủ và dừ liệu giao dịch. - Dữ liệu cấu trúc giao dịch (Transaction structure data) đại diện cho những người tham gia trực tiếp trong một giao dịch, chẳng hạn như nhà cung cấp, khách hàng và sản phẩm. Thông tin về một giao dịch không thể được ghi lại trừ khi thông tin chi tiết của những người tham gia này đã tồn tại trong cơ sở dữ liệu. - Dữ liệu cấu trúc doanh nghiệp (Enterprise structure data) là dữ liệu mô tả cấu trúc của doanh nghiệp, ví dụ dữ liệu mô tả về cơ cấu tổ chức hoặc cơ cấu tài chính. Neu coi dữ liệu chủ được biểu diễn dưới dạng các danh từ của dừ liệu và thông tin thì dữ liệu giao dịch là các động từ. Chúng mô tả các hoạt động diễn ra hàng ngày trong tổ chức, doanh nghiệp như việc bán hàng, doanh số bán hàng, hay các bệnh nhân được phép xuất viện hay nhập viên tại bệnh viện... Bất kể các miền dữ liệu được xác định như thế nào, khái niệm dữ liệu chủ cần được xác định rõ ràng và phân biệt với các loại dữ liệu khác. Việc xác định dữ liệu chủ phụ thuộc quan điểm của từng tổ chức và dựa vào các thực thể quan trọng trong các miền dừ liệu của tổ chức đó. 3. Quản lý dữ liệu chủ Mặc dù được định nghĩa là dữ liệu chủ nhưng dừ liệu này vẫn có thể được lưu trữ phân tán ở các hệ thống ứng dụng khác nhau và do đó có thể dẫn đến các silo thông tin (các thông tin biệt lập). Điều này phản ánh một thực trạng tại nhiều doanh nghiệp là dữ liệu về một thực thể hay dữ liệu chủ của một miền dữ liệu được lưu trữ ở nhiều cơ sở dừ liệu khác nhau trong các hệ thống Số 229- Tháng 6. 2021- Tạp chí Khoa học Đào tạo Ngân hàng 75 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp khác nhau, nhưng thông tin phản ánh về chúng lại không đồng nhất. Việc lưu trừ dừ liệu chủ ở các hệ thống khác nhau gây khó khăn trong việc tổng hợp, phân tích và xử lý thông tin. Ví dụ được mô tả ở Hình 1, rõ ràng với dữ liệu chủ miên khách hàng được lưu trữ ở hệ thống “Kinh doanh” và hệ thống “Kế toán” là khác nhau. Thực tế là cùng một thực thể khách hàng Lê Văn An nhưng thông tin về khách hàng này được biểu diễn khác nhau ở 2 hệ thống: hệ thống “Kinh doanh” khách hàng An Van Le với mã khách hàng là KH002, có số điện thoại 0902345678, địa chỉ 25 Lý Thái Tổ, Hà Nội khác với khách hàng An Le (mã ID0070) trong hệ thống “Kế toán” với địa chỉ tại 12 Chùa Bộc, Hà Nội, có số điện thoại 0909789456. Mặc dù đây là một khách hàng duy nhất Lê Văn An, nhưng khi bộ phận quản lý muốn đưa ra các quyết định liên quan đến kế hoạch chăm sóc khách hàng và giới thiệu sản phẩm thì họ không biết được số điện thoại nào khách hàng hay sử dụng cũng như địa chỉ mà khách hàng thường xuyên có mặt ở đâu để có thể thực hiện các chiến dịch quảng cáo, marketing sản phẩm,... Vậy thông tin nào chính xác nhất khi mô tả về dữ liệu chủ miền khách hàng là vấn đề mà doanh nghiệp cần quan tâm, cũng như có một cái nhìn thống nhất về dữ liệu chủ khách hàng tại một nơi duy nhất, thay vì thông tin nằm rải rác ở nhiều hệ thống. Nhìn rộng hơn, với doanh nghiệp sản xuất và kinh doanh sản phẩm có nhiều bộ phận phòng ban thì dữ liệu chủ xuất hiện và được lưu giữ ở các hệ thống tách biệt nhau như ở Hình 3 (Keith Gordon, 2013). Như mô tả ở Hình 3, dữ liệu chủ các miền dữ liệu: khách hàng, sản phâm, phòng ban, nhà cung cẩp xuất hiện ở các quy trình trong các bộ phận, phòng ban khác nhau (Bảng 3). Dữ liệu chủ các miền dữ liệu được lưu trữ một cách rời rạc ở các hệ thống thông tin được cung cấp bởi các hãng khác nhau như mô tả ở hai ví dụ trên (Hình 1, Hình 3) sẽ dần đến tình trạng: dữ liệu của cùng một thực thể trong một miền dữ liệu sẽ rất khác biệt và khi đó chất lượng dữ liệu không được đảm bảo ảnh hưởng đến việc 76 Tạp chí Khoa học Đào tạo Ngân hàng- Số 229- Tháng 6. 2021 NGÔ THÙY LINH - PHAN THANH ĐỨC Bảng 3. Dữ liệu chủ xuất hiện ờ các hệ thống khác nhau Dữ liệu chủ Được lưu trữ ở các hệ thống trong các phòng ban Sản phẩm 8 hệ thống Khách hàng 7 hệ thống Phòng ban 3 hệ thống Nhà cung cấp 3 hệ thống Nguồn: Keith Gordon (2013) ra quyết định của tổ chức, cùng nhiều vấn đề khác nữa liên quan đến điều hành, quản lý khi chất lượng dữ liệu kém... Chính vì vậy, cần phải Quản lý dữ liệu chủ (Master Data Management- MDM) để đảm bảo chất lượng thông tin chính xác nhất cho các thực thể quan trọng trong tổ chức. Định nghĩa về quản lý dữ liệu chủ của David Loshin (2009) cho biết: Quản lý dữ liệu chủ là tập hợp các hoạt động quản lý “dữ liệu tốt nhất”, mà có thể điều phối các bên liên quan chính, những người tham gia và khách hàng doanh nghiệp trong việc kết hợp với các ứng dụng kinh doanh, các phương pháp quản lý thông tin và công cụ quản lý dữ liệu để thực thi các chính sách, thủ tục, dịch vụ và cơ sở hạ tầng hồ trợ cho việc nắm bắt, tích hợp và sau đó chia sẻ việc sử dụng dữ liệu chủ, đảm bảo dữ liệu này là chính xác, kịp thời, nhất quán. Một định nghĩa nữa về quản lý dừ liệu chủ “đó là khuôn khổ của các quy trình và công nghệ nhằm tạo ra và duy trì một môi trường có thẩm quyền, đáng tin cậy, bền vững, chính xác và an toàn mà có thể mô tả một phiên bản duy nhất và toàn diện, chính xác của dữ liệu chủ và các mối quan hệ của nó. Định nghĩa được đưa ra bởi Gartner (2013): quản lý dữ liệu chủ là tập các quy tắc dựa trên công nghệ cho phép các bộ phận nghiệp vụ và công nghệ thông tin làm việc cùng nhau để giúp tổ chức có được một phiên bản duy nhất và chính xác nhất về dừ liệu chủ (Keith Gordon, 2013). Các định nghĩa này nêu rõ hai thành phần chính của việc quản lý dừ liệu chủ được mô tả ở Hình 4. Hai thành phần của MDM: Thành phần Chính sách (Policies) bao gồm các chính sách đại diện cho quản trị dữ liệu của MDM, thành phần Công nghệ (Technologies) bao gồm các công nghệ hồ trợ MDM. Chính sách xác định các vai trò và trách nhiệm trong quy trình MDM. Ví dụ: nếu một công ty giới thiệu một sản phẩm mới, các chính sách xác định ai chịu trách nhiệm tạo mục nhập mới trong sổ đăng ký sản phẩm chính, các tiêu chuẩn cho tạo định danh sản phẩm, những người hoặc bộ phận nào cần được thông báo và những hệ thống dữ liệu khác cần được cập nhật. Tuân thủ quy định cùng với sự riêng tư và bảo mật thông tin cũng là những vấn đề quan trọng (John R. Talburt Yinle Zhou, 2015). Thành phần công nghệ của MDM cần xác định hai việc chính, đó là: Quy trình xác định thực thể (Entity Resolution Process) và Quản lý thông tin xác thực thực thể (Entity Identity Information Management- EIIM). - Quy trình xác định thực thể (ER) sẽ xác định các thực thể quan trọng trong tổ chức, quy trình này diễn ra khi hai hệ thống thông tin đang cùng tham chiếu đến một hoặc nhiều thực thể trong thế giới thực. Quy trình Hình 4. Các thành phần của MDM Nguồn: John R. Taỉburt Yinle Zhou (2015) SÔ'''' 229- Tháng 6. 2021- Tạp chí Khoa học Đào tạo Ngân hàng 77 Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp Customer Master Data Bảng 4. Dữ liệu chủ miền khách hàng sau khi được quăn lý bôi MDM ID First Middle Last TelNum Address City Zip ID0010 An Van Le 0902345678 12 Chua Boo Ha Noi 100000 Nguồn: David Loshin (2009) này sẽ “sắp xếp” chọn lọc thông tin về các thực thể, xảy ra khi có nhiều nguồn thông tin cùng tham chiếu đến tập các thực thể, sẽ chọn ra thông tin có độ ưu tiên, chính xác cao. Ví dụ, một bệnh nhân được đưa vào bệnh viện ở các thời điểm khác nhau, mỗi lần ở các khoa khác nhau là khoa nội trú và ngoại trú. ER sẽ so sánh thông tin nhập viện ở mồi thời điểm và đưa ra quyết định hồ sơ nhập viện nào cho cùng một bệnh nhân và hồ sơ nào dành cho bệnh nhân khác. - Quân lý thông tin nhận dạng thực thể (EIIM) là bộ sưu tập và quản lý thông tin nhận dạng với mục tiêu duy trì tính toàn vẹn danh tính chủ thể theo thời gian (Zhou Talburt, 201 la). Tính toàn vẹn danh tính thực thể yêu cầu mồi thực thể phải được mô tả trong một hệ thống là duy nhất. Các thực thể riêng biệt phải được ...

Trang 1

Quản trị dữ liệu chủ da miền: nâng cao quản trị dữ liệu

cho các tô chức doanh nghiệp

Ngô Thùy Linh - Phan Thanh Đức Khoa Hệ thống thông tin quàn lý, Học viện Ngân hàng

Ngày nhận: 17/05/2021

Ngày nhận bàn sửa: 26/05/2021

Ngày duyệt đăng: 25/06/2021

Tóm tắt: Dữ liệu ngày nay đã trở thành một trong những tài sản quan trọng của các

tổ chức, doanh nghiệp Tuy nhiên, thách thức đặt ra với các nhà quản lý là làm thế nào để có thể khai thác, sử dụng và quản lý dữ liệu một cách hiệu quả và thông minh khỉ có quả nhiều nguồn dữ liệu bên trong và bên ngoài tố chức Giải pháp quản lý

dữ liệu chủ đa miền dựa vào việc quản lý tống thê dữ liệu trên đa miền sẽ giúp các

tổ chức có cái nhìn thong nhất và chỉnh xác về các thực thê quan trọng, từ đó cung cấp các thông tin tài chính phù hợp, đáng tin cậy Bài báo này tập trung làm rõ các khải niệm, tầm quan trọng cùa việc quản lý dữ liệu chủ đa miền và một số cách tiếp cận khỉ xây dựng quản lý dữ liệu chủ da miên.

Từ khóa: Dữ liệu chủ, Quản trị dữ liệu chủ, Quản lý dữ liệu chủ đa miền

Multi-domain master data management: improving data governance for enterprises

Abstract: Today data has become one of the important assets of organizations and businesses However, one challenge faced by managers is how to effectively and intelligently exploit, use and manage data when the organization is exposed to a large number of both internal and external data sources A multi-domain master data management solution based on the overall management of data across multiple domains will help organizations develop a unified and accurate view of important entities, thereby providing suitable and reliable financial information This article attempts to clarify the concepts and the importance of multi-domain master data management, and propose feasible approaches when building multi-domain master data management.

Keywords: Master Data, Master Data Management, Multi-Domain Master Data Management

Ngo, Thuy Linh

Email: linhnt@hvnh.edu.vn

Phan, Thanh Duc

Email: ducpt@hvnh.edu.vn

Organization of all: Faculty of Management Information System, Banking Academy of Vietnam

Trang 2

1 Đặt vấn đề

Một khảo sát của Gartner (2019) cho thấy

răng chât lượng dữ liệu kém đã dần đèn chi

phí của các tổ chức tăng lên tới 11,8 triệu

USD Một trong những nguyên nhân dẫn

đến chất lượng dừ liệu kém là chưa tích hợp

được thông tin từ các nguồn dữ liệu khác

nhau trong tổ chức Nhiều tổ chức hiện

nay đã nhận ra giá trị và tầm quan trọng

của việc quản lý dữ liệu chủ (Master Data

Management- MDM) và coi MDM là một

giải pháp cho thách thức này Các tổ chức

thường bắt đầu triển khai MDM và dừng

ở việc tập trung vào một miền dữ liệu (a

data domain), sau đó mới mở rộng đến các

miền khác trong mô hình quản lý dừ liệu đa

mien (a multi- domain model) Trong quá

trình thực hiện, hầu hết các tổ chức gặp một

số khó khăn trong việc thực hiện đầy đủ

và nhất quán các mục tiêu quản trị dữ liệu

chủ trên nhiều miền (Mark Allen & Dalton

Cervo, 2015) Sự khó khăn này bắt nguồn

từ việc không có cái nhìn tổng thể về các

thành phần, chức năng và cả các dịch vụ để

có thể quản trị dữ liệu chủ một cách chính

xác và hiệu quả Một số tổ chức nhìn nhận

việc quản trị này về bản chất chỉ là việc tích

hợp dừ liệu đơn thuần Đây sẽ trở thành

một sai lầm khi các dữ liệu theo thời gian

ngày càng trở nên đa dạng và phức tạp, bởi

vì ngoài việc tích họp dữ liệu thì tổ chức

còn cần phải đưa ra các trách nhiệm của

bộ phận, phòng ban đối với dữ liệu và cần

phải quan tâm đến việc quản lý chất lượng

dữ liệu để có thể tiếp cận thành công quản

trị dữ liệu trên nhiều miền Phần tiếp theo

của bài báo sẽ trình bày các vấn đề có liên

quan đến dữ liệu chủ, miền dữ liệu, quản

lý dừ liệu chủ, dừ liệu chủ đa miền và một

số cách tiếp cận xây dựng quản trị đa miền

nhằm nâng cao việc quản trị dữ liệu cho các

tô chức, doanh nghiệp

2 Dữ liệu chủ và miền dữ liệu

Mồi một miền dữ liệu phản ánh đến một tập các thực thể quan trọng mà các tổ chức, doanh nghiệp thường quan tâm như: tập các khách hàng, các sản phẩm, các nhà cung câp, các nhân viên, tài chính, chính sách (Mark Allen & Dalton Cervo, 2015) Trong mồi miền dữ liệu có thể có một hoặc nhiều thực thể, thực thể có thể là một đối tượng,

cá nhân, đơn vị, địa điểm phải là duy nhất trong một miền nhất định và thường có các thuộc tính kèm theo Ví dụ, trong miền Khách hàng, một doanh nghiệp đối tác hoặc một cá nhân có hợp đồng với doanh nghiệp có thể được coi là một thực thể, mồi thực thể khách hàng có một số thuộc tính như: họ tên, số điện thoại, e-mail, giới tính Tùy vào từng loại hình, lĩnh vực kinh doanh của từng tổ chức mà có các miền dữ liệu với các thực thể khác nhau Chẳng hạn

có một số miền dữ liệu tương ứng với từng lĩnh vực như sau:

- Lĩnh vực sản xuất: Khách hàng, Sản phẩm, Nhà cung cấp, Nguyên vật liệu, Địa điểm

- Lĩnh vực chăm sóc sức khỏe: Bệnh nhân,

Nhà cung cấp, Sản phẩm, Khiếu nại, Triệu chứng lâm sàng, Bảo hiểm

- Lĩnh vực tài chính: Khách hàng, Tài

khoản, Sản phẩm, Địa điểm, Bảo hiểm

- Lĩnh vực giáo dục: Sinh viên, Khoa bộ

môn, Địa điểm, Tài liệu, Khóa học

Trên thực tế, mức độ ưu tiên về dữ liệu của các thực thể là khác nhau, dữ liệu nào có mức độ ưu tiên cao sẽ được lưu trữ trong vùng bộ nhớ được truy cập nhanh hơn, trong hệ tài nguyên tốt hơn, quan tâm về chất lượng dừ liệu của thực thể đó hơn, có

cơ chế kiểm soát chất lượng dừ liệu tốt hơn

Do đó khái niệm “Dừ liệu chủ” (Master data) đã ra đời để mô tả, phản ánh đến những dữ liệu quan trọng cần được quan tâm nhiều hơn trong tổ chức Theo John R Talburt & Yinle Zhou (2015), dừ liệu chủ

Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 73

Trang 3

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

của một tổ chức được định nghĩa là dữ liệu

được lưu giữ bởi tổ chức đó, mô tả các thực

thể độc lập và liên quan chính đến các hoạt

động của tổ chức Một định nghĩa khác về

dữ liệu chủ là dữ liệu mô tả vê các thực thê

quan trọng đối với các hoạt động và phân

tích của tổ chức, cách dừ liệu này tương tác

và chia sẻ sẽ cung cấp ngữ cảnh cho dữ liệu

giao dịch (Mark Allen & Dalton Cervo,

2015) Hay dữ liệu chủ là dữ liệu mô tả các thực thể lõi của tổ chức với tập các thuộc tính và định danh là nhất quán và chính xác (Keith Gordon, 2013)

Ví dụ sau đây sẽ mô tả rõ hơn về dữ liệu chủ,

dữ liệu về các thực thể khách hàng được lưu trữ ở các hệ thống Kinh doanh và Ke toán của công ty X (David Loshin, 2009)

Các thông tin liên quan đến thực thể khách

Hình 1 Dữ liệu về khách hàng được lưu trữ ở 2 hệ thống khác nhau

Nguồn: David Loshin (2009)

Bảng 1 Dữ liệu chủ miền khách hàng của Hệ thống Kinh doanh

Customer Master Data

ID Cust FirstName MiddleName LastName TelNum Address City

Nguồn: David Loshin (2009)

Nguồn: David Loshin (2009)

Bang 2 Dữ liệu chu miền khách hàng của Hệ thống Kế toán

Customer Master Data

74 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6 2021

Trang 4

hàng được lưu trữ ở hai hệ thống này bao

gồm:

Hệ thống “Kinh doanh” lưu trừ các thông

tin khách hàng bao gồm: Tên (FirstName),

Tên đệm (MiddleName), Họ (LastName),

Số điện thoại (TelNum), Địa chỉ (Address)

Dữ liệu chủ miền khách hàng của hệ thống

Kinh doanh được biểu diễn như ở Bảng 1

Hệ thống “Kế toán” lưu trừ các thông tin

của khách hàng bao gồm: Tên (First), Họ

(Last), Địa chỉ (Add), Thành phố (City),

Mã bưu chính (ZIP), số điện thoại (Tel)

Dữ liệu chủ miền khách hàng của hệ thống

Kế toán được thể hiện ở Bảng 2

Các miền dữ liệu cũng như các dữ liệu khác

bên trong tổ chức đều có thể chia thành 2

loại: dữ liệu hoạt động (operational data)

và dữ liệu không hoạt động (nonoperational

data) “Dừ liệu hoạt động” là tập họp dữ

liệu theo thời gian thực để hồ trợ yêu cầu

của tổ chức trong các hoạt động hàng ngày

của họ “Dữ liệu không hoạt động” thường

được thu thập trong kho dữ liệu với tần suất

ít hơn và được sử dụng cho hệ thống kinh

doanh thông minh (Dalton Cervo & Mark

Allen, 2011) Dữ liệu chủ về bản chất là các

dữ liệu “không hoạt động”, cụ thể hon, cấu

trúc dữ liệu chủ được mô tả ở Hình 2

Cấu trúc dữ liệu chủ gồm 3 lóp: dữ liệu

tham chiếu, dữ liệu cấu trúc giao dịch, dữ

liệu cấu trúc doanh nghiệp

Hình 2 Cấu trúc 3 lóp dữ liệu chủ

Nguồn: Keith Gordon (2013)

- Dữ liệu tham chiếu (Reference Data): Dữ liệu thường được mô tả bởi các giá trị được

sử dụng để phân biệt các dữ liệu khác nhau, chẳng hạn như phân biệt giữa dừ liệu chủ

và dừ liệu giao dịch

- Dữ liệu cấu trúc giao dịch (Transaction structure data) đại diện cho những người tham gia trực tiếp trong một giao dịch, chẳng hạn như nhà cung cấp, khách hàng

và sản phẩm Thông tin về một giao dịch không thể được ghi lại trừ khi thông tin chi tiết của những người tham gia này đã tồn tại trong cơ sở dữ liệu

- Dữ liệu cấu trúc doanh nghiệp (Enterprise structure data) là dữ liệu mô tả cấu trúc của doanh nghiệp, ví dụ dữ liệu mô tả về cơ cấu

tổ chức hoặc cơ cấu tài chính

Neu coi dữ liệu chủ được biểu diễn dưới dạng các danh từ của dừ liệu và thông tin thì dữ liệu giao dịch là các động từ Chúng

mô tả các hoạt động diễn ra hàng ngày trong tổ chức, doanh nghiệp như việc bán hàng, doanh số bán hàng, hay các bệnh nhân được phép xuất viện hay nhập viên tại bệnh viện

Bất kể các miền dữ liệu được xác định như thế nào, khái niệm dữ liệu chủ cần được xác định rõ ràng và phân biệt với các loại

dữ liệu khác Việc xác định dữ liệu chủ phụ thuộc quan điểm của từng tổ chức và dựa vào các thực thể quan trọng trong các miền

dừ liệu của tổ chức đó

3 Quản lý dữ liệu chủ

Mặc dù được định nghĩa là dữ liệu chủ nhưng dừ liệu này vẫn có thể được lưu trữ phân tán ở các hệ thống ứng dụng khác nhau và do đó có thể dẫn đến các silo thông tin (các thông tin biệt lập) Điều này phản ánh một thực trạng tại nhiều doanh nghiệp

là dữ liệu về một thực thể hay dữ liệu chủ của một miền dữ liệu được lưu trữ ở nhiều

cơ sở dừ liệu khác nhau trong các hệ thống

Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 75

Trang 5

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

khác nhau, nhưng thông tin phản ánh về

chúng lại không đồng nhất

Việc lưu trừ dừ liệu chủ ở các hệ thống khác

nhau gây khó khăn trong việc tổng hợp,

phân tích và xử lý thông tin Ví dụ được mô

tả ở Hình 1, rõ ràng với dữ liệu chủ miên

khách hàng được lưu trữ ở hệ thống “Kinh

doanh” và hệ thống “Kế toán” là khác

nhau Thực tế là cùng một thực thể khách

hàng Lê Văn An nhưng thông tin về khách

hàng này được biểu diễn khác nhau ở 2 hệ

thống: hệ thống “Kinh doanh” khách hàng

An Van Le với mã khách hàng là KH002,

có số điện thoại 0902345678, địa chỉ 25 Lý

Thái Tổ, Hà Nội khác với khách hàng An

Le (mã ID0070) trong hệ thống “Kế toán”

với địa chỉ tại 12 Chùa Bộc, Hà Nội, có số

điện thoại 0909789456 Mặc dù đây là một

khách hàng duy nhất Lê Văn An, nhưng khi

bộ phận quản lý muốn đưa ra các quyết định

liên quan đến kế hoạch chăm sóc khách

hàng và giới thiệu sản phẩm thì họ không

biết được số điện thoại nào khách hàng hay

sử dụng cũng như địa chỉ mà khách hàng

thường xuyên có mặt ở đâu để có thể thực

hiện các chiến dịch quảng cáo, marketing

sản phẩm, Vậy thông tin nào chính xác

nhất khi mô tả về dữ liệu chủ miền khách

hàng là vấn đề mà doanh nghiệp cần quan

tâm, cũng như có một cái nhìn thống nhất

về dữ liệu chủ khách hàng tại một nơi duy

nhất, thay vì thông tin nằm rải rác ở nhiều

hệ thống

Nhìn rộng hơn, với doanh nghiệp sản xuất

và kinh doanh sản phẩm có nhiều bộ phận

phòng ban thì dữ liệu chủ xuất hiện và được

lưu giữ ở các hệ thống tách biệt nhau như ở

Hình 3 (Keith Gordon, 2013)

Như mô tả ở Hình 3, dữ liệu chủ các miền

dữ liệu: khách hàng, sản phâm, phòng ban,

nhà cung cẩp xuất hiện ở các quy trình

trong các bộ phận, phòng ban khác nhau

(Bảng 3)

Dữ liệu chủ các miền dữ liệu được lưu

trữ một cách rời rạc ở các hệ thống thông tin được cung cấp bởi các hãng khác nhau như mô tả ở hai ví dụ trên (Hình 1, Hình 3) sẽ dần đến tình trạng: dữ liệu của cùng một thực thể trong một miền dữ liệu sẽ rất khác biệt và khi đó chất lượng dữ liệu không được đảm bảo ảnh hưởng đến việc

76 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6 2021

Trang 6

Bảng 3 Dữ liệu chủ xuất hiện các

hệ thống khác nhau

Dữ liệu chủ Được lưu trữ ở các hệ

thống trong các phòng ban

Nhà cung cấp 3 hệ thống

Nguồn: Keith Gordon (2013)

ra quyết định của tổ chức, cùng nhiều vấn

đề khác nữa liên quan đến điều hành, quản

lý khi chất lượng dữ liệu kém Chính vì

vậy, cần phải Quản lý dữ liệu chủ (Master

Data Management- MDM) để đảm bảo

chất lượng thông tin chính xác nhất cho các

thực thể quan trọng trong tổ chức

Định nghĩa về quản lý dữ liệu chủ của

David Loshin (2009) cho biết: Quản lý dữ

liệu chủ là tập hợp các hoạt động quản lý

“dữ liệu tốt nhất”, mà có thể điều phối các

bên liên quan chính, những người tham gia

và khách hàng doanh nghiệp trong việc

kết hợp với các ứng dụng kinh doanh, các

phương pháp quản lý thông tin và công cụ

quản lý dữ liệu để thực thi các chính sách,

thủ tục, dịch vụ và cơ sở hạ tầng hồ trợ cho

việc nắm bắt, tích hợp và sau đó chia sẻ

việc sử dụng dữ liệu chủ, đảm bảo dữ liệu

này là chính xác, kịp thời, nhất quán Một

định nghĩa nữa về quản lý dừ liệu chủ “đó là

khuôn khổ của các quy trình và công nghệ

nhằm tạo ra và duy trì một môi trường có

thẩm quyền, đáng tin cậy, bền vững, chính

xác và an toàn mà có thể mô tả một phiên

bản duy nhất và toàn diện, chính xác của dữ

liệu chủ và các mối quan hệ của nó Định

nghĩa được đưa ra bởi Gartner (2013): quản

lý dữ liệu chủ là tập các quy tắc dựa trên

công nghệ cho phép các bộ phận nghiệp

vụ và công nghệ thông tin làm việc cùng

nhau để giúp tổ chức có được một phiên

bản duy nhất và chính xác nhất về dừ liệu

chủ (Keith Gordon, 2013)

Các định nghĩa này nêu rõ hai thành phần chính của việc quản lý dừ liệu chủ được mô

tả ở Hình 4

Hai thành phần của MDM: Thành phần Chính sách (Policies) bao gồm các chính sách đại diện cho quản trị dữ liệu của MDM, thành phần Công nghệ (Technologies) bao gồm các công nghệ hồ trợ MDM Chính sách xác định các vai trò và trách nhiệm trong quy trình MDM Ví dụ: nếu một công

ty giới thiệu một sản phẩm mới, các chính sách xác định ai chịu trách nhiệm tạo mục nhập mới trong sổ đăng ký sản phẩm chính, các tiêu chuẩn cho tạo định danh sản phẩm, những người hoặc bộ phận nào cần được thông báo và những hệ thống dữ liệu khác cần được cập nhật Tuân thủ quy định cùng với sự riêng tư và bảo mật thông tin cũng là những vấn đề quan trọng (John R Talburt

& Yinle Zhou, 2015)

Thành phần công nghệ của MDM cần xác định hai việc chính, đó là: Quy trình xác định thực thể (Entity Resolution Process)

và Quản lý thông tin xác thực thực thể (Entity Identity Information Management- EIIM)

- Quy trình xác định thực thể (ER) sẽ xác định các thực thể quan trọng trong tổ chức, quy trình này diễn ra khi hai hệ thống thông tin đang cùng tham chiếu đến một hoặc nhiều thực thể trong thế giới thực Quy trình

Hình 4 Các thành phần của MDM

Nguồn: John R Taỉburt & Yinle Zhou (2015)

SÔ' 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 77

Trang 7

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

Customer Master Data

Bảng 4 Dữ liệu chủ miền khách hàng sau khi được quăn lý bôi MDM

Nguồn: David Loshin (2009)

này sẽ “sắp xếp” chọn lọc thông tin về các

thực thể, xảy ra khi có nhiều nguồn thông

tin cùng tham chiếu đến tập các thực thể, sẽ

chọn ra thông tin có độ ưu tiên, chính xác

cao Ví dụ, một bệnh nhân được đưa vào

bệnh viện ở các thời điểm khác nhau, mỗi

lần ở các khoa khác nhau là khoa nội trú và

ngoại trú ER sẽ so sánh thông tin nhập viện

ở mồi thời điểm và đưa ra quyết định hồ sơ

nhập viện nào cho cùng một bệnh nhân và

hồ sơ nào dành cho bệnh nhân khác

- Quân lý thông tin nhận dạng thực thể

(EIIM) là bộ sưu tập và quản lý thông tin

nhận dạng với mục tiêu duy trì tính toàn

vẹn danh tính chủ thể theo thời gian (Zhou

& Talburt, 201 la) Tính toàn vẹn danh tính

thực thể yêu cầu mồi thực thể phải được mô

tả trong một hệ thống là duy nhất Các thực

thể riêng biệt phải được mô tả riêng cho

trong hệ thống (Maydanchik, 2007) Toàn

vẹn danh tính chủ thể là một yêu cầu cơ bản

cho các hệ thống MDM

Quay trở lại ví dụ mô tả trên Hình 1, sau

khi xác minh với khách hàng tên Lê Văn

An thì bộ phận chăm sóc khách hàng biết

được rằng: ông Lê Văn An có địa chỉ 12

Chùa Bộc là địa chỉ tạm trú và địa chỉ ở

25 Lý Thường Kiệt là nơi đăng ký địa chỉ

thường trú, số điện thoại 0902345678 là

số điện thoại khách hàng thường xuyên sử

dụng Do đó mọi giao dịch sẽ được thực

hiện với ông An ở 12 Chùa Bộc, liên hệ

qua số điện thoại 0902345678 Một số bộ

phận, phòng ban (phụ trách liên quan đến

mảng khách hàng) của doanh nghiệp X mong muốn được lấy thông tin về khách hàng một cách chính xác và đảm bảo nhất

Dữ liệu chủ về miền khách hàng sau khi được quản lý bởi MDM và được biểu diễn như Bảng 4

Miền dữ liệu khách hàng có thực thể khách hàng Lê Văn An (Bảng 4) sau khi được quản lý bởi MDM có mã định danh ID0010 duy nhất với các thuộc tính: Tên, Đệm,

Họ, Số điện thoại, Địa chỉ, Thành phố, Mã bưu chính; ngoài thực thể này thì miền dữ liệu khách hàng còn có nhiều khách hàng khác và các đối tác cũng được quản lý bởi MDM

Như vậy quản lý dừ liệu chủ không chi là vấn đề về công nghệ, không chỉ là vấn đề tích hợp dữ liệu mà còn liên quan đến trách nhiệm quản lý dữ liệu, trách nhiệm của các bộ phận phòng ban liên quan rồi chính sách, chiến lược của tổ chức Khi tổ chức, doanh nghiệp triển khai MDM, thì các

bộ phận nghiệp vụ và bộ phận công nghệ thông tin làm việc cùng nhau sẽ đảm bảo được tính đồng nhất, độ chính xác, tính bền vững của dữ liệu chủ được chia sẻ trong tổ chức đó Do đó tổ chức cũng tránh được các cuộc tranh luận vô tận, tốn thời gian về việc trả lời câu hỏi “dữ liệu của hệ thống trong phòng ban nào là đúng?”, điều này có thể dần đến các quyết định kém hiệu quả ảnh hưởng tới chiến lược của tổ chức

Dữ liệu chủ đa miền

Quản lý dữ liệu chủ sẽ cung cấp công cụ

78 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6 2021

Trang 8

Bảng 5 Một số nhân tố xác định các miền cần đến MDM

GIÁ TRỊ KINH DOANH

Giá trị kinh doanh là một yếu tố quan trọng khi quyết định những miền nào cần phải có MDM Một lý do tại sao hầu hết các công ty bắt đầu với MDM khách hàng là vì không ccó gì nghi ngờ giá trị chính xác về thông tin khách hàng mang lại cho doanh nghiệp Một phiên bản duy nhất và chính xác về khách hàng có thể liên quan trực tiếp đến sự sông còn của một tổ chức Như vậy, mọi miền cần được đánh giá từ quan điểm giá trị kinh daonh để xác định lợi ích của việc áp dụng MDM cho tổ chức đó

SỐ LƯỢNG

Số lượng liên quan trực tiếp đến việc cần thiết có MDM Nếu một công

ty chỉ cộ hai hoặc ba đối tác, thì không có khả năng hưởng lợi từ MDM đến miền đối tác Nhưng với một ví dụ khác, nếu một công ty kinh doạnh với hàng ngàn đại lý, thì việc thực hiện giải pháp MDM cho các miền đối tác rất có ý nghĩa

TÍNH THAY ĐỔI Nếu dữ liệu không thay đổi và các tập thuộc tính của dữ liệu liên quan

đến các thực thể không biến đổi thì không cần thiết phải cần đến MDM KHẢ NẤNG DỪNG LẠI

Càng nhiều miền có trong một tổ chức thì việc sử dụng MDM càng cần thiêt để có sự nhât quán, tin cậy, chính xác của các luồng thông tin trong tổ chức đó.

ĐỌ PHỨC TẠP

Độ phức tạp của các thuộc tính và dữ liệu liên quan đến một miền là

cơ sở để thực thi giải pháp MDM Lấy miền sản phẩm làm ví dụ: Các sản phẩm trong một công ty có thể rất phức tạp, với số lượng lớn các thuộc tính liên quan Từ thực tế đó việc triển khai MDM cho miền sản phẩm trong công ty là rất lớn

Nguồn:Mark Allen & Dalton Cervo (2015)

và quy trình quản lý dữ liệu chủ, đảm bảo

dữ liệu chủ không chỉ nhất quán mà còn

chính xác Quản lý dữ liệu chủ theo miền

(Master Data Management domain) phản

ánh một miền dữ liệu cụ thể mà tại đó việc

xác định và kiểm soát dữ liệu chủ được

tập trung Trong tổ chức không chỉ có một

miền dữ liệu mà còn nhiều miền dữ liệu

quan trọng khác nữa, do đó họ không chỉ

tập trung quản lý dừ liệu chủ trên một miền

mà còn hướng tới quản lý trên nhiều miền

Quản lý dữ liệu chủ đa miền có liên quan

đến việc quản lý tổng thể dữ liệu chủ trên

nhiều miền Vậy liệu tất cả các miền có cần

đến MDM, nhân tố nào ảnh hưởng đến việc

xác định miền dữ liệu cần MDM tập trung

quan tâm đến? Bảng 5 mô tả một số nhân tố

chính trong việc định hướng miền dữ liệu

cho MDM trong mô hình đa miền

Để việc quản lý dừ liệu và cung cấp thông

tin một cách hiệu quả cũng như tăng cao khả năng cạnh tranh cho các tổ chức, doanh nghiệp thì các giải pháp MDM đa miền cần

có sự tham gia và cộng tác hiệu quả của bộ phận nghiệp vụ chịu trách nhiệm về chất lượng dữ liệu và bộ phận công nghệ thông tin có nhiệm vụ quản trị dữ liệu MDM đa miền cần hoạt động như một cầu nối tạo động lực cho việc cộng tác cho hai bộ phận

đó trong tổ chức Điều này dễ hiểu đối với tình huống tổ chức doanh nghiệp nào cần chuyển đổi từ cơ sở hạ tầng hệ thống cũ sang hệ thống mới đòi hỏi phải có các yêu cầu liên quan đến bảo mật, quyền riêng tư, các quy định, chính sách Để đối mặt và giải quyết được các thách thức này cần có

sự kết hợp chặt chẽ giữa các phòng ban nghiệp vụ và phòng ban công nghệ Một minh họa về giải pháp MDM đa miền được

mô tả ở Hình 5

Số 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 79

Trang 9

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

Nguồn:Mark Allen & Dalton Cervo (2015)

Với giải pháp MDM đa miền được mô tả ở

Hình 5, cần đến 4 bộ phận hồ trợ cho việc

triển khai MDM thành công, đó là: sự hồ

trợ từ cấp điều hành, từ ban chỉ đạo, bộ

phận quản lý chưcmg trình, bộ phận quản lý

các thay đổi và rủi ro Với mỗi miền dữ liệu

1, 2, , n cần phải bảo đảm chất lượng dữ

liệu, đồng bộ hóa dữ liệu, chính sách quản

lý dữ liệu, quản lý dữ liệu tham chiếu, xác

định thực thể, quản lý Đọc- Ghi- Cập nhật-

Xóa dữ liệu (CRƯD) Giải pháp MDM thể

hiện trên Hình 5 cho thấy một số chức năng

được dùng chung và có thể được sử dụng

bởi nhiều miền dữ liệu Ví dụ, chương trình

quản trị dữ liệu có phạm vi và quyền hạn

rộng hơn, không chỉ tập trung vào dữ liệu

chủ Tương tự, việc bảo mật dừ liệu có thê

sẽ tập trung vào các chính sách và quản lý

liên quan đến truy cập dữ liệu và bảo vệ dữ

liệu chủ Vì MDM được áp dụng trên nhiều miền, nên các chức năng, các công cụ và quy trình liên quan tới các miền trở nên dề

sử dụng hơn Một số chức năng, chang hạn như quản lý chất lượng dữ liệu là vô cùng rộng Bởi vì nếu chất lượng dữ liệu của một miền tốt thực sự thì có thể tái sử dụng dữ liệu này trên nhiều miền, nhưng chúng vần

có các yêu cầu cụ thể theo miền cho các hoạt động như mô tả dữ liệu, làm sạch dữ liệu, chuẩn hóa dữ liệu

Như vậy giải pháp MDM được thiết lập

để giải quyết các vấn đề: dừ liệu trùng lặp, phân mảnh, không nhất quán trên nhiều nguồn Các hệ thống thông tin thường sẽ

hồ trợ một nghiệp vụ cụ thể và khi đó dữ liệu chủ yếu duy trì cho nghiệp vụ này Có rất ít sự kết nối dữ liệu giữa các hệ thống với nhau vì thiếu quy trình tổng thể trong

80 Tạp chí Khoa học & Đào tạo Ngân hàng- số 229- Tháng 6 2021

Trang 10

Hình 6 Các chức năng của MDM đa miền

Nguồn:Mark Allen & Dalton Cervo (2015)

tổ chức Và hệ quả là dữ liệu có chất lượng

kém, không chính xác bởi vì có nhiều nguồn

thông tin cùng mô tả, đại diện cho một thực

thể MDM sẽ đóng vai trò hỗ trợ thiết lập

và quản lý các luật để xác định các thành

phần dữ liệu chung, được sử dụng để khớp

các thực thể từ nhiều nguồn, cũng như đưa

các kỳ thuật để làm sạch và củng cố thông

tin từ các nguồn đó Từ đó tạo ra một phiên

bản duy nhất và chính xác nhất về thực thể

Hình 6 biếu diễn các chức năng của MDM

đa miền như: quản trị dữ liệu, quản trị chất

lượng dữ liệu, đồng bộ và tích hợp dữ liệu,

quản lý dữ liệu tham chiếu, bảo mật dữ

liệu, kiến trúc dữ liệu

4 Một số cách tiếp cận xây dựng dữ liệu

chủ đa miền

Không có một cách tiếp cận duy nhất nào

có thể phù hợp cho tất cả các yêu cầu của

MDM đa miền ở mọi tổ chức, doanh nghiệp

Như đã trình bày ở Bảng 5, có nhiều yếu

tố ảnh hưởng đến việc xác định miền dữ liệu của một tổ chức có cần đến MDM hay không, riêng một miền dữ liệu cũng đã đòi hỏi nhiều công nghệ để vận hành Hơn nữa việc triển khai MDM không chỉ đơn thuần chỉ là thêm một ứng dụng mới mà có thể sẽ ảnh hưởng đến các dữ liệu quan trọng đang được lưu trữ trong các hệ thống hiện có Từ góc độ công nghệ, hiện nay không có giải pháp duy nhất nào có thể đồng thời thỏa mãn các yêu cầu của các tổ chức, doanh nghiệp Do đó, khi đánh giá các sản phẩm MDM đa miền, cần phải hiểu những gì nhà cung cấp mang lại cho doanh nghiệp

MDM đa miền có thể phát triển từ nhiều tình huống khác nhau có thể xảy ra trong doanh nghiệp, vì vậy khó có một chiến lược hoặc kế hoạch toàn diện nào cho các

tổ chức, doanh nghiệp Chẳng hạn trong Ngân hàng X bộ phận Telesales sau khi gọi điện cho khách hàng A tư vấn về sản phẩm bảo hiểm thì họ được khách hàng này phản hồi là đã từng đến giao dịch tại chi nhánh

Sô' 229- Tháng 6 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 81

Ngày đăng: 10/03/2024, 20:09

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w