You are on page 1of 15

Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu

cho các tổ chức doanh nghiệp

Ngô Thùy Linh - Phan Thanh Đức


Khoa Hệ thống thông tin quản lý, Học viện Ngân hàng

Ngày nhận: 17/05/2021


Ngày nhận bản sửa: 26/05/2021
Ngày duyệt đăng: 25/06/2020

Tóm tắt: Dữ liệu ngày nay đã trở thành một trong những tài sản quan trọng của các
tổ chức, doanh nghiệp. Tuy nhiên, thách thức đặt ra với các nhà quản lý là làm thế
nào để có thể khai thác, sử dụng và quản lý dữ liệu một cách hiệu quả và thông minh
khi có quá nhiều nguồn dữ liệu bên trong và bên ngoài tổ chức. Giải pháp quản lý
dữ liệu chủ đa miền dựa vào việc quản lý tổng thể dữ liệu trên đa miền sẽ giúp các
tổ chức có cái nhìn thống nhất và chính xác về các thực thể quan trọng, từ đó cung
cấp các thông tin tài chính phù hợp, đáng tin cậy. Bài báo này tập trung làm rõ các
khái niệm, tầm quan trọng của việc quản lý dữ liệu chủ đa miền và một số cách tiếp
cận khi xây dựng quản lý dữ liệu chủ đa miền.
Từ khóa: Dữ liệu chủ, Quản trị dữ liệu chủ, Quản lý dữ liệu chủ đa miền

Multi-domain master data management: improving data governance for enterprises


Abstract: Today data has become one of the important assets of organizations and businesses.
However, one challenge faced by managers is how to effectively and intelligently exploit, use and
manage data when the organization is exposed to a large number of both internal and external data
sources. A multi-domain master data management solution based on the overall management of data
across multiple domains will help organizations develop a unified and accurate view of important
entities, thereby providing suitable and reliable financial information. This article attempts to clarify
the concepts and the importance of multi-domain master data management, and propose feasible
approaches when building multi-domain master data management.
Keywords: Master Data, Master Data Management, Multi-Domain Master Data Management

Ngo, Thuy Linh


Email: linhnt@hvnh.edu.vn
Phan, Thanh Duc
Email: ducpt@hvnh.edu.vn
Organization of all: Faculty of Management Information System, Banking Academy of Vietnam

Tạp chí Khoa học & Đào tạo Ngân hàng © Học viện Ngân hàng
Số 229- Tháng 6. 2021 72 ISSN 1859 - 011X
NGÔ THÙY LINH - PHAN THANH ĐỨC

1. Đặt vấn đề 2. Dữ liệu chủ và miền dữ liệu

Một khảo sát của Gartner (2019) cho thấy Mỗi một miền dữ liệu phản ánh đến một
rằng chất lượng dữ liệu kém đã dẫn đến chi tập các thực thể quan trọng mà các tổ chức,
phí của các tổ chức tăng lên tới 11,8 triệu doanh nghiệp thường quan tâm như: tập các
USD. Một trong những nguyên nhân dẫn khách hàng, các sản phẩm, các nhà cung
đến chất lượng dữ liệu kém là chưa tích hợp cấp, các nhân viên, tài chính, chính sách...
được thông tin từ các nguồn dữ liệu khác (Mark Allen & Dalton Cervo, 2015). Trong
nhau trong tổ chức. Nhiều tổ chức hiện mỗi miền dữ liệu có thể có một hoặc nhiều
nay đã nhận ra giá trị và tầm quan trọng thực thể, thực thể có thể là một đối tượng,
của việc quản lý dữ liệu chủ (Master Data cá nhân, đơn vị, địa điểm... phải là duy nhất
Management- MDM) và coi MDM là một trong một miền nhất định và thường có
giải pháp cho thách thức này. Các tổ chức các thuộc tính kèm theo. Ví dụ, trong miền
thường bắt đầu triển khai MDM và dừng Khách hàng, một doanh nghiệp đối tác
ở việc tập trung vào một miền dữ liệu (a hoặc một cá nhân có hợp đồng với doanh
data domain), sau đó mới mở rộng đến các nghiệp có thể được coi là một thực thể,
miền khác trong mô hình quản lý dữ liệu đa mỗi thực thể khách hàng có một số thuộc
miền (a multi- domain model). Trong quá tính như: họ tên, số điện thoại, e-mail, giới
trình thực hiện, hầu hết các tổ chức gặp một tính... Tùy vào từng loại hình, lĩnh vực kinh
số khó khăn trong việc thực hiện đầy đủ doanh của từng tổ chức mà có các miền dữ
và nhất quán các mục tiêu quản trị dữ liệu liệu với các thực thể khác nhau. Chẳng hạn
chủ trên nhiều miền (Mark Allen & Dalton có một số miền dữ liệu tương ứng với từng
Cervo, 2015). Sự khó khăn này bắt nguồn lĩnh vực như sau:
từ việc không có cái nhìn tổng thể về các - Lĩnh vực sản xuất: Khách hàng, Sản phẩm,
thành phần, chức năng và cả các dịch vụ để Nhà cung cấp, Nguyên vật liệu, Địa điểm...
có thể quản trị dữ liệu chủ một cách chính - Lĩnh vực chăm sóc sức khỏe: Bệnh nhân,
xác và hiệu quả. Một số tổ chức nhìn nhận Nhà cung cấp, Sản phẩm, Khiếu nại, Triệu
việc quản trị này về bản chất chỉ là việc tích chứng lâm sàng, Bảo hiểm...
hợp dữ liệu đơn thuần. Đây sẽ trở thành - Lĩnh vực tài chính: Khách hàng, Tài
một sai lầm khi các dữ liệu theo thời gian khoản, Sản phẩm, Địa điểm, Bảo hiểm...
ngày càng trở nên đa dạng và phức tạp, bởi - Lĩnh vực giáo dục: Sinh viên, Khoa bộ
vì ngoài việc tích hợp dữ liệu thì tổ chức môn, Địa điểm, Tài liệu, Khóa học...
còn cần phải đưa ra các trách nhiệm của Trên thực tế, mức độ ưu tiên về dữ liệu của
bộ phận, phòng ban đối với dữ liệu và cần các thực thể là khác nhau, dữ liệu nào có
phải quan tâm đến việc quản lý chất lượng mức độ ưu tiên cao sẽ được lưu trữ trong
dữ liệu để có thể tiếp cận thành công quản vùng bộ nhớ được truy cập nhanh hơn,
trị dữ liệu trên nhiều miền. Phần tiếp theo trong hệ tài nguyên tốt hơn, quan tâm về
của bài báo sẽ trình bày các vấn đề có liên chất lượng dữ liệu của thực thể đó hơn, có
quan đến dữ liệu chủ, miền dữ liệu, quản cơ chế kiểm soát chất lượng dữ liệu tốt hơn.
lý dữ liệu chủ, dữ liệu chủ đa miền và một Do đó khái niệm “Dữ liệu chủ” (Master
số cách tiếp cận xây dựng quản trị đa miền data) đã ra đời để mô tả, phản ánh đến
nhằm nâng cao việc quản trị dữ liệu cho các những dữ liệu quan trọng cần được quan
tổ chức, doanh nghiệp. tâm nhiều hơn trong tổ chức. Theo John R.
Talburt & Yinle Zhou (2015), dữ liệu chủ

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 73
Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

của một tổ chức được định nghĩa là dữ liệu 2015). Hay dữ liệu chủ là dữ liệu mô tả các
được lưu giữ bởi tổ chức đó, mô tả các thực thực thể lõi của tổ chức với tập các thuộc
thể độc lập và liên quan chính đến các hoạt tính và định danh là nhất quán và chính xác
động của tổ chức. Một định nghĩa khác về (Keith Gordon, 2013).
dữ liệu chủ là dữ liệu mô tả về các thực thể Ví dụ sau đây sẽ mô tả rõ hơn về dữ liệu chủ,
quan trọng đối với các hoạt động và phân dữ liệu về các thực thể khách hàng được lưu
tích của tổ chức, cách dữ liệu này tương tác trữ ở các hệ thống Kinh doanh và Kế toán
và chia sẻ sẽ cung cấp ngữ cảnh cho dữ liệu của công ty X (David Loshin, 2009)
giao dịch (Mark Allen & Dalton Cervo, Các thông tin liên quan đến thực thể khách

Hình 1. Dữ liệu về khách hàng được lưu trữ ở 2 hệ thống khác nhau
Nguồn: David Loshin (2009)

Bảng 1. Dữ liệu chủ miền khách hàng của Hệ thống Kinh doanh
Customer Master Data
ID Cust FirstName MiddleName LastName TelNum Address City
KH002 An Van Le 090234567 25 Ly Thai To Ha Noi

Nguồn: David Loshin (2009)

Bảng 2. Dữ liệu chủ miền khách hàng của Hệ thống Kế toán


Customer Master Data
ID First Last Add City Zip Tel
ID0070 An Le 12 Chua Boc Ha Noi 100000 0909789456

Nguồn: David Loshin (2009)

74 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021
NGÔ THÙY LINH - PHAN THANH ĐỨC

hàng được lưu trữ ở hai hệ thống này bao - Dữ liệu tham chiếu (Reference Data): Dữ
gồm: liệu thường được mô tả bởi các giá trị được
Hệ thống “Kinh doanh” lưu trữ các thông sử dụng để phân biệt các dữ liệu khác nhau,
tin khách hàng bao gồm: Tên (FirstName), chẳng hạn như phân biệt giữa dữ liệu chủ
Tên đệm (MiddleName), Họ (LastName), và dữ liệu giao dịch.
Số điện thoại (TelNum), Địa chỉ (Address). - Dữ liệu cấu trúc giao dịch (Transaction
Dữ liệu chủ miền khách hàng của hệ thống structure data) đại diện cho những người
Kinh doanh được biểu diễn như ở Bảng 1. tham gia trực tiếp trong một giao dịch,
Hệ thống “Kế toán” lưu trữ các thông tin chẳng hạn như nhà cung cấp, khách hàng
của khách hàng bao gồm: Tên (First), Họ và sản phẩm. Thông tin về một giao dịch
(Last), Địa chỉ (Add), Thành phố (City), không thể được ghi lại trừ khi thông tin chi
Mã bưu chính (ZIP), Số điện thoại (Tel). tiết của những người tham gia này đã tồn
Dữ liệu chủ miền khách hàng của hệ thống tại trong cơ sở dữ liệu.
Kế toán được thể hiện ở Bảng 2. - Dữ liệu cấu trúc doanh nghiệp (Enterprise
Các miền dữ liệu cũng như các dữ liệu khác structure data) là dữ liệu mô tả cấu trúc của
bên trong tổ chức đều có thể chia thành 2 doanh nghiệp, ví dụ dữ liệu mô tả về cơ cấu
loại: dữ liệu hoạt động (operational data) tổ chức hoặc cơ cấu tài chính.
và dữ liệu không hoạt động (nonoperational Nếu coi dữ liệu chủ được biểu diễn dưới
data). “Dữ liệu hoạt động” là tập hợp dữ dạng các danh từ của dữ liệu và thông tin
liệu theo thời gian thực để hỗ trợ yêu cầu thì dữ liệu giao dịch là các động từ. Chúng
của tổ chức trong các hoạt động hàng ngày mô tả các hoạt động diễn ra hàng ngày
của họ. “Dữ liệu không hoạt động” thường trong tổ chức, doanh nghiệp như việc bán
được thu thập trong kho dữ liệu với tần suất hàng, doanh số bán hàng, hay các bệnh
ít hơn và được sử dụng cho hệ thống kinh nhân được phép xuất viện hay nhập viên tại
doanh thông minh (Dalton Cervo & Mark bệnh viện...
Allen, 2011). Dữ liệu chủ về bản chất là các Bất kể các miền dữ liệu được xác định như
dữ liệu “không hoạt động”, cụ thể hơn, cấu thế nào, khái niệm dữ liệu chủ cần được
trúc dữ liệu chủ được mô tả ở Hình 2. xác định rõ ràng và phân biệt với các loại
Cấu trúc dữ liệu chủ gồm 3 lớp: dữ liệu dữ liệu khác. Việc xác định dữ liệu chủ phụ
tham chiếu, dữ liệu cấu trúc giao dịch, dữ thuộc quan điểm của từng tổ chức và dựa
liệu cấu trúc doanh nghiệp. vào các thực thể quan trọng trong các miền
dữ liệu của tổ chức đó.

3. Quản lý dữ liệu chủ

Mặc dù được định nghĩa là dữ liệu chủ


nhưng dữ liệu này vẫn có thể được lưu trữ
phân tán ở các hệ thống ứng dụng khác
nhau và do đó có thể dẫn đến các silo thông
tin (các thông tin biệt lập). Điều này phản
ánh một thực trạng tại nhiều doanh nghiệp
là dữ liệu về một thực thể hay dữ liệu chủ
Hình 2. Cấu trúc 3 lớp dữ liệu chủ của một miền dữ liệu được lưu trữ ở nhiều
Nguồn: Keith Gordon (2013) cơ sở dữ liệu khác nhau trong các hệ thống

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 75
Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

khác nhau, nhưng thông tin phản ánh về

Nguồn: Keith Gordon (2013)


chúng lại không đồng nhất.
Việc lưu trữ dữ liệu chủ ở các hệ thống khác
nhau gây khó khăn trong việc tổng hợp,
phân tích và xử lý thông tin. Ví dụ được mô
tả ở Hình 1, rõ ràng với dữ liệu chủ miền
khách hàng được lưu trữ ở hệ thống “Kinh
doanh” và hệ thống “Kế toán” là khác

Hình 3. Mối quan hệ giữa các quy trình nghiệp vụ và dữ liệu chủ
nhau. Thực tế là cùng một thực thể khách
hàng Lê Văn An nhưng thông tin về khách
hàng này được biểu diễn khác nhau ở 2 hệ
thống: hệ thống “Kinh doanh” khách hàng
An Van Le với mã khách hàng là KH002,
có số điện thoại 0902345678, địa chỉ 25 Lý
Thái Tổ, Hà Nội khác với khách hàng An
Le (mã ID0070) trong hệ thống “Kế toán”
với địa chỉ tại 12 Chùa Bộc, Hà nội, có số
điện thoại 0909789456. Mặc dù đây là một
khách hàng duy nhất Lê Văn An, nhưng khi
bộ phận quản lý muốn đưa ra các quyết định
liên quan đến kế hoạch chăm sóc khách
hàng và giới thiệu sản phẩm thì họ không
biết được số điện thoại nào khách hàng hay
sử dụng cũng như địa chỉ mà khách hàng
thường xuyên có mặt ở đâu để có thể thực
hiện các chiến dịch quảng cáo, marketing
sản phẩm,... Vậy thông tin nào chính xác
nhất khi mô tả về dữ liệu chủ miền khách
hàng là vấn đề mà doanh nghiệp cần quan
tâm cũng như có một cái nhìn thống nhất
về dữ liệu chủ khách hàng tại một nơi duy
nhất thay vì thông tin nằm rải rác ở nhiều
hệ thống.
Nhìn rộng hơn, với doanh nghiệp sản xuất
và kinh doanh sản phẩm có nhiều bộ phận
phòng ban thì dữ liệu chủ xuất hiện và được
lưu giữ ở các hệ thống tách biệt nhau như ở
Hình 3 (Keith Gordon, 2013). trữ một cách rời rạc ở các hệ thống thông
Như mô tả ở Hình 3, dữ liệu chủ các miền tin được cung cấp bởi các hãng khác nhau
dữ liệu: khách hàng, sản phẩm, phòng ban, như mô tả ở hai ví dụ trên (Hình 1, Hình
nhà cung cấp xuất hiện ở các quy trình 3) sẽ dẫn đến tình trạng: dữ liệu của cùng
trong các bộ phận, phòng ban khác nhau một thực thể trong một miền dữ liệu sẽ
(Bảng 3). rất khác biệt và khi đó chất lượng dữ liệu
Dữ liệu chủ các miền dữ liệu được lưu không được đảm bảo ảnh hưởng đến việc

76 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021
NGÔ THÙY LINH - PHAN THANH ĐỨC

chủ (Keith Gordon, 2013).


Bảng 3. Dữ liệu chủ xuất hiện ở các
hệ thống khác nhau Các định nghĩa này nêu rõ hai thành phần
Được lưu trữ ở các hệ chính của việc quản lý dữ liệu chủ được mô
Dữ liệu chủ tả ở Hình 4.
thống trong các phòng ban
Sản phẩm 8 hệ thống Hai thành phần của MDM: Thành phần
Khách hàng 7 hệ thống
Chính sách (Policies) bao gồm các chính
sách đại diện cho quản trị dữ liệu của MDM,
Phòng ban 3 hệ thống
thành phần Công nghệ (Technologies) bao
Nhà cung cấp 3 hệ thống gồm các công nghệ hỗ trợ MDM. Chính
Nguồn: Keith Gordon (2013) sách xác định các vai trò và trách nhiệm
trong quy trình MDM. Ví dụ: nếu một công
ra quyết định của tổ chức, cùng nhiều vấn ty giới thiệu một sản phẩm mới, các chính
đề khác nữa liên quan đến điều hành, quản sách xác định ai chịu trách nhiệm tạo mục
lý khi chất lượng dữ liệu kém... Chính vì nhập mới trong sổ đăng ký sản phẩm chính,
vậy, cần phải Quản lý dữ liệu chủ (Master các tiêu chuẩn cho tạo định danh sản phẩm,
Data Management- MDM) để đảm bảo những người hoặc bộ phận nào cần được
chất lượng thông tin chính xác nhất cho các thông báo và những hệ thống dữ liệu khác
thực thể quan trọng trong tổ chức. cần được cập nhật. Tuân thủ quy định cùng
Định nghĩa về quản lý dữ liệu chủ của với sự riêng tư và bảo mật thông tin cũng là
David Loshin (2009) cho biết: Quản lý dữ những vấn đề quan trọng (John R. Talburt
liệu chủ là tập hợp các hoạt động quản lý & Yinle Zhou, 2015).
“dữ liệu tốt nhất”, mà có thể điều phối các Thành phần công nghệ của MDM cần xác
bên liên quan chính, những người tham gia định hai việc chính, đó là: Quy trình xác
và khách hàng doanh nghiệp trong việc định thực thể (Entity Resolution Process)
kết hợp với các ứng dụng kinh doanh, các và Quản lý thông tin xác thực thực thể
phương pháp quản lý thông tin và công cụ (Entity Identity Information Management-
quản lý dữ liệu để thực thi các chính sách, EIIM).
thủ tục, dịch vụ và cơ sở hạ tầng hỗ trợ cho - Quy trình xác định thực thể (ER) sẽ xác
việc nắm bắt, tích hợp và sau đó chia sẻ định các thực thể quan trọng trong tổ chức,
việc sử dụng dữ liệu chủ, đảm bảo dữ liệu quy trình này diễn ra khi hai hệ thống thông
này là chính xác, kịp thời, nhất quán. Một tin đang cùng tham chiếu đến một hoặc
định nghĩa nữa về quản lý dữ liệu chủ “đó là nhiều thực thể trong thế giới thực. Quy trình
khuôn khổ của các quy trình và công nghệ
nhằm tạo ra và duy trì một môi trường có
thẩm quyền, đáng tin cậy, bền vững, chính
xác và an toàn mà có thể mô tả một phiên
bản duy nhất và toàn diện, chính xác của dữ
liệu chủ và các mối quan hệ của nó. Định
nghĩa được đưa ra bởi Gartner (2013): quản
lý dữ liệu chủ là tập các quy tắc dựa trên
công nghệ cho phép các bộ phận nghiệp
vụ và công nghệ thông tin làm việc cùng
nhau để giúp tổ chức có được một phiên Hình 4. Các thành phần của MDM
bản duy nhất và chính xác nhất về dữ liệu Nguồn: John R. Talburt & Yinle Zhou (2015)

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 77
Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

Bảng 4. Dữ liệu chủ miền khách hàng sau khi được quản lý bởi MDM
Customer Master Data
ID First Middle Last TelNum Address City Zip
ID0010 An Van Le 0902345678 12 Chua Boc Ha Noi 100000

Nguồn: David Loshin (2009)

này sẽ “sắp xếp” chọn lọc thông tin về các mảng khách hàng) của doanh nghiệp X
thực thể, xảy ra khi có nhiều nguồn thông mong muốn được lấy thông tin về khách
tin cùng tham chiếu đến tập các thực thể, sẽ hàng một cách chính xác và đảm bảo nhất.
chọn ra thông tin có độ ưu tiên, chính xác Dữ liệu chủ về miền khách hàng sau khi
cao. Ví dụ, một bệnh nhân được đưa vào được quản lý bởi MDM và được biểu diễn
bệnh viện ở các thời điểm khác nhau, mỗi như Bảng 4.
lần ở các khoa khác nhau là khoa nội trú và Miền dữ liệu khách hàng có thực thể khách
ngoại trú. ER sẽ so sánh thông tin nhập viện hàng Lê Văn An (Bảng 4) sau khi được
ở mỗi thời điểm và đưa ra quyết định hồ sơ quản lý bởi MDM có mã định danh ID0010
nhập viện nào cho cùng một bệnh nhân và duy nhất với các thuộc tính: Tên, Đệm,
hồ sơ nào dành cho bệnh nhân khác. Họ, Số điện thoại, Địa chỉ, Thành phố, Mã
- Quản lý thông tin nhận dạng thực thể bưu chính; ngoài thực thể này thì miền dữ
(EIIM) là bộ sưu tập và quản lý thông tin liệu khách hàng còn có nhiều khách hàng
nhận dạng với mục tiêu duy trì tính toàn khác và các đối tác... cũng được quản lý
vẹn danh tính chủ thể theo thời gian (Zhou bởi MDM.
& Talburt, 2011a). Tính toàn vẹn danh tính Như vậy quản lý dữ liệu chủ không chỉ là
thực thể yêu cầu mỗi thực thể phải được mô vấn đề về công nghệ, không chỉ là vấn đề
tả trong một hệ thống là duy nhất. Các thực tích hợp dữ liệu mà còn liên quan đến trách
thể riêng biệt phải được mô tả riêng cho nhiệm quản lý dữ liệu, trách nhiệm của
trong hệ thống (Maydanchik, 2007). Toàn các bộ phận phòng ban liên quan rồi chính
vẹn danh tính chủ thể là một yêu cầu cơ bản sách, chiến lược của tổ chức... Khi tổ chức,
cho các hệ thống MDM. doanh nghiệp triển khai MDM, thì các
Quay trở lại ví dụ mô tả trên Hình 1, sau bộ phận nghiệp vụ và bộ phận công nghệ
khi xác minh với khách hàng tên Lê Văn thông tin làm việc cùng nhau sẽ đảm bảo
An thì bộ phận chăm sóc khách hàng biết được tính đồng nhất, độ chính xác, tính bền
được rằng: ông Lê Văn An có địa chỉ 12 vững của dữ liệu chủ được chia sẻ trong tổ
Chùa Bộc là địa chỉ tạm trú và địa chỉ ở chức đó. Do đó tổ chức cũng tránh được
25 Lý Thường Kiệt là nơi đăng ký địa chỉ các cuộc tranh luận vô tận, tốn thời gian về
thường trú, số điện thoại 0902345678 là việc trả lời câu hỏi “dữ liệu của hệ thống
số điện thoại khách hàng thường xuyên sử trong phòng ban nào là đúng?”, điều này có
dụng. Do đó mọi giao dịch sẽ được thực thể dẫn đến các quyết định kém hiệu quả...
hiện với ông An ở 12 Chùa Bộc, liên hệ ảnh hưởng tới chiến lược của tổ chức.
qua số điện thoại 0902345678. Một số bộ Dữ liệu chủ đa miền
phận, phòng ban (phụ trách liên quan đến Quản lý dữ liệu chủ sẽ cung cấp công cụ

78 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021
NGÔ THÙY LINH - PHAN THANH ĐỨC

Bảng 5. Một số nhân tố xác định các miền cần đến MDM
Giá trị kinh doanh là một yếu tố quan trọng khi quyết định những miền
nào cần phải có MDM. Một lý do tại sao hầu hết các công ty bắt đầu
với MDM khách hàng là vì không ccó gì nghi ngờ giá trị chính xác về
thông tin khách hàng mang lại cho doanh nghiệp. Một phiên bản duy
GIÁ TRỊ KINH DOANH
nhất và chính xác về khách hàng có thể liên quan trực tiếp đến sự
sống còn của một tổ chức. Như vậy, mọi miền cần được đánh giá từ
quan điểm giá trị kinh daonh để xác định lợi ích của việc áp dụng MDM
cho tổ chức đó
Số lượng liên quan trực tiếp đến việc cần thiết có MDM. Nếu một công
ty chỉ có hai hoặc ba đối tác, thì không có khả năng hưởng lợi từ MDM
SỐ LƯỢNG đến miền đối tác. Nhưng với một ví dụ khác, nếu một công ty kinh
doanh với hàng ngàn đại lý, thì việc thực hiện giải pháp MDM cho các
miền đối tác rất có ý nghĩa
Nếu dữ liệu không thay đổi và các tập thuộc tính của dữ liệu liên quan
TÍNH THAY ĐỔI
đến các thực thể không biến đổi thì không cần thiết phải cần đến MDM
Càng nhiều miền có trong một tổ chức thì việc sử dụng MDM càng cần
KHẢ NĂNG DỪNG LẠI thiết để có sự nhất quán, tin cậy, chính xác của các luồng thông tin
trong tổ chức đó.
Độ phức tạp của các thuộc tính và dữ liệu liên quan đến một miền là
cơ sở để thực thi giải pháp MDM. Lấy miền sản phẩm làm ví dụ: Các
ĐỘ PHỨC TẠP sản phẩm trong một công ty có thể rất phức tạp, với số lượng lớn các
thuộc tính liên quan. Từ thực tế đó việc triển khai MDM cho miền sản
phẩm trong công ty là rất lớn
Nguồn:Mark Allen & Dalton Cervo (2015)

và quy trình quản lý dữ liệu chủ, đảm bảo tin một cách hiệu quả cũng như tăng cao
dữ liệu chủ không chỉ nhất quán mà còn khả năng cạnh tranh cho các tổ chức, doanh
chính xác. Quản lý dữ liệu chủ theo miền nghiệp thì các giải pháp MDM đa miền cần
(Master Data Management domain) phản có sự tham gia và cộng tác hiệu quả của bộ
ánh một miền dữ liệu cụ thể mà tại đó việc phận nghiệp vụ chịu trách nhiệm về chất
xác định và kiểm soát dữ liệu chủ được lượng dữ liệu và bộ phận công nghệ thông
tập trung. Trong tổ chức không chỉ có một tin có nhiệm vụ quản trị dữ liệu. MDM đa
miền dữ liệu mà còn nhiều miền dữ liệu miền cần hoạt động như một cầu nối tạo
quan trọng khác nữa, do đó họ không chỉ động lực cho việc cộng tác cho hai bộ phận
tập trung quản lý dữ liệu chủ trên một miền đó trong tổ chức. Điều này dễ hiểu đối với
mà còn hướng tới quản lý trên nhiều miền. tình huống tổ chức doanh nghiệp nào cần
Quản lý dữ liệu chủ đa miền có liên quan chuyển đổi từ cơ sở hạ tầng hệ thống cũ
đến việc quản lý tổng thể dữ liệu chủ trên sang hệ thống mới đòi hỏi phải có các yêu
nhiều miền. Vậy liệu tất cả các miền có cần cầu liên quan đến bảo mật, quyền riêng tư,
đến MDM, nhân tố nào ảnh hưởng đến việc các quy định, chính sách... Để đối mặt và
xác định miền dữ liệu cần MDM tập trung giải quyết được các thách thức này cần có
quan tâm đến? Bảng 5 mô tả một số nhân tố sự kết hợp chặt chẽ giữa các phòng ban
chính trong việc định hướng miền dữ liệu nghiệp vụ và phòng ban công nghệ. Một
cho MDM trong mô hình đa miền. minh họa về giải pháp MDM đa miền được
Để việc quản lý dữ liệu và cung cấp thông mô tả ở Hình 5.

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 79
Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

Hình 5. Giải pháp MDM đa miền


Nguồn:Mark Allen & Dalton Cervo (2015)

Với giải pháp MDM đa miền được mô tả ở liệu chủ. Vì MDM được áp dụng trên nhiều
Hình 5, cần đến 4 bộ phận hỗ trợ cho việc miền, nên các chức năng, các công cụ và
triển khai MDM thành công, đó là: sự hỗ quy trình liên quan tới các miền trở nên dễ
trợ từ cấp điều hành, từ ban chỉ đạo, bộ sử dụng hơn. Một số chức năng, chẳng hạn
phận quản lý chương trình, bộ phận quản lý như quản lý chất lượng dữ liệu là vô cùng
các thay đổi và rủi ro. Với mỗi miền dữ liệu rộng. Bởi vì nếu chất lượng dữ liệu của một
1, 2,..., n cần phải bảo đảm chất lượng dữ miền tốt thực sự thì có thể tái sử dụng dữ
liệu, đồng bộ hóa dữ liệu, chính sách quản liệu này trên nhiều miền, nhưng chúng vẫn
lý dữ liệu, quản lý dữ liệu tham chiếu, xác có các yêu cầu cụ thể theo miền cho các
định thực thể, quản lý Đọc- Ghi- Cập nhật- hoạt động như mô tả dữ liệu, làm sạch dữ
Xóa dữ liệu (CRUD). Giải pháp MDM thể liệu, chuẩn hóa dữ liệu...
hiện trên Hình 5 cho thấy một số chức năng Như vậy giải pháp MDM được thiết lập
được dùng chung và có thể được sử dụng để giải quyết các vấn đề: dữ liệu trùng lặp,
bởi nhiều miền dữ liệu. Ví dụ, chương trình phân mảnh, không nhất quán trên nhiều
quản trị dữ liệu có phạm vi và quyền hạn nguồn. Các hệ thống thông tin thường sẽ
rộng hơn, không chỉ tập trung vào dữ liệu hỗ trợ một nghiệp vụ cụ thể và khi đó dữ
chủ. Tương tự, việc bảo mật dữ liệu có thể liệu chủ yếu duy trì cho nghiệp vụ này. Có
sẽ tập trung vào các chính sách và quản lý rất ít sự kết nối dữ liệu giữa các hệ thống
liên quan đến truy cập dữ liệu và bảo vệ dữ với nhau vì thiếu quy trình tổng thể trong

80 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021
NGÔ THÙY LINH - PHAN THANH ĐỨC

Hình 6. Các chức năng của MDM đa miền


Nguồn:Mark Allen & Dalton Cervo (2015)

tổ chức. Và hệ quả là dữ liệu có chất lượng tố ảnh hưởng đến việc xác định miền dữ
kém, không chính xác bởi vì có nhiều nguồn liệu của một tổ chức có cần đến MDM hay
thông tin cùng mô tả, đại diện cho một thực không, riêng một miền dữ liệu cũng đã đòi
thể. MDM sẽ đóng vai trò hỗ trợ thiết lập hỏi nhiều công nghệ để vận hành. Hơn nữa
và quản lý các luật để xác định các thành việc triển khai MDM không chỉ đơn thuần
phần dữ liệu chung, được sử dụng để khớp chỉ là thêm một ứng dụng mới mà có thể sẽ
các thực thể từ nhiều nguồn, cũng như đưa ảnh hưởng đến các dữ liệu quan trọng đang
các kỹ thuật để làm sạch và củng cố thông được lưu trữ trong các hệ thống hiện có. Từ
tin từ các nguồn đó. Từ đó tạo ra một phiên góc độ công nghệ, hiện nay không có giải
bản duy nhất và chính xác nhất về thực thể. pháp duy nhất nào có thể đồng thời thỏa
Hình 6 biểu diễn các chức năng của MDM mãn các yêu cầu của các tổ chức, doanh
đa miền như: quản trị dữ liệu, quản trị chất nghiệp. Do đó, khi đánh giá các sản phẩm
lượng dữ liệu, đồng bộ và tích hợp dữ liệu, MDM đa miền, cần phải hiểu những gì nhà
quản lý dữ liệu tham chiếu, bảo mật dữ cung cấp mang lại cho doanh nghiệp.
liệu, kiến trúc dữ liệu.... MDM đa miền có thể phát triển từ nhiều
tình huống khác nhau có thể xảy ra trong
4. Một số cách tiếp cận xây dựng dữ liệu doanh nghiệp, vì vậy khó có một chiến
chủ đa miền lược hoặc kế hoạch toàn diện nào cho các
tổ chức, doanh nghiệp. Chẳng hạn trong
Không có một cách tiếp cận duy nhất nào Ngân hàng X bộ phận Telesales sau khi gọi
có thể phù hợp cho tất cả các yêu cầu của điện cho khách hàng A tư vấn về sản phẩm
MDM đa miền ở mọi tổ chức, doanh nghiệp. bảo hiểm thì họ được khách hàng này phản
Như đã trình bày ở Bảng 5, có nhiều yếu hồi là đã từng đến giao dịch tại chi nhánh

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 81
Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

Y của ngân hàng đó và cũng đã được tư liệu, cụ thể là làm sạch dữ liệu, chuẩn hóa
vấn tại quầy giao dịch nhiều lần, gói bảo dữ liệu, củng cố và gia tăng thông tin đầu ra.
hiểm này được gọi với tên gọi khác nhưng Cách tiếp cận này được gọi là MDM phân
thực chất vẫn chỉ là một sản phẩm. Hiện tích, với mục đích chính là cải thiện phân
tại khách hàng A vẫn chưa muốn sử dụng tích, báo cáo và kinh doanh thông minh hỗ
sản phẩm này và khách hàng này rất không trợ đưa ra các quyết định chính xác phù hợp
hài lòng nếu nhân viên Telesales của ngân với chiến lược của tổ chức, doanh nghiệp.
hàng X gọi điện làm phiền thêm lần nữa. Hình 7 mô tả một MDM đa miền phân tích.
Do đó, cần phải đồng nhất thông tin khách Theo cách tiếp cận MDM kiểu phân tích
hàng và sản phẩm cũng như lịch sử giao được trình bày ở Hình 7, thì trung tâm quản
dịch tại mọi điểm tiếp xúc để tránh mất trị dữ liệu chủ đa miền (MDM hub, hay
thời gian của cả nhân viên và khách hàng trung tâm MDM) có nhiều cách khác nhau
cũng như tránh được việc tư vấn sản phẩm để quản lý dữ liệu từ các hệ thống nguồn.
không đúng người, không đúng thời điểm. Cụ thể là:
Tình huống phát sinh này cho thấy cần thiết - Kiểu tích hợp ảo
phải quản lý dữ liệu chủ miền khách hàng - Kiểu bền vững
và miền sản phẩm. - Kiểu kết hợp
Một số nơi triển khai MDM từ các nguồn Kiểu 1: MDM đa miền kiểu tích hợp ảo
dữ liệu phái sinh, không phải trực tiếp từ Trong cách tiếp cận này, MDM hub duy trì
các hệ thống nguồn lưu trữ dữ liệu giao dịch tập các thông tin tối thiểu cần thiết để xác
hàng ngày của tổ chức. Trong trường hợp định dữ liệu liên quan đến một thực thể và
này, việc triển khai MDM thường bắt đầu thông tin để biết thực thể đó được lưu trữ ở
với việc thiết lập kho dữ liệu để tận dụng đâu trong các hệ thống nguồn. MDM hub
các khả năng tích hợp dữ liệu từ các nguồn duy trì dữ liệu định danh và các trường dữ
hiện có. Đồng thời nâng cao chất lượng dữ liệu chính của các hệ thống nguồn. Tất cả

Hình 7. MDM đa miền phân tích


Nguồn:Mark Allen & Dalton Cervo (2015)

82 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021
NGÔ THÙY LINH - PHAN THANH ĐỨC

Hình 8. MDM đa miền kiểu tích hợp ảo


Nguồn:Mark Allen & Dalton Cervo (2015)

Hình 9. MDM đa miền kiểu bền vững


Nguồn:Mark Allen & Dalton Cervo (2015)

các dữ liệu khác liên quan đến một thực thực thể. Do vậy trung tâm MDM trở thành
thể được lưu giữ tại các nguồn tương ứng một nguồn tập trung dữ liệu chính xác và
của chúng để tránh việc bị trùng lặp trong duy nhất, và từ đó sẽ cung cấp các thuộc
MDM hub. Về bản chất, MDM hub hỗ trợ tính dữ liệu quan trọng cho các hệ thống
để xác định một phiên bản của thực thể tại ứng dụng khác. Theo giải pháp này, giả
nhiều nguồn dữ liệu của các phân hệ nghiệp định ban đầu trung tâm MDM sẽ cập nhật
vụ có liên quan. Do đó trung tâm MDM chỉ dữ liệu các thực thể từ nhiều nguồn. Sau
đơn giản là một hệ thống tham chiếu đến đó, dữ liệu về các thực thể sẽ được tạo ra
các nguồn dữ liệu nguồn khác nhau. Hình và duy trì lưu trữ trong trung tâm MDM và
8 mô tả một triển khai MDM đa miền kiểu được sử dụng bởi các ứng dụng khác. Mô
tích hợp ảo. hình triển khai này cần có một kiểu thiết kế
Kiểu 2: MDM kiểu bền vững kiến trúc kết hợp phức tạp cao, và đây cũng
Với cách tiếp cận này, trung tâm MDM sẽ là hạn chế vì có thể yêu cầu thay đổi lớn
lưu trữ tất cả các trường thuộc tính của một đối với các ứng dụng hiện có để truy cập

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 83
Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

Hình 10. MDM đa miền kiểu kết hợp


Nguồn:Mark Allen & Dalton Cervo (2015)

dữ liệu từ trung tâm MDM thay vì dữ liệu ở các phòng ban, và xác định chương trình
được duy trì cục bộ. Hình 9 mô tả một kiến quản lý nào đang được thực hiện. Không
trúc kiểu bền vững. xem xét đầy đủ các yêu cầu này sẽ dẫn
Kiểu 3: MDM kiểu kết hợp đến tình trạng: các chương trình hiện có
Cách tiếp cận này kết hợp giữa MDM kiểu ảnh hưởng, tác động qua lại lẫn nhau và
tích hợp và kiểu bền vững để khắc phục liên quan đến các điều chỉnh ưu tiên. Các
những hạn chế của hai mô hình đó. Trong phòng ban nghiệp vụ và bộ phận giao dịch
kiểu kết hợp, không chỉ các trường thuộc là những nơi tạo lập và sử dụng thường
tính định danh được lưu trữ trong trung tâm xuyên dữ liệu chủ. Khi đó có thể các giao
MDM, mà một bản sao của nhiều thuộc dịch sẽ cần đến dữ liệu chủ từ nhiều miền,
tính liên quan đến một thực thể cũng được chẳng hạn miền kế hoạch thực hiện và đơn
duy trì tại đó sẽ tăng tốc truy vấn đến trung đặt hàng có thể có tác động đáng kể đến các
tâm MDM. Ngoài ra, vì thông tin là bản sao hoạt động kinh doanh ở bộ phận bán hàng
nên các hệ thống hiện tại có thể tiếp tục sử và marketing. Có thể bước đầu ​​MDM được
dụng phiên bản dữ liệu của riêng mình. Do thực hiện thành công sẽ mang lại nhiều lợi
đó với cách tiếp cận này, trung tâm MDM ích cho hoạt động doanh nghiệp và các hoạt
là một hệ thống tham chiếu, tích hợp từ động phân tích, nhưng cũng kéo theo các
nhiều nguồn, và áp dụng quy trình xác định thay đổi về dữ liệu và quy trình có thể bị
các thực thể và các chức năng đảm bảo chất gián đoạn nếu như chúng không được quản
lượng dữ liệu và cung cấp một phiên bản lý tốt. Báo giá, đơn đặt hàng, yêu cầu, thanh
chính xác duy nhất về dữ liệu chủ. Hình 10 toán, và cung cấp dịch vụ liên quan đến các
trình bày mô hình MDM đa miền kết hợp. quy trình chính có thể dễ bị gián đoạn khi dữ
Khi tổ chức lên kế hoạch thực hiện giải liệu chủ thay đổi phụ thuộc vào ​​MDM. Và
pháp MDM đa miền, cần phải có đủ thời tất nhiên, nếu không được xử lý tốt, những
gian để tìm hiểu các cách tiếp cận triển khai thay đổi đó có thể ảnh hưởng tiêu cực đến
MDM, cũng như kiểm tra sự ảnh hưởng, tác sự hài lòng và lòng trung thành của khách
động qua lại của các nghiệp vụ kinh doanh hàng do đó có thể ảnh hưởng đến lợi nhuận

84 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021
NGÔ THÙY LINH - PHAN THANH ĐỨC

của công ty và trở thành một vấn đề không chức, doanh nghiệp đạt được mục tiêu cũng
mong muốn. Như vậy khi tiến hành quản lý như lợi thế cạnh tranh trên thị trường.
tất cả các miền dữ liệu với giải pháp MDM Đối với các doanh nghiệp quy mô lớn,
đa miền, điều quan trọng là phải kiểm kê, chẳng hạn các ngân hàng thương mại thì
đánh giá các quy trình nghiệp vụ, khu vực MDM là một giải pháp không thể thiếu nếu
tiêu dùng và vòng đời của dữ liệu chủ. Giải muốn quản lý được các nguồn dữ liệu lớn,
pháp MDM đa miền cần phải là cầu nối tạo đa dạng và thường xuyên biến động. Các
ra sự cộng tác giữa các bộ phận có trách ngân hàng đã có đến hàng triệu khách hàng
nhiệm liên quan và các bộ phận đóng vai tiềm năng và có số vốn tài chính lớn. Hoạt
trò trực tiếp trong quản lý dữ liệu thông qua động tại các ngân hàng có liên quan đến
các phòng ban nghiệp vụ cũng như phòng nhiều doanh nghiệp, quản lý hàng triệu tài
ban công nghệ thông tin. khoản và vô số sản phẩm tài chính, xử lý
giao dịch với hàng ngàn đại lý và duy trì
5. Kết luận mối quan hệ với hàng ngàn nhà cung cấp và
các công ty khác (ví dụ: nhà đấu giá, công
Dữ liệu là một tài sản của tổ chức, dữ liệu ty thẩm định, phá sản, tòa án và ủy thác, và
chủ là chìa khóa cho hoạt động kinh doanh, các cơ quan thu nợ). Các ngân hàng cũng
đòi hỏi cần phải có sự quản lý thích đáng. sở hữu hoặc sử dụng dịch vụ của các công
MDM là giải pháp cho việc quản lý dữ ty bảo hiểm, giao dịch với hàng ngàn luật
liệu, tuy nhiên MDM không chỉ là vấn đề sư đại diện cho họ hoặc khách hàng khi xảy
công nghệ, mà còn liên quan đến khả năng ra tranh chấp, và thuê hàng ngàn nhân viên.
quản trị và ảnh hưởng đến các quy trình Với những mô tả đó thì có thể xác định vô
kinh doanh của doanh nghiệp. Phạm vi số các miền dữ liệu mà một ngân hàng cần
của MDM khá lớn do nó là sự tích hợp của phải có: triển vọng, khách hàng, phương
các thành phần, các chức năng và dịch vụ tiện, nhà sản xuất, tài khoản tài chính, sản
cần thiết để tạo, duy trì và quản lý, chia sẻ phẩm tài chính, đại lý, liên hệ, nhà cung
các dữ liệu quan trọng. Bên cạnh đó, việc cấp, luật sư và nhân viên... Rõ ràng là khối
lập kế hoạch cho một chương trình MDM lượng thông tin lớn thì số lượng thuộc tính
đa miền cho tổ chức, doanh nghiệp trên và các hệ thống dữ liệu duy trì tất cả thông
thực tế gặp nhiều thách thức. Chiến lược tin sẽ lớn và phức tạp. Các ngân hàng sẽ
và cách tiếp cận phù hợp chỉ ra rằng đó là hưởng lợi ích từ giải pháp MDM đa miền
cơ sở thích hợp để hoàn thiện đầy đủ, thực khi loại trừ được các vấn đề về dư thừa
hiện thành công các chiến lược và mục tiêu dữ liệu và sự không nhất quán trên nhiều
MDM trên toàn doanh nghiệp. Đây là chìa nguồn dữ liệu. Vì vậy với tổ chức doanh
khóa để cung cấp dữ liệu đáng tin cậy kịp nghiệp có quy mô lớn như các ngân hàng
thời để giúp doanh nghiệp đạt được lợi thế rất thích hợp để triển khai MDM.
cạnh tranh. Bài báo đã trình bày khái niệm cơ bản của
Trong MDM đa miền, điều quan trọng là dữ liệu chủ, quản lý dữ liệu chủ, dữ liệu chủ
phải xác định: nên sử dụng cách tiếp cận đa miền, và các cách tiếp cận để xây dựng
MDM nào phù hợp với các thành phần, quản trị dữ liệu chủ đa miền. Từ đó, chỉ
chức năng và dịch vụ trên các miền dữ liệu. ra vai trò và tầm quan trọng của việc quản
Hơn thế nữa, sự cộng tác chặt chẽ giữa trị dữ liệu chủ đa miền trong các tổ chức,
các bộ phận kinh doanh, nghiệp vụ và bộ doanh nghiệp hiện nay. Việc xây dựng và
phận công nghệ thông tin sẽ thúc đẩy các tổ quản trị dữ liệu chủ đa miền đã góp phần

Số 229- Tháng 6. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 85
Quản trị dữ liệu chủ đa miền: nâng cao quản trị dữ liệu cho các tổ chức doanh nghiệp

nâng cao quản trị rủi ro cho doanh nghiệp,


giúp doanh nghiệp có cái nhìn chính xác
nhất về các thực thể quan trọng trong hoạt
động kinh doanh để kịp thời đưa ra các
quyết định mang tính chiến lược trong bối
cảnh của cách mạng công nghiệp 4.0 đang
diễn ra mạnh mẽ như hiện nay. ■

Tài liệu tham khảo


David Loshin, 2009, “Master Data Management”, Elsevier Inc.
Dalton Cervo & Mark Allen, “Master data management in practice”, 2011, John Wiley & Sons, Inc.
Gartner, 2019, “How to Get Started With Master Data Management”.
John R. Talburt, Yinle Zhou, 2015, “Master Data Management and Information Integration”, Elsevier Inc.
Keith Gordon, 2013, “Principles of data management”, BCS Learning and Development Ltd.
Mark Allen & Dalton Cervo, 2015, “Multi - Domain Master Data Management”, Elsevier Inc.
Maydanchik, A., 2007. “Data Quality Assessment”. Technics Publications.
Zhou, Y., Talburt, J.R., 2011a. “Entity identity information management”. International Conference on Information
Quality 2011.

86 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 229- Tháng 6. 2021

You might also like