Chúng ta hoàn toàn không th tránh s thay i.. Nh ng quy t nh này cung c p giá tr và tác ng kinh doanh mà có th phân b cho kho ch a... Công nghi p sau này ôi khi c p mô hình 3NF nh các mô
Trang 2I C M N
Tr c h t, em xin g i t i toàn th các th y cô Khoa Công ngh thông tin l i chúc s c kho và l i c m n sâu s c
Trong su t th i gian h c t p t i tr ng i h c L c H ng v i s t n tình truy n t ki n th c c a th y cô ã giúp cho em có m t s ki n th c c b n và các
ph ng pháp h c t p, nghiên c u khoa h c hi u qu em có s t tin h n trong công vi c và các công tác nghiêu c u khoa h c sau này
Em xin t lòng bi t n sâu s c n th y PGS.TS Phúc ã t n tình h ng
n em trong vi c th c hi n lu n v n này và kính chúc th y cùng gia ình luôn
nh kh e, thành công trong công vi c và t nhi u thành t u trong các công trình nghiên c u khoa h c c a mình
Em xin trân tr ng c m n !
Trang 4C L C
I C M N i
I CAM OAN ii
C L C iii
DANH M C CÁC T VI T T T iv
DANH M C B NG v
DANH M C HÌNH NH vi
GI I THI U 1
CH NG 1: M U 3
1.1 Lý do th c hi n tài 3
1.2 M c tiêu nghiên c u 4
1.3 Ph m vi nghiên c u 4
1.4 Ph ng pháp th c hi n 4
1.5 Tóm t t k t qu t c 5
CH NG 2: C S LÝ THUY T 6
2.1 Lý thuy t v kho d li u 6
2.1.1 nh ngh a và các c m c a kho d li u 6
2.1.2 M c tiêu c a kho d li u 9
2.1.3 Các thành ph n c a m t kho d li u 12
2.1.4 Mô hình d li u và vi c thi t k kho d li u 16
2.2 Lý thuy t v m i quan h khách hàng 30
2.2.1 N n t ng qu n lý quan h khách hàng 30
2.2.2 Qu n lý quan h khách hàng và qu n tr thông minh 32
2.2.3 Kho d li u khách hàng 34
2.2.4 Qu n tr thông minh v i s th a mãn c a khách hàng 35
CH NG 3: THI T K VÀ XÂY D NG KHO D LI U VÀ I QUAN H KHÁCH HÀNG 37
3.1 Thi t k ch c n ng cho h th ng qu n lý quan h khách hàng 38
3.2 Thi t k CSDL cho kho d li u 39
3.2.1 Thi t k kh i d li u Product Sales 39
3.2.2 Thi t k kh i d li u Communication Subscription 45
3.3 N p d li u cho kho d li u 48
3.4 T o truy v n phát sinh d li u cho kho d li u 57
CH NG 4: CÀI T VÀ KHAI THÁC KHO D LI U 58
4.1 Vi t ch ng trình t o form nh p li u 58
4.2 Xây d ng ng d ng khai thác d li u t kho d li u 61
4.3 Ch y ch ng trình và phân tích k t qu 64
T LU N VÀ H NG TÌM HI U NÂNG CAO 74 TÀI LI U THAM KH O
PH L C
Trang 5DANH M C CÁC T VI T T T
4GL : Fourth-Generation Languages / Ngôn ng th h th t
ASP : Application Support Provider / Nhà cung c p d ch v h tr ng d ng
BI : Business Intelligence / Qu n tr thông minh
CET : Current Extraction Time / Th i m trích xu t d li u hi n th i
CRM : Customer Relationship Management / Qu n lý quan h khách hàng
CSDL : C s d li u
DASD : Direct Access Storage Device / Thi t b l u tr truy c p tr c ti p
DBMS : Database Management System / H th ng qu n tr CSDL
DDS : Dimentional Data Store / L u tr d li u chi u
DIS : Data Item Set / Mô hình quan h c p trung
DN : Doanh nghi p
DSS : Decision Support System / H th ng h tr ra quy t nh
DW : Data Warehouse / Kho d li u
ETL : Extract, Transform, Load / Trích xu t, chuy n i và n p d li u
ER : Entity Relationship / Quan h th c th
ERD : Entity Relationship Level / M c quan h th c th
ERP : Enterprise Resource Planning / Ho ch nh ngu n l c DN
IT : Information Technology / Công ngh thông tin (CNTT)
LSET : Last Successful Extraction Time / Th i m trích xu t d li u thành công
cu i cùng MIS : Management Information Systems / H th ng thông tin qu n lý
NF : Normal Form / Chu n hóa d li u
ODS : Operational Data Store / L u tr d li u u hành
OLAP : Online Analytical Processing / X lý phân tích tr c tuy n
OLTP : Online Transaction Processing / X lý giao d ch tr c tuy n
PC : Personal Computer / Máy tính cá nhân
RSS : Really Simple Syndication (RSS 2.0.0) / là nh d ng d li u d a theo
chu n XML dùng trong vi c chia s tin t c Web
SCM : Supply Chain Management / Qu n lý chu i cung ng
SOA : Service-Oriented Architecture / Ki n trúc h ng d ch v
Trang 6DANH M C B NG
ng 2.1 Các khía c nh ch y u c a CRM 31
ng 3.1 Các ch c n ng c a h th ng qu n lý quan h khách hàng 38
ng 3.2 Thi t k chi ti t cho b ng s ki n Product Sales 41
ng 3.3 Thông tin mô t b ng chi u d li u dim_Date 42
ng 3.4 Thi t k chi ti t cho b ng chi u d li u dim_Date 42
ng 3.5 Thi t k chi ti t cho b ng chi u d li u dim_Product 43
ng 3.6 Thi t k chi ti t cho b ng chi u d li u dim_Customer 43
ng 3.7 Thi t k chi ti t cho b ng chi u d li u dim_Store 44
ng 3.8 D li u m u cho b ng s ki n Communication Subscription 46
ng 3.9 Thi t k chi ti t cho b ng s ki n Communication Subscription 46
ng 3.10 Thi t k chi ti t cho b ng chi u d li u dim_Communication 47
ng 3.11 Thi t k chi ti t cho b ng chi u d li u dim_Subscription_Status 47
ng 3.12 Thi t k chi ti t cho b ng chi u d li u dim_Channel 47
Trang 7DANH M C HÌNH NH
Hình 2.1 Các thành ph n c a kho d li u 12
Hình 2.2 B ng s ki n 15
Hình 2.3 B ng chi u d li u 15
Hình 2.4 Chuy n d li u t h th ng u hành sang môi tr ng kho d li u không ch n thu n là vi c trích xu t d li u 17
Hình 2.5 D li u t các ng d ng khác nhau c c k r i r c 18
Hình 2.6 Chuy n i d li u t các h th ng hi n t i sang môi tr ng kho d li u m t cách h p lý thì nó s c tích h p 19
Hình 2.7 Các th c th và các m i quan h 20
Hình 2.8 M i th c th trong mô hình ERD s c xác nh b ng mô hình DIS 20
Hình 2.9 Các quan h trong ERD s c ph n ánh b ng các k t n i trong DIS 21
Hình 2.10 Các u vào c a b ng c trình bày b ng hai giao tác 21
Hình 2.11 Các y u t thi t k liên quan n hi u su t 22
Hình 2.12 Môi tr ng c ghi d li u 22
Hình 2.13 Mô hình d li u hai chi u n gi n - các th c th là ngang hàng 24
Hình 2.14 Mô hình d li u ba chi u cho th y r ng các th c th là không ngang hàng v i nhau 24
Hình 2.15 Mô hình k t n i hình sao n gi n v i th c th N HÀNG c tính toán nhi u nh t và các th c th khác k t n i vào 25
Hình 2.16 Trong nhi u tr ng h p, b ng s ki n t ng h p c tính toán b i li u d ng s và khóa ngo i trong khi b ng chi u d li u c tính toán b ng d li u ký t 26
Hình 2.17 Mô hình k t n i hình bông tuy t n gi n v i th c th KHÁCH HÀNG k t n i v i th c th QU C GIA 27
Hình 2.18 Kh i OLAP trong mô hình kho d li u 28
Hình 2.19 Cách ti p c n ETL v i t ng d li u trung gian 29
Hình 2.20 Cách ti p c n ETL không có t ng d li u trung gian 29
Trang 8Hình 2.21 Cách ti p c n ELT cho phép vi c chuy n i d li u trên máy ch
kho d li u 30
Hình 2.22 Mô hình qu n tr thông minh 34
Hình 3.1 L u các b c ti n hành thi t k và khai thác kho d li u 38
Hình 3.2 B ng s ki n và chi u d li u cho kh i d li u Product Sales 40
Hình 3.3 L c hình sao y cho kh i d li u Product Sales 44
Hình 3.4 B ng s ki n và chi u d li u cho kh i d li u Communication Subscription 45
Hình 3.5 L c hình sao y cho kh i d li u Communication Subscription 48
Hình 3.6 T o d án m i cho vi c n p d li u và t o l u d li u 49
Hình 3.7 Ánh x c t d li u gi a h th ng ngu n và kho d li u 49
Hình 3.8 K t qu th c thi d án cho b ng chi u d li u dim_Customer 50
Hình 3.9 K t qu th c thi d án cho b ng chi u d li u dim_Product 51
Hình 3.10 Tác v dòng d li u cho b ng chi u d li u dim_Store 52
Hình 3.11 K t qu th c thi d án cho b ng chi u d li u dim_Store 53
Hình 3.12 L u ki m soát và t tham s cho d án cho b ng s ki n 54
Hình 3.13 L u dòng d li u và vi c ánh x c t d li u cho b ng s ki n 55
Hình 3.14 K t qu vi c n p d li u cho b ng s ki n 56
Hình 4.1 Màn hình chính c a ng d ng nh p li u cho h th ng ngu n 58
Hình 4.2 Màn hình ng nh p ng d ng nh p li u 59
Hình 4.3 Màn hình nh p li u cho danh m c khách hàng 59
Hình 4.4 Màn hình nh p li u cho danh m c s n ph m 60
Hình 4.5 Màn hình nh p li u cho danh m c kho 60
Hình 4.6 Kh i t o d án xây d ng kh i d li u OLAP 61
Hình 4.7 K t n i hình sao trong kh i d li u OLAP 62
Hình 4.8 Ti n trình t o kh i d li u t b ng s ki n và b ng chi u d li u 63
Hình 4.9 Tri n khai thành công kh i d li u OLAP 63
Hình 4.10 Kh i t o d án khai thác kho d li u 64
Hình 4.11 Báo cáo l i nhu n bán hàng theo khách hàng và th i gian 64
Hình 4.12 Doanh thu bán hàng theo th i gian 65
Hình 4.13 Báo cáo chi phí và s l ng mua theo vùng, qu c gia 66
Trang 9Hình 4.14 Báo cáo l i nhu n theo khách hàng và thông tin giao ti p v i khách
hàng 66
Hình 4.15 Báo cáo doanh thu theo s n ph m, khách hàng và th i gian 67
Hình 4.16 Báo cáo doanh thu theo s n ph m, khách hàng và th i gian b ng MS Excel 68
Hình 4.17 Danh sách các tr ng d li u s c ch n cho vi c phân tích d li u 69
Hình 4.18 Bi u v ch tiêu l i nhu n 69
Hình 4.19 Bi u v ch tiêu doanh thu 70
Hình 4.20 Báo cáo doanh thu c a t t c khách hàng 70
Hình 4.21 Báo cáo l i nhu n c a t t c khách hàng n m 2013 71
Hình 4.22 Báo cáo l i nhu n theo th i gian 72
Hình 4.23 Báo cáo l i nhu n theo v trí a lý 72
Hình 4.24 Báo cáo doanh thu d a trên kênh giao ti p 73
Trang 10GI I THI U
Ngày nay, nhu c u m r ng và phát tri n các gi i pháp DW và BI s ngày càng l n m nh, nh t là trong b i c nh kinh t xã h i nh hi n t i s bu c các TC/DN ph i t i u hóa các ho t ng c a mình và a ra quy t nh nhanh chóng, chính xác Gi i pháp DW và BI th ng i chung v i nhau nh là gi i pháp t ng th
ph c v cho quá trình xây d ng m t doanh nghi p thông minh, thông qua vi c t p
p và x lý d li u, a ra các báo cáo, phân tích và d oán theo các góc nhìn a chi u ph c v cho các ho t ng theo dõi và a ra quy t nh c a doanh nghi p Trong ó, DW ch n gi n là vi c h p nh t d li u t nhi u ngu n, c chu n hóa có th khai thác t t, h tr trong vi c a ra các quy t nh mang tính chi n l c và chi n thu t M c ích chính c a DW là luôn cung c p m t hình nh
th ng nh t và chính xác nh t v doanh nghi p t i b t k th i m nào S d ng m t trong các gi i pháp qu n lý kho d li u, doanh nghi p có th khai thác toàn b d
li u c a doanh nghi p mình thay vì tr c ây th ng m t r t nhi u công s c
BI là gi i pháp s d ng các k n ng, qui trình, công ngh , ng d ng h tr
ra quy t nh, các công c BI nâng cao kh n ng tr giúp a ra các quy t nh mang tính chi n l c, chi n thu t và em l i hi u qu trong kinh doanh BI cho phép doanh nghi p hi u bi t v quá kh và d oán t ng lai thông qua ng d ng CNTT có th d dàng ki m soát kh i l ng d li u kh ng l , khai phá tri th c
n có theo nhi u góc nhìn y c a m t doanh nghi p M c ích chính c a BI là
tr cho doanh nghi p ra quy t nh t t h n
th ng BI cung c p các kh n ng tr l i nh ng câu h i quan tr ng b ng cách chuy n m t l ng l n d li u t các h th ng ang ho t ng sang m t nh
ng hi n hành, có th s d ng và d hi u Chúng cung c p thông tin là s n sàng
ra quy t nh BI cho phép phân tích xu h ng hi n t i và t ng lai, c nh báo ngay
p t c các c h i và các v n và cung c p thông tin ph n h i liên t c v tính hi u
qu c a vi c ra quy t nh
Bên c nh s k t h p gi a DW và các ng d ng BI, còn có m t y u t có nh
ng không nh t i thành công c a doanh nhi p, ó là CRM CRM cam k t mang
i l i nhu n áng k cho các t ch c tri n khai nó c v doanh thu và hi u qu cao
Trang 11trong ho t ng s n xu t Chuy n sang nh h ng khách hàng tr ng tâm có th d n
n hi u qu kinh doanh t ng cao và t giá n nh, t ng tr ng doanh thu, gia t ng doanh s bán hàng v i chi phí gi m, c i thi n t su t l i nhu n t khách hàng, gia
ng s th a mãn khách hàng và g n k t lâu dài v i khách hàng Cu i cùng, m i t
ch c u mu n khách hàng trung thành h n, l i nhu n nhi u h n B i vì nó th ng
òi h i m t s u t áng k thu hút khách hàng m i nên chúng ta không th có
kh n ng có nh ng kho n u t này Do v y, m t trong nh ng m c tiêu c a CRM là chuy n i nh ng khách hàng không mang l i l i nhu n thành nh ng khách hàng mang l i l i nhu n [11]
i dung c a lu n v n bao g m các ph n sau:
u: gi i thi u chung v kho d li u, qu n tr thông minh và qu n lý
quan h khách hàng Tình hình ng d ng kho d li u c a các doanh nghi p
i Vi t Nam và vai trò c a quan h khách hàng trong kinh doanh
Ch ng 1: trình bày v các v n chung c a lu n v n nh : lý do th c hi n tài, m c tiêu tài, ph ng pháp th c hi n và k t qu t c
Ch ng 2: trình bày lý thuy t v kho d li u và m i quan h khách hàng
Các c m và vi c thi t k kho d li u; vai tro c a quan h khách hàng
và qu n tr thông minh
Ch ng 3: trình bày vi c thi t k m t kho d li u c th v i vi c thi t các
kh i d li u, vi c n p d li u t h th ng ngu n vào CSDL kho d li u
Ch ng 4: vi t ng d ng n p d li u cho h th ng ngu n và thi t k các d
án khai thác d li u t kho d li u, ng th i ti n hành phân tích d li u ã
c khai thác t kho d li u
t lu n và h ng phát tri n: tóm l c các n i d ng ã c trình bày trong lu n v n và xu t các h ng phát tri n thêm
Tài li u tham kh o: danh sách các tài li u dùng cho vi c tham kh o
hoàn thành bài lu n v n
Ph l c: các n mã l nh c dùng trong quá trình sinh d li u cho kho
li u t h th ng ngu n
Trang 12CH NG 1
U 1.1 Lý do th c hi n tài:
Vi c ng d ng h th ng thông tin h tr ra quy t nh mà trong ó DW là m t thành ph n quan tr ng còn h n ch , ch d ng l i các doanh nghi p l n nh : Ngân hàng (Sacombank, Vietin Bank), Vi n thông (MobiFone), Ch ng khoán (sàn giao
ch ch ng khoán hà N i) (Ngu n: Ngân hàng Nhà N c Vi t Nam) Do ó, xây
ng mô hình DW s giúp doanh nghi p hi u rõ h n v h th ng này và giúp Ban Giám c a ra nh ng quy t nh nhanh chóng, chính xác cho ho t ng s n xu t kinh doanh c a doanh nghi p mình
Theo k t qu nghiên c u c a 2 chuyên gia là Paul Gray và Jongbok Byun,
tr ng Claremont Graduate School, khi tri n khai DW và CRM thành công, doanh nghi p s c h ng r t nhi u l i ích nh :
Có th ti t ki m chi phí ti p c n khách hàng m i (th ng cao h n g p 5-10 n) nh duy trì c m i quan h t t v i khách hàng hi n t i
t c s th a mãn và trung thành c a khách hàng u này r t có l i vì khách hàng trung thành th ng có xu h ng quay tr l i mua và ít quan tâm
i giá c h n khách hàng m i
ng l i nhu n: M t công ty c t ng thêm 5% khách hàng trung thành thì
có th t ng 25% n h n 100% l i nhu n tùy theo các ngành ngh kinh doanh
ng c ng hi u qu ho t ng qu n lý công ty nh h th ng quy trình rõ ràng trong CRM b t bu c các nhân viên (NV) ph i tuân th quy nh v báo cáo tình hình c a t ng b ph n
Sau ây là các l i ích c a vi c tri n khai CRM thành công c thu th p và
ng k t t m t cu c kh o sát r ng rãi c a các nghiên c u CRM g n ây [2]:
i thi n kh n ng h ng m c tiêu khách hàng có l i nhu n
Tích h p các d ch v qua các kênh
i thi n l c l ng bán hàng hi u qu và t n ng su t cao
Trang 13c thù hóa các thông p marketing
Tùy bi n các s n ph m và d ch v
i thi n d ch v khách hàng hi u qu và t n ng su t cao
i thi n v giá c
i lý do ó, tài này s nghiên c u sâu h n v vi c ng d ng kho d li u
và m i quan h khách hàng nh m giúp doanh nghi p có cái nhìn rõ h n v tình hình kinh doanh c a doanh nghi p mình và có nh ng phân tích k t qu kinh doanh thông qua ho t ng mua bán, giao ti p v i khách hàng nh m xây d ng chi n l c khách hàng tr ng tâm t ng hi u qu s n xu t, kinh doanh c a doanh nghi p m t khi doanh nghi p phát tri n và qui mô s n xu t kinh doanh c m r ng
Trang 14ng d ng h qu n tr CSLD SQL Server 2005 xây d ng CSDL kho
li u và m i quan h khách hàng
Vi t mã l nh trên CSLD SQL Server 2005 phát sinh d li u t h
th ng ngu n vào kho d li u
ng d ng b công c Visual Studio 2005 – Business Intelligence Development Studio th c hi n vi c chuy n i, n p d li u t h
th ng ngu n d li u vào kho d li u
Phân tích tình hình kinh doanh c a doanh nghi p:
d ng công c OLAP trên b công c Visual Studio 2005 khai thác d li u trên kho d li u
d ng d án báo cáo c a b công c Visual Studio 2005 phân tích
t CSDL kho d li u v doanh thu c a doanh nghi p
t ch ng trình khai thác d li u c a kho d li u d a trên k thu t OLAP
t d án báo cáo phân tích tình hình kinh doanh c a doanh nghi p
Trang 15CH NG 2
S LÝ THUY T 2.1 Lý thuy t kho d li u:
d ng chúng a ra quy t nh kinh doanh thông minh s làm cho doanh nghi p s có b c phát tri n nh y v t và thành công Trong b i c nh này, các ngành công nghi p ang ngày càng t p trung vào DW, OLAP, và các công ngh liên quan khác Trong ph m vi nghiên c u c a lu n v n này, h c viên ch t p trung vào DW
Có hai cách nh ngh a khác nhau v kho d li u c Ralph Kimball và Bill Inmon a ra Có th nói, hai ông là cha c a khái ni m kho d li u Theo Ralph
Kimball “Kho d li u là m t h th ng trích xu t, làm s ch, t ng h p và cung c p ngu n d li u vào m t kho l u tr d li u a chi u và sau ó h tr , th c hi n truy
n và phân tích cho các m c ích c a quá trình ra quy t nh.”, còn theo Bill Inmon thì “Kho d li u là m t t p h p d li u t ng i n nh (không hay thay i), c p nh t theo th i gian, c tích h p theo h ng ch nh m h tr quá trình t o quy t nh v m t qu n lý.” [13] Tuy nhiên, nh ngh a c a Bill Inmon
c ch p nh n r ng rãi h n Có th hi u các c m trong nh ngh a c a Bill Inmon nh sau:
ng ch (Subject-Oriented): ngh a là d li u s cung c p thông tin
m t ch c th h n là các thông tin v các ch c n ng hay phòng ban
a m t công ty B i vì kho d li u theo h ng ch nên nó s cho phép phân tích thông tin c k t n i v i m t ch c th nào ó, ví d Marketing ho c Sales Nói m t cách n gi n h ng ch là m t qui trình kinh doanh (business process) ch không ph i là m t b ph n (department)
Trang 16Tích h p (Integrated): có ngh a là d li u c thu th p trong DW có th
n t nhi u ngu n khác nhau, nh ng c k t h p thành m t n v h p lý
và có liên quan m t thi t v i nhau Ví d : d li u có th l y t b ph n Marketing và Sales a vào kho d li u thành doanh thu hàng n m
p nh t theo th i gian (Time-Variant): kho d li u l u tr d li u t quá
kh c ng nh hi n t i nh h ng các quy t nh kinh doanh trong
ng lai D li u quá kh s tr giúp trong vi c xác nh các m u d li u
n n m t s quy t nh kinh doanh nào ó Nó hoàn toàn ph thu c vào
ng i qu n tr và nhà qu n lý doanh nghi p v vi c quy t nh cách l u tr
li u trong kho d li u trong bao lâu Ví d : 1 n m, 3 n m, 5 n m,…
n nh (Non-Volatile): có ngh a là s không có vi c c p nh t d li u c
u tr trong kho d li u mà thay vào ó là các thông tin c t ch c
hi n th các thay i c a d li u ó D li u trong kho d li u c s d ng cho vi c phân tích nên các thao tác c p nh t hay xóa d li u có th làm nh
ng t i vi c phân tích này Vì v y, nói chung là d li u trong DW không bao gi c c p nh t hay xóa b B t c khi nào m t thu c tính c th
ho c m c d li u c c p nh t t i ngu n thì phiên b n m i c a nó c
u tr trong DW vô hi u phiên b n d li u c
Tr c tiên, chúng ta s t p trung vào các m c tiêu c b n c a DW Các m c tiêu này c phát tri n d a trên các yêu c u và vi c qu n lý kinh doanh
DW ph i làm sao d li u c a DN c truy c p m t cách d dàng
i dung c a DW ph i d hi u D li u ph i tr c quan và rõ ràng i v i
ng i kinh doanh ch không n thu n ch cho các nhà phát tri n D hi u
ng ý là m c d c, n i dung c a DW c n c xác nh là có ý ngh a Doanh nhân mu n tách ra và k t h p l i d li u trong kho theo cách k t h p
vô t n, quá trình th ng c g i là chi u và ch n Các công c truy c p vào DW ph i n gi n và d s d ng Chúng c ng ph i tr l i k t qu truy
n cho ng i s d ng v i th i gian ch i là t i thi u
DW ph i trình bày thông tin c a DN m t cách nh t quán D li u trong
kho ph i áng tin c y D li u ph i c thu th p m t cách c n th n t nhi u ngu n khác nhau ngoài DN, c làm s ch, m b o ch t l ng và
Trang 17c s d ng ch khi nó phù h p v i tiêu chí c a ng i s d ng Thông tin
m t quá trình kinh doanh ph i phù h p v i thông tin t n i khác N u hai
bi n pháp th c hi n có cùng tên thì chúng ph i có ngh a là cùng m t th
Ng c l i, n u hai bi n pháp này không gi ng nhau thì chúng ph i c dán nhãn khác nhau Thông tin nh t quán có ngh a là thông tin ch t l ng cao Nó có ngh a là t t c các d li u s c trình bày và hoàn ch nh Tính
nh t quán c ng ng ý r ng các nh ngh a chung cho n i dung c a DW s
n có cho ng i s d ng
DW ph i c thích ng và linh ho t v i s thay i Chúng ta hoàn toàn
không th tránh s thay i Nhu c u c a ng i s d ng, u ki n kinh doanh, d li u và công ngh t t c u là các ch th cho các bi n ng c a
th i gian DW ph i c c thi t k x lý các thay i không th tránh kh i này Thay i i v i DW nên nh nhàng, có ngh a là nó không làm m t hi u l c c a d li u ho c các ng d ng hi n th i D li u và các
ng d ng hi n th i s không b thay i ho c phá v khi doanh nghi p yêu
u nh ng câu h i m i ho c m t s d li u m i c thêm vào DW N u
li u mô t trong DW c ch nh s a thì chúng ta ph i gi i lý gi i cho
nh ng thay i m t cách thích h p
DW ph i là ph ng ti n an toàn b o v thông tin quí báu c a DN
Thông tin quí báu c a m t DN s c l u tr trong DW m c t i thi u,
DW có th ch a thông tin v nh ng gì chúng ta ang bán cho m t ai ó v i
t giá c nào ó – là nh ng chi ti t nguy h i ti m tàng trong tay c a
nh ng k x u DW ph i ki m soát vi c truy c p vào các thông tin bí m t
a DN m t cách hi u qu
DW ph i ph c v nh là n n t ng cho vi c ra quy t nh t t h n DW
ph i có d li u chính xác h tr vi c ra quy t nh Ch có m t u ra chính xác t DW: quy t nh c a ra sau khi DW trình bày các b ng
ch ng c a nó Nh ng quy t nh này cung c p giá tr và tác ng kinh doanh mà có th phân b cho kho ch a Danh hi u nguyên th y x y ra
tr c DW v n là mô t t t nh t v nh ng gì chúng ta ang thi t k : m t h
th ng h tr ra quy t nh
Trang 18Vì v y, chúng ta có th nói r ng DW không là gì c ngo i tr là n i l u tr
c bi t d li u c a doanh nghi p, là n i d li u c t ch c theo cách mà vi c phân tích tr nên d dàng và tr c quan cho ng i qu n tr doanh nghi p và giúp h
th c hi n công vi c d a trên các quy t nh kinh doanh Hay nói cách khác, m c tiêu chính c a DW là cung c p m t kho l u tr d li u h p nh t, linh ho t, có ý ngh a cho ng i dùng trong vi c phân tích, báo cáo và h tr ra quy t nh T t c các m c tiêu khác c a DW u có ngu n g c t m c tiêu chính này Tuy nhiên, v phía ng i s d ng ho c doanh nghi p v n có khó kh n trong vi c phân tích, khai thác, t ch c kho d li u, các khó kh n th ng g p là:
Không th tìm th y d li u c n thi t: D li u r i rác r t nhi u h th ng
i các giao di n và công c khác nhau, khi n t n nhi u th i gian chuy n t
th ng này sang h th ng khác Có th có nhi u ngu n thông tin áp ng
c òi h i, nh ng chúng l i có nh ng khác bi t và khó phát hi n thông tin nào là úng
Không th l y ra c d li u c n thi t: Th ng xuyên ph i có chuyên gia
tr giúp, d n n công vi c b d n ng Có nh ng lo i thông tin không
th l y ra c n u không m r ng kh n ng làm vi c c a h th ng có
n
Không th hi u d li u tìm th y: Mô t d li u nghèo nàn và th ng xa r i
i các thu t ng nghi p v quen thu c
Trang 19Ng n ch n vi c trình bày cùng v n mà khác nhau các con s
Chúng ta mu n m i ng i s d ng thông tin h tr vi c ra quy t nh
Nh v y, v i các yêu c u v công vi c nh trên, chúng ta s chuy n i thành các yêu c u c a m t kho d li u
Kho d li u ph i làm cho thông tin c a m t TC c truy xu t d dàng
Các n i dung c a kho d li u ph i d hi u Các d li u ph i tr c quan và rõ ràng cho ng i dùng làm vi c ch không n thu n cho các nhà phát tri n D hi u có
ng ý là m c d c; n i dung c a kho d li u c n mang ý ngh a Ng i dùng doanh nghi p mu n chia tách và k t h p d li u trong kho d li u m t cách vô h n, quá trình này th ng c g i là chi u và ch n Các công c truy c p vào kho d
li u ph i n gi n và d s d ng Chúng c ng ph i tr l i k t qu truy v n cho
ng i s d ng v i th i gian ch i là t i thi u
Kho d li u ph i trình bày thông tin c a TC m t cách nh t quán D li u
trong kho d li u ph i áng tin c y D li u ph i c k t n i c n th n t nhi u ngu n xung quanh t ch c, c làm s ch, ph i m b o ch t l ng và s n sàng ch khi nó phù h p v i nhu c u c a ng i s d ng Thông tin t m t qui trình kinh doanh ph i phù h p v i thông tin c a qui trình khác N u hai ph ng pháp th c
hi n có cùng tên thì chúng ph i cùng ngh a Ng c l i, n u hai ph ng pháp không
có ngh a t ng t thì chúng ph i c dán nhãn khác nhau S nh t quán thông tin
có ngh a là thông tin có ch t l ng cao Có ngh a là t t c các d li u ã c tính toán và hoàn ch nh Tính nh t quán c ng ng ý r ng các nh ngh a t ng quát n i dung c a kho d li u là có s n cho ng i dùng
Kho d li u ph i thích nghi và thay i linh ho t. n gi n vì chúng ta không th tránh kh i s thay i Nhu c u c a ng i s d ng, u ki n kinh doanh,
li u và công ngh t t c u tùy thu c vào bi n ng c a th i gian Kho d li u
ph i c c thi t k x lý các thay i không th tránh kh i này Thay i
i v i kho d li u nên uy n chuy n, u ó có ngh a là chúng không làm m t
hi u l c d li u ho c các ng d ng hi n có D li u và các ng d ng hi n có không nên b thay i ho c b phá v khi c ng ng doanh nghi p yêu c u câu h i m i
Trang 20ho c d li u m i c thêm vào kho N u d li u mô t trong kho d li u c thay i thì chúng ta ph i gi i thích cho nh ng thay i m t cách thích h p
Kho d li u ph i là m t ph ng ti n an toàn b o v tài s n thông tin
a DN Viên ng c thông tin quý giá c a m t t ch c c l u tr trong kho d
li u m c t i thi u, kho d li u gi ng nh n i ch a thông tin v nh ng gì chúng ta ang bán cho ai ó v i m t m c giá nào ó – m t m i nguy h i ti m n trong tay nh ng ng i x u Kho d li u ph i ki m soát vi c truy c p vào thông tin
bí m t c a t ch c m t cách hi u qu
Kho d li u ph i ph c v nh là n n t ng cho s c i thi n vi c ra quy t
nh Kho d li u ph i có d li u chính xác h tr quá trình ra quy t nh Ch
có m t s th t u ra duy nh t t m t kho d li u: các quy t nh c a ra sau khi kho d li u ã a ra b ng ch ng c a nó
ng ng doanh nghi p ph i ch p nh n kho d li u n u nó là c coi
là thành công Vi c chúng ta ã xây d ng m t gi i pháp p m t s d ng các s n
ph m và n n t ng t t là u không quan tr ng N u c ng ng doanh nghi p không
ch p nh n kho d li u và ti p t c s d ng nó tích c c 6 tháng sau khi ào t o thì
vi c nghi m thu là th t b i Không gi ng nh vi c vi t l i m t h th ng, n i ng i dùng không có s l a ch n nào khác là ph i s d ng h th ng m i, nh ng s
ng h th ng m i, vi c s d ng kho d li u ôi khi là tùy ch n S n gi n hóa
d dàng c ng i s d ng ch p nh n h n
Trang 212.1.3 Các thành ph n c a m t kho d li u:
Có b n thành ph n riêng r và phân bi t s c trình bày trong môi tr ng kho d li u, ó là: h th ng ngu n d li u, khu v c t ng d li u, khu v c trình bày
li u và các công c truy c p d li u
th ng ngu n d li u (Operational Source Systems): ây là nh ng h
th ng các b n ghi d li u ghi l i các giao d ch trong quá trình ho t ng kinh doanh Các h th ng ngu n d li u này nên c dùng bên ngoài kho d li u
i vì chúng ta ít có ki m soát n i dung và nh d ng d li u trong các h
th ng này u tiên c a chính h th ng ngu n này là x lý hi u su t và tính s n sàng Truy v n trên h th ng ngu n này b bó h p, các truy v n có k t qu m i
n m t b n ghi b h n ch nghiêm tr ng cho các nhu c u trên h th ng ngu n
li u này Chúng ta gi nh r ng các h th ng ngu n d li u không c truy v n theo cách thông d ng và t xu t nh kho d li u Các h th ng ngu n d li u duy trì r t ít d li u quá kh và n u có m t kho d li u t t thì các h th ng ngu n d li u có th c gi m b t trách nhi m trình bày hay
u tr quá kh M i h th ng ngu n d li u th ng là m t ng d ng hình ng
Hình 2.1 Các thành ph n c a kho d li u
(Ngu n: [11])
Trang 22nhiên, có ít u t cho vi c chia s d li u chung nh s n ph m, khách hàng, a lý N u h th ng ngu n d li u ang c tái c u trúc l i có cái nhìn nh t quán thì s là u tuy t v i Vi c n l c tích h p các ng d ng c a doanh nghi p nh th s làm cho vi c thi t k kho d li u d dàng h n nhi u
Khu v c t ng d li u (Data Staging Area): khu v c t ng d li u c a kho d
li u là c p t i c vi c l u tr và các qui trình x lí ph bi n nh là trích
xu t-chuy n i-n p d li u Khu v c t ng d li u là t t c m i th gi a các
th ng ngu n d li u và khu v c trình bày d li u Trong kho d li u, d
li u làm vi c thô c chuy n i vào kho d li u chuy n giao cho ng i
d ng có yêu c u truy v n và s d ng Do ó, ng i dùng s không c phép truy c p vào khu v c t ng d li u này Khu v c t ng d li u b chi ph i
i các ho t ng n gi n là phân lo i và x lý tu n t Trong nhi u tr ng
p, khu v c t ng d li u không d a trên công ngh liên quan mà thay vào ó
là bao g m m t h th ng các t p tin Sau khi xác nh n d li u cho phù h p v i
nh ng quy t c công vi c c nh ngh a là m t-m t và m t-nhi u, thì b c
cu i cùng trong vi c xây d ng m t c s d li u v t lý chu n 3 y là vô ngh a
Trình bày d li u (Data Presentation): Khu v c trình bày d li u là n i d
t data mart trình bày d li u t m t qui trình công vi c n gi n
Mô hình chi u là m t tên m i cho m t k thu t c làm cho c s d li u n
gi n và d hi u T t ng tr ng này n tr ng h p khác, b t u t nh ng
m 1970, các t ch c, công ty t v n, ng i dùng và các nhà cung c p CNTT
ã h ng v m t c u trúc chi u n gi n làm cho các nhu c u c b n c a con ng i phù h p v i s gi n n
Trang 23Công nghi p sau này ôi khi c p mô hình 3NF nh các mô hình ER ER
là t vi t t t c a Entity Relationship ERD là vi c v các h p và ng giao
ti p các m i quan h gi a các b ng v i nhau C hai mô hình 3NF và chi u
có th c trình bày trong ERDs b i vì c hai bao g m các b ng quan h có
t n i v i nhau, s khác bi t chính gi a mô hình 3NF và chi u là m c chu n hóa Vì c hai lo i mô hình có th c trình bày theo d ng ERDs, nên chúng ta s không c p n các mô hình 3NF là mô hình ER; thay vào ó,
chúng ta s g i chúng là các mô hình chu n hóa gi m thi u s nh m l n
Mô hình chu n hóa là vô cùng h u ích cho vi c x lý các công vi c u hành b i vì m t giao d ch c p nh t ho c chèn ch c n tác ng vào c s d
li u m t n i Tuy nhiên, các mô hình chu n hóa là quá ph c t p i v i d
li u kho cho vi c th c hi n truy v n Ng i dùng không th hi u, xác nh
ho c ghi nh các mô hình chu n hóa t ng t nh h th ng ng giao thông Vi c s d ng các mô hình chu n hóa trong khu v c trình bày d li u
a kho d li u s phá toàn b m c ích c a kho d li u, c th là, truy v n
li u tr c quan và hi u su t cao
Thay vào ó, mô hình chi u gi i quy t các v n v l c ph c t p trong khu v c trình bày d li u M t mô hình chi u ch a các thông tin gi ng nh
t mô hình chu n hóa, nh ng gói d li u trong nh d ng thi t k v i m c
c tiêu là làm cho ng i dùng d hi u, t ng hi u su t truy v n và thay i linh ho t
Trong mô hình chi u, có hai thu t ng hay c s d ng, ó là: b ng s ki n (fact tables) và b ng chi u d li u (dimension tables)
ng s ki n (fact tables): m t b ng s ki n là m t b ng chính trong mô
hình chi u có ch c n ng l u tr các d li u t ng h p cho quá trình ho t
ng Ng i dùng c g ng l u tr d li u t ng h p t k t qu c a m t quá trình công vi c trong m t data mart n l B i vì d li u t ng h p a
ph n là l n nh t trong b t k data mart nào nên c n tránh vi c l p l i nhi u
i khác
Trang 24Nh ng thu c tính này mô t các hàng trong b ng chi u d li u Trong b ng
li u chi u, càng nhi u mô t v n b ng càng t t Vi c b ng d li u chi u
có kho ng 50 n 100 thu c tính trong nó là không ph bi n Kích th c
ng chi u d li u th ng ít v s hàng (ít h n 1 tri u hàng r t nhi u), nh ng
có nhi u c t thu c tính M i chi u c xác nh b i khóa chính duy nh t
a nó, c ký hi u là PK và là khóa ngo i cho b ng s ki n t ng h p nào
t n i v i nó
Hình 2.2 B ng s ki n (Ngu n: tác gi )
Hình 2.3 B ng chi u d li u (Ngu n: tác gi )
Trang 25Thu c tính c a b ng chi u d li u óng vai trò quan tr ng trong kho d li u
i vì chúng là ngu n g c c a h u h t t t c các ràng bu c và d li u báo cáo, nên chúng là chìa khóa làm cho kho d li u d hi u và d s d ng S c
nh c a kho d li u là t l thu n v i ch t l ng và chi u sâu c a các thu c tính c a b ng chi u d li u Th i gian dành cho vi c cung c p các thu c tính
i mô t k thu t rõ ràng càng nhi u thì kho d li u càng t t Th i gian dành cho vi c tính toán giá tr trong m t c t thu c tính càng nhi u thì kho d
li u càng t t Th i gian dành cho vi c m b o ch t l ng giá tr trong m t
t thu c tính càng nhi u thì kho d li u càng t t
Công c truy c p d li u (Data Access Tools): thành ph n chính cu i cùng
trong môi tr ng kho d li u là các công c truy c p d li u Vi c s d ng thu t ng công c là c p n s a d ng v kh n ng có th c cung
p cho ng i dùng tác ng lên khu v c trình bày d li u cho quá trình phân tích ra quy t nh Theo nh ngh a, t t c các công c truy c p d li u truy v n d li u t khu v c trình bày c a kho d li u Rõ ràng, vi c truy v n là toàn b v n trong vi c s d ng kho d li u
t công c truy c p d li u có th n gi n nh m t công c truy v n c
bi t ho c ph c t p nh m t mô hình khai thác d li u ho c mô hình ng d ng Các công c truy v n c bi t có th c hi u và s d ng có hi u qu ch v i
t nh t l ng i dùng nh h p trong kho d li u ti m n ng Ph n l n
ng i dùng mong mu n truy c p d li u thông qua các ng d ng tham s có
n M t s các công c truy c p d li u ph c t p h n, nh các công c d báo ho c mô hình, th c s có th n p k t qu c a chúng tr l i vào khu v c ngu n d li u h th ng ho c các khu v c t ng d li u/ trình bày d li u c a kho d li u
2.1.4 Mô hình d li u và vi c thi t k kho d li u:
Có 2 y u t chính trong vi c xây d ng m t kho d li u: thi t k giao di n t các h th ng u hành và thi t k b n thân kho d li u Kho d li u c xây d ng theo phong cách c i ti n, ngh a là m t giai n phát tri n m i ph thu c hoàn toàn vào k t qu t c t các giai n tr c ó u tiên, m t ph n d li u c xác
Trang 26nh Sau ó nó c s d ng và xem xét k l ng b i các nhà phân tích DSS Ti p theo, d a trên thông tin ph n h i t ng i dùng cu i, d li u c s a i / ho c các d li u khác c thêm vào Sau ó, các ph n khác c a kho d li u c xây
ng và c nh th Vòng l p thông tin ph n h i s ti p t c trong su t toàn b s
n t i c a kho d li u Do ó, kho d li u không th thi t k nh các h th ng
ng yêu c u c n c Hay nói cách khác, các yêu c u d oán v n còn quan
tr ng [15]
li u u hành: Ban u, d li u h ng giao d ch u hành b khóa trong các
th ng k th a hi n t i M c dù chúng ta ngh r ng vi c t o các kho d li u ch liên quan n vi c l y d li u ho t ng này ra và nh p vào kho d li u, không còn làm gì thêm n a Vi c ch n thu n l y d li u t môi tr ng k th a và t nó trong kho d li u t c r t ít hi u qu cho kho d li u
Hình 2.4 cho th y vi c n gi n hóa cách chuy n d li u t môi tr ng h
Trang 27Hình 2.5 cho th y thi u s tích h p trong m t môi tr ng h th ng hi n hành tiêu bi u L y d li u vào kho d li u mà không c n tích h p nó là m t sai l m nguy hi m
t ví d n gi n c a s thi u tích h p d li u là vi c mã hóa không nh t quán, nh th hi n b i vi c mã hóa tr ng gi i tính Trong m t ng d ng, gi i tính
mã hóa là m/f ng d ng khác, nó c mã hóa là 0/1 Trong m t ng d ng khác
a c mã hoá nh x/y T t nhiên, vi c mã hóa gi i tính là không quan tr ng n u
nh nó c th c hi n nh t quán Khi d li u i vào kho d li u, các giá tr khác nhau c a các ng d ng ph i c gi i mã m t cách chính xác và ghi nh n l i v i giá tr thích h p
t ví d khác, hãy xem xét b n ng d ng có cùng tr ng pipeline Tr ng
pipeline c o b ng các n v khác nhau trong các ng d ng khác nhau Trong
t ng d ng c o b ng inch, trong ng d ng khách là theo cm, v v Trong kho d li u thì tr ng pipeline o nh th nào là không quan tr ng mi n là nó c
o nh t quán Khi m i ng d ng chuy n d li u c a nó cho kho d li u, các phép
o c a tr ng pipeline c chuy n i thành m t n v o nh t quán
Hình 2.5 D li u t các ng d ng khác nhau c c k r i r c
(Ngu n: [15])
Cùng d li u, khác tên Cùng tên, khác d li u D li u ch t n t i 1 ch Cùng d li u, khác khóa
Trang 28Các mô hình d li u trong kho d li u:
Có ba c p c a mô hình d li u: mô hình c p cao (g i là c p quan h
th c th ), mô hình c p trung (g i là m c d li u) và mô hình c p th p (g i là mô hình v t lý)
Mô hình d li u c p cao: Mô hình c p cao cao các m i quan h và các
th c th nh hình 2.7 sau ây Tên c a th c th c bao quanh b i m t hình b u d c M i quan h gi a các th c th c mô t b ng các m i tên
ng và s l ng m i tên cho bi t l ng c a m i quan h và ch có m i quan h tr c ti p c ch ra Khi làm nh v y, các ph thu c ng m nh s
Chuy n i n v tính:
Trang 29Mô hình d li u c p trung: Sau khi mô hình d li u c p cao c t o ra,
p ti p theo c thành l p, ó là mô hình d li u c p trung hay g i là DIS i v i m i th c th c xác nh trong các mô hình d li u c p cao thì s có m t mô hình d li u c p trung c t o ra, nh trong hình 2.8 Mô hình d li u c p cao xác nh b n th c th M i khu v c sau ó c phát
tri n thành mô hình c p trung c a riêng nó
Khi m t quan h c xác nh trong mô hình ERD thì nó s c trình bày
ng m t c p quan h k t n i mô hình DIS Hình 2.9 sau ây s ch ra
Mô hình ERD n gi n trong môi tr ng s n xu t
Hình 2.7 Các th c th và các m i quan h
(Ngu n: [15])
Trang 30Trong mô hình ERD, m t quan h gi a customer và account c xác nh
Trong mô hình DIS cho account, t n t i m t k t n i bên d i account u
này nói lên r ng m t account có th có nhi u customer g n k t v i nó
Trong mô hình DIS này, không có k t n i t ng ng bên d i customer
ây s là m t k t n i t i account, ch ra r ng m t customer có th có 1 hay nhi u account
Mô hình d li u v t lý: Các mô hình d li u v t lý c t o ra t mô hình
li u c p trung ch b ng vi c m r ng mô hình d li u c p trung thêm vào khóa và các c tính v t lý c a mô hình ó T i th i m này, mô hình
Trang 31c dù có th nói r ng các b ng ã s n sàng c th hóa vào thi t k c s
li u v t lý, nh ng v n còn l i m t b c thi t k cu i cùng – tính n c tính hi u su t V i kho d li u, b c u tiên làm nh th là mang tính quy t
nh trên vi c k t tinh d li u và phân ho ch d li u u này là r t quan
tr ng
Sau khi vi c k t tinh d li u và phân ho ch c tính n, m t lo t các thi t
v t lý khác v t lý khác c a vào thi t k , nh ã nêu trong hình 2.11
u quan tâm nh t trong thi t k c n cân nh c là s d ng vi c c ghi v t lý I/O ( u vào/ u ra) Vi c c ghi v t lý I/O là ho t ng a d li u vào máy tính hay g i d li u ra ngoài l u tr Hình 2.12 s cho th y m t
tr ng h p c ghi I/O n gi n
Công vi c c a các nhà thi t k kho d li u là t ch c d li u v t lý cho
vi c tr v s l ng t i a các b n ghi t vi c th c hi n c ghi v t lý I/O Ví , gi s m t l p trình viên ph i l y 5 b n ghi d li u N u các b n ghi này
c t ch c thành các kh i d li u khác nhau trong vi c l u tr , thì n m thao tác c ghi s c th c hi n Nh ng n u các nhà thi t k có th d
Hình 2.11 Các y u t thi t k liên quan n hi u su t
(Ngu n: [15])
Hình 2.12 Môi tr ng c ghi d li u
(Ngu n: [15])
Trang 32oán tr c r ng các b n ghi này s c n thi t thành nh m t nhóm và có th
t c nh nhau vào cùng m t kh i, thì ch c n m t thao tác c ghi là , do
ó làm cho ch ng trình ch y hi u qu h n nhi u
t n i hình sao:
Vi c thi t k kho d li u trong th gi i mà trong ó cách ti p c n chu n hóa là
p lý Có nhi u lý do r t chính áng t i sao s chu n hóa a ra thi t k t i u cho
i nhau là có ý ngh a
t cách ti p c n khác thi t k c s d li u c c p trong ng c nh kho d li u là cách ti p c n a chi u Cách ti p c n này òi h i các k t n i d ng sao, b ng s ki n t ng h p và b ng kích th c Cách ti p c n a chi u áp d ng riêng cho kh i d li u, ch không dành cho kho d li u Không gi ng nh kho d
li u, vùng d li u nh hình b i các yêu c u xây d ng m t vùng d li u, c n
ph i bi t r t nhi u v các yêu c u x lý xung quanh vùng d li u này M t khi các yêu c u rõ ràng, thì vùng d li u có th t o thành c u trúc d ng sao t i u
Hãy xem xét mô hình d li u trong hình 2.13 Mô hình d li u trong hình cho
th y b n th c th n có quan h v i nhau N u t t c c coi là mô hình d li u cho vi c thi t k c s d li u thì suy lu n là t t c các th c th u bình ng v i nhau Nói cách khác, t m t quan m thi t k , mô hình d li u này làm cho t t c các th c th ngang hàng v i nhau Vi c ti p c n thi t k c s d li u cho kho d
li u ch t quan m c a mô hình này s d n t i m t tác ng "ph ng" Trong th c
Trang 33, v i nhi u lý do thì các th c th trong th gi i vùng d li u là b t c u gì
nh ng ngo i tr là ngang hàng v i nhau M t s th c có nhu c u cho vi c thi t k
và ng d ng t bi t [15]
xem lý do t i khía c nh d li u và quan h c a mô hình d li u trong m t
ch c b bóp méo, hãy xem xét mô hình ba chi u th hi n trong hình 2.14 sau ây
ây, các th c th i di n cho nhà cung c p, khách hàng, s n ph m, giao hàng
c tính toán riêng l , trong khi th c th n hàng c tính toán r t nhi u Có nhi u s ki n ho c d li u xu t hi n nhi u trong b ng ho c các b ng c a th c th
n hàng h n b t k th c th nào khác Vì có m t l ng l n d li u c n tính toán cho th c th n hàng nên nó s c n có m t thi t k riêng theo yêu c u này
u trúc thi t k yêu c u x lý m t l ng l n d li u trong m t th c th nào
ó trong khu v c d li u c g i là m t “k t n i hình sao” M t ví d n gi n c a
t k t n i hình sao nh trong hình 2.15 sau ây N HÀNG là th c th trung tâm c a các k t n i hình sao và là th c th có l ng tính toán nhi u nh t Xung quanh N HÀNG là nh ng th c th NHÀ CUNG C P, KHÁCH HÀNG, S N
PH M, GIAO HÀNG M i m t th c th xung quanh này có m t l ng d li u
Hình 2.13 Mô hình d li u hai chi u n gi n - các th c th là ngang hàng
(Ngu n: [15])
Hình 2.14 Mô hình d li u ba chi u cho th y r ng các th c th là không ngang hàng v i nhau
Vài th c th có d li u nhi u h n cái kia
(Ngu n: [15])
Trang 34khiêm t n Trung tâm c a k t n i hình sao – th c th N HÀNG - c g i là
"b ng s ki n." Các th c th xung quanh c g i là "chi u d li u" B ng s ki n
ch a d li u nh n d ng duy nh t N HÀNG, c ng nh d li u duy nh t cho các
n t hàng riêng c a nó B ng s ki n ch a các khóa ngo i c k t n i tr c v i các b ng chi u d li u bên ngoài Các quan h khóa ngo i có th i kèm v i thông tin khóa th ng bên trong k t n i hình sao n u, trong th c t , các thông tin khóa
th ng c s d ng th ng xuyên trong b ng s ki n [1]
Có th s có m t s quan h khóa ngo i t i các b ng chi u d li u M t quan khóa ngo i c t o ra khi nó c n ki m tra d li u khóa ngo i ó v i d li u trong b ng s ki n t ng h p M t trong nh ng khía c nh u vi t c a mô hình k t
i hình sao là r t nhi u tr ng h p mà d li u ký t b cô l p v i d li u d ng s Xem xét ví d trong hình 2.16, d li u ký t th ng n m trong các b ng chi u d
Trang 35t trong nh ng v n c a kho d li u và vùng d li u là làm sao l y d li u kho d li u a vào vùng d li u D li u trong kho d li u có chi u sâu d
li u và chi ti t, trong khi d li u trong vùng d li u là cô ng và t ng h p nh , d li u s c chuy n t kho d li u sang vùng d li u Vi c di chuy n d li u kho d li u sang vùng d li u này t ng t nh vi c chuy n d li u t các h
th ng u hành sang kho d li u
t n i hình bông tuy t:
t n i bông tuy t trong mô hình kho d li u thì ph c t p h n k t n i hình sao, nh ng nó v n là m t lo i k t n i hình sao Nó c g i là k t n i bông tuy t vì
c a s gi ng nh m t bông tuy t K t n i hình bông tuy t s lo i b s d
th a ó là, d li u chi u s c a vào nhi u b ng thay vì m t b ng l n Ví d ,
t b ng chi u d li u khách hàng trong k t n i hình sao có th c chu n hóa
thành m t b ng khách hàng và m t b ng qu c gia trong k t n i hình bông tuy t
Trong khi u này giúp ti t ki m không gian, thì nó l i làm t ng s b ng chi u d
li u và yêu c u nhi u k t n i khóa ngo i h n K t qu là t o ra các truy v n ph c
Hình 2.16 Trong nhi u tr ng h p, b ng s ki n t ng h p c tính toán b i d li u d ng s và
khóa ngo i trong khi b ng chi u d li u c tính toán b ng d li u ký t
(Ngu n: [15])
Trang 36p h n và gi m hi u su t truy v n Hình 2.17 trình bày m t k t n i hình bông tuy t
n gi n
OLAP:
OLAP là ho t ng t ng tác phân tích các giao d ch i v i d li u kinh doanh c l u tr trong kho d li u chi u a ra quy t nh kinh doanh mang tính sách l c và chi n l c Ng i làm OLAP th ng là các nhà phân tích kinh doanh, qu n lý kinh doanh và giám c u hành Ch c n ng n hình trong OLAP bao g m t p h p (t ng c ng), ào sâu ( nh n c chi ti t), ch n và chi u (c t kh i d li u và t ng h p các giá tr trong các thành ph n) Ch c n ng OLAP có
th c cung c p s d ng cho m t c s d li u quan h ho c s d ng cho m t c
d li u a chi u OLAP s d ng m t c s d li u quan h c g i là x lý phân tích tr c tuy n quan h (ROLAP) OLAP mà s d ng m t c s d li u a chi u c g i là x lý phân tích tr c tuy n a chi u (MOLAP)
Hình 2.17 Mô hình k t n i hình bông tuy t n gi n v i th c th KHÁCH HÀNG k t n i v i
th c th QUÔC GIA (Ngu n: [15])
Trang 37t ví d c a OLAP là phân tích tính hi u qu c a m t ch ng trình qu ng cáo trên m t s s n ph m b ng cách o c m c t ng tr ng doanh thu trong kho ng th i gian nh t nh M t ví d khác là phân tích tác ng c a vi c t ng giá bán s n ph m t i các khu v c khác nhau và các nhóm s n ph m t i cùng m t kho ng th i gian [13]
Các ph ng pháp n p d li u cho kho d li u:
ETL là quá trình l y và chuy n i d li u t h th ng ngu n và t vào kho
li u
Có m t s nguyên t c c b n c n hi u là khi nào trích xu t d li u t m t h
th ng ngu n cho m c ích tính toán cho m t kho d li u u tiên, kh i l ng d
li u c l y là l n, có th là hàng tr m MB ho c hàng ch c GB M t h th ng OLTP c thi t k l y d li u ra t ng m nh nh , ch không ph i v i s l ng l n
nh th này, vì v y ph i c n th n không làm ch m h th ng ngu n gi m hi u
su t quá nhi u Vi c trích xu t ph i làm cho h th ng ch y càng nhanh càng t t,
ch ng h n nh n m phút n u có th , ch không ph i là ba gi ( u này ph thu c vào ph ng pháp tri n khai) Vi c trích xu t c ng có th th c hi n theo d ng càng
nh càng t t, ch ng h n nh 10MB m i ngày n u có th , ch không ph i là 1GB
i ngày Ngoài ra, vi c trính xu t c ng nên c th c hi n m t cách càng th ng xuyên càng t t, ch ng h n nh m t l n/ngày n u có th , ch không ph i là m i n m phút Vi c trích xu t làm s thay i trong h th ng ngu n càng gi m thi u càng
t, ch ng h n nh không thay i chút nào n u có th , ch không t o ra các thay
i trên m i giao d ch trong m i b ng
Hình 2.18 Kh i OLAP trong mô hình kho d li u
(Ngu n: [3])
Trang 38ng d li u là m t c s d li u v t lý ho c các t p tin a d li u vào khu v c
ng d li u có ngh a là chèn nó vào CSDL ho c ghi d li u vào t p tin
Chuy n i d li u trong b nh s nhanh h n so v i t nó trên a N u d
li u nh , thì chuy n i trong b nh là kh thi, nh ng n u d li u l n, thì ph i trên a tr c tiên Vi c a d li u vào b nh ph thu c vào dung l ng b
nh c a máy ch ETL Vi c thay th cho hai cách ti p c n ETL th hi n trong 2
Hình 2.19 Cách ti p c n ETL v i t ng d li u trung gian
(Ngu n: [13])
Hình 2.20 Cách ti p c n ETL không có t ng d li u trung gian
(Ngu n: [13])
Trang 39hình 2.19 và hình 2.20 c g i là ELT, nh th hi n trong hình 2.21 sau ây Trong cách ti p c n ELT này, h th ng s th c hi n vi c l y d li u t h th ng ngu n, n p vào kho d li u và sau ó áp d ng các chuy n i b ng cách c p nh t
li u trong kho Trong cách ti p c n ELT, d li u c a h th ng ngu n v c b n
c sao chép vào kho d li u và chuy n i ó Ng i ta th ng s d ng cách ti p c n ETL n u h có m t máy ch ETL m nh m và ph n m m m nh m
Hay nh m t công c k thu t
ng 2.1 s mô t chi ti t các khía c nh c a CRM S có các góc nhìn khác và
ch c n ng c a CRM Ví d , theo cái nhìn c a ngành công nghi p thì CRM s bao m:
Hình 2.21 Cách ti p c n ELT cho phép vi c chuy n i d li u trên máy ch kho d li u
(Ngu n: [13])
Trang 40Giúp doanh nghi p cho phép b ph n ti p th xác nh và h ng t i m c tiêu khách t t nh t, qu n lý chi n d ch ti p th và t o ra i ng bán hàng
Cho phép s hình thành c a các m i quan h cá nhân v i khách hàng, v i
c ích c i thi n s hài lòng c a khách hàng và t i a hóa l i nhu n, xác
nh nh t khách hàng mang l i l i nhu n nhi u nh t và cung c p cho h
c d ch v t t nh t
Cung c p nhân viên các thông tin và quy trình c n thi t hi u bi t v khách hàng c a mình, hi u và xác nh nhu c u khách hàng và xây d ng các m i quan h gi a công ty, khách hàng m i và các i tác phân ph i m t cách hi u qu
[CRM có liên quan v i] s sáng
o và thúc y các m i liên k t
và quan h v i th tr ng bên ngoài, c bi t là kênh phân
CRM thành công òi h i các công
ty liên t c ánh giá và u tiên các
i quan h khách hàng d a trên vòng i l i nhu n t ng i c a
[CRM cho phép doanh nghi p]
u t các khách hàng ti m
ng có giá tr cho mình, nh ng
ng gi m thi u các kho n u
v i các khách hàng không có giá tr
tr ng tâm và nh h ng b i s
hi u bi t v nhu c u thay i c a khách hàng.
CRM không ph i là m t d án
i r c - nó là m t tri t lý kinh doanh nh m t c chi n l c khách hàng tr ng tâm cho doanh nghi p mình.
B ng 2.1 Các khía c nh ch y u c a CRM
(Ngu n: [2])