1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Hệ thống thông tin quản lý: Xây dựng data warehouse và business intelligence cho ngành mỹ phẩm

65 7 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây dựng data warehouse và business intelligence cho ngành mỹ phẩm
Tác giả Luận Văn Thạc Sĩ
Người hướng dẫn PGS.TS. Nguyễn Thanh Bình, PGS.TS. Nguyễn Tuấn Cường, TS. Lê Hoành Sử
Trường học Trường Đại học Bách Khoa, Đại học Quốc Gia TP.HCM
Chuyên ngành Hệ thống thông tin quản lý
Thể loại Luận Văn Thạc Sĩ
Năm xuất bản 2022
Thành phố Tp. HCM
Định dạng
Số trang 65
Dung lượng 1,67 MB

Cấu trúc

  • 1.1. Giӟi thiӋXÿӅ tài (0)
  • 1.2. Mөc tiêu và nӝi dung cӫDÿӅ tài (12)
  • 1.3. Giӟi hҥQÿӅ tài (13)
  • 1.4. Cҩu trúc báo cáo (13)
    • 2.1.1 T̯m quan tr͕ng cͯa Data Warehouse (15)
    • 2.1.2 Ĉ̿FWU˱QJFͯa Data Warehouse (16)
    • 2.1.3 Ĉ̿c tính cͯa Data Warehouse (16)
    • 2.1.4 Lͫi ích cͯa Data Warehouse (17)
    • 2.1.6 Ki͇n trúc Data Warehouse (19)
    • 2.1.7 OLAP và OLTP (22)
    • 2.1.8 Ti͇n Trình ETL (25)
    • 2.1.9 Khái ni͏m và lͫi ích cͯa Business Intelligence (27)
  • 2.2. Các nghiên cӭu liên quan (29)
  • 3.1 Các vҩQÿӅ gһp phҧi khi triӇn khai hӋ thӕng (30)
  • 3.2 HӋ thӕng phҫn mӅm và báo cáo cӫDF{QJW\ÿDQJVӱ dөng (0)
  • 3.3 Phҫn mӅm hӛ trӧ xây dӵng hӋ thӕng Data Warehouse và BI (31)
  • 3.4 Quy trình nghiӋp vө (32)
    • 3.3.1 Nghi͏p vͭ bán hàng (32)
    • 3.3.2 Nghi͏p vͭ kho (34)
    • 3.3.3 Nghi͏p vͭ khi͇u n̩i khách hàng (36)
  • 4.1. Yêu cҫu tӯ F{QJW\YjQJѭӡi dùng hӋ thӕng (0)
  • 4.2. Các phân hӋ ÿӇ xây dӵng hӋ thӕng (39)
  • 4.4. Xây dӵng các Data Mart (41)
    • 4.4.1 Thông tin chi ti͇t các table cho Data Mart (41)
    • 4.4.2 Mô hình bán hàng (45)
    • 4.4.3 Mô hình kho (47)
    • 4.4.4 Mô hình khi͇u n̩i khách hàng (48)
  • 4.5. ThiӃt kӃ DSA (49)
  • 4.6. ThiӃt kӃ tiӃn trình ETL (50)
  • 4.7. ThiӃt kӃ Business Intelligence (52)
  • 4.8. ĈiQKJLiKӋ thӕng (55)
    • 4.8.1 Thu th̵p yêu c̯u tͳ QJ˱ͥi dùng h͏ th͙ng (55)
    • 4.8.2 ĈiQKJLiWͳ các phòng ban (59)
  • 5.1 KӃt quҧ ÿҥWÿѭӧc (62)
  • 5.2 ѬXYjQKѭӧFÿLӇm cӫDSKѭѫQJSKiSÿѭӧFÿӅ xuҩt (62)
  • 5.3 ĈyQJJySFӫa luұQYăQYӅ mһt khoa hӑc và ӭng dөng (62)
  • Bҧng 4.1: Thông tin chi tiӃt cӫa bҧng danh mөc thӡi gian (0)
  • Bҧng 4.2: Thông tin chi tiӃt cӫa bҧng danh mөc sҧn phҭm (0)
  • Bҧng 4.3: Thông tin chi tiӃt cӫa bҧng danh mөc loҥi sҧn phҭm (0)
  • Bҧng 4.4: Thông tin chi tiӃt cӫa bҧng danh mөc kênh (0)
  • Bҧng 4.5: Thông tin chi tiӃt cӫa bҧng danh mөc vùng (0)
  • Bҧng 4.6: Thông tin chi tiӃt cӫa bҧng danh mөc khách hàng (0)
  • Bҧng 4.7: Thông tin chi tiӃt cӫa bҧng danh mөc nhà máy (0)
  • Bҧng 4.8: Thông tin chi tiӃt cӫa bҧng danh mөc loҥi khiӃu nҥi (0)
  • Bҧng 4.9: Thông tin chi tiӃt cӫa bҧng danh mөc tình trҥng kho (0)
  • Bҧng 4.10: Thông tin chi tiӃt cӫa bҧng danh mөc kho (0)
  • Bҧng 4.11: Thông tin chi tiӃt cӫa bҧng danh mөc nhân viên (0)
  • Bҧng 4.12: Thông tin chi tiӃt cӫa bҧng sӵ kiӋn bán hàng (0)
  • Bҧng 4.13: Thông tin chi tiӃt cӫa bҧng sӵ kiӋn kho (0)
  • Bҧng 4.14: Thông tin chi tiӃt cӫa bҧng sӵ kiӋn khiӃu nҥi khách hàng (0)

Nội dung

Mөc tiêu và nӝi dung cӫDÿӅ tài

Mөc tiêu cӫa luұQYăQOjxây dӵng hӋ thӕQJ':FKRF{QJW\³71++7KѭѫQJPҥi Vұn tҧi Công nghӋ +RD3KѭӧQJĈӓ´ KӃt quҧ cӫa viӋc nghiên cӭu này là giúp công ty có thӇ gom tҩt cҧ các dӳ liӋu tӯ nhiӅu hӋ thӕng khác nhau cӫa công ty, các hӋ thӕQJÿmYjÿDQJtrong quá trình hoҥWÿӝng vào mӝt CSDL duy nhҩt Chuҭn hóa dӳ liӋu tҥo thành các model phù hӧSÿӇ làm báo cáo, dashboard và phân tích Mӛi model sӁ khác nhau tùy thuӝc vào tӯng phân hӋ cӫa công ty Vӟi viӋc ӭng dөQJÿѭӧc DW vào công ty sӁ giúp cho công ty tӕLѭXÿѭӧc trong viӋc làm báo

FiRQKѭWLӃt kiӋm thӡi gian, dӳ liӋu rừ ràngô ngoài ra, cỏc bỏo cỏo sӁ ÿѭӧc lờn hӋ thӕng BI sӁ tҥo ra nhӳng chart, biӇXÿӗ SKRQJSK~JL~SÿDGҥng trong quá trình phân tích, và hӋ thӕQJFNJQJ sӁ ÿѭӧc chҥy online trên website QrQFiFQKkQYLrQWUѭӣQJSKzQJJLiPÿӕc có thӇ dӉ dàng theo dõi sӕ liӋu cұp nhұp mӝWFiFKQKDQKFKyQJFKtQK[iFNK{QJQKѭWUѭӟFÿk\Pӛi lҫn cҫn sӕ liӋu thì nhân viên phҧi làm tay và gӱi file excel qua email Ĉҧm báo tính an toàn, bҧo mұWÿӝ tin cұy cӫa dӳ liӋu và tránh nguy cѫ mҩt dӳ liӋu ĈӇ xây dӵQJÿѭӧc mӝt DW và BI cӫa công ty cҫn thӵc hiӋQFiFEѭӟc sau:

- Phân tích tình hình hoҥWÿӝng hiӋn tҥi cӫa công ty Tìm hiӇu vҩQÿӅ, mô hình hoҥt ÿӝng và các hӋ thӕng phҫn mӅm hiӋn tҥi cӫa công ty ҧQKKѭӣQJQKѭ thӃ QjRÿӃn viӋc xây dӵng mӝt hӋ thӕng DW và BIĈӇ tӯ ÿyWKҩ\ÿѭӧc nhu cҫu cҩp thiӃt YjÿӅ xuҩt EDQOmQKÿҥo cho viӋc cҫn xây dӵng mӝt hӋ thӕng DW và BI phù hӧp

- Tìm hiӇu vӅ các mô hình DW và BI ÿmÿѭӧc triӇn khai trong các công trình nghiên cӭu liên quan, tӯ ÿy xiFÿӏQKSKѭѫQJSKiSphù hӧp ÿӇ giҧi quyӃt yêu cҫu cҧu công ty

- TiӃn hành thu thұp các yêu cҫu cҫn thiӃt cho viӋc xây dӵng DW và BI ViӋc thu yêu cҫu cҫn nhiӅu thӡi gian, bên cҥQKÿyFyQKLӅu yӃu tӕ ҧQKKѭӣQJÿӃn quá trình xây dӵng hӋ thӕng FNJQg cҫQÿѭӧc xem xét và loҥi bӓ Ngoài ra cҫn tìm hiӇu kӻ các quy trình nghiӋp vө, cách thӭFOѭXGӳ liӋu, và các phҫn mӅPPjF{QJW\ÿDQJVӱ dөng

- Tìm hiӇu các công cө phҫn mӅm cҫn thiӃt cho viӋc xây dӵng hӋ thӕng Tӯ ÿyÿiQK JLiYj[iFÿӏnh phҫn mӅm nào phù hӧp nhҩt vӟi nhu cҫu cӫDF{QJW\QKѭJLiFҧÿӝ thụng dөng cӫa phҫn mờm, danh tiӃQJôĈLӅu này cҫn sӵ phӕi hӧp cӫa nhiӅu phũng EDQQKѭWjLFKtQKNӃ toỏn, thҭPÿӏQK,7ô

- Và cuӕi cùng là triӇn khai xây dӵng hӋ thӕng ÿӇ giҧi quyӃt các vҩQÿӅ ÿmÿѭӧc nêu ra tӯ ÿҫXĈLӇm quan trӑng ӣ Eѭӟc này là thiӃt kӃ ÿѭӧc mӝt mô hình phù hӧp vӟi tӯng nhu cҫu cӫa các phòng ban.

Giӟi hҥQÿӅ tài

Mһc dù viӋc xây dӵng DW và BI là sӵ cҫn thiӃt cӫa công ty cҫn rҩt nhiӅu nhân lӵc, tài chính và thӡi gian Vì thӃ, tác giҧ sӁ tұp trung xây dӵng cho là ba phân hӋ: phân hӋ bán hàng, phân hӋ kho, và phân hӋ khiӃu nҥi khách hàng.

Cҩu trúc báo cáo

T̯m quan tr͕ng cͯa Data Warehouse

Báo cáo, phân tích và thӕng kê là mӝt phҫn không thӇ thiӃu cӫa bҩt kǤ công ty nào Khi công ty sӱ dөng các hӋ thӕng khác nhau trong hoҥWÿӝQJQKѭKӋ thӕng ERP, hӋ thӕng nhân sӵ, hӋ thӕQJ&50ôEҩt kǤ hӋ thӕQJQjRFNJQJVӁ cú phҫn chӭFQăQJEiRFiRWURQJÿy7X\vұy, cú nhӳng khi cҫn sӵ SKkQWtFKFKX\rQVkXKѫQQrQWKѭӡng các công ty sӁ sӱ dөng mӝt công cө ULrQJÿӇ SKkQWtFKÿyOj([FHO0һc dù excel hӛ trӧ rҩt mҥQKWURQJSKkQWtFKQKѭQJQyFNJQJFy nhӳng hҥn chӃ nhҩWÿӏQKQKѭJLӟi hҥn sӕ Oѭӧng dòng cӝt, khó truy cұp mӑi lúc mӑLQѫLWӕFÿӝ xӱ lý khụng cao vӟi dӳ liӋu lӟQôFKtQKÿLӅu này làm giӟi hҥn viӋc phõn tớch

Chính vì thӃ ÿӇ có thӇ có mӝt báo cáo nhanh, chính xác và thân thiӋn vӟLQJѭӡLGQJÿӗng thӡLEiRFiRÿyFyWKӇ chҥy khӕLOѭӧng data lӟn, và luôn coi lҥLÿѭӧc các dӳ liӋu quá khӭ, thì cҫn phҧi có mӝt hӋ thӕng dӳ liӋXÿiSӭQJÿѭӧFÿӝ әQÿӏQKOѭXWUӳ và bҧo mұt cӫa dӳ liӋu Vì vұy, tác giҧ sӁ ÿӅ cұSÿӃn nhӳng tҫm quan trӑng cӫa hӋ thӕng DW và BI ÿӕi vӟi tә chӭc:

- Các tә chӭc có mӝt khӕLOѭӧng dӳ liӋu lӟn thì DW sӁ giúp user dӉ dàng xӱ lý và truy cұp dӳ liӋu

- 7Uѭӟc khi vô DW thì các dӳ liӋu tӯ nhiӅu nguӗn, nhiӅu hӋ thӕng khác nhau sӁ vô chung mӝt nguӗn CSDL duy nhҩWÿLӅu này giúp cho dӳ liӋu trong DW là dӳ liӋXÿm ÿѭӧc chuҭn hóa, xӱ lý và làm sҥch hӛ trӧ cho user sӱ dөng dӳ liӋu

- User sӁ không cҫn phҧi sӱ dөQJFiFSKѭѫQJSKiSWKӫ công trong viӋFOѭXWUӳ, hӧp nhҩt, trích xuҩt dӳ liӋu cho phân tích báo cáo

- Giúp user khai thác dӳ liӋu tӕWKѫQYjSKkQWtFKWӕWKѫQ

- Vӟi mӝt dӳ liӋXÿmÿѭӧc thӕng nhҩt và làm sҥch thì viӋc phát triӇn mӝt hӋ thӕng mӟi vӟi dӳ liӋXFNJWUӣ nên dӉ GjQJKѫQtWWӕn thӡi gian nhân lӵFKѫQ

- Dӳ liӋXÿѭӧFOѭXWUӳ dҥng cҩu trúc sӁ giúp cho quá trình bàn giao hoһFKѭӟng dүn trӣ QrQÿѫQJLҧQKѫQ

- VӅ mһt phân tích yêu cҫu có dӳ liӋu lӏch sӱ thì DW có thӇ ÿiSӭQJÿѭӧc mӝt cách dӉ dàng

- DW hӛ trӧ cho viӋc tҥREiRFiRÿLӅu này giúp giҧi phóng tài nguyên cho các hӋ thӕng khác vì các hӋ thӕQJNKiFWKѭӡng phҧi có các phҫn báo cáo riêng

- Cuӕi cùng vӟi DW sӁ hҥn chӃ ÿѭӧc rӫi ro mҩt dӳ liӋu và giúp dӉ dàng cho viӋc bҧo mұt

- Giúp tә chӭc có thӇ ÿѭDUDQKӳng quyӃWÿӏnh mang tính then chӕt vӟi sӵ ÿDGҥng cӫa hӋ thӕng dashboard, báo cáo

- Vӟi sӵ cҥnh tranh cӫa thӏ WUѭӡng thì viӋc có mӝt BI chuҭn sӁ giúp tә chӭc WăQJÿѭӧc lӧi thӃ cҥnh tranh so vӟLÿӕi thӫ vì dӳ liӋu có thӇ hiӋn ra nhiӅu khía cҥnh khác nhau QKѭNKiFKKjQJ[XKѭӟng thӏ WUѭӡQJô

- Giúp tә chӭFSKkQWtFKÿѭӧc nhӳng insight cӫa dӳ liӋuÿLӅu này có thӇ tiӃt kiӋPÿѭӧc chi phí, giҧm rӫLURYjWăQJdoanh thu

- %,FzQJL~SQKuQUDÿѭӧc nhӳQJQKѭӧFÿLӇPÿӇ cҧi thiӋn dӵa trên dӳ liӋXQKѭVҧn phҭPTX\WUuQKFRQQJѭӡLô

Ĉ̿FWU˱QJFͯa Data Warehouse

&NJQJQKѭQKLӅu hӋ thӕQJNKiF':FNJQJFyQKӳQJÿһFWUѭQJFѫEҧn sau:

- Tính tích hӧp (Integration): Dӳ liӋu cӫD':ÿѭӧc tұp hӧp tӯ nhiӅu nguӗn dӳ liӋu khác

QKDXQKѭFiFKӋ thӕng hoҥWÿӝng, các file, các tài liӋXOLrQTXDQÿӃn hoҥWÿӝng cӫa tә chӭFô

- +ѭӟng chӫ ÿӅ (Subject-Oriented): Dӳ liӋu cӫD':ÿѭӧFOѭXWUӳ WKHRKѭӟng chӫ ÿӅ, phân hӋ, nghiӋp vө mà tә chӭc quan tâm ví dө: thӵc thӇ OjQJj\NKiFKKjQJÿҥi lý và nghiӋp vөEiQKjQJNKRô

- 7tFKONJ\WKHRWKӡi gian (Time-Variant): Dӳ liӋXOѭXWUӳ có tính chҩt lӏch sӵ, bao gӗm nhӳng dӳ liӋu cӫa quá khӭ, dӳ liӋXÿDQJSKiWVLQKӣ hiӋn tҥi và dӳ liӋu sӁ phát sinh trong WѭѫQJODLWKѭӡng dӳ liӋu sӁ bҳWÿҫXÿѭӧFOѭXWҥi thӡLÿLӇm tә chӭc bҳWÿҫu hoҥWÿӝng

- Bҩt biӃn (Non-Volatie): Dӳ liӋu trong DW là dӳ liӋu chӍ ÿѭӧFÿӑFNK{QJÿѭӧFWKD\ÿәi,

KD\[yD':ÿѭӧc thiӃt kӃ cho mөFÿtFKNKDLWKiFYjSKkQWtFKFKӭ không phҧLQKѭFiFCSDL cho nhӳng hӋ thӕng hoҥWÿӝQJEuQKWKѭӡng khác.

Ĉ̿c tính cͯa Data Warehouse

Trong quá trình hoҥWÿӝng cӫa tә chӭc dӳ liӋu sӁ càng ngày càng nhiӅXKѫQ7ә chӭc muӕn sӱ dөng nhӳng dӳ liӋXQj\ÿӇ hӛ trӧ cho hoҥWÿӝng cӫa tә chӭFQKѭNKDLSKi, dӵ ÿRiQSKkQWtFKôQuá trình tұp hӧp và thao tác trên nhӳng dӳ liӋXQj\FyFiFÿһc tính sau:

- Tính tích hӧp: là DW có khҧ QăQJWKXWKұp dӳ liӋu tӯ nhiӅu nguӗn khác nhau và xӱ lý chúng tҥo thành mӝt dӳ liӋu thӕng nhҩt Mӝt DW là mӝt khung nhìn tәng thӇ thӕng nhҩt các khung nhìn khác nhau Ví dө: WURQJÿӅ tài này phân hӋ bán hàng hoһc phân hӋ kho có thӇ sӱ dөng chung mӝt thông tin vӅ sҧn phҭPQKѭQJFiFYҩQÿӅ vӅ sӕ Oѭӧng cӫa sҧn phҭm thì cҫn góc nhìn khác nhau vӅ thông tin sҧn phҭm Mӝt DW sӁ có góc nhìn toàn thӇ vӅ sҧn phҭP*yFQKuQÿyEDRJӗm các chiӅu dӳ liӋu khác nhau tӯ các hӋ thӕng khác nhau

- Tính lӏch sӱ: các dӳ liӋXWURQJ':ÿѭӧc tұp trung theo thӡi gian và thӇ hiӋn mӝt góc nhìn cӫa mӝt chӫ ÿӅ trong mӝWJLDLÿRҥn

- ChӍ ÿӑc: Dӳ liӋu trong DW chӍ ÿѭӧFSKpSÿӑc và truy cұSNK{QJÿѭӧc sӱa, xóa bӣLQJѭӡi sӱ dөng dӳ liӋXÿy

- Không biӃQÿӝng: tính không biӃQÿӝng cӫa dӳ liӋXÿѭӧc hiӇXWKHRQJKƭD dӳ liӋXÿѭӧc

OѭXWUӳ lâu dài trong DW Mһc dù có thêm dӳ liӋu mӟLQKѭQJGӳ liӋXFNJWURQJ':FNJQJ sӁ không bӏ xóa, sӱDĈLӅu này cho phép dӳ liӋu thӇ hiӋQÿѭӧc thông tin theo thӡi gian và cung cҩSÿӫ sӕ liӋu cҫn cho viӋc hӛ trӧ hoҥWÿӝng cӫa tә chӭc

- Dӳ liӋu tәng hӧp: Dӳ liӋu chi tiӃt là thông tin mӭc thҩp nhҩWÿѭӧFOѭXWUӳ trong DW

7Kѭӡng thӇ hiӋn vӅ mһt hoҥWÿӝng nghiӋp vө cӫa tә chӭc Dӳ liӋu tәng hӧSÿѭӧc tích hӧp qua nhiӅXJLDLÿRҥn khác nhau.

Lͫi ích cͯa Data Warehouse

- /ѭXWUӳ dӳ liӋu lӟn và tӕFÿӝ truy cұp nhanh: Dӳ liӋXÿѭӧc tәng hӧp tӯ các nguӗn

NKiFQKDXGRÿyDW có thӇ OѭXtrӳ mӝt khӕLOѭӧng dӳ liӋu lӟn tӯ quá khӭ FKRÿӃn hiӋn tҥi Và do thiӃt kӃ các DM nên user có thӇ truy vҩn dӳ liӋu mӝt cách nhanh chóng mà không cҫQGQJÿӃn mӝt câu truy vҩn dӳ liӋu phӭc tҥp

- 7ăQJFѭӡng tính bҧo mұt dӳ liӋu':FKRSKpSWăQJFѭӡng bҧo mұt bҵng cách cung cҩSFiFWtQKQăQJEҧo mұWQkQJFDRÿѭӧc tích hӧp trong cҩu hình cӫa nó

- Dӳ liӋu әQÿӏnh: Khi dӳ liӋu nҵm trong DW, nó sӁ không bao giӡ WKD\ÿәi hoһc mҩt ÿL'RÿyXVHUNKLFRL dӳ liӋu vӅ quá khӭ vүn nҳPÿѭӧc trӑn vҽQÿѭӧc vҩQÿӅ dӵa vào dӳ liӋu tҥi thӡLÿLӇm ÿy

- ThiӃt kӃ linh hoҥt: DW ÿѭӧc thiӃt kӃ linh hoҥt giúp dӉ dàng tích hӧp dӳ liӋu mӟi, ÿӗng thӡi giúp user dӉ dàng tӵ tҥo ra nhӳng dashboard, report cӫa riêng mình

- 7ăQJlӧi thӃ cҥnh tranh: vӟi viӋc hӛ trӧ ÿDFKLӅu góc nhìn tӯ hoҥWÿӝng kinh doanh tӯ nhiӅXKѭӟng khác nhau, tә chӭc sӁ có lӧi thӃ KѫQWURQJYLӋFÿѭDUDTX\ӃWÿӏnh vӟi nhӳQJÿӕi thӫ cҥnh tranh

- Nâng cao hiӋu quҧ công viӋc: vӟi viӋc các dӳ liӋu có thӇ dӉ dàng xӱ lý, truy cұp thì user sӁ không mҩt thӡi gian làm các report mӝt cách thӫ F{QJÿLӅXQj\JL~SWăQJKLӋu quҧ giҧi quyӃt công viӋc cӫa user

- Cҧi thiӋQÿѭӧc hoҥWÿӝng kinh doanh: tә chӭc có thӇ dӵDYjR':ÿӇ [HP[pWÿiQK giá và khҳc phөc vҩQÿӅ gһp phҧi trong nӝi bӝ tә chӭc

2.1.5 6˯ÿ͛ và mô hình trong Data Warehouse

7URQJVѫÿӗ cӫD':WKuFyKDLVѫÿӗ FKtQKWKѭӡng dùng là:

6WDU6FKHPDVѫÿӗ sao): OjVѫÿӗ ÿѭӧc thiӃt kӃ theo dҥQJKuQKQJ{LVDRÿӇ thӇ hiӋn vӅ mӕi quan hӋ giӳa các table vӟi nhau bao gӗm mӝt bҧng có thông tin chi tiӃWWKѭӡng thӇ hiӋn quá trình phát sinh tәng quan cӫa cỏc phõn hӋ QKѭJLDRGӏch bỏn hàng, sӕ Oѭӧng hàng nhұp xuҩWôYjFiFWDEOH[XQJ quanh thӇ hiӋn các thông tin cho bҧng chi tiӃt bên trên Hình minh hӑDÿѭӧc biӇu diӉQQKѭKuQK

Snowflake Schema Vѫÿӗ bông tuyӃt): vӅ FѫEҧQVѫÿӗ này khá giӕQJVѫÿӗ KuQKVDRQKѭQJ các table thӇ hiӋn mһt thông tin sӁ ÿѭӧc bә sung thêm bҵng mӝt table nӳa, table này sӁ liên kӃt trӵc tiӃSÿӃn table thӇ hiӋn thông tin chӭ không liên kӃt table chi tiӃt Hình minh hӑDÿѭӧc biӇu diӉQQKѭKunh 2.2:

Ki͇n trúc Data Warehouse

Tùy thuӝc vào nhu cҫu cӫa tә chӭc vӅ FѫEҧn DW có 3 kiӃn trúc:

KiӃQWU~F':FѫEҧn: Ĉk\OjNLӃQWU~FFѫEҧn nhҩt cӫa trong DW, lҩy DW làm trung tâm chính, tҩt cҧ các data tӯ source khác nhau sӁ ÿѭӧFÿҭy vô trӵc tiӃS':YjFiFEiRFiRSKkQWtFKFNJQJVӁ lҩy trӵc tiӃSOrQÿy0{KuQKQj\FyPӝWQKѭӧFÿLӇm là DW sӁ phҧLOjQѫL[ӱ lý cho nhiӅu thao tác khác nhau tӯ (7/FKRÿӃn phân WtFKEiRFiRÿLӅu này sӁ làm quá tҧi DW làm giҧm hiӋXQăQJ

(https://docs.oracle.com/cd/E11882_01/server.112/e25554/concept.htm#DWHSG8071)

Hình 2.3: KiӃn trúc Data Warehouse FѫEҧn

KiӃn trúc DW vӟi Staging Area: KiӃn trúc này khác kiӃQWU~FFѫEҧn ӣ chӛ OjEѭӟc thu thұp data khác nhau tӯ nguӗQWKD\Yuÿҭy vào DW sӁ ÿҭ\TXD6WDJLQJ$UHDÿLӅXQj\JL~SEѭӟc xӱ lý tӯ GDWDVRXUFHY{':QKѭQJFyQKѭӧFÿLӇm là ӣ JyFÿӝ khi user sӱ dөng data tӯ ':ÿӇ phân tích, làm báo cáo thì sӁ truy cұp trӵc tiӃp vô DW lúc này sӁ khiӃn cho qua trình lҩy data sӁ bӏ giҧm hiӋXQăQJ

(https://docs.oracle.com/cd/E11882_01/server.112/e25554/concept.htm#DWHSG8073)

KiӃn trúc DW vӟi Staging Area và Data Marts: ÿk\FyWKӇ nói là kiӃn trúc tӕLѭXQhҩt hiӋn giӡ trong viӋc thiӃt kӃ DW TҥLÿk\GDWDWӯ các nguӗn sӁ ÿѭӧFÿҭ\YjRVWDJLQJDUHDWUѭӟc khi vô

DW và user sӁ lҩy dӳ liӋu tӯ '0QѫLÿѭӧc thiӃt kӃ riêng cho tӯng phân hӋ NKiFQKDXÿk\Oj cách chia nhӓ tӯng phân viӋFÿӇ xӱ lý giúp tӕLѭXKyDKLӋu năQJ

Hình 2.4: KiӃn trúc Data Warehouse vӟi Staging Area

(https://docs.oracle.com/cd/E11882_01/server.112/e25554/concept.htm#DWHSG8075)

Thành phҫn trong DW: x Data Sources (Dӳ liӋu nguӗn):

- Dӳ liӋu là dӳ liӋXÿҫu vào cӫa hӋ thӕng DW, bao gӗm nhiӅu loҥi dӳ liӋu khác nhau ÿѭӧc lӵa chӑQÿӇ ÿѭDYjRKӋ thӕng

- Ĉӕi vӟi hӋ thӕng DW hiӋn tҥi thì dӳ liӋu nguӗQÿDSKҫn là nhӳng CSDL giành cho các hӋ thӕng hoҥWÿӝng cӫDF{QJW\QKѭFKLWLӃt giao dӏch bán hàng phát sinh hàng ngày, giao dӏFKNKRô

- &iF&6'/Qj\WKѭӡQJÿѭӧc xây dӵng các hӋ quҧn trӏ &6'/QKѭ2UDFOH0LFURVRIW 64/6HYHU6DS+DQDô

- 1JRjLUD'DWD6RXUFHFNJQJFyWKӇ bao gӗm các dӳ liӋu nҵPErQQJRjL&6'/QKѭFiF file dҥQJWH[WH[FHOôKRһFFNJQJFyWKӇ cỏc CSDL khỏc bờn ngoài cӫa tә chӭFÿѭӧc liên kӃt trӵc tiӃp x Staging Area: WKѭӡQJÿѭӧc thiӃt kӃ OjQѫLOѭXWUӳ tҥm dӳ liӋu và sӁ [yDÿLNKL[ӱ lý xong tӯng tiӃn trình ETL và chuҭn bӏ xӱ lý cho tiӃn trình ETL tiӃSWKHR7KѭӡQJÿѭӧc thiӃt kӃ có hai loҥi DSA:

- '6$ÿtFKOj&6'/FyFҩXWU~FWѭѫQJÿѭѫQJJLӕng vӟL'0OjQѫLFKӭa kӃt quҧ output tҥi cuӕi tiӃQWUuQK(7/WUѭӟFÿyGӳ liӋXÿѭӧc thiӃt kӃ phù hӧSNKLÿѭӧFÿҭ\UD7Kѭӡng chӍ có mӝW'6$ÿtFK

Hình 2.5: KiӃn trúc Data Warehouse vӟi Staging Area và Data Marts

- DSA nguӗn: là CSDL có cҩXWU~FWѭѫQJÿѭѫQJYӟi DS, có thӇ hiӇXQKѭÿk\OjQѫLOѭX trӳ dӳ liӋu khác cӫa DS vì mӑi tӯ DS qua DSA sӁ ÿѭӧc giӳ nguyên Có nhiӅu DSA nguӗn khác nhau tùy theo nhu cҫu cҧXQJѭӡi thiӃt kӃ x Raw Data: tҥi DW sӁ có nhӳng loҥi data cҫn có cҩXWU~FFNJQJQKѭQӝi dung giӕQJQKѭ '6ÿLӅu này giúp cho quá trình ETL trӣ QrQÿѫQJLҧQKѫQQKҩt là cho thiӃt kӃ ':Fѫ bҧn sӁ giúp cҧi thiӋn hiӋXQăQJ x Summary Data: Dҥng data tәng hӧSÿѭӧc xӱ lý mӝWFiFÿѫQJLҧn trong tiӃn trình ETL, WKѭӡQJ ÿѭӧc tҥR UD ÿӇ tӕL ѭX KyD TXi WUuQK FKҥy cӫa ETL ví dө: thay vì tҥo table Transaction Main tӯ table Transaction, có thӇ tҥo 1 table tәng hӧp là Transaction

Summary thì ta sӁ có flow sau: Transaction ± >Transaction Summay ±> Transaction Main x Metadata: OjGDWDFKtQKÿӇ tҥo mô hình cho DM, WKѭӡQJÿѭӧFGQJÿӇ ÿҥi diӋn cho dӳ liӋXNKiF'QJÿӇ [iFÿӏQKFiFÿӕLWѭӧQJWURQJ':0HWDGDWDWKѭӡQJÿѭӧc phân làm ba loҥi chính:

- Business Metadata (Siêu dӳ liӋu doanh nghiӋp)WKѭӡng thӇ hiӋn thông tin cӫa tә chӭc, ÿӏQKQJKƭDWә chӭc và FiFFKtQKViFKWKD\ÿәi Chӭa các thông tin nghiӋp vө trên góc ÿӝ QJѭӡi sӱ dөng hӋ thӕng

- Technical Metadata (Siêu dӳ liӋu kӻ thuұt): bao gӗm tên cӝWNtFKWKѭӟc bҧng kiӇu dӳ liӋu và giá trӏ cho phép Chӭa các thông tin dӳ liӋXWUrQJyFÿӝ QJѭӡi quҧn trӏ và thiӃt kӃ hӋ thӕng

- Operational Metadata (Siêu dӳ liӋu hoҥWÿӝng): thӇ hiӋn tình trҥng hoҥWÿӝng cӫa dӳ liӋXQKѭGӳ liӋXÿmÿѭӧFOѭXWUӳ KD\ÿѭӧc cұp nhұp mӟi, thӇ hiӋQÿѭӧFêQJKƭDlӏch sӱ cӫa dӳ liӋXÿy x Data Mart:

- Có thӇ hiӇXQKѭPӝt DW thu nhӓ, chính vì thӃ nó có nhӳQJÿһFÿLӇm giӕng vӟi DW, ÿѭӧFGQJÿӇ OѭXWUӳ thӇ hiӋn cho mӝt nghiӋp vө bҩt kǤ cӫa tә chӭc

- Các DM có thӇ ÿѭӧc xây dӵng mӝWFiFKÿӝc lұp, phө thuӝc hoһc kӃt hӧp

- '0WKѭӡng có thӇ hiӋn cho toàn bӝ nghiӋp vө hay mӝt phҫn trong nghiӋp vө ÿy

- ViӋc chia nhӓ các nghiӋp vө WKjQKFiF'0JL~SWăQJWӕFÿӝ truy vҩQFNJQJQKѭWKӡi gian phҧn hӗi cӫa dӳ liӋu

- Giúp tiӃt kiӋm chi phí trong quá trình triӇn khai, thay vì triӇn khai toàn bӝ DW ta có thӇ triӇn khai tӯng DM.

OLAP và OLTP

OLTP: Ĉѭӧc sӱ dөng ÿӇ quҧn lý dӳ liӋu real time, cho phép thӵc hiӋn mӝt khӕLOѭӧng dӳ liӋu lӟQQKѭcác giao dӏch hàng ngày Các hӋ thӕng hoҥWÿӝng hàng ngày cӫa tә chӭFWKѭӡng sӱ dөQJ2/73QKѭKӋ thӕng ERP, hӋ thӕng nhõn sӵô

Hình 2.6: Ví dө vӅ mô hình OLTP (https://viblo.asia/p/oltp-va-olap-co-gi-khac-nhau-maGK786BZj2)

- Xӱ lý mӝWOѭӧng dӳ liӋu lӟQOLrQTXDQÿӃn các giao dӏFKÿѫQJLҧn, WK{QJWKѭӡng là thêm, xóa, sӱa và cұp nhұp dӳ liӋu cùng vӟi các truy vҩQÿѫQJLҧQQKѭNLӇm tra sӕ OѭӧQJÿѫQKjQJô

- Cho phép nhiӅXQJѭӡi dùng truy cұp vào cùng mӝt dӳ liӋu, ÿӗng thӡLFNJQJÿҧm bҧo tính toàn vҽn cӫa dӳ liӋu

- TӕFÿӝ xӱ lý dӳ liӋu rҩt nhanh vӟi thӡi gian phҧn hӗi theo mili giây, hiӋu quҧ cӫa hӋ thӕQJ2/73WKѭӡQJÿѭӧFÿREҵng tәng sӕ giao dӏch thӵc hiӋQÿѭӧc mӛi ngày

- Cung cҩp các tұp dӳ liӋXÿѭӧc lұp chӍ mөc, các tұp dӳ liӋXQj\ÿѭӧc sӱ dөQJÿӇ tìm kiӃm, truy xuҩt và truy vҩn nhanh chóng

- Luôn sҹn sàng mӑi lúc: hӋ thӕng OLTP xӱ lý sӕ Oѭӧng lӟn các giao dӏFKÿӗng thӡi, vì vұy bҩt kǤ viӋc mҩt dӳ liӋu hoһc hӋ thӕng ngӯng hoҥWÿӝng FNJQJFyWKӇ gây ra hұu quҧ ÿiQJNӇ và tӕn kém Mӝt bҧQVDROѭXGӳ liӋu hoàn chӍnh phҧi có sҹn trong bҩt kǤ

13 thӡLÿLӇm nào HӋ thӕng OLTP yêu cҫXVDROѭXWKѭӡng xuyên YjWăQJGҫn theo thӡi gian

OLAP Cube (mô hình dӳ liӋXÿDFKLӅu): OjP{KuQKGQJÿӇ hӛ trӧ phân tích dӳ liӋXÿD chiӅu dӵa vào các tiêu chí khác nhau, ví dө: muӕn theo dõi dӳ liӋu doanh thu cӫa công ty theo nhóm khách hàng và sҧn phҭPKD\WKHRQKyPÿӏDÿLӇm và thӡi gian, thì cӭ mӛLQKyPQKѭYұy là mӝt chiӅu dӳ liӋu vì nó cung cҩp các góc nhìn khác nhau

(https://viblo.asia/p/oltp-va-olap-co-gi-khac-nhau-maGK786BZj2)

Các hoҥWÿӝng chính cӫa Olap cube gӗm:

- Slice: là viӋc cӕ ÿӏnh giá trӏ dӳ liӋu khi user chӑn mӝt thông sӕ bҩt kǤ trên mô hình ví dө: dӳ liӋu có doanh thu và nhӳng thông tin liên quan tӯ QăP-2021 thì khi chӑn dӳ liӋu

2021 sӁ show ra toàn bӝ dӳ liӋXOLrQTXDQÿӃQQăP

- Dice: là mӝt thao tác khi chӑn nhiӅu slice

- Drill Down/Up: viӋc truy vҩn dӳ liӋu khi user chӫ ÿӝng giӟi hҥn chiӅu dӳ liӋu lҥi, ví dө: user muӕn coi doanh thu trong tháng 1 cӫa sҧn phҭm A thì user sӁ chӑQWKiQJVDXÿy xem dӳ liӋu sҧn phҭP$WѭѫQJӭng

- Roll up: chӍ viӋc tәng hӧp dӳ liӋu tӯ mӝt công thӭFQjRÿyYtGө muӕn tính tӍ lӋ doanh thu cӫa sҧn phҭm A vӟi sҧn phҭm B, thì user lҩy tәng doanh thu sҧn phҭm A theo mӝt chiӅu dӳ liӋXQjRÿyWLӃp theeo tính tәng doanh thu sҧn phҭm B theo chiӅXWѭѫQJӭng và Roll up cho ra tӍ lӋ

- Pivot: là quá trình xem dӳ liӋu tӯ ÿDFKLӅu khác nhau, ví dө xem doanh thu theo ngày, thỏng, theo vựng, theo sҧn phҭPô

Table Fact (bҧng sӵ kiӋn): WKѭӡng miêu tҧ các hoҥWÿӝng hàng ngày cӫa tә chӭFQKѭJLDR dӏch phát sinh hҵng ngày, bҧng sӵ kiӋQFNJQJFyQpWWѭѫQJWӵ QKѭGҥng data raw

Hình 2.7: Ví dө vӅ mô hình OLAP

Table Dimension (bҧng thӭ nguyên): table WKѭӡng thӇ hiӋn các thông tin chi tiӃW ÿӇ tham chiӃXFKRWDEOHIDFWWKѭӡng ít khi có sӵ thêm dӳ liӋu mӟi so vӟi table fact

Sӵ khác nhau giӳa OLAP và OLTP:

- 2/73ÿѭӧc dựng cho cỏc hӋ thӕng vұn KjQKQKѭ(53&50ôFzQKӋ thӕng OLAP thì các hӋ thӕQJEiRFiR%,GQJÿӇ tҥRFiFGDVKERDUGUHSRUWÿӇ phân tích và hӛ trӧ ra quyӃWÿӏnh

- HӋ thӕng OLTP vӟLQJѭӡi dùng chӫ yӃu sӁ là nhӳQJQKkQYLrQEuQKWKѭӡng, thӵc hiӋn cỏc cụng viӋc hҵng ngày lһSÿLOҥLQKѭQKkQYLrQWKXQJkQQKkQYLrQJLDRGӏFKô

HӋ thӕng OLAP chӫ yӃu hӛ trӧ cho nhà quҧQOờÿLӅXKjQKôÿӇ nҳPÿѭӧc tỡnh hỡnh tәng quan trong hoҥWÿӝng cӫa tә chӭc

- OLTP luôn phҧi cұp nhұp dӳ liӋu liên tөc theo thӡi gian thӵc, OLAP thì chӍ cұp nhұp dӳ liӋu theo mӝt chu kǤ QKѭQJj\WXҫQWKiQJô

- OLTP sӱ dөng mô hình dӳ liӋu dҥng Entity-Relationship vӟi khóa chính và khóa ngoҥi OLAP thì dùng mô hình Mutil-Dimensional

- OLAP hӛ trӧ QJѭӡi dùng vӟi mӝt sӕ Oѭӧng nhҩWÿӏQKWKѭӡng tҫPWUăPQJѭӡi trӣ lҥi, OLTP thì hӛ trӧ hàng ngàn cho tӟi hàng triӋXQJѭӡi dùng

- ĈӇ ÿiQKJLiWӕFÿӝ hiӋu suҩt thì OLTP chú trӑng sӕ Oѭӧng giao dӏFKQJѭӡi dùng truy cұp cùng mӝt lúc Còn OLAP chú trӑng thӡi gian truy vҩn và phҧn hӗi cӫa dӳ liӋu.

Ti͇n Trình ETL

ETL là tӯ viӃt tҳt cӫa Extract - Transform ± Load là mӝt quy trình cho viӋFÿҭy dӳ liӋu tӯ nguӗn này sang nguӗn khác 4XiWUuQK(7/ÿmWUӣ thành mӝt khái niӋm phә biӃn trong nhӳQJQăPYj WKѭӡQJÿѭӧc sӱ dөng trong kho dӳ liӋu

- Extract (Trích xuҩt): OjTXiWUuQKÿӑc, trích xuҩt dӳ liӋu tӯ CSDL

- Transform (BiӃQÿәi): là quá trình chuyӇQÿәi dӳ liӋu ÿѭӧc trích xuҩWWUѭӟFÿyWKjQKFiFGӳ liӋu có cҩu trúc và nӝi dung mong muӕn theo nhu cҫu cӫDQJѭӡi xӱ lý dӳ liӋu Có thӇ biӃn ÿәi bҵng cách xӱ dөng mӝt quy tҳFQjRÿyKD\NӃt hӧp nhiӅu table khác nhau ra mӝt table mӟLô

- Load (Tҧi): là quá trình input dӳ liӋu vào CSDL mình muӕn hay còn gӑLOj&6'/ÿtFK

Mӝt hӋ thӕQJ(7/ÿѭӧc thiӃt kӃ phù hӧp sӁ trích xuҩt dӳ liӋu tӯ các hӋ thӕng nguӗn khác nhau, thӵc thi các tiêu chuҭn vӅ tính nhҩt quán và chҩWOѭӧng dӳ liӋu, tuân thӫ dӳ liӋXÿӇ các nguӗn riêng biӋt có thӇ ÿѭӧc sӱ dөng cùng nhau và cuӕi cùng cung cҩp dӳ liӋu ӣ ÿӏnh dҥng sҹn VjQJÿӇ các nhà phát triӇn ӭng dөng có thӇ xây dӵng ӭng dөQJYjQJѭӡi dùng cuӕi có thӇ ÿѭD ra quyӃWÿӏnh Vì viӋc trích xuҩt dӳ liӋu cҫn có thӡLJLDQQrQWKѭӡng thӵc hiӋn song song ba giai ÿRҥn Hình minh hӑDÿѭӧc biӇu diӉQQKѭKuQK8:

(https://www.stitchdata.com/etldatabase/etl-process/)

*LDLÿRҥn trích xuҩt ± Extract: Ĉk\OjEѭӟc ÿҫu tiên cӫDTX\WUuQK(7/OLrQTXDQÿӃn viӋc trích xuҩt dӳ liӋu tӯ các hӋ thӕng nguӗn khác nhau

Các tә chӭFWKѭӡng sӱ dөng nhiӅu loҥi CSDL khác nhau cho tӯng hӋ thӕQJFKѭDNӇ ÿӃn các dӳ liӋu nҵm bên ngoài hӋ thӕng Các tә chӭFFNJQJVӁ WKѭӡng sӱ dөng mӝt công cө cho phân tích vӟi dӳ liӋu tӯ nhiӅu nguӗn khác nhauĈӇ dӳ liӋXÿѭӧc chuyӇQÿӃn CSDL mӟi, WUѭӟc tiên nó phҧLÿѭӧc trích xuҩt tӯ các nguӗn dӳ liӋu khác nhau

7URQJEѭӟFÿҫu tiên cӫa quy trình ETL, dӳ liӋu có cҩu trúc và không cҩXWU~Fÿѭӧc nhұp và hӧp nhҩt vào mӝt CSDL duy nhҩt Dӳ liӋu có thӇ ÿѭӧc trích xuҩt tӯ nhiӅu hӋ thӕng khác nhau, bao gӗm:

Mһc dù các dӳ liӋu này có thӇ xӱ lý thӫ F{QJQKѭQJYLӋc trích xuҩt dӳ liӋu bҵng tay có thӇ tӕn nhiӅu thӡi gian và dӉ bӏ lӛi Các công cө ETL tӵ ÿӝng hóa quá trình trích xuҩt và tҥo ra mӝt quy trình làm viӋc hiӋu quҧ YjÿiQJWLQFұ\KѫQ

Hình 2.8: Minh hӑa tiӃn trình ETL

7URQJJLDLÿRҥn này cӫa quy trình ETL, các quy tҳFYjTX\ÿӏnh có thӇ ÿѭӧc áp dөQJÿӇ ÿҧm bҧo chҩWOѭӧng dӳ liӋu và khҧ QăQJWUX\Fұp Quá trình chuyӇQÿәi dӳ liӋu bao gӗm mӝt sӕ chӭc QăQJYӅ mһt xӱ lý dӳ liӋXQKѭVDX

- Data cleansing: nhҵm mөFÿtFKFKӍ truyӅn dӳ liӋXÿ~QJFKRPөc tiêu

- Tiêu chu̱n hóa: áp dөng các quy tҳc hay công thӭc nhҩWÿӏnh cho dӳ liӋu

- Lo̩i b͗ dͷ li u trùng l̿p: loҥi bӓ nhӳng dӳ liӋu giӕng nhau hoһc bӏ trùng

- Xác minh: xem xét dӳ liӋXQjRGQJÿѭӧFKD\NK{QJGQJÿѭӧFÿӕi vӟi nhӳng dӳ liӋu có sӵ dӏ WKѭӡng sӁ ÿѭӧFÿһt cҧnh báo

- S̷p x͇p: dӳ liӋXÿѭӧc sҳp xӃp theo tӯng loҥi

- Các tác vͭ khác: nhӳng tác vө khác áp dөQJÿӇ cҧi thiӋn dӳ liӋu

ChuyӇQÿәLWKѭӡQJÿѭӧc coi là phҫn quan trӑng nhҩt cӫa quy trình ETL ChuyӇQÿәi dӳ liӋu cҧi thiӋn tính toàn vҽn dӳ liӋXYjÿҧm bҧo dӳ liӋXÿӃn CSDL ÿtFKmӝt cách chính xác và hiӋu quҧ

%ѭӟc cuӕi cùng trong quy trình ETL là tҧi dӳ liӋXÿmÿѭӧc biӃQÿәi VDQJ&6'/ÿtFK Dӳ liӋu có thӇ ÿѭӧc tҧi tҩt cҧ cùng mӝt lúc (tҧi toàn bӝ) hoһc theo các khoҧng thӡi gian theo lӏch trình (tҧLWăQJGҫn)

- Tҧi toàn bӝ: là tҧi tҩt cҧ dӳ liӋu mà không cҫn thiӃt lұp bҩt kǤ ÿLӅu kiӋn giӟi hҥn dӳ liӋu nào trong suӕt quá trình tҧi MһFGÿLӅu này khá là tiӋn lӧLÿӕi vӟLQJѭӡi xӱ lý dӳ liӋXQKѭQJGRWҧi hӃt toàn bӝ khi gһp lӛi xҧy ra sӁ khó mà kiӇPVRiWÿѭӧc

- TҧLWăQJGҫn: là thiӃt lұp mӝt khoҧng thӡi gian nhҩWÿӏQKWUѭӟc khi tҧi, so sánh vӟi dӳ liӋXÿmWҧLWUѭӟFÿyYӟi dӳ liӋu mӟi tҧi KiӇu tҧi dӳ liӋu này giúp giҧm tài nguyên hӋ thӕng sӱ dөng khi tҧi dӳ liӋXYjÿӗng thӡi dӉ kiӇm soát trong quá trình tҧi.

Khái ni͏m và lͫi ích cͯa Business Intelligence

BI (Kinh doanh thông minh) bao gӗm các chiӃQOѭӧc và công nghӋ ÿѭӧc các doanh nghiӋp sӱ dөQJÿӇ phân tích dӳ liӋu thông tin kinh doanh Công nghӋ BI cung cҩp các góc nhìn vӅ lӏch sӱ, hiӋn tҥi và dӵ ÿRiQYӅ hoҥWÿӝng kinh doanh

ChӭFQăQJSKә biӃn cӫa BI bao gӗm: báo cáo, xӱ lý phân tích trӵc tuyӃn, phân tích, khai phá dӳ liӋu, quҧn lý hiӋu suҩWNLQKGRDQKô

Tә chӭc có thӇ sӱ dөQJ%,ÿӇ hӛ trӧ mӝt loҥt các quyӃWÿӏnh kinh doanh tӯ hoҥWÿӝQJÿӃn chiӃQOѭӧc BI hiӋu quҧ nhҩt khi có thӇ kӃt hӧp dӳ liӋu tӯ thӏ WUѭӡng mà công ty hoҥWÿӝng vӟi dӳ liӋu nӝi bӝ cӫa công ty

BI giúp các tә chӭc hiӇXU}KѫQYӅ thӏ WUѭӡQJÿiQKJLiQKXFҫu và tính phù hӧp cӫa sҧn phҭm, dӏch vө ÿӕi vӟi các phân khúc thӏ WUѭӡng khác nhau

HӋ thӕQJ%,WKѭӡng sӱ dөng dӳ liӋXFyÿѭӧc tӯ ':QrQWK{QJWKѭӡng hai hӋ thӕng này sӁ OX{QÿLFKXQJYӟi nhau

(https://docs.microsoft.com/en-us/power-bi/fundamentals/power-bi-overview)

- Cҧi thiӋQÿӝ chính xác cӫa dӳ liӋu

- ĈѭDUDTX\ӃWÿӏnh tӕWKѫQQKDQKFKyQJKѫQ

- Cҧi thiӋn ÿѭӧc kӃt quҧ ÿҥWÿѭӧc

- DӉ dàng chia sҿ dӳ liӋu mӝt cách an toàn và bҧo mұt

- HiӇn thӏ tӕWKѫQYӅ thông tin tài chính và hoҥWÿӝng dӵa vào trӵc quan hóa dӳ liӋu

- Giҧm sӵ kém hiӋu quҧ trong quá trình hoҥWÿӝng

- Cҧi thiӋn hiӋu quҧ làm viӋc cӫa nhân viên

- HiӋn tҥi các phҫn mӅP%,WKѭӡng có giá cҥnh tranh nên giúp tә chӭc tiӃt kiӋPÿѭӧc chi phí

Hình 2.9: Minh hӑa vӅ mӝt hӋ thӕng Business Intelligence

- 7ăQJFѭӡng tính minh bҥch trong hoҥWÿӝng cӫa tә chӭc

Các nghiên cӭu liên quan

ắ ĈӅ WjL³Xõy dӵng Data Warehouse và Business Intelligence cho cụng ty ngành nhӵa tҥi TP.Hӗ &Kt0LQK´ cӫa NguyӉQ9ăQ7jL nói vӅ xây dӵng hӋ thӕng DW và BI cho công ty theo nghiӋp vө bán hàng ắ ĈӅ WjL³;k\Gӵng kho dӳ liӋu trong kӹ nguyờn khoa hӑc dӳ liӋX´Fӫa NguyӉn Thӏ Minh 3Kѭӧng nói vӅ viӋc xây dӵQJ':FKRWKѭYLӋQWUѭӡng ắ Cụng trỡnh nghiờn cӭX³A Data Warehouse Based Modelling Technique for Stock Market

$QDO\VLV´ cӫa Debomita Mondal, Giridhar Maji, Takaaki Goto, Narayan C Debnath và Soumya Sen nghiên cӭu tұp trung cho viӋF[iFÿӏnh mӝt mô hình kho dӳ liӋu FѫEҧn cho viӋc phân tích thӏ WUѭӡng chӭng khoán ắ Nghiờn cӭX ³$ +ROLVWLF 9LHZ RI 'DWD :DUHKRXVLQJ LQ (GXFDWLRQ´ Fӫa Oswaldo Moscoso-Zea, Joel Paredes-Gualtor, Sergio LujáN-Mora nghiên cӭu vӅ quá trình xây dӵng và triӇn khai DW trong ngành giáo dөc ắ Nghiờn cӭX³$QDO\VLVRIWKH,PSDFWRI%XVLQHVV,QWHOOLJHQFHLQ3XEOLF$GPLQLVWUDWLRQ´ cӫa Rita Ribeiro, Andreia Oliveira, Isabel Pedrosa nghiên cӭu vӅ ӭng dөQJ%,WURQJFѫ quan hành chính công cӫa Bӗ ĈjR1KDYjKLӋu quҧ cӫa BI trong viӋc cҧi thiӋn hiӋu quҧ hoҥWÿӝng cӫDFѫTXDQ ắ Nghiờn cӭX³%XVLQHVV,QWHOOLJHQFHIRU&DUGLRYDVFXODU'LVHDVH$VVHVVPHQW´Fӫa Cristiana Silva, Joana Pereira, Luís Costa, Hugo Peixoto, José Machado, António Abelha nghiên cӭu viӋc phát triӇn DW và xây dӵng các chӍ sӕ cho nhu cҫu phân tích bҵng cách sӱ dөng các công cө BI, giúp cҧi thiӋn viӋFFKăPVyFEӋnh nhân tim mҥch

&+ѬѪ1* : ĈÈ1+*,È HIӊN TRҤNG CÔNG TY CHO XÂY DӴNG Hӊ THӔNG

Các vҩQÿӅ gһp phҧi khi triӇn khai hӋ thӕng

Vӟi mӝt hӋ thӕng mӟi khi triӇn khai tҥLF{QJW\QKѭKӋ thӕng DW và BI thì vҩQÿӅ là không thӇ tránh khӓi, quá trình triӇQNKDLÿzLKӓi sӵ thông thҥo vӅ mһt hӋ thӕng FNJQJQKѭQJKLӋp vө cӫDF{QJW\GѭӟLÿk\OjFiFYҩQÿӅ mà tác giҧ gһp khi triӇn khai hӋ thӕng:

- Do dӳ liӋXOѭXWӯ nhiӅu hӋ thӕng khác nhau, nên cҫn phҧi hiӇu rõ hӋ thӕng mà công W\ÿDQJVӱ dөng

- Không có tài liӋu cho dӳ liӋu cӫa hӋ thӕng, nên cҫn phҧLWKѭӡng xuyên giao tiӃp vӟi XVHUÿӇ có cái nhìn chi tiӃt vӅ dӳ liӋu

- Dӳ liӋu sӱ dөng nhiӅu tӯ viӃt tҳWQrQNKyNKăQWURQJYLӋc hiӇu dӳ liӋu

- Cҫn nҳm bҳWÿѭӧc nghiӋp vө cӫa công ty

- 8VHUFKѭDTXHQWURQJYLӋc sӱ dөng hӋ thӕng DW và BI

- Do triӇn khai hӋ thӕng DW và BI cҫn mӝt sӕ Oѭӧng nhân sӵ có chuyên môn nhҩWÿӏnh nên quá trình triӇQNKDLNKyÿӇ WuPÿѭӧFQJѭӡi cҫn thiӃt

3.2 HӋ thӕng phҫn mӅm và báo cáo cӫa công ty ÿDQJsӱ dөng

Vӟi sӵ cҫn thiӃt trong hoҥWÿӝng kinh doanh thì hiӋn công ty sӱ dөng nhiӅu phҫn mӅm và hӋ thӕng báo cáo khác nhau cho tӯng phân hӋ

- Ĉây là phҫn mӅm mà phòng ban kӃ toán sӱ dөng chính cho viӋc ghi nhұn các nghiӋp vө kӃ toán

- Phҫn mӅm này chӍ dùng cho phòng ban kӃ toán là chính không hӛ trӧ các nghiӋp vө NKiFQKѭQKkQVӵNKRô

- Phҫn mӅm hoҥWÿӝng chính trong nӝi bӝ công ty bao gӗm các nghiӋp vө: x Kinh doanh x Mua hàng x Lұp kӃ hoҥch x Quҧn lý kho

- Phҫn mӅm quҧn lý nhân sӵ ULrQJÿѭӧc công ty order bên ngoài làm

- Quҧn lý viӋc chҩm cụng, nghӍ phộp, làm thờm giӡôcӫa nhõn viờn

HӋ thӕng báo cáo hiӋn tҥi:

- Các báo cáo hiӋQÿDQJÿѭӧc tәng hӧp tӯ nhiӅu nguӗn dӳ liӋu khác nhau bҵng cách thӫ công trên Excel

- Nhân viên báo cáo sӁ OѭXOҥi tӯng file Excel trên hӋ thӕng sever theo mӝWJLDLÿRҥn thӡi gian nhҩWÿӏnh cӫa báo cáo

- Khi có các chӍ sӕ cҫQWKD\ÿәi thì sӁ phҧi cұp nhұp lҥi file Excel và gӱi qua email cho các nhân viên liên quan

3.3 Phҫn mӅm hӛ trӧ xây dӵng hӋ thӕng Data Warehouse và BI

HiӋn nay có khá là nhiӅu phҫn mӅm phөc vө cho viӋc xây dӵng DW và BI &{QJW\ÿmÿiQK giá nhiӅu yӃu tӕ và xin ý kiӃn thҧo luұn tӯ nhiӅu chuyên gia khác nhau nên công ty sӁ sӱ dөng các phҫn mӅm cӫa 0LFURVRIWÿӇ phөc vө cho xây dӵng hӋ thӕng DW và BI gӗm:

- Mӝt hӋ quҧn trӏ FѫVӣ dӳ liӋu quan hӋ ÿѭӧc phát triӇn bӣi Microsoft vӟi mөFÿtFKWҥo YjGX\WUuFѫVӣ dӳ liӋu

- Mӝt máy chӫ FѫVӣ dӳ liӋu, phҫn mӅm có chӭFQăQJFKtQKOjOѭXWUӳ và truy xuҩt dӳ liӋu theo yêu cҫu cӫa các ӭng dөng phҫn mӅm khác

- Có thӇ chҥy trên cùng mӝt máy tính hoһc trên mӝt máy tính khác trên mҥng (bao gӗm cҧ Internet)

- Sӱ dөng ngôn ngӳ T-64/ÿѭӧc phát triӇn bӣi Microsoft

- Mӝt công cө quҧn lý, tích hӧp và xӱ lý dӳ liӋu

- 0{LWUѭӡQJFKtQKÿӇ chҥy ETL, giúp tӵ ÿӝng hóa các chӭFQăQJWURQJ(7/

- Phҫn mӅm hӛ trӧ nhiӅu tác vө khác nhau cho vҩQÿӅ ETL

- Mӝt công cө hӛ trӧ cho viӋc phân tích dӳ liӋu ÿDFKiӅu OLAP

- Là mӝt phҫn trong Microsoft SQL Server

- Giúp tҥo và quҧn lý các mô hình DM mӝt cách linh hoҥt

- Sӱ dөng ngôn ngӳ MDX làm ngôn ngӳ truy vҩn

- Mӝt chӭFQăQJWURQJ0LFURVRIW9LVXDO6WXGLR

- Là môi WUѭӡQJWKDRWiFFKtQKÿӇ tҥo ra các model cho DM

- Các DM tҥo ra sӁ ÿѭӧc deploy và input vào SSAS

- Là công cө cho thiӃt kӅ hӋ thӕng kinh doanh thông minh cӫa Microsoft

- ĈѭӧFGQJÿӇ trӵc quan hóa dӳ liӋu, tҥo các dashboard, report theo yêu cҫu cӫa QJѭӡi sӱ dөng dӳ liӋu

- Vӟi giao diӋn thân thiӋn dӉ sӱ dөQJJL~SQJѭӡi dùng dӉ dàng thao tác

- Hӛ trӧ ngôn ngӳ Data Analysis Expressions (DAX) mӝt ngôn ngӳ do Microsoft phát triӇn cho phân tích, ngôn ngӳ này khá giӕng vӟLH[FHOÿLӅXQj\JL~SQJѭӡi dùng dӉ dàng nҳm bҳt

- Có hai dӏch vө chính cӫD 3RZHU %, Oj 3RZHU %, 'HVNWRS GQJ ÿӇ phát triӇn các dashboard và nhӳng tính toán phӭc tҥp, Power BI Service dùng cho nӅn tҧng web thích hӧp cho nhӳng báo cáo nhanh gӑn Hai dӏch vө Qj\WѭѫQJWiFKӛ trӧ lүn nhau

3.4 Quy trình nghiӋp vө ĈӇ có thӇ xây dӵng các DM chính xác cho tӯng phân hӋ khác nhau, cҫn phҧi hiӇu rõ vӅ quy trình nghiӋp vө cӫa tӯng phân hӋ ÿy&ác quy trình nghiӋp vө này sӁ thӇ hiӋQÿѭӧc luӗng data chҥy trong hӋ thӕQJNKLXVHUWKDRWiFÿӗng thӡLFNJQJKLӇXÿѭӧc cách thӭc nghiӋp vө hӛ trӧ cho vҩQÿӅ phân tích

'RÿӅ tài tұp trung vào ba phân hӋ chính là bán hàng, kho và khiӃu nҥi khách hàng nên tác giҧ sӁ tұp trung vào quy trình cӫa ba phân hӋ trên bao gӗPVѫÿӗ quy trình và diӉn giҧi tӯng EѭӟFWURQJTX\WUuQKÿy

- Khách hàng sӁ yêu cҫXÿһt mua sҧn phҭm thông qua các kênh bán hàng khác nhau cӫa công ty

- Nhân viên bán hàng sӁ [HP[pWÿiQKJLi[HPFyÿiSӭQJÿѭӧc yêu cҫu cӫa khách hàng không

- NӃu không thì sӁ tӯ chӕi yêu cҫXÿyQӃu ÿѭӧc thì sӁ bҳWÿҫu tҥRÿѫQKjQJ

Hình 3.1: Quy trình nghiӋp vө bán hàng

- Dӵa trên nhӳng yêu cҫXWUѭӟFÿyQKkQYLrQVӁ tҥRÿѫQKjQJJӗm sӕ OѭѫQJÿѫQJLi và ngày giao hàng

- ĈѫQKjQJVӁ là phiӃXEiQKjQJQKѭQJFKѭDÿѭӧc giao

- Ĉánh giá sӕ Oѭӧng, giá cҧQJj\JLDRYjSKѭѫQJWKӭc thanh toán

- Sau khi duyӋWÿѫQnhân viên sӁ tҥo mӝt phiӃu bán hàng dӵa trên thông tin ÿѫQKjQJ ÿmÿѭӧc tҥo bên trên

- PhiӃu bán hàng này sӁ ÿѭӧc chuyӇn xuӕQJÿѫQYӏ NKRÿӇ xuҩt hàng

- Chuҭn bӏ hàng hóa theo phiӃu bán hàng bên trên và

- Xác nhұn xuҩt kho và giao sҧn phҭPÿӃn tay khách hàng

- Thu tiӅn cӫDNKiFKKjQJÿtQKNqPPӝt phiӃu thu tӯ khách hàng

- LѭXWUӳ lҥi cỏc thụng tin bao gӗm phiӃXEiQKjQJÿѫQKjQJKyDÿѫQô

- ĈӅ xuҩt mua sҧn phҭm tӯ FiFQKjPi\ÿӇ ÿҧm bҧo sӕ Oѭӧng sҧn phҭm cung ӭng

- ĈѫQYӏ mua hàng sӁ xem xét, nӃXÿӗng ý sӁ tҥo phiӃu yêu cҫu mua hàng

- Ĉánh giá sӕ Oѭӧng mua, giá cҧ, ngày nhұQKjQJYjSKѭѫQJWKӭc thanh toán

Hình 3.2: Quy trình nghiӋp vө kho

- Tҥo phiӃu mua hàng dӵa vào phiӃu yêu cҫu mua hàng bên trên

- Ĉӗng thӡi tҥo phiӃu yêu cҫu nhұSNKRNKLPXDÿѭӧc hàng

- Sau khi KjQJÿѭӧc mua sӁ ÿѭӧFÿѭDY{NKR

- Thӫ NKRÿiQKJLiOҥLÿҫ\ÿӫ sӕ OѭӧQJÿѫQKjQJÿѭӧc nhұp và tҥo phiӃu nhұp kho

- KLFyÿѫQKjQJWӯ khách hàng sӁ có yêu cҫu xuҩt kho

- ĈiQKJLi\rXFҫXFyÿѭӧFÿiSӭng, nӃXÿѭӧc thì sӁ duyӋWÿѫQ

- Ĉánh giá sӕ Oѭӧng sҧn phҭm xuҩt kho, ngày xuҩt kho

- SDXNKLÿѭӧc duyӋt sӁ tҥo phiӃu xuҩt kho cho sҧn phҭm

- PhiӃu xuҩWNKRQj\FNJQJVӁ ÿѭӧFÿtQKNqPWKHRÿѫQKjQJbán

- KiӇm kê lҥi hàng còn tӗn sau khi xuҩt

- LѭXWUӳ lҥi các thông tin giҩy tӡ liên quan

Hình 3.3: Quy trình nghiӋp vө khiӃu nҥi khách hàng DiӉn giҧi quy trình

- Khách hàng khiӃu nҥi vӅ sҧn phҭm cӫa công ty thông qua email, ÿLӋn thoҥi trӵc tiӃp hay tҥLÿҥi lý bán hàng

- Nhân viên hӛ trӧ sӁ ghi nhұn các khiӃu nҥi này vô hӋ thӕng

- Tҥo ÿѫQNKLӃu nҥi gӗm sҧn phҭm, thӡi gian, khách hàng

Xem xét giҧi pháp Hài lòng

- Nhân viên xem xét, xác thӵc lҥi các khiӃu nҥi

- NӃXÿk\ÿ~QJOjNKLӃu nҥLFKtQKÿiQJQKkQYLrQVӁ tҥRÿѫQNKLӃu nҥi

- ĈӅ xuҩWSKѭѫQJSKiS[ӱ lý cho các khiӃu nҥi liên quan

- TҥLEѭӟc này sӁ ÿiQKJLiFiFJLҧi pháp có thӇ xӱ OêWKѭӡng thì sӁ nêu giҧi pháp trӵc tiӃp vӟLNKiFKKjQJÿӇ xem xét ý kiӃn

- NӃu khách hàng không hài lòng quay lҥLEѭӟFSKѭѫQJSKiS[ӱ OêÿӇ ÿiQKJLiYjÿӅ xuҩWSKѭѫQJSKiSPӟi

- NӃu khách hàng hài lòng sӁ giҧi quyӃt cho khách hàng

- Sau khi giҧi quyӃt xong ghi nhұn lҥi phҧn hӗi cӫa khách hàng

- LѭXtrӳ lҥi các thông tin giҩy tӡ liên quan

&+ѬѪ1* : XÂY DӴNG DATA WAREHOUSE VÀ BUSINESS INTELLIGENCE

4.1 Yêu cҫu tӯ công ty và QJѭӡi dùng hӋ thӕng

HiӋQQD\F{QJW\ÿDQJsӱ dөng nhiӅu hӋ thӕng vӟi các CSDL khác nhau trong công tác quҧn lý và kinh doanh, ÿӗng thӡLGROѭXGӳ liӋu ӣ nhiӅu CSDL khác nhau nên vӅ mһt cҩu trúc data FNJQJFyVӵ khác nhau Vì thӃ khi cҫn các báo cáo phөc vө cho thӕng kê, phân tích thì cҫn phҧi lҩy sӕ liӋu tӯ nhiӅu CSDL và xӱ lý kӃt nӕi chuҭn hóa dӳ liӋu

User sӁ dөQJH[FHOÿӇ tәng hӧp lҥi dӳ liӋXVDXÿy[k\Gӵng thành mӝt báo cáo riêng, viӋc này có hҥn chӃ là excel chӍ xӱ lý dӵ liӋu tҫm mӝt triӋu dòng và tӕFÿӝ xӱ lý rҩt chұPÿӗng thӡi nӃu muӕn coi dӳ liӋu quá khӭ user phҧLOѭXULrQJWKjQKQKLӅu file excel cӫa mӛi tháng Chính vì nhӳng bҩt cұp trên nên user FyÿѭDUDQKӳng yêu cҫXQKѭVDX: x Cҫn mӝt hӋ thӕQJÿӇ user có thӇ dӉ dàng phân tích theo nhiӅu thông tin khác nhau x MӝW&6'/ÿӇ OѭXWUӳ tҩt cҧ dӳ liӋu tӯ các hӋ thӕng khác nhau x HӋ thӕng có thӇ dӉ dàng phân tích dӳ liӋu mӝt cách nhanh chóng x PhҧLÿҧm bҧRÿѭӧFÿӝ bҧo mұt YjNK{QJFyQJX\FѫPҩt dӳ liӋu x Giao diӋn QJѭӡi dùng dashboard, báo cáo thân thiӋn và dӉ sӱ dөng vӟi user

4.2 Các phân hӋ ÿӇ xây dӵng hӋ thӕng

Dӵa vào nhӳng yêu cҫu cӫa user, Tác giҧ sӁ thiӃt kӃ mӝt hӋ thӕng DW và BI Sau khi xem xét và phân tích dӵa vào thӡLJLDQYjÿӝ ѭXWLrQÿӕi vӟi tӯng phҫn viӋc mà user yêu cҫu, nên ӣ ÿk\7iFJLҧ sӁ tұp trung xây dӵng cho ba phân hӋ là : bán hàng, kho, và khiӃu nҥi khách hàng cӫa trong công ty

Mӛi phân hӋ sӁ có mӝt mô hình phù hӧp WѭѫQJӭng, mӛi mô hình sӁ bao gӗm dӳ liӋu và chiӅu dӳ liӋu

4.3 Mô hình Data Warehouse ÿӅ xuҩt

Mô hình sӁ bao gӗm: x Data Source: ÿk\OjQѫLbҳWÿҫu cӫa dӳ liӋu tӯ nhiӅu CSDL khác nhau gӗm có: phҫn mӅm ERP, phҫn mӅm quҧn lý kho, phҫn mӅPFKăPVyFNKiFKKjQJYjFiFGӳ liӋu bên ngoài ҧQKKѭӣng ÿӃn các phân hӋ PjÿӅ tài nhҳPÿӃn x DSA: ÿk\OjQѫLOѭXWUӳ ÿҫu vào cӫa dӳ liӋu tӯ Data Sourceÿѭӧc input theo dҥng 1:1 bao gӗm cҩu trúc và nӝi dung cӫa dӳ liӋu&iFGDWDÿѭӧFOѭXWҥLÿk\VӁ ÿѭӧc xӱ lý VDXÿyVӁ ÿѭӧc load lên DW, DSA OjFNJQJOj QѫLTXҧn lý quá trình ETL x Data Warehouse: ÿk\VӁ nѫLOѭu trӳ dӳ liӋu cҫn thiӃt cho phân tích báo cáo gӗm: ắ Raw Data là nhӳng data lҩy 1:1 tӯ DSA, nhӳQJGDWDQj\ÿѭӧc lӵa chӑn ÿӇ xӱ lý riêng và phân tích thêm ắ Summary Data: là nhӳQJGDWDÿѭӧc cұp nhұp khi dӳ liӋXÿѭӧFÿѭDYjR':EDR gӗm nhӳng dӳ liӋu ÿѭӧc tәng hӧSFѫEҧQYjÿѫQJLҧQYDLWUzFKtQKOjJL~SWăQJ tӕc hiӋu suҩt truy cұp ắ Meta Data: là thụng tin ÿӇ [iFÿӏnh dӳ liӋu 9DLWUzFKtQKOjÿѫQJLҧn cҩu trỳc và nӝi dөng cӫa dӳ liӋu, cho phép các nhà phân tích dӳ liӋu phân loҥL ÿӏnh vӏ và Kѭӟng các truy vҩQÿӃn dӳ liӋu cҫn thiӃt x Data Mart: nhӳng kho dӳ liӋu cho tӯng phân hӋ WURQJÿӅ tài này gӗm bán hàng, kho, khiӃu nҥi khách hàng bao gӗm dӳ liӋu và các mӕi quan hӋ giӳa bҧng Fact và bҧng Dimension

30 x Business Intelligence: là hӋ thӕng chӭa nhӳng dashboard, report dҥng thӕng kê, phân WtFKÿѭӧc xây dӵng trӵc tiӃp trên tool BI cө thӇ ӣ ÿk\OjSKҫn mӅm Power BI x ETL: tiӃn trình trích xuҩt, biӃQÿәi và tҧi dӳ liӋu

4.4 Xây dӵng các Data Mart

4.4.1 Thông tin chi ti͇t các table cho Data Mart

Các table cӫa Data Mart là các table chính cho quá trình tҥo mô hình cho tӯng phân hӋ, chính vì vұy các table này có schema riêng là dw ÿӇ dӉ dàng phân biӋWFNJQJQKѭWLӋn quҧn lý trong quá trỡnh ETL, và schema này sӁ ÿѭӧF OѭX GѭӟL GDWDEDVH QKѭdw.Date_Dim, dw.Product_dimô

QKѭQJNKLOrQPRGHOVӁ bӓ VFKHPDÿӇ tҥo thân thiӋt vӅ mһt giao diӋn QJѭӡi dùng

Table dw.Date_Dim: thӇ hiӋn thông tin vӅ mһt thӡi gianÿk\OjWDEOHFѫEҧn nhҩt khi xây dӵng các DM, vì bҩt cӭ quá trình làm dashboard, report hay phân tích dӳ liӋXWKuÿӅu cҫn xem xét theo yӃu tӕ thӡi gian Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact khác theo cӝt Date vӟi mӕi quan hӋ là 1:N

Date Date Ngày theo format:yyyy-mm-dd

FullMonthName Varchar Tháng theo tên

Bҧng 4.1: Thông tin chi tiӃt cӫa bҧng danh mөc thӡi gian

Table dw.Product_Dim: thӇ hiӋn thông tin cӫa sҧn phҭmÿk\FNJQJOjPӝWWDEOHFѫEҧn nӳa vì chiӅu sҧn phҭm vүn là chiӅXÿѭӧc coi nhiӅu nhҩt trong bҩt kǤ công ty nào Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact khác theo cӝt ID vӟi mӕi quan hӋ là 1:N

Product_name Varchar Tên sҧn phҭm

Category_id Number Mã loҥi sҧn phҭm

Bҧng 4.2: Thông tin chi tiӃt cӫa bҧng danh mөc sҧn phҭm

Table dw.Product_Category_Dim: thӇ hiӋn thông tin cӫa loҥi sҧn phҭmÿӇ viӋc tӕLѭXKyD

PRGHOFNJQJQKѭJLҧm tҧi cho table Product thì tác giҧ tách riêng ra loҥi sҧn phҭm riêng, thông

WKѭӡng trong thӕng kê, các nhà quҧn lý hiӃm khi coi chi tiӃt tӯng sҧn phҭm mà hӑ sӁ coi thӕng kê cӫa nhóm hay loҥi sҧn phҭPÿy Table này sӁ kӃt nӕi 2 chiӅu vӟi các table dw.Product_Dim theo cӝt ID vӟi mӕi quan hӋ là 1:N

Id Number Mã loҥi sҧn phҭm

Type Varchar Tên loҥi sҧn phҭm

Bҧng 4.3: Thông tin chi tiӃt cӫa bҧng danh mөc loҥi sҧn phҭm

Phҫn mӅm hӛ trӧ xây dӵng hӋ thӕng Data Warehouse và BI

HiӋn nay có khá là nhiӅu phҫn mӅm phөc vө cho viӋc xây dӵng DW và BI &{QJW\ÿmÿiQK giá nhiӅu yӃu tӕ và xin ý kiӃn thҧo luұn tӯ nhiӅu chuyên gia khác nhau nên công ty sӁ sӱ dөng các phҫn mӅm cӫa 0LFURVRIWÿӇ phөc vө cho xây dӵng hӋ thӕng DW và BI gӗm:

- Mӝt hӋ quҧn trӏ FѫVӣ dӳ liӋu quan hӋ ÿѭӧc phát triӇn bӣi Microsoft vӟi mөFÿtFKWҥo YjGX\WUuFѫVӣ dӳ liӋu

- Mӝt máy chӫ FѫVӣ dӳ liӋu, phҫn mӅm có chӭFQăQJFKtQKOjOѭXWUӳ và truy xuҩt dӳ liӋu theo yêu cҫu cӫa các ӭng dөng phҫn mӅm khác

- Có thӇ chҥy trên cùng mӝt máy tính hoһc trên mӝt máy tính khác trên mҥng (bao gӗm cҧ Internet)

- Sӱ dөng ngôn ngӳ T-64/ÿѭӧc phát triӇn bӣi Microsoft

- Mӝt công cө quҧn lý, tích hӧp và xӱ lý dӳ liӋu

- 0{LWUѭӡQJFKtQKÿӇ chҥy ETL, giúp tӵ ÿӝng hóa các chӭFQăQJWURQJ(7/

- Phҫn mӅm hӛ trӧ nhiӅu tác vө khác nhau cho vҩQÿӅ ETL

- Mӝt công cө hӛ trӧ cho viӋc phân tích dӳ liӋu ÿDFKiӅu OLAP

- Là mӝt phҫn trong Microsoft SQL Server

- Giúp tҥo và quҧn lý các mô hình DM mӝt cách linh hoҥt

- Sӱ dөng ngôn ngӳ MDX làm ngôn ngӳ truy vҩn

- Mӝt chӭFQăQJWURQJ0LFURVRIW9LVXDO6WXGLR

- Là môi WUѭӡQJWKDRWiFFKtQKÿӇ tҥo ra các model cho DM

- Các DM tҥo ra sӁ ÿѭӧc deploy và input vào SSAS

- Là công cө cho thiӃt kӅ hӋ thӕng kinh doanh thông minh cӫa Microsoft

- ĈѭӧFGQJÿӇ trӵc quan hóa dӳ liӋu, tҥo các dashboard, report theo yêu cҫu cӫa QJѭӡi sӱ dөng dӳ liӋu

- Vӟi giao diӋn thân thiӋn dӉ sӱ dөQJJL~SQJѭӡi dùng dӉ dàng thao tác

- Hӛ trӧ ngôn ngӳ Data Analysis Expressions (DAX) mӝt ngôn ngӳ do Microsoft phát triӇn cho phân tích, ngôn ngӳ này khá giӕng vӟLH[FHOÿLӅXQj\JL~SQJѭӡi dùng dӉ dàng nҳm bҳt

- Có hai dӏch vө chính cӫD 3RZHU %, Oj 3RZHU %, 'HVNWRS GQJ ÿӇ phát triӇn các dashboard và nhӳng tính toán phӭc tҥp, Power BI Service dùng cho nӅn tҧng web thích hӧp cho nhӳng báo cáo nhanh gӑn Hai dӏch vө Qj\WѭѫQJWiFKӛ trӧ lүn nhau.

Quy trình nghiӋp vө

Nghi͏p vͭ bán hàng

- Khách hàng sӁ yêu cҫXÿһt mua sҧn phҭm thông qua các kênh bán hàng khác nhau cӫa công ty

- Nhân viên bán hàng sӁ [HP[pWÿiQKJLi[HPFyÿiSӭQJÿѭӧc yêu cҫu cӫa khách hàng không

- NӃu không thì sӁ tӯ chӕi yêu cҫXÿyQӃu ÿѭӧc thì sӁ bҳWÿҫu tҥRÿѫQKjQJ

Hình 3.1: Quy trình nghiӋp vө bán hàng

- Dӵa trên nhӳng yêu cҫXWUѭӟFÿyQKkQYLrQVӁ tҥRÿѫQKjQJJӗm sӕ OѭѫQJÿѫQJLi và ngày giao hàng

- ĈѫQKjQJVӁ là phiӃXEiQKjQJQKѭQJFKѭDÿѭӧc giao

- Ĉánh giá sӕ Oѭӧng, giá cҧQJj\JLDRYjSKѭѫQJWKӭc thanh toán

- Sau khi duyӋWÿѫQnhân viên sӁ tҥo mӝt phiӃu bán hàng dӵa trên thông tin ÿѫQKjQJ ÿmÿѭӧc tҥo bên trên

- PhiӃu bán hàng này sӁ ÿѭӧc chuyӇn xuӕQJÿѫQYӏ NKRÿӇ xuҩt hàng

- Chuҭn bӏ hàng hóa theo phiӃu bán hàng bên trên và

- Xác nhұn xuҩt kho và giao sҧn phҭPÿӃn tay khách hàng

- Thu tiӅn cӫDNKiFKKjQJÿtQKNqPPӝt phiӃu thu tӯ khách hàng

- LѭXWUӳ lҥi cỏc thụng tin bao gӗm phiӃXEiQKjQJÿѫQKjQJKyDÿѫQô

Nghi͏p vͭ kho

- ĈӅ xuҩt mua sҧn phҭm tӯ FiFQKjPi\ÿӇ ÿҧm bҧo sӕ Oѭӧng sҧn phҭm cung ӭng

- ĈѫQYӏ mua hàng sӁ xem xét, nӃXÿӗng ý sӁ tҥo phiӃu yêu cҫu mua hàng

- Ĉánh giá sӕ Oѭӧng mua, giá cҧ, ngày nhұQKjQJYjSKѭѫQJWKӭc thanh toán

Hình 3.2: Quy trình nghiӋp vө kho

- Tҥo phiӃu mua hàng dӵa vào phiӃu yêu cҫu mua hàng bên trên

- Ĉӗng thӡi tҥo phiӃu yêu cҫu nhұSNKRNKLPXDÿѭӧc hàng

- Sau khi KjQJÿѭӧc mua sӁ ÿѭӧFÿѭDY{NKR

- Thӫ NKRÿiQKJLiOҥLÿҫ\ÿӫ sӕ OѭӧQJÿѫQKjQJÿѭӧc nhұp và tҥo phiӃu nhұp kho

- KLFyÿѫQKjQJWӯ khách hàng sӁ có yêu cҫu xuҩt kho

- ĈiQKJLi\rXFҫXFyÿѭӧFÿiSӭng, nӃXÿѭӧc thì sӁ duyӋWÿѫQ

- Ĉánh giá sӕ Oѭӧng sҧn phҭm xuҩt kho, ngày xuҩt kho

- SDXNKLÿѭӧc duyӋt sӁ tҥo phiӃu xuҩt kho cho sҧn phҭm

- PhiӃu xuҩWNKRQj\FNJQJVӁ ÿѭӧFÿtQKNqPWKHRÿѫQKjQJbán

- KiӇm kê lҥi hàng còn tӗn sau khi xuҩt

- LѭXWUӳ lҥi các thông tin giҩy tӡ liên quan.

Nghi͏p vͭ khi͇u n̩i khách hàng

Hình 3.3: Quy trình nghiӋp vө khiӃu nҥi khách hàng DiӉn giҧi quy trình

- Khách hàng khiӃu nҥi vӅ sҧn phҭm cӫa công ty thông qua email, ÿLӋn thoҥi trӵc tiӃp hay tҥLÿҥi lý bán hàng

- Nhân viên hӛ trӧ sӁ ghi nhұn các khiӃu nҥi này vô hӋ thӕng

- Tҥo ÿѫQNKLӃu nҥi gӗm sҧn phҭm, thӡi gian, khách hàng

Xem xét giҧi pháp Hài lòng

- Nhân viên xem xét, xác thӵc lҥi các khiӃu nҥi

- NӃXÿk\ÿ~QJOjNKLӃu nҥLFKtQKÿiQJQKkQYLrQVӁ tҥRÿѫQNKLӃu nҥi

- ĈӅ xuҩWSKѭѫQJSKiS[ӱ lý cho các khiӃu nҥi liên quan

- TҥLEѭӟc này sӁ ÿiQKJLiFiFJLҧi pháp có thӇ xӱ OêWKѭӡng thì sӁ nêu giҧi pháp trӵc tiӃp vӟLNKiFKKjQJÿӇ xem xét ý kiӃn

- NӃu khách hàng không hài lòng quay lҥLEѭӟFSKѭѫQJSKiS[ӱ OêÿӇ ÿiQKJLiYjÿӅ xuҩWSKѭѫQJSKiSPӟi

- NӃu khách hàng hài lòng sӁ giҧi quyӃt cho khách hàng

- Sau khi giҧi quyӃt xong ghi nhұn lҥi phҧn hӗi cӫa khách hàng

- LѭXtrӳ lҥi các thông tin giҩy tӡ liên quan

&+ѬѪ1* : XÂY DӴNG DATA WAREHOUSE VÀ BUSINESS INTELLIGENCE

4.1 Yêu cҫu tӯ công ty và QJѭӡi dùng hӋ thӕng

HiӋQQD\F{QJW\ÿDQJsӱ dөng nhiӅu hӋ thӕng vӟi các CSDL khác nhau trong công tác quҧn lý và kinh doanh, ÿӗng thӡLGROѭXGӳ liӋu ӣ nhiӅu CSDL khác nhau nên vӅ mһt cҩu trúc data FNJQJFyVӵ khác nhau Vì thӃ khi cҫn các báo cáo phөc vө cho thӕng kê, phân tích thì cҫn phҧi lҩy sӕ liӋu tӯ nhiӅu CSDL và xӱ lý kӃt nӕi chuҭn hóa dӳ liӋu

User sӁ dөQJH[FHOÿӇ tәng hӧp lҥi dӳ liӋXVDXÿy[k\Gӵng thành mӝt báo cáo riêng, viӋc này có hҥn chӃ là excel chӍ xӱ lý dӵ liӋu tҫm mӝt triӋu dòng và tӕFÿӝ xӱ lý rҩt chұPÿӗng thӡi nӃu muӕn coi dӳ liӋu quá khӭ user phҧLOѭXULrQJWKjQKQKLӅu file excel cӫa mӛi tháng Chính vì nhӳng bҩt cұp trên nên user FyÿѭDUDQKӳng yêu cҫXQKѭVDX: x Cҫn mӝt hӋ thӕQJÿӇ user có thӇ dӉ dàng phân tích theo nhiӅu thông tin khác nhau x MӝW&6'/ÿӇ OѭXWUӳ tҩt cҧ dӳ liӋu tӯ các hӋ thӕng khác nhau x HӋ thӕng có thӇ dӉ dàng phân tích dӳ liӋu mӝt cách nhanh chóng x PhҧLÿҧm bҧRÿѭӧFÿӝ bҧo mұt YjNK{QJFyQJX\FѫPҩt dӳ liӋu x Giao diӋn QJѭӡi dùng dashboard, báo cáo thân thiӋn và dӉ sӱ dөng vӟi user

4.2 Các phân hӋ ÿӇ xây dӵng hӋ thӕng

Dӵa vào nhӳng yêu cҫu cӫa user, Tác giҧ sӁ thiӃt kӃ mӝt hӋ thӕng DW và BI Sau khi xem xét và phân tích dӵa vào thӡLJLDQYjÿӝ ѭXWLrQÿӕi vӟi tӯng phҫn viӋc mà user yêu cҫu, nên ӣ ÿk\7iFJLҧ sӁ tұp trung xây dӵng cho ba phân hӋ là : bán hàng, kho, và khiӃu nҥi khách hàng cӫa trong công ty

Mӛi phân hӋ sӁ có mӝt mô hình phù hӧp WѭѫQJӭng, mӛi mô hình sӁ bao gӗm dӳ liӋu và chiӅu dӳ liӋu

4.3 Mô hình Data Warehouse ÿӅ xuҩt

Mô hình sӁ bao gӗm: x Data Source: ÿk\OjQѫLbҳWÿҫu cӫa dӳ liӋu tӯ nhiӅu CSDL khác nhau gӗm có: phҫn mӅm ERP, phҫn mӅm quҧn lý kho, phҫn mӅPFKăPVyFNKiFKKjQJYjFiFGӳ liӋu bên ngoài ҧQKKѭӣng ÿӃn các phân hӋ PjÿӅ tài nhҳPÿӃn x DSA: ÿk\OjQѫLOѭXWUӳ ÿҫu vào cӫa dӳ liӋu tӯ Data Sourceÿѭӧc input theo dҥng 1:1 bao gӗm cҩu trúc và nӝi dung cӫa dӳ liӋu&iFGDWDÿѭӧFOѭXWҥLÿk\VӁ ÿѭӧc xӱ lý VDXÿyVӁ ÿѭӧc load lên DW, DSA OjFNJQJOj QѫLTXҧn lý quá trình ETL x Data Warehouse: ÿk\VӁ nѫLOѭu trӳ dӳ liӋu cҫn thiӃt cho phân tích báo cáo gӗm: ắ Raw Data là nhӳng data lҩy 1:1 tӯ DSA, nhӳQJGDWDQj\ÿѭӧc lӵa chӑn ÿӇ xӱ lý riêng và phân tích thêm ắ Summary Data: là nhӳQJGDWDÿѭӧc cұp nhұp khi dӳ liӋXÿѭӧFÿѭDYjR':EDR gӗm nhӳng dӳ liӋu ÿѭӧc tәng hӧSFѫEҧQYjÿѫQJLҧQYDLWUzFKtQKOjJL~SWăQJ tӕc hiӋu suҩt truy cұp ắ Meta Data: là thụng tin ÿӇ [iFÿӏnh dӳ liӋu 9DLWUzFKtQKOjÿѫQJLҧn cҩu trỳc và nӝi dөng cӫa dӳ liӋu, cho phép các nhà phân tích dӳ liӋu phân loҥL ÿӏnh vӏ và Kѭӟng các truy vҩQÿӃn dӳ liӋu cҫn thiӃt x Data Mart: nhӳng kho dӳ liӋu cho tӯng phân hӋ WURQJÿӅ tài này gӗm bán hàng, kho, khiӃu nҥi khách hàng bao gӗm dӳ liӋu và các mӕi quan hӋ giӳa bҧng Fact và bҧng Dimension

30 x Business Intelligence: là hӋ thӕng chӭa nhӳng dashboard, report dҥng thӕng kê, phân WtFKÿѭӧc xây dӵng trӵc tiӃp trên tool BI cө thӇ ӣ ÿk\OjSKҫn mӅm Power BI x ETL: tiӃn trình trích xuҩt, biӃQÿәi và tҧi dӳ liӋu

4.4 Xây dӵng các Data Mart

4.4.1 Thông tin chi ti͇t các table cho Data Mart

Các table cӫa Data Mart là các table chính cho quá trình tҥo mô hình cho tӯng phân hӋ, chính vì vұy các table này có schema riêng là dw ÿӇ dӉ dàng phân biӋWFNJQJQKѭWLӋn quҧn lý trong quá trỡnh ETL, và schema này sӁ ÿѭӧF OѭX GѭӟL GDWDEDVH QKѭdw.Date_Dim, dw.Product_dimô

QKѭQJNKLOrQPRGHOVӁ bӓ VFKHPDÿӇ tҥo thân thiӋt vӅ mһt giao diӋn QJѭӡi dùng

Table dw.Date_Dim: thӇ hiӋn thông tin vӅ mһt thӡi gianÿk\OjWDEOHFѫEҧn nhҩt khi xây dӵng các DM, vì bҩt cӭ quá trình làm dashboard, report hay phân tích dӳ liӋXWKuÿӅu cҫn xem xét theo yӃu tӕ thӡi gian Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact khác theo cӝt Date vӟi mӕi quan hӋ là 1:N

Date Date Ngày theo format:yyyy-mm-dd

FullMonthName Varchar Tháng theo tên

Bҧng 4.1: Thông tin chi tiӃt cӫa bҧng danh mөc thӡi gian

Table dw.Product_Dim: thӇ hiӋn thông tin cӫa sҧn phҭmÿk\FNJQJOjPӝWWDEOHFѫEҧn nӳa vì chiӅu sҧn phҭm vүn là chiӅXÿѭӧc coi nhiӅu nhҩt trong bҩt kǤ công ty nào Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact khác theo cӝt ID vӟi mӕi quan hӋ là 1:N

Product_name Varchar Tên sҧn phҭm

Category_id Number Mã loҥi sҧn phҭm

Bҧng 4.2: Thông tin chi tiӃt cӫa bҧng danh mөc sҧn phҭm

Table dw.Product_Category_Dim: thӇ hiӋn thông tin cӫa loҥi sҧn phҭmÿӇ viӋc tӕLѭXKyD

PRGHOFNJQJQKѭJLҧm tҧi cho table Product thì tác giҧ tách riêng ra loҥi sҧn phҭm riêng, thông

WKѭӡng trong thӕng kê, các nhà quҧn lý hiӃm khi coi chi tiӃt tӯng sҧn phҭm mà hӑ sӁ coi thӕng kê cӫa nhóm hay loҥi sҧn phҭPÿy Table này sӁ kӃt nӕi 2 chiӅu vӟi các table dw.Product_Dim theo cӝt ID vӟi mӕi quan hӋ là 1:N

Id Number Mã loҥi sҧn phҭm

Type Varchar Tên loҥi sҧn phҭm

Bҧng 4.3: Thông tin chi tiӃt cӫa bҧng danh mөc loҥi sҧn phҭm

Table dw.Channel_Dim: thӇ hiӋn thông tin cӫa các kênh bán hàng, miêu tҧ vӅ các kênh bán hàng chớnh cӫa cụng ty vớ dө bỏn hàng online, bỏn hàng cӫDDJHQWEiQKjQJTXDÿҥLOờô Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

Bҧng 4.4: Thông tin chi tiӃt cӫa bҧng danh mөc kênh

Table dw.Region_Dim: thӇ hiӋn thông tin cӫa tӍnh thành phӕWKѭӡQJÿѭӧc sӱ dөQJÿӇ thӇ hiӋQÿӏDÿLӇm mà khách hàng order sҧn phҭPQѫLVҧn phҭPÿӃn tay khách hàng Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã tӍnh thành phӕ

Name Varchar Tên tӍnh thành phӕ

Area Varchar Khu vӵc tӍnh thành phӕ

Bҧng 4.5: Thông tin chi tiӃt cӫa bҧng danh mөc vùng

Table dw.Customer_Dim: thӇ hiӋn thông tin cӫa khách hàng, bao gӗm rҩt nhiӅu thông tin quan trӑQJOLrQTXDQÿӃQNKiFKKjQJQKѭÿӏa chӍ, sӕ ÿLӋn thoҥLHPDLOôÿѭӧc dựng cho phõn hӋ bán hàng và khiӃu nҥi khách hàng Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã khách hàng

Name Varchar Tên khách hàng

Address Varchar Ĉӏa chӍ cӫa khách hàng

Bҧng 4.6: Thông tin chi tiӃt cӫa bҧng danh mөc khách hàng

Table dw.Factory_Dim: thӇ hiӋn thông tin cӫDQKjPi\QѫLVҧn suҩt cӫa sҧn phҭm, dӉ dàng truy xuҩt nguӗn gӕc cӫa sҧn phҭm khi nhұp và xuҩWNKRÿӗng thӡi hӛ trӧ cho phân hӋ khiӃu nҥi khách hàng Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã nhà máy

Name Varchar Tên nhà máy

Address Varchar Ĉӏa chӍ nhà máy

Bҧng 4.7: Thông tin chi tiӃt cӫa bҧng danh mөc nhà máy

Table dw.CustomerComplaint_Type_Dim: thӇ hiӋn loҥi thông tin khiӃu nҥi, bao gӗm nhiӅu dҥng thụng tin khiӃu nҥi khỏc nhau sҧn phҭm lӛi, giao hàng bӏ trӉôTable này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

Bҧng 4.8: Thông tin chi tiӃt cӫa bҧng danh mөc loҥi khiӃu nҥi

Table dw.Warehouse_Status_Dim: thӇ hiӋn trҥng thái cӫa sҧn phҭm trong kho là xuҩt kho hoһc nhұp kho Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã trҥng thái kho

Name Varchar Tên trҥng thái kho

Bҧng 4.9: Thông tin chi tiӃt cӫa bҧng danh mөc tình trҥng kho

Table dw.Warehouse_Dim: thӇ hiӋn thông tin kho cӫDF{QJW\QѫLOѭXWUӳ các sҧn phҭm cӫa

F{QJW\WUѭӟFNKLÿѭDÿӃn tay khách hàng Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

Bҧng 4.10: Thông tin chi tiӃt cӫa bҧng danh mөc kho

Table dw.Staff_Dim: thӇ hiӋn thông tin cӫa tҩt cҧ nhân viên trong công ty, table này có thӇ sӱ dөng cho nhiӅu phân hӋ NKiFQKDXWURQJWѭѫQJODLQKѭQJWURQJÿӅ tài này chӍ dùng cho phân hӋ kho Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã nhân viên

Name Varchar Tên nhân viên

Role Varchar Vai trò cӫa nhân viên

Department Varchar Phòng ban cӫa nhân viên

Bҧng 4.11: Thông tin chi tiӃt cӫa bҧng danh mөc nhân viên

Các phân hӋ ÿӇ xây dӵng hӋ thӕng

Dӵa vào nhӳng yêu cҫu cӫa user, Tác giҧ sӁ thiӃt kӃ mӝt hӋ thӕng DW và BI Sau khi xem xét và phân tích dӵa vào thӡLJLDQYjÿӝ ѭXWLrQÿӕi vӟi tӯng phҫn viӋc mà user yêu cҫu, nên ӣ ÿk\7iFJLҧ sӁ tұp trung xây dӵng cho ba phân hӋ là : bán hàng, kho, và khiӃu nҥi khách hàng cӫa trong công ty

Mӛi phân hӋ sӁ có mӝt mô hình phù hӧp WѭѫQJӭng, mӛi mô hình sӁ bao gӗm dӳ liӋu và chiӅu dӳ liӋu

4.3 Mô hình Data Warehouse ÿӅ xuҩt

Mô hình sӁ bao gӗm: x Data Source: ÿk\OjQѫLbҳWÿҫu cӫa dӳ liӋu tӯ nhiӅu CSDL khác nhau gӗm có: phҫn mӅm ERP, phҫn mӅm quҧn lý kho, phҫn mӅPFKăPVyFNKiFKKjQJYjFiFGӳ liӋu bên ngoài ҧQKKѭӣng ÿӃn các phân hӋ PjÿӅ tài nhҳPÿӃn x DSA: ÿk\OjQѫLOѭXWUӳ ÿҫu vào cӫa dӳ liӋu tӯ Data Sourceÿѭӧc input theo dҥng 1:1 bao gӗm cҩu trúc và nӝi dung cӫa dӳ liӋu&iFGDWDÿѭӧFOѭXWҥLÿk\VӁ ÿѭӧc xӱ lý VDXÿyVӁ ÿѭӧc load lên DW, DSA OjFNJQJOj QѫLTXҧn lý quá trình ETL x Data Warehouse: ÿk\VӁ nѫLOѭu trӳ dӳ liӋu cҫn thiӃt cho phân tích báo cáo gӗm: ắ Raw Data là nhӳng data lҩy 1:1 tӯ DSA, nhӳQJGDWDQj\ÿѭӧc lӵa chӑn ÿӇ xӱ lý riêng và phân tích thêm ắ Summary Data: là nhӳQJGDWDÿѭӧc cұp nhұp khi dӳ liӋXÿѭӧFÿѭDYjR':EDR gӗm nhӳng dӳ liӋu ÿѭӧc tәng hӧSFѫEҧQYjÿѫQJLҧQYDLWUzFKtQKOjJL~SWăQJ tӕc hiӋu suҩt truy cұp ắ Meta Data: là thụng tin ÿӇ [iFÿӏnh dӳ liӋu 9DLWUzFKtQKOjÿѫQJLҧn cҩu trỳc và nӝi dөng cӫa dӳ liӋu, cho phép các nhà phân tích dӳ liӋu phân loҥL ÿӏnh vӏ và Kѭӟng các truy vҩQÿӃn dӳ liӋu cҫn thiӃt x Data Mart: nhӳng kho dӳ liӋu cho tӯng phân hӋ WURQJÿӅ tài này gӗm bán hàng, kho, khiӃu nҥi khách hàng bao gӗm dӳ liӋu và các mӕi quan hӋ giӳa bҧng Fact và bҧng Dimension

30 x Business Intelligence: là hӋ thӕng chӭa nhӳng dashboard, report dҥng thӕng kê, phân WtFKÿѭӧc xây dӵng trӵc tiӃp trên tool BI cө thӇ ӣ ÿk\OjSKҫn mӅm Power BI x ETL: tiӃn trình trích xuҩt, biӃQÿәi và tҧi dӳ liӋu.

Xây dӵng các Data Mart

Thông tin chi ti͇t các table cho Data Mart

Các table cӫa Data Mart là các table chính cho quá trình tҥo mô hình cho tӯng phân hӋ, chính vì vұy các table này có schema riêng là dw ÿӇ dӉ dàng phân biӋWFNJQJQKѭWLӋn quҧn lý trong quá trỡnh ETL, và schema này sӁ ÿѭӧF OѭX GѭӟL GDWDEDVH QKѭdw.Date_Dim, dw.Product_dimô

QKѭQJNKLOrQPRGHOVӁ bӓ VFKHPDÿӇ tҥo thân thiӋt vӅ mһt giao diӋn QJѭӡi dùng

Table dw.Date_Dim: thӇ hiӋn thông tin vӅ mһt thӡi gianÿk\OjWDEOHFѫEҧn nhҩt khi xây dӵng các DM, vì bҩt cӭ quá trình làm dashboard, report hay phân tích dӳ liӋXWKuÿӅu cҫn xem xét theo yӃu tӕ thӡi gian Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact khác theo cӝt Date vӟi mӕi quan hӋ là 1:N

Date Date Ngày theo format:yyyy-mm-dd

FullMonthName Varchar Tháng theo tên

Bҧng 4.1: Thông tin chi tiӃt cӫa bҧng danh mөc thӡi gian

Table dw.Product_Dim: thӇ hiӋn thông tin cӫa sҧn phҭmÿk\FNJQJOjPӝWWDEOHFѫEҧn nӳa vì chiӅu sҧn phҭm vүn là chiӅXÿѭӧc coi nhiӅu nhҩt trong bҩt kǤ công ty nào Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact khác theo cӝt ID vӟi mӕi quan hӋ là 1:N

Product_name Varchar Tên sҧn phҭm

Category_id Number Mã loҥi sҧn phҭm

Bҧng 4.2: Thông tin chi tiӃt cӫa bҧng danh mөc sҧn phҭm

Table dw.Product_Category_Dim: thӇ hiӋn thông tin cӫa loҥi sҧn phҭmÿӇ viӋc tӕLѭXKyD

PRGHOFNJQJQKѭJLҧm tҧi cho table Product thì tác giҧ tách riêng ra loҥi sҧn phҭm riêng, thông

WKѭӡng trong thӕng kê, các nhà quҧn lý hiӃm khi coi chi tiӃt tӯng sҧn phҭm mà hӑ sӁ coi thӕng kê cӫa nhóm hay loҥi sҧn phҭPÿy Table này sӁ kӃt nӕi 2 chiӅu vӟi các table dw.Product_Dim theo cӝt ID vӟi mӕi quan hӋ là 1:N

Id Number Mã loҥi sҧn phҭm

Type Varchar Tên loҥi sҧn phҭm

Bҧng 4.3: Thông tin chi tiӃt cӫa bҧng danh mөc loҥi sҧn phҭm

Table dw.Channel_Dim: thӇ hiӋn thông tin cӫa các kênh bán hàng, miêu tҧ vӅ các kênh bán hàng chớnh cӫa cụng ty vớ dө bỏn hàng online, bỏn hàng cӫDDJHQWEiQKjQJTXDÿҥLOờô Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

Bҧng 4.4: Thông tin chi tiӃt cӫa bҧng danh mөc kênh

Table dw.Region_Dim: thӇ hiӋn thông tin cӫa tӍnh thành phӕWKѭӡQJÿѭӧc sӱ dөQJÿӇ thӇ hiӋQÿӏDÿLӇm mà khách hàng order sҧn phҭPQѫLVҧn phҭPÿӃn tay khách hàng Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã tӍnh thành phӕ

Name Varchar Tên tӍnh thành phӕ

Area Varchar Khu vӵc tӍnh thành phӕ

Bҧng 4.5: Thông tin chi tiӃt cӫa bҧng danh mөc vùng

Table dw.Customer_Dim: thӇ hiӋn thông tin cӫa khách hàng, bao gӗm rҩt nhiӅu thông tin quan trӑQJOLrQTXDQÿӃQNKiFKKjQJQKѭÿӏa chӍ, sӕ ÿLӋn thoҥLHPDLOôÿѭӧc dựng cho phõn hӋ bán hàng và khiӃu nҥi khách hàng Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã khách hàng

Name Varchar Tên khách hàng

Address Varchar Ĉӏa chӍ cӫa khách hàng

Bҧng 4.6: Thông tin chi tiӃt cӫa bҧng danh mөc khách hàng

Table dw.Factory_Dim: thӇ hiӋn thông tin cӫDQKjPi\QѫLVҧn suҩt cӫa sҧn phҭm, dӉ dàng truy xuҩt nguӗn gӕc cӫa sҧn phҭm khi nhұp và xuҩWNKRÿӗng thӡi hӛ trӧ cho phân hӋ khiӃu nҥi khách hàng Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã nhà máy

Name Varchar Tên nhà máy

Address Varchar Ĉӏa chӍ nhà máy

Bҧng 4.7: Thông tin chi tiӃt cӫa bҧng danh mөc nhà máy

Table dw.CustomerComplaint_Type_Dim: thӇ hiӋn loҥi thông tin khiӃu nҥi, bao gӗm nhiӅu dҥng thụng tin khiӃu nҥi khỏc nhau sҧn phҭm lӛi, giao hàng bӏ trӉôTable này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

Bҧng 4.8: Thông tin chi tiӃt cӫa bҧng danh mөc loҥi khiӃu nҥi

Table dw.Warehouse_Status_Dim: thӇ hiӋn trҥng thái cӫa sҧn phҭm trong kho là xuҩt kho hoһc nhұp kho Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã trҥng thái kho

Name Varchar Tên trҥng thái kho

Bҧng 4.9: Thông tin chi tiӃt cӫa bҧng danh mөc tình trҥng kho

Table dw.Warehouse_Dim: thӇ hiӋn thông tin kho cӫDF{QJW\QѫLOѭXWUӳ các sҧn phҭm cӫa

F{QJW\WUѭӟFNKLÿѭDÿӃn tay khách hàng Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

Bҧng 4.10: Thông tin chi tiӃt cӫa bҧng danh mөc kho

Table dw.Staff_Dim: thӇ hiӋn thông tin cӫa tҩt cҧ nhân viên trong công ty, table này có thӇ sӱ dөng cho nhiӅu phân hӋ NKiFQKDXWURQJWѭѫQJODLQKѭQJWURQJÿӅ tài này chӍ dùng cho phân hӋ kho Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Fact theo cӝt ID vӟi mӕi quan hӋ là 1:N

ID Number Mã nhân viên

Name Varchar Tên nhân viên

Role Varchar Vai trò cӫa nhân viên

Department Varchar Phòng ban cӫa nhân viên

Bҧng 4.11: Thông tin chi tiӃt cӫa bҧng danh mөc nhân viên

Table dw.Sales_Fact: thӇ hiӋn chi tiӃt các giao dӏch phát sinh trong phân hӋ bán hàng, user sӁ FRLÿѭӧc doanh thu bán hàng theo nhiӅu chiӅu khác nhau dӵa vào table này Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Dimession theo cӝt các cӝW,'WѭѫQJӭng vӟi mӕi quan hӋ là 1:N

ID Number Mã ID cӫa table

Customer_Id Number Mã khách hàng

Product_id Number Mã sҧn phҭm

Region_id Number Mã vùng

Channel_id Number Mã kênh

Transaction_date Date Ngày phát sinh giao dӏch

Quantity Number Sӕ Oѭӧng sҧn phҭm

Total Number Doanh thu = Price * Quantity

Bҧng 4.12: Thông tin chi tiӃt cӫa bҧng sӵ kiӋn bán hàng

Table dw.Warehouse_Fact: thӇ hiӋn chi tiӃt các giao dӏch phát sinh trong phân hӋ kho, user có thӇ biӃWÿѭӧc sӕ Oѭӧng xuҩt kho, sӕ Oѭӧng nhұp kho, tӯ ÿyFNJQJFyWKӇ WtQKÿѭӧc sӕ Oѭӧng tӗn kho Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Dimession theo cӝt các cӝW,'WѭѫQJӭng vӟi mӕi quan hӋ là 1:N

ID Number Mã ID cӫa table

Warehouse_Id Number Mã kho

Product_id Number Mã sҧn phҭm

Factory_id Number Mã nhà máy sҧn xuҩt

Staff_id Number Mã nhân viên

Transaction_date Date Ngày phát sinh giao dӏch

Status_id Number Mã tình trҥng giao dӏch

Quantity Number Sӕ Oѭӧng sҧn phҭm

Bҧng 4.13: Thông tin chi tiӃt cӫa bҧng sӵ kiӋn kho

Table dw.CustomerComplaint_Fact: thӇ hiӋn chi tiӃt các giao dӏch phát sinh trong phân hӋ khiӃu nҥi khách hàng, user có thӇ biӃWÿѭӧc sӕ lҫn khiӃu nҥi cӫa khách hàng Table này sӁ kӃt nӕi 2 chiӅu vӟi các table Dimession theo cӝt các cӝW,'WѭѫQJӭng vӟi mӕi quan hӋ là 1:N

ID Number Mã ID cӫa table

Customer_id Number Mã khách hàng

Product_id Number Mã sҧn phҭm

Region_id Number Mã vùng

Channel_id Number Mã kênh

Transaction_date Date Ngày phát sinh khiӃu nҥi

Factory_id Number Mã nhà máy sҧn xuҩt

Type_id Number Mã loҥi khiӃu nҥi

Bҧng 4.14: Thông tin chi tiӃt cӫa bҧng sӵ kiӋn khiӃu nҥi khách hàng

Mô hình bán hàng

Bán hàng là mӝt hoҥWÿӝng chính cӫa công ty Công ty bán nhӳng mһt hàng mӻ phҭm thông TXDFiFNrQKEiQKjQJWѭѫQJӭng Vӟi sӕ Oѭӧng giao dӏch phát sinh hàng ngày rҩt là lӟn và nhiӅu loҥi mһt hàng khác nhau, vì thӃ khi thiӃt kӃ mô hình cҫQÿҧm bҧo có thӇ thӕng kê và phân tích vӟi nhiӅu chiӅu thông tin khác nhau gӗm: ngày bán hàng, sҧn phҭm bán, khách hàng mua sҧn phҭm, khu vӵc mua hàng và kênh bán hàng DӵDYjRÿytác giҧ ÿѭDUDVѫÿӗ tәng quan và mô hình database QKѭhình 4.2 và 4.3:

35 Hình 4.3: Chi tiӃt mô hình bán hàng cӫa Data Mart Hình 4.2: Tәng quan mô hình bán hàng cӫa Data Mart

Mô hình kho

Các sҧn phҭPWUѭӟFNKLÿѭӧFÿѭDÿӃn tay cӫa khách hàng sӁ ÿѭӧFOѭXYjRNKR Công ty sӁ ÿѭDVҧn phҭm vào nhӳng kho cҫn thiӃWÿӇ dӉ dàng trong viӋc nhұSNKRFNJQJQKѭ[Xҩt kho, chính vì thӃ vӟi mô hình kho cҫn có các chiӅu thông tin sau: nhà máy sҧn xuҩt, kho hàng, sҧn phҭm, loҥi sҧn phҭm, ngày xuҩt nhұp kho và nhân viên DӵDYjRÿytác giҧ ÿѭDUDVѫÿӗ tәng quan và P{KuQKGDWDEDVHQKѭhình 4.4 và 4.5:

Hình 4.5: Chi tiӃt mô hình kho cӫa Data Mart Hình 4.4: Tәng quan mô hình kho cӫa Data Mart

Mô hình khi͇u n̩i khách hàng

Trong suҩt quá trình bán hàng sӁ có nhӳng lúc khách hàng sӁ có nhӳng thҳc mҳc, than phiӅn vӅ sҧn phҭm Mô hình sӁ giúp quҧn lý nhӳng khiӃu nҥi cӫa khách hàng mӝWFiFKÿDFKLӅu giúp công ty dӉ GjQJÿѭDUDKѭӟng giҧi quyӃt vҩQÿӅ cho tӯng sҧn phҭm, mô hình sӁ có các chiӅu WK{QJWLQQKѭVDX kênh bán hàng, sҧn phҭm, loҥi sҧn phҭm, nhà máy sҧn xuҩt sҧn phҭm, khách hàng, loҥi khiӃu nҥi, ngày khiӃu nҥi DӵDYjRÿyWiFJLҧ ÿѭDUDVѫ ÿӗ tәng quan và mô hình GDWDEDVHQKѭKuQK6 và 4.7:

Hình 4.6: Tәng quan mô hình khiӃu nҥi khách hàng cӫa Data Mart

Hình 4.7: Chi tiӃt mô hình khiӃu nҥi khách hàng cӫa Data Mart

ThiӃt kӃ DSA

'6$OjQѫLOѭXWUӳ dӳ liӋu tҥm nhiӋm vө chính sӁ là xӱ lý dӳ liӋu và load dӳ liӋu lên trên

DW giúp tӕL ѭX KyD KLӋX QăQJ WURQJ TXi WUuQK (7/ &iF WDEOH Wҥi DSA sӁ ÿѭӧc thiӃt kӃ vӟi schema là stg bao gӗm:

- Stg.Date_Dim: chӭa dӳ liӋu liên quan vӅ QJj\WKiQJÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Region_Dim: chӭa dӳ liӋu liên quan vӅ khu vӵFÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Product_Dim: chӭa dӳ liӋu liên quan vӅ sҧn phҭPÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Product_Category_Dim: chӭa dӳ liӋu liên quan vӅ loҥi sҧn phҭP ÿѭӧc lҩy tӯ

CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Customer_Dim: chӭa dӳ liӋu liên quan vӅ NKiFKKjQJÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Channel_Dim: chӭa dӳ liӋu liên quan vӅ NrQKEiQKjQJÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Factory_Dim: chӭa dӳ liӋu liên quan vӅ nhà máy sҧn xuҩW ÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.CustomerComplaint_Type_Dim: chӭa dӳ liӋu liên quan vӅ loҥi khiӃu nҥLÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Warehouse_Dim: chӭa dӳ liӋu liên quan vӅ NKRÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Staff_Dim: chӭa dӳ liӋu liên quan vӅ QKkQYLrQÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Warehouse_Status_Dim: chӭa dӳ liӋu liên quan vӅ tình trҥQJ NKR ÿѭӧc lҩy tӯ

CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Warehosue_Transaction: chӭa dӳ liӋu liên quan vӅ giao dӏch phát sinh cӫa kho theo hoҥWÿӝng hҵng ngày cӫDF{QJW\ÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥt ÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.CustomerComplaint _Transaction: chӭa dӳ liӋu liên quan vӅ FiFÿѫQNKLӃu nҥi cӫa khách hàng theo hoҥWÿӝng hҵng ngày cӫDF{QJW\ÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1

- Stg.Sales_Transaction: chӭa dӳ liӋu liên quan vӅ các giao dӏch bán hàng theo hoҥt ÿӝng hҵng ngày cӫDF{QJW\ÿѭӧc lҩy tӯ CSDL nguӗn cӫa hӋ thӕng hoҥWÿӝng trong công ty và table này sӁ ÿѭӧc ETL tӯ table nguӗn qua vӟi toàn bӝ cҩu trúc và nӝi dung giӕng nhau theo dҥng 1:1.

ThiӃt kӃ tiӃn trình ETL

Mô hình thiӃt kӃ tәng quan cӫa tiӃn trình ETL cӫDÿӅ tài:

Hình 4.8: Tәng quan tiӃn trình ETL

- Table Source: là nhӳng table gӕc tӯ các hӋ thӕng khác nhau cӫDF{QJW\QKѭKӋ thӕng

ERP, hӋ thӕng kӃ WRiQô&iFWDEOHQj\ÿDSKҫn là cỏc table dành cho cỏc hoҥWÿӝng kinh doanh chính cӫa công ty và dӳ liӋu sӁ ÿѭӧc cұp nhұp real time tùy thuӝc vào end user

- Table Schema STG: TiӃp theo data tӯ source sӁ ÿѭӧFÿҭy vào Staging theo dҥng 1:1

QJKƭDOjWҩt cҧ nhӳng data tӯ source sӁ khi vào DSA sӁ ÿѭӧc giӳ nguyên bao gӗm cҧ nӝi

40 dung và cҩXWU~FGDWDYjNKLGDWDÿѭӧc vô DSA sӁ ÿѭӧc thiӃt lұp sҹn mӝt schema stg thӇ hiӋQÿk\OjQKӳng data thuӝc DSA

- Table Schema DW: ÿk\OjEѭӟc cuӕi cùng cӫa tiӃn trình ETL tҥLEѭӟc này các data tӯ

DSA sӁ ÿѭӧc xӱ OờQKѭWKrPFӝWWKD\ÿәi cҩXWU~FWKD\ÿәLORJLFôWKHRQKѭPRQJPXӕn cӫDQJѭӡi thiӃt kӃ '0ÿӇ tҥRUDÿѭӧc nhӳng table phù hӧpÿӗng thӡi sӁ có sӵ so sánh WUѭӟc khi input vào DW ví dө nӃX':ÿmFyGӳ liӋXQăPWKuWDFKӍ ÿҭy dӳ liӋXQăP 2021.Các table trong DW này sӁ có schema là dw

ThiӃt kӃ chi tiӃt cӫD(7/ÿӕi vӟi table Fact (bҧng sӵ kiӋn):

ThiӃt kӃ chi tiӃt cӫD(7/ÿӕi vӟi table Dimession (bҧng thông tin):

Hình 4.9: Chi tiӃt tiӃn trình ETL cӫa Table

ThiӃt kӃ Business Intelligence

Sau khi thiӃt kӃ xong các Data Mart, Tác giҧ sӁ connect trӵc tiӃp model lên Power BI Tùy vào cái mà user muӕn, Tác giҧ sӁ thiӃt kӃ các dashboard, report phù hӧp hoһc user có thӇ tӵ thiӃt

_Status_Dim PD Dw.Warehouse_

Table Staff 1:1 Stg.Staff_Dim PD Dw.Staff_Dim

_Dim PD Dw.Warehouse_Dim

1:1 Stg.ProductC ategory_Dim PD Dw.

Dim PD Dw.Channel_Dim

Dim PD Dw.Factory_Dim

CustomerCompl aint_Type _Dim PD

Hình 4.10: Chi tiӃt tiӃn trình ETL cӫa Table Dimension

42 kӃ mӝt báo cáo cho riêng mình vӟi mӝt ILOH3RZHU%,ÿmÿѭӧc connect vӟLPRGHOWѭѫQJӭng trong Data Mart, tác giҧ FNJQJVӁ Kѭӟng dүn user cách sӱ dөng phҫn mӅm Power BI

Vӟi sӵ hӛ trӧ cӫD3RZHU%,FiFGDVKERDUGUHSRUWÿѭӧc thiӃt kӃ có thӇ publish lên website cӫa BI, tiӋn lӧi cho bҩt kǤ user nào cӫa công ty có thӇ dӉ dàng theo dõi báo cáo Các model cӫa '0FNJQJVӁ ÿѭӧFÿtQKNqPWUӵc tiӃp lên Power BI giúp user dӉ dàng sӱ dөng bao gӗm

- BI cӫa phân hӋ khiӃu nҥi khách hàng

Các hình ҧQKErQGѭӟi miêu tҧ các model trong DM sӁ ÿѭӧFÿtQKNqPWUӵc tiӃp vô tӯng BI cӫa mӛi phân hӋ và ví dө vӅ dashboard cӫa phân hӋ bán hàng

Hình 4.11: Phân hӋ bán hàng trên Business Intelligence

43 Hình 4.12: Phân hӋ kho trên Business Intelligence

Hình 4.13: Phân hӋ khiӃu nҥi khách hàng trên Business Intelligence

ĈiQKJLiKӋ thӕng

Thu th̵p yêu c̯u tͳ QJ˱ͥi dùng h͏ th͙ng

Tác giҧ sӁ thu thұp và xem xét các yêu cҫu tӯ chính nhӳng nhân viên tӯ phòng bán hàng, SKzQJNKRYjSKzQJFKăPVyFNKiFKKjQJ7ӯ ÿyWiFJLҧ sӁ lұp nhӳng phiӃu yêu cҫu tӯ các SKzQJEDQÿѭDFKREDQOmQKÿҥo duyӋt và xem xét

Hình 4.14: ThiӃt kӃ dashboard trên Power BI

45 Hình 4.15: PhiӃu yêu cҫu tӯ phòng bán hàng

46 Hình 4.16: PhiӃu yêu cҫu tӯ phòng kho

ĈiQKJLiWͳ các phòng ban

Sau khi thu thұp yêu cҫu, triӇn khai hӋ thӕng và sӱ dөng hӋ thӕng mӝt thӡi gian, tác giҧ lұp phiӃXÿiQKJLiYj[iFQKұn tӯ FiFWUѭӣng phòng ban QKѭKuQK

50 Hình 4.18: PhiӃXÿiQKJLiWӯ các phòng ban

KӃt quҧ ÿҥWÿѭӧc

Sau thӡi gian nghiên cӭu và thӵc hiӋn luұQYăQtác giҧ ÿmWuPKLӇXÿѭӧc các khái niӋm và SKѭѫQJWKӭc xây dӵng DW và BI, thiӃt lұp các trình tӵ chҥy ETL, ӭng dөng quy trình nghiӋp vө cӫa công ty trong viӋc xây dӵng các DM tӯ ÿyWҥo các báo cáo, dashboard trên hӋ thӕng BI cho QJѭӡi dùng, hӛ trӧ các quá trình phân tích thӕng kê dӳ liӋu trong kinh doanh cӫa công ty.

ѬXYjQKѭӧFÿLӇm cӫDSKѭѫQJSKiSÿѭӧFÿӅ xuҩt

- ѬXÿLӇm:Vӟi viӋc thiӃt kӃ ÿѭӧc mӝt mô hình DW phù hӧSXVHUÿmFyWKӇ dӉ dàng phân tích, thӕng kê dӳ liӋXÿiSӭQJÿѭӧc vӅ ÿӝ nhanh chóng và chính xác trong báo cáo Có thӇ phân tích dӳ liӋu vӟi mӝt sӕ Oѭӧng lӟn cө thӇ KѫQPӝt triӋu dòng vӟi nhiӅu cӝWNKiFQKDXÿLӅu mà excel và các hӋ thӕQJFNJNK{QJOjPÿѭӧc Ĉӗng thӡLÿѭDKӃt tҩt cҧ dӳ liӋu vӅ mӝt nguӗn thӕng nhҩt giúp dӉ dàng quҧQOêYjWăQJÿѭӧFÿӝ bҧo mұt cao

- 1KѭӧFÿLӇm: Mһc dù có thӇ xӱ lý vӟi khӕLOѭӧng dӳ liӋu lӟQQKѭQJYӟi mӝWOѭӧng dӳ liӋu quá lӟn thì DW khó có thӇ xӱ lý mӝWFiFKWUѫQWUXQKDQKFKyQJTXiWUuQK(7/ cҫn phҧi kiӇm soát mӝt cách sát sao hӧp lý vì khi dӳ liӋu càng nhiӅu và càng phӭc tҥp WKu(7/FNJQJVӁ gһp nhiӅu vҩQÿӅ NKyNKăQ

ĈyQJJySFӫa luұQYăQYӅ mһt khoa hӑc và ӭng dөng

LuұQYăQQj\NK{QJFy ÿyQJJyS nhiӅu vӅ mһt khoa hӑc vì tұp trung triӇn khai hӋ thӕng trong thӵc tӃ

VӅ mһt ӭng dөng thì luұQYăQÿmFyÿѭӧc nhӳQJÿyQJJySVDX

- Xây dӵQJÿѭӧc cho công ty có mӝt hӋ thӕng DW và BI chuҭn

- *L~Sÿӥ user vӅ mһt phân tích, thӕQJNrEiRFiRÿӇ ÿiSӭng nhu cҫu kinh doanh mӝt cách nhanh chóng, tӵ ÿӝng và chính xác

- TҥRFѫVӣ, tiӅQÿӅ ÿӇ công ty có thӇ phát triӇn nhiӅXJyFÿӝ khác vӅ mһt dӳ liӋu

- Giúp công ty cҧi thiӋQÿѭӧc nghiӋp vөWăQJOӧi thӃ cҥnh tranh vӟLFiFÿӕi thӫ khác

5.4 +ѭӟng mӣ rӝQJWѭѫQJODL

- ĈӅ tài chӍ mӟi phát triӇn cho phân hӋ bán hàng, kho, khiӃu nҥi khách hàng nên có thӇ phỏt triӇn cho cỏc phõn hӋ NKiFQKѭNӃ WRiQWjLFKtQKPXDKjQJô

- TӕLѭXKyDOҥi nhӳQJ'0ÿmÿѭӧc tҥo trong luұQYăQNKLFyVӵ WKD\ÿәi nghiӋp vө hay có thêm nhӳng yêu cҫu mӟi cӫa user

- Phát triӇQJyFÿӝ khoa hӑc dӳ liӋu dӵa vào hӋ thӕng DW và %,ÿm[k\Gӵng

- VӅ mһt công nghӋ có thӇ tiӃp tөc phát triӇQQKѭVӱ dөng Data Lake, Hadoop, Spark ÿӇ JL~SWăQJWӕc xӱ lý data

[1] F Silvers, Building and Maintaining a Data Warehouse, Auerbach Publications, 2008 [2] W H Inmon, Building the Data Warehouse, Wiley, 2005

[3] J W Han, M C Kamber, and J Pei, Data Mining: Concepts & Techniques, Morgan

[4] R Kimball, DQGM Ross, The Data Warehouse Toolkit, Wiley, 2013

[5] N V Tài ³Xây dӵng Data Warehouse và Business Intelligence cho công ty ngành nhӵa tҥi TP.Hӗ Chí Minh´ M.A thesis, University of Technology, Hӗ Chí Minh, 2019

[6] D Mondal, G Maji, T Goto, N C Debnath and S Sen³A Data Warehouse Based

Modelling Technique for Stock Market Analysis´ International Journal of Engineering

[7] O M Zea, J P Gualtor, DQGS L Mora, ³A Holistic View of Data Warehousing in

Education´ Institute of Electrical and Electronics Engineers Access (IEEE Access), vol 6, pp 64659 - 64673, 2018

[8] R Ribeiro, A Oliveira, DQGI Pedrosa, ³Analysis of the Impact of Business Intelligence in

Public Administration´ presented at the 5th International Conference on Future Internet of Things and Cloud Workshops (FiCloudW), Chaves, Portugal, 2021

[9] C Silva, J Pereira, L Costa, H Peixoto, J Machado, A Abelha, ³Business Intelligence for Cardiovascular Disease Assessment´ presented at the 16th Iberian Conference on Information Systems and Technologies (CISTI), Prague, Czech Republic, 2017

[10] ³'DWDZDUHKRXVLQJLQ0LFURVRIW$]XUH´,QWHUQHWhttps://docs.microsoft.com/en- us/azure/architecture/data-guide/relational-data/data-warehousing, Oct 20, 2021

[11] S 6LPLF³'DWD:DUHKRXVH$UFKLWHFWXUH([SODLQHG´,QWHUQHW https://phoenixnap.com/kb/data-warehouse-architecture-explained, Oct 20, 2021

[12] ³8QGHUVWDQGVWDUVFKHPDDQGWKHLPSRUWDQFHIRU3RZHU%,´,QWHUQHW https://docs.microsoft.com/en-us/power-bi/guidance/star-schema, Oct 20, 2021

[13] %++j³2/$3&XEH´,QWHUQHWhttps://kipalog.com/posts/OLAP-Cube, Oct 20, 2021 [14] ³(7/OjJu´,QWHUQHWhttps://bizflycloud.vn/tin-tuc/etl-la-gi-cach-thuc-hoat-dong-cua- etl-va-tai-sao-can-su-dung-elt-20200731175234501.htm, Oct 20, 2021.

Ngày đăng: 31/07/2024, 10:25