Kho dӳ liӋu là mӝt thành phҫn quan trӑng cӫa phân tích kinh doanh, sӱ dөng các kӻ thuұt phân tích trên dӳ liӋu doanh nghiӋp.. 4XDÿyOXұQYăQÿm[k\GӵQJÿѭӧc kho dӳ liӋu trên nӅn tҧng ÿiPPk\Yӟ
Lý do chӑQÿӅ tài
Xây dӵng báo cáo thông minh BI tӯ kho dӳ liӋu là mӝWOƭQKYӵc ngày càng hҩp dүQYjÿyQJYDLWUzTXDQWUӑQJKѫQWURQJYLӋc hӛ trӧ ra các quyӃWÿӏnh cho các cá nhân, tә chӭc thay vì chӍ dӵa vào các yӃu tӕ kinh nghiӋm, cҧPWtQKFiLQKuQÿѫQ diӋn cӫa mӝt sӕ QJѭӡLÿӭQJÿҫu Bên cҥnh ÿyVӵ bùng nә thông tin ngày nay làm cho dӳ liӋu là vô cùng nhiӅX Yj ÿD Gҥng Dӵa trên nhu cҫX ÿy QJj\ FjQJ QKLӅu doanh nghiӋSÿѭDGӳ liӋu lên nӅn tҧQJÿiPPk\&ORXGSODWIRUPWKD\YuVӱ dөng hҥ tҫng doanh nghiӋp tӵ xây dӵng vì lý do kinh phí và thӡi gian triӇQNKDLFNJQJQKѭ khҧ QăQJPӣ rӝQJWURQJWѭѫQJODL
'RÿyW{LÿmFKӑQÿӅ tài xây dӵng kho dӳ liӋu trên nӅn tҧQJÿiPPk\YuFKL phí khӣi tҥo rҿ, xây dӵng hҥ tҫng nhanh chóng, tính sҹn sàng mӣ rӝng cao nên có thӇ ÿiSӭng cho nhiӅu doanh nghiӋp và công ty tӯ quy mô vӯa và nhӓ ÿӃn nhӳng công ty có quy mô lӟn Bên cҥQKÿyYLӋc phân tích và xây dӵng báo cáo BI cho ngành nghӅ bҩWÿӝng sҧn là mӝWÿӅ tài ít thҩy WURQJOƭQKYӵc phân tích dӳ liӋu
4XDÿyOXұQYăQÿm[k\GӵQJÿѭӧc kho dӳ liӋu trên nӅn tҧng ÿiPPk\Yӟi chi phí rҿ và thӡi gian ngҳn và xây dӵQJÿѭӧc bӝ báo cáo BI bao gӗm: phân tích cҩu trúc dӳ liӋu bҩWÿӝng sҧn, xây dӵng các báo cáo vӟi dӳ liӋu bҩWÿӝng sҧQTXD ÿy giúp doanh nghiӋp hiӇX NKiFK KjQJ KѫQ UD ÿѭӧF FiF FKѭѫQJ WUuQK EiQ KjQJ Eҩt ÿӝng sҧn hӧSOêFNJQJQKѭTXҧn lý hӧSÿӗng, chi phí cӫa dӵ án bҩWÿӝng sҧn hiӋu quҧ.
Mөc tiêu
Mͭc tiêu t͝ng quát: xây dӵng kho dӳ liӋu trên nӅn tҧQJÿiPPk\ tӯ ÿyӭng dөng xây dӵng các báo cáo thông minh BI tӯ kho dӳ liӋu dӵa trên dӳ liӋu cӫa doanh nghiӋp kinh doanh bҩWÿӝng sҧn
- Nghiên cӭu và nҳPÿѭӧc các khái niӋPFѫEҧn cӫa kho dӳ liӋu, các thuӝc tính cӫa kho dӳ liӋu
- Nghiên cӭXYjÿӅ xuҩt mô hình kho dӳ liӋu cho mӝt công ty Xây dӵng và kinh doanh bҩWÿӝng sҧQÿLӇn hình: dӳ liӋu bán hàng, dӳ liӋu mua hàng và dӳ liӋu ngân sách cӫa công ty
- Nghiên cӭu và xây dӵng kho dӳ liӋu trên nӅn tҧQJ ÿiP Pk\ AWS cӫa Amazon
- Nghiên cӭu và xây dӵng giҧi pháp trích xuҩt, xӱ OêYjÿѭDGӳ liӋu tӯ FѫVӣ dӳ liӋu vào kho dӳ liӋu bҵng công cө Pentaho Data Integration
- Nghiên cӭu và xây dӵng các báo cáo thông minh BI dành cho doanh nghiӋp bҩWÿӝng sҧn bҵng ӭng dөng Power BI
- Xây dӵng kho dӳ liӋu trên nӅn tҧQJÿiPPk\Fӫa Amazon
- Xây dӵQJÿѭӧc các báo cáo BI cho phòng ban SALES, KӃ toán, Cung ӭng và phòng hoҥFKÿӏnh ngân sách
Nghiên cứu khoa học chính là nghiên cứu xuất các giải pháp và xây dựng "Xây Dựng Kho Dữ Liệu Trên Nền Tảng Các Dịch Vụ Phần Mềm Đám Mây", để cải thiện chất lượng dữ liệu và cung cấp nền tảng dữ liệu chung phục vụ công tác quản lý nhà nước.
Vө Bi Cho Công Ty Xây Dӵng Và Kinh Doanh BҩWĈӝng SҧnĈk\OjÿӅ tài lӟn mang tính áp dөng công nghӋ YjWtQKÿһc thù cӫa tӯQJOƭQKYӵc khi triӇQNKDLĈӇ ÿҧm bҧo chҩWOѭӧng và trong khҧ QăQJFKRSKpSÿӅ tài xin giӟi hҥQYjRQKѭQJSKҫn cӕt lõi cӫa kiӃn trúc kho dӳ liӋXWURQJOƭQKYӵc bҩWÿӝng sҧn và kinh doanh khách sҥn - biӋt thӵ nghӍ Gѭӥng trên nӅn tҧQJ ÿiP Pk\ Yj F{QJ Fө tích hӧp dӳ liӋu là Pentaho Data Integration:
- Tìm hiӇu vӅ kiӃn trúc kho dӳ liӋu và tính cҫn thiӃWFNJQJQKѭVӵ khác biӋt so vӟi hӋ thӕng giao dӏch nghiӋp vө
- Tìm hiӇu vӅ giҧi pháp kiӃn trúc kho dӳ liӋu cӫa nhà cung cҩp giҧi pháp Cloud AWS cӫa Amazon và các công nghӋ hӛ trӧ viӋc phân tích dӳ liӋu nhҵm trích xuҩt thông tin: phҫn mӅm Pentaho Data Integration, phҫn mӅm Microsoft Power BI
- Nghiên cӭu giҧi pháp xây dӵng kho dӳ liӋu phù hӧp vӟi thӵc trҥng vӅ nhân lӵc, chi phí cӫa các doanh nghiӋp vӯa và nhӓ tҥi ViӋt Nam
- Nghiên cӭu mô hình dӳ liӋu nhҵm xây dӵng các báo cáo thông minh BI WURQJOƭQKYӵc kinh doanh bҩWÿӝng sҧn
Xây dӵng kho dӳ liӋu vӟi chӫ ÿӅ sҧn phҭm dӵa trên nӅn tҧng công nghӋ Cloud và thiӃt lұp công cө khai thác dӳ liӋu tӯ kho dӳ liӋXÿӇ chӭng mình tính khҧ thi và ÿiSӭng yêu cҫu cӫa kho dӳ liӋXÿm[k\Gӵng
Xây dựng các báo cáo kinh doanh mang tính ứng dụng thực tiễn: Phân tích khách hàng giúp doanh nghiệp hiểu rõ nhu cầu và hành vi mua sắm của khách hàng mục tiêu Báo cáo kinh doanh bán hàng theo dõi hiệu suất bán hàng, doanh số và tỷ lệ chuyển đổi Báo cáo cung ứng tối ưu hóa chuỗi cung ứng, quản lý hàng tồn kho và dự báo nhu cầu Báo cáo ngân sách dự án giúp theo dõi chi phí dự án, đảm bảo tính minh bạch và hiệu quả trong việc sử dụng ngân sách.
1.5 éQJKƭDWKӵc tiӉn éQJKƭDWKӵc tiӉn cӫa luұQYăQEDRJӗm:
- ĈӅ xuҩt mô hình dӳ liӋu trong viӋc xây dӵng kho dӳ liӋu tӯ nguӗn dӳ liӋu giao dӏch cӫa doanh nghiӋp bҩWÿӝng sҧn
- Tҥo mӝt kho dӳ liӋu và bӝ công cө ÿiSӭQJÿҫ\ÿӫ và nhanh chóng yêu cҫu lұp báo cáo quҧn trӏ và ra quyӃWÿӏnh cho mӝt doanh nghiӋp bҩWÿӝng sҧn
Nӝi dung cӫDFKѭѫQJQj\VӁ xoay quanh nghiên cӭu vӅ FѫVӣ lý thuyӃt kho dӳ liӋu, dӏch vө Fѫ Vӣ dӳ liӋu quan hӋ cӫa Amazon Web Services, công cө Pentaho Data Integration và công cө trӵc quan hóa dӳ liӋu Microsoft Power BI
Vì mөc tiêu cӫDÿӅ tài là xây dӵng kho dӳ liӋu trên nӅn tҧQJÿiPPk\GRÿy ÿӅ tài sӁ tұp trung nghiên cӭu khái niӋm kho dӳ liӋu và áp dөng xây dӵng trên nӅn tҧQJÿiPPk\Fӫa Amazon Web Services là mӝt công ty con cӫa Amazon cung cҩp các nӅn tҧQJÿLӋQWRiQÿiPPk\WKHR\rXFҫu cho các cá nhân, công ty và chính phӫ, WUrQFѫVӣ trҧ tiӅn theo nhu cҫu sӱ dөng Bên cҥQKÿyÿӇ tích hӧp dӳ liӋu tӯ bên QJRjLQKѭWӋp dӳ liӋXFѫVӣ dӳ liӋu mà cө thӇ là dӳ liӋu công ty kinh doanh và xây dӵng bҩW ÿӝng sҧn ÿӅ tài sӁ nghiên cӭu và sӱ dөng công cө Pentaho Data Integration cӫa Hitachi cung cҩp các khҧ QăQJ7UtFK[Xҩt, ChuyӇQÿәi và TҧLÿӇ tҥo ÿLӅu kiӋn thuұn lӧi cho quá trình thu thұp, làm sҥFKYjOѭXWUӳ dӳ liӋu bҵng cách sӱ dөQJÿӏnh dҥQJÿӗng nhҩt và nhҩt quán có thӇ truy cұp và phù hӧp vӟLQJѭӡi dùng cuӕi Và cuӕLFQJÿӅ tài sӁ tìm hiӇu và ӭng dөng xây dӵng các báo cáo BI bҵng công cө Power BI là mӝt dӏch vө phân tích kinh doanh cӫa Microsoft Nó nhҵm mөFÿtFKFXQJFҩp hình ҧQKWѭѫQJWiFYjNKҧ QăQJNLQKdoanh thông minh vӟi giao diӋQÿӫ ÿѫQJLҧQÿӇ QJѭӡi dùng cuӕi tҥo báo cáo và trang tәng quan cӫa riêng hӑ
Vì khҧ QăQJWLӃp cұn dӉ và chi phí thҩp nên các công cө kӇ trên sӁ dӉ dàng triӇn khai cho doanh nghiӋp QKѭQJYүQÿiSӭQJÿҫ\ÿӫ yêu cҫu vì các phҫn mӅm và ӭng dөng thuӝc các công ty lӟn và tên tuәi trên thӃ giӟL QKѭ $PD]RQ +LWDFKL Yj Microsoft
Nguӗn dӳ liӋu sӱ dөng tích hӧSYjÿѭDYjRNKRGӳ liӋXVDXÿyWUӵc quan hóa trên ӭng dөng Power BI sӁ là nguӗn dӳ liӋu giao dӏch cӫa doanh nghiӋp kinh doanh và xây dӵng bҩWÿӝng sҧn Tәng quan vӅ kho dӳ liӋu
'DWDEDVH&ѫVӣ dӳ liӋu) là mӝt tұp hӧp có tә chӭc các thông tin có cҩu trúc hoһc dӳ liӋXWKѭӡQJÿѭӧFOѭXWUӳ trӵc tuyӃn trong mӝt hӋ thӕng máy tính MӝWFѫ sӣ dӳ liӋXWKѭӡQJÿѭӧc kiӇm soát bӣi hӋ thӕng quҧQOêFѫVӣ dӳ liӋu (DBMS) Cùng vӟi nhau, dӳ liӋu và DBMS, cùng vӟi các ӭng dөQJÿѭӧc liên kӃt vӟLFK~QJÿѭӧc gӑi là mӝt hӋ thӕQJFѫVӣ dӳ liӋXWKѭӡQJÿѭӧc rút ngҳQWKjQKFѫVӣ dӳ liӋu [1] Mӝt sӕ loҥi database:
- HӋ thӕQJ Fѫ Vӣ quҧn lý dӳ liӋu quan hӋ - RDBMS (Oracle, MySQL, MS
- CSDL dҥng khúa ± giỏ trӏ 5HGLV0HPFDFKHGô
- Mụ hỡnh wide ± FROXPQ&DVVDQGUD+%DVHô
- CSDL dҥng bӝ máy tìm kiӃm (Elasticsearch)
2.1.1.2 Transaction và thuӝc tính ACID
Trong ngӳ cҧnh database trong hӋ thӕng nghiӋp vө, mӝt tác vө cҫn truy xuҩt, hӋ tKӕQJ QJKLӋSYөFҫQSKҧLTXҧQOêOѭXWUӳ9ӅPһWӭQJGөQJPjQyLFiFWKӵFWKӇWKXӝF
FQJPӝWORҥLFyFiFWKXӝFWtQKJLӕQJKӋWQKDX
&KXҭQKóa OjTXiWUuQKWiFKEҧQJSKkQUmWKjQKFiFEҧQJQKӓKѫQGӵDYjR
FiFSKөWKXӝFKjP&iFGҥQJFKXҭQOjFiFFKӍGүQÿӇWKLӃWNӃFiFEҧQJWURQJ&6'/
0өFÿtFKFӫDFKXҭQKóa OjORҥLEӓFiFGѭWKӯDGӳOLӋXYjFiFOӛLNKLWKDRWiFGѭ
WKӯDYjFiFOӛLNKLWKDRWiFGӳOLӋX,QVHUW'HOHWH8SGDWH1KѭQJFKXҭQKóa làm
WăQJWKӡLJLDQWUX\YҩQ ĈӇWKӓD PmQWtQK$&,'WKLӃWNӃFӫDPӝWGDWDEDVHWKѭӡQJÿѭӧFÿѭDYӅGҥQJ
FKXҭQ1)- WK1RUPDO)RUPTX\ÿӏQKUҵQJPӛLWKӵFWKӇWURQJGDWDEDVHSKҧL thӓD PmQFiFÿLӅXNLӋQVDX
- Giá trӏ cӫa mӝt thuӝc tính phҧi là giá trӏ nguyên tӕ, tӭc là không phҧi mӝt danh sách các giá trӏ phӭc hӧp (Chuҭn 1 - 1NF)
- Các thuӝc tính không phҧi khóa chính chӍ phө thuӝc vào toàn bӝ tұp khóa chính, không phө thuӝc vào tұp con nào cӫa tұp khóa chính nói trên (Chuҭn
- Các thuӝc tính không phҧi khóa ÿӝc lұp vӟi nhau (không thӇ nӝi suy giá trӏ mӝt thuӝc tính tӯ các thuӝc tính không phҧi khóa khác) (Chuҭn 3 - 3NF)
'DWDEDVHWK{QJWKѭӡQJKD\FzQÿѭӧFJӑLOjGDWDEDVHQJKLӋSYөRSHUDWLRQDO database) KӛWUӧFiFQJKLӋSYөKjQJQJj\YjÿLӇPPҥQKQKҩWFӫD QyOjÿҧPEҧR WRjQYҽQGӳOLӋX[ӱOêJLDRGӏFKWUX\FұSVRQJVRQJYjNK{QJWKӓD PmQFiF\rXFҫX YӅSKkQWtFKGӳOLӋX7K{QJWKѭӡQJFiFGDWDEDVHQJKLӋSYөFKӍOѭXWUӳGӳOLӋXFKL WLӃW FKR WKӡL ÿLӇP KLӋQ WҥL NK{QJ OѭX WUӳ Gӳ OLӋX OӏFK Vӱ Gӳ OLӋX WURQJ GDtabase ÿѭӧFWKLӃWNӃFKXҭQKóa UҩWFDRQrQWKѭӡQJFyKLӋXQăQJNpPNKLWUX\YҩQSKӭFWҥS KRһFNKӕLOѭӧQJGӳOLӋXOӟQYjYLӋFWUX\YҩQGӳOLӋXWӯQKLӅXQJXӗQNKiFQKDXOj JҫQQKѭNK{QJWKӇQӃXFKӍGQJGDWDEDVHQJKLӋSYө+ӋWKӕQJTXҧQOê2SHUDWLRQDO DatabDVH Oj KӋ WKӕQJ [ӱ Oê JLDR GӏFK WUӵF WX\ӃQ OLTP - Online Transaction Processing) [2]
'DWD:DUHKRXVHNKRGӳOLӋX OjNKiLQLӋPÿѭӧFJLӟLWKLӋXOҫQÿҫXYjRQăP
EӣLQKjQJKLrQFӭXFӫD,%0Oj%DUU\'HYOLQYj3DXO0XUSK\Ĉk\OjQѫL OѭXWUӳGӳOLӋXEҵQJ WKLӃWEӏÿLӋQWӱFӫD PӝWWәFKӭF GRDQK QJKLӋSQKҵPKӛWUӧ YLӋF SKkQ WtFK Gӳ OLӋX Yj OұS EiR FiR 9j WKHR F{QJ W\ FKX\rQ OұS WUuQK KӋ WKӕQJSKҫQ PӅP FKR GRDQK QJKLӋS 0RQD 0HGLD WKu ÿy Oj FiFK KLӇX WKHR WUX\ӅQ WKӕQJWҥLWKӡLÿLӇPNKiLQLӋPNKRGӳOLӋXQj\UDÿӡLYj'DWDZDUHKRXVHQJj\QD\ ÿmNKiF
1Jj\QD\QJѭӡLWDKLӇX³NKRGӳOLӋX´WKHRQJӳFҧQKUӝQJKѫQEDRJӗP WұSFiF SKѭѫQJSKiSNӻWKXұWYjF{QJQJKӋFyWKӇNӃWKӧSKӛWUӧQKDXÿӇWKXWKұSYjTXҧQ OêGӳOLӋXWӯQKLӅXQJXӗQP{LWUѭӡQJNKiFQKDXÿӇFXQJFҩSWK{QJWLQFKRQJѭӡLVӱ GөQJ'RÿyNKRGӳOLӋXFzQFyWKӇÿѭӧFJӑLEҵQJQKӳQJFiLWrQVDXKӋWKӕQJKӛ WUӧTX\ӃWÿӏQKKӋWKӕQJÿLӅXKjQKWK{QJWLQKӋWKӕQJWK{QJWLQTXҧQOêӭQJGөQJ SKkQWtFK.KRGӳOLӋXWKѭӡQJFyGXQJOѭӧQJOrQÿӃQKjQJWUăP*%WKұPFKtWtQK EҵQJÿѫQYӏ7%
KӃt quҧ cө thӇ
Xây dựng kho dữ liệu với chất lượng số liệu sạch từ nguồn công nghệ Cloud và thiết lập công cụ khai thác dữ liệu từ kho dữ liệu, chứng minh tính khả thi và đáp ứng yêu cầu của kho dữ liệu nhằm khai thác tối đa giá trị của dữ liệu.
Xây dӵng các bӝ báo cáo mang tính ӭng dөng thӵc tiӉQWURQJOƭQKYӵc kinh doanh bҩWÿӝng sҧn: báo cáo phân tích khách hàng, báo cáo kinh doanh bán hàng, báo cáo cung ӭng, báo cáo ngân sách dӵ án.
éQJKƭDWKӵc tiӉn
Giӟi ThiӋu Chung VӅ Database
Hệ quản trị cơ sở dữ liệu (DBMS) là một tập hợp thống tin được cấu trúc chặt chẽ trong máy tính DBMS kiểm soát và quản lý dữ liệu Cùng với dữ liệu và DBMS, các ứng dụng liên kết được gọi là hệ quản lý cơ sở dữ liệu rút gọn (RDBMS).
- HӋ thӕQJ Fѫ Vӣ quҧn lý dӳ liӋu quan hӋ - RDBMS (Oracle, MySQL, MS
- CSDL dҥng khúa ± giỏ trӏ 5HGLV0HPFDFKHGô
- Mụ hỡnh wide ± FROXPQ&DVVDQGUD+%DVHô
- CSDL dҥng bӝ máy tìm kiӃm (Elasticsearch)
2.1.1.2 Transaction và thuӝc tính ACID
Trong ngӳ cҧnh database trong hӋ thӕng nghiӋp vө, mӝt tác vө cҫn truy xuҩt, hӋ tKӕQJ QJKLӋSYөFҫQSKҧLTXҧQOêOѭXWUӳ9ӅPһWӭQJGөQJPjQyLFiFWKӵFWKӇWKXӝF
FQJPӝWORҥLFyFiFWKXӝFWtQKJLӕQJKӋWQKDX
&KXҭQKóa OjTXiWUuQKWiFKEҧQJSKkQUmWKjQKFiFEҧQJQKӓKѫQGӵDYjR
FiFSKөWKXӝFKjP&iFGҥQJFKXҭQOjFiFFKӍGүQÿӇWKLӃWNӃFiFEҧQJWURQJ&6'/
0өFÿtFKFӫDFKXҭQKóa OjORҥLEӓFiFGѭWKӯDGӳOLӋXYjFiFOӛLNKLWKDRWiFGѭ
WKӯDYjFiFOӛLNKLWKDRWiFGӳOLӋX,QVHUW'HOHWH8SGDWH1KѭQJFKXҭQKóa làm
WăQJWKӡLJLDQWUX\YҩQ ĈӇWKӓD PmQWtQK$&,'WKLӃWNӃFӫDPӝWGDWDEDVHWKѭӡQJÿѭӧFÿѭDYӅGҥQJ
FKXҭQ1)- WK1RUPDO)RUPTX\ÿӏQKUҵQJPӛLWKӵFWKӇWURQJGDWDEDVHSKҧL thӓD PmQFiFÿLӅXNLӋQVDX
- Giá trӏ cӫa mӝt thuӝc tính phҧi là giá trӏ nguyên tӕ, tӭc là không phҧi mӝt danh sách các giá trӏ phӭc hӧp (Chuҭn 1 - 1NF)
- Các thuӝc tính không phҧi khóa chính chӍ phө thuӝc vào toàn bӝ tұp khóa chính, không phө thuӝc vào tұp con nào cӫa tұp khóa chính nói trên (Chuҭn
- Các thuӝc tính không phҧi khóa ÿӝc lұp vӟi nhau (không thӇ nӝi suy giá trӏ mӝt thuӝc tính tӯ các thuӝc tính không phҧi khóa khác) (Chuҭn 3 - 3NF)
Data Warehouse
'DWDEDVHWK{QJWKѭӡQJKD\FzQÿѭӧFJӑLOjGDWDEDVHQJKLӋSYөRSHUDWLRQDO database) KӛWUӧFiFQJKLӋSYөKjQJQJj\YjÿLӇPPҥQKQKҩWFӫD QyOjÿҧPEҧR WRjQYҽQGӳOLӋX[ӱOêJLDRGӏFKWUX\FұSVRQJVRQJYjNK{QJWKӓD PmQFiF\rXFҫX YӅSKkQWtFKGӳOLӋX7K{QJWKѭӡQJFiFGDWDEDVHQJKLӋSYөFKӍOѭXWUӳGӳOLӋXFKL WLӃW FKR WKӡL ÿLӇP KLӋQ WҥL NK{QJ OѭX WUӳ Gӳ OLӋX OӏFK Vӱ Gӳ OLӋX WURQJ GDtabase ÿѭӧFWKLӃWNӃFKXҭQKóa UҩWFDRQrQWKѭӡQJFyKLӋXQăQJNpPNKLWUX\YҩQSKӭFWҥS KRһFNKӕLOѭӧQJGӳOLӋXOӟQYjYLӋFWUX\YҩQGӳOLӋXWӯQKLӅXQJXӗQNKiFQKDXOj JҫQQKѭNK{QJWKӇQӃXFKӍGQJGDWDEDVHQJKLӋSYө+ӋWKӕQJTXҧQOê2SHUDWLRQDO DatabDVH Oj KӋ WKӕQJ [ӱ Oê JLDR GӏFK WUӵF WX\ӃQ OLTP - Online Transaction Processing) [2]
'DWD:DUHKRXVHNKRGӳOLӋX OjNKiLQLӋPÿѭӧFJLӟLWKLӋXOҫQÿҫXYjRQăP
EӣLQKjQJKLrQFӭXFӫD,%0Oj%DUU\'HYOLQYj3DXO0XUSK\Ĉk\OjQѫL OѭXWUӳGӳOLӋXEҵQJ WKLӃWEӏÿLӋQWӱFӫD PӝWWәFKӭF GRDQK QJKLӋSQKҵPKӛWUӧ YLӋF SKkQ WtFK Gӳ OLӋX Yj OұS EiR FiR 9j WKHR F{QJ W\ FKX\rQ OұS WUuQK KӋ WKӕQJSKҫQ PӅP FKR GRDQK QJKLӋS 0RQD 0HGLD WKu ÿy Oj FiFK KLӇX WKHR WUX\ӅQ WKӕQJWҥLWKӡLÿLӇPNKiLQLӋPNKRGӳOLӋXQj\UDÿӡLYj'DWDZDUHKRXVHQJj\QD\ ÿmNKiF
1Jj\QD\QJѭӡLWDKLӇX³NKRGӳOLӋX´WKHRQJӳFҧQKUӝQJKѫQEDRJӗP WұSFiF SKѭѫQJSKiSNӻWKXұWYjF{QJQJKӋFyWKӇNӃWKӧSKӛWUӧQKDXÿӇWKXWKұSYjTXҧQ OêGӳOLӋXWӯQKLӅXQJXӗQP{LWUѭӡQJNKiFQKDXÿӇFXQJFҩSWK{QJWLQFKRQJѭӡLVӱ GөQJ'RÿyNKRGӳOLӋXFzQFyWKӇÿѭӧFJӑLEҵQJQKӳQJFiLWrQVDXKӋWKӕQJKӛ WUӧTX\ӃWÿӏQKKӋWKӕQJÿLӅXKjQKWK{QJWLQKӋWKӕQJWK{QJWLQTXҧQOêӭQJGөQJ SKkQWtFK.KRGӳOLӋXWKѭӡQJFyGXQJOѭӧQJOrQÿӃQKjQJWUăP*%WKұPFKtWtQK EҵQJÿѫQYӏ7%
+Ӌ WKӕQJ ÿѭӧF GQJ FKR NKR Gӳ OLӋX Oj KӋ WKӕQJ [ӱ Oê SKkQ WtFK WUӵF WX\ӃQ (OLAP ± 2QOLQH$QDO\WLFDO3URFHVVLQJ1yÿѭӧFWӕLѭXKyDFKRYLӋFWUX\YҩQYj EiRFiRWҥRÿLӅXNLӋQFKRWUX\YҩQQJKLӋSYөWK{QJPLQK2/$3WҥRÿLӅXNLӋQ[ӱ OêPӝWWұSGӳOLӋXOӟQYӟLWKӡLJLDQWѭѫQJWiFÿѭӧFNpRGjLKѫQ2/$3FNJQJFKR SKpSQJѭӡLVӱGөQJ FyFiLQKuQEӭFWUDQKWRjQFҧQKFiFFRQVӕNKӫQJKRҧQJWӯÿy WuPUD[XKѭӟQJYjQKuQUDEӭFWUDQKOӟQKѫQ [3]
7KDPVӕ 'DWDEDVHQJKLӋSYө Data warehouse
0өFÿtFK ĈѭӧFWKLӃWNӃÿӇOѭXOҥLEҧQJKL ĈѭӧFWKLӃWNӃÿӇSKkQWtFK
NK{QJÿѭӧFFKXҭQKyD ĈӏQKKѭӟQJ SKөFYөÿӏQKKѭӟQJFKRӭQJ
GөQJVҧQSKҭP ÿӏQKKѭӟQJFKRFiFORҥLPөF ÿtFKNKiFQKDX
WKѭӡQJJLӟLKҥQWURQJӭQJ GөQJ
OѭXWUӳGӳOLӋXWӯQKLӅXQJXӗQ khác nhau ĈӝNKҧGөQJ GӳOLӋXFyVҹQWӯWKӡLJLDQ
WKӵFFҫQOjFy ÿѭӧFOjPPӟLNKLFҫQWKLӃWWӯ QKLӅXQJXӗQNKiFQKDXFҫQWKu SKҧLÿӧLKӋWKӕQJFKҥ\WҥROҥLGӳ OLӋXÿӏQKNǤFҫQWKLӃW
6ӱGөQJ ӻWKXұWP{KuQK(5ÿѭӧFVӱ
.ӻWKXұWP{KuQKGӳOLӋXÿѭӧF VӱGөQJ
.ӻWKXұW &DSWXUHGӳOLӋX $QDO\]HGӳOLӋX
/RҥLGӳOLӋX 'ӳOLӋXÿѭӧFOѭXWUӳWURQJ&ѫ
VӣGӳOLӋXÿѭӧFFұSQKұW
'ӳOLӋXKLӋQWҥLYjOӏFKVӱÿѭӧF OѭXWUӳ&yWKӇNK{QJÿѭӧFFұS nKұW
/ѭXWUӳGӳOLӋX 3KѭѫQJSKiSWLӃSFұQTXDQKӋ
SKҷQJÿѭӧFVӱGөQJÿӇOѭXWUӳ GӳOLӋX
6ӱGөQJSKѭѫQJSKiSWLӃSFұQ ÿDFKLӅXYjFKXҭQKyDFKRFҩX WU~FGӳOLӋX9tGө/ѭӧFÿӗVDR YjE{QJWX\ӃW
JLҧQÿѭӧFVӱGөQJ
&iFWUX\YҩQSKӭFWҥSÿѭӧFVӱGөQJFKRPөFÿtFKSKkQWtFK 7yPWҳWGӳOLӋX /ѭXGӳOLӋXFKLWLӃW /ѭXWUӳGӳOLӋXWyPWҳW
0өFÿtFK KӛWUӧJLDRGӏFKKjQJQJj\ báo cáo và phân tích data
7KLӃWNӃ KѭӟQJӭQJGөQJ KѭӟQJFKӫÿӅ
Data FұSQKұWFyWtQKQJKLӋSYө EӅQYӳQJFyWtQKOӏFKVӱ
.tFKWKѭӟF snapshot, GB archive, TB
7UX\YҩQ JLDRGӏFKÿѫQJLҧQYjFұSQKұW
SKӭFWҥSWUX\YҩQWәQJKӧSYj FұSQKұWKҥQFKӃ
1JѭӡLGQJ hàng nghìn KjQJWUăP
B̫ng 1 So sánh database và data warehouse
'DWD:DUHKRXVHFKtQKOjGDWDEDVHFKX\rQGQJFKRWҥREiRFiRYjSKkQWtFK GӳOLӋX1yYӯDKӛWUӧFiFWUX\YҩQSKӭFWҥSYӯDOjÿLӇPWұSWUXQJGӳOLӋXWӯQKLӅX QJXӗQ NKiF QKDX ÿӇ Fy ÿѭӧF WK{QJ WLQ SKkQ WtFK ÿҫ\ ÿӫ QKҩW 7KHR ÿy GDWD ZDUHKRXVHOjPӝWWұSKӧSGӳOLӋXKѭӟQJFKӫÿӅWRjQYҽQNK{QJEӏUzUӍPҩWPiWYj FyJLiWUӏOӏFKVӱ
- 7tQKK˱ͣQJFKͯÿ͉6XEMHFW-oriented): x ĈѭӧFWәFKӭF[XQJTXDQKFiFFKӫÿӅFKtQKQKѭNKiFKKjQJFXVWRPHUVҧQ SKҭPSURGXFWEiQKjQJVDOHV x 7ұSWUXQJYjRYLӋFP{KuQKKyDYjSKkQWtFKGӳOLӋXFKRFiFQKjÿѭDUDTX\ӃW ÿӏQKPjNK{QJWұSWUXQJYjRFiFKRҥWÿӝQJKD\FiF[ӱOêJLDRGӏFKKjQJQJj\ x &XQJFҩSPӝWNKXQJQKuQÿѫQJLҧQYjV~FWtFK[XQJTXDQKFiFVӵNLӋQ FӫDFiF FKӫÿӅ
- 7tQKWRjQÝQ,QWHJUDWHG x ĈѭӧF[k\GӵQJEҵQJYLӋFWtFKKӧSGӳOLӋXWӯFiFQJXӗQGӳOLӋXKӛQWҥSÿDEӝ
&ѫVӣGӳOLӋXTXDQKӋUHODWLRQDOGDWDEDVHVIODWILOHVFiFEҧQJJKLJLDRGӏFKWUӵFWX\ӃQ x &iFNӻWKXұWOjPVҥFKYjWtFKKӧSGӳOLӋXÿѭӧFiSGөQJÿҧPEҧRVӵÿӗQJQKҩW WURQJFiFTX\ѭӟFWrQFҩXWU~FPmKyDFiFÿѫQYӏÿRWKXӝFWtQKôJLӳDFiF QJXӗQNKiFQKDXNKLGӳOLӋXÿѭӧFFKX\ӇQÿӃQNKRGӳOLӋXQyVӁÿѭӧFFKX\ӇQ ÿәL
- 7tQKḘWEL͇Q1RQ9RODWLOH x /jPӝWOѭXWUӳYұWOêFӫDGӳOLӋXÿѭӧFFKX\ӇQÿәLWӯP{LWUѭӡQJWiFQJKLӋS x &ұSQKұWWiFQJKLӋSFӫDGӳOLӋXNK{QJ[XҩWKLӋQWURQJP{LWUѭӡQJNKRGӳOLӋX NK{QJ\rXFҫXFiFFѫFKӃ[ӱOêJLDRGӏFKSKөFKӗLYjÿLӅXNKLӇQWѭѫQJWUDQK FKӍ\rXFҫXKDLWKDRWiFWURQJWUX\FұSGӳOLӋX1ҥSYjWUX\FұSGӳOLӋX
- *LiWU͓O͓FKV͵7LPH-varying): x Connect to Database (Ctrl+U) tӯ menu bar b Nhұp vào box:
Password: nhұp mұt khҭu ặ Chӑn OK
Hình 3-14 K͇t n͙i kho dͷ li u b̹ng MySQL Workbech c Làm viӋc vӟi MySQL Workbench
Hình 3-15 T̩o b̫ng dͷ li u b̹ng SQL Script trong MySQL Workbench
Bҧng dӳ liӋu có thӇ ÿѭӧc tҥo bҵng câu lӋnh mySQL script
Hình 3-16 Thêm dͷ li u vào kho dͷ li u b̹ng file csv
KiӇm tra dӳ liӋu sau khi import thành công bҵng cách query dӳ liӋu
Hình 3-17 Ki͋m tra dͷ li u trong kho dͷ li u b̹ng MySQL workbench
Xӱ lý dӳ liӋXÿѭDYjRNKRGӳ liӋu phөc vө báo cáo BI
Xây dӵng bӝ dӳ liӋu dùng cho báo cáo bán hàng
Dữ liệu kinh doanh đóng vai trò quan trọng trong việc cung cấp cái nhìn toàn cảnh về tình hình bán hàng theo các chiến dịch và theo thời gian Nhờ đó, doanh nghiệp có thể hiểu rõ hơn về khách hàng của mình theo các loại hình sản phẩm khách hàng quan tâm, loại hình sản phẩm bán chạy nhất, thị trường nào kinh doanh tốt nhất, khách hàng thuộc khu vực nào và thuộc nhóm thu nhập nào.
3.3.1.1 Báo cáo sӕ Oѭӧng sҧn phҭPÿmEiQ
Báo cáo vӅ sӕ Oѭӧng sҧn phҭPÿmEiQ và sҧn phҭm còn lҥi nhҵm cung cҩp cái nhìn toàn cҧnh vӅ tình hình bán hàng cӫa công ty theo dӵ án và theo thӡi gian
Sӱ dөQJ5'6Yj0\64/:RUNEHQFKÿӇ OѭXWUӳ và quҧn lý dӳ liӋu vӅ bҩWÿӝng sҧn; ETL dӳ liӋu vӟi PDI (Pentaho Data Integration) và tҥo báo cáo Sales vӟi Power
BI Tӯ bҧQJà+RXVHảYjà&RQWUDFWảWtQKUDÿѭӧc tәng sӕ FăQKLӋn cú, sӕ FăQÿmEiQ BOD giӳ và sӕ FăQFzQOҥLVDXÿy[HP[pWGRDQKVӕ theo kênh bán và theo dӵ án
Giҧi thích ý QJKƭD các cӝt trong 2 bҧng:
AOID: Mã dӵ án/phase/building/ property type/house
AOTYPE: Loҥi dӵ án/phase/ building/ property type/house
STATUS: trҥng thái FăQ hӝ
DB_KEY: Key VBELN: Mã hӧp ÿӗng VBELN_PRE: Mã giҩy ÿһt cӑc AUART: Loҥi hӧp ÿӗng
BUKRS: Công ty CURR: TiӅn tӋ DD_DATE: Ngày mua SIGN_DATE: Ngày ký ESTAT: Trҥng thái PAPER_CN_TYPE: Loҥi hӧp ÿӗng bán sӍ/lҿ AOXM: Mã dӵ án
AOFQ: Mã Phase AOLD: Mã Building AOYT: Mã Loҥi hình Bҩt ÿӝng sҧn AOFY: Mã FăQ hӝ
KUNNR: Khách hàng LYQD: Kênh bán hàng GW_ID: ID nhân viên bán hàng RGZJ: Tәng giá trӏ FăQ hӝ ACTUAL_AMOUNT: Sӕ tiӅn ÿm thanh toán NH_BUKRS: Novahome Company Code
B̫ng 2 éQJKƭDFiFF͡t trong b̫ng House và Contract Ӣ bҧng à+RXVHả thỡ mó FăQ hӝ là khúa chớnh cũn bҧng à&RQWUDFWả thỡ DB_KEY là khóa chính và mã FăQ hӝ là khóa ngoҥi
Hai bҧng ÿѭӧc kӃt nӕi vӟi nhau qua mã FăQ hӝ (1 to many) 'DWD PRGHO ÿѭӧc thӇ hiӋQQKѭVDX
Hình 3-19 Liên k͇t dͷ li u b̫ng House và Contract qua AOID ± AOFY
Hình 3-19 mô tҧ mӕi liên kӃt giӳa bҧng House và Contract
Hình 3-20 ETL ± Báo cáo bán hàng
- 9uFӝW$2,'FӫDEҧQJà+RXVHảJӝSFKXQJWҩWFҧFiFPmGӵiQSKDVHEXLOGLQJ SURSHUW\W\SHKRXVHQrQSKҧL6HOI-RLQEҧQJà+RXVHảÿӇOҩ\ÿѭӧFPmYjWrQGӵ iQWѭѫQJӭQJFKRPmYjWrQFăQKӝ7KӵFKLӋQEҵQJFiFK
- /ӑFULrQJEҧQJà)LOWHU) 003 Sale Director > 006 Sale Manager > 002 Sales Supervisor > 007 Sales Consultant
%˱ͣ c 3: Inner Join 2 bҧng sau xӱ lý
- Inner Join bҵng ID và ID nhân viên bán hàng cӫa 2 bҧng sӁ UDÿѭӧc bҧng Sales Details cuӕi cùng
- Sӱ dөng Group by (COUNT sӕ FăQ 680 Wәng tiӅQ Yj 1XPEHU UDQJH ÿӇ phân nhóm khách hàng: x 3KkQQKyPWKHRVӕFăQ
- Merge Join lҥLÿӇ có bҧQJÿҫ\ÿӫ thêm 2 cӝt Phân nhóm khách hàng theo sӕ FăQYj3KkQQKyPNKiFKKjQJWKHRVӕ tiӅn
Hình 3-31 ETL báo cáo s̫n pẖPÿmEiQWKHRNKiFKKjQJ
Xây dӵng bӝ dӳ liӋu dӳ liӋu dùng cho báo cáo tiӃQÿӝ thu tiӅn
3.3.2.1 Báo cáo tiӃQÿӝ thu tiӅn
- %iRFiRKLӇQWKӏÿѭӧFFiFVӕOLӋXVDX
- 6ӕWLӅQWKӵFWKXWӯWKiQJÿӃQWKiQJWKHRWӯQJ'ӵiQ*URXS'ӵiQD
- 6ӕWLӅQSKҧLWKXWӯWKiQJÿӃQWKiQJWKHRWӯQJ'ӵiQ*URXS'ӵiQD
- 6ӕWKӵFKLӋQWKHRNӃKRҥFKNLQKGRDQKD
- 6ӕWLӅQWKӵFWKXÿѭӧFKLӇXOjWҩWFҧQKӳQJNKRҧQWKXFKROӏFKWKDQKWRiQFӫDWҩW FҧFiF+ӧSÿӗQJFyQJj\WKӵFWKXQҵPWURQJNKRҧQJ)URP± 7RPjXVHUFKӑQ FKҥ\%iRFiR
- 6ӕ WLӅQ SKҧL WKX ÿѭӧF KLӇX Oj WҩW Fҧ QKӳQJ NKRҧQ SKҧL WKX FӫD +ӧS ÿӗQJ Fy QJj\SKҧLWKXQҵPWURQJNKRҧng From ± 7RPjXVHUFKӑQFKҥ\%iRFiR
- 6ӕFKӍWLrXNӃKRҥFKNLQKGRDQKOjWәQJFӫD x 6ӕWLӅQSKҧLWKXWӯWKiQJÿӃQWKiQJFӫDQăPXVHUFKӑQFKҥ\%iRFiR x 6ӕFKӍWLrXNLQKGRDQKFӫDFiFWKiQJWURQJWѭѫQJODLQӃXFyFӫDQăPXVHUFKӑQ FKҥ\%iRFiR x 6ӕWKӵF KLӋQWKHRNӃKRҥFKNLQKGRDQKVӕWKӵFWKXFӫDWҩWFҧKӧSÿӗQJFyQJj\ WKXWKXӝFQăPXVHUFKӑQFKҥ\%iRFiR
Các khoản phải thu, phải trả thuộc lưu chuyển tiền tệ là các khoản thu/chi thuộc lịch thanh toán kế toán, bao gồm các khoản chi do thanh lý, giải thể hoặc thanh lý chuyển đổi, thanh lý hợp nhất doanh nghiệp; không bao gồm chi phí hoạt động, khoản trích lập phát sinh, các khoản phân bổ tiền lương thanh lý.
- Báo cáo KLӇQWKӏÿѭӧFFiFVӕOLӋXVDX: x 6ӕVҧQSKҭPÿmNê+ӧSÿӗQJ x 6ӕVҧQSKҭPFyQӧTXiKҥQWӯQJj\WUӣOrQ
- 7ӹOӋQӧTXiKҥQVӕWLӅQWKHRFiFPӕF x 7ӯÿӃQQJj\ x 7ӯÿӃQQJj\ x Trên 90 ngày ĈӏQKQJKƭDFiFFKӍ sӕ
Sӕ ngày quá hҥn = Ngày chҥy báo cáo - 1Jj\ÿӃn hҥn thanh toán
- 6ӕVҧQSKҭPÿmNê+Ĉ x +ӧSÿӗQJÿDQJFzQKLӋXOӵF x 1Jj\Nê+ӧSÿӗQJQҵPWURQJNKRҧQg From ± 7RPjXVHUFKӑQFKҥ\%iRFiR
- 6ӕVҧQSKҭPFyQӧTXiKҥQWӯQJj\WUӣOrQ x +ӧSÿӗQJÿDQJFzQKLӋXOӵF x 1Jj\Nê+ӧSÿӗQJQҵPWURQJNKRҧQJ)URP± 7RPjXVHUFKӑQFKҥ\%iRFiR x 6ӕQJj\TXiKҥQOӟQKѫQKRһFEҵQJQJj\
- 1ӧTXiKҥQVӕWLӅQFzQOҥLSKҧLWKDQKWRiQFKRWҩWFiNKRҧQQӧFӫDWҩWFҧQKӳQJ KӧSÿӗQJFzQKLӋXOӵFTXiKҥQFy x 6ӕ1Jj\TXiKҥQWӯÿӃQQJj\ x + 6ӕ1Jj\TXiKҥQWӯÿӃQQJj\ x 6ӕ1Jj\TXiKҥQOӟQKѫQQJj\
Hình 3-32 ETL cho báo cáo ti͇Qÿ͡ thu ti͉n
Hình 3-32FiFEѭӟc ETL báo cáo tiӃQÿӝ thu tiӅn
3.3.2.3 Xây dӵng bӝ dӳ liӋu dӳ liӋu dùng cho báo cáo thu mua cung ӭng
Báo cáo thu mua cung ӭQJ NKi ÿһc thù dành cho doanh nghiӋp bҩW ÿӝng sҧn trong viӋc quҧn lý chi phí và ngân sách cho các hӧSÿӗng thu mua nguyên vұt liӋu và thuê dӏch vө phөc vө cho quá trình xây dӵQJFNJQJQKѭTXҧn lý các hӧSÿӗng vӟi nhà cung cҩp.
Xây dӵng bӝ dӳ liӋu dӳ liӋu dùng cho báo cáo kӃ hoҥch thӵc hiӋn hӧp ÿӗng cung ӭng
Xây dӵng dӳ liӋX ÿҫu ra cho báo cáo bҵng công cө PDI - Pentaho Data Integration Dӳ liӋXÿҫu vào là dӳ liӋu thұt tӯ hӋ thӕng ERP cӫa doanh nghiӋp bҩt ÿӝng sҧn Gӗm 5 bҧng dӳ liӋu
Dựa trên mô hình chung của các dự án trong hệ thống, biểu đồ 3-33 trình bày thông tin tổng hợp về các tình trạng thực hiện hiện tại của dự án, bao gồm các thông số: 3367 dự án đã hoàn thành, 786 dự án đang triển khai và 30 dự án đang trong quá trình sửa đổi bổ sung.
Hình 3-36 B̫ng Plan Detail tͳ h th͙ng giao d͓ch OLTP
Hình 3-36 mô tҧ bҧng kӃ hoҥch ngân sách dӵ kiӃn chi tiӃt cӫa tӯng dӵ án, ví dө dӵ án A cҫQ Fy QJkQ ViFK FKR Wѭ Yҩn quҧn lý xây dӵQJ Wѭ YҩQ ,7 Wѭ Yҩn khӕi Oѭӧng
Hình 3-34 là dӳ liӋu thұt tӯ hӋ thӕng vӟi các khoҧn chi phí cho mӝt dӵ iQÿDQJ triӇn khai cӫa tұSÿRjQ
Bҧng dӳ liӋu thӭ 2 chӭa kӃ hoҥch chi tiӃt (plan detail) cho tӯng dӵ án, tӯng chi tiӃt sӁ ÿѭӧc rã nhӓ ÿӇ ÿѭDYjRWjLNKRҧn chi phí cӫa dӵ án (cost account) bҧng 3 Tәng hӧp 2 bҧng này sӁ ÿѭӧc chi tiӃt dӵ án và chi phí tәng cӫa tӯng kӃ hoҥch chi tiӃWÿy
Hình 3-35B̫ng Plan Header tͳ h th͙ng OLTP
Hình 3-36 B̫ng Contract tͳ h th͙ng OLTP
Dӳ liӋXÿҫu ra gӗm mӝt bҧng kӃt quҧ vӟLFiFWUѭӡng: tên dӵ án, ngân sách cho dӵ iQ QJkQ ViFK ÿm OrQNӃ hoҥFK QJkQ ViFKÿm Vӱ dөQJQJkQ ViFK FKѭD OrQNӃ hoҥch và ngân sách còn lҥi
Hình 3-37 Dͷ li Xÿ̯u ra (Target Data) chi phí ngân sách d án
Hình 3-38 Quy trình ETL ḽy dͷ li u chi phí ngân sách d iQÿ˱DYjRNKRGͷ li u
4 &+ѬѪ1*HIӊN THӴC CÁC BÁO CÁO THÔNG MINH BI VÀ ĈÈ1+*,È.ӂT QUҦ ĈҤ7ĈѬӦC
&KѭѫQJWDVӁ xây dӵng bӝ báo cáo BI tӯ kho dӳ liӋXÿmKLӋn thӵc tҥLFKѭѫQJ FNJQJQKѭÿiQKJLiNӃt quҧ ÿҥWÿѭӧc cӫa bӝ báo cáo BI này Do các dӳ liӋXÿm[k\ dӵng là dӳ liӋu cuӕi cùng và có thӇ trình diӉn bҵng công cө 3RZHU%,GRÿyFKӍ cҫn kӃt nӕi kho dӳ liӋXÿmWҥo vào Power BI và trình diӉn Thӵc tӃ, có thӇ sӱ dөng các chӭc QăQJWtQKWRiQWӯ 3RZHU%,FNJQJUҩt mҥnh mӁ QKѭQJÿӇ tránh ҧQKKѭӣng tӕc ÿӝ xӱ lý nên bӝ dӳ liӋu cuӕLÿmÿѭӧc ETL tҥi kho dӳ liӋu.
Xây dӵng bӝ báo cáo BI tӯ kho dӳ liӋu
Báo cáo bán hàng
Báo cáo bán hàng chung cho toàn bӝ dӵ án cӫa công ty bҩWÿӝng sҧn Sau khi ETL sӁ kӃt nӕi Power BI vӟi MySQL tҥi mөFÿӇ lҩy dӳ liӋu và trӵc quan KRiĈҫu tiên sӱ dөng 3 Card ÿӇ thӇ hiӋn sӕ FăQ7әng cӝng, sӕ FăQĈmEiQYj%2' giӳ lҥi và sӕ FăQFzQOҥi TiӃSÿyOj6WDFNHGFROXPQFKDUWÿӇ thӇ hiӋn phҫn WUăPFiFFRQ sӕ theo dӵ iQÿyPӝt cách trӵc quan Và cuӕi cùng là mӝW7DEOHÿӇ có thӇ dӉ dàng xem chi tiӃt dӳ liӋu theo tӯng dӵ iQFNJQJQKѭFiFFRQVӕ vӅ dӵ án Ӣ trang thӭ 2 sӱ dөQJ'RQXWFKDUWÿӇ thӇ hiӋn phҫQWUăPVҧn phҧPÿmEiQWKHR NrQKEiQKjQJYj7DEOHÿӇ xem sӕ liӋu chi tiӃt TiӃp theo là so sánh Tәng giá trӏ FăQ hӝ trên hӧSÿӗng và Sӕ tiӅQÿmWKDQKWRiQWKӵc tӃ cӫDFăQKӝ ÿyFKRÿӃn thӡLÿLӇm làm báo cáo sӱ dөng Treemap và Stacked area chart
Hình 4-1 Báo cáo bán hàng chung cho toàn b͡ d án cͯa công ty b̭Wÿ͡ng s̫n
TҥLÿk\QJѭӡi dùng có thӇ xem báo cáo theo dӵ án vӟi sӕ FăQÿmEiQYj BOD giӳ lҥi, sӕ FăQFKѭDEiQYjWәng sӕ FăQ
Báo cáo sҧn phҭPÿmEiQWKHRWKӡLJLDQFNJQJQKѭVӕ tiӅQÿmWKXWKHRWӯng tháng
Hình 4-2 Báo cáo s̫n pẖPÿmEiQWKHRWKͥLJLDQFNJQJQK˱V͙ ti͉QÿmWKXWKHRWͳng tháng
Hình 4-3 Báo cáo s̫n pẖPÿmEiQWKHRNrQKEiQKjQJ Ĉҫu tiên ta tҥo hierachy cho Nhóm dӵ án và Dӵ án, xem sӕ FăQ ÿm EiQ ÿѭӧc theo chiӅu thӡi gian dùng Line chart và Bar chart Nhìn vào hình và bҧng có thӇ thҩ\ÿѭӧc sӕ OѭӧQJFiFFăQÿmEiQWKHRWӯng tháng và theo cҧ quá trình, cao nhҩt và thҩp nhҩt ӣ tháng nào Ngoài ra có thӇ sӱ dөQJ6OLFHUÿӇ lӑc ra thӡi gian và dӵ án cҫQ[HP[pWNƭKѫQ
Hình 4-4 Báo cáo chi ti͇t s͙ FăQÿmEiQWKHRWKͥi gian, có th͋ xem theo nhóm d án và theo tháng
Báo cáo tương tác FAQ giúp người dùng xem dữ liệu theo dạng trực quan thông qua các thành phần như Bản đồ, Biểu đồ hình tròn, Bảng và Bộ lọc Ngoài ra, bảng điều khiển cũng cung cấp thông tin về các thành phố và tình trạng mới nhất.
Hình 4-5 Báo cáo s͙ FăQÿmEiQWKHRW͑nh thành, có th͋ xem theo thͥi gian và theo nhóm d án
Dӵa vào bҧQJÿm(7/UDWҥo hierachy cho nhân viên công theo theo thӭ tӵ cҩp bұc (001 Individual Agency > 003 Sale Director > 006 Sale Manager > 002 Sales Supervisor > 007 Sales Consultant), sӱ dөng Bar chart, Line chart và Table, Slicer ÿӇ biӇu diӉn
Hình 4-6 Báo cáo s͙ FăQÿmEiQWKHRJLiPÿ͙c sàn
TiӃp tөc sӱ dөng Pie chart%DUFKDUW7DEOH6OLFHUÿӇ thӕng kê khách hàng theo nhóm, cө thӇ là theo tәng tiӅn hӑ ÿmEӓ UDPXDFăQKӝ
Hình 4-7 Báo cáo theo t͑ l ph̯QWUăPQKyPNKiFKKjQJPXDWKHRV͙ ti͉n
/jPWѭѫQJWӵ QKѭdashboard ӣ WUrQQKѭQJӣ ÿk\OjFKLDQKyPNKiFKKjQJWKHR sӕ Oѭӧng sҧn phҭm hӑ ÿmPXD&NJQJFyWKӇ chӑn xem theo thӡi gian, dӵ án, nhóm dӵ án
Hình 4-8 Báo cáo theo t͑ l ph̯QWUăPQKyPNKiFKKjQJPXDWKHRs͙ FăQ
Báo cáo tiӃQÿӝ thu tiӅn
Báo cáo tình hình thu tiền cung cấp cái nhìn tổng quan theo nhóm dự án hoặc dự án về tình hình thu tiền của khách hàng theo thời gian Từ đó lý giải và quy định dựa trên nguyên tắc vào của công ty theo dự án và theo thời gian.
Báo cáo tiӃQÿӝ thu tiӅn theo kӃ hoҥFKNLQKGRDQKQăP
Hình 4-9 Báo cáo ti͇Qÿ͡ thu ti͉n theo k͇ ho̩FKNLQKGRDQKQăP
Báo cáo tiӃQÿӝ thu tiӅn thӵc tӃ bán hàng:
Hình 4-10 Báo cáo ti͇Qÿ͡ thu ti͉n thc t͇ bán hàng
Báo cáo tiӃQÿӝ thu tiӅn theo dӵ án:
Hình 4-11 Báo cáo ti͇Qÿ͡ thu ti͉n theo d án
Báo cáo nӧ xҩu, các khoҧn phҧi thu quá hҥn:
Hình 4-12 Báo cáo nͫ x̭u, các kho̫n ph̫i thu quá h̩n
Báo cáo kӃ hoҥch thӵc hiӋn ngân sách dӵ án
Báo cáo thӇ hiӋn kӃ hoҥch thӵc hiӋn ngân sách theo dӵ án và tiӃQÿӝ thӵc hiӋn hӧSÿӗng theo nhà cung cҩSWURQJOƭQKYӵc kinh doanh bҩWÿӝng sҧn
Hình 4-13 Báo cáo tình hình thc hi n ngân sách
%iRFiRVRViQKFKLSKtFKѭDOrQNӃ hoҥFKWUrQFKLSKtÿmOrQNӃ hoҥch, chi phí ÿmWKӵc hiӋn trên chi phí còn lҥi:
Hình 4-14 %iRFiRVRViQKFKLSKtFK˱DOrQN͇ ho̩FKWUrQFKLSKtÿmOrQN͇ ho̩ch
Báo cáo tình hình thӵc hiӋn hӧSÿӗng vӟi nhà cung cҩp:
Hình 4-15 Báo cáo tình hình thc hi n hͫSÿ͛ng vͣi nhà cung c̭p
ĈiQKJLiNӃt quҧ
Phân tích dữ liệu từ hệ thống ERP và hiện thực hóa các báo cáo BI của doanh nghiệp bằng sản phẩm chuyển đổi số của chúng tôi hiện nay Trong bối cảnh các công ty bằng sản phẩm chuyển đổi số và xây dựng các hệ thống ERP, việc sử dụng dữ liệu từ các hệ thống ERP và tạo ra các báo cáo thông minh BI phục vụ cho việc ra quyết định giúp doanh nghiệp tồn tại tại thị trường dữ liệu Việc xây dựng kho dữ liệu trên nền tảng cung cấp năng lực xử lý dữ liệu lớn ngày càng trở nên phổ biến nhờ tính tin cậy, tính bảo mật (các công ty cung cấp nền tảng dịch vụ điện toán đám mây quốc tế và bảo mật dữ liệu, an toàn dữ liệu), tính sẵn sàng và tính nhất quán, khả năng mở rộng cao.
Qua luұQYăQQj\W{LFNJQJÿmӭng dөQJFiFEiRFiR%,PjW{Lÿm[k\Gӵng vào trong công viӋFFNJQJQKѭJL~SGRDQKQJKLӋp sӱ dөng và ra quyӃWÿӏnh dӵa vào các báo cáo này:
Hình 4-16 Minh chͱng t͝ chͱFWUDLQLQJFKRWHDPVDXNKLÿmÿ˱ͫc duy t bͧLJLiPÿ͙c
Hình 4-17 Minh chͱQJÿăQJNêV͵ dͭng các báo cáo và ͱng dͭQJYjRQăP
5 &+ѬѪ1*KӂT LUҰN VÀ KIӂN NGHӎ NHӲNG NGHIÊN CӬU TIӂP THEO
KӃt quҧ WKXÿѭӧc
ViӋc xây dӵng kho dӳ liӋu và ӭng dөng xây dӵng báo cáo thông minh BI là nhu cҫu thiӃt yӃu cӫa nhiӅu doanh nghiӋSÿDQJWKӵc hiӋn chuyӇQÿәi sӕ Dӳ liӋu ÿDQJ sinh ra tӯng giӡ tӯng phútGRÿyYLӋc sӱ dөng dӳ liӋu sao cho hiӋu quҧ và tҥo sinh giá trӏ tӯ dӳ liӋXÿDQJFy là vҩQÿӅ nhiӅu doanh nghiӋSÿDQJKѭӟQJÿӃQ/ƭQKYӵc bҩWÿӝng sҧQOjOƭQKYӵc khá mӟLWURQJFRQÿѭӡng chuyӇQÿӕi sӕ so vӟLFiFOƭQKYӵc khác, bҵng chӭng là nhiӅu doanh nghiӋp bҩWÿӝng sҧn hiӋn nay chӍ mӟi bҳWÿҫu xây dӵng hӋ thӕng ERP và dҫn chuyӇQÿәi sӕ WKHRKѭӟng cҧi thiӋn trҧi nghiӋm khách hàng QKѭ xây dӵQJFiFVjQWKѭѫQJPҥLÿLӋn tӱ FKROƭQKYӵc bҩWÿӝng sҧn 'Rÿy, viӋc phân tích và sӱ dөng dӳ liӋu tӯ thu thұSÿѭӧFFNJQJOjNKiPӟLWURQJOƭQKYӵc này
Bên cҥQK ÿy QKӳQJ GRDQK QKkQ ÿӭQJ ÿҫu doanh nghiӋp bҩW ÿӝng sҧQ ÿD Vӕ WKѭӡng dӵa vào kinh nghiӋPFiQKkQFyÿѭӧc sau nhiӅXQăPNLQKGRDQKEҩWÿӝng sҧn và ra quyӃWÿӏQKtWQѫLӭng dөng viӋc phân tích dӳ liӋXYjÿѭDUDTX\ӃWÿӏnh Do ÿyEҧQWKkQFNJQJPXӕn ÿyQJJySPӝt phҫn khi chӑn nghiên cӭu và xây dӵng kho dӳ liӋu và các báo cáo thông minh
Với thời gian triển khai nhanh, từ lý thuyết đến thực hành, bài viết sẽ hướng dẫn cách xây dựng kho dữ liệu và ứng dụng báo cáo BI dựa trên dữ liệu doanh nghiệp bàng sản, có thể áp dụng cho các công ty có quy mô vừa và nhỏ vì chi phí và thời gian triển khai ngắn khi sử dụng nền tảng Cloud và công cụ chi phí thấp Pentaho Data Integration (nếu dùng từ phiên bản 9.2 trở xuống có thể sử dụng miễn phí) Bên cạnh việc cung cấp báo cáo bán hàng và quản lý cung ứng cho doanh nghiệp bàng sản, có thể:
- ;k\GӵQJKRjQFKӍQKJLҧLSKiSNKRGӳOLӋXWUrQÿiPPk\FӫDQKjFXQJFҩSGӏFKYө$PD]RQ YӟLFKLSKtWKӵFKLӋQNKiWKҩS
Hình 5-5-1 Chi phí trong 7 tháng s͵ dͭng RDS cͯa Amazon tͳ tháng 7-ÿ͇n 12-2021
- ;k\GӵQJÿѭӧFEӝEiRFiRFKRSKzQJEDQÿһFWKWURQJOƭQKYӵFNLQKGRDQK EҩWÿӝQJVҧQSKzQJNLQKGRaQKEiQKjQJYjSKRQJFXQJӭQJWKӵFKLӋQFiFKӧS ÿӗQJWURQJOƭQKYӵF[k\GӵQJ EDRJӗPWUrQEiRFiRNKiFQKDX
Tӯ kӃt quҧ WKXÿѭӧc cӫa luұQYăQKѭӟng phát triӇn sӁ xây dӵng nhiӅu bӝ báo FiRKѫQ cho các phân hӋ chӭFQăQJSKә biӃn: kӃ toán, nhân sӵ, kӃ hoҥch và chi phí
Có thӇ triӇn khai cho các doanh nghiӋp vӯa và nhӓ vӟi chi phí thҩp Vì khi triӇn khai trên Cloud, bҧQWKkQFyFѫKӝi trҧi nghiӋPFiFEѭӟc xây dӵng, cҩu hình, quҧn trӏ hҥ tҫng cӫa kho dӳ liӋu4XDÿyFyWKӇ mӣ rӝQJKѫQkhi sӱ dөng Cloud cho các loҥLFѫVӣ dӳ liӋXNKiFQKѭ2UDFOHFKRGӳ liӋu có cҩu trúc hay FѫVӣ dӳ liӋu Hadoop cho dӳ liӋu phi cҩu trúc trên AWS
Ngoài ra, việc sử dụng dữ liệu từ kho dữ liệu có thể mở rộng khả năng khám phá dữ liệu, phân tích và trích xuất kiến thức từ dữ liệu, giúp doanh nghiệp nắm bắt tình hình kinh doanh, sức khỏe tài chính của doanh nghiệp bằng các công cụ sử dụng ngôn ngữ khai phá dữ liệu mạnh mẽ như Python, mang lại giá trị cho doanh nghiệp trong việc đưa ra quyết định kinh doanh nhanh chóng và hiệu quả.
[1] Ralph Kimball, Margy Ross (2013) The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd Edition
[2] 'L[RQ -DPHV 3HQWDKR +DGRRS DQG 'DWD /DNHV -DPHV 'L[RQảV %ORJ James
[3] Paulraj, Ponniah, (2010) Data warehousing fundamentals for IT professionals Ponniah, Paulraj (2nd ed.) Hoboken, N.J.: John Wiley & Sons ISBN 9780470462072 OCLC 662453070
[4] Internet:https://blog.trginternational.com , Oct 4 th , 2021
[5] Internet:https://aws.amazon.com , Oct 4 th , 2021
[6] Internet:https://help.hitachivantara.com/Documentation/Pentaho/9.0/Products/ Pentaho_Data_Integration, Oct 13 th , 2021
To create Power BI reports, it is recommended to follow comprehensive steps outlined in reputable resources like Madhan Raghu's article "Steps for Creating Power BI Reports" and Microsoft's "Get Started with Power BI Desktop" documentation These resources provide valuable guidance on navigating the Power BI ecosystem efficiently.
[9] Analytics8, 2021 Real-Time Analytics in Power BI https://www.analytics8.com/blog/real-time-analytics-in-power-bi/, Oct 24 th ,
[10] Sirui Sun, 2016 Building a Real-time IoT Dashboard with Power BI: A Step- by-Step Tutorial https://powerbi.microsoft.com/en-us/blog/using-power-bi- real-time-dashboards-todisplay-iot-sensor-data-a-step-by-step-tutorial/, Oct
[11] https://help.sap.com/viewer/10d72174fe994f0e8e82a8ac7c4eb041/1.0%20SP 02/en-US/10c3a08b63234b55837b38018add5107.html, Oct 25 th , 2021
[12] https://help.sap.com/viewer/10d72174fe994f0e8e82a8ac7c4eb041/1.0%20SP
02/en-US/9d1b33fb62094c839abff21c7372874b.html, Oct 25 th , 2021