1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Hệ thống thông tin quản lý: Xây dựng kho dữ liệu trên nền tảng đám mây đáp ứng các dịch vụ bi cho công ty xây dựng và kinh doanh bất động sản

105 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 2

75ѬӠ1*ĈҤI HӐC BÁCH KHOA ± Ĉ+4*-HCM

Cán bӝ Kѭӟng dүn khoa hӑc: PGS.TS Trҫn Minh Quang Cán bӝ chҩm nhұn xét 1: PGS.TS NguyӉn TuҩQĈăQJ Cán bӝ chҩm nhұn xét 2: TS Lê Hoành Sӱ

LuұQYăQWKҥFVƭÿѭӧc bҧo vӋ tҥL7UѭӡQJĈҥi hӑc %iFK.KRDĈ+4*7S+&0 ngày 13 tháng 01 QăP2

Thành phҫn HӝLÿӗQJÿiQKJLiOXұQYăQWKҥFVƭJӗm: 1 Chӫ tӏch hӝLÿӗng: PGS.TS NguyӉn Thanh Bình 7KѭNêTS Trҫn Tuҩn Anh

3 GV phҧn biӋn 1: PGS.TS NguyӉn TuҩQĈăQJ 4 GV phҧn biӋn 2: TS Lê Hoành Sӱ

5 Ӫy viên: TS Phan Trӑng Nhân

Xác nhұn cӫa Chӫ tӏch HӝLÿӗQJÿiQKJLi/9Yj7Uѭӣng Khoa quҧn lý chuyên ngành sau khi luұQYăQÿmÿѭӧc sӱa chӳa (nӃu có)

KHOA HӐC VÀ KӺ THUҰT MÁY TÍNH

Trang 3

ĈҤ,+Ӑ&48Ӕ&*,$73+&0

75ѬӠ1*ĈҤ,+Ӑ&%È&+KHOA

&Ӝ1*+Ñ$;­+Ӝ,&+Ӫ1*+Ƭ$9,ӊ71$0 ĈӝFOұS- 7ӵGR- +ҥQKSK~F

NHIӊM VӨ LUҰ19Ă17+Ҥ&6Ƭ

+ӑWrQKӑFYLrQ7UҫQ+ӗ6DQJ MSHV: 197020« 1Jj\WKiQJQăPVLQK 1ѫLVLQK7P+&0« &KX\rQQJjQK+ӋWKӕQJWK{QJWLQTXҧQOê 0mVӕ : 8340405«

I 7Ç1Ĉӄ7¬, ;k\'ӵQJ.KR'ӳ/LӋX7UrQ1ӅQ7ҧQJĈiP0k\ĈiSӬQJ&iF

'ӏFK9өBI &KR&{QJ7\;k\'ӵQJ9j.LQK'RDQK%ҩWĈӝQJ6ҧQ

II 1+,ӊ09Ө9¬1Ӝ,'81* ;k\GӵQJNKRGӳOLӋXWUrQQӅQWҧQJÿiPPk\

FKRGRDQKQJKLӋSEҩWÿӝQJVҧQYjӭQJGөQJWҥRFiFEiRFiRTXҧQWUӏWK{QJPLQK%,GӵDWUrQNKRGӳOLӋXQj\

III 1*¬<1+Ұ11+,ӊ09Ө22/02/2021

IV NGÀY +2¬17+¬1+1+,ӊ09Ө 12/12/2021 V &È1%Ӝ+ѬӞ1*'Ү1 PGS.TS 7UҫQ0LQK4XDQJ

Trang 4

LӠI CҦ0Ѫ1

Tôi xin chân thành cҧPѫQÿӃn tҩt cҧ mӑLQJѭӡi, thҫy, cô, các anh chӏ nghiên cӭu sinh, hӑc viên cao hӑc, các bҥn sinh viên nhӳQJQJѭӡLÿmJL~Sÿӥ tôi trong quá trính thӵc hiӋQYjKRjQWKjQKÿӅ tài luұQYăQWKҥFVƭQj\

Ĉһc biӋt, tôi xin gӱi lӡi cҧPѫQÿӃn thҫ\Kѭӟng dүn khoa hӑc cӫa tôi, PGS.TS Trҫn Minh Quang ÿm Kӛ trӧ ÿӝng viên, chia sҿ kinh nghiӋm vӟi tôi trong cҧ quá trình theo hӑFFKѭѫQJWUuQKVDXÿҥi hӑc tҥLWUѭӡng

Thành phӕ Hӗ Chí Minh, tháng 12 QăP

Trang 5

TÓM TҲT

Kho dӳ liӋu Oj NKR OѭX WUӳ ÿLӋn tӱ cӫa mӝW Oѭӧng lӟn thông tin cӫa mӝt doanh

nghiӋp hoһc tә chӭc Kho dӳ liӋu là mӝt thành phҫn quan trӑng cӫa phân tích kinh doanh, sӱ dөng các kӻ thuұt phân tích trên dӳ liӋu doanh nghiӋp Kho dӳ liӋu dӵa trên nӅn tҧQJÿiP Pk\ Oj Pӝt tiêu chuҭn mӟi giúp doanh nghiӋp hoһc tә chӭc bӓ TXDJLDLÿRҥn phҧi mua phҫn cӭng, tҥo phòng máy chӫWKXrÿjRWҥo và duy trì mӝt ÿӝLQJNJQKkQYLrQÿӇ ÿLӅu hành hҥ tҫng máy chӫ, tӯ ÿyJLҧm tҧi thӡi gian và chi phí triӇQNKDLO~Fÿҫu7X\QKLrQÿLӅXQj\NK{QJFyQJKƭDOjFiFêWѭӣng kho dӳ liӋu truyӅn thӕng là lӛi thӡi Lý thuyӃt kho dӳ liӋu cә ÿLӇn làm nӅn tҧng cho hҫu hӃt nhӳng gì mà kho dӳ liӋu dӵa trên nӅn tҧQJÿiPPk\WKӵc hiӋn Bên cҥQKÿyYiӋc ӭng dөng kho dӳ liӋu vào xây dӵQJFiFEiRFiRWK{QJPLQK%,ÿӇ hӛ trӧ ra quyӃt ÿӏnh kinh doanh cho doanh nghiӋp trong OƭQKYӵc bҩWÿӝng sҧQOjÿӅ tài mӟi hiӋn nay sӁ ÿѭӧc nghiên cӭu và thӵc hiӋn trong luұQYăQQj\

Trang 6

ABSTRACT

A data warehouse is an electronic repository of large amounts of information about a business or an organization Data warehousing is an important component of business analytics, using analytical techniques on business data Cloud-based data warehousing is a new standard that helps businesses or organizations skip buying hardware, creating server rooms, hiring, training, and maintaining staffs to run the business Therefore, it helps to reduce initial deployment time and costs However, this does not mean that traditional data warehouse ideas are obsolete Classical data warehouse theory underlies most of what cloud-based data warehouses do Besides, the application of data warehouse in building Business Intelligent reports to support business decision making for enterprises in the real estate field is a new topic today and has been researched and implemented in this thesis

Trang 7

LӠ,&$0Ĉ2$1

Tôi, Trҫn Hӗ Sang [LQFDPÿRDQÿӅ tài luұQYăQWKҥFVƭ³;k\'ӵQJ.KR'ӳ/LӋX7UrQ1ӅQ7ҧQJĈiP0k\ĈiSӬQJ&iF'ӏFK9ө%,&KR&{QJ7\;k\'ӵQJ9j.LQK'RDQK%ҩWĈӝQJ6ҧQ´YjF{QJYLӋFÿѭӧFWUuQKEj\WURQJÿӅ tài này là cӫa tôi Tôi xác nhұn rҵng:

- Công viӋF Qj\ ÿѭӧc thӵc hiӋn toàn bӝ hoһc chӫ yӃX NKL ÿDQJ WKHR Kӑc FKѭѫQJWUuQKWKҥFVƭWҥLWUѭӡQJĈҥi hӑc này

- 7Uѭӡng hӧp bҩt kǤ phҫn nào cӫa luұQ YăQ Qj\ WUѭӟF ÿk\ ÿm ÿѭӧc nӝp cho mӝt bҵng cҩp hoһc bҩt kǤ YăQEҵng nào khác tҥLWUѭӡQJĈҥi hӑc này hoһc bҩt kǤ FѫVӣ giáo dөc nào khác, các phҫQQj\ÿmÿѭӧc trích dүn rõ ràng

- Khi tôi tham khҧR F{QJ WUuQK ÿm [Xҩt bҧn cӫa nhӳQJ QJѭӡi khác, các phҫn Qj\OX{Qÿѭӧc ghi nhұn rõ ràng

- Trích dүn tӯ tác phҭm cӫDQJѭӡi khác, nguӗQOX{Qÿѭӧc cung cҩp Ngoҥi trӯ nhӳng trích dүQQKѭYұy, luұQYăQQj\KRjQWRjQOjF{QJYLӋc cӫa riêng tôi - Tôi thӯa nhұn tҩt cҧ các nguӗn trӧ giúp chính

Thành phӕ Hӗ Chí Minh, tháng 12 QăP Hӑc viên

Trҫn Hӗ Sang

Trang 8

2.1.7 Tìm hiӇu RDS (Amazon Relationship Database Service) 19

2.2 Giӟi thiӋu vӅ công cө tích hӧp Pentaho Data Integration 24

2.2.1 Giӟi thiӋu 24

2.2.2 ETL vӟi Pentaho Data Integration 24

2.3 Giӟi thiӋu vӅ ӭng dөng trӵc quan hóa dӳ liӋu Power BI 30

2.3.1 Power BI là gì? 30

Trang 9

2.3.2 ѬXÿLӇm và hҥn chӃ Power BI 33

3 &+ѬѪ1*;Æ<'ӴNG KHO DӲ LIӊU TRÊN NӄN TҦ1*ĈÈ00Æ<TRÊN TҰP DӲ LIӊU DOANH NGHIӊP BҨ7ĈӜNG SҦN 35

3.1 Mô hình dӳ liӋu bҩWÿӝng sҧn 35

3.2 Xây dӵng kho dӳ liӋu trên Cloud Amazon Web Services 40

3.2.1 Tҥo và kӃt nӕLÿӃQFѫVӣ dӳ liӋu MySQL bҵng Amazon RDS 41

3.2.2 Quҧn lý data warehouse vӟi MySQL Workbench 47

3.3 Xӱ lý dӳ liӋXÿѭDYjRNKRGӳ liӋu phөc vө báo cáo BI 49

3.3.1 Xây dӵng bӝ dӳ liӋu dùng cho báo cáo bán hàng 50

3.3.2 Xây dӵng bӝ dӳ liӋu dӳ liӋu dùng cho báo cáo tiӃQÿӝ thu tiӅn 65

3.3.3 Xây dӵng bӝ dӳ liӋu dӳ liӋu dùng cho báo cáo kӃ hoҥch thӵc hiӋn hӧp ÿӗng cung ӭng 67

4 &+ѬѪ1*+,ӊN THӴ&&È&%È2&È27+Ð1*0,1+%,9¬ĈÈ1+GIÁ KӂT QUҦ ĈҤ7ĈѬӦC 72

4.1 Xây dӵng bӝ báo cáo BI tӯ kho dӳ liӋu 72

4.1.1 Báo cáo bán hàng 72

4.1.2 Báo cáo tiӃQÿӝ thu tiӅn 80

4.1.3 Báo cáo kӃ hoҥch thӵc hiӋn ngân sách dӵ án 84

Trang 10

Hình 2-8 BiӇXWѭӧng Icon cӫa Power BI 31

Hình 2-9 Quy trình cӫa Power BI 32

Hình 3-1 Các phân hӋ chӭFQăQJWURQJKӋ thӕng giao dӏch OLTP 35

Hình 3-2 Luӗng dӳ liӋu phân hӋ CCM 36

Hình 3-3 Mô hình hóa dӳ liӋu CCM 37

Hình 3-4 Luӗng dӳ liӋu phân hӋ SLM 38

Hình 3-5 Mô hình dӳ liӋu bán hàng 39

Hình 3-6 Mô hình dӳ liӋu thanh toán sau bán hàng 40

Hình 3-7 Tҥo kho dӳ liӋu trên AWS 41

Hình 3-8 Tҥo kho dӳ liӋu trên AWS 41

Hình 3-9 Tҥo và cҩu hình kho dӳ liӋu trên AWS 43

Hình 3-10 Kho dӳ liӋu sau khi tҥo thành công 45

Hình 3-11 Cҩu hình bҧo mұt kӃt nӕi 45

Hình 3-12 Cҩu hình bҧo mұWÿҫu vào 46

Hình 3-13 CҩXKuQKUDQJH,3FKRÿҫu vào 46

Hình 3-14 KӃt nӕi kho dӳ liӋu bҵng MySQL Workbech 47

Hình 3-15 Tҥo bҧng dӳ liӋu bҵng SQL Script trong MySQL Workbench 48

Hình 3-16 Thêm dӳ liӋu vào kho dӳ liӋu bҵng file csv 48

Hình 3-17 KiӇm tra dӳ liӋu trong kho dӳ liӋu bҵng MySQL workbench 49

Hình 3-18 KӃt quҧ VDXNKLFjLÿһt Pentaho Data Integration 50

Hình 3-19 Liên kӃt dӳ liӋu bҧng House và Contract qua AOID ± AOFY 52

Hình 3-20 ETL ± Báo cáo bán hàng 53

Hình 3-21 Xӱ lý kênh bán ± Sales Overview 55

Hình 3-22 KӃt quҧ xӱ lý bҧng Contract ± Sales Overview (1) 55

Hình 3-23 KӃt quҧ xӱ lý bҧng Contract ± Sales Overview (2) 56

Hình 3-24 KӃt quҧ ETL ± Sales Overview 57

Hình 3-25 ETL báo cáo sӕ Oѭӧng sҧn phҭPÿmEiQ 57

Hình 3-26 ETL báo cáo sӕ OѭӧQJÿmEiQWKHRJLiPÿӕc sàn 58

Hình 3-27 Data Model ± Sales Detais (1) 60

Hình 3-28 Data Model ± Sales Detais (2) 61

Hình 3-29 ETL ± Sales Details 62

Hình 3-30 KӃt quҧ xӱ lý Sales_Overview và Customer ± Sales Details 63

Trang 11

Hình 3-31 ETL báo cáo sҧn phҭPÿmEiQWKHRNKiFKKjQJ 65

Hình 3-32 ETL cho báo cáo tiӃQÿӝ thu tiӅn 67

Hình 3-33 Bҧng Project Overview 68

Hình 3-34 Bҧng Project Overview 69

Hình 3-35Bҧng Plan Header tӯ hӋ thӕng OLTP 69

Hình 3-36 Bҧng Contract tӯ hӋ thӕng OLTP 70

Hình 3-37 Dӳ liӋXÿҫu ra (Target Data) chi phí ngân sách dӵ án 70

Hình 3-38 Quy trình ETL lҩy dӳ liӋu chi phí ngân sách dӵ iQÿѭDYjRNKRGӳ liӋu 71

Hình 4-1 Báo cáo bán hàng chung cho toàn bӝ dӵ án cӫa công ty bҩWÿӝng sҧn 73

Hình 4-2 Báo cáo sҧn phҭPÿmEiQWKHRWKӡLJLDQFNJQJQKѭVӕ tiӅQÿmWKX theo tӯng tháng 74

Hình 4-3 Báo cáo sҧn phҭPÿmEiQWKHRNrQKEiQKjQJ 75

Hình 4-4 Báo cáo chi tiӃt sӕ FăQÿmEiQWKHRWKӡi gian, có thӇ xem theo nhóm dӵ án và theo tháng 76

Hình 4-5 Báo cáo sӕ FăQÿmEiQWKHRWӍnh thành, có thӇ xem theo thӡi gian và theo nhóm dӵ án 77

Hình 4-6 Báo cáo sӕ FăQÿmEiQWKHRJLiPÿӕc sàn 78

Hình 4-7 Báo cáo theo tӍ lӋ phҫQWUăPQKyPNKiFKKjng mua theo sӕ tiӅn 79

Hình 4-8 Báo cáo theo tӍ lӋ phҫQWUăPQKyPNKiFKKjQJPXDWKHRVӕ FăQ 80

Hình 4-9 Báo cáo tiӃQÿӝ thu tiӅn theo kӃ hoҥFKNLQKGRDQKQăP 81

Hình 4-10 Báo cáo tiӃQÿӝ thu tiӅn thӵc tӃ bán hàng 82

Hình 4-11 Báo cáo tiӃQÿӝ thu tiӅn theo dӵ án 83

Hình 4-12 Báo cáo nӧ xҩu, các khoҧn phҧi thu quá hҥn 84

Hình 4-13 Báo cáo tình hình thӵc hiӋn ngân sách 85

Hình 4-%iRFiRVRViQKFKLSKtFKѭDOrQNӃ hoҥFKWUrQFKLSKtÿmOrQNӃ hoҥch 86

Hình 4-15 Báo cáo tình hình thӵc hiӋn hӧSÿӗng vӟi nhà cung cҩp 87

Hình 4-16 Minh chӭng tә chӭFWUDLQLQJFKRWHDPVDXNKLÿmÿѭӧc duyӋt bӣi giám ÿӕc 88

Hình 4-17 Minh chӭQJÿăQJNêVӱ dөng các báo cáo và ӭng dөng YjRQăP 88Hình 5-5-1 Chi phí trong 7 tháng sӱ dөng RDS cӫa Amazon tӯ tháng 7-ÿӃn 12-2021 90

Trang 12

DANH MӨC BҦNG

Bҧng 1 So sánh database và data warehouse 8BҧQJéQJKƭDFiFFӝt trong bҧng House và Contract 51BҧQJ;iFÿӏQKJLiPÿӕc sàn 58Bҧng 4 Giӟi thiӋu các cӝt trong bҧng Dimension báo cáo phân tích khách hàng 59

Trang 13

1.1 Lý do chӑQÿӅ tài

Xây dӵng báo cáo thông minh BI tӯ kho dӳ liӋu là mӝWOƭQKYӵc ngày càng hҩp dүQYjÿyQJYDLWUzTXDQWUӑQJKѫQWURQJYLӋc hӛ trӧ ra các quyӃWÿӏnh cho các cá nhân, tә chӭc thay vì chӍ dӵa vào các yӃu tӕ kinh nghiӋm, cҧPWtQKFiLQKuQÿѫQdiӋn cӫa mӝt sӕ QJѭӡLÿӭQJÿҫu Bên cҥnh ÿyVӵ bùng nә thông tin ngày nay làm cho dӳ liӋu là vô cùng nhiӅX Yj ÿD Gҥng Dӵa trên nhu cҫX ÿy QJj\ FjQJ QKLӅu doanh nghiӋSÿѭDGӳ liӋu lên nӅn tҧQJÿiPPk\ &ORXGSODWIRUP WKD\YuVӱ dөng hҥ tҫng doanh nghiӋp tӵ xây dӵng vì lý do kinh phí và thӡi gian triӇQNKDLFNJQJQKѭkhҧ QăQJPӣ rӝQJWURQJWѭѫQJODL

'RÿyW{LÿmFKӑQÿӅ tài xây dӵng kho dӳ liӋu trên nӅn tҧQJÿiPPk\YuFKLphí khӣi tҥo rҿ, xây dӵng hҥ tҫng nhanh chóng, tính sҹn sàng mӣ rӝng cao nên có thӇ ÿiSӭng cho nhiӅu doanh nghiӋp và công ty tӯ quy mô vӯa và nhӓ ÿӃn nhӳng công ty có quy mô lӟn Bên cҥQK ÿy YLӋc phân tích và xây dӵng báo cáo BI cho ngành nghӅ bҩWÿӝng sҧn là mӝWÿӅ tài ít thҩy WURQJOƭQKYӵc phân tích dӳ liӋu

4XDÿyOXұQYăQÿm[k\GӵQJÿѭӧc kho dӳ liӋu trên nӅn tҧng ÿiPPk\Yӟi chi phí rҿ và thӡi gian ngҳn và xây dӵQJÿѭӧc bӝ báo cáo BI bao gӗm: phân tích cҩu trúc dӳ liӋu bҩW ÿӝng sҧn, xây dӵng các báo cáo vӟi dӳ liӋu bҩW ÿӝng sҧQ TXD ÿygiúp doanh nghiӋp hiӇX NKiFK KjQJ KѫQ UD ÿѭӧF FiF FKѭѫQJ WUuQK EiQ KjQJ Eҩt ÿӝng sҧn hӧSOêFNJQJQKѭTXҧn lý hӧSÿӗng, chi phí cӫa dӵ án bҩWÿӝng sҧn hiӋu quҧ

1.2 Mөc tiêu

Mͭc tiêu t͝ng quát: xây dӵng kho dӳ liӋu trên nӅn tҧQJÿiPPk\ tӯ ÿyӭng

dөng xây dӵng các báo cáo thông minh BI tӯ kho dӳ liӋu dӵa trên dӳ liӋu cӫa doanh nghiӋp kinh doanh bҩWÿӝng sҧn

- Nghiên cӭu và xây dӵng kho dӳ liӋu trên nӅn tҧQJ ÿiP Pk\ AWS cӫa Amazon

Trang 14

- Nghiên cӭu và xây dӵng giҧi pháp trích xuҩt, xӱ OêYjÿѭDGӳ liӋu tӯ FѫVӣ dӳ liӋu vào kho dӳ liӋu bҵng công cө Pentaho Data Integration

- Nghiên cӭu và xây dӵng các báo cáo thông minh BI dành cho doanh nghiӋp bҩWÿӝng sҧn bҵng ӭng dөng Power BI

K͇t qu̫:

- Xây dӵng kho dӳ liӋu trên nӅn tҧQJÿiPPk\Fӫa Amazon

- Xây dӵQJÿѭӧc các báo cáo BI cho phòng ban SALES, KӃ toán, Cung ӭng và phòng hoҥFKÿӏnh ngân sách

1.3 Giӟi hҥn YjÿӕLWѭӧng nghiên cӭu cӫDÿӅ tài

éWѭӣng khoa hӑc chính cӫDÿӅ tài là nghiên cӭXÿӅ xuҩt các giҧi pháp và xây

dӵng "Xây Dӵng Kho Dӳ LiӋu Trên NӅn TҧQJ ĈiP 0k\ ĈiS Ӭng Các Dӏch

Vө Bi Cho Công Ty Xây Dӵng Và Kinh Doanh BҩWĈӝng SҧnĈk\OjÿӅ tài lӟn

mang tính áp dөng công nghӋ YjWtQKÿһc thù cӫa tӯQJOƭQKYӵc khi triӇQNKDLĈӇ ÿҧm bҧo chҩWOѭӧng và trong khҧ QăQJFKRSKpSÿӅ tài xin giӟi hҥQYjRQKѭQJSKҫn cӕt lõi cӫa kiӃn trúc kho dӳ liӋXWURQJOƭQKYӵc bҩWÿӝng sҧn và kinh doanh khách sҥn - biӋt thӵ nghӍ Gѭӥng trên nӅn tҧQJ ÿiP Pk\ Yj F{QJ Fө tích hӧp dӳ liӋu là Pentaho Data Integration:

- Tìm hiӇu vӅ kiӃn trúc kho dӳ liӋu và tính cҫn thiӃWFNJQJQKѭVӵ khác biӋt so vӟi hӋ thӕng giao dӏch nghiӋp vө

- Tìm hiӇu vӅ giҧi pháp kiӃn trúc kho dӳ liӋu cӫa nhà cung cҩp giҧi pháp Cloud AWS cӫa Amazon và các công nghӋ hӛ trӧ viӋc phân tích dӳ liӋu nhҵm trích xuҩt thông tin: phҫn mӅm Pentaho Data Integration, phҫn mӅm Microsoft Power BI

- Nghiên cӭu giҧi pháp xây dӵng kho dӳ liӋu phù hӧp vӟi thӵc trҥng vӅ nhân lӵc, chi phí cӫa các doanh nghiӋp vӯa và nhӓ tҥi ViӋt Nam

- Nghiên cӭu mô hình dӳ liӋu nhҵm xây dӵng các báo cáo thông minh BI WURQJOƭQKYӵc kinh doanh bҩWÿӝng sҧn

Trang 15

1.4 KӃt quҧ cө thӇ

Xây dӵng kho dӳ liӋu vӟi chӫ ÿӅ sҧn phҭm dӵa trên nӅn tҧng công nghӋ Cloud và thiӃt lұp công cө khai thác dӳ liӋu tӯ kho dӳ liӋXÿӇ chӭng mình tính khҧ thi và ÿiSӭng yêu cҫu cӫa kho dӳ liӋXÿm[k\Gӵng

Xây dӵng các bӝ báo cáo mang tính ӭng dөng thӵc tiӉQ WURQJ OƭQK Yӵc kinh doanh bҩWÿӝng sҧn: báo cáo phân tích khách hàng, báo cáo kinh doanh bán hàng, báo cáo cung ӭng, báo cáo ngân sách dӵ án

1.5 éQJKƭDWKӵc tiӉn

éQJKƭDWKӵc tiӉn cӫa luұQYăQEDRJӗm:

- ĈӅ xuҩt mô hình dӳ liӋu trong viӋc xây dӵng kho dӳ liӋu tӯ nguӗn dӳ liӋu giao dӏch cӫa doanh nghiӋp bҩWÿӝng sҧn

- Tҥo mӝt kho dӳ liӋu và bӝ công cө ÿiSӭQJÿҫ\ÿӫ và nhanh chóng yêu cҫu lұp báo cáo quҧn trӏ và ra quyӃWÿӏnh cho mӝt doanh nghiӋp bҩWÿӝng sҧn

Trang 16

2 &+ѬѪ1*TӘNG QUAN

Nӝi dung cӫDFKѭѫQJQj\VӁ xoay quanh nghiên cӭu vӅ FѫVӣ lý thuyӃt kho dӳ liӋu, dӏch vө Fѫ Vӣ dӳ liӋu quan hӋ cӫa Amazon Web Services, công cө Pentaho Data Integration và công cө trӵc quan hóa dӳ liӋu Microsoft Power BI

Vì mөc tiêu cӫDÿӅ tài là xây dӵng kho dӳ liӋu trên nӅn tҧQJÿiPPk\GRÿyÿӅ tài sӁ tұp trung nghiên cӭu khái niӋm kho dӳ liӋu và áp dөng xây dӵng trên nӅn tҧQJÿiPPk\Fӫa Amazon Web Services là mӝt công ty con cӫa Amazon cung cҩp các nӅn tҧQJÿLӋQWRiQÿiPPk\WKHR\rXFҫu cho các cá nhân, công ty và chính phӫ, WUrQFѫVӣ trҧ tiӅn theo nhu cҫu sӱ dөng Bên cҥQKÿyÿӇ tích hӧp dӳ liӋu tӯ bên QJRjLQKѭWӋp dӳ liӋXFѫVӣ dӳ liӋu mà cө thӇ là dӳ liӋu công ty kinh doanh và xây dӵng bҩW ÿӝng sҧn ÿӅ tài sӁ nghiên cӭu và sӱ dөng công cө Pentaho Data Integration cӫa Hitachi cung cҩp các khҧ QăQJ7UtFK[Xҩt, ChuyӇQÿәi và TҧLÿӇ tҥo ÿLӅu kiӋn thuұn lӧi cho quá trình thu thұp, làm sҥFKYjOѭXWUӳ dӳ liӋu bҵng cách sӱ dөQJÿӏnh dҥQJÿӗng nhҩt và nhҩt quán có thӇ truy cұp và phù hӧp vӟLQJѭӡi dùng cuӕi Và cuӕLFQJÿӅ tài sӁ tìm hiӇu và ӭng dөng xây dӵng các báo cáo BI bҵng công cө Power BI là mӝt dӏch vө phân tích kinh doanh cӫa Microsoft Nó nhҵm mөFÿtFKFXQJFҩp hình ҧQKWѭѫQJWiFYjNKҧ QăQJNLQKdoanh thông minh vӟi giao diӋQÿӫ ÿѫQJLҧQÿӇ QJѭӡi dùng cuӕi tҥo báo cáo và trang tәng quan cӫa riêng hӑ Vì khҧ QăQJ WLӃp cұn dӉ và chi phí thҩp nên các công cө kӇ trên sӁ dӉ dàng triӇn khai cho doanh nghiӋp QKѭQJYүQÿiSӭQJÿҫ\ÿӫ yêu cҫu vì các phҫn mӅm và ӭng dөng thuӝc các công ty lӟn và tên tuәi trên thӃ giӟL QKѭ $PD]RQ +LWDFKL YjMicrosoft

Nguӗn dӳ liӋu sӱ dөng tích hӧSYjÿѭDYjRNKRGӳ liӋXVDXÿyWUӵc quan hóa trên ӭng dөng Power BI sӁ là nguӗn dӳ liӋu giao dӏch cӫa doanh nghiӋp kinh doanh và xây dӵng bҩWÿӝng sҧn Tәng quan vӅ kho dӳ liӋu

2.1.1 Giӟi ThiӋu Chung VӅ Database 2.1.1.1 Khái niӋm

'DWDEDVH &ѫVӣ dӳ liӋu) là mӝt tұp hӧp có tә chӭc các thông tin có cҩu trúc

hoһc dӳ liӋXWKѭӡQJÿѭӧFOѭXWUӳ trӵc tuyӃn trong mӝt hӋ thӕng máy tính MӝWFѫsӣ dӳ liӋXWKѭӡQJÿѭӧc kiӇm soát bӣi hӋ thӕng quҧQOêFѫVӣ dӳ liӋu (DBMS) Cùng vӟi nhau, dӳ liӋu và DBMS, cùng vӟi các ӭng dөQJÿѭӧc liên kӃt vӟLFK~QJÿѭӧc gӑi là mӝt hӋ thӕQJFѫVӣ dӳ liӋXWKѭӡQJÿѭӧc rút ngҳQWKjQKFѫVӣ dӳ liӋu [1]

Mӝt sӕ loҥi database:

Trang 17

- HӋ thӕQJ Fѫ Vӣ quҧn lý dӳ liӋu quan hӋ - RDBMS (Oracle, MySQL, MS 6HUYHU3RVWJUH64/ «

- Document store (MongoDB, CouFKEDVH « - CSDL dҥng khóa ± giá trӏ 5HGLV0HPFDFKHG « - Mô hình wide ± FROXPQ &DVVDQGUD+%DVH « - CSDL dҥng bӝ máy tìm kiӃm (Elasticsearch)

2.1.1.2 Transaction và thuӝc tính ACID

Trong ngӳ cҧnh database trong hӋ thӕng nghiӋp vө, mӝt tác vө cҫn truy xuҩt, hӋ tKӕQJ QJKLӋSYөFҫQSKҧLTXҧQOêOѭXWUӳ9ӅPһWӭQJGөQJPjQyLFiFWKӵFWKӇWKXӝFFQJPӝWORҥLFyFiFWKXӝFWtQKJLӕQJKӋWQKDX

&KXҭQKóa OjTXiWUuQKWiFKEҧQJ SKkQUm WKjQKFiFEҧQJQKӓKѫQGӵDYjR

FiFSKөWKXӝFKjP&iFGҥQJFKXҭQOjFiFFKӍGүQÿӇWKLӃWNӃFiFEҧQJWURQJ&6'/0өFÿtFKFӫDFKXҭQKóa OjORҥLEӓFiFGѭWKӯDGӳOLӋXYjFiFOӛLNKLWKDRWiFGѭWKӯDYjFiFOӛLNKLWKDRWiFGӳOLӋX ,QVHUW'HOHWH8SGDWH 1KѭQJFKXҭQKóa làm WăQJWKӡLJLDQWUX\YҩQ

ĈӇWKӓD PmQWtQK$&,'WKLӃWNӃFӫDPӝWGDWDEDVHWKѭӡQJÿѭӧFÿѭDYӅGҥQJFKXҭQ 1)- WK1RUPDO)RUP TX\ÿӏQKUҵQJPӛLWKӵFWKӇWURQJGDWDEDVHSKҧLthӓD PmQFiFÿLӅXNLӋQVDX

- Giá trӏ cӫa mӝt thuӝc tính phҧi là giá trӏ nguyên tӕ, tӭc là không phҧi mӝt danh sách các giá trӏ phӭc hӧp (Chuҭn 1 - 1NF)

- Các thuӝc tính không phҧi khóa chính chӍ phө thuӝc vào toàn bӝ tұp khóa chính, không phө thuӝc vào tұp con nào cӫa tұp khóa chính nói trên (Chuҭn 2 - 2NF)

- Các thuӝc tính không phҧi khóa ÿӝc lұp vӟi nhau (không thӇ nӝi suy giá trӏ mӝt thuӝc tính tӯ các thuӝc tính không phҧi khóa khác) (Chuҭn 3 - 3NF)

Trang 18

2.1.2 Data Warehouse 2.1.2.1 Các khái niӋm

database) Kӛ WUӧ FiF QJKLӋS Yө KjQJ QJj\ Yj ÿLӇP PҥQK QKҩW FӫD Qy Oj ÿҧP EҧR

WRjQYҽQGӳOLӋX[ӱOêJLDRGӏFKWUX\FұSVRQJVRQJYjNK{QJWKӓD PmQFiF\rXFҫXYӅSKkQWtFKGӳOLӋX7K{QJWKѭӡQJFiFGDWDEDVHQJKLӋSYөFKӍOѭXWUӳGӳOLӋXFKLWLӃW FKR WKӡL ÿLӇP KLӋQ WҥL NK{QJ OѭX WUӳ Gӳ OLӋX OӏFK Vӱ Gӳ OLӋX WURQJ GDtabase ÿѭӧFWKLӃWNӃFKXҭQKóa UҩWFDRQrQWKѭӡQJFyKLӋXQăQJNpPNKLWUX\YҩQSKӭFWҥSKRһFNKӕLOѭӧQJGӳOLӋXOӟQYjYLӋFWUX\YҩQGӳOLӋXWӯQKLӅXQJXӗQNKiFQKDXOjJҫQQKѭNK{QJWKӇQӃXFKӍGQJGDWDEDVHQJKLӋSYө+ӋWKӕQJTXҧQOê2SHUDWLRQDO

DatabDVH Oj KӋ WKӕQJ [ӱ Oê JLDR GӏFK WUӵF WX\ӃQ OLTP - Online Transaction

Processing) [2]

'DWD:DUHKRXVH NKRGӳOLӋX OjNKiLQLӋPÿѭӧFJLӟLWKLӋXOҫQÿҫXYjRQăP

EӣLQKjQJKLrQFӭXFӫD,%0Oj%DUU\'HYOLQYj3DXO0XUSK\Ĉk\OjQѫLOѭXWUӳGӳOLӋXEҵQJ WKLӃWEӏÿLӋQWӱFӫD PӝWWәFKӭF GRDQK QJKLӋSQKҵPKӛWUӧYLӋF SKkQ WtFK Gӳ OLӋX Yj OұS EiR FiR 9j WKHR F{QJ W\ FKX\rQ OұS WUuQK KӋWKӕQJSKҫQ PӅP FKR GRDQK QJKLӋS 0RQD 0HGLD WKu ÿy Oj FiFK KLӇX WKHR WUX\ӅQWKӕQJWҥLWKӡLÿLӇPNKiLQLӋPNKRGӳOLӋXQj\UDÿӡLYj'DWDZDUHKRXVHQJj\QD\ÿmNKiF

1Jj\QD\QJѭӡLWDKLӇX³NKRGӳOLӋX´WKHRQJӳFҧQKUӝQJKѫQEDRJӗP WұSFiFSKѭѫQJSKiSNӻWKXұWYjF{QJQJKӋFyWKӇNӃWKӧSKӛWUӧQKDXÿӇWKXWKұSYjTXҧQOêGӳOLӋXWӯQKLӅXQJXӗQP{LWUѭӡQJNKiFQKDXÿӇFXQJFҩSWK{QJWLQFKRQJѭӡLVӱGөQJ'RÿyNKRGӳOLӋXFzQFyWKӇÿѭӧFJӑLEҵQJQKӳQJFiLWrQVDXKӋWKӕQJKӛWUӧTX\ӃWÿӏQKKӋWKӕQJÿLӅXKjQKWK{QJWLQKӋWKӕQJWK{QJWLQTXҧQOêӭQJGөQJSKkQWtFK.KRGӳOLӋXWKѭӡQJFyGXQJOѭӧQJOrQÿӃQKjQJWUăP*%WKұPFKtWtQKEҵQJÿѫQYӏ7%

+Ӌ WKӕQJ ÿѭӧF GQJ FKR NKR Gӳ OLӋX Oj KӋ WKӕQJ [ӱ Oê SKkQ WtFK WUӵF WX\ӃQ(OLAP ± 2QOLQH$QDO\WLFDO3URFHVVLQJ

Ngày đăng: 31/07/2024, 10:25

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w