1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận học phần phân tích dữ liệu và tri thức kinh doanh

45 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Chính vì v y, viể ậ ệc phân tích thường xuyên hoạt động kinh doanh của doanh nghiệp sẽ giúp cho các nhà qu n tr ả ị đánh giá đầy đủ, chính xác mọi diễn biến và kết quả hoạt động s n xu t

Trang 1

ĐẠI HỌC BÁCH KHOA HÀ NỘI

Ngành Quản trị Kinh doanh

Giảng viên hướng dẫn ThS Nguy n Danh Tú

Bộ môn Phân tích d li u và tri th c kinh doanh ữ ệ ứ

Viện Toán ng d ng và Tin h c ứ ụ ọ

HÀ NỘI, 01/2023

Chữ ký của GVHD

Trang 2

1.3 Cấu trúc dữ liệu cho kho dữ liệu 9

1.4 Các loại lược đồ của kho dữ liệu 10

1.4.1 Lược đồ hình sao (Start Schema) 10

1.4.2 Lược đồ bông tuyết (Snow Flake Schema) 10

1.4.3 Galaxy Schema 11

1.4.4 Fact Constellation Schema 11

1.5 Nguyên lý thiết kế Data Warehouse 12

PHẦN 2: TỒNG QUAN V BI 132.1 Các khái niêm cơ bản về BI 13

2.2 M t s hoộ ố ạt động chính c a BI 132.3 ng d ng và l i ích c a BI trong kinh doanh 14Ứ ụ ợ ủ2.3.1 ng dụng 14

2.3.2 L i ích 15

PHẦN 3: ỨNG DỤNG DATAWAREHOUSE VÀ BI VÀO PHÂN TÍCH DỮ LIỆU LĨNH VỰC BÁN L 173.1 Gi i thi u v bài toán và ODS 17ớ ệ ề3.2 Ki n trúc DataWarehouse 18ế3.3 Ti n x lý d li u 18ề ử ữ ệ3.4 Mô hình d li u OLTP 21ữ ệ3.4.1 Sơ đồ quan hệ thực thể 21

3.4.2 Mô t cả ấu trúc trong cơ sở ữ ệu 21 d li3.4.3 Phân tích các chi u Dimension 23

3.5 Mô hình d li u OLAP 25ữ ệ3.6 Các m u Dashboard 263.6.1 DashboardSale - Doanh thu 26

3.6.2 Dashboard Quantity - Sản lượng 33

3.6.3 Dashboard Profit - L i nhuận 39

Trang 3

2

KẾT LUẬN 45TÀI LI U THAM KH O 46Ệ Ả

Trang 4

3

ĐÁNH GIÁ THÀNH VIÊN NHÓM HỌ VÀ TÊN Nguyễn Trọng Chiến

LỚP Quản trị kinh doanh 02 - K65

NHÓM Nhóm 7

STT Tên thành viên

Làm t t

phần việc được

nhóm

Ký (Ghi rõ họ tên) Chiến

Nguyễn Trọng Chiến

Trang 5

4

TỰ ĐÁNH GIÁ BÁO CÁO

Khoản th i gian h c tờ ọ ập môn Phân tích dữ liệu và tri thức kinh doanh trong học kì 2022.1 là giai đoạn nhóm em được ti p xúc v i m t m ng ki n th c mế ớ ộ ả ế ứ ới Để ờ đây, vào cuối gi kì nhóm có cơ hội t ng h p và hổ ợ ệ th ng hóa l i m t vài ki n thố ạ ộ ế ức đã học, đồng th i k t h p v i ờ ế ợ ớdữ liệu thực tế để nâng cao kiến thức chuyên môn, được trình bày thông qua bài báo cáo cu i ốkì c a nhóm Tuy ch có 17 tu n hủ ỉ ầ ọc, nhưng qua quá trình học tập và trao đổi, nhóm em đã mởrộng tầm nhìn và tiếp thu nhiều kiến thức sẽ được s d ng trong suử ụ ốt 04 năm đạ ọi h c Từ đó nhóm em nh n th y, vi c th c hiậ ấ ệ ự ện báo cáo vơi dữ ệ li u ngoài th c t là vô cùng quan tr ng - ự ế ọnó giúp sinh viên xây d ng n n t ng lý thuyự ề ả ết được học cũng như cách thức trình bày một bài tiểu luận báo cáo Trong quá trình thực hiện bài báo cáo, từ ch còn b ng ỗ ỡ ỡ cho đến thiếu ki n ếthức và kinh nghiệm, nhóm em đã gặp phải rất nhiều khó khăn nhưng vớ ự giúp đỡ ậi s t n tình của th y Nguy n Danh ầ ễ Tú đã giúp nhóm em có được nh ng kinh nghi m, tr i nghi m quý báu ữ ệ ả ệđể hoàn thành t t bài báo cáo ố

Vì th i gian và ki n th c còn h n h p nên bài báo cáo không th tránh kh i nh ng thi u ờ ế ứ ạ ệ ể ỏ ữ ếsót, r t mong s góp ý c a th y Nguyấ ự ủ ầ ễn Danh Tú, để nhóm em rút kinh nghi m và hoàn thành ệtốt hơn trong những bài báo cáo tiếp theo

Em xin chân thành c m ả ơn!

Trang 6

5

LỜI M Ở ĐẦU

Trong những năm gần đây xu thế ộ h i nh p v kinh tậ ề ế hi n nay, s c nh tranh di n ra ệ ự ạ ễgay gắt, để t n t i và phát tri n các doanh nghi p phồ ạ ể ệ ải đối m t v i r t nhiặ ớ ấ ều khó khăn Đứng trước nh ng thách thữ ức như hiện nay, các doanh nghi p ph i không ng ng hoàn thi n, nâng cao ệ ả ừ ệhoạt động kinh doanh của mình, đồng thời phải có những chiến lược kinh doanh để thích ứng cho mỗi giai đoạn phát tri n Chính vì v y, viể ậ ệc phân tích thường xuyên hoạt động kinh doanh của doanh nghiệp sẽ giúp cho các nhà qu n tr ả ị đánh giá đầy đủ, chính xác mọi diễn biến và kết quả hoạt động s n xu t kinh doanh, biả ấ ết được những điểm mạnh, điểm yếu c a doanh ng iệp để ủcủng cố, phát huy hay khắc ph c, cụ ải tiến quản lý Từ đó, doanh ghi p t n d ng phát huy m i ệ ậ ụ ọtiềm năng, khai th c tắ ối đa nguồ ựn l c nhằm đạt đến hi u qu cao nh t trong kinh doanh K t ệ ả ấ ếquả của phân tích là cơ sở để đưa ra các quyết định qu n tr ng n h n và dài h n Phân tích hi u ả ị ắ ạ ạ ệquả hoạt động kinh doanh thông qua dữ liệu thu thập được, giúp dự báo, đề phòng và hạn chế những rủi ro trong kinh doanh Hi n nay, xu th phát tri n hung c a n n kinh t th gi i nói ệ ế ể ủ ề ế ế ớchung và n n kinh t cề ế ủa nước ta nói riêng đòi hỏi các doanh nghi p ph i n l c r t l n m i có ệ ả ổ ự ấ ớ ớtể t n t i và phát triồ ạ ển được Điều này đòi hỏi các nhà quản trị doanh nghiệp phải biết rõ thực lực c a doanh nghiủ ệp mình mà đề ra các phương hướng phát tri n phù hể ợp Để làm được điều này nhà qu n tr ph i th c hi n nghiêm túc vi c phân tích k t qu hoả ị ả ự ệ ệ ế ả ạt động kinh doanh d a ựtrên d li u c a doanh nghi p mình ữ ệ ủ ệ

Vì v y, phân tích k t qu hoậ ế ả ạt động kinh doanh có vai trò r t quan trấ ọng đối với mọi doanh nghi p Việ ệc hoàn thành hay không đạt được k hoế ạch kinh doanh đề ra s quyẽ ết định sự sống còn c a m t doanh nghiủ ộ ệp Để rút ng n kho ng cách c a nh ng d tính k ho ch thì vi c ắ ả ủ ữ ự ế ạ ệphân tích k t qu hoế ả ạt động kinh doanh c a doanh nghi p phủ ệ ải được th c hi n c n tr ng nh m ự ệ ẩ ọ ằcó sự đánh giá đúng đắn và chính xác Từ đó, nhà quản tr s có nhị ẽ ững định hướng cho tương lai c a doanh nghi p phù h p v i s phát tri n chung c a n n kinh tủ ệ ợ ớ ự ể ủ ề ế đất nước, tăng khả năng cạnh tranh cho doanh nghiệp, giúp doanh nghiệp phát triển bền vững

Đồng thời với s phát tri n ngày càng nhanh c a Công ngh , vi c phân tích d li u t ự ể ủ ệ ệ ữ ệ ừđo xây dựng lên các Dashboard ngày càng tr nên d dàng Vì v y, nhóở ễ ậ m em đã lựa ch n Phân ọtích d li u vữ ệ ới bài toán “Bán lẻ” thông qua Hệ cơ sở ữ ệ d li u và Quá trình kinh doanh thông minh (BI)

Trang 7

Hình 3 19 Dashboard Doanh thu_Năm 2015 30

Hình 3 20 Dashboard Doanh thu_Năm 2016 31

Hình 3 21 Dashboard Doanh thu_Năm 2017 32

Hình 3 22 Dashboard S n lả ượng_Tổng quát 34

Hình 3 23 Dashboard Sản lượng_Năm 2014 35

Hình 3 24 Dashboard Sản lượng_Năm 2015 36

Hình 3 25 Dashboard Sản lượng_Năm 2016 37

Hình 3 26 Dashboard Sản lượng_Năm 2017 38

Hình 3 27 Dashboard L i nhuợ ận_Tổng quát 40

Hình 3 28 Dashboard L i nhuợ ận_Năm 2014 41

Hình 3 29 Dashboard L i nhuợ ận_Năm 2015 42

Hình 3 30 Dashboard L i nhuợ ận_Năm 2016 43

Hình 3 31 Dashboard L i nhuợ ận_Năm 2017 44

Trang 8

7

DANH MỤC B NG BI U Ả Ể

Bảng 3 1 Mô tả các trường dữ liệu 17

Bảng 3 2 Mô tả cấu trúc DetailOrde 22

Bảng 3 3 Mô tả cấu trúc Customer 22

Bảng 3 4 Mô tả cấu trúc Order 22

Bảng 3 5 Mô tả cấu trúc Category 22

Bảng 3 6 Mô tả cấu trúc Product 23

Trang 9

Data Warehouse hoạt động như một kho lưu trữ trung tâm D liữ ệu đi vào kho dữ ệ li u từ h th ng giao dệ ố ịch và các cơ sở ữ ệu liên quan khác Sau đó, dữ ệu đượ d li li c x lý, chuy n ử ểđổi để người dùng có thể truy cập những dữ liệu này thông qua công cụ Business Intelligence, SQL client hay b ng tính ả

Một Data Warehouse thường bao gồm các yếu tố như: • Một cơ sở dữ liệu quan hệ để lưu trữ và quản lý dữ liệu

• Giải pháp trích xuất, tải và biến đổi ELT để chuẩn b dị ữ liệu cho phân tích • Khả năng phân tích thống kê, báo cáo và khai thác dữ liệu

• Các công cụ phân tích khách hàng để ự tr c quan hóa và trình bày d li u cho ữ ệngười dùng doanh nghiệp

• Các ng d ng phân tích khác, ph c tứ ụ ứ ạp hơn tạo ra thông tin có thể hành động bằng cách áp dụng khoa học dữ liệu và thuật toán trí tuệ nhân tạo AI hoặc các tính năng đồ thị và không gian cho phép nhi u lo i phân tích d liề ạ ữ ệu hơn trên quy mô l n ớ

Bên cạnh đó, Data Warehouse cũng có những đặc tính nhất định của b n thân h ả ệ cơ sở, bao gồm 04 đặc tính: hướng chủ đề, tích hợp, dữ liệu theo thời gian và bền vững; giống như Inmon, W.H - một chuyên gia hàng đầu trong vi c xây d ng h th ng kho d li u - ệ ự ệ ố ữ ệ từng đề cập "Một kho dữ liệu là một tập hợp dữ liệu hướng chủ đề, tích hợp, biến thể thời gian, ít biến động hỗ trợ cho quá trình đưa ra quyết định của doanh nghiệp"; cụ thể như sau:

Hướng chủ đề: Thông tin trong Data Warehouse sẽ được tập trung vào việc mô hình

và phân tích dữ liệu cho việc ra quyết định chứ không phải xử lý các giao dịch hay tác nghiệp hàng ngày xoay quanh các chủ thể như: khách hàng, sản phẩm và doanh thu Mục đích của Kho dữ liệu là phục vụ các yêu cầu phân tích, hoặc khai phá cụ thể được gọi là chủ đề dưới một góc nhìn cụ thể và đơn giản quanh một chủ đề bằng cách loại trừ dữ liệu thừa đối với quá trình đưa ra quyết định

Tích hợp: Một kho dữ liệu thường được xây dựng bởi việc tích hợp nhiều nguồn dữ liệu khác nhau chẳng hạn như cơ sở dữ liệu quan hệ, các tập tin, và hồ sơ giao dịch trực tuyến Áp dụng các kỹ thuật, tiền xử lý dữ liệu ETL nhằm làm sạch dữ liệu, tổng hợ dữ liệu từ nhiều p nguồn vào một kho dữ liệu cho phé người sử dụng có thể xem đồng thời nhiều nhóm chỉ tiêu p khác nhau, từ đó đảm bảo tính nhất quán giữa các nguồn dữ liệu

Dữ liệu theo thời gian Vì dữ liệu thay đổi liên tục nên chúng sẽ được gán 1 nhãn thời : gian tương ứng tại thời điểm nhập liệu Việc gắn thời gian này giúp người sử dụng dễ dàng so sánh dữ liệu với nhau để biết được các thay đổi đang đi theo chiều hướng tích cực hay tiêu cực

Trang 10

9 cả các cấu trúc quan trọng trong kho dữ liệu chứa, hoặc ngầm chứa một phần tử của thời gian

Bền vững: Một kho dữ liệu luôn luôn là kho riêng biệt về mặt vật lý đối với dữ liệu

trong xử lý giao tác hàng ngày Do việc tách biệt này, một kho dữ liệu không yêu cầu xử lý giao dịch, phục hồi, và cơ chế kiểm soát xử lý đồng thời Nó thường đòi hỏi chỉ có hai hoạt động trên dữ liệu là tải dữ liệu và làm mới dữ liệu

1.2 Vai trò của Data Warehouse

Sự xuất hiện của kho dữ liệu nhằm mục đích đáp ứng lượng dữ liệu ngày càng tăng cần được xử lý Nhu cầu lưu trữ dữ liệu tăng lên đi kèm với đó là sự phức tạp của hệ thống máy tính Từ đó, ta thấy được những lợi ích mà kho dữ liệu mang lại cho doanh nghiệp như:

• Tích hợp dữ liệu vào một nguồn, ở cùng một định dạng, giải quyết sự phân mảnh và mất cân bằng dữ liệu để đáp ứng nhu cầu thông tin của tất cả người dùng • Tiết kiệm thời gian và hiệu quả trong việc tìm kiếm dữ liệu cần thiết

• Thông qua xử lý và phân tích dữ liệu Data Warehouse giúp cho dữ liệu của doanh nghiệp hiệu quả hơn

• Giúp người dùng đưa ra các quyết định hợp lý, nhanh chóng và hiệu quả, đem lại nhiều lợi nhuận hơn,…

• Giúp tổ chức, xác định, quản lý và thực hiện các dự án/hoạt động một cách hiệu quả và chính xác

• Tăng đáng kể lượng dữ liệu cần được tổng hợp, lưu trữ và xử lý

1.3 Cấu trúc dữ liệu cho kho dữ liệu

Lượng dữ liệu trong kho là rất lớn và không có những thao tác như sửa đổi hay tạo mới nên nó cần được tối ưu cho việc phân tích và báo cáo Các thao tác với dữ liệu của kho dựa trên cơ sở Mô hình dữ liệu đa chiều (multidimensional data model), được mô hình hoá vào đối tượng được gọi là data cube Data cube là trung tâm phân tích, nó bao gồm nhiều dữ kiện (fact) và dữ kiện tạo ra nhiều chiều dữ kiện khác nhau (dimention)

Hình 1 1 Mô hình d li u nhi u chi u ữ ệ ề ề

Trong kho dữ liệu Data Warehouse, ta sẽ bắt gặp 03 loại dữ kiện như: (1) Additive - dữ

Trang 11

10 Additive những sự kiện có thể được tóm tắt cho một số Dimension trong bảng Fact chứ không phải là những bảng khác; (3) Non-Additive Là những sự kiện không được tóm tắt cho bất kỳ Dimension hiện tại nào trong bảng Fact Đồng thời, hệ thống kho dữ liệu gồm 3 tầng: (1) Tầng đáy - cung cấp dịch vụ lấy dữ liệu từ nhiều nguồn sau đó chuẩn hoá, làm sạch, tối ưu và lưu trữ dữ liệu đã tập trung; (2) Tầng giữa - cung cấp các dịch vụ thực hiện các thao tác với dữ liệu hay là dịch vụ OLAP; (3) Tầng trên - nơi chứa các câu truy vấn, báo cao, phân tích.

Bên cạnh đó, trong quá trình phân tích dữ liệu ta sẽ bắt gặ các hoạt động OLAp P chính: • Thu nhỏ (roll up): Tập hợp thành những tập có phạm vi lớn hơn VD: tập hợp theo năm -

thay vì theo quý

• Mở rộng (drill down): Chia nhỏ thành nhiều tập dữ liệu.- VD: Nhóm theo tháng thay vì theo quý

• Cắt lát (slice): Nhìn theo từng lớp một VD: Từ danh mục bán hàng của Q1,Q2,Q3, Q4 chỉ xem của quý Q1

• Thu nhỏ (dice): Bỏ bớt một phần của dữ liệu

• Pivot (rotate): Trực quan hóa, 3D thành hàng mặt phẳng 2D.

1.4 Các loại lược đồ của kho dữ liệu

1.4.1 Lược đồ hình sao (Start Schema)

Gồm 1 bảng Fact (bảng sự kiện) nằm ở trung tâm và được bao quanh bởi những bảng Dimension (bảng chiều) Dữ liệu của lược đồ hình sao không được chuẩn hoá Các câu hỏi nhằm vào bảng Fact và được cấu trúc bởi các bảng Dimension

Hình 1 2 Đồ thị lược đồ hình sao.

Ưu điểm: Bảng Fact, Dimension được mô tả rõ ràng, dễ hiểu Bảng Dim là bảng dữ liệu tĩnh, và bảng Fact là dữ liệu động được nạp bằng các thao tác Khoá của Fact được tạo bởi khoá của các bảng Dim Nghĩa là khoá chính của các bảng Dim chính là khoá của bảng Fact

Nhược: Dữ liệu không được chuẩn hoá

1.4.2 Lược đồ bông tuyết (Snow Flake Schema)

Lược đồ bông tuyết là dạng mở rộng của lược đồ hình sao bằng các bổ sung các Dim Bảng Fact như lược đồ hình sao, bảng Dim được chuẩn hoá Các chiều được cấu trúc rõ ràng Bảng Dim được chia thành chiều chính hay chiều phụ,

Trang 12

11 Nhược: Cấu trúc phi dạng chuẩn của lược đồ hình sao phù hợp hơn cho việc duyệt các chiều

Hình 1 3 Đồ ị lược đồ th hình sao

1.4.3 Galaxy Schema

Galaxy Schema chứa nhiều bảng Fact sử dụng chung một số bảng Dim Lược đồ là sự kết hợp của nhiều data mart (kho dữ liệu có chủ đề, dạng thu nhỏ của kho dữ liệu, kho dữ liệu được chia thành nhiều phần nhỏ khác nhau)

Hình 1 4 Đồ ị lược đồ th Galaxy

1.4.4 Fact Constellation Schema

Dimension trong lược đồ được tách thành các Dimension độc lập dựa trên các cấp độ của hệ thống phân cấp

Hình 1.5 Đồ thị lược đồ Fact Constellation

Trang 13

14 • Phân tích th ng kê (Statistical analysis); ố

• Dự đoán (Forecasting)

Bên cạnh đó, ệ vi c xác l p báo cáo trong h th ng BI cậ ệ ố ần lưu ý các bước quan trọng, bao gồm:

• Data sources: Đầu tiên, các d li u s ữ ệ ẽ được thu th p t các ngu n d liậ ừ ồ ữ ệu đa dạng như CRM, HRM, các trang web Thương mại điện tử,

• Data warehousing (Kho d li u): Kho d li u ữ ệ ữ ệ là nơi dữ ệu được lưu trữ li lâu dài b ng ằhệ thống các thiết b ịđiện tử của doanh nghiệp;

• Integrating Server (Tích h p máy ch ): Giúp v n hành công c ợ ủ ậ ụ ETL để chuyển đổi dữ liệu từ Data Sources sang Data Warehouse;

• Analysis Server (Máy chủ phân tích): Đầu vào c a d liủ ữ ệu, sau đó thu nhận d li u s ữ ệ ẽtrả về kết quả dựa trên tri thức nghiệp vụ đã định nghĩa sẵn;

• Reporting Server (Máy ch báo cáo): B ph n báo cáo các output nhủ ộ ậ ận được t ừAnalysis Server;

• Data Mining (Khai thác d liữ ệu): Đây là quá trình dữ ệu đ li ã qua xử lý được đem đi trích xuất, được đánh giá là một trong nh ng khâu khá quan tr ng! Data Mining bao ữ ọgồm phân loại (classification), phân cụm (Clustering), hoặc dự đoán (Prediction);

• Data Presentation (Trình bày d li u): Cu i cùng, d li u s ữ ệ ố ữ ệ ẽ đượ ổc t ng h p thành các ợbiểu đồ từ quá trình data mining được tạo ra từ đây

2.3 ng d ng và l i ích c a BI trong kinh doanh Ứ ụ ợ ủ

2.3.1 ng d ng Ứ ụ

2.3.1.1 Tr c quan d li u ự ữ ệ

Phần mềm BI s d ng m t lo t các công c phân tích d liử ụ ộ ạ ụ ữ ệu được thi t k ế ế để phân tích và qu n lý d liả ữ ệu liên quan đến hoạt động kinh doanh c a doanh nghi p D liủ ệ ữ ệu này, được trình bày dưới dạng trực quan, cho phép t ch c theo dõi hoổ ứ ạt động h u cậ ần, bán hàng, năng suất và hơn thế nữa

Một s n n t ng BI cung c p khố ề ả ấ ả năng báo cáo tùy chỉnh, nơi người dùng có thể chỉ định các thông s c a h Nhố ủ ọ ững người khác cung c p các m u báo cáo sấ ẫ ẵn có đã bao gồm các chỉ số tiêu chuẩn ngành

Trình bày d li u b ng hình nh trữ ệ ằ ả ực quan và định d ng d hi u, h th ng BI cho phép ạ ễ ể ệ ốngay c nhân viên ít kinh nghi m nhả ệ ất cũng có thể rút ra thông tin chi ti t t d li u Thay vì ế ừ ữ ệdựa vào các nhà khoa h c dọ ữ liệu được đào tạo để phân tích dữ liệu của mình, nhà quản tr có ịthể phân tích và trình bày d li u c a chính mình cho các c ữ ệ ủ ổ đông, các bộ phận khác ho c nhóm ặcủa công ty

Trên th c t , ta có thự ế ể nghĩ đến m t s h thộ ố ệ ống BI như: QlikView, Power BI, Spago, Pentaho, SAP BO, Oracle BI, IBM Cognos

2.3.1.2 Báo cáo

Một ng d ng kinh doanh quan tr ng c a BI là báo cáo Các công c BI thu th p và ứ ụ ọ ủ ụ ậnghiên c u các t p h p d li u phi c u trúc ngoài vi c t ch c và s dứ ậ ợ ữ ệ ấ ệ ổ ứ ử ụng chúng để ạ t o ra m t ộloạt các loại báo cáo khác nhau Chúng có thể bao gồm nhân sự, chi phí, bán hàng, d ch v ị ụkhách hàng và các quy trình khác

Trang 14

15 đích, phân phối, nhiệm vụ và giá tr Báo cáo là quá trình s p x p d liị ắ ế ữ ệu dưới dạng tóm t t v i ắ ớmục đích theo dõi hoạt động kinh doanh Phân tích là quá trình khám phá d liữ ệu để rút ra những hiểu biết sâu sắc có thể được áp dụng để ả c i thiện thực tiễn kinh doanh

Về cơ bản, báo cáo biến dữ liệu thành thông tin đơn giản Phân tích lấy dữ liệu và biến nó thành thông tin chi ti t h u ích Cế ữ ả hai đều giúp doanh nghi p c i thi n hi u su t và giám ệ ả ệ ệ ấsát hoạt động nhưng sử ụng các phương pháp khác nhau để làm điều đó d

Báo cáo cho người dùng biết điều gì đang xảy ra và phân tích giải thích lý do t i sao ạđiều đó lại xảy ra Cả hai quy trình đều có thể được thực hiện bằng hình ảnh hóa nhưng không nhất thiết phải làm như vậy

Các công c ụ BI là lý tưởng để xử lý d liữ ệu động V m t l ch s , tr c quan hóa d li u ề ặ ị ử ự ữ ệlà tĩnh và một cái mới sẽ phải được tạo cho mỗi lần thay đổi biến Phần mềm BI hiện đại cung cấp các bảng điều khiển tương tác có thể ập nh t theo th i gian th c ậ ờ ực, mang đến m t cộ ấp độmới v kh ng s d ng và s nhanh nh y trong phân tích d li u ề ả nă ử ụ ự ạ ữ ệ

2.3.1.3 Qu n lý hi u su t ả ệ ấ

Với các ứng dụng BI, các tổ chức có thể theo dõi tiến độ ục tiêu dựa trên khung th i m ờgian được xác định trước hoặc có thể tùy ch nh Các mỉ ục tiêu theo hướng d liữ ệu như thờ ại h n hoàn thành d án, m c tiêu th i gian giao hàng ho c m c tiêu bán hàng Ví d , n u nhà qu n ự ụ ờ ặ ụ ụ ế ảlý muốn đạt được m t m c tiêu bán hàng nhộ ụ ất định, h th ng BI c a h có th phân tích d li u ệ ố ủ ọ ể ữ ệcủa các tháng trước đó và đề xuất một mục tiêu hợp lý để hướng tới dựa trên hiệu suất trong quá kh ứ

Các m c tiêu này có thụ ể được theo dõi ch t chặ ẽ để cung c p thông tin c p nhấ ậ ật thường xuyên v tiề ến độ ục tiêu Điề m u này giúp nhà qu n lý hi u nh ng kho ng tr ng có th còn lả ể ữ ả ố ể ại Người dùng có th ể cài đặt h th ng c nh báo khi h sệ ố ả ọ ắp đạt được m c tiêu ho c n u th i ụ ặ ế ờhạn kết thúc mà họ vẫn chưa đạt được mục tiêu Điều này giúp các nhà quản lý và nhân viên luôn c p nh t tiậ ậ ến độ ủ c a h ọ và giúp các nhóm luôn hướng t i m c tiêu ớ ụ

Người dùng cũng có thể theo dõi việc hoàn thành mục tiêu và sử dụng dữ liệu tiến độđể đánh giá năng suất t ng th của m t t ch c Không giổ ể ộ ổ ứ ống như các trường hợp m t m t ấ ộlượng thời gian đáng kể để theo dõi ho c s p x p d li u c n thi t kh n c p, thông tin luôn có ặ ắ ế ữ ệ ầ ế ẩ ấthể truy cập dễ dàng Điều này giúp doanh nghiệp tiết kiệm th i gian và ti n bờ ề ạc

Từ đó, mỗi doanh nghi p s tìm cho mình nhệ ẽ ững hướng đi phù hợp với định hướng phát triển và gia tăng tính cạnh tranh trong quá trình kinh doanh c a mình Ngoài ra, khi áp d ng BI ủ ụvào quá trình kinh doanh, doanh nghiệp còn được nh n nh ng l i ích sau: ậ ữ ợ

• Đưa ra những thông tin và giúp doanh nghiệp sử dụng những thông tin một cách hiệu

Trang 15

16 • Giúp doanh nghiệp đưa ra những quyết định nhanh chóng, k p th i ị ờ

• Phân tích và dự đoán xu hướng và hành vi c a khách hàng, giúp doanh nghi p v lên ủ ệ ẽbức tranh khách hàng tổng thể

• BI giúp doanh nghi p hoệ ạch định t t c k ho ch, chiấ ả ế ạ ến lược marketing trong tương lai • Giúp doanh nghi p có cái nhìn khách quan, t ng th v doanh nghi p c a mình ệ ổ ể ề ệ ủ• Tối ưu chi phí và thời gian hoạt động cũng như hỗ trợ sát sao công tác điều hành của

doanh nghi p ệ

• Lợi thế tính về cạnh tranh, nắm trong tay nhiều cơ hội kinh doanh • Giúp doanh nghiệp đánh giá và cải thi n b máy c a t ch c ệ ộ ủ ổ ứ

Trang 16

17

PHẦN 3: ỨNG DỤNG DATAWAREHOUSE VÀ BI VÀO PHÂN TÍCH DỮ LIỆU LĨNH VỰC BÁN LẺ

3.1 Gi i thi u v bài toán và ODS ớ ệ ề

T p d li u ậ ữ ệ được s d ng trong bài phân tích thuử ụ ộc lĩnh vực bán hàng t i th ạ ị trường Hoa kỳ trong giai đoạn 2014 - 2017, được cung cấ bởi Michael Martin Dữ liệu gồm 21 cột, tương p ứng với 21 giữ liệu với 9994 đơn hàng được thực hiện trong suốt 04 năm bao gồm 792 khách hàng khác nhau được chia ra làm 03 bộ phận khách hàng chính Người tiêu dùng: (Consumer), tổ chức (Corporate), văn phòng (Home Office)

1 Row ID (Order Item Id) Đơn hàng thứ n

3 Order Date Ngày đặt hàng

5 Ship Mode Chế độ vận chuyển 6 Customer ID Mã ID khách hàng 7 Customer Name Tên khách hàng

9 Country Quốc gia cư trú của khách hàng 10 City Thành phố cư trú của khách hàng 11 State Bang cư trú của khách hàng 12 Postal Code Mã bưu chính

Bảng 3 1 Mô tả các trường dữ liệu

Hình 3 1 Sơ đồ quy trình nghi p v ệ ụ

Trang 17

18

(Requirement), bao gồm: Sale, Quantity, Profit; các FACT được được phân tích dựa trên các

DIM như: Order Date (Month, Quarter, Year), Ship Mode, Segment, Region, State, City, Category, Sub - Category, Product

Vi c phân tích các chệ ủ điểm d a vào các DIM trên s giúp ự ẽ ngườ ử ụi s d ng có cái nhìn tổng quát nh t v k t qu kinh doanh, cung cấ ề ế ả ấp nh ng thông tin c n thi t cho vi c ra quyữ ầ ế ệ ết định (chân dung khách hàng tiềm năng, dòng sản phẩm được sử dụng nhiều, doanh thu của sản phẩm ) từ đó cải thiện hiệu suất kinh doanh

3.2 Ki n trúc DataWarehouse ế

Hình 3 2 Ki n trúc Data Warehouse c a h th ng qu n lý hoế ủ ệ ố ả ạt động bán l ẻ

Tầng đầu tiên c a ki n trúc là Data Source - ủ ế “Sample Superstore” đượ ấ ự ệ cơ sởc l y t hdữ liệu hoạt động t các nguừ ồn bên ngoài (file csv, excel ) Những công cụ và tiện ích này thực hiện việc loại b d liỏ ữ ệu thừa, làm sạch dữ liệu, chuyển i d li u, c p nh t d li u D đổ ữ ệ ậ ậ ữ ệ ữliệu được lưu trữ vào 5 bảng:

(1) B ảng Detail Order; (2) B ảng Customer; (3) B ảng Order; (4) B ảng Produc; (5) B ảng Category

Tầng ti p theo là vi c s d ng các công c tích h p trên Excel ho c Power Query nh m ế ệ ử ụ ụ ợ ặ ằETL - ti n x lý d liề ử ữ ệu trước khi đưa vào Data Warehouse Tầng giữa là “Storage Layer” bao gồm các Data Warehouse và Data marts được cài đặt dùng mô hình quan h OLAP ệ Tầng trên cùng là tầng người dùng cuối, gồm các câu truy v n và các công c làm báo cáo, phân tích, ấ ụcông c khai thác d li u, thông qua công c Power BI v : ụ ữ ệ ụ ề

(1) Quantity: Số lượng đơn đặt hàng được đặt; (2) Sale: Doanh thu;

(3) Profit: L i nhuợ ận thu được

3.3 Ti n x lý d li u ề ử ữ ệ

Trang 18

19 cột, xóa dữ li u trùng l p, xóa d li u trệ ặ ữ ệ ống, định d ng l i dạ ạ ữ li u, tách sheet, transform d li u ệ ữ ệsang Power BI

Trang 19

20 Hình 3 6 Xóa d li u null ữ ệ

Định d ng l i d li u ạ ạ ữ ệ

Hình 3 7 Định d ng l i d li u ạ ạ ữ ệ

Tách sheet

Hình 3 8 Tách d li u thành t ng b ng ữ ệ ừ ả

Trang 20

21 ữ ệ

Hình 3 9 Chuy n d li u sang Power BI ể ữ ệ

3.4 Mô hình d li u OLTP ữ ệ

3.4.1 Sơ đồ quan hệ thực thể

Hình 3 10 Sơ đồ quan h th c th OLTP ệ ự ể

3.4.2 Mô t cả ấu trúc trong cơ sở ữ ệ d li u

Bảng “FACT DetailOrder”

STT Tên thu c tính Kiểu

2 Customer ID Nvarchar(255) 3 Product ID Nvarchar(255)

Trang 22

23

STT Tên thu c tính Kiểu

1 Category ID Nvarchar(255) 2 Product ID Nvarchar(255)

4 Product Name Nvarchar(255)

Bảng 3 6 Mô tả cấu trúc Product

3.4.3 Phân tích các chi u Dimension

3.4.3.1 Các chi u phân tích

Chiều thời gian

STT Tên thu c tính Kiểu

Bảng 3 7 OLTP - Dim_Date

Chiều sản phẩm

STT Tên thu c tính Kiểu

1 Product ID Nvarchar(255) 2 Category ID Nvarchar(255) 3 Category Name Nvarchar(255)

Bảng 3 10 OLTP - Dim_Customer

Ngày đăng: 29/05/2024, 18:11

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w