báo cáo cá nhân kho dữ liệu và kinh doanh thông minh

64 0 0
Tài liệu đã được kiểm tra trùng lặp
báo cáo cá nhân kho dữ liệu và kinh doanh thông minh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Về mặt hình thức,bài báo cáo đã đáp ứng đúng như yêu cầu của thầy đưa ra như font chữ Times New Roman, cỡchữ 12, căn lề hai bên và đảm bảo không sai chính tả.Các công việc đã thực hiện đ

Trang 1

KHOA TOÁN TIN———————o0o——————–

BÁO CÁO CÁ NHÂN

MÔN HỌC: KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH

Giảng viên hướng dẫn: ThS Nguyễn Danh Tú

Trang 2

Phần II: Kết quả thu được, đánh giá và góp ý cho môn học 92

1 Kết quả thu được 92

2 Đánh giá môn học 92

3 Góp ý cho môn học 92

Tài liệu tham khảo 93

1

Trang 3

Tự đánh giá báo cáo cá nhân

Về mặt cấu trúc, bài báo cáo đã có đủ các phần cơ bản như mục lục, tự đánh giá báo cáo, nộidung, kết quả thu được và đóng góp ý kiến cho môn học, tài liệu tham khảo Về mặt hình thức,bài báo cáo đã đáp ứng đúng như yêu cầu của thầy đưa ra như font chữ Times New Roman, cỡchữ 12, căn lề hai bên và đảm bảo không sai chính tả.

Các công việc đã thực hiện được:Phần I: Kết quả thực hành tuần

Đã thực hiện chụp lại toàn bộ kết quả của các tuần (mỗi ảnh đều có đầy đủ thông tin Họ và tên – MSSV)Số lượng bài làm : đã hoàn thành đủ số bài của 12 tuần thực hànhPhần II: Kết quả thu được và góp ý cho môn học

Đã trình bày kết quả thu được sau khi kết thúc môn học.Đánh giá môn học và nêu tầm quan trọng của môn học Đã đưa ra một vài góp ý cho môn học.

Tài liệu tham khảo:

Đã đưa ra một số link, đường dẫn, tài liệu tham khảo đã sử dụng trong quá trình họctập.

Em xin gửi lời cảm ơn sâu sắc tới ThS Nguyễn Danh Tú – người giảng dạy em trong môn họcnày Cảm ơn thầy vì những kiến thức bổ ích mà thầy mang đến cho chúng em, giúp chúng em cóthể nắm rõ được các khái niệm cũng như ứng dụng thực tế của môn học Điều đặc biệt ấn tượngcủa thầy là lòng nhiệt tình và tận tâm dành cho việc giảng dạy Thầy luôn sẵn lòng lắng nghe vàtrả lời mọi câu hỏi của chúng em một cách tỉ mỉ và chi tiết Em mong rằng sẽ có cơ hội được thầytiếp tục giảng dạy trong các học phần tiếp theo.

Em xin chân thành cảm ơn!

Trang 4

Phần I: Kết quả thực hành1 Bài thực hành tuần 1

1.1.Tiền xử lý dữ liệu cơ bản trong Excel

a Sắp xếp theo ID

b Sắp xếp theo tên + họ và tên đệm

c Sắp xếp theo màu

3

Trang 5

d Lọc theo 1 tiêu chí

e Lọc theo nhiều tiêu chí

f Lọc theo 1 tiêu chí (nâng cao)

g Lọc theo nhiều tiêu chí (nâng cao)

h Copy dữ liệu lọc sang một sheet khác

i Tách ngày tháng

Trang 6

j Tách địa chỉ

5

Trang 7

k Tách họ tên

l Flash fill

m Xóa dữ liệu bị trùng

Trang 8

n Thống kê mô tả

o Tách họ và tên bằng 2 cách

p Lập danh sách các chức vụ của mỗi bộ phận

7

Trang 9

1.2.SVp xếp dữ liê Wu trong Excel và lọc dữ liê Wu

Trang 10

a Sắp xếp dữ liệu theo họ tên

b Lọc nhân viên bộ phận kho

c Lọc nhân viên có mức lương từ 8 đến 10 triệu

d Lọc nhân viên chưa có thông tin CMND

e Lọc nhân viên cần xác minh lại hộ khẩu

f Lọc nhân viên bộ phận kho + hộ khẩu Hà Nội1.3.Tự đô Wng điền thông tin v\ng trống

9

Trang 11

1.4.Copy paste trong Excel

a Transpose(xoay bảng) và toán tử cộng dữ liệu

b Copy Paste từ nguồn khác (website)

Trang 12

c Copy ô F7 sang ô C7 giữ nguyên giá trị và màu sắc

1.5.Dán dữ liê Wu vào 1 v\ng đã được lọc

1.6.Data Validation

a Dạng danh sách

b Dạng điều kiện, thông báo nhập

11

Trang 13

c Danh sách nâng cao

d Find and Select

1.7.Định dạng có điều kiện trong Excel

a Định dạng top %, - định dạng tiến độ

Trang 14

b Tổng hợp doanh thu của các sản phẩm tại mỗi tỉnh của mỗi quốc gia theo năm

c Tổng hợp tổng mỗi sản phẩm đã bán tại mỗi nước lọc theo trạng thái đơn hàng

d Tổng hợp số lượng đơn hàng khách hàng đã đặt theo từng năm lọc theo trạng thái đơn hàng

21

Trang 15

e Tổng hợp tỷ lệ sản phẩm bán ra theo các năm

3 Bài thực hành tuần 3

3.1.Xây dựng Dashboard trên Excel

a Dim & Fact

b Dashboard

3.2.Xây dựng Dashboard trên dữ liệu

a Yêu cầu phân tích

Trang 17

d Dashboard

e Phân tích DashboardTheo thời gian:

- Các sản phẩm: Vintage Cars, Classic Cars, MotorCycles có doanh thu tăngvào các tháng 10-11.

- Plans được mua nhiều vào các tháng 4-5, 9-10, dịp có nhiều ngày lễ.- Trains và Trucks & Buses có doanh thu đều theo các tháng từng năm

nhưng đang có dấu hiệu giảm => Có xu hướng không được ưa chuộng vàothời gian tới.

Theo quốc gia:

- Ở các quốc gia phát triển (USA) có mức doanh thu cao vượt trội so với cácquốc gia đang phát triển.

- Doanh thu ở USA là cao nhất, thị trường có nhiều người giàu có so với cácquốc gia khác.

Trang 18

4 Bài thực hành tuần 44.1.Power Query

a Extract DataExtract từ Excel

Extract từ folder

25

Trang 19

Extract từ google sheets

b TransformMerge Query

Append Query

Trang 20

Group byUnpivot Table

Transpose and pivot

27

Trang 21

c Load Data

Trang 22

Load data bằng power query

Dim & Fact

29

Trang 23

Data Model (hình sao)

d Add Column

Trang 24

Add index column

Add duplicate column

31

Trang 25

Add conditional column

Add custom column

Trang 26

Add index subgroup

e Extract dữ liệu từ MySQL

33

Trang 28

4.2.Xây dựng các mô hình cho đơn vị Đại học Bách Khoa Hà Nội

a Business flow

b Data flow

35

Trang 29

5 Bài thực hành tuần 55.1.Power query & Dash

a Yêu cầu phân tíchPhân tích doanh thu:

Trang 30

c Dim & Fact

d Tạo Dashboard

e Phân tích Dashboard

Doanh thu theo khách hàng:

- Khách hàng C262, C219, C733, C660 là 4 khách hàng đem lại nhiều doanhthu nhất.

Doanh thu theo sản phẩm và theo nhân viên:

37

Trang 31

- Mặt hàng xe đạp có doanh thu gấp rưỡi tổng doanh thu các mặt hàng => nhu cầu đi xe đạp rất cao

- Nhân viên Lan Anh đem lại nhiều doanh thu cho cửa hàng nhất, các nhânviên khác có năng lực khá đồng đều.

Doanh thu theo thời gian:- Doanh thu năm 2020 là cao nhất

- Doanh thu cao trong khoảng từ quý 4 đến quý 1 năm sau do mọi ngườithường mua sắm nhiều trong dịp này để chuẩn bị cho giáng sinh, tết,…

Doanh thu theo khu vực:

- Các thành phố lớn như Hà Nội, Đà Nẵng, Hồ Chí Minh,… có doanhthu cao vì tập trung nhiều dân cư và có mức sống, thu nhập ở mức cao.- Ở các thành phố nhỏ đặc biệt ở miền núi cao thì doanh thu không đượccao do mật độ dân cư thưa thớt, thu nhập thấp, nhu cầu sử dụng các sảnphẩm giá trị không cao.

Phí ship trung bình theo hình thức vận chuyển và đóng gói:

- Phí ship trung bình khi chuyển bằng máy bay là rẻ nhất và bằng xe tảilà đắt nhất.

- Phí ship trung bình cao ở các mặt hàng đóng gói lớn, hộp to vì chúngkhá là cồng kềnh và chiếm diện tích.

Phí ship trung bình theo khu vực:

- Phí ship trung bình ở các thành phố lớn nhìn chung là cao hơn các khuvực khác do chịu nhiều chi phí phát sinh khi đi lại trên đường.Thời gian giao hàng trung bình theo mức độ ưu tiên và loại hình vậnchuyển:

- Nhìn chung máy bay là loại hình vận chuyển nhanh nhất và máy bay cótốc độ di chuyển nhanh nhất.

- Tàu hỏa chậm nhất.

- Các mặt hàng quan trọng thường được vận chuyển nhanh hơn các mặthàng còn lại.

- Thời gian vận chuyển tỉ lệ nghịch với mức độ ưu tiên của sản phẩm.

5.2.Xây dựng Dashboard trên Google Data Studio

Trang 32

a Tạo kết nối google sheet

39

Trang 33

b Tạo bảng

Trang 34

c Tạo bảng có bản đồ nhiệt

d Tạo bộ lọc

41

Trang 35

e Tạo bộ lọc cho 1 bảng

f Tạo bản đồ

Trang 36

c Video 6.3

d Video 6.4

63

Trang 37

8 Bài thực hành tuần 8

a Truy vấn thông tin khách hàng phàn nàn

b Truy vấn ra thông tin đơn hàng

c Truy vấn nhân viên đã chăm sóc khách hàng của đơn hàng này

d Truy vấn thông tin sản phẩm bị phàn nàn

Trang 38

e Kiểm tra kho hàng còn sản phẩm đó không?

f Đưa ra những dòng sản phẩm có cùng mức giá, chênh lệch giá nhỏ để tư vấn (Nhỏ hơn 5 đô)

g Đưa ra những dòng xe có cùng một số đặc điểm với xe trước

65

Trang 39

h Truy vấn sản phẩm mới mà khách hàng yêu cầu theo đặc điểm

i Tìm 1 nhân viên đã có kinh nghiệm để tư vấn cho khách hàng

j Hiển thị những khách hàng đã mua sản phẩm này để tiến hành khảo sát chất lượng

Trang 40

k Hiển thị top 5 khách hàng có tổng giá trị đơn hàng lớn nhất

l Hiển thị top 5 sản phẩm có tỷ lệ doanh số cao nhất

m Kiểm tra giao vận đã đúng thời gian yêu cầu chưa, hiển thị đơn hàng giao trễ

67

Trang 41

n Đưa các các sản phẩm không có mặt trong bất kỳ một đơn hàng nào

o Đưa ra các sản phẩm có số lượng trong kho lớn hơn trung bình số lượng trong kho củacác sản phẩm cùng loại

p Thống kê tổng số lượng sản phẩm trong kho theo từng dòng sản phẩm của từng nhà cung ứng

Trang 42

q Thống kê ra mỗi sản phẩm được đặt hàng lần cuối vào thời gian nào và khách hàng đãđặt hàng

9 Bài thực hành tuần 9

a Tạo cơ sở dữ liệu và tạo bảng Dim, bảng Fact

69

Trang 44

71

Trang 45

b Đổ dữ liệu

Trang 46

73

Trang 47

c Data Model Logic

Trang 48

d Data Model Vật Lý

10.Bài thực hành tuần 10

10.1.Phân tích 7 câu truy vấn trong OLTP

75

Trang 49

a Thống kê doanh số của các nhân viên theo phòng ban

b Thống kê doanh số theo các office

Trang 50

c Thống kê doanh số theo nội địa tại các office

d Thống kê mức độ chênh lệch giá bán và giá niêm yết trung bình theo từng sản phẩm

77

Trang 51

e Thống kê khách hàng tại quốc gia nào nhận được nhiều ưu đãi mua hàng nhất (giá bán rẻ hơn giá niêm yết)

Trang 52

f Thống kế số lượng hàng tồn và mức chênh lệch giá bán trung bình theo sản phẩm

g Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực (cụ thể là ở USA)

10.2.Phân tích 8 câu truy vấn trong OLAP

79

Trang 53

a Thống kê top 5 sản phẩm mang lại doanh số lớn nhất

b Thống kê doanh số của các nhân viên theo phòng ban

Trang 54

c Thống kê doanh số theo các office

d Thống kê doanh số theo dòng sản phẩm

81

Trang 55

e Thống kê doanh số theo dòng sản phẩm theo thời gian

f Thống kê tổng số lượng hàng trong kho theo từng sản phẩm

Trang 56

g Thống kê top những khách hàng đã thanh toán nhiều nhất

h Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực (cụ thể là USA)

83

Trang 57

11.Bài thực hành tuần 11

a Extract dữ liệu từ MySQL sang Excel

b Tạo mối quan hệ giữa các bảng trong Excel

Trang 58

c Thống kê doanh số của các nhân viên theo phòng ban (cụ thể là phòng ban có officeCode =4)

d Thống kê doanh số theo các office (theo từng dòng sản phẩm)

e Thống kê doanh số theo nội địa tại các office

85

Trang 59

f Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực

Trang 60

- Phòng ban số 4 đạt mức doanh số cao vượt trội so với các phòng ban khác(959 sản phẩm được bán ra) Phòng ban số 4 chiếm 32.01% tổng số lượngdoanh thu của tất cả các phòng ban.

- Phòng ban số 5 đạt mức doanh thu thấp nhất Theo thời gian:

- Số lượng doanh thu tăng dần, dẫn đến sự gia tăng 230.77% giữa tháng 1 năm2003 và tháng 5 năm 2005.

- Tuy nhiên, số lượng doanh thu bắt đầu giảm vào tháng 7 năm 2004, giảm đi20.59% trong 9 tháng.

- Trong giai đoạn tăng dốc mạnh nhất từ tháng 7 năm 2003 đến tháng 12 năm2003, số lượng doanh thu đã tăng từ 63 lên 83.

Theo nhân viên:

- Nhân viên Gerard Hernandez bán được nhiều đơn hàng nhất (396) Nhiều hơnnhân viên Leslie Thompson và nhân viên Martin Gerard – nhân viên bán đượcít đơn nhất 282 đơn.

- Dùng Slicer để lọc theo dòng sản phẩm, ta thấy rằng sản phẩm mà nhân viênGerard Hernandez bán được đa phần là Classic Cars (138).

b Phân tích chất lượng đơn hàng

Theo trạng thái:

- Nhìn chung, các đơn hàng đều đã được giao thành công (2771 đơn hàng) Chỉcó một phần nhỏ (79 đơn hàng) bị hủy

87

Trang 61

- Sử dụng Slicer lọc theo trạng thái hủy hàng, có thể thấy phần lớn số lượng hủyhàng sẽ rơi vào các loại mặt hàng Ships (25.09%), Classic Cars (25.02%),Planes (22.78%).

Theo thời gian:

- Sự bất thường về số lượng khách hàng nhất là vào tháng 10 năm 2003, khi vậnchuyển có mức cao nhất là 529.

- Số lượng khách hàng cho Resolved bắt đầu có xu hướng tăng vào tháng 10năm 2003, tăng 287,50% (23) trong 5 quý.

- Classic Cars chiếm 39,48% trên tổng số lượng trong kho.

- Trên tất cả 7 dòng sản phẩm, Tổng số lượng trong kho dao động từ 16696 đến219183.

Trang 62

Phần II: Kết quả thu được, đánh giá và góp ý cho môn học1 Kết quả thu được

Dưới đây là một vài kết quả em đã thu được sau khi hoàn thành môn học:Kiến thức cơ bản về Data Warehouse:

Hiểu rõ khái niệm và mục đích của Data Warehouse trong việc tổ chức dữ liệuđể hỗ trợ quyết định kinh doanh.

Nắm vững các khái niệm quan trọng như OLAP (Online AnalyticalProcessing), OLTP (Online Transaction Processing), Star Schema, SnowflakeSchema, Dimension, Fact, v.v.

Biết cách xác định và tối ưu hóa các khóa chính, cơ sở dữ liệu con, và quan hệgiữa các bảng trong một Data Warehouse.

ETL (Extract, Transform, Load):

Nắm vững quy trình ETL và khả năng thực hiện việc trích xuất dữ liệu từ cácnguồn khác nhau như cơ sở dữ liệu, tệp văn bản, và API.

Biết cách thực hiện biến đổi (transform) dữ liệu để làm cho nó phù hợp với môhình dữ liệu của Data Warehouse.

Có khả năng tải dữ liệu đã biến đổi vào Data Warehouse một cách hiệu quả.Mô hình hóa dữ liệu (Data Modeling):

Hiểu cách thiết kế mô hình dữ liệu cho Data Warehouse bằng cách sử dụng cáckỹ thuật như Dimensional Modeling và Entity-Relationship Modeling.Biết cách xác định và xây dựng các thuộc tính, chỉ mục, và các quan hệ giữacác bảng để hỗ trợ truy vấn dữ liệu hiệu quả.

Có khả năng áp dụng các nguyên tắc chuẩn hóa dữ liệu và giải quyết vấn đề dữliệu không nhất quán.

89

Trang 63

Nội dung chương trình học: Em rất ấn tượng với nội dung chương trình học của

môn học Từ cơ bản đến chi tiết, mọi khái niệm liên quan đến Data Warehouse vàPower BI đều được giảng viên trình bày một cách tỉ mỉ và dễ hiểu Việc học vềquy trình ETL và cách tạo báo cáo trong Power BI đã giúp em nắm vững toàn diệnquy trình xử lý dữ liệu và biến chúng thành thông tin hữu ích.

Phương pháp giảng dạy: Giảng viên đã thể hiện sự đam mê và chuyên nghiệp

trong việc truyền đạt kiến thức Cách giảng dạy linh hoạt và tạo sự tương tác vớisinh viên đã làm cho bài học trở nên thú vị và gây hứng thú Sự kết hợp giữa lýthuyết và thực hành giúp em hiểu sâu hơn và tăng khả năng ứng dụng kiến thứcvào thực tế.

Ứng dụng thực tiễn: Môn học đã giúp em nhận ra tầm quan trọng và ứng dụng

thực tiễn của Data Warehouse và Power BI trong môi trường doanh nghiệp Em đãhiểu rõ hơn về cách dữ liệu được chuyển đổi thành thông tin quan trọng hỗ trợquyết định kinh doanh.

Phản hồi và hỗ trợ: Em vô cùng cảm kích sự phản hồi tích cực và sự hỗ trợ tận

tình từ giảng viên Thầy đã tạo môi trường học tập thoải mái và đáng tin cậy, giúpem tự tin hơn trong việc đặt câu hỏi và nhận giúp đỡ khi cần thiết.

3 Góp ý cho môn học

Môn học “Kho dữ liệu và kinh doanh thông minh” em được học là khoảng thời gian cuốicủa năm thứ 3 Vì vậy, những gì mà môn học đem lại có những cái có thể bản thân đã biếtnhưng có những cái hoàn toàn mới mẻ Thật may mắn khi người giảng dạy cho chúng emlà thầy Nguyễn Danh Tú Nếu nói về việc chỉnh chu và truyền đạt kiến thức, em nhận thấyrằng thầy đã truyền đạt vô cùng đầy đủ Lượng bài tập thầy giao cho chúng em cũng đủ đểchúng em ôn tập và thực hành

Nhưng em xin phép có một vài góp ý nhỏ dành cho môn học như sau:

Môn học nên có thêm nhiều tiết thực hành trên lớp hơn, để chữa về các bài thựchành tuần, để chúng em có thể hiểu rõ hơn về mục đích của bài thực hành đó vàgiải đáp được những khúc mắc của mà vẫn còn gặp phải

Nên nêu rõ kết quả cần đạt được tại mỗi tuần thực hành

Trên đây là một vài góp ý khách quan của em Mặc dù cảm thấy quá trình học tập và sốlượng kiến thức mà thầy truyền đạt đã đủ để chúng em có một cái nhìn nào đó sâu hơn vềmôn học, nhưng nếu được thực hành nhiều hơn nữa, em tin rằng việc ghi nhớ sẽ lâu hơnvà hiệu quả hơn.

Trang 64

Tài liệu tham khảo

[1] Nguyễn Danh Tú, Slide bài giảng Kho dữ liệu và kinh doanh thông minh, Đại họcBách khoa Hà Nội.

[2] Kênh Youtube Power BI of Pavan Lalwami - https://www.youtube.com/Power BI FullOnline Training by Pavan Lalwami.

[3] W.H Inmon - Building the Data Warehouse, Wiley , 2005

[4] Alberto Ferrari, Marco Russo - Introducing Microsoft Power BI, 2016

91

Ngày đăng: 14/06/2024, 16:22