1. Trang chủ
  2. » Luận Văn - Báo Cáo

báo cáo cá nhân kho dữ liệu và kinh doanh thông minh

64 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề BÁO CÁO CÁ NHÂN
Tác giả Hoàng Văn Toàn
Người hướng dẫn ThS. Nguyễn Danh Tú
Trường học ĐẠI HỌC BÁCH KHOA HÀ NỘI
Chuyên ngành KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH
Thể loại báo cáo cá nhân
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 64
Dung lượng 20,68 MB

Cấu trúc

  • Phần I: Kết quả thực hành (4)
    • 1. Bài thực hành tuần 1 (4)
    • 2. Bài thực hành tuần 2 (0)
    • 3. Bài thực hành tuần 3 (15)
    • 4. Bài thực hành tuần 4 (18)
    • 5. Bài thực hành tuần 5 (29)
    • 6. Bài thực hành tuần 6 (0)
    • 7. Bài thực hành tuần 7 (0)
    • 8. Bài thực hành tuần 8 (37)
    • 9. Bài thực hành tuần 9 (42)
    • 10. Bài thực hành tuần 10 (48)
    • 11. Bài thực hành tuần 11 (57)
    • 12. Bài thực hành tuần 12 (59)
  • Phần II: Kết quả thu được, đánh giá và góp ý cho môn học (62)
    • 1. Kết quả thu được (62)
    • 2. Đánh giá môn học (62)
    • 3. Góp ý cho môn học (63)
  • Tài liệu tham khảo (3)

Nội dung

Về mặt hình thức,bài báo cáo đã đáp ứng đúng như yêu cầu của thầy đưa ra như font chữ Times New Roman, cỡchữ 12, căn lề hai bên và đảm bảo không sai chính tả.Các công việc đã thực hiện đ

Kết quả thực hành

Bài thực hành tuần 1

1.1 Tiền xử lý dữ liệu cơ bản trong Excel a Sắp xếp theo ID b Sắp xếp theo tên + họ và tên đệm c Sắp xếp theo màu

3 d Lọc theo 1 tiêu chí e Lọc theo nhiều tiêu chí f Lọc theo 1 tiêu chí (nâng cao) g Lọc theo nhiều tiêu chí (nâng cao) h Copy dữ liệu lọc sang một sheet khác i Tách ngày tháng j Tách địa chỉ

5 k Tách họ tên l Flash fill m Xóa dữ liệu bị trùng n Thống kê mô tả o Tách họ và tên bằng 2 cách p Lập danh sách các chức vụ của mỗi bộ phận

1.2 SVp xếp dữ liê Wu trong Excel và lọc dữ liê Wu a Sắp xếp dữ liệu theo họ tên b Lọc nhân viên bộ phận kho c Lọc nhân viên có mức lương từ 8 đến 10 triệu d Lọc nhân viên chưa có thông tin CMND e Lọc nhân viên cần xác minh lại hộ khẩu f Lọc nhân viên bộ phận kho + hộ khẩu Hà Nội

1.3 Tự đô Wng điền thông tin v\ng trống

1.4 Copy paste trong Excel a Transpose(xoay bảng) và toán tử cộng dữ liệu b Copy Paste từ nguồn khác (website) c Copy ô F7 sang ô C7 giữ nguyên giá trị và màu sắc

1.5 Dán dữ liê Wu vào 1 v\ng đã được lọc

1.6 Data Validation a Dạng danh sách b Dạng điều kiện, thông báo nhập

11 c Danh sách nâng cao d Find and Select

1.7 Định dạng có điều kiện trong Excel a Định dạng top %, - định dạng tiến độ b Tổng hợp doanh thu của các sản phẩm tại mỗi tỉnh của mỗi quốc gia theo năm c Tổng hợp tổng mỗi sản phẩm đã bán tại mỗi nước lọc theo trạng thái đơn hàng d Tổng hợp số lượng đơn hàng khách hàng đã đặt theo từng năm lọc theo trạng thái đơn hàng

21 e Tổng hợp tỷ lệ sản phẩm bán ra theo các năm

3.1 Xây dựng Dashboard trên Excel a Dim & Fact b Dashboard

3.2 Xây dựng Dashboard trên dữ liệu a Yêu cầu phân tích

Khía cạnh: thời gian, quốc gia, kích thước sản phẩm, sản phẩm, khu vực địa lý b Dim & Fact c Dimension

- Các sản phẩm: Vintage Cars, Classic Cars, MotorCycles có doanh thu tăng vào các tháng 10-11.

- Plans được mua nhiều vào các tháng 4-5, 9-10, dịp có nhiều ngày lễ.

- Trains và Trucks & Buses có doanh thu đều theo các tháng từng năm nhưng đang có dấu hiệu giảm => Có xu hướng không được ưa chuộng vào thời gian tới.

- Ở các quốc gia phát triển (USA) có mức doanh thu cao vượt trội so với các quốc gia đang phát triển.

- Doanh thu ở USA là cao nhất, thị trường có nhiều người giàu có so với các quốc gia khác.

- Các dòng sản phẩm size medium có doanh thu cao hơn các size khác.

- Các thành phố lớn như New York, California có doanh số dòng sản phẩm Motorbike với size large cao hơn các khu vực khác.

- Tổng quan thì sản phẩm Classic Cars có doanh thu cao nhất, phương tiện được ưa thích và sử dụng rộng rãi ở các nước.

Extract từ google sheets b Transform

Load data bằng power query

Data Model (hình sao) d Add Column

Q&A e Extract dữ liệu từ MySQL

4.2 Xây dựng các mô hình cho đơn vị Đại học Bách Khoa Hà Nội a Business flow b Data flow

5.1 Power query & Dash a Yêu cầu phân tích

Khía cạnh: khách hàng, sản phẩm, nhân viên, thời gian, khu vực

Phân tích phí giao hàng:

Khía cạnh: khu vực, hình thức vận chuyển, hình thức đóng gói

Phân tích thời gian giao hàng trung bình:

Chỉ số: số ngày giao hàng

Khía cạnh: mức độ ưu tiên, loại hình vận chuyển b Tạo Data Model c Dim & Fact d Tạo Dashboard e Phân tích Dashboard

Doanh thu theo khách hàng:

- Khách hàng C262, C219, C733, C660 là 4 khách hàng đem lại nhiều doanh thu nhất.

Doanh thu theo sản phẩm và theo nhân viên:

- Mặt hàng xe đạp có doanh thu gấp rưỡi tổng doanh thu các mặt hàng

=> nhu cầu đi xe đạp rất cao

- Nhân viên Lan Anh đem lại nhiều doanh thu cho cửa hàng nhất, các nhân viên khác có năng lực khá đồng đều.

Doanh thu theo thời gian:

- Doanh thu năm 2020 là cao nhất

- Doanh thu cao trong khoảng từ quý 4 đến quý 1 năm sau do mọi người thường mua sắm nhiều trong dịp này để chuẩn bị cho giáng sinh, tết,… Doanh thu theo khu vực:

- Các thành phố lớn như Hà Nội, Đà Nẵng, Hồ Chí Minh,… có doanh thu cao vì tập trung nhiều dân cư và có mức sống, thu nhập ở mức cao.

- Ở các thành phố nhỏ đặc biệt ở miền núi cao thì doanh thu không được cao do mật độ dân cư thưa thớt, thu nhập thấp, nhu cầu sử dụng các sản phẩm giá trị không cao.

Phí ship trung bình theo hình thức vận chuyển và đóng gói:

- Phí ship trung bình khi chuyển bằng máy bay là rẻ nhất và bằng xe tải là đắt nhất.

- Phí ship trung bình cao ở các mặt hàng đóng gói lớn, hộp to vì chúng khá là cồng kềnh và chiếm diện tích.

Phí ship trung bình theo khu vực:

- Phí ship trung bình ở các thành phố lớn nhìn chung là cao hơn các khu vực khác do chịu nhiều chi phí phát sinh khi đi lại trên đường. Thời gian giao hàng trung bình theo mức độ ưu tiên và loại hình vận chuyển:

- Nhìn chung máy bay là loại hình vận chuyển nhanh nhất và máy bay có tốc độ di chuyển nhanh nhất.

- Các mặt hàng quan trọng thường được vận chuyển nhanh hơn các mặt hàng còn lại.

- Thời gian vận chuyển tỉ lệ nghịch với mức độ ưu tiên của sản phẩm.

5.2 Xây dựng Dashboard trên Google Data Studio a Tạo kết nối google sheet

39 b Tạo bảng c Tạo bảng có bản đồ nhiệt d Tạo bộ lọc

41 e Tạo bộ lọc cho 1 bảng f Tạo bản đồ c Video 6.3 d Video 6.4

8 Bài thực hành tuần 8 a Truy vấn thông tin khách hàng phàn nàn b Truy vấn ra thông tin đơn hàng c Truy vấn nhân viên đã chăm sóc khách hàng của đơn hàng này d Truy vấn thông tin sản phẩm bị phàn nàn e Kiểm tra kho hàng còn sản phẩm đó không? f Đưa ra những dòng sản phẩm có cùng mức giá, chênh lệch giá nhỏ để tư vấn (Nhỏ hơn 5 đô) g Đưa ra những dòng xe có cùng một số đặc điểm với xe trước

65 h Truy vấn sản phẩm mới mà khách hàng yêu cầu theo đặc điểm i Tìm 1 nhân viên đã có kinh nghiệm để tư vấn cho khách hàng j Hiển thị những khách hàng đã mua sản phẩm này để tiến hành khảo sát chất lượng k Hiển thị top 5 khách hàng có tổng giá trị đơn hàng lớn nhất l Hiển thị top 5 sản phẩm có tỷ lệ doanh số cao nhất m Kiểm tra giao vận đã đúng thời gian yêu cầu chưa, hiển thị đơn hàng giao trễ

67 n Đưa các các sản phẩm không có mặt trong bất kỳ một đơn hàng nào o Đưa ra các sản phẩm có số lượng trong kho lớn hơn trung bình số lượng trong kho của các sản phẩm cùng loại p Thống kê tổng số lượng sản phẩm trong kho theo từng dòng sản phẩm của từng nhà cung ứng q Thống kê ra mỗi sản phẩm được đặt hàng lần cuối vào thời gian nào và khách hàng đã đặt hàng

9 Bài thực hành tuần 9 a Tạo cơ sở dữ liệu và tạo bảng Dim, bảng Fact

73 c Data Model Logic d Data Model Vật Lý

10.1 Phân tích 7 câu truy vấn trong OLTP

75 a Thống kê doanh số của các nhân viên theo phòng ban b Thống kê doanh số theo các office c Thống kê doanh số theo nội địa tại các office d Thống kê mức độ chênh lệch giá bán và giá niêm yết trung bình theo từng sản phẩm

77 e Thống kê khách hàng tại quốc gia nào nhận được nhiều ưu đãi mua hàng nhất (giá bán rẻ hơn giá niêm yết) f Thống kế số lượng hàng tồn và mức chênh lệch giá bán trung bình theo sản phẩm g Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực (cụ thể là ở USA)

10.2 Phân tích 8 câu truy vấn trong OLAP

79 a Thống kê top 5 sản phẩm mang lại doanh số lớn nhất b Thống kê doanh số của các nhân viên theo phòng ban c Thống kê doanh số theo các office d Thống kê doanh số theo dòng sản phẩm

Bài thực hành tuần 3

3.1 Xây dựng Dashboard trên Excel a Dim & Fact b Dashboard

3.2 Xây dựng Dashboard trên dữ liệu a Yêu cầu phân tích

Khía cạnh: thời gian, quốc gia, kích thước sản phẩm, sản phẩm, khu vực địa lý b Dim & Fact c Dimension

- Các sản phẩm: Vintage Cars, Classic Cars, MotorCycles có doanh thu tăng vào các tháng 10-11.

- Plans được mua nhiều vào các tháng 4-5, 9-10, dịp có nhiều ngày lễ.

- Trains và Trucks & Buses có doanh thu đều theo các tháng từng năm nhưng đang có dấu hiệu giảm => Có xu hướng không được ưa chuộng vào thời gian tới.

- Ở các quốc gia phát triển (USA) có mức doanh thu cao vượt trội so với các quốc gia đang phát triển.

- Doanh thu ở USA là cao nhất, thị trường có nhiều người giàu có so với các quốc gia khác.

- Các dòng sản phẩm size medium có doanh thu cao hơn các size khác.

- Các thành phố lớn như New York, California có doanh số dòng sản phẩm Motorbike với size large cao hơn các khu vực khác.

- Tổng quan thì sản phẩm Classic Cars có doanh thu cao nhất, phương tiện được ưa thích và sử dụng rộng rãi ở các nước.

Bài thực hành tuần 4

Extract từ google sheets b Transform

Load data bằng power query

Data Model (hình sao) d Add Column

Q&A e Extract dữ liệu từ MySQL

4.2 Xây dựng các mô hình cho đơn vị Đại học Bách Khoa Hà Nội a Business flow b Data flow

Bài thực hành tuần 5

5.1 Power query & Dash a Yêu cầu phân tích

Khía cạnh: khách hàng, sản phẩm, nhân viên, thời gian, khu vực

Phân tích phí giao hàng:

Khía cạnh: khu vực, hình thức vận chuyển, hình thức đóng gói

Phân tích thời gian giao hàng trung bình:

Chỉ số: số ngày giao hàng

Khía cạnh: mức độ ưu tiên, loại hình vận chuyển b Tạo Data Model c Dim & Fact d Tạo Dashboard e Phân tích Dashboard

Doanh thu theo khách hàng:

- Khách hàng C262, C219, C733, C660 là 4 khách hàng đem lại nhiều doanh thu nhất.

Doanh thu theo sản phẩm và theo nhân viên:

- Mặt hàng xe đạp có doanh thu gấp rưỡi tổng doanh thu các mặt hàng

=> nhu cầu đi xe đạp rất cao

- Nhân viên Lan Anh đem lại nhiều doanh thu cho cửa hàng nhất, các nhân viên khác có năng lực khá đồng đều.

Doanh thu theo thời gian:

- Doanh thu năm 2020 là cao nhất

- Doanh thu cao trong khoảng từ quý 4 đến quý 1 năm sau do mọi người thường mua sắm nhiều trong dịp này để chuẩn bị cho giáng sinh, tết,… Doanh thu theo khu vực:

- Các thành phố lớn như Hà Nội, Đà Nẵng, Hồ Chí Minh,… có doanh thu cao vì tập trung nhiều dân cư và có mức sống, thu nhập ở mức cao.

- Ở các thành phố nhỏ đặc biệt ở miền núi cao thì doanh thu không được cao do mật độ dân cư thưa thớt, thu nhập thấp, nhu cầu sử dụng các sản phẩm giá trị không cao.

Phí ship trung bình theo hình thức vận chuyển và đóng gói:

- Phí ship trung bình khi chuyển bằng máy bay là rẻ nhất và bằng xe tải là đắt nhất.

- Phí ship trung bình cao ở các mặt hàng đóng gói lớn, hộp to vì chúng khá là cồng kềnh và chiếm diện tích.

Phí ship trung bình theo khu vực:

- Phí ship trung bình ở các thành phố lớn nhìn chung là cao hơn các khu vực khác do chịu nhiều chi phí phát sinh khi đi lại trên đường. Thời gian giao hàng trung bình theo mức độ ưu tiên và loại hình vận chuyển:

- Nhìn chung máy bay là loại hình vận chuyển nhanh nhất và máy bay có tốc độ di chuyển nhanh nhất.

- Các mặt hàng quan trọng thường được vận chuyển nhanh hơn các mặt hàng còn lại.

- Thời gian vận chuyển tỉ lệ nghịch với mức độ ưu tiên của sản phẩm.

5.2 Xây dựng Dashboard trên Google Data Studio a Tạo kết nối google sheet

39 b Tạo bảng c Tạo bảng có bản đồ nhiệt d Tạo bộ lọc

41 e Tạo bộ lọc cho 1 bảng f Tạo bản đồ c Video 6.3 d Video 6.4

8 Bài thực hành tuần 8 a Truy vấn thông tin khách hàng phàn nàn b Truy vấn ra thông tin đơn hàng c Truy vấn nhân viên đã chăm sóc khách hàng của đơn hàng này d Truy vấn thông tin sản phẩm bị phàn nàn e Kiểm tra kho hàng còn sản phẩm đó không? f Đưa ra những dòng sản phẩm có cùng mức giá, chênh lệch giá nhỏ để tư vấn (Nhỏ hơn 5 đô) g Đưa ra những dòng xe có cùng một số đặc điểm với xe trước

65 h Truy vấn sản phẩm mới mà khách hàng yêu cầu theo đặc điểm i Tìm 1 nhân viên đã có kinh nghiệm để tư vấn cho khách hàng j Hiển thị những khách hàng đã mua sản phẩm này để tiến hành khảo sát chất lượng k Hiển thị top 5 khách hàng có tổng giá trị đơn hàng lớn nhất l Hiển thị top 5 sản phẩm có tỷ lệ doanh số cao nhất m Kiểm tra giao vận đã đúng thời gian yêu cầu chưa, hiển thị đơn hàng giao trễ

67 n Đưa các các sản phẩm không có mặt trong bất kỳ một đơn hàng nào o Đưa ra các sản phẩm có số lượng trong kho lớn hơn trung bình số lượng trong kho của các sản phẩm cùng loại p Thống kê tổng số lượng sản phẩm trong kho theo từng dòng sản phẩm của từng nhà cung ứng q Thống kê ra mỗi sản phẩm được đặt hàng lần cuối vào thời gian nào và khách hàng đã đặt hàng

9 Bài thực hành tuần 9 a Tạo cơ sở dữ liệu và tạo bảng Dim, bảng Fact

73 c Data Model Logic d Data Model Vật Lý

10.1 Phân tích 7 câu truy vấn trong OLTP

75 a Thống kê doanh số của các nhân viên theo phòng ban b Thống kê doanh số theo các office c Thống kê doanh số theo nội địa tại các office d Thống kê mức độ chênh lệch giá bán và giá niêm yết trung bình theo từng sản phẩm

77 e Thống kê khách hàng tại quốc gia nào nhận được nhiều ưu đãi mua hàng nhất (giá bán rẻ hơn giá niêm yết) f Thống kế số lượng hàng tồn và mức chênh lệch giá bán trung bình theo sản phẩm g Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực (cụ thể là ở USA)

10.2 Phân tích 8 câu truy vấn trong OLAP

79 a Thống kê top 5 sản phẩm mang lại doanh số lớn nhất b Thống kê doanh số của các nhân viên theo phòng ban c Thống kê doanh số theo các office d Thống kê doanh số theo dòng sản phẩm

81 e Thống kê doanh số theo dòng sản phẩm theo thời gian f Thống kê tổng số lượng hàng trong kho theo từng sản phẩm g Thống kê top những khách hàng đã thanh toán nhiều nhất h Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực (cụ thể là USA)

11.Bài thực hành tuần 11 a Extract dữ liệu từ MySQL sang Excel b Tạo mối quan hệ giữa các bảng trong Excel c Thống kê doanh số của các nhân viên theo phòng ban (cụ thể là phòng ban có officeCode =4) d Thống kê doanh số theo các office (theo từng dòng sản phẩm) e Thống kê doanh số theo nội địa tại các office

85 f Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực

12.Bài thực hành tuần 12 a Phân tích doanh số

- Trên tất cả các phòng ban, số lượng doanh thu dao động từ 137 đến 959 sản phẩm.

- Phòng ban số 4 đạt mức doanh số cao vượt trội so với các phòng ban khác (959 sản phẩm được bán ra) Phòng ban số 4 chiếm 32.01% tổng số lượng doanh thu của tất cả các phòng ban.

- Phòng ban số 5 đạt mức doanh thu thấp nhất

- Số lượng doanh thu tăng dần, dẫn đến sự gia tăng 230.77% giữa tháng 1 năm

- Tuy nhiên, số lượng doanh thu bắt đầu giảm vào tháng 7 năm 2004, giảm đi 20.59% trong 9 tháng.

- Trong giai đoạn tăng dốc mạnh nhất từ tháng 7 năm 2003 đến tháng 12 năm

2003, số lượng doanh thu đã tăng từ 63 lên 83.

- Classic Cars chiếm phần trăm cao nhất, 40.13% trên tổng số doanh thu theo các loại mặt hàng.

- Trains chiếm phần trăm thấp nhất, 1.96% trên tổng số doanh thu theo các loại mặt hàng.

- Nhân viên Gerard Hernandez bán được nhiều đơn hàng nhất (396) Nhiều hơn nhân viên Leslie Thompson và nhân viên Martin Gerard – nhân viên bán được ít đơn nhất 282 đơn.

- Dùng Slicer để lọc theo dòng sản phẩm, ta thấy rằng sản phẩm mà nhân viên Gerard Hernandez bán được đa phần là Classic Cars (138). b Phân tích chất lượng đơn hàng

- Nhìn chung, các đơn hàng đều đã được giao thành công (2771 đơn hàng) Chỉ có một phần nhỏ (79 đơn hàng) bị hủy

- Sử dụng Slicer lọc theo trạng thái hủy hàng, có thể thấy phần lớn số lượng hủy hàng sẽ rơi vào các loại mặt hàng Ships (25.09%), Classic Cars (25.02%), Planes (22.78%).

- Classic Cars là loại mặt hàng có số lượng đặt nhiều nhất (37.72% trên tổng số lượng sản phẩm được bán ra).

- Trains là loại mặt hàng có số lượng đặt ít nhất (2.67% trên số lượng sản phẩm được bán ra).

- Sự bất thường về số lượng khách hàng nhất là vào tháng 10 năm 2003, khi vận chuyển có mức cao nhất là 529.

- Số lượng khách hàng cho Resolved bắt đầu có xu hướng tăng vào tháng 10 năm 2003, tăng 287,50% (23) trong 5 quý.

- Các đơn hàng sẽ tập trung ở khu vực Bắc Mĩ và Châu Úc.

- Classic Cars có tổng số lượng trong kho cao nhất 219183 và cao hơn 1.212,79% so với Trains, loại xe có tổng số lượng trong kho thấp nhất là 16696.

- Classic Cars chiếm 39,48% trên tổng số lượng trong kho.

- Trên tất cả 7 dòng sản phẩm, Tổng số lượng trong kho dao động từ 16696 đến219183.

Bài thực hành tuần 8

a Truy vấn thông tin khách hàng phàn nàn b Truy vấn ra thông tin đơn hàng c Truy vấn nhân viên đã chăm sóc khách hàng của đơn hàng này d Truy vấn thông tin sản phẩm bị phàn nàn e Kiểm tra kho hàng còn sản phẩm đó không? f Đưa ra những dòng sản phẩm có cùng mức giá, chênh lệch giá nhỏ để tư vấn (Nhỏ hơn 5 đô) g Đưa ra những dòng xe có cùng một số đặc điểm với xe trước

65 h Truy vấn sản phẩm mới mà khách hàng yêu cầu theo đặc điểm i Tìm 1 nhân viên đã có kinh nghiệm để tư vấn cho khách hàng j Hiển thị những khách hàng đã mua sản phẩm này để tiến hành khảo sát chất lượng k Hiển thị top 5 khách hàng có tổng giá trị đơn hàng lớn nhất l Hiển thị top 5 sản phẩm có tỷ lệ doanh số cao nhất m Kiểm tra giao vận đã đúng thời gian yêu cầu chưa, hiển thị đơn hàng giao trễ

67 n Đưa các các sản phẩm không có mặt trong bất kỳ một đơn hàng nào o Đưa ra các sản phẩm có số lượng trong kho lớn hơn trung bình số lượng trong kho của các sản phẩm cùng loại p Thống kê tổng số lượng sản phẩm trong kho theo từng dòng sản phẩm của từng nhà cung ứng q Thống kê ra mỗi sản phẩm được đặt hàng lần cuối vào thời gian nào và khách hàng đã đặt hàng

Bài thực hành tuần 9

a Tạo cơ sở dữ liệu và tạo bảng Dim, bảng Fact

73 c Data Model Logic d Data Model Vật Lý

Bài thực hành tuần 10

10.1 Phân tích 7 câu truy vấn trong OLTP

75 a Thống kê doanh số của các nhân viên theo phòng ban b Thống kê doanh số theo các office c Thống kê doanh số theo nội địa tại các office d Thống kê mức độ chênh lệch giá bán và giá niêm yết trung bình theo từng sản phẩm

77 e Thống kê khách hàng tại quốc gia nào nhận được nhiều ưu đãi mua hàng nhất (giá bán rẻ hơn giá niêm yết) f Thống kế số lượng hàng tồn và mức chênh lệch giá bán trung bình theo sản phẩm g Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực (cụ thể là ở USA)

10.2 Phân tích 8 câu truy vấn trong OLAP

79 a Thống kê top 5 sản phẩm mang lại doanh số lớn nhất b Thống kê doanh số của các nhân viên theo phòng ban c Thống kê doanh số theo các office d Thống kê doanh số theo dòng sản phẩm

81 e Thống kê doanh số theo dòng sản phẩm theo thời gian f Thống kê tổng số lượng hàng trong kho theo từng sản phẩm g Thống kê top những khách hàng đã thanh toán nhiều nhất h Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực (cụ thể là USA)

Bài thực hành tuần 11

a Extract dữ liệu từ MySQL sang Excel b Tạo mối quan hệ giữa các bảng trong Excel c Thống kê doanh số của các nhân viên theo phòng ban (cụ thể là phòng ban có officeCode =4) d Thống kê doanh số theo các office (theo từng dòng sản phẩm) e Thống kê doanh số theo nội địa tại các office

85 f Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực

Bài thực hành tuần 12

- Trên tất cả các phòng ban, số lượng doanh thu dao động từ 137 đến 959 sản phẩm.

- Phòng ban số 4 đạt mức doanh số cao vượt trội so với các phòng ban khác (959 sản phẩm được bán ra) Phòng ban số 4 chiếm 32.01% tổng số lượng doanh thu của tất cả các phòng ban.

- Phòng ban số 5 đạt mức doanh thu thấp nhất

- Số lượng doanh thu tăng dần, dẫn đến sự gia tăng 230.77% giữa tháng 1 năm

- Tuy nhiên, số lượng doanh thu bắt đầu giảm vào tháng 7 năm 2004, giảm đi 20.59% trong 9 tháng.

- Trong giai đoạn tăng dốc mạnh nhất từ tháng 7 năm 2003 đến tháng 12 năm

2003, số lượng doanh thu đã tăng từ 63 lên 83.

- Classic Cars chiếm phần trăm cao nhất, 40.13% trên tổng số doanh thu theo các loại mặt hàng.

- Trains chiếm phần trăm thấp nhất, 1.96% trên tổng số doanh thu theo các loại mặt hàng.

- Nhân viên Gerard Hernandez bán được nhiều đơn hàng nhất (396) Nhiều hơn nhân viên Leslie Thompson và nhân viên Martin Gerard – nhân viên bán được ít đơn nhất 282 đơn.

- Dùng Slicer để lọc theo dòng sản phẩm, ta thấy rằng sản phẩm mà nhân viên Gerard Hernandez bán được đa phần là Classic Cars (138). b Phân tích chất lượng đơn hàng

- Nhìn chung, các đơn hàng đều đã được giao thành công (2771 đơn hàng) Chỉ có một phần nhỏ (79 đơn hàng) bị hủy

- Sử dụng Slicer lọc theo trạng thái hủy hàng, có thể thấy phần lớn số lượng hủy hàng sẽ rơi vào các loại mặt hàng Ships (25.09%), Classic Cars (25.02%), Planes (22.78%).

- Classic Cars là loại mặt hàng có số lượng đặt nhiều nhất (37.72% trên tổng số lượng sản phẩm được bán ra).

- Trains là loại mặt hàng có số lượng đặt ít nhất (2.67% trên số lượng sản phẩm được bán ra).

- Sự bất thường về số lượng khách hàng nhất là vào tháng 10 năm 2003, khi vận chuyển có mức cao nhất là 529.

- Số lượng khách hàng cho Resolved bắt đầu có xu hướng tăng vào tháng 10 năm 2003, tăng 287,50% (23) trong 5 quý.

- Các đơn hàng sẽ tập trung ở khu vực Bắc Mĩ và Châu Úc.

- Classic Cars có tổng số lượng trong kho cao nhất 219183 và cao hơn 1.212,79% so với Trains, loại xe có tổng số lượng trong kho thấp nhất là 16696.

- Classic Cars chiếm 39,48% trên tổng số lượng trong kho.

- Trên tất cả 7 dòng sản phẩm, Tổng số lượng trong kho dao động từ 16696 đến219183.

Kết quả thu được, đánh giá và góp ý cho môn học

Kết quả thu được

Dưới đây là một vài kết quả em đã thu được sau khi hoàn thành môn học:

Kiến thức cơ bản về Data Warehouse:

Hiểu rõ khái niệm và mục đích của Data Warehouse trong việc tổ chức dữ liệu để hỗ trợ quyết định kinh doanh.

Nắm vững các khái niệm quan trọng như OLAP (Online Analytical Processing), OLTP (Online Transaction Processing), Star Schema, Snowflake Schema, Dimension, Fact, v.v.

Biết cách xác định và tối ưu hóa các khóa chính, cơ sở dữ liệu con, và quan hệ giữa các bảng trong một Data Warehouse.

Nắm vững quy trình ETL và khả năng thực hiện việc trích xuất dữ liệu từ các nguồn khác nhau như cơ sở dữ liệu, tệp văn bản, và API.

Biết cách thực hiện biến đổi (transform) dữ liệu để làm cho nó phù hợp với mô hình dữ liệu của Data Warehouse.

Có khả năng tải dữ liệu đã biến đổi vào Data Warehouse một cách hiệu quả.

Mô hình hóa dữ liệu (Data Modeling):

Hiểu cách thiết kế mô hình dữ liệu cho Data Warehouse bằng cách sử dụng các kỹ thuật như Dimensional Modeling và Entity-Relationship Modeling. Biết cách xác định và xây dựng các thuộc tính, chỉ mục, và các quan hệ giữa các bảng để hỗ trợ truy vấn dữ liệu hiệu quả.

Có khả năng áp dụng các nguyên tắc chuẩn hóa dữ liệu và giải quyết vấn đề dữ liệu không nhất quán.

Nắm vững cách sử dụng Power BI Desktop để kết nối với các nguồn dữ liệu và tạo báo cáo trực quan.

Biết cách sử dụng các biểu đồ, đồ thị, và bảng điều khiển để trực quan hóa dữ liệu một cách dễ hiểu và hấp dẫn.

Có khả năng tạo các báo cáo động và trang tổng hợp (dashboards) để theo dõi hiệu suất kinh doanh và các chỉ số quan trọng.

Biết cách public Dashboard lên web để chia sẻ cho người khác.

Phân tích dữ liệu và báo cáo:

Hiểu cách sử dụng Power BI để thực hiện phân tích dữ liệu và trả lời các câu hỏi kinh doanh quan trọng.

Đánh giá môn học

Môn học "Kho dữ liệu và kinh doanh thông minh" là một hành trình học tập thực sự đáng nhớ và đáng giá Nó không chỉ giúp em mở rộng kiến thức về lĩnh vực quan trọng này, mà còn mang đến cho em nhiều kỹ năng mới và trải nghiệm thực tế hữu ích.

Nội dung chương trình học: Em rất ấn tượng với nội dung chương trình học của môn học Từ cơ bản đến chi tiết, mọi khái niệm liên quan đến Data Warehouse và Power BI đều được giảng viên trình bày một cách tỉ mỉ và dễ hiểu Việc học về quy trình ETL và cách tạo báo cáo trong Power BI đã giúp em nắm vững toàn diện quy trình xử lý dữ liệu và biến chúng thành thông tin hữu ích.

Phương pháp giảng dạy: Giảng viên đã thể hiện sự đam mê và chuyên nghiệp trong việc truyền đạt kiến thức Cách giảng dạy linh hoạt và tạo sự tương tác với sinh viên đã làm cho bài học trở nên thú vị và gây hứng thú Sự kết hợp giữa lý thuyết và thực hành giúp em hiểu sâu hơn và tăng khả năng ứng dụng kiến thức vào thực tế. Ứng dụng thực tiễn: Môn học đã giúp em nhận ra tầm quan trọng và ứng dụng thực tiễn của Data Warehouse và Power BI trong môi trường doanh nghiệp Em đã hiểu rõ hơn về cách dữ liệu được chuyển đổi thành thông tin quan trọng hỗ trợ quyết định kinh doanh.

Phản hồi và hỗ trợ: Em vô cùng cảm kích sự phản hồi tích cực và sự hỗ trợ tận tình từ giảng viên Thầy đã tạo môi trường học tập thoải mái và đáng tin cậy, giúp em tự tin hơn trong việc đặt câu hỏi và nhận giúp đỡ khi cần thiết.

Ngày đăng: 14/06/2024, 16:22

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w