![báo cáo cá nhân kho dữ liệu và kinh doanh thông minh](https://123docz.net/image/doc_normal.png)
Đang tải... (xem toàn văn)
Thông tin tài liệu
Về mặt hình thức,bài báo cáo đã đáp ứng đúng như yêu cầu của thầy đưa ra như font chữ Times New Roman, cỡchữ 12, căn lề hai bên và đảm bảo không sai chính tả.Các công việc đã thực hiện đ
Trang 1KHOA TOÁN TIN———————o0o——————–
BÁO CÁO CÁ NHÂN
MÔN HỌC: KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH
Giảng viên hướng dẫn: ThS Nguyễn Danh Tú
Trang 2Phần II: Kết quả thu được, đánh giá và góp ý cho môn học 92
1 Kết quả thu được 92
2 Đánh giá môn học 92
3 Góp ý cho môn học 92
Tài liệu tham khảo 93
1
Trang 3Tự đánh giá báo cáo cá nhân
Về mặt cấu trúc, bài báo cáo đã có đủ các phần cơ bản như mục lục, tự đánh giá báo cáo, nộidung, kết quả thu được và đóng góp ý kiến cho môn học, tài liệu tham khảo Về mặt hình thức,bài báo cáo đã đáp ứng đúng như yêu cầu của thầy đưa ra như font chữ Times New Roman, cỡchữ 12, căn lề hai bên và đảm bảo không sai chính tả.
Các công việc đã thực hiện được:Phần I: Kết quả thực hành tuần
Đã thực hiện chụp lại toàn bộ kết quả của các tuần (mỗi ảnh đều có đầy đủ thông tin Họ và tên – MSSV)Số lượng bài làm : đã hoàn thành đủ số bài của 12 tuần thực hànhPhần II: Kết quả thu được và góp ý cho môn học
Đã trình bày kết quả thu được sau khi kết thúc môn học.Đánh giá môn học và nêu tầm quan trọng của môn học Đã đưa ra một vài góp ý cho môn học.
Tài liệu tham khảo:
Đã đưa ra một số link, đường dẫn, tài liệu tham khảo đã sử dụng trong quá trình họctập.
Em xin gửi lời cảm ơn sâu sắc tới ThS Nguyễn Danh Tú – người giảng dạy em trong môn họcnày Cảm ơn thầy vì những kiến thức bổ ích mà thầy mang đến cho chúng em, giúp chúng em cóthể nắm rõ được các khái niệm cũng như ứng dụng thực tế của môn học Điều đặc biệt ấn tượngcủa thầy là lòng nhiệt tình và tận tâm dành cho việc giảng dạy Thầy luôn sẵn lòng lắng nghe vàtrả lời mọi câu hỏi của chúng em một cách tỉ mỉ và chi tiết Em mong rằng sẽ có cơ hội được thầytiếp tục giảng dạy trong các học phần tiếp theo.
Em xin chân thành cảm ơn!
Trang 4Phần I: Kết quả thực hành1 Bài thực hành tuần 1
1.1.Tiền xử lý dữ liệu cơ bản trong Excel
a Sắp xếp theo ID
b Sắp xếp theo tên + họ và tên đệm
c Sắp xếp theo màu
3
Trang 5d Lọc theo 1 tiêu chí
e Lọc theo nhiều tiêu chí
f Lọc theo 1 tiêu chí (nâng cao)
g Lọc theo nhiều tiêu chí (nâng cao)
h Copy dữ liệu lọc sang một sheet khác
i Tách ngày tháng
Trang 6j Tách địa chỉ
5
Trang 7k Tách họ tên
l Flash fill
m Xóa dữ liệu bị trùng
Trang 8n Thống kê mô tả
o Tách họ và tên bằng 2 cách
p Lập danh sách các chức vụ của mỗi bộ phận
7
Trang 91.2.SVp xếp dữ liê Wu trong Excel và lọc dữ liê Wu
Trang 10a Sắp xếp dữ liệu theo họ tên
b Lọc nhân viên bộ phận kho
c Lọc nhân viên có mức lương từ 8 đến 10 triệu
d Lọc nhân viên chưa có thông tin CMND
e Lọc nhân viên cần xác minh lại hộ khẩu
f Lọc nhân viên bộ phận kho + hộ khẩu Hà Nội1.3.Tự đô Wng điền thông tin v\ng trống
9
Trang 111.4.Copy paste trong Excel
a Transpose(xoay bảng) và toán tử cộng dữ liệu
b Copy Paste từ nguồn khác (website)
Trang 12c Copy ô F7 sang ô C7 giữ nguyên giá trị và màu sắc
1.5.Dán dữ liê Wu vào 1 v\ng đã được lọc
1.6.Data Validation
a Dạng danh sách
b Dạng điều kiện, thông báo nhập
11
Trang 13c Danh sách nâng cao
d Find and Select
1.7.Định dạng có điều kiện trong Excel
a Định dạng top %, - định dạng tiến độ
Trang 14b Tổng hợp doanh thu của các sản phẩm tại mỗi tỉnh của mỗi quốc gia theo năm
c Tổng hợp tổng mỗi sản phẩm đã bán tại mỗi nước lọc theo trạng thái đơn hàng
d Tổng hợp số lượng đơn hàng khách hàng đã đặt theo từng năm lọc theo trạng thái đơn hàng
21
Trang 15e Tổng hợp tỷ lệ sản phẩm bán ra theo các năm
3 Bài thực hành tuần 3
3.1.Xây dựng Dashboard trên Excel
a Dim & Fact
b Dashboard
3.2.Xây dựng Dashboard trên dữ liệu
a Yêu cầu phân tích
Trang 17d Dashboard
e Phân tích DashboardTheo thời gian:
- Các sản phẩm: Vintage Cars, Classic Cars, MotorCycles có doanh thu tăngvào các tháng 10-11.
- Plans được mua nhiều vào các tháng 4-5, 9-10, dịp có nhiều ngày lễ.- Trains và Trucks & Buses có doanh thu đều theo các tháng từng năm
nhưng đang có dấu hiệu giảm => Có xu hướng không được ưa chuộng vàothời gian tới.
Theo quốc gia:
- Ở các quốc gia phát triển (USA) có mức doanh thu cao vượt trội so với cácquốc gia đang phát triển.
- Doanh thu ở USA là cao nhất, thị trường có nhiều người giàu có so với cácquốc gia khác.
Trang 184 Bài thực hành tuần 44.1.Power Query
a Extract DataExtract từ Excel
Extract từ folder
25
Trang 19Extract từ google sheets
b TransformMerge Query
Append Query
Trang 20Group byUnpivot Table
Transpose and pivot
27
Trang 21c Load Data
Trang 22Load data bằng power query
Dim & Fact
29
Trang 23Data Model (hình sao)
d Add Column
Trang 24Add index column
Add duplicate column
31
Trang 25Add conditional column
Add custom column
Trang 26Add index subgroup
e Extract dữ liệu từ MySQL
33
Trang 284.2.Xây dựng các mô hình cho đơn vị Đại học Bách Khoa Hà Nội
a Business flow
b Data flow
35
Trang 295 Bài thực hành tuần 55.1.Power query & Dash
a Yêu cầu phân tíchPhân tích doanh thu:
Trang 30c Dim & Fact
d Tạo Dashboard
e Phân tích Dashboard
Doanh thu theo khách hàng:
- Khách hàng C262, C219, C733, C660 là 4 khách hàng đem lại nhiều doanhthu nhất.
Doanh thu theo sản phẩm và theo nhân viên:
37
Trang 31- Mặt hàng xe đạp có doanh thu gấp rưỡi tổng doanh thu các mặt hàng => nhu cầu đi xe đạp rất cao
- Nhân viên Lan Anh đem lại nhiều doanh thu cho cửa hàng nhất, các nhânviên khác có năng lực khá đồng đều.
Doanh thu theo thời gian:- Doanh thu năm 2020 là cao nhất
- Doanh thu cao trong khoảng từ quý 4 đến quý 1 năm sau do mọi ngườithường mua sắm nhiều trong dịp này để chuẩn bị cho giáng sinh, tết,…
Doanh thu theo khu vực:
- Các thành phố lớn như Hà Nội, Đà Nẵng, Hồ Chí Minh,… có doanhthu cao vì tập trung nhiều dân cư và có mức sống, thu nhập ở mức cao.- Ở các thành phố nhỏ đặc biệt ở miền núi cao thì doanh thu không đượccao do mật độ dân cư thưa thớt, thu nhập thấp, nhu cầu sử dụng các sảnphẩm giá trị không cao.
Phí ship trung bình theo hình thức vận chuyển và đóng gói:
- Phí ship trung bình khi chuyển bằng máy bay là rẻ nhất và bằng xe tảilà đắt nhất.
- Phí ship trung bình cao ở các mặt hàng đóng gói lớn, hộp to vì chúngkhá là cồng kềnh và chiếm diện tích.
Phí ship trung bình theo khu vực:
- Phí ship trung bình ở các thành phố lớn nhìn chung là cao hơn các khuvực khác do chịu nhiều chi phí phát sinh khi đi lại trên đường.Thời gian giao hàng trung bình theo mức độ ưu tiên và loại hình vậnchuyển:
- Nhìn chung máy bay là loại hình vận chuyển nhanh nhất và máy bay cótốc độ di chuyển nhanh nhất.
- Tàu hỏa chậm nhất.
- Các mặt hàng quan trọng thường được vận chuyển nhanh hơn các mặthàng còn lại.
- Thời gian vận chuyển tỉ lệ nghịch với mức độ ưu tiên của sản phẩm.
5.2.Xây dựng Dashboard trên Google Data Studio
Trang 32a Tạo kết nối google sheet
39
Trang 33b Tạo bảng
Trang 34c Tạo bảng có bản đồ nhiệt
d Tạo bộ lọc
41
Trang 35e Tạo bộ lọc cho 1 bảng
f Tạo bản đồ
Trang 36c Video 6.3
d Video 6.4
63
Trang 378 Bài thực hành tuần 8
a Truy vấn thông tin khách hàng phàn nàn
b Truy vấn ra thông tin đơn hàng
c Truy vấn nhân viên đã chăm sóc khách hàng của đơn hàng này
d Truy vấn thông tin sản phẩm bị phàn nàn
Trang 38e Kiểm tra kho hàng còn sản phẩm đó không?
f Đưa ra những dòng sản phẩm có cùng mức giá, chênh lệch giá nhỏ để tư vấn (Nhỏ hơn 5 đô)
g Đưa ra những dòng xe có cùng một số đặc điểm với xe trước
65
Trang 39h Truy vấn sản phẩm mới mà khách hàng yêu cầu theo đặc điểm
i Tìm 1 nhân viên đã có kinh nghiệm để tư vấn cho khách hàng
j Hiển thị những khách hàng đã mua sản phẩm này để tiến hành khảo sát chất lượng
Trang 40k Hiển thị top 5 khách hàng có tổng giá trị đơn hàng lớn nhất
l Hiển thị top 5 sản phẩm có tỷ lệ doanh số cao nhất
m Kiểm tra giao vận đã đúng thời gian yêu cầu chưa, hiển thị đơn hàng giao trễ
67
Trang 41n Đưa các các sản phẩm không có mặt trong bất kỳ một đơn hàng nào
o Đưa ra các sản phẩm có số lượng trong kho lớn hơn trung bình số lượng trong kho củacác sản phẩm cùng loại
p Thống kê tổng số lượng sản phẩm trong kho theo từng dòng sản phẩm của từng nhà cung ứng
Trang 42q Thống kê ra mỗi sản phẩm được đặt hàng lần cuối vào thời gian nào và khách hàng đãđặt hàng
9 Bài thực hành tuần 9
a Tạo cơ sở dữ liệu và tạo bảng Dim, bảng Fact
69
Trang 4471
Trang 45b Đổ dữ liệu
Trang 4673
Trang 47c Data Model Logic
Trang 48d Data Model Vật Lý
10.Bài thực hành tuần 10
10.1.Phân tích 7 câu truy vấn trong OLTP
75
Trang 49a Thống kê doanh số của các nhân viên theo phòng ban
b Thống kê doanh số theo các office
Trang 50c Thống kê doanh số theo nội địa tại các office
d Thống kê mức độ chênh lệch giá bán và giá niêm yết trung bình theo từng sản phẩm
77
Trang 51e Thống kê khách hàng tại quốc gia nào nhận được nhiều ưu đãi mua hàng nhất (giá bán rẻ hơn giá niêm yết)
Trang 52f Thống kế số lượng hàng tồn và mức chênh lệch giá bán trung bình theo sản phẩm
g Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực (cụ thể là ở USA)
10.2.Phân tích 8 câu truy vấn trong OLAP
79
Trang 53a Thống kê top 5 sản phẩm mang lại doanh số lớn nhất
b Thống kê doanh số của các nhân viên theo phòng ban
Trang 54c Thống kê doanh số theo các office
d Thống kê doanh số theo dòng sản phẩm
81
Trang 55e Thống kê doanh số theo dòng sản phẩm theo thời gian
f Thống kê tổng số lượng hàng trong kho theo từng sản phẩm
Trang 56g Thống kê top những khách hàng đã thanh toán nhiều nhất
h Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực (cụ thể là USA)
83
Trang 5711.Bài thực hành tuần 11
a Extract dữ liệu từ MySQL sang Excel
b Tạo mối quan hệ giữa các bảng trong Excel
Trang 58c Thống kê doanh số của các nhân viên theo phòng ban (cụ thể là phòng ban có officeCode =4)
d Thống kê doanh số theo các office (theo từng dòng sản phẩm)
e Thống kê doanh số theo nội địa tại các office
85
Trang 59f Thống kê top 5 những sản phẩm được khách hàng mua nhiều nhất theo khu vực
Trang 60- Phòng ban số 4 đạt mức doanh số cao vượt trội so với các phòng ban khác(959 sản phẩm được bán ra) Phòng ban số 4 chiếm 32.01% tổng số lượngdoanh thu của tất cả các phòng ban.
- Phòng ban số 5 đạt mức doanh thu thấp nhất Theo thời gian:
- Số lượng doanh thu tăng dần, dẫn đến sự gia tăng 230.77% giữa tháng 1 năm2003 và tháng 5 năm 2005.
- Tuy nhiên, số lượng doanh thu bắt đầu giảm vào tháng 7 năm 2004, giảm đi20.59% trong 9 tháng.
- Trong giai đoạn tăng dốc mạnh nhất từ tháng 7 năm 2003 đến tháng 12 năm2003, số lượng doanh thu đã tăng từ 63 lên 83.
Theo nhân viên:
- Nhân viên Gerard Hernandez bán được nhiều đơn hàng nhất (396) Nhiều hơnnhân viên Leslie Thompson và nhân viên Martin Gerard – nhân viên bán đượcít đơn nhất 282 đơn.
- Dùng Slicer để lọc theo dòng sản phẩm, ta thấy rằng sản phẩm mà nhân viênGerard Hernandez bán được đa phần là Classic Cars (138).
b Phân tích chất lượng đơn hàng
Theo trạng thái:
- Nhìn chung, các đơn hàng đều đã được giao thành công (2771 đơn hàng) Chỉcó một phần nhỏ (79 đơn hàng) bị hủy
87
Trang 61- Sử dụng Slicer lọc theo trạng thái hủy hàng, có thể thấy phần lớn số lượng hủyhàng sẽ rơi vào các loại mặt hàng Ships (25.09%), Classic Cars (25.02%),Planes (22.78%).
Theo thời gian:
- Sự bất thường về số lượng khách hàng nhất là vào tháng 10 năm 2003, khi vậnchuyển có mức cao nhất là 529.
- Số lượng khách hàng cho Resolved bắt đầu có xu hướng tăng vào tháng 10năm 2003, tăng 287,50% (23) trong 5 quý.
- Classic Cars chiếm 39,48% trên tổng số lượng trong kho.
- Trên tất cả 7 dòng sản phẩm, Tổng số lượng trong kho dao động từ 16696 đến219183.
Trang 62Phần II: Kết quả thu được, đánh giá và góp ý cho môn học1 Kết quả thu được
Dưới đây là một vài kết quả em đã thu được sau khi hoàn thành môn học:Kiến thức cơ bản về Data Warehouse:
Hiểu rõ khái niệm và mục đích của Data Warehouse trong việc tổ chức dữ liệuđể hỗ trợ quyết định kinh doanh.
Nắm vững các khái niệm quan trọng như OLAP (Online AnalyticalProcessing), OLTP (Online Transaction Processing), Star Schema, SnowflakeSchema, Dimension, Fact, v.v.
Biết cách xác định và tối ưu hóa các khóa chính, cơ sở dữ liệu con, và quan hệgiữa các bảng trong một Data Warehouse.
ETL (Extract, Transform, Load):
Nắm vững quy trình ETL và khả năng thực hiện việc trích xuất dữ liệu từ cácnguồn khác nhau như cơ sở dữ liệu, tệp văn bản, và API.
Biết cách thực hiện biến đổi (transform) dữ liệu để làm cho nó phù hợp với môhình dữ liệu của Data Warehouse.
Có khả năng tải dữ liệu đã biến đổi vào Data Warehouse một cách hiệu quả.Mô hình hóa dữ liệu (Data Modeling):
Hiểu cách thiết kế mô hình dữ liệu cho Data Warehouse bằng cách sử dụng cáckỹ thuật như Dimensional Modeling và Entity-Relationship Modeling.Biết cách xác định và xây dựng các thuộc tính, chỉ mục, và các quan hệ giữacác bảng để hỗ trợ truy vấn dữ liệu hiệu quả.
Có khả năng áp dụng các nguyên tắc chuẩn hóa dữ liệu và giải quyết vấn đề dữliệu không nhất quán.
89
Trang 63Nội dung chương trình học: Em rất ấn tượng với nội dung chương trình học của
môn học Từ cơ bản đến chi tiết, mọi khái niệm liên quan đến Data Warehouse vàPower BI đều được giảng viên trình bày một cách tỉ mỉ và dễ hiểu Việc học vềquy trình ETL và cách tạo báo cáo trong Power BI đã giúp em nắm vững toàn diệnquy trình xử lý dữ liệu và biến chúng thành thông tin hữu ích.
Phương pháp giảng dạy: Giảng viên đã thể hiện sự đam mê và chuyên nghiệp
trong việc truyền đạt kiến thức Cách giảng dạy linh hoạt và tạo sự tương tác vớisinh viên đã làm cho bài học trở nên thú vị và gây hứng thú Sự kết hợp giữa lýthuyết và thực hành giúp em hiểu sâu hơn và tăng khả năng ứng dụng kiến thứcvào thực tế.
Ứng dụng thực tiễn: Môn học đã giúp em nhận ra tầm quan trọng và ứng dụng
thực tiễn của Data Warehouse và Power BI trong môi trường doanh nghiệp Em đãhiểu rõ hơn về cách dữ liệu được chuyển đổi thành thông tin quan trọng hỗ trợquyết định kinh doanh.
Phản hồi và hỗ trợ: Em vô cùng cảm kích sự phản hồi tích cực và sự hỗ trợ tận
tình từ giảng viên Thầy đã tạo môi trường học tập thoải mái và đáng tin cậy, giúpem tự tin hơn trong việc đặt câu hỏi và nhận giúp đỡ khi cần thiết.
3 Góp ý cho môn học
Môn học “Kho dữ liệu và kinh doanh thông minh” em được học là khoảng thời gian cuốicủa năm thứ 3 Vì vậy, những gì mà môn học đem lại có những cái có thể bản thân đã biếtnhưng có những cái hoàn toàn mới mẻ Thật may mắn khi người giảng dạy cho chúng emlà thầy Nguyễn Danh Tú Nếu nói về việc chỉnh chu và truyền đạt kiến thức, em nhận thấyrằng thầy đã truyền đạt vô cùng đầy đủ Lượng bài tập thầy giao cho chúng em cũng đủ đểchúng em ôn tập và thực hành
Nhưng em xin phép có một vài góp ý nhỏ dành cho môn học như sau:
Môn học nên có thêm nhiều tiết thực hành trên lớp hơn, để chữa về các bài thựchành tuần, để chúng em có thể hiểu rõ hơn về mục đích của bài thực hành đó vàgiải đáp được những khúc mắc của mà vẫn còn gặp phải
Nên nêu rõ kết quả cần đạt được tại mỗi tuần thực hành
Trên đây là một vài góp ý khách quan của em Mặc dù cảm thấy quá trình học tập và sốlượng kiến thức mà thầy truyền đạt đã đủ để chúng em có một cái nhìn nào đó sâu hơn vềmôn học, nhưng nếu được thực hành nhiều hơn nữa, em tin rằng việc ghi nhớ sẽ lâu hơnvà hiệu quả hơn.
Trang 64Tài liệu tham khảo
[1] Nguyễn Danh Tú, Slide bài giảng Kho dữ liệu và kinh doanh thông minh, Đại họcBách khoa Hà Nội.
[2] Kênh Youtube Power BI of Pavan Lalwami - https://www.youtube.com/Power BI FullOnline Training by Pavan Lalwami.
[3] W.H Inmon - Building the Data Warehouse, Wiley , 2005
[4] Alberto Ferrari, Marco Russo - Introducing Microsoft Power BI, 2016
91
Ngày đăng: 14/06/2024, 16:22
Xem thêm:
Tài liệu cùng người dùng
Tài liệu liên quan