BỘ GIÁO DỤC VÀ ĐÀO TẠOĐẠI HỌC BÁCH KHOA HÀ NỘIBÁO CÁO BÀI TẬP LỚN ĐỀ TÀI: ỨNG DỤNG POWER BI VÀO PHÂN TÍCHCHUỖI THỜI GIAN BÁN HÀNG CHĂM SÓC SỨC KHOẺSinh viên thực hiện : Phạm Ngọc LêMSSV
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC BÁCH KHOA HÀ NỘI
BÁO CÁO BÀI TẬP LỚN
ĐỀ TÀI: ỨNG DỤNG POWER BI VÀO PHÂN TÍCH CHUỖI THỜI GIAN BÁN HÀNG CHĂM SÓC SỨC KHOẺ
Sinh viên thực hiện : Phạm Ngọc Lê
MSSV : 20210250P
Lớp : QTKD2.1-K66
Ngành Quản trị Kinh doanh
Giảng viên hướng dẫn Đào Thành Chung
Bộ môn Phân tích dữ liệu và tri thức kinh doanh
Hà Nội, 06/2024
Trang 2I GIỚI THIỆU VỀ ĐỀ TÀI
Phân tích chuỗi thời gian bán hàng chăm sóc sức khoẻ: Ý tưởng dự án kinh doanh
thông minh này cho phép những người trong lĩnh vực Chăm sóc sức khỏe động vật theo dõi hiệu quả việc bán các sản phẩm dành riêng cho việc điều trị các loài động vật nhỏ Các doanh nghiệp có thể ngay lập tức so sánh doanh số bán sản phẩm ở các thành phố xếp hạng cao nhất và thấp nhất Dự án có thể tạo ra một báo cáo kỹ lưỡng về doanh số bán hàng theo nhóm trị liệu và xu hướng bán hàng trong bất kỳ khoảng thời gian cụ thể nào
Để làm được điều này, em đã lưu trữ dữ liệu về thời gian bán hàng dược phẩm từ website kanggle.com Sau đó dữ liệu này sẽ được làm sạch và mã hoá thành dạng tốt nhất
để huấn luyện các mô hình trí tuệ nhân tạo
Về phần lưu trữ dữ liệu em dùng công cụ Numbers và chuyển đổi dữ liệu qua dạng csv để lưu trữ dữ liệu Sau đó là add dữ liệu vào Power BI để bắt đầu phân tích bảng báo cáo dưới dạng biểu đồ, bản đồ giúp ta hiểu rõ hơn về dữ liệu
Đây là những nội dung chính của đề tài để nghiên cứu về xử lý và ứng dụng dữ liệu liên quan tới chuỗi thời gian bán hàng Hy vọng đề tài sẽ mang lại những kiến thức mới
và hữu dụng cho mọi người
II THỰC HIỆN PHÂN TÍCH DỮ LIỆU BẰNG POWER BI
1 Power BI là gì?
- Power BI là viết tắt của Power Business Intelligence là một công cụ phân tích kinh doanh thông minh của Microsoft
- Power BI gồm 3 ứng dụng:
Power BI Desktop dùng để đưa dữ liệu vào và làm báo cáo Power BI service để chia sẻ dữ liệu cho nhiều người
Power BI Mobile dùng để xem báo cáo trên điện thoại di động
Trang 3Với người dùng cá nhân thì chúng em lựa chọn Power BI Desktop để thực hiện phân tích
- Power BI sẽ giúp chúng ta kết nối, chuyển đổi dữ liệu lớn, truy xuất được nhiều nguồn dữ liệu, định dạng, tự động cập nhật dữ liệu theo dữ liệu nguồn Hỗ trợ phân tích dữ liệu bằng biểu thức phân tích DAX Trực quan hoá dữ liệu cho báo cáo rất tốt chỉ cần kéo thẻo là ra được bảng phân tích chi tiết
2 Phân tích dữ liệu theo bảng trong Power BI
a Làm sạch dữ liệu:
Trang 4- Bảng trên là dữ liệu thô sau khi tải về từ web kanggle.com, ta sẽ giữ lại các dữ liệu về tên mặt hàng và năm, tháng, số giờ trong chu kỳ để add vào công cụ Power
BI và thực hiện phân tích
b Thực hiện phân tích:
- Phân tích chuỗi hàng năm Đầu tiên, chúng ta hãy phân tích dữ liệu hàng năm và
xem chúng ta có thể rút ra những suy luận gì từ dữ liệu này
- Tách năm, tháng, ngày khỏi cột mốc thời gian.
- Từ đó ta tạo được các trường dữ liệu như sau:
- Như biểu đồ ta thấy sản phẩm M01AB bán chạy nhất vào năm 2016 và bán chậm
nhất vào năm 2014
Trang 5- Sản phẩm M01AE bán chạy nhất năm 2016 và chậm nhất năm 2017
Trang 6- Sản phẩm N02BA bán chạy nhất vào năm 2014 và chậm nhất vào năm 2019
- Sản phầm N02BE bán chạy nhất vaò năm 2016 và chậm nhất vào năm 2017
Trang 7- Sản phẩm N05B bán chạy nhất vào năm 2014 và chậm nhất vào năm 2017
Trang 8- Sản phẩm N05C bán chạy nhất vào năm 2014 và chậm nhất vào năm 2017
- Sản phẩm R03 bán chạy nhất vào năm 2018 và chậm nhất vào năm 2014
- Sản phẩm R06 bán chạy nhất vào năm 2019 và chậm nhất vào năm 2014
Trang 9- Phân tích biểu đồ doanh thu hàng năm ở trên, chúng ta có thể kết luận rằng: Năm
2017 chứng kiên sự giảm sút lớn về doanh số bán hàng
- Theo thống kê ở trên chúng ta thấy, giá trị bán ra tối thiểu của phần lớn các loại thuốc là 0 trong khi thuốc N05B là 1 Đây là lý do vì sao năm 2017 có doanh số bán ra thấp nhất
- Vẽ biểu đồ doanh bố bán hàng của các năm
Trang 12- Kết luận: Từ biểu đồ trên chúng ta có thể suy ra rằng, doanh số bán hàng trong
tháng đầu tiên của năm 2017 là 0 Điều này có nghĩa là chúng ta đã thiếu các giá trị trong tháng đầu tiên
- Vẽ biểu đồ doanh số bán hàng theo năm 2017, năm có doanh số thấp nhât
Trang 14- Kết luận: Từ những biểu đồ này chúng ta có thể nói rằng, dữ liệu không bị thiếu Thay vào
đó doanh số bán thuốc vào ngày 2 tháng 1 năm 2017 thấp hơn là không có đợt bán thuốc nào vào ngày 2 tháng 2
Trang 15TỔNG KẾT
Đề tài nghiên cứu này tập trung vào việc xây dựng hệ thống lưu trữ và xử lý dữ liệu liên quan đến các thông số về mặt hàng tính theo ngày tháng năm
Chúng em đã thu thập được lượng lớn dữ liệu về dữ liệu chuỗi thời gian bán hàng chăm sóc sức khoẻ từ các nguồn tin khác nhau Sau đó, dữ liệu được làm sạch và chuẩn hóa
Để xử lý lượng dữ liệu lớn, chúng em sử dụng Power BI để lưu trữ và truy vấn dữ liệu nhanh chóng, đồng thời là để quan sát và phân tích dữ liệu dưới dạng biểu đồ, bản đồ
Trong tương lai, chúng em sẽ tiếp tục phát triển hệ thống lưu trữ và xử lý dữ liệu lớn hiệu quả hơn, đồng thời theo dõi và cải thiện chất lượng dữ liệu
Nhìn chung, đề tài đã đạt được một số kết quả ban đầu khả quan về việc xây dựng cơ sở dữ liệu lớn liên quan đến dữ liệu bán hàng Chúng em sẽ tiếp tục hoàn thiện và phát triển đề tài này trong thời gian tới
Chúng em cảm ơn thầy và các bạn đã lắng nghe bài phân tích của chúng em