Trong bối cảnh đó, nghiên cứu này chú trọng vào việc phân tích dữ liệu bán hàng trong ngành thực phẩm, với mục tiêu chính là hiểu rõ hơn về hành vi mua sắm của khách hàng và xác định các
Trang 1NGUYEN TAT THANH
TIỂU LUẬN MÔN HỌC CHUYEN DE CHUYEN SAU KHOA HOC DU LIEU 2
DOANH SO THUC PHAM: PHAN TICH VA PHAT TRIEN
CHIẾN LƯỢC
Giang vién giang day: ThS Su Nhat Ha
Sinh viên thực hiện: Nguyễn Thành Tan
Chuyên ngành : KHOA HỌC DỮ LIỆU
Tp.HCM, ngay 16 thang 05 Nam 2024
Trang 2NGUYEN TAT THANH
TIỂU LUẬN MÔN HỌC DEEP LEARNING TRONG KHOA HỌC DỮ LIỆU
DOANH SO THUC PHAM: PHAN TICH VA PHAT TRIEN
CHIẾN LƯỢC
Giang vién giang day: ThS Su Nhat Ha
Sinh viên thực hiện: Nguyễn Thành Tan
Chuyên ngành : KHOA HỌC DỮ LIỆU
Tp.HCM, ngay 16 thang 05 Nam 2024
Trang 3Ho va tén: Nguyén Thanh Tan MSSV: 2100005442
Chuyén nganh: KHOA HOC DU LIEU Lớp: 2IDTH2D
Email: 2100005442@nttu.edu.vn SDT: 0332947806
Tên đề tài: Doanh Số Thực Phẩm Phân Tích và Phát Triển Chiến Lược
Giảng viên giảng dạy: ThS Sử Nhật Hạ
Thời gian thực hiện: 21/02/2024 đến 15/05/2024
Nhiệm vụ/nội dung (mô tả chỉ tiết nội dung, yêu cầu, phương pháp ):
Nội dung và yêu cầu đã được thông qua bộ môn
TP.HCM, ngay 16 tháng 05 năm 2024
(Ký và ghi rõ họ tên) (Ký và ghi ro ho ten)
Trang 4
LOI MO DAU
Trong thé giới kinh doanh ngày nay, sự cạnh tranh khốc liệt đặt ra một thách thức không
ngừng đối với các doanh nghiệp trong ngành thực phẩm Đề tồn tại và phát triển, các doanh nghiệp cần phải hiểu rõ hơn về nhu cầu và hành vi của khách hàng, đồng thời phải
điều chính và tối ưu hóa chiến lược kinh đoanh của mình một cách linh hoạt và hiệu quả
Trong bối cảnh đó, nghiên cứu này chú trọng vào việc phân tích dữ liệu bán hàng trong ngành thực phẩm, với mục tiêu chính là hiểu rõ hơn về hành vi mua sắm của khách hàng
và xác định các cơ hội và thách thức trong việc tôi ưu hóa doanh số bán hàng
Chúng em sẽ tiễn hành phân tích chi tiết đữ liệu foodsales, một bộ dữ liệu cung cấp thông
tin về các sản phẩm, khu vực, ngày giao địch và các yếu tô khác liên quan đến hoạt động bán hàng Từ đó, chủng em hy vọng sẽ đưa ra các phân tích sâu sắc và đề xuất các chiến lược kinh doanh cụ thê để giúp các doanh nghiệp trong ngành thực phẩm tối ưu hóa hiệu
Trang 5Một lần nữa, em xin chân thành cảm ơn thầy Ths Sử Nhật Hạ- người đã trực tiếp giúp
đỡ, quan tâm, hướng dẫn em hoàn thành tốt sản phâm và bài báo cáo này trong thời gian qua
Bài báo cáo của em còn hạn chế và còn nhiều bỡ ngỡ nên không tránh khỏi những thiếu sot, em rất mong nhận được những ý kiến đóng góp quý báu của quý Thầy đề kiến thức của em trong lĩnh vực này được hoàn thiện hơn đồng thời có điều kiện bỗ sung, nâng cao
ý thức và trình độ của mình của mình
Em xin chân thành cảm ơn các quý thầy cô rất nhiều!
Sinh viên thực hiện
Trang 6BM-ChT-
TRUONG DAI HOC NGUYEN TAT THANH
TRUNG TÂM KHẢO THÍ
KỶ THỊ KÉT THÚC HỌC PHÁN HỌC KỲ I NĂM HỌC 2022 - 2023
PHIEU CHAM THI TIEU LUAN/DO AN
M6n thi: Deep learning trong khoa học đữ liệu Lớp học phân:
Nhóm sinh viên thực hiện:
1 Phạm Văn Tài
2 Nguyễn Thành Tân
Ngày thi: 16/05/2024
Đề tài tiểu luận/báo cáo của sinh viên: DOANH SỐ THỰC PHẨM: PHÂN TÍCH VÀ PHÁT
TRIEN CHIEN LƯỢC
Phân đánh giá của giảng viên (căn cứ trên thang rubrics của môn học):
Giang vién cham thi
Trang 7Giảng viên giảng dạy
(Ký tên và ghi rõ họ tên)
Trang 8MỤC LỤC
CHƯƠNG I: GIỚI THIỆU - 22s ÉEE2212112712127111211121 1121k 1
1 Giới thiệu đề tài 5 - s2 2 12112112 11121122121121110212222121 1211 1
1.2 Ly do chon 46 tab ccccccccceccccccccscsccseesessesscsvssesscsesssevssesesevssvsesevsvssesvavevsresevecsevecevees 1
1.3 Mục tiêu đề tab cecccccccccsssessessecsessessessessesscssessessessussessnesissseecaressssesssvareeteeeen 2
1.4 Pham vi nghién COU ố 4 2
CHƯƠNG 2: CƠ SỞ LÝ THUYÉT VÀ CÔNG NGHỆ, 2 2s E21 22kg 3
2.1 Power BI: Tổng quan 5c s21 11 1121111 11 1110122111121 11tr tre 3
2.2 Giới thiệu về biểu đỒ - + s22 5212112122112111212122221121 2121 ng 12
2.3 Công nghệ và các công cụ liên quan c2 22211222112 12 11112111102 211kg 18
CHƯƠNG 3: THỰC NGHIEM VA PHAN TICH 0 ecccsccsccesscessessesssessesssessesssessesssesseseees 21
3.1 Xử lý dữ liệu và chuẩn bị - - S1 E111 H11 21 1 re 23
3.2 Xây dựng bảng điều khiển và báo cáo - TH HH trường 25
3.3 Kết luận 52 c2 2n H222 2121212112121 rrrrra 34
3.3 Đánh giá hạn chế và hướng phát triển tương lai s5 SE xin 35 TÀI LIỆU THAM KHẢO - - 552 222222212221122111211211121122121121112112121 6 36
Trang 9DANH MỤC HÌNH
Hình I: Truy cập báo cáo va dashboar của Power BÌ c2 H cv nhe 5 Hình 2: Giao điện (phần 1) của Power BÌ s5 s22 2122212211212 eE tre 8 Hinh 3: Giao dién (phan 2) cla Power Bli ccccccccccssesssssessesessesssesesssessessessessessvssesssvesstases 9 Hinh 4: Giao dién (phan 3) cia Power Bli ccccccccccscsssessesssssessesssesesssessesessesessessseeneneees 10 Hinh 5: Giao dién (phan 3) cia Power Bli ccccccccccccssssssesssssessessesesssesseseessessessesseseensneees ll
Hinh 6: Biéu 46 cot (Column Chatt) 0 c.ccccccccccscssessesscsessesseseesessessvsssessvsessesevsesssevsvseeeees 13 Hinh 7: Biéu d6 dung (Line Chart) 0.cccccccccccscescsscsscscsscssessssssvssesesevsseseceessvsececevsvseeenes 14 Hinh 8: Biéu d6 két hop (Combo Chatt) c.ccccccccscscsssssvssessessssessvsessesessesesevseesesevsveeeees 15 Hình 9: Biêu đồ điểm (Scatter Chart) 5 5c E11 1121111211 211111 012112111 trau 17
Hình 10: Biểu đồ dạng cây (Treemap) - St 1E E1 E122 1121212 HH rêu 18 Hinh 08009 ì007.901ì 0(raiaaiaaii.4ẢỀẼŸẢÝÝỶẼỶÝÝỶ 19
Hình I2: Công cụ Tabular - 2 2 2221212111211 121 1112111211111 1121110111811 1811111811 20 Hình 13: Thêm dữ liệu vào Power BÌ - TH n SE S gu nh syyy 21 Hinh 14: Phan tích và làm sạch đữ liệu ccc ccccceeceeeeecenntccacccceccevsveesenttttteeeesns 22
Hình 15: Dữ liệu có trong EXxcelL - - c1 2112111211112 1151 1115115111 11211512 1tr es 24
Hình 16: Công thức tính cột '“TotalPrice” - c c1 t2 11121112211 2111811511181 11 He 25
Hình L7: Báo cáo “Doanh thu bán hàng” 0 1 221221111211 12 1121115711811 1811112811 25
Hình 18: Biểu đồ Slicer 22c 2221 2211122211122211121111121111211112.112211 1e rde 26
Hình 19: Biểu đồ Slicer () c- S21 E1 E112 111111 22111 121 tt tre 26 Hình 20: Biểu đồ Slicer (2) s S21 E1 111011211111 22111 12111121 gey 27 Hình 21: Biểu đồ đường - ST nEH Tx H1 11 2H ngưng 28
Hình 22: Biểu đồ Stacked bar chat 222 22 222111221112221112111210112112 21.0 29
Hình 23: Biểu đồ Stacked bar chart( ) - 5 SE 1112112111211 2111 1E trrreerrre 29 Hình 24: Biêu đồ Stacker bar chart (2) - 5S 11111211211 211 121 1E TH HH ng nu 30
Hình 25: Biểu đồ tròn 6:22 221112211 122110.21111211112111121212112112112 1e 31
Hình 26: Biều đồ tròn ((1) -c- c1 S12 1211111212111 1211 12111 ng gang 32 Hình 27: Biểu đồ tròn (2) - s2 x2 211 222 11 12111 121 ng gan 33 Hình 28: Biểu đồ dạng bảng (S1 ST T HE1 HH HH HH 1 HH nh nêu 34
Trang 10ki HIEU CAC CUM TU VIET TAT
Trang 11
CHUONG T1: GIỚI THIỆU
1 Giới thiệu đề tài
Ngành công nghiệp thực phẩm là một trong những ngành kinh doanh quan trọng nhất trên toàn cầu, đóng góp vào nhu câu cơ bản của con người và có ảnh hưởng sâu rộng đến sức khỏe và chất lượng cuộc sống Của mọi người Trong bối cảnh môi trường kinh doanh ngày càng cạnh tranh và biến đôi nhanh chóng, việc hiểu rõ và phân tích dữ liệu bán hàng trong ngành thực phẩm trở nên cực kỳ quan trọng đề các doanh nghiệp có thê tối ưu hóa
chiến lược kinh doanh và đạt được sự thành công bền vững
Đề tài "Doanh Số Thực Phẩm: Phân Tích và Phát Triển Chiến Lược” tập trung vào việc
nghiên cứu và phân tích đữ liệu bán hàng trong ngành thực phẩm, với mục tiêu chính là
hiểu rõ hơn về hành vi mua sắm của khách hàng và xác định các cơ hội và thách thức
trong việc tối ưu hóa doanh số bán hàng Chúng tôi sẽ tiến hành phân tích chỉ tiết dữ liệu
foodsales, một bộ dữ liệu cung cấp thông tin về các sản phẩm, khu vực, ngày giao dịch và các yêu tô khác liên quan đến hoạt động bán hàng Từ đó, chúng tôi hy vọng sẽ đưa ra các phân tích sâu sắc và đề xuất các chiến lược kinh doanh cụ thê để giúp các doanh nghiệp trong ngành thực phẩm tôi ưu hóa hiệu suất kinh doanh của mình và đạt được sự thành công bền vững
Đồ án này không chỉ là cơ hội để nghiên cứu và áp dụng kiến thức về phân tích đữ liệu vào thực tÊ, mà còn là một cơ hội đê đóng góp vào sự phát triên của ngành thực phâm và làm phong phú hơn các chiến lược kinh doanh trong tương lai
e© Thách Thức về Quản Lý Dữ Liệu: Ngành công nghiệp thực phẩm thường xuyên phải đối mặt với lượng đữ liệu lớn từ các giao địch bán hàng Quản lý và phân tích
đữ liệu một cách hiệu quả là một thách thức đối với các doanh nghiệp trong ngành
này
e©_ Tiêm Năng Tối Ưu Hóa Doanh Số: Phân tích đữ liệu bán hàng thực phâm có thê
giúp các doanh nghiệp xác định những cơ hội tối ưu hóa doanh số bán hàng, từ
Trang 12việc tôi ưu hóa cung câp sản phâm đền việc xác định các chiên lược giá cả và tiếp
thị hiệu quả
1.3 Mục tiêu đề tài
Mục tiêu của đồ án bao gôm:
¢ Phân Tích Xu Hướng: Hiểu rõ hơn về các xu hướng và mẫu số trong doanh số bán hàng thực phẩm theo thời gian, khu VỰC, loại sản phẩm và các yêu tô khác
se Tối Ưu Hóa Doanh Số: Xác định các yếu tố ảnh hưởng, đến doanh số bán hàng và
đề xuất các chiến lược tối ưu hóa đề tăng cường hiệu suất kinh doanh
® Trinh Bay Thong Tin: Tao ra các báo cáo và biểu đồ trực quan bằng Power BI dé
trình bày thông tin một cach dé hiéu va hap dan
1.4 Phạm vi nghiên cứu
Pham vi của đồ án bao gôm:
© Nguồn Dữ Liệu: Sử dụng bảng dữ liệu "foodsale" chứa thông tin về giao dịch bán hàng thực phẩm
® Phương Pháp Nghiên Cứu: Sử dụng công cụ Power BI đề phân tích và trực quan hóa đữ liệu từ bảng "foodsale", bao gồm các biều đồ, bảng điều khiển và báo cáo
Trang 13CHUONG 2: CO SO LY THUYET VA CONG NGHE
2.1 Power BI: Tổng quan
2.1.1 Khái niệm
Power BI viết tắt của Power Business Intelligence là bộ công cụ phân tích thông mình của Microsoft Là một công cụ trực quan hoa dữ liệu và là giải pháp phân tích kimh doanh, giúp chuyên đổi đữ liệu từ các nguồn khác nhau thành bảng điều khiển (Dashboard) và báo cáo BI (Power BI Report) Power BI sé giup bạn đưa ra những phân tích dir liệu vara quyết định nhạn chóng thuận lợi dé dang bằng cách cho phép người dùng kết nối với nhiều nguồn đữ liệu khác nhau, từ các tệp Excel đơn giản đến cơ sở dữ liệu phức tạp như
SQL Server, va tạo ra các báo cáo và biểu đồ trực quan đề hiểu rõ hơn về dữ liệu của họ
Power BI gồm 3 ứng dụng:
® Power BI Desktop: dùng để đưa dữ liệu vào và làm báo cáo
© Power BI Service: dé chia sé dir liéu cho nhiéu người
© Power BI App: dùng đề xem các báo cáo trên di động
Va 6 day ching ta chit yéu la ste dung Power BI Desktop
Ngoài ra, Power BI giúp bạn kết nối và tập hợp đữ liệu từ nhiều hệ thống phần mềm cũng như đữ liệu riêng lẻ trên các files Excel, files text và các dạng dữ liệu khác, sau đó biến
đỡ liệu này thành thông tim hữu ích cho doanh nghiệp của bạn thông qua VIỆc frực quan hoá dữ liệu giúp các nhà quản lý đưa ra được những quyết định dựa trên sô liệu, giám bớt
sự cảm tính, tập trung vào những yếu tô dẫn tới thành công của tô chức
2.1.2 Tại sao phải dùng Power BI
Trang 14Power BI là một công cụ mạnh mẽ giup đưa ra quyết định nhanh chóng trong công việc phân tích đữ liệu Với khả năng kết nói, mô hình hóa và khám phá đữ liệu một cách trực quan thông qua các báo cáo, Power BI cho phép bạn tạo ra những hình ảnh tương tác đẹp mắt, dễ hiểu va dé chia sé
Một trong những điểm mạnh của Power BI là tích hợp với các công cụ khác như
Microsoft Excel, giúp bạn có thể tận dụng các giải pháp hiện có một cách linh hoạt và hiệu quả Bạn có thể nhanh chóng kết nối và làm việc với dữ liệu từ nhiều nguồn khác
nhau mà không gặp khó khăn
Power BI cung cấp một quy trình khởi tạo để đàng, cho phép bạn kết nói với đữ liệu từ bất kỳ nguồn nảo và khám phá thông tin bằng các hình ảnh tương tác đẹp mắt Bạn cũng
có thể xuất ban bao cao va bang điều khiên, cộng tác với đồng nghiệp và chia sẻ kiến thức bên trong và bên ngoài tô chức của mình một cách để dàng
Với khả năng truy cập thông tin ở bất cứ đâu, bạn có thể đễ đàng xem đữ liệu trên cả máy tính và điện thoại thong minh da cai đặt ứng dụng Power BI Mobile, giúp bạn tiếp tục làm việc một cách linh hoạt và hiệu quả ngay cả khi bạn đang di chuyển
2.1.3 Ứng dụng thực tế về phân tích kinh doanh với Power BI
Power BI hé tro Dy an Đối mới Công dân thúc đây sứ mệnh hỗ trợ các thành phố trên khắp thế giới hoạt động tốt hơn với dữ liệu và biến sự minh bạch trở thành một phần của quản trị hàng ngày Nó hỗ trợ Dự án Đôi mới Công dân dạy cho các nhà lãnh đạo cách công nghệ dân sự có thể tích hợp quy trình ra quyết định dựa trên dữ liệu vào công việc hàng ngày tác động đến công dân và thu hút họ tìm hiểu về cộng đồng của họ
> Tương tác true quan, dé dang tích hợp với các phần mềm tin học khác
Power BI mang lại giá trị lớn nhờ khá năng trực quan hoàn hảo va Dashboard điều khiển tương tác đem lại cái nhìn toàn cảnh Mở hiệu suất của doanh nghiệp Nhằm hỗ trợ các chuyên gia phân tích, Power BI cưng cấp Dashboard miễn phí đề điều hướng “kéo và thả”
dữ liệu theo mong muốn, cùng kho thư viện trực quan không lỗ cho phép tạo những báo cáo lớn một cách đơn giản và trích xuất cực nhanh
Power BI có thê cùng lúc trích xuất dữ liệu từ hàng chục file Excel và rất nhiều phan mém
Trang 15Nếu muốn sở hữu những bản báo cáo đẹp mắt, sinh động, bạn hoàn toàn có thê tin tưởng Power BI Nam trong d}ng san phẩm doanh nghiệp của hãng Microsoft, Power BI tích hợp chặt chẽ với các sản phẩm lưu trữ thông tin phổ biển khác của MicrosoÑ như Microsoft Excel, Azure và SQL Server cùng các giải pháp quản lý của Microsoft gồm Microsoft Flow (quản lý quy trình) và Microsoft Dynamics (giải pháp ERP)
> Truy cập không giới hạn vào đữ liệu cục bộ và dữ liệu đảm mây
Power BI có thể thực hiện data mashup, kết hợp đữ liệu từ nhiều nguồn khác nhau và phântích dữ liệu bán cấu trúc (semi-structured data) Nó giúp người dùng tập trung lưu trữ tat cả thông tin cục bộ và dữ liệu đám mây, nhờ đó, người dùng có thẻ truy cập liên mạch mọi lúc, mọi nơi, không bị giới hạn không gian và thời gian làm việc Bạn cũng có thể sử
dụng các liên kết đã được xây dựng trước dé cai thiện khâu nhập liệu từ các giải pháp như
Marketo, Salesforce, Google Analytics Power BI cé thể kết nối được với mọi loại hình kho lưu trữ đữ liệu tại chỗ khác nhau như SQL Server, Oracle hoặc Hadoop Đối với kho lưu trữ điện toán đám mây như Google BigQuery hay Azure, Power BI có sẵn các trình kết nối được nhà phát triển xây dựng trướcnhằm tạo nên trải nghiệm đa nhiệm nhất
> Powcr BI cho phép truy cập bao cáo và dashboards ngay lập tức
Power BI cho phép bạn chia sẻ thông tin đữ liệu và báo cáo với người khác, không bị phụ thuộc vào điều kiện địa lí, thời gian hay thiết bị Hệ thống này cũng có tính linh hoạt vì nó hoạt động với các hệ điều hành hàng đầu — Windows, iOS và Android Khi những người
có quyên truy cập tiễn hành chỉnh sửa, cập nhật đữ liệu, hệ thống sẽ thông báo ngay đến chủ sở hữu đề nhanh chóng phân tích kịp thời
Hình 1: Truy cập báo cáo và dashboar cua Power BI
Power BI là hệ thống đa nền tảng, đa thiết bị
> Tích hợp không giới hạn với img dụng của bên thứ ba
Các nhà phát triển Microsoft Power BI đảm bảo rằng hệ thống có thê được tích hợp trong
bất kỳ hệ sinh thái phần mềm nào Nhờ đó, Power BI có thê kết nối với rất nhiều phần
mềm và công cụ phô biến của bên thứ ba Hiện tại, Microsoft vẫn liên tục nghiên cứu mở
5
Trang 16rộng khả năng kết nối của hệ thống này, cho phép người dùng nhập thêm nhiều cơ sở đữ
liệu và nguôn đữ liệu
> Chia sẻ an toàn các báo cáo và phân tích dữ liệu
Người dùng có thể xuất các báo cáo trực quan trực tiếp lên mạng Internet và gửi qua cmailcho những người liên quan Dé dam bao an ninh, chúng ta có thê thiết lập giới hạn quyền truy cập vào báo cáo hoặc thiết lập các vùng dữ liệu đặc thù, chỉ cho phép những người nhất định truy cập Ví dụ: các nhân viên bán lẻ của một siêu thị tại Tp Hồ Chí Minh chỉ có thê xem đữ liệu bán hàng tại chỉ nhánh của mình, trong khi Giám đốc kinh doanh có thê xem đữ liệu bán hàng trên toàn quốc
> Khả năng mô hỉnh hóa đữ liệu
Mô hình hóa dữ liệu là một trong những chức năng được sử dụng đề kết nối nhiều nguồn
dữ liệu trong phần mềm Power BI, bằng các mối liên kết nhằm chỉ ra các nguồn đữ liệu
có môi liên hệ với nhau ra sao Nhờ đó, những bản báo cáo giữa các phòng ban sẽ không con roi rac ma mang tinh thong nhất, tông thé
Với chức năng mô hình hóa dữ liệu, bạn có thể tạo các tính toán tùy chỉnh trên những
Dashboard hiện có Kết quả tính toán sẽ được trình bày trực tiếp trong các báo cáo quản trirực quan Tính chất này của Power BI phù hợp với tất cả các lĩnh vực kinh đoanh, trong hoạt động vận hành cũng như quản lý hiệu suất nhân viên, kiêm soát dòng tiền có thê áp dụng để xây dựng mọi mẫu báo cáo quản trị trong tất cả doanh nghiệp, phòng ban
> Thém nguon đữ liệu
Power BI có thể kết nối với hơn 60 giải pháp phổ biến mà ngày nay các công thường sử dụng, ví dụ như Spark, Hadoop, SAP Người dùng không phải mô hình hóa đữ liệu trong
hệ thông nguồn, mà đữ liệu có thê được tích hợp trực tiếp VỚI phan mém Power BI
> Không đòi hỏi phải có kiến thức lập trình
Đối với những ai thường xuyên phải thực hiện nhiệm vụ phân tích theo yêu cau cu thé,
Power BI chính là nền tảng giúp bạn làm công việc hàng ngày một cách đơn giản, dễ dàng, thực hiện phân tích, tính toán nhanh, khả năng hiển thị lớn giup tiết kiệm thời gian Khác với nhiều phần mềm quản trị, bạn không cần thiết phải có kiến thức lập trình để làm việc với công cụ này
Với màn hình trực quan và bộ công cụ đa nhiệm, Power BI không đòi hỏi người dùng phải có kiên thức lập trình đề phân tích đữ liệu
> Tài liệu hướng dẫn sử dụng sẵn có:
Hầu hết ngươ 1# i dùng Việt Nam đã quá quen với giao diện của Microsoft, do đó sẽ nhanh chóng làm quen với Power BI ma không mắt quá nhiều thời gian Dé hỗ trợ người dùng tìm ra giải pháp làm việc tốt nhất, ông lớn công nghệ cung cung cap san rat nhiều bản chỉ dẫn, video, bài viết nhằm tối đa hóa tiềm năng công cụ
Trang 17> Khả năng tìm kiếm thông minh:
Chức năng tìm kiếm thông minh Q&A của Power BI là một trong những tiện ích nồi trội, thường xuyên được nhắc đến nhất Với chức năng này, nguo $1 dung có thê đưa ra những câu hỏi tự nhiên như khi đang * 'search” trên các nền tảng tìm kiếm Google, Edge, Céc Cốc và xem kết quả, biểu đồ liên quan đến truy vấn Tiện ích này cho phép quét cácthông tin an chi trong vai giây, thậm chí có thể chỉ ra được mối tương quan, các trường hợp ngoại lệ hoặc cho thấy xu hướng
Trang 18- Bước 3: Sau khi nhân vào sẽ mở ra cửa sô của Microsoft Store, trên ô tìm kiêm năm ở vị trí giữa phía trên màn hình, nhân vào tìm kiêm Power BI Desktop
- _ Bước 4: Nhân vào đề suất hiện thị ra và tải xuống (nhấn “Try free” sau khi mở) 2.1.5 Giao diện Power BI
Phần 1: Tab làm việc gồm File, Home, View Modeling và Help: chứa đựng tất cả các chức
năng phô biến nhất của chương trình
Hình 2: Giao điện (phần 1) của Power BI
Phan 2: Ctra s6 Fields va Visualizations: Fields chira danh sach cua tat ca cac bang dit liệu đã
load lên dé xây dựng biêu đồ Visualizations: chứa tất cả các kiểu biểu đồ Phần này nằm bên
phải của giao diện Power BÌ
Trang 19Hình 3: Giao điện (phần 2) của Power BI
Phần 3: Lựa chọn giao diện làm việc (Quicklaunch), phan nay nằm bên trái của giao điện
Power BI va gom 3 loại: a
— Report: dùng đề xem và cho xây dựng biêu đồ
Trang 20Hình 4: Giao điện (phần 3) của Power BI
— Data: dùng để xem thông tin chỉ tiết bảng dữ liệu (bao gồm các cột, dòng thông tin)
— Relationships: quản lý quan hệ ràng buộc giữa các bảng
10
Trang 21Phần 4: là vùng nằm chính giữa giao điện Power BỊ, là nơi đề thiết kế các loại biêu đồ
can
Hình 5: Giao điện (phần 3) của Power BI
Trang 222.2 Giới thiệu về biểu đồ
Visualization hiểu một cách đơn giản là hình ảnh hóa dựa trên dữ liệu Khái niệm của visualization rất ngắn gọn nhưng trên thực tế visualization lại là một mảng rất rộng và có thê coi là một lĩnh vực kết hợp của khoa học và nghệ thuật bởi nó vừa lên quan đến đồ họa (sử dụng hình học đề điển tả kết quả), vừa liên quan đến khoa học thống kê (sử dụng con số để nói lên vấn đề) Nhờ có visualization, chúng ta có thể đễ đàng đưa ra các so sánh trực quan, tính toán tý trọng, nhận biết trend, phát hiện outlier, nhận diện đặc điểm phân phối của biến tốt hơn Từ đó hỗ trợ quá trình năm thông tin và đưa ra quyết định tốt hơn Trong các kĩ năng của dafa sclentist thì visualization là một trong những kĩ năng cơ ban va quan trọng nhật Thê nhưng nhiêu data sclentist lại chưa nhận diện được điều nay
và thường xem nhẹ vai trò của visualization Trước đây tôi cũng đã từng mắc sai lầm như vậy Qua kinh nghiệm nhiều năm xây dựng mô hình và phân tích kinh doanh đã giúp tôi nhìn nhận lại vai trò cua visualization Chinh vi thế tôi quyết định tổng hợp bài viết này theo cách bao quát và sơ đăng nhất về visualization trên python như một tài liệu sử dụng khi cần và đồng thời cũng là cách củng cô lại kiến thức
Thế những biểu đồ nào thông dụng thường được sử dụng trong Power BI? Chúng có tác dụng gì? Ứng dụng thực tế ra sao? Chung ta ching tim hiểu trong phần nảy
2.2.1 Biểu đồ cột— Column Chart
Biểu đồ cột là một trong những loại biêu đỗ phô biến nhất trong Power BI Nó phù hợp để
so sánh giá tri của các mục khác nhau hoặc dé thể hiện thay đối dữ liệu theo thời gian Biểu đồ cột thường có trục x là các mục cần so sánh và trục Y là giá trị tương ứng Một sô cải tiến của biêu đồ cột bao gồm cột nhóm, cột tông hợp, và cột đan xen (clustered, stacked, va 100% stacked column charts)
12
Trang 232.2.2 Biểu đồ đường — Line Chart
Biểu đồ đường là công cụ mạnh mẽ đề hiển thị xu hướng của đữ liệu theo thời gian Nó thường được sử dụng đề biểu diễn biến đổi của đữ liệu theo một khoảng thời gian cụ thé,
giúp người xem nhận biết và dự đoán xu hướng tăng/giảm của đữ liệu Biểu đồ đường cũng có thê được kết hợp với biểu đô cột đề so sánh các xu hướng
13