TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘIKHOA TOÁN TINBÁO CÁO THỰC HÀNH GIỮA KỲKHO DỮ LIỆU VÀ KINH DOANH THÔNG MINHGV Hướng dẫn : ThS... Tóm tắtTrong bài báo cáo cá nhân này, kết quả từ các bài th
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
KHOA TOÁN TIN
***
BÁO CÁO THỰC HÀNH GIỮA KỲ
KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH
GV Hướng dẫn : ThS Nguyễn Danh Tú
Sinh viên thực hiện : Dương Văn Khoa
Mã lớp học phần : 142302
Hà Nội, tháng 1 năm 2024
Trang 2Tóm tắt
Trong bài báo cáo cá nhân này, kết quả từ các bài thực hành cá nhân xuyên suốt học phần này sẽđược trình bày theo thứ tự của giảng viên Các nội dung chính bao gồm phân tích thông tin trênExcel, công cụ Power BI, phần mềm MySQL Tiếp đó, trong quá trình thực hành xử lý dữ liệuvới các công cụ trên, tiến trình truy xuất dữ liệu từ nhiều nguồn đã được đề cập và ứng dụngtrong bài thực hành Những bài thực hành liên quan trực tiếp đến các câu hỏi thực tế có thể xảy
ra, liên quan nhiều đến các lĩnh vực kinh tế, giáo dục, Nhờ đó, từ học phần Kho dữ liệu và kinhdoanh thông minh, nhiều kiến thức phân tích dữ liệu quan trọng giúp ích cho sinh viên chuyênngành rất nhiều trong quá trình thực tập và đi làm
Trang 3Lời mở đầu
Ngày nay, các doanh nghiệp muốn tồn tại trong môi trường cạnh tranh khắc nghiệt cần đưa rađược những lựa chọn thông minh và hạn chế thấp nhất rủi ro Phân tích dữ liệu chính là phươngpháp tối ưu mà doanh nghiệp cần để nhìn rõ bản thân, nhìn rõ thị trường và từ đó tìm được lựachọn tối ưu Quá trình làm sạch, xử lý dữ liệu thô, đồng thời trích xuất thông tin theo yêu cầu,trực quan hóa dữ liệu để rồi từ đó phân tích tình hình, đưa ra kế hoạch tương lai Đó chính làcách tiếp cận phân tích dữ liệu, một công việc quan trọng để biến dữ liệu lớn thành thông tin hữuích, giúp nhà quản lý có cái nhìn bao quát, nhanh chóng đưa ra được lựa chọn sáng suốt.Trong học phần Kho dữ liệu và kinh doanh thông minh, cách tiếp cận và thực hành phân tích dữliệu đã được liên kết trường hợp thực tế giúp sinh viên hiểu và thực hành được các bài toán dữliệu của doanh nghiệp
Trang 4Lời cảm ơn
Lời đầu tiên, em xin gửi lời cảm ơn chân thành nhất tới thầy Nguyễn Danh Tú, Viện Toán ứngdụng và Tin học, Trường Đại học Bách khoa Hà Nội Đối với em, điều may mắn của mình làđược thầy trực tiếp giảng dạy trong thời gian học tập lớp Kho dữ liệu và kinh doanh thông minh.Thầy đã tận tình chỉ bảo, hướng dẫn cho lớp chúng em rất nhiều kiến thức cả về cốt lõi của chủ
đề bài báo cáo và cũng như những kiến thức liên quan về môn học
Trong quá trình tìm hiểu cũng có gặp một vài khó khăn về mặt kiến thức, trình bày song em đã
nỗ lực để hoàn thành tốt nhất có thể Đây là bản báo cáo em tổng hợp lại kết quả thực hành cánhân, đồng thời tự đánh giá kết quả bản thân trong học phần này Trong báo cáo không tránhkhỏi những sai sót, em rất mong những sự góp ý của thầy để em rút kinh nghiệm và hoàn thiệnbáo cáo tốt hơn Em chân thành cảm ơn thầy đã hướng dẫn cho em ở bộ môn này!
Hà Nội, Ngày 23 tháng 7 năm 2023Sinh viên thực hiện
Dương Văn Khoa
Trang 5Tóm tắt 2
Lời mở đầu 3
Lời cảm ơn 4
Thực hành 1: ETL dữ liệu trong Excel 8
1.1 Sắp xếp và lọc dữ liệu 8
1.2 Sắp xếp và lọc dữ liệu nâng cao 12
1.3 Tip 14
1.4 Copy - Paste 15
1.5 Copy – Paste nâng cao 17
1.6 Data Validation 18
1.7 Định dạng cơ bản 18
1.8 Định dạng nâng cao 21
Thực hành 2: Pivot - Pivot chart - Làm báo cáo trên dữ liệu bán hàng 23
2.1 Pivot 23
2.2 Pivot chart 27
2.3 Làm báo cáo trên dữ liệu bán hàng 29
Thực hành 3: Xây dựng Dashboard trên Excel 30
3.1 Thực hành theo mẫu 30
3.2 Thực hành xây dựng dashboard trên dữ liệu 31
Thực hành 4: Power Query 33
4.1 Power Query 33
4.1.1 Extract data 33
4.1.2 Transform data 34
4.1.3 Data model 37
4.1.4 Add column 39
4.1.5 Lấy dữ liệu từ SQL 41
4.2 Xây dựng mô hình 41
Trang 6Thực hành 5: Power Query & Dash, Xây dựng Dashboard trên Google Data Studio 44
5.1 Power Query & Dash 44
5.2 Xây dựng Dashboard trên Google Data Studio 45
Thực hành 6: Power BI 48
6.1 Xây dựng Dashboard theo mẫu 48
6.2 Xây dựng Dashboard 3.0 trên dữ liệu bán hàng 49
Thực hành 7: Tìm hiểu các tính năng trên Power BI 51
7.1 Video 1 51
7.2 Video 2 56
7.3 Video 3 58
7.4 Video 4 60
7.5 Video 5 62
Thực hành 8: (Project 1)- Truy vấn dữ liệu trên cơ sở dữ liệu OLTP 63
1,Truyvấnthông tinkhách hàngphànnàn 63
2,Truyvấnra thông tinđơnhàng 63
3,Truy vấn nhânviênđã chăm sóckhách hàng củađơnhàngnày 63
4,Truy vấn thôngtin sảnphẩmbịphànnàn 64
5,Kiểmtrakhohàng cònsảnphẩm đókhông 64
6,Đưaranhữngdòng sảnphẩmcócùngmứcgiá,chênhlệchgiánhỏ.(Nhỏhơn5đô) 64
7,Đưara nhữngdòngxecó cùngmộtsố đặcđiểmvớixetrước 64
8,Truyvấnsảnphẩmmớimàkháchhàngyêucầutheođặcđiểm 65
9,Tìm1nhânviênđãcókinhnghiệmđểtưvấnchokháchhàng 65
10,Hiển thịnhững kháchhàngđãmuasảnphẩmnàyđểtiếnhànhkhảosátchất lượng 66
11,Hiển thị top5kháchhàngcótổnggiá trịđơn hàng lớnnhất 66
12,Hiểnthịtop5sảnphẩm cótỷlệ doanhsốcaonhất 66
13,Kiểm tragiao vậnđã đúngthờigianyêucầuchưa,hiểnthịđơnhàng giao trễ 67
14,Đưacáccácsảnphẩm không cómặt trong bấtkỳ mộtđơnhàngnào 67
15,Đưaracácsảnphẩmcósố lượngtrongkholớnhơntrungbìnhsốlượngtrongkhocủacác sảnphẩmcùngloại 67
16,Thốngkêtổngsố lượngsảnphẩmtrongkhotheodòngsảnphẩmcủatừng nhàcungứng 68
17,Thốngkêramỗisảnphẩm đượcđặthànglầncuốivàothờigiannàovà kháchhàngđã đặt hàng 68
Trang 7Thực hành 9: (Project 2)- Xây dựng cơ sở dữ liệu phân tích OLAP 70
Thực hành 10: (Project 3A)- Truy vấn dữ liệu trên hai CSDL OLTP&OLAP 73
OLTP_1Thốngkêdoanhsốcủacácnhânviên/quảnlý theophòngban(cụthểlàphòngbancó officeCode=4) 73
OLTP_2Thốngkêdoanhsốtheocácoffice 73
OLTP_3Thốngkêdoanhsốtheonộiđịatạicácoffice 74
OLTP_4Thốngkêmứcđộchênhlệchgiábánvà giániêmyết trungbìnhtheotừngsản phẩm 74
OLTP_5 Thốngkêkháchhàngtạiquốcgianàonhận đượcnhiềuưuđãimuahàngnhất(giábán rẻhơngiániêmyết) 75
OLTP_6 Thốngkếlượnghàngtồnvàmứcchênhlệchgiábán trungbình theo sảnphẩm 75
OLTP_7Thốngkêtop5nhữngsảnphẩmđượckháchhàngmua nhiềunhấttheokhuvực(cụthể làởUSA) 75
OLAP_1Thốngkêtop5sảnphẩmmanglạidoanhsốlớnnhất 76
OLAP_2Thốngkêdoanhsốcủacácnhân viên/quản lýtheophòng ban 76
OLAP_3Thốngkêdoanhsốtheocácoffice 77
OLAP_4Thống kêdoanhsố theodòngsản phẩm 77
OLAP_5Thốngkêdoanhsố theodòngsản phẩmtheothờigian 78
OLAP_6Thốngkêtổngsốlượnghàng trongkhotheotừngsảnphẩm 78
OLAP_7Thốngkêtopnhữngkhách hàng đãthanh toánnhiềunhất 79
OLAP_8Thốngkêtop5nhữngsảnphẩmđượckháchhàngmua nhiềunhấttheokhuvực(cụthể làUSA) 79
Thực hành 11: (Project 3B)- Xây dựng dashboard và phân tích dữ liệu từ CSDL OLTP 81
1,Thốngkêdoanh sốcủacácnhânviên/quảnlýtheo phòngban(cụthểlàphòngbancó officeCode=4) 81
2,Thốngkê doanhsốtheocácoffice 81
3,Thốngkê doanhsốtheonộiđịatại cácoffice 82
4,Thốngkêtop5nhữngsảnphẩmđược khách hàngmuanhiềunhấttheokhuvựccụthể 82
Thực hành 12: (Project 3C)- Xây dựng dashboard và phân tích dữ liệu từ CSDL OLTP 84
KẾT QUẢ THU ĐƯỢC, ĐÁNH GIÁ VÀ GÓP Ý CHO MÔN HỌC 85
TÀI LIỆU THAM KHẢO 86
Trang 9Sắp xếp dữ liệu theo nhiều tiêu chí
Lọc dữ liệu là cách giúp chúng ta tìm kiếm và hiển thị các dòng dữ liệu cần thiết mộtcách nhanh hơn
Lọc dữ liệu theo một tiêu chí
Trang 10Lọc dữ liệu theo nhiều tiêu chí
Lọcdữliệunângcao
Lọc theo 1 tiêu chí và nhiều tiêu chí
Trang 11Saochép vàcắt dántrongExcelđể xửlýdữ liệu
Pháthiệndữliệuquacácđịnhdạngcóđiềukiện.Định dạng top, định dạng tiến độ
Trang 12Định dạng lọc trùng
Tạoxácthựcdữliệukhinhậpvào(DataValidation).Kiểm tra hợp lệ dữ liệu
Trang 13Thông báo nhập, thông báo lỗi
Trang 14Tuần 2: Pivot, vẽ đồ thị, làm báo cáoPivottable
Định dạng dữ liệu Pivot
Định dạng dữ liệu Pivot (tiếp)
Trang 15Group theo tháng
Làm mới dữ liệu
Trang 16(cụthểlàở USA).
OLAP_1Thốngkêtop5sảnphẩmmanglạidoanhsốlớnnhất
OLAP_2Thốngkêdoanhsốcủacácnhânviên/quảnlýtheophòngban
Trang 17OLAP_3Thốngkêdoanhsố theo cácoffice.
OLAP_4Thốngkêdoanhsốtheodòngsảnphẩm
Trang 18OLAP_5Thốngkêdoanhsốtheodòngsảnphẩm theothờigian.
OLAP_6Thốngkêtổngsố lượnghàngtrongkhotheotừngsảnphẩm
Trang 19OLAP_7Thốngkêtopnhữngkháchhàngđãthanh toánnhiềunhất.
OLAP_8 Thốngkêtop5nhữngsảnphẩmđượckháchhàngmuanhiềunhấttheokhu vực
Trang 21(cụthểlàUSA).
Trang 22Thực hành 11: (Project 3B)- Xây dựng dashboard và phân tích dữ liệu từ CSDL OLTP
1,Thốngkêdoanhsốcủacácnhânviên/quảnlýtheophòngban(cụthểlàphòngbancóofficeCode=4)
2, Thống kêdoanhsốtheocácoffice
Trang 234,Thốngkêtop5nhữngsảnphẩmđượckháchhàngmuanhiềunhấttheokhuvựccụthể
Trang 24ModelOLTP
Trang 25Thực hành 12: (Project 3C)- Xây dựng dashboard và phân tích dữ liệu từ CSDL OLTP
Dashboard
Phântíchdashboard,vềsảnphẩm,Cóthểthấytỷlệdoanhsốtheosảnphẩmphânhóarõrệt,cầnđẩymạnhvàocácloạisảnphẩmchiếmtỷtrọngcao.Tươngtựvớithờigiantrongquý4năm2003vàquý4năm2004.Trongnămcácquýcódoanhsốthấpthườnglàquý123vàtăngmạnh doanhsốvàoquý4cho thấynhucầumuasắmcácmặthàngphươngtiệngiaothôngthườnglàvào cuối năm.Đối vớiphòngban,xétvớiđường xuhướngtheophòngbancóthểnhậnthấytheoloạisảnphẩmkhácnhauchorasailệchkhácnhau,đâylànền
tảngđểxâydựngkếhoạchmarketing,bánhànghợplý,nhằmnângcaodoanhthuởcác
phòngbanthấpnhưphòng2,3,5
Trang 26KẾT QUẢ THU ĐƯỢC, ĐÁNH GIÁ VÀ GÓP Ý CHO MÔN HỌCKết quả thu được
Một số kiến thức, kỹ năng mà bản thân em có được sau khi thực hành:
Khả năng sử dụng thành thạo Excel cơ bản và thao tác được các chức năng chỉnh sửa, biểudiễn và phân tích dữ liệu
Được làm quen với công cụ PowerBI và Google Data Studio, tự mình tìm hiểu cách thứchoạt động, các khái niệm, các cách cài đặt, tuỳ biến cho các công cụ trực quan hoá dữ liệu.Hiểu được ưu, nhược điểm của từng công cụ, biết khi nào nên dùng công cụ nào phù hợp.Biết thêm các kiến thức về Datawarehouse và Business Intelligence
Sau khi thực hành các nội dung, bản thân em không chỉ có thêm nhiều kiến thức và kỹ năng sửdụng các công cụ nêu trên cho phân tích dữ liệu mà còn ứng dụng được cho nhiều mục đích kháctrong cuộc sống Việc được thao tác và ứng dụng các công cụ giúp em có một cái nhìn mới, cócách tiếp cận mới và đạt hiệu quả cao hơn trong học tập cũng như công việc của bản thân
Một số góp ý cho môn học
Đây là lần đầu tiên em được biết đến các công cụ phân tích dữ liệu trong chương trình thực hành,
em cảm thấy chúng rất hữu ích cho bản thân và không quá khó như mình nghĩ Em cũng đánh giárất cao cách học P-I-O-L-E, học theo cách này giúp em dễ dàng hiểu được bản chất kiến thức vàbài tập so với cách học thông thường, kiến thức sau khi học cũng được ghi nhớ lâu và dễ dàng ôntập lại khi cần
Em xin phép có một vài góp ý:
1 Một số video trên kênh Youtube của thầy chia sẻ có phần âm thanh chất lượng chưa được tốt,
có video tiếng người hướng dẫn rất nhỏ, hoặc bị lọt tạp âm lớn dẫn đến quá trình xem video vàthực hành có đôi chút bất tiện
2 Ngoài các công cụ đã học, em cũng muốn biết thêm về các công cụ khác như Python, để có cáinhìn tổng quan hơn, có sự so sánh, đánh giá giữa các công cụ
Trang 27TÀI LIỆU THAM KHẢO
Slide bài giảng Kho dữ liệu và Kinh doanh thông minh, ThS Nguyễn Danh Tú, Viện Toánứng dụng và Tin học, Đại học Bách khoa Hà Nội
Kênh Youtube Học Excel cơ bản
PowerBI Tutorial, Pavan Lalwani
Google Data Studio Tutorial, RailSware Product Academy
Và các nguồn tài liệu, cộng đồng chia sẻ trên internet khá