1. Trang chủ
  2. » Luận Văn - Báo Cáo

báo cáo thực hành giữa kỳ kho dữ liệu và kinh doanh thông minh

27 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Báo cáo thực hành giữa kỳ
Tác giả Dương Văn Khoa
Người hướng dẫn ThS. Nguyễn Danh Tú
Trường học Trường Đại học Bách Khoa Hà Nội
Chuyên ngành Kho Dữ Liệu Và Kinh Doanh Thông Minh
Thể loại Báo cáo thực hành
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 27
Dung lượng 7,64 MB

Nội dung

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘIKHOA TOÁN TINBÁO CÁO THỰC HÀNH GIỮA KỲKHO DỮ LIỆU VÀ KINH DOANH THÔNG MINHGV Hướng dẫn : ThS... Tóm tắtTrong bài báo cáo cá nhân này, kết quả từ các bài th

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

KHOA TOÁN TIN

***

BÁO CÁO THỰC HÀNH GIỮA KỲ

KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH

GV Hướng dẫn : ThS Nguyễn Danh Tú

Sinh viên thực hiện : Dương Văn Khoa

Mã lớp học phần : 142302

Hà Nội, tháng 1 năm 2024

Trang 2

Tóm tắt

Trong bài báo cáo cá nhân này, kết quả từ các bài thực hành cá nhân xuyên suốt học phần này sẽđược trình bày theo thứ tự của giảng viên Các nội dung chính bao gồm phân tích thông tin trênExcel, công cụ Power BI, phần mềm MySQL Tiếp đó, trong quá trình thực hành xử lý dữ liệuvới các công cụ trên, tiến trình truy xuất dữ liệu từ nhiều nguồn đã được đề cập và ứng dụngtrong bài thực hành Những bài thực hành liên quan trực tiếp đến các câu hỏi thực tế có thể xảy

ra, liên quan nhiều đến các lĩnh vực kinh tế, giáo dục, Nhờ đó, từ học phần Kho dữ liệu và kinhdoanh thông minh, nhiều kiến thức phân tích dữ liệu quan trọng giúp ích cho sinh viên chuyênngành rất nhiều trong quá trình thực tập và đi làm

Trang 3

Lời mở đầu

Ngày nay, các doanh nghiệp muốn tồn tại trong môi trường cạnh tranh khắc nghiệt cần đưa rađược những lựa chọn thông minh và hạn chế thấp nhất rủi ro Phân tích dữ liệu chính là phươngpháp tối ưu mà doanh nghiệp cần để nhìn rõ bản thân, nhìn rõ thị trường và từ đó tìm được lựachọn tối ưu Quá trình làm sạch, xử lý dữ liệu thô, đồng thời trích xuất thông tin theo yêu cầu,trực quan hóa dữ liệu để rồi từ đó phân tích tình hình, đưa ra kế hoạch tương lai Đó chính làcách tiếp cận phân tích dữ liệu, một công việc quan trọng để biến dữ liệu lớn thành thông tin hữuích, giúp nhà quản lý có cái nhìn bao quát, nhanh chóng đưa ra được lựa chọn sáng suốt.Trong học phần Kho dữ liệu và kinh doanh thông minh, cách tiếp cận và thực hành phân tích dữliệu đã được liên kết trường hợp thực tế giúp sinh viên hiểu và thực hành được các bài toán dữliệu của doanh nghiệp

Trang 4

Lời cảm ơn

Lời đầu tiên, em xin gửi lời cảm ơn chân thành nhất tới thầy Nguyễn Danh Tú, Viện Toán ứngdụng và Tin học, Trường Đại học Bách khoa Hà Nội Đối với em, điều may mắn của mình làđược thầy trực tiếp giảng dạy trong thời gian học tập lớp Kho dữ liệu và kinh doanh thông minh.Thầy đã tận tình chỉ bảo, hướng dẫn cho lớp chúng em rất nhiều kiến thức cả về cốt lõi của chủ

đề bài báo cáo và cũng như những kiến thức liên quan về môn học

Trong quá trình tìm hiểu cũng có gặp một vài khó khăn về mặt kiến thức, trình bày song em đã

nỗ lực để hoàn thành tốt nhất có thể Đây là bản báo cáo em tổng hợp lại kết quả thực hành cánhân, đồng thời tự đánh giá kết quả bản thân trong học phần này Trong báo cáo không tránhkhỏi những sai sót, em rất mong những sự góp ý của thầy để em rút kinh nghiệm và hoàn thiệnbáo cáo tốt hơn Em chân thành cảm ơn thầy đã hướng dẫn cho em ở bộ môn này!

Hà Nội, Ngày 23 tháng 7 năm 2023Sinh viên thực hiện

Dương Văn Khoa

Trang 5

Tóm tắt 2

Lời mở đầu 3

Lời cảm ơn 4

Thực hành 1: ETL dữ liệu trong Excel 8

1.1 Sắp xếp và lọc dữ liệu 8

1.2 Sắp xếp và lọc dữ liệu nâng cao 12

1.3 Tip 14

1.4 Copy - Paste 15

1.5 Copy – Paste nâng cao 17

1.6 Data Validation 18

1.7 Định dạng cơ bản 18

1.8 Định dạng nâng cao 21

Thực hành 2: Pivot - Pivot chart - Làm báo cáo trên dữ liệu bán hàng 23

2.1 Pivot 23

2.2 Pivot chart 27

2.3 Làm báo cáo trên dữ liệu bán hàng 29

Thực hành 3: Xây dựng Dashboard trên Excel 30

3.1 Thực hành theo mẫu 30

3.2 Thực hành xây dựng dashboard trên dữ liệu 31

Thực hành 4: Power Query 33

4.1 Power Query 33

4.1.1 Extract data 33

4.1.2 Transform data 34

4.1.3 Data model 37

4.1.4 Add column 39

4.1.5 Lấy dữ liệu từ SQL 41

4.2 Xây dựng mô hình 41

Trang 6

Thực hành 5: Power Query & Dash, Xây dựng Dashboard trên Google Data Studio 44

5.1 Power Query & Dash 44

5.2 Xây dựng Dashboard trên Google Data Studio 45

Thực hành 6: Power BI 48

6.1 Xây dựng Dashboard theo mẫu 48

6.2 Xây dựng Dashboard 3.0 trên dữ liệu bán hàng 49

Thực hành 7: Tìm hiểu các tính năng trên Power BI 51

7.1 Video 1 51

7.2 Video 2 56

7.3 Video 3 58

7.4 Video 4 60

7.5 Video 5 62

Thực hành 8: (Project 1)- Truy vấn dữ liệu trên cơ sở dữ liệu OLTP 63

1,Truyvấnthông tinkhách hàngphànnàn 63

2,Truyvấnra thông tinđơnhàng 63

3,Truy vấn nhânviênđã chăm sóckhách hàng củađơnhàngnày 63

4,Truy vấn thôngtin sảnphẩmbịphànnàn 64

5,Kiểmtrakhohàng cònsảnphẩm đókhông 64

6,Đưaranhữngdòng sảnphẩmcócùngmứcgiá,chênhlệchgiánhỏ.(Nhỏhơn5đô) 64

7,Đưara nhữngdòngxecó cùngmộtsố đặcđiểmvớixetrước 64

8,Truyvấnsảnphẩmmớimàkháchhàngyêucầutheođặcđiểm 65

9,Tìm1nhânviênđãcókinhnghiệmđểtưvấnchokháchhàng 65

10,Hiển thịnhững kháchhàngđãmuasảnphẩmnàyđểtiếnhànhkhảosátchất lượng 66

11,Hiển thị top5kháchhàngcótổnggiá trịđơn hàng lớnnhất 66

12,Hiểnthịtop5sảnphẩm cótỷlệ doanhsốcaonhất 66

13,Kiểm tragiao vậnđã đúngthờigianyêucầuchưa,hiểnthịđơnhàng giao trễ 67

14,Đưacáccácsảnphẩm không cómặt trong bấtkỳ mộtđơnhàngnào 67

15,Đưaracácsảnphẩmcósố lượngtrongkholớnhơntrungbìnhsốlượngtrongkhocủacác sảnphẩmcùngloại 67

16,Thốngkêtổngsố lượngsảnphẩmtrongkhotheodòngsảnphẩmcủatừng nhàcungứng 68

17,Thốngkêramỗisảnphẩm đượcđặthànglầncuốivàothờigiannàovà kháchhàngđã đặt hàng 68

Trang 7

Thực hành 9: (Project 2)- Xây dựng cơ sở dữ liệu phân tích OLAP 70

Thực hành 10: (Project 3A)- Truy vấn dữ liệu trên hai CSDL OLTP&OLAP 73

OLTP_1Thốngkêdoanhsốcủacácnhânviên/quảnlý theophòngban(cụthểlàphòngbancó officeCode=4) 73

OLTP_2Thốngkêdoanhsốtheocácoffice 73

OLTP_3Thốngkêdoanhsốtheonộiđịatạicácoffice 74

OLTP_4Thốngkêmứcđộchênhlệchgiábánvà giániêmyết trungbìnhtheotừngsản phẩm 74

OLTP_5 Thốngkêkháchhàngtạiquốcgianàonhận đượcnhiềuưuđãimuahàngnhất(giábán rẻhơngiániêmyết) 75

OLTP_6 Thốngkếlượnghàngtồnvàmứcchênhlệchgiábán trungbình theo sảnphẩm 75

OLTP_7Thốngkêtop5nhữngsảnphẩmđượckháchhàngmua nhiềunhấttheokhuvực(cụthể làởUSA) 75

OLAP_1Thốngkêtop5sảnphẩmmanglạidoanhsốlớnnhất 76

OLAP_2Thốngkêdoanhsốcủacácnhân viên/quản lýtheophòng ban 76

OLAP_3Thốngkêdoanhsốtheocácoffice 77

OLAP_4Thống kêdoanhsố theodòngsản phẩm 77

OLAP_5Thốngkêdoanhsố theodòngsản phẩmtheothờigian 78

OLAP_6Thốngkêtổngsốlượnghàng trongkhotheotừngsảnphẩm 78

OLAP_7Thốngkêtopnhữngkhách hàng đãthanh toánnhiềunhất 79

OLAP_8Thốngkêtop5nhữngsảnphẩmđượckháchhàngmua nhiềunhấttheokhuvực(cụthể làUSA) 79

Thực hành 11: (Project 3B)- Xây dựng dashboard và phân tích dữ liệu từ CSDL OLTP 81

1,Thốngkêdoanh sốcủacácnhânviên/quảnlýtheo phòngban(cụthểlàphòngbancó officeCode=4) 81

2,Thốngkê doanhsốtheocácoffice 81

3,Thốngkê doanhsốtheonộiđịatại cácoffice 82

4,Thốngkêtop5nhữngsảnphẩmđược khách hàngmuanhiềunhấttheokhuvựccụthể 82

Thực hành 12: (Project 3C)- Xây dựng dashboard và phân tích dữ liệu từ CSDL OLTP 84

KẾT QUẢ THU ĐƯỢC, ĐÁNH GIÁ VÀ GÓP Ý CHO MÔN HỌC 85

TÀI LIỆU THAM KHẢO 86

Trang 9

Sắp xếp dữ liệu theo nhiều tiêu chí

Lọc dữ liệu là cách giúp chúng ta tìm kiếm và hiển thị các dòng dữ liệu cần thiết mộtcách nhanh hơn

Lọc dữ liệu theo một tiêu chí

Trang 10

Lọc dữ liệu theo nhiều tiêu chí

Lọcdữliệunângcao

Lọc theo 1 tiêu chí và nhiều tiêu chí

Trang 11

Saochép vàcắt dántrongExcelđể xửlýdữ liệu

Pháthiệndữliệuquacácđịnhdạngcóđiềukiện.Định dạng top, định dạng tiến độ

Trang 12

Định dạng lọc trùng

Tạoxácthựcdữliệukhinhậpvào(DataValidation).Kiểm tra hợp lệ dữ liệu

Trang 13

Thông báo nhập, thông báo lỗi

Trang 14

Tuần 2: Pivot, vẽ đồ thị, làm báo cáoPivottable

Định dạng dữ liệu Pivot

Định dạng dữ liệu Pivot (tiếp)

Trang 15

Group theo tháng

Làm mới dữ liệu

Trang 16

(cụthểlàở USA).

OLAP_1Thốngkêtop5sảnphẩmmanglạidoanhsốlớnnhất

OLAP_2Thốngkêdoanhsốcủacácnhânviên/quảnlýtheophòngban

Trang 17

OLAP_3Thốngkêdoanhsố theo cácoffice.

OLAP_4Thốngkêdoanhsốtheodòngsảnphẩm

Trang 18

OLAP_5Thốngkêdoanhsốtheodòngsảnphẩm theothờigian.

OLAP_6Thốngkêtổngsố lượnghàngtrongkhotheotừngsảnphẩm

Trang 19

OLAP_7Thốngkêtopnhữngkháchhàngđãthanh toánnhiềunhất.

OLAP_8 Thốngkêtop5nhữngsảnphẩmđượckháchhàngmuanhiềunhấttheokhu vực

Trang 21

(cụthểlàUSA).

Trang 22

Thực hành 11: (Project 3B)- Xây dựng dashboard và phân tích dữ liệu từ CSDL OLTP

1,Thốngkêdoanhsốcủacácnhânviên/quảnlýtheophòngban(cụthểlàphòngbancóofficeCode=4)

2, Thống kêdoanhsốtheocácoffice

Trang 23

4,Thốngkêtop5nhữngsảnphẩmđượckháchhàngmuanhiềunhấttheokhuvựccụthể

Trang 24

ModelOLTP

Trang 25

Thực hành 12: (Project 3C)- Xây dựng dashboard và phân tích dữ liệu từ CSDL OLTP

Dashboard

Phântíchdashboard,vềsảnphẩm,Cóthểthấytỷlệdoanhsốtheosảnphẩmphânhóarõrệt,cầnđẩymạnhvàocácloạisảnphẩmchiếmtỷtrọngcao.Tươngtựvớithờigiantrongquý4năm2003vàquý4năm2004.Trongnămcácquýcódoanhsốthấpthườnglàquý123vàtăngmạnh doanhsốvàoquý4cho thấynhucầumuasắmcácmặthàngphươngtiệngiaothôngthườnglàvào cuối năm.Đối vớiphòngban,xétvớiđường xuhướngtheophòngbancóthểnhậnthấytheoloạisảnphẩmkhácnhauchorasailệchkhácnhau,đâylànền

tảngđểxâydựngkếhoạchmarketing,bánhànghợplý,nhằmnângcaodoanhthuởcác

phòngbanthấpnhưphòng2,3,5

Trang 26

KẾT QUẢ THU ĐƯỢC, ĐÁNH GIÁ VÀ GÓP Ý CHO MÔN HỌCKết quả thu được

Một số kiến thức, kỹ năng mà bản thân em có được sau khi thực hành:

Khả năng sử dụng thành thạo Excel cơ bản và thao tác được các chức năng chỉnh sửa, biểudiễn và phân tích dữ liệu

Được làm quen với công cụ PowerBI và Google Data Studio, tự mình tìm hiểu cách thứchoạt động, các khái niệm, các cách cài đặt, tuỳ biến cho các công cụ trực quan hoá dữ liệu.Hiểu được ưu, nhược điểm của từng công cụ, biết khi nào nên dùng công cụ nào phù hợp.Biết thêm các kiến thức về Datawarehouse và Business Intelligence

Sau khi thực hành các nội dung, bản thân em không chỉ có thêm nhiều kiến thức và kỹ năng sửdụng các công cụ nêu trên cho phân tích dữ liệu mà còn ứng dụng được cho nhiều mục đích kháctrong cuộc sống Việc được thao tác và ứng dụng các công cụ giúp em có một cái nhìn mới, cócách tiếp cận mới và đạt hiệu quả cao hơn trong học tập cũng như công việc của bản thân

Một số góp ý cho môn học

Đây là lần đầu tiên em được biết đến các công cụ phân tích dữ liệu trong chương trình thực hành,

em cảm thấy chúng rất hữu ích cho bản thân và không quá khó như mình nghĩ Em cũng đánh giárất cao cách học P-I-O-L-E, học theo cách này giúp em dễ dàng hiểu được bản chất kiến thức vàbài tập so với cách học thông thường, kiến thức sau khi học cũng được ghi nhớ lâu và dễ dàng ôntập lại khi cần

Em xin phép có một vài góp ý:

1 Một số video trên kênh Youtube của thầy chia sẻ có phần âm thanh chất lượng chưa được tốt,

có video tiếng người hướng dẫn rất nhỏ, hoặc bị lọt tạp âm lớn dẫn đến quá trình xem video vàthực hành có đôi chút bất tiện

2 Ngoài các công cụ đã học, em cũng muốn biết thêm về các công cụ khác như Python, để có cáinhìn tổng quan hơn, có sự so sánh, đánh giá giữa các công cụ

Trang 27

TÀI LIỆU THAM KHẢO

Slide bài giảng Kho dữ liệu và Kinh doanh thông minh, ThS Nguyễn Danh Tú, Viện Toánứng dụng và Tin học, Đại học Bách khoa Hà Nội

Kênh Youtube Học Excel cơ bản

PowerBI Tutorial, Pavan Lalwani

Google Data Studio Tutorial, RailSware Product Academy

Và các nguồn tài liệu, cộng đồng chia sẻ trên internet khá

Ngày đăng: 17/06/2024, 17:25

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w