1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đề tài ứng dụng phân tích dữ liệu vào dự báo khả năng tốt nghiệp hay bỏ học của sinh viên tại thành phố hồ chí minh

59 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Phân Tích Dữ Liệu Vào Dự Báo Khả Năng Tốt Nghiệp Hay Bỏ Học Của Sinh Viên Tại Thành Phố Hồ Chí Minh
Tác giả Nguyễn Quốc Khang, Phạm Thị Thanh Mai, Đỗ Nhật Hồng Khanh
Người hướng dẫn ThS. Hồ Hướng Thiền
Trường học Trường Đại Học Mở Thành Phố Hồ Chí Minh
Chuyên ngành Phân Tích Dữ Liệu
Thể loại báo cáo giữa kỳ
Năm xuất bản 2024
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 59
Dung lượng 8,03 MB

Nội dung

Đây là một lĩnh vực nghiên cứu mới và còn nhiều tiềm năng phát triển, đặc biệt là ở Việt Nam, nơi việc ứng dụng khoa học dữ liệu vào dự báo tỷ lệ giữ chân học sinh, sinh viên còn ít đượ

Trang 1

TRƯỜNG ĐẠI HỌC MỞ TP HỒ CHÍ MINH

HO CHI MINH CITY OPEN UNIVERSITY

BAO CAO GIU'A KY ;

DE TAI: UNG DUNG PHAN TICH DU LIEU VÀO DỰ BAO KHA NANG TOT NGHIỆP HAY BỎ HỌC CỦA SINH VIÊN TẠI THÀNH PHÓ HÒ CHÍ MINH

Môn học: Phân tích dữ liệu

Trang 2

BANG DANH GIA THANH VIEN

STT Ho va tén Mã số sinh viên Đánh giá

1 Nguyễn Quốc Khang 2154050132 100%

CHU ONG 1 TONG QUAN VE DE TAI

1 Lý do chọn đề tài nghiên cứu -2- 2+ ©+++++x+2E++rx+rxezrxerxesrxerrrees

2.3 Tạo Mô Hình Dữ Liệu 75 5S SS2<1111 111 * + S333 1 se

2.4 Tạo Biểu đỗ báo cáo -s-©2s- sc 2xx 2212221221121 2121.211 21111 xe

“hi ni 0995 3A

Trang 3

2.6 Chia Sé Bao C40 0 cscceesssssssssssesseevssesseesssessseessesssesssesssessseesseessteseeesseesssenee CHUONG 3 QUY TRINH THUC HIEN PHAN TICH DU LIEU VA CAC

ion 23

2 Câu trúc dữ liệu -¿-2¿©22+©22+2E+2EE2EE22EE221122122121121112112112111211 11221121 ce 25 3 Transform data bằng Power BÌ -¿ 2¿©2222222x2 22A2 EEEEEE.EErerkrrvee 37 3.1 Trove quan héa ditt 1 eee 39

3.2 Cac bude thyrc Wien 40

K2 A0 40

Kon nan 41

E01: ác HA 41

3.2.4 Visualization D[IOWNS: - ĩc +5 +4 +1 1.21211111111131 H111 1c 41 Em" 005086 .d4 41

3.2.6 Format Option ở biểu đồ trong Power BÌ 2¿-75-552552 43 CHUONG 4 KET QUA THỰC NGHIỆM 43 Két qua phan tich Dashboard c ccccscsssssssessssssssssesssesssesseessessessecssessecsueessessecsseetss 44 1 Biểu đồ cột thê hiện tình trạng hơn nhân của sinh viên . - 45

2 Biểu đồ cột thê hiện tham dự buổi ngày/tối 2 2225+©522222cxcczesrxesreee 46 3 Biêu đồ cột thê hiện nghề nghiệp của cha mụẹ -.2- 22222 522++++2xz+cx2 46 4 Biểu đồ cột thê hiện nợ sinh viên -2- 2 22 ©22+x+2E++EE++EEtEEE+EEvrxezrxerxesree 41 5 Biểu đồ cột thê hiện học phí cập nhật mới nhắt 2-22 5¿©5+2+++>+2 48 6 Biêu đồ cột thé hiện giữ học bơng của sinh viên 2-©2255+55z+cxz+ccez 48 7 Biéu dé cột thê hiện trung bình điểm học kì 1 (diém trung bình) - 49

8 Biéu đồ cột thê hiện trung bình điểm học kì 2 (điểm trung bình) 50

9 Biểu đồ cột thê hiện độ tuổi nhập học -.2 2¿ 2 52+5+22++£xz+zx+zzesrxesrxee 51 > KGt 6 6 nổ . 51

CHƯƠNG 5: KÉT LUẬN 52 1 Kết 8085183010021 52

2 Kết S080, 0i) 000 0n 52

ki a6 1n ậàặä⁄4‹4 53 TAI LIEU THAM KHAO 54

Trang 4

MO DAU

Bất kỳ phương pháp phân tích hoặc dự báo nào hiện nay trên thị trường đều yêu cầu

dữ liệu Nếu không có nó, những nhà quản lý không thê đưa ra quyết định đúng đắn dựa trên những gì họ thấy Nhiều người tìm nhiều cách khác nhau để phân loại các phương pháp dự báo, có thê kế đến một số phương pháp nổi bật như: ngoại suy xu hướng, dự báo tổng hợp và rất nhiều phương pháp khác Hiện nay, ở Việt Nam có rất nhiều đơn vị sử dụng các phương pháp này để lập kế hoạch phát triển kinh tế như là: Tổng cục Thống kê, Viện chiến lược phát triển, Bộ Kế hoạch và Đầu tư, Một số

chuyên gia, nhà quản lý đã nghiên cứu vấn đề phân tích, dự báo và đưa ra nhiễu giải

pháp áp dụng cho nhiều lĩnh vực Chúng bao gồm phân tích tình trạng tài chính của một công ty, tạo ra các chính sách tiền tệ, dự báo giá của tư liệu sản xuất, dự báo giá cô phiếu và hoạch định các chính sách tài chính Ở Báo cáo này, em đã sử dụng một công

cụ khai phá dữ liệu khá mạnh mẽ đến từ Microsoft là Microsoft Power Bi

CHUONG 1 TONG QUAN VE DE TAI

1 Lý do chọn đề tài nghiên cứu

Yếu tố con người luôn đóng vai trò quyết định trong sự phát triển của một nền kinh tế bền vững Chính vì vậy giáo dục được coi là quốc sách quan trọng nhất không chỉ của Việt Nam mà còn của các nước trên thế gidi Đề hiện thực hóa xu hướng trên, Việt Nam luôn tạo mọi điều kiện để nâng cao dân trí, đào tạo nguồn nhân lực, bồi dưỡng nhân tài trong nước và nâng cao trình độ chuyên môn kỹ thuật của người lao động theo nhu cầu của người lao động trong nước nhằm phục vụ cho nhu cầu công nghiệp hóa, hiện đại hóa ngày càng tốt hơn Tuy nhiên, trong những năm gần đây tình trạng sinh viên Việt Nam bỏ học giữa chừng ở các địa phương, đặc biệt là TPHCM đang được dư luận quan tâm

nhiều nhất Vì vậy để giải quyết tình trạng này thì chúng ta cần tìm hiểu tý lệ

giữ chân sinh viên các trường Đại học tại địa bàn TP.HCM Tỷ lệ này là một chỉ

số quan trọng đánh giá hiệu quả hoạt động của các trường học Việc dự báo tỷ

Trang 5

lệ giữ chân giúp các trường học xác định các yêu tô ảnh hướng đên việc sinh viên bỏ học và đưa ra các biện pháp can thiệp kỊp thời

Theo phó giáo sư, tiến sĩ Đỗ Văn Dũng, nguyên hiệu trưởng trường Đại học Sư phạm Kỹ thuật TP.HCM, hàng năm có 10-20% sinh viên bỏ học Theo thong ké

trước đây, có khoảng 5% không thể đóng học phí và 5% lo lắng Mới đây trên

website cua trường Đại học Bách Khoa TP.HCM TP.HCM cảnh báo 2.252 học sinh bỏ học trong nửa đầu năm học 2019-2020 Các trường đại học và cao đẳng thường trực nằm trong số 2.252 sinh viên được cảnh báo tự nguyện nghỉ học trong học kỳ đầu tiên hệ thong đại học hoặc hệ thong dai hoc chung cho phép bạn vừa học vừa làm Câu chuyện thu hút sự chú ý của dư luận sau khi một số trường trước đó công bó danh sách cảnh cáo học sinh và buộc thôi học Hiện tượng này xảy ra ở nhiều trường, thậm chí một số trường có tỷ lệ trúng tuyên

“cạnh tranh” rất cao, chang hạn như các trường đại học Khoa học Tự nhiên,

Đại học Quốc gia Thành phố Hồ Chí Minh Trong một học kỳ, Hồ Chí Minh

quyết định đuôi học 454 học sinh và cảnh cáo 605 người Và trong năm học

2016-2017, tuyên sinh tại Thành phố Hồ Chí Minh đã tăng hơn 59.000 sinh

viên trong năm học, nâng tổng số sinh viên của thành phố lên gần 1,5 triệu, theo

báo cáo Theo thông báo tuyên sinh năm 2020 của Trường Kinh tế TP.HCM,

6.804 người sẽ tốt nghiệp vào năm 2021

Đê dễ dàng hơn trong việc nghiên cứu thì ứng dụng khoa học dữ liệu vào dự

báo tỷ lệ giữ chân sẽ mang lại nhiều lợi ích Nó cung cấp các mô hình dự báo

chính xác hơn so với các phương pháp truyền thống, xác định các yếu tô ảnh hưởng đến việc sinh viên bỏ học một cách hiệu quả, và giúp các trường học đưa

ra các biện pháp can thiệp hiệu quả hơn để tăng tỷ lệ giữ chân Với tính ứng dụng cao, các mô hình dự báo có thé duoc áp dụng cho nhiều trường học khác nhau, và các biện pháp can thiệp được đề xuất có thê được áp dụng một cách dễ dàng

Đây là một lĩnh vực nghiên cứu mới và còn nhiều tiềm năng phát triển, đặc biệt

là ở Việt Nam, nơi việc ứng dụng khoa học dữ liệu vào dự báo tỷ lệ giữ chân học sinh, sinh viên còn ít được thực hiện Với ý nghĩa khoa học và thực tiễn cao, nghiên cứu đề tài này có thê giúp các trường học nâng cao tỷ lệ giữ chân học sinh, sinh viên, góp phần nâng cao chất lượng giáo dục Đó cũng là lý do nhóm chúng em chọn đề tài: " Ứng dụng khoa học công nghệ vào dự báo khả năng tốt nghiệp hay bỏ học của sinh viên tại TPHCM "

Trang 6

2 Mục tiêu nghiên cứu

Mục tiêu chung: Ứng dụng khoa học công nghệ vào dự báo khả năng tốt nghiệp hay bó học của sinh viên tại TPHCM trên cơ sở đó nhằm đề xuất những giải pháp có thê giúp các trường học nâng cao tý lệ giữ chân sinh viên, góp phần nâng cao chất lượng giáo dục, đưa ra các chính sách hỗ trợ những khó khăn của

3 Đối tượng nghiên cứu - Phạm vi nghiên cứu

Đối tượng nghiên cứu: nghiên cứu khả năng bỏ học hay tốt nghiệp của sinh viên Phạm vi nghiên cứu: trên địa bàn Thành phố Hồ Chí Minh dựa trên bộ dữ liệu

“higher-education-predictors-of-student-retention”’

4 Phương pháp thực hiện

Quy trình thực hiện đồ án như sau

Bước 1: Xác định mục tiêu nghiên cứu

- Mục tiêu nghiên cứu của đồ án là: Dự báo tỷ lệ giữ chân của học sinh, sinh viên

Bước 2: Thu thập dữ liệu

- Nhóm Chọn Sử dụng bộ dữ liệu “ higher-education-predictors-of-student-retention” tt trang Kaggle cho bài nghiên cứu của nhóm

Bước 3: Tiền xử lý dữ liệu

- — Làm sạch dữ liệu

- _ Tích hợp dữ liệu

- Chỉnh dạng dữ liệu

- — Rút gọn dữ liệu

Bước 4: Phân tích mô tả

- Giai thích dữ liệu lịch sử để hiểu rõ hơn những thay đổi xảy ra trong đối

tượng nghiên cứu Phân tích mô tả sử dụng một loạt các dữ liệu thô dé phân tích, đưa ra một bức tranh chính xác về những gì đã xảy ra trong dé tài và điêm khác biệt với các giai đoạn khác

Trang 7

5 Kiém tra, phan tích, đánh giá hiệu suât và hoàn thiện đồ án

Từ đó, xây dựng các mô hình dự báo dựa vào bộ dữ liệu huấn luyện có sẵn và so sánh các kết quả rút ra được với nhau nhằm giúp các học sinh, sinh viên có thêm thông tin khi đưa ra quyết định của mình

CHƯƠNG 2 GIỚI THIỆU VẺ POWER BI DESKTOP

1 Khái niệm

Power BI Desktop là một ứng dụng cho phép người dùng kết nối, trực quan hóa và

chuyền đổi dữ liệu một cách rất tiên tiến Nó hoàn toàn miễn phí đề sử dụng và nó có

thê được cài đặt cục bộ trên máy tính Power BI Desktop phù hợp cho cả những người mới bắt đầu phân tích dữ liệu và những người có thâm niên trong ngành

Ứng dụng này kết hợp nhiều nguồn dữ liệu khác nhau đề tạo ra một mô hình dữ liệu để

dễ dàng quản lý và sử dụng hơn Sau khi tạo ra mô hình này, nó có thê dễ dàng được phân tích, quản lý và chia sẻ với cộng đồng, các thành viên trong dự án Các bảng và các liên kết dữ liệu trong ứng dụng này cũng có thể được chia sẻ với các thành viên khác của cộng đông thông qua báo cáo

Người dùng có thể dễ dàng chia sẻ báo cáo thông qua Power Bi Service và tạo báo cáo chuyên nghiệp bằng cách sử dụng công cụ phân tích đữ liệu Power Bi Điều này rất hữu ích cho nhiều dự án kinh doanh

2 Ứng dung cua power BI

Power Bi Desktop có nhiều tính năng và ứng dụng phô biến bao gồm:

- Connect to data (Két néi đến dữ liệu)

- Transform and clean this data to create a data model (làm sạch và chuyên đổi dir liệu đề tạo mô hình đữ liệu)

- Create visuals (tạo các biểu đồ, đồ thị dưới dạng hình ảnh dé cung cap một hình ảnh trực quan của dữ liệu phân tích)

- Create Report (Tạo báo cáo bao gồm một hoặc nhiều trang báo cáo chứa các hình ảnh liên quan)

Trang 8

chia sé cua Power Bi dé chia sé cho những người dùng khác)

Như vậy, ta có thê thấy đê phục vụ cho công việc của mình, những chuyên gia phân tích dữ liệu là những người phải thường xuyên phụ trách những công việc này Tuy nhiên, có những người không là chuyên gia phân tích hoặc có một số chuyên gia cũng

đã thực hiện các việc chia sẻ các mô hình dữ liệu và báo cáo vì mục đích tốt hơn, tạo ra giá trị cho cộng đồng

Power Bi là ứng dụng được cập nhật liên tục, đây là lý do khiến nó trở thành một trong những công cụ được ưu tiên lựa chọn đầu tiên cho việc phân tích và báo cáo dữ liệu Ứng dụng này thường xuyên ghi nhận các phản hồi của các khách hàng và đưa ra các bản cập nhật đề vá lỗi cũng như thêm các tính năng mới hàng tháng

Góc trên cùng bên trái của ứng dụng có ba ngăn, chúng được sắp xếp theo thứ tự từ trên xuông dưới như sau:

Trang 9

- Report: Người dùng sẽ dành phần lớn thời gian ở chế độ xem này đề có thé tạo báo cáo và biêu đô Dạng xem Báo cáo có 5 khu vực chính:

1 Ruy băng, hiên thị các nhiệm vụ phô biên liên quan dên báo cáo và trực quan hóa

2 Dạng xem Báo cáo hoặc canvas, nơi phân trực quan hóa được tạo và sắp

BW! AS c? Ø- FJ | project-snalysis - Power 81 Desktop 7 Qa x

Eo Home View hfodeling Michoel Blythe oe

2 7 Là L t ) mm” m—m 2 Lo $ È 2 iter ° Đĩa ElIotöovr jj pel = a -8 M8 F¬m

a Get Recant Enter Eqit E Refresh Solution Partner dew New Pì Manage New

_— Dota Sources* Dota Queries” Templates Showcase Page* Visual G2 Snapes = View saumBelationships —leasure* Publlsh

Eaternal Data Resources insert View Mionshipt Calculations Share

ard 5 sua

Hinh 2: Giao dién chinh cua report

- Data: O ché độ xem này, các mô hình dữ liệu được liên kết với báo cáo được các chuyên gia phân tích thực hiện phân tích dựa trên các phương thức tính toán và việc

Trang 10

ước tính, đo lường hợp lý nhằm mục đích kiểm tra, đánh giá và có thế chuyển đổi mô

hình dữ liệu nếu cần thiết Dạng xem Dữ liệu có 3 khu vực chính:

1 Ruy băng, có tab Lập mô hình được chọn bên dưới Trên tab này, bạn tạo các bảng và cột đã tính, rồi thực hiện các thay đổi khác cho mô hình dữ liệu

2 Ngăn trung tâm, hiển thị dữ liệu cho bảng đã chọn

3 Ngăn Trường, nơi bạn kiểm soát cách các trường hiên thị trong báo cáo

Bi) AS & @ =| project-analysis - Power BI Desktop ~ op x

mm Home Modeling Michoe! Blythe oe

zotion: Do Manage View As Ri Role t

Manage Sort By , » Ears

Relationships | we Column Table Colum $ » 4|Auto 2

Belatlonshlps Calculations Sort Formatting Properties Security

Hinh 3: Giao dién chinh cua Data

- Model: Các công thức, chỉ số, các mỗi quan hệ giữa các trường dữ liệu được thể hiện ở chế độ xem này, giúp người dùng có thế xem và quản lý các mô hình dữ liệu một cách dễ dàng Trong Trình soạn thảo truy vấn, bạn xây dựng các truy vẫn và chuyền đổi dữ liệu, sau đó tải mô hình dữ liệu đã tỉnh chỉnh vào Power BI Desktop Trình soạn thảo truy vấn có 4 khu vực chính:

1 Ruy băng, có nhiều tùy chọn để định hình và chuyên đổi đữ liệu mà bạn đưa

vào

2 Ngăn bên trái, nơi các truy van được liệt kê và có sẵn đề lựa chọn, xem và định hình

Trang 11

3 Ngan trung tâm, nơi dữ liệu từ truy vấn đã chọn hiển thị và có sẵn đề định hình

4 Cửa số Thiết đặt truy vấn, liệt kê các thuộc tính của truy vấn và các bước chuyền đổi đữ liệu đã được áp dụng

GB! H @- = | project-onatysis - Query Editor = n x

mm Home lô0fôm AđđColumn — View 9

-x by bà = F So [ty LẦyProperbe: L = $l Data type: Any = =

=+ LX” + — CC CP ravances Eaitor = x lì "TT Ure First Row As Headers © Clote & Recent Enter Cato source Manage = Refresh SẺ Choote Remove Reduce Split, Group , Combine

Apply * Sourees* Dato seltings Porometers* Preview > (1) Menage + Columns Columns > Rows? Column By 2 Replace Values *

Dota Sources Parameters Query Manage Columas Sort Tiansfottm

Close New Query

Queries [2] fy | = Table.ReneveColunaz(8^Changsđ Type",

EB Oe

& Meee xuau 2 2 itor upgrade - finance department

2 3 Now vertion of CRM system

fon of productivity rottwrare Monitor upgrade - ses W

Changed Type

le devices for engineering tcurr

Pee Columns1

ew Bi sofware

3 Desktop upgrade for finance

wade for Marketing 4 13/10/2016

Mobile devices for anelytics team 7 1/12/2016

Trang 12

fa là © Lò,

Get Excel OneLake SQL

datay workbook data hub~ Server

Common data sources

11

Trang 13

2.2 Làm sạch và chuyền đổi dữ liệu

Các dữ liệu được chuyên đổi bằng trình soạn thảo Power Query được tích hợp sẵn ở ứng dụng sau khi làm sạch dữ liệu Công cụ Power Query Editor này khá mạnh mẽ,

nhờ vào đó người dùng có thê thực hiện nhiều thay đổi đến dữ liệu của mình Việc

phân tích sẽ dễ dàng hơn nhờ vào quá trình làm sạch và kiểm tra dữ liệu thô

Ta có thê mở cửa số hoạt động của Power Query Editor băng cách tìm vào tab Home sau đó nhân chen Transform Data 6 phan ving cua Query

File Home Insert Modeling View Optimize Help

ela © HE Là

Ge [a hia ©

Get Excel Onelake SQL Enter Dataverse Recent

datay workbook data huby Server data sources ¥

Clipboard Data

Hinh 6: Transform data editor

Transform data v

Bia oe

Refresh

visual New

Text More New Quick visuals v measure measure Calculations Sensitivity

Power Query Editor ghi lại mọi bước người dùng thực hiện trong khi chuyền đổi dữ liệu Do đó, vào lần tiếp theo nguồn dữ liệu được kết nôi, quá trình chuyên đổi sẽ tự

động lặp lại đề dữ liệu luôn được chuyền đổi theo đúng ý của bản thân đã chỉ định

0:01008550CC0040995140A8206106f 0101008SSDCCD04099514ĐAB2A6106FE: 0/010085S0CC0040995140AB2A6106FE: 0/01008550CC0040995140A82A6106f: 0101008550CC0049995140A02A6106f0 O101008SSOCCO01099S 140152161 06FE 0/01008550CCD040995140AB2A6106FEI 0¡01008550CC0049995140A82A6106f0: 0¡01008550CC004099S140Að2A6106F 0¡:01008S5S0CC004999S14ÔA82A6106fE: 0¡01008550CC0040995140A82A6106f6: 0¡i01008550CC0040995140A02A6100T 0: 0/01008SSDCCD04099S14DAB2AB1OEFE:

Trang 14

giữa các bảng sẽ dễ dàng hơn bằng cách tạo mô hình đữ liệu Điều này dẫn đến các công việc dữ liệu sẽ dễ dàng hoàn thành hơn so với các phương pháp truyền thống 2.3 Tạo Mô Hình Dữ Liệu

Việc tạo một mô hình đữ liệu đòi hỏi sự hiệu biết về cấu trúc của bảng đữ liệu, cũng

như danh mục bảng Bảng Dimension sẽ cung cấp chỉ tiết và thêm bắt kỳ thông tin bỗ sung nào vào dữ liệu có trong bảng dữ liệu thô

Người dùng Power BI linh hoạt hơn khi tạo mô hình dữ liệu so với những người sử dụng cơ sở dữ liệu Lý do cho điều này là vì các mô hình của Power Bi có thê mở hơn

cơ sở dữ liệu, chúng không yêu cầu người dùng phải gắn bó với một liên kết cụ thẻ Một trong những ưu điểm chính của Power Bi là nó có thế thực hiện các phép tính dựa trên các bảng dữ liệu và các nguồn được liên kết với nhau trong mô hình dữ liệu của

nó Điều này giúp người dùng tạo báo cáo chỉ tiết và cụ thê hơn mức có thê chỉ với một bang

1 Dates ™ Regions [™ Products ™ Customers Date 5 Regional IO = Index a Customer index

= Year City Name Product Name Customer Names

> QuarterOfYear County T Overall Sales T Customer Soles Rani 3` MonthOrYear State Code | Product Groups Ind TE Customer Group

S DavOfiicnth sate TH Product Groups Crain Innay

1 Financial Details ™ Sales M Sales Budgets

Category OrderDate Month & Year

3ˆ Values Warehouse Code Customer Names

TE type S Order Quantity ——=

TP type index S unit Price

Hình Š: Mô hình Dữ liệu

2.4 Tạo Biểu đồ báo cáo.

Trang 15

đồ Thông tin dữ liệu có thê được biểu diễn bang đồ thị thông qua các phương pháp

biểu đổ, trực quan nhất có thê kê đến hình ảnh Các chức năng tính toán có thê được

đưa vào báo cáo bằng cách trực quan hóa chúng qua đồ thị

Hình ảnh dưới đây cho chúng ta thấy một ví dụ về một biểu đồ đơn giản nhất: biểu đỗ

Viéc chon biéu tượng từ bộ chọn loại biểu đồ sẽ mở ra một hệ thong lựa chọn bao gồm

nhiều loại biểu đỗ khác nhau Khi chọn được loại biểu đồ phù hợp thì từ giao diện này, bắt kỳ ai cũng có thê đễ dàng xem đữ liệu và hiểu được ý nghĩa của nó Thay đổi biểu

14

Trang 16

tượng được sử dụng trong biểu đồ cũng làm thay đổi hình dạng biểu đồ, điều này giúp

bạn dễ dàng phân tích dữ liệu và đưa ra kết luận Nhìn vào biểu đồ chúng ta có thê dễ

dàng đưa ra các nhận định về dữ liệu đồng thời cũng dễ dàng hơn trong việc đưa ra các

quyết định từ việc nhìn nhận các biểu đồ phân tích

Hình 10: Giao diện chọn loại biểu đồ

Biéu đồ của Power Bi cực kỳ đơn giản để sử dụng Tất cả những gì bạn cần làm là chọn loại biểu đồ phù hợp và chọn dữ liệu bạn muốn phân tích Khi điều này được thực hiện, bạn có thể tạo báo cáo, chọn hoặc thậm chí kéo thả các trường dữ liệu vào biéu dé Power Bi cũng giúp những người không am hiếu nhiều về phân tích dữ liệu trở nên dễ dàng hơn khi sử dựng nó, ứng dụng này sẽ tự động thực hiện tính toán và tao biéu dé dé chúng ta lựa chọn dựa trên các trường chúng ta đã chọn Khi một loại

Trang 17

màn hình hình ảnh của biêu đô cân tạo

Trang 18

Hinh 11; Field Dit liéu

Biêu đồ trực quan ở chê độ xem biêu đô báo cáo có thê được thay đôi nêu người dùng chọn một loại biêu đỗ khác, nêu chưa có loại biêu đỗ nào được chọn thì một biêu đỗ mới sẽ được xuât hiện dựa vào lựa chọn của người dùng

2.5 Tạo Báo Cáo

Bằng cách tạo một tập hợp các báo cáo dé thị có liên quan, dữ liệu phân tích Power B1

có thể dé dàng được trình bày một cách trực quan

Power Bi ho tro khá mạnh mẽ về các công cụ tạo báo cáo cũng như có thê chia sẻ cho những người có liên quan với việc người dùng có thê tạo các báo cáo rât phức tạp, giàu

tính trực quan và có thê kết hợp với nhiều dữ liệu đến từ nhiều nguồn khác nhan

Total

Hình 12: Giao diện tạo Báo cáo

Hình ảnh dưới đây là một ví dụ về báo cáo Power Bi Nó hiến thị rõ ràng các phần

quan trọng của báo cáo như tiêu đề và các sô liệu được hiện thị dưới dạng biéu do dé

Trang 19

giúp người dùng đọc và hiểu dữ liệu đễ dàng hơn Hơn nữa, ứng dụng này cho phép người dùng tạo nhiều báo cáo đồng thời và sử dụng các trang riêng biệt cho các mục đích khác nhau

2.6 Chia Sẻ Báo Cáo

Sau khi kết thúc phần tạo báo cáo, người dùng có thê chia sẻ báo cáo lên dịch vụ của Power Bi, cho phép các thành viên trong tô chức truy cập vào Điều này có hiệu quả làm cho báo cáo công khai

Đê có thê chia sẻ Báo cáo, người dùng cân đi đên tab Home trên thanh công cụ, sau đó chọn Publish ở phân vùng Share

FilE Home Insert = Modeling View Optimize Help

Hình 13: Vị trí nút Chia sẻ Báo cáo

Kết nối với Power BI Desktop bằng tài khoản Power BI sẽ mớ ra quyền truy cập vào tất cả các dịch vụ Power BI

Khi tạo báo cáo trong Power BI, ban can chon vi tri ma ban muôn chia sẻ báo cáo của mình Đây có thê là một trong Không gian làm việc của tôi, không gian làm việc nhóm của dịch vụ Power BI hoặc bat kỳ vị trí nào khác trong dịch vụ

- Nếu bạn chưa đăng nhập vào dịch vụ Power BI, hãy nhập tài khoản, sau đó bam hoặc nhắn vào Đăng nhập

Trang 21

20

Trang 22

Get Quick Insights

-_ Dịch vụ Power BI tải báo cáo vào trình duyệt Nếu ngăn điều hướng bên trái không được mở rộng, hãy bấm hoặc nhấn vào menu ở trên cùng bên trái (a) dé

mở rộng

21

Trang 23

Hình 14: Giao điện chỉa sẻ Báo cáo

Bạn có thể thấy rằng khi chúng ta phát hành, Power BI Desktop đã tải lên tập dữ liệu (d) và báo cáo (c) Ban tao bang thông tin trong dịch vụ, chứ không phải Power BI Desktop và không gian làm việc này chưa có bảng thông tin nao (b)

CHƯƠNG 3 QUY TRÌNH THỰC HIỆN PHẦN TÍCH DỮ LIỆU VÀ CÁC BUOC TIEN HANH

1 M6 ta nguén dé liéu

Nguồn dữ liệu được lấy trực tiếp từ Kaggle:

Bộ dữ liệu đã được kiểm tra và xử lý số liệu sao cho phù hợp với đồ án của

nhóm hơn Dữ liệu lưu lại và được sử dụng cho nghiên cứu với tên tệp

® Phân Tích Dữ Liệu

Tập dữ liệu này được thu thập từ một tổ chức giáo dục đại học với mục đích dự đoán tình trạng bỏ học và thành công trong học tập của sinh viên Dữ liệu bao

22

Trang 24

gồm thông tin đữ liệu nhân khâu học, đữ liệu kinh tế xã hội và kinh tế vĩ mô, dữ liệu tại thời điểm tuyến sinh và dữ liệu vào cuối học kỳ thứ nhất và thứ hai

Dữ liệu được sử dụng để xây dựng các mô hình phân loại nhằm dự đoán tình

trạng bỏ học và thành công trong học tập của học sinh Vấn đề được xây dựng dưới dạng nhiệm vụ phân loại với ba loại nhiệm vụ gồm: bỏ học, đã đăng ký và tốt nghiệp vào cuối thời gian bình thường của khóa học

Bộ dữ liệu gồm: 4425 dòng quan sát và 17 cột thuộc tính Trong đó, “mục tiêu”

là biến phụ thuộc, còn lại là các biến độc lập

Dữ liệu Marital status String Độc thân, đã Tinh trang hôn

nhân kết hôn nhân

khẩu

Nationality String Bồ Đào Nha, Quốc tịch

Đức, Tây Ban Nha,

Gender Numeric/bin 0,1 Giới tính

ary

23

Trang 25

Educational Numeric/bin 0,1 Nhu cầu giáo dục

ary

Tuition fees up Numeric/bin 0,1 Học phí cập nhật

Scholarship Numeric/bin 0,1 Giữ học bồng

Dữ liệu Unemployment Numeric/co 7.6 dén 16.2 Tý lệ thất nghiệp

Trang 26

Daytime/evenin Numeric/bin 0,1 Tham dự ban

Previous Numeric/dis 1 đến 17 Trình độ chuyên

Curricular units Numeric/dis 0 dén 20 Don vi hoc ky 1

Trang 27

học kỳ Curricular units Numeric/dis 0 dén 26 Don vi hoc ky 1

Curricular units Numeric/co 0 đến 18.875 Đơn vị chương Ist sem (grade) ntinuous trinh hoc ky 1

(diém trung binh)

Dữ liệu Curricular units Numeric/dis 0 dén 19 Don vi hoc ky 2

hoc tap 2nd sem crete (có tín chỉ)

cuối (credited)

học kì 2

Curricular units Numeric/dis 0 dén 20 Don vi hoc ky 2

Trang 29

3 - Dịch vụ xã hội (đi học buổi tối)

Ngày đăng: 15/01/2025, 21:38

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN