1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận báo cáo cuối kì học phần nhập môn khoa học dữ liệu

13 17 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tiểu Luận Báo Cáo Cuối Kì Học Phần Nhập Môn Khoa Học Dữ Liệu
Tác giả Phạm Ngọc Mai
Người hướng dẫn TS Nguyễn Hoàng Long
Trường học Đại Học Quốc Gia Hà Nội
Chuyên ngành Quản Lý Thông Tin CLC
Thể loại tiểu luận
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 13
Dung lượng 1,01 MB

Nội dung

Những gì tìm hiểu được về file Trang 3  Institituon: cung cấp tên của các trường đại học được xếp hạng. Country: thông tin về quốc gia mà trường đại học đó thuộc về. National rank: X

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN

- -TIỂU LUẬN

BÁO CÁO CUỐI KÌ HỌC PHẦN NHẬP MÔN KHOA HỌC DỮ LIỆU

Họ và tên sinh viên : Phạm Ngọc Mai

Giảng viên : TS Nguyễn Hoàng Long

Mã sinh viên : 22031878

Điện thoại : 0373649958

Ngành : Quản lý thông tin CLC

HÀ NỘI 6 – 2023

Trang 2

I Giới thiệu về file dữ liệu (University ranking Shanghai)

Tên file University ranking SHANGHAI

Mục thành phần trong file

World rank Institution Country National rank Quality of education Alumni employment Quality of faculty Publications In昀氀uence Citations Broad impact Patents Score Year

1 Những gì tìm hiểu được về file

 World rank: cho biết vị trí xếp hạng của từng trường đại học trên toàn cầu theo hệ thống xếp hạng của trường đại học Thượng Hải

Trang 3

 Institituon: cung cấp tên của các trường đại học được xếp hạng

 Country: thông tin về quốc gia mà trường đại học đó thuộc về

 National rank: Xếp hạng của trường đại học đó trong đất nước mà nó đặt

 Quality of education: đánh giá chất lượng giáo dục dựa trên những đánh giá nhất định

 Alumni employment: Tỷ lệ sinh viên tốt nghiệp có việc làm sau khi rời khỏi trường

 Quality of faculty: Chất lượng của giảng viên và nhân viên giảng dạy

 Publications: Số lượng bài báo được công bố từ trường đại học

 In昀氀uence: Sự ảnh hưởng của trường đại học trong cộng đồng học thuật

 Citations: Số lượng trích dẫn của các bài báo từ trường đại học

 Broad impact: Tầm ảnh hưởng của trường đại học trong các lĩnh vực rộng

 Patents: Số lượng bằng sáng chế được đăng ký từ

trường đại học

 Score: Đây là một điểm số tổng thể dùng để xếp hạng trường đại học, có thể được tính dựa trên các yếu tố khác nhau như chất lượng giáo dục, thành tựu nghiên cứu, tầm ảnh hưởng và các chỉ số khác

Trang 4

 Year: Thông tin này chỉ ra năm liên quan đến các thông tin trong 昀椀le dữ liệu, cho biết dữ liệu thuộc về khoảng thời gian nào.Năm mà bảng xếp hạng được công bố

 Em có thể thấy một số tương quan có thể tồn tại giữa các thông tin:

 Quality of education và Alumni employment: Chất

lượng giáo dục có thể ảnh hưởng đến tỷ lệ sinh viên tốt nghiệp có việc làm Nếu chất lượng giáo dục tốt, có thể tăng khả năng sinh viên tìm được việc làm sau khi tốt nghiệp

 Quality of education và Quality of faculty: Chất

lượng giáo dục phụ thuộc vào đội ngũ giảng viên Nếu trường đại học có đội ngũ giảng viên chất lượng, có thể cung cấp một môi trường học tập tốt hơn và nâng cao chất lượng giáo dục

 Quality of faculty và Publications: Chất lượng giảng

viên có thể ảnh hưởng đến hoạt động nghiên cứu

và công bố bài báo của trường đại học Nếu có đội ngũ giảng viên chất lượng, có khả năng nghiên cứu tốt, thì số lượng và chất lượng bài báo công bố

có thể tăng

 In昀氀uence và Citations: Mức độ ảnh hưởng của

trường đại học trong cộng đồng học thuật có thể được đo bằng số lượng trích dẫn các nghiên cứu

Trang 5

của trường Nếu trường đại học có ảnh hưởng lớn,

có khả năng nghiên cứu chất lượng, thì số lượng trích dẫn có thể cao

 Broad impact và Patents: Tầm ảnh hưởng rộng của

trường đại học có thể liên quan đến số lượng bằng sáng chế mà trường đã đạt được Nếu trường đại học có ảnh hưởng lớn trong các lĩnh vực khoa học, công nghệ, thì có thể tạo ra nhiều bằng sáng chế

 Em có thể thấy được bảng xếp hạng của các

trường đại học trên thế giới và tại sao trường đó lại

có thứ hạng như vậy vì những lí do khách quan được tổng hợp Dựa trên chất lượng về giáo dục, tỷ

lệ việc làm của sinh viên khi ra trường, ấn phẩm của trường, những sáng chế ,

 Từ những yếu tố thành phần quyết định điểm số, xếp hạng cho trường

 File dữ liệu: File dữ liệu bao gồm hơn 2000 hàng dữ liệu khác nhau, là

tổng hợp xếp hạng của các trường đại học trên thế giới theo các top xếp hạng (100 - 1000) trải dài từ năm 2012 đến 2015 Ngoài ra còn có thêm các dữ liệu khác liên quan trực tiếp đến các trường đại học (national rank, quality of education, alumni employment, quality of faculty, publications, influence, citations, broad impact, patents, score)

Trang 6

II Xử lí dữ liệu

1 Vấn đề tồn tại trong file dữ liệu

TIN SAI

SỬA

Coutry

Kingdom

Viết một tên nước

để đồng

bộ bảng

dữ liệu khi vẽ biểu đồ America

2 7 11 14 21 762 954 1883 2033

USA

National_rank

không có

số lẻ, phải là số chẵn

Quality_of_educa

tion

Hai mươi

Viết số, không viết chữ

Trang 7

Bốn mươi tám phẩy tám

Xếp hạng không có

số lẻ, phải là số chẵn

điểm lớn hơn 100

Xếp hạng năm 2012

2 Quá trình thực hiện

i Biểu đồ cột: Sử dụng biểu đồ cột để so sánh sự

chênh lệch giữa chất lượng đào tạo và độ nổi tiếng của các trường đại học trên toàn cầu hoặc từng quốc gia Cột thể hiện xếp hạng, điểm số của từng trường, giúp em dễ dàng so sánh và nhìn thấy sự chênh lệch giữa các trường

Trang 8

ii Biểu đồ cột ngang: em chọn ra 5 Quốc gia có tỉ

lệ sinh viên cao nhất

Trang 9

iii Biểu đồ cột kép: em so sánh mối tương quan giữa chất

lượng nghiên cứu khoa học và bằng sáng chế của các trường đại học trên các quốc gia Để thấy sự chênh lệch của các yếu tố ảnh hưởng đến xếp hạng, điểm số của các trường trên các quốc gia, vì không phải cứ có bằng sáng chế là chất lượng nghiên cứu tốt

iv Biểu đồ cột ngang: Sử dụng biểu đồ cột ngang

để theo dõi chất lượng giáo dục và những ảnh hưởng sâu rộng tác động đến chất lượng giáo dục của các trường đại học qua các quốc gia Điều này giúp em nhìn thấy sự thay đổi và tiến triển ngành giáo dục qua các quốc gia

Trang 10

 Biểu đồ cột ngang: so sánh tỉ lệ sinh viên thấy rõ sự chênh lệch trong dãy cột ngắn dài Người xem dễ quan sát khoảng cách giữa top 1 và top 2 dễ dàng hơn

v Biểu đồ cột: giúp em so sánh giữa chất lượng

khoa và sự biểu dương của các khoa trong các trường đại học qua các quốc gia, giúp em theo dõi sự tương quan giữa chất lượng khoa và sự biểu dương các khoa của các trường đại học của các quốc gia

Trang 11

Các biểu đồ em đều dùng pivot table để thống kê dữ liệu qua các năm, giúp người

xem, lọc thông tin một cách dễ dàng

III Dash Board

Em tổng hợp tất cả các sơ đồ em đã làm, rồi dùng Pivot table để thống kê

dữ liệu qua các năm

Trang 12

 Em lấy top 5 trong các cột thông tin Vì người đọc để ý những trường top trên, ít ai có thể đủ thời gian, hay quan sát nhiều thông tin của quá nhiều trường, nhiều quốc gia trong 1 bảng dữ liệu dashboard

 Em lọc 5 trường đại học có cao nhất bằng cách dùng hàm SUM rồi lọc trong 4 năm Max điểm là 400 từ đó xếp hạng, khi đó ta nhìn thấy trường nào lấy điểm cao top đầu thế giới qua các năm để có cái nhìn tổng quan

 Em dùng PivotTable để xử lý số liệu về trích dẫn, bằng sáng chế, mức độ

mở rộng Em dùng biểu đồ kép 3 để so sánh 3 thông tin dữ liệu với nhau trong top 5 trường đại học có thông số ấn tượng nhất

Bài em còn nhiều thiếu sót, ý tưởng chưa thực sự phong phú, xử lý số liệu còn rối, mong thầy có thể xem xét và góp ý cho em hoàn thiện bài hơn ạ.

Em xin chân thành cảm ơn Thầy vì kì học vừa qua ạ!

Ngày đăng: 19/03/2024, 16:02

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w