Những gì tìm hiểu được về file Trang 3 Institituon: cung cấp tên của các trường đại học được xếp hạng. Country: thông tin về quốc gia mà trường đại học đó thuộc về. National rank: X
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
- -TIỂU LUẬN
BÁO CÁO CUỐI KÌ HỌC PHẦN NHẬP MÔN KHOA HỌC DỮ LIỆU
Họ và tên sinh viên : Phạm Ngọc Mai
Giảng viên : TS Nguyễn Hoàng Long
Mã sinh viên : 22031878
Điện thoại : 0373649958
Ngành : Quản lý thông tin CLC
HÀ NỘI 6 – 2023
Trang 2I Giới thiệu về file dữ liệu (University ranking Shanghai)
Tên file University ranking SHANGHAI
Mục thành phần trong file
World rank Institution Country National rank Quality of education Alumni employment Quality of faculty Publications In昀氀uence Citations Broad impact Patents Score Year
1 Những gì tìm hiểu được về file
World rank: cho biết vị trí xếp hạng của từng trường đại học trên toàn cầu theo hệ thống xếp hạng của trường đại học Thượng Hải
Trang 3 Institituon: cung cấp tên của các trường đại học được xếp hạng
Country: thông tin về quốc gia mà trường đại học đó thuộc về
National rank: Xếp hạng của trường đại học đó trong đất nước mà nó đặt
Quality of education: đánh giá chất lượng giáo dục dựa trên những đánh giá nhất định
Alumni employment: Tỷ lệ sinh viên tốt nghiệp có việc làm sau khi rời khỏi trường
Quality of faculty: Chất lượng của giảng viên và nhân viên giảng dạy
Publications: Số lượng bài báo được công bố từ trường đại học
In昀氀uence: Sự ảnh hưởng của trường đại học trong cộng đồng học thuật
Citations: Số lượng trích dẫn của các bài báo từ trường đại học
Broad impact: Tầm ảnh hưởng của trường đại học trong các lĩnh vực rộng
Patents: Số lượng bằng sáng chế được đăng ký từ
trường đại học
Score: Đây là một điểm số tổng thể dùng để xếp hạng trường đại học, có thể được tính dựa trên các yếu tố khác nhau như chất lượng giáo dục, thành tựu nghiên cứu, tầm ảnh hưởng và các chỉ số khác
Trang 4 Year: Thông tin này chỉ ra năm liên quan đến các thông tin trong 昀椀le dữ liệu, cho biết dữ liệu thuộc về khoảng thời gian nào.Năm mà bảng xếp hạng được công bố
Em có thể thấy một số tương quan có thể tồn tại giữa các thông tin:
Quality of education và Alumni employment: Chất
lượng giáo dục có thể ảnh hưởng đến tỷ lệ sinh viên tốt nghiệp có việc làm Nếu chất lượng giáo dục tốt, có thể tăng khả năng sinh viên tìm được việc làm sau khi tốt nghiệp
Quality of education và Quality of faculty: Chất
lượng giáo dục phụ thuộc vào đội ngũ giảng viên Nếu trường đại học có đội ngũ giảng viên chất lượng, có thể cung cấp một môi trường học tập tốt hơn và nâng cao chất lượng giáo dục
Quality of faculty và Publications: Chất lượng giảng
viên có thể ảnh hưởng đến hoạt động nghiên cứu
và công bố bài báo của trường đại học Nếu có đội ngũ giảng viên chất lượng, có khả năng nghiên cứu tốt, thì số lượng và chất lượng bài báo công bố
có thể tăng
In昀氀uence và Citations: Mức độ ảnh hưởng của
trường đại học trong cộng đồng học thuật có thể được đo bằng số lượng trích dẫn các nghiên cứu
Trang 5của trường Nếu trường đại học có ảnh hưởng lớn,
có khả năng nghiên cứu chất lượng, thì số lượng trích dẫn có thể cao
Broad impact và Patents: Tầm ảnh hưởng rộng của
trường đại học có thể liên quan đến số lượng bằng sáng chế mà trường đã đạt được Nếu trường đại học có ảnh hưởng lớn trong các lĩnh vực khoa học, công nghệ, thì có thể tạo ra nhiều bằng sáng chế
Em có thể thấy được bảng xếp hạng của các
trường đại học trên thế giới và tại sao trường đó lại
có thứ hạng như vậy vì những lí do khách quan được tổng hợp Dựa trên chất lượng về giáo dục, tỷ
lệ việc làm của sinh viên khi ra trường, ấn phẩm của trường, những sáng chế ,
Từ những yếu tố thành phần quyết định điểm số, xếp hạng cho trường
File dữ liệu: File dữ liệu bao gồm hơn 2000 hàng dữ liệu khác nhau, là
tổng hợp xếp hạng của các trường đại học trên thế giới theo các top xếp hạng (100 - 1000) trải dài từ năm 2012 đến 2015 Ngoài ra còn có thêm các dữ liệu khác liên quan trực tiếp đến các trường đại học (national rank, quality of education, alumni employment, quality of faculty, publications, influence, citations, broad impact, patents, score)
Trang 6II Xử lí dữ liệu
1 Vấn đề tồn tại trong file dữ liệu
TIN SAI
SỬA
Coutry
Kingdom
Viết một tên nước
để đồng
bộ bảng
dữ liệu khi vẽ biểu đồ America
2 7 11 14 21 762 954 1883 2033
USA
National_rank
không có
số lẻ, phải là số chẵn
Quality_of_educa
tion
Hai mươi
Viết số, không viết chữ
Trang 7Bốn mươi tám phẩy tám
Xếp hạng không có
số lẻ, phải là số chẵn
điểm lớn hơn 100
Xếp hạng năm 2012
2 Quá trình thực hiện
i Biểu đồ cột: Sử dụng biểu đồ cột để so sánh sự
chênh lệch giữa chất lượng đào tạo và độ nổi tiếng của các trường đại học trên toàn cầu hoặc từng quốc gia Cột thể hiện xếp hạng, điểm số của từng trường, giúp em dễ dàng so sánh và nhìn thấy sự chênh lệch giữa các trường
Trang 8ii Biểu đồ cột ngang: em chọn ra 5 Quốc gia có tỉ
lệ sinh viên cao nhất
Trang 9iii Biểu đồ cột kép: em so sánh mối tương quan giữa chất
lượng nghiên cứu khoa học và bằng sáng chế của các trường đại học trên các quốc gia Để thấy sự chênh lệch của các yếu tố ảnh hưởng đến xếp hạng, điểm số của các trường trên các quốc gia, vì không phải cứ có bằng sáng chế là chất lượng nghiên cứu tốt
iv Biểu đồ cột ngang: Sử dụng biểu đồ cột ngang
để theo dõi chất lượng giáo dục và những ảnh hưởng sâu rộng tác động đến chất lượng giáo dục của các trường đại học qua các quốc gia Điều này giúp em nhìn thấy sự thay đổi và tiến triển ngành giáo dục qua các quốc gia
Trang 10 Biểu đồ cột ngang: so sánh tỉ lệ sinh viên thấy rõ sự chênh lệch trong dãy cột ngắn dài Người xem dễ quan sát khoảng cách giữa top 1 và top 2 dễ dàng hơn
v Biểu đồ cột: giúp em so sánh giữa chất lượng
khoa và sự biểu dương của các khoa trong các trường đại học qua các quốc gia, giúp em theo dõi sự tương quan giữa chất lượng khoa và sự biểu dương các khoa của các trường đại học của các quốc gia
Trang 11Các biểu đồ em đều dùng pivot table để thống kê dữ liệu qua các năm, giúp người
xem, lọc thông tin một cách dễ dàng
III Dash Board
Em tổng hợp tất cả các sơ đồ em đã làm, rồi dùng Pivot table để thống kê
dữ liệu qua các năm
Trang 12 Em lấy top 5 trong các cột thông tin Vì người đọc để ý những trường top trên, ít ai có thể đủ thời gian, hay quan sát nhiều thông tin của quá nhiều trường, nhiều quốc gia trong 1 bảng dữ liệu dashboard
Em lọc 5 trường đại học có cao nhất bằng cách dùng hàm SUM rồi lọc trong 4 năm Max điểm là 400 từ đó xếp hạng, khi đó ta nhìn thấy trường nào lấy điểm cao top đầu thế giới qua các năm để có cái nhìn tổng quan
Em dùng PivotTable để xử lý số liệu về trích dẫn, bằng sáng chế, mức độ
mở rộng Em dùng biểu đồ kép 3 để so sánh 3 thông tin dữ liệu với nhau trong top 5 trường đại học có thông số ấn tượng nhất
Bài em còn nhiều thiếu sót, ý tưởng chưa thực sự phong phú, xử lý số liệu còn rối, mong thầy có thể xem xét và góp ý cho em hoàn thiện bài hơn ạ.
Em xin chân thành cảm ơn Thầy vì kì học vừa qua ạ!