Khai phá cụm hướng thời gian trên dữ liệu giáo dục

62 27 0
Khai phá cụm hướng thời gian trên dữ liệu giáo dục

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA LÊ MINH CHÂU KHAI PHÁ CỤM HƢỚNG THỜI GIAN TRÊN DỮ LIỆU GIÁO DỤC Ngành: KHOA HỌC MÁY TÍNH Mã số: 60480101 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 06 năm 2018 CƠNG TRÌNH ĐƢỢC HỒN THÀNH TẠI TRƢỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG –HCM Cán hƣớng dẫn khoa học: TS Võ Thị Ngọc Châu Cán chấm nhận xét 1: PGS.TS Quản Thành Thơ Cán chấm nhận xét 2: PGS.TS Hồ Bảo Quốc Luận văn thạc sĩ đƣợc bảo vệ Trƣờng Đại học Bách Khoa, ĐHQG TP.HCM ngày 17 tháng 07 năm 2018 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: Chủ tịch hội đồng: PGS.TS Dƣơng Tuấn Anh Thƣ kí: TS Nguyễn Hồ Mẫn Rạng GV phản biện 1: PGS.TS Quản Thành Thơ GV phản biện 2: PGS.TS Hồ Bảo Quốc Ủy viên: TS Lê Thanh Vân Xác nhận Chủ tịch Hội đồng đánh giá LV Trƣởng Khoa quản lý chuyên ngành sau luận văn đƣợc sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƢỞNG KHOA KH&KTMT ĐẠI HỌC QUỐC GIA TP.HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Lê Minh Châu MSHV: 7140818 Ngày, tháng, năm sinh: 31/08/1983 Nơi sinh: TP.Hồ Chí Minh Ngành: Khoa Học Máy Tính Mã số : 60480101 I TÊN ĐỀ TÀI: Khai phá cụm hƣớng thời gian liệu giáo dục II NHIỆM VỤ VÀ NỘI DUNG: - Tìm hiểu lý thuyết cơng trình liên quan mơ hình chủ đề mơ hình chủ đề hƣớng thời gian Mơ hình hóa liệu học tập sinh viên khoa Khoa Học Máy Tính, trƣờng Đại học Bách Khoa TP.HCM theo mơ hình chủ đề hƣớng thời gian Thực nghiệm mơ hình chủ đề, mơ hình chủ đề hƣớng thời gian giải thuật K-Means liệu học tập sinh viên Phân tích đánh giá cụm nhằm xác định tiến độ học tập sinh viên môn học ảnh hƣởng đến kết học tập sinh viên Trực quan hóa cụm chủ đề III NGÀY GIAO NHIỆM VỤ: 15/01/2018 IV.NGÀY HOÀN THÀNH NHIỆM VỤ: 17/06/2018 V CÁN BỘ HƢỚNG DẪN : TS Võ Thị Ngọc Châu TP HCM, ngày 17 tháng 06 năm 2018 CÁN BỘ HƢỚNG DẪN TRƢỞNG KHOA KH & KTMT (Họ tên chữ ký) (Họ tên chữ ký) LỜI CÁM ƠN Tôi xin gửi lời cám ơn chân thành đến sâu sắc đến TS Võ Thị Ngọc Châu – khoa Khoa học máy tính – Trƣờng ĐH Bách Khoa TP.HCM Trong suốt trình thực đề tài, Cô bỏ nhiều công sức thời gian tận tình hƣớng dẫn tạo điều kiện để tơi hồn thành tốt luận văn Tôi gửi lời cám ơn chân thành đến Thầy Cô khoa Khoa học máy tính Các Thầy Cơ tận tình dạy trang bị kiến thức, tạo điều kiện để tơi hồn thành luận văn Tơi xin gửi lời cám ơn đến gia đình, đồng nghiệp, bạn bè tạo điều kiện giúp đỡ thời gian tinh thần thời gian tơi hồn thành luận văn Trong thời gian thực luận văn, đƣợc hỗ trợ giúp đỡ Thầy Cơ, gia đình, bạn bè đồng nghiệp Tơi cố gắng hồn thành luận văn với hết khả thân Tuy nhiên không tránh khỏi thiếu sót Kính mong q Thầy Cơ bạn tận tình bảo góp ý để luận văn đƣợc hồn thiện TP Hồ Chí Minh, ngày 17 tháng 06 năm 2018 Học viên Lê Minh Châu TÓM TẮT LUẬN VĂN Trong năm gần đây, khả tính tốn máy tính đƣợc nâng lên tầm cao lƣợng liệu ngày lớn Việc nghiên cứu liệu lớn ứng dụng học máy xử lý liệu dần trở thành nhu cầu cấp thiết Trong toán xử lý liệu, tốn gom cụm liệu ln thách thức không nhỏ với cộng đồng nhà khoa học liệu Giải thuật mơ hình chủ đề Latent Dirichlet Allocation (LDA) đƣợc đề xuất nhƣ giải pháp ứng dụng tảng toán học thống kê việc giải toán gom cụm.Hiện nay, nhiều nghiên cứu mở rộng mơ hình LDA nhằm đáp ứng u cầu đa dạng khai phá liệu văn bản, bật số mơ hình chủ đề hƣớng thời gian Dynamic Topic Model (DTM) với tính xác định tiến triển chủ đề theo khung thời gian Trong luận văn này, đề tài đề xuất áp dụng mơ hình chủ đề hƣớng thời gian DTM nhƣ giải pháp cho toán gom cụm phân tích liệu học tập sinh viên khoa Khoa Học Máy Tính, trƣờng Đại Học Bách Khoa TP.HCM, theo thời gian Từ việc phân tích đặc trƣng cụm sinh viên cụm môn học, trình học tập sinh viên học kỳ nhƣ môn học ảnh hƣởng đến kết học tập sinh viên đƣợc xác định cách nhanh chóng hiệu Kết đạt đƣợc từ giải pháp đề tài cho thấy vƣợt trội mơ hình DTM khám phá cụm so với mơ hình khác (LDA, K-Means) Giá trị độ đo perplexity mơ hình cụm đạt đƣợc từ mơ hình DTM thƣờng tốt đƣợc đánh giá liệu học kỳ khóa 2006 ABSTRACT In recent years, the computing power of computers has risen to a new height and the amount of data is growing Research big data and apply machine learning in data processing are gradually becoming an urgent needed In data processing problems, the problem of clustering data is always a challenge to the data scientists The Latent Dirichlet Allocation (LDA) algorithm was proposed as a statistical mathematical platform solution for solving clustering problems Currently, many of research extend the LDA algorithm to meet diverse requirements in text data mining, most notably Dynamic Topic Model (DTM), with the ability to determine the evolution of topics of a collection of documents over time The thesis propose to apply DTM as a solution for clustering problems and to analyze student records at Computer Science Faculty, Ho Chi Minh city University Of Technology By analyzing the characteristics of a student cluster or subject cluster, the learning process of the students in each semester as well as subjects affecting the student's academic performance is determined quickly and effective The results obtained from the proposed solution show that DTM is better than others (LDA, K-Means) in cluster discovery The perplexity value of this model is usually better when evaluated student records of the six semesters in 2006 course LỜI CAM ĐOAN Tôi xin cam đoan ngồi kết quả, thơng tin đƣợc tham khảo từ cơng trình khác nhƣ ghi rõ luận văn, cơng việc, kết đƣợc trình bày luận văn tơi thực chƣa đƣợc sử dụng để lấy chứng chỉ, cấp khác TP HCM, ngày 17 tháng 06 năm 2018 Học viên Lê Minh Châu Mục lục NHIỆM VỤ LUẬN VĂN THẠC SĨ LỜI CÁM ƠN TÓM TẮT LUẬN VĂN ABSTRACT LỜI CAM ĐOAN Chƣơng 1.1 Lí chọn đề tài 1.2 Mục tiêu nghiên cứu 1.3 Ý nghĩa khoa học 1.4 Ý nghĩa thực tiễn 1.5 Phạm vi thực đề tài Chƣơng 2.1 Nền tảng lý thuyết 2.1.1 Mơ hình chủ đề ẩn 2.1.1.1 Phương pháp phân tích mơ hình chủ đề ẩn 2.1.1.2 Mơ hình sinh mơ hình chủ đề ẩn 2.1.1.3 Ước lượng tham số suy diễn với mô hình Gibbs Sampling cho mơ hình chủ đề ẩn 2.1.2 Mơ hình chủ đề hướng thời gian 2.1.2.1 Mô tả giải thuật 2.1.2.2 Ước lượng tham số theo phương pháp lọc Kalman 2.1.2.2.1 Giới thiệu 2.1.2.2.2 Phương pháp lọc Kalman mơ hình chủ đề hướng thời gian 2.1.3 Định dạng Blei’s lda-c 2.1.4 Phương pháp đánh giá mơ hình sử dụng Perplexity 10 2.2 Các nghiên cứu liên quan 10 2.2.1 Áp dụng mơ hình chủ đề phân tích chứng khốn [15] 10 2.2.2 Áp dụng mơ hình chủ đề hướng thời gian phân tích báo khoa học [11] 11 Chƣơng 13 3.1 Mơ hình tổng quát 13 3.2 Phương hướng giải 15 3.3 Dữ liệu minh họa 15 3.4 Phương pháp phân tích cụm 17 4.3.1 Phân tích cụm theo sinh viên 17 4.3.2 Phân tích cụm theo mơn học 18 Chƣơng 19 4.1 Câu hỏi thực nghiệm 19 4.2 Môi trường thực nghiệm 19 4.3 Chuẩn bị liệu 20 4.4 Kết thực nghiệm đánh giá 21 4.4.1 Mơ hình DTM 21 4.4.2 Mơ hình LDA 25 4.4.3 Giải thuật K-Means 28 4.4.4 So sánh phương pháp 30 4.4.4.1 So sánh chất lượng mẫu chuyển cụm 30 4.4.4.2 So sánh độ đo perplexity 33 4.4.5 Trực quan hóa cụm 34 Chƣơng 41 5.1 Các nội dung thực 41 5.2 Mức độ đạt đề tài 41 5.3 Hướng phát triển 41 TÀI LIỆU THAM KHẢO 42 PHỤ LỤC PHẦN LÝ LỊCH TRÍCH NGANG DANH MỤC VIẾT TẮT Từ BOW pLSA LDA DTM GS-SGLD NIPS S&P500 Nguyên văn Bag of Words Probabilistic Latent Semantic Analysis Latent Dirichlet Allocation Dynamic Topic Model Gibbs Sample - Stochastic Gradient Langevin Dynamics Neural Information Processing Systems Standard & Poor’s 500 Stock Index 4.4.5.2Trực quan hóa cụm sinh viên với mơ hình LDA Hình 17: Hình ảnh cụm sinh viên (LDA) cho học kỳ năm 2006 Hình 18: Hình ảnh cụm sinh viên (LDA) cho học kỳ năm 2006 Trang 38 Hình 19: Hình ảnh cụm sinh viên (LDA) cho học kỳ năm 2006 Hình 20: Hình ảnh cụm sinh viên (LDA) cho học kỳ năm 2006 Trang 39 Hình 21: Hình ảnh cụm sinh viên (LDA) cho học kỳ năm 2006 Hình 22: Hình ảnh cụm sinh viên (LDA) cho học kỳ năm 2006 Trang 40 Chƣơng KẾT LUẬN VÀ ĐỀ XUẤT 5.1 Các nội dung đƣợc thực Đề tài đƣợc thực dựa sở việc áp dụng nội dung sau: - Tìm hiểu lý thuyết cơng trình liên quan mơ hình chủ đề mơ hình chủ đề hƣớng thời gian - Mơ hình hóa liệu học tập sinh viên với mơ hình chủ đề hƣớng thời gian - Phân tích cụm theo mục tiêu sau :  Xác định trình học tập sinh viên từ phân loại sinh viên gặp khó khăn việc học tập  Xác định nhóm mơn học ảnh hƣởng đến q trình học tập sinh viên - So sánh đánh giá cụm mơ hình LDA, mơ hình DTM K-Means - Trực quan hóa cụm 5.2 Mức độ đạt đƣợc đề tài Đề tài xác định đặc trƣng cụm sinh viên cụm mơn học Từ đó, phân loại đƣợc nhóm sinh viên học tốt, học khơng tốt có chuyển biến kết học tập Bằng việc so sánh, đánh giá kết cụm giải thuật (DTM, LDA, KMeans) đề tài cho thấy phù hợp mơ hình DTM cho khai phá cụm liệu học tập sinh viên 5.3 Hƣớng phát triển Một số hƣớng cải tiến cho đề tài: - Dựa vào phân tích cụm kết tìm đƣợc đƣợc sử dụng thực tiễn cho mơ hình hỗ trợ định hệ hỗ trợ định lĩnh vực giáo dục - Tự động hóa cơng đoạn phân tích cụm - Phân tích cụm phải gắn liền với trực quan hóa (bổ sung biểu đồ so sánh, trực quan hóa cụm môn học ,…) Trang 41 TÀI LIỆU THAM KHẢO [1] Deerwester, S Dumais, T Landauer, G Furnas, and R Harshman (1990), “Indexing by latent semantic analysis”, Journal of the American Society of Information Science , tập 41, 391-407 [2] Baeza-Yates, B Ribeiro-Neto (1999), “Modern Information Retrieval”, ACM Press , Addison-Wesley, New York [3] T.Hofmann (1999), ”Probabilistic latent semantic analysis”, Computer Science Division, University of California, Berkeley & International Computer Science Institute, Berkeley, CA [4] Thomas P.Minka (2000),”Estimating a Dirichlet distribution” ,Technical report, M.I.T [5] T.Hofmann (2001),“Unsupervised learning by probabilistic latent semantic indexing”, Machine Learning ,tập 42,177-196 [6] Lê Thanh Minh (2002),”Khai khoáng điểm thi tốt nghiệp phục vụ đánh giá phân loại học sinh”,luận văn Thạc sĩ,Đại học Khoa học Tự nhiên,TP.HCM [7] Nguyễn Quốc Thông (2002),”Phát triển số ứng dụng khai thác liệu vào giáo dục đào tạo”,luận văn Thạc sĩ,Đại học Khoa học Tự nhiên,TP.HCM [8] David M.Blei,Andrew Y.Ng,Michael I.Jordan (2003),“Latent Dirichlet Allocation” ,Journal of Machine Learning Research,tập 3,993-1022 [9] Markus Koskela, Jorma Laaksonen, and Erkki Oja(2004), ”Entropy-based measures for clustering and SOM topology preservation applied to content-based image indexing and retrieval”, Laboratory of Computer and Information Science, Helsinki University of Technology, Finland [10] Gregor Heinrich (2005),“Parameter Estimation for Text Analysis“,Technical report, University of Leipzig,Sachsen,Germany [11] David M.Blei, John D.Lafferty (2006),“Dynamic Topic Model”, Proceedings of the 23rd international Conference on Machine Learning ICML ’06,113-120 [12] Greg Welch,Gary Bishop (2006),”An introduction to the Kalman Filter”,University of North Carolina,North Carolina [13] Xuerui Wang,Andrew McCallum (2006),”Topics over Time:A Non-Markov Continuous-Time Model of Topical Trends”,University of Massachusetts,Massachusetts [14] Jiawei Han and Micheline Kamber (2006),“Data Mining: Concepts and Techniques, 2nd edition”, Morgan Kaufmann Publishers, San Francisco,CA [15] Gabriel Doyle, Charles Elkan (2009),”Financial Topic Model”,University of California ,San Diego ,CA Trang 42 [16] Phan Đình Thế Huân (2009),”Nghiên cứu ứng dụng phƣơng pháp khai mỏ luật kết hợp liệu giáo dục”,luận văn Thạc sĩ.Đại học Khoa học Tự nhiên ,TP.HCM [17] Xuan-Hieu Phan,Cam-Tu Nguyen,Dieu-Thu Le,Le-Minh Nguyen, Susumu Horiguchi, Senior Member,IEEE Quang-Thuy Ha (2011),“A Hidden Topic-Based Framework toward Building Applications with Short Web Documents”, IEEE , tập 23 (7),961-975 [18] William M.Darling (2011),“A theoretical and practical implementation tutorial on topic modeling and Gibbs sampling “,Technical report ,University of Guelph ,Guelph,Canada [19] Nguyễn Thị Vân Hảo (2011),”Xây dựng hệ thống dự đoán kết tốt nghiệp phổ thông trung học”,luận văn Thạc sĩ,Đại học Lạc Hồng ,Đồng Nai [20] Ali Daud (2012),“Using time topic modeling for semantics-based dynamic research interest finding”, Knowledge- Based Systems,tập 26 ,154-163 [21] Nguyễn Đăng Nhƣợng (2012),”Khai phá liệu kết học tập học sinh trƣờng cao đẳng nghề Văn Lang Hà Nội”,luận văn Thạc sĩ,Đại học Công nghệ,ĐHQGHN [22] Thi-Tuoi Nguyen, Tri-Thanh Nguyen Quang-Thuy Ha (2013),”Applying Hidden Topics in Ranking Social Update Streams on Twitter”,IEEE RIVF,180-185 [23] Đỗ Thanh Nghị,Phạm Nguyên Khang,Nguyễn Minh Trung Trịnh Trung Hƣng (2014),”Phát môn học quan trọng ảnh hƣởng đến kết học tập sinh viên ngành Công Nghệ Thông Tin”,Tạp chí khoa học trƣờng Đại học Cần Thơ,tập 33,49-57 [24] Rel Guzman Apaza,Elizabeth Vera Cervantes,Laura Cruz Quispe,Jose Ochoa Luna (2014),”Online Courses Recommendation based on LDA”,National University of St.Agustin ,Arequipa, Peru [25] Arnab Bhadury, Jianfei Chen, Jun Zhu, Shixia Liu (2016), ”Scaling up Dynamic Topic Models, Tsinghua University, China [26] Nguyễn Xuân Long (2017), “Unsupervised learning,hierarchical models and inference algorithms”, Michigan Institute for Data Science, University of Michigan, Michigan [27] Perplexity, https://en.wikipedia.org/wiki/Perplexity [28] Perplexity in LDA Model, http://cfss.uchicago.edu/fall2016/text02.html [29] https://github.com/RaReTechnologies/gensim/tree/develop/docs/notebooks/datasets Trang 43 PHỤ LỤC Bảng 27: Bảng trích điểm học tập sinh viên s001001 s001004 s001025 s003001 s003002 s003003 s003004 s006001 s006002 s006004 s006018 s006023 s007001 s007002 s007005 s008001 s500300 s501120 s501127 s501128 s501130 s501302 s501303 s502001 s502002 s503001 s503002 s503003 s504002 s505001 s505002 s505003 s505004 s505005 s506001 s506002 s604001 HK1 0 4.7 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0 4.6 HK2 0 4.7 0 5.1 2.7 0 5.3 0 2.2 0 0 0 0 0 0 0 0 4.6 HK3 0 4.7 5 5.1 2.7 0 5.3 0 2.2 0 4.5 0.5 0 6.6 6.6 0 0 0 4.6 Trang HK4 0 4.7 5 5.1 2.8 6.4 0 5.3 0 5.2 2.2 0 4.5 0.5 5.8 6.6 6.6 3.5 0 4.2 4.6 HK5 0 6.6 4.8 5 5.1 2.8 6.4 0 5.3 4.9 8 5.2 2.2 0 6.5 6.6 0.5 5.8 6.6 6.6 3.5 3.4 0 4.2 4.2 4.7 HK6 0 6.6 4.8 5 5.1 2.8 6.4 0 5.3 4.9 8 5.2 2.2 0 6.5 6.6 0.5 5.8 2.4 6.6 6.6 3.5 3.4 3.2 4.2 4.2 4.7 Bảng 28: Bảng trích điểm học tập sinh viên 15 s001001 s001004 s001025 s003001 s003002 s003003 s003004 s006001 s006002 s006004 s006018 s006023 s007001 s007002 s007005 s008001 s500300 s501120 s501127 s501128 s501130 s501302 s501303 s502001 s502002 s503001 s503002 s503003 s504002 s505001 s505002 s505003 s505004 s505005 s506001 s506002 s604001 HK1 0 5.7 0 0 0 0 0 8.2 0 0 0 0 0 0 0 0 0 HK2 0 5.7 6.8 0 4.9 4.7 0 6.3 0 8.2 6.6 0 0 0 0 0 0 0 0 HK3 0 5.7 6.8 6.3 4.9 5.9 0 6.3 0 8.2 6.6 0 7.8 4.5 0 5.8 7.5 0 0 0 Trang HK4 0 5.7 6.8 6.3 6.4 4.9 6.2 5.9 8.4 6.3 0 8.2 6.6 0 7.8 4.5 5.8 7.5 5.8 0 5 HK5 0 5.7 6.8 6.3 6.4 8.6 6.2 5.9 8.4 6.3 8.2 6.6 0 7.8 8.3 6.5 5.8 7.5 5.8 5.4 0 6.9 HK6 0 5.7 6.8 6.3 6.4 8.6 6.2 5.9 6.4 8.4 6.3 8.2 6.6 0 7.8 8.3 6.5 5.8 7.5 7.2 5.4 6.7 6.8 6.9 Bảng 29: Bảng trích điểm học tập sinh viên 37 s001001 s001004 s001025 s003001 s003002 s003003 s003004 s006001 s006002 s006004 s006018 s006023 s007001 s007002 s007005 s008001 s500300 s501120 s501127 s501128 s501130 s501302 s501303 s502001 s502002 s503001 s503002 s503003 s504002 s505001 s505002 s505003 s505004 s505005 s506001 s506002 s604001 HK1 0 7.5 0 0 0 4.1 0 0 0 0 0 0 0 0 0 0 0 2.8 HK2 0 7.5 4.5 1.5 1.4 0 4.1 3.2 0 2.8 4.3 0 0 0 0 0 0 0 0 2.8 HK3 0 7.5 4.5 1.5 1.4 0 4.1 3.2 0 2.8 4.3 0 6.8 8.2 0 7.4 6.9 0 0 0 3.6 Trang HK4 0 7.5 4.5 1.5 1.4 0 4.1 3.2 0 8.2 4.3 0 6.8 8.2 0 7.4 6.9 4.8 0 4.2 3.6 HK5 0 7.5 7.1 5.4 1.5 1.4 6.8 7.8 3.2 0 8.5 8.2 4.3 0 6.8 8.2 8.2 0 7.4 6.9 4.8 9.4 0 4.2 6.1 HK6 0 7.5 7.1 5.4 1.5 1.4 6.8 7.8 3.2 0 8.5 8.2 4.3 0 6.8 8.2 8.2 6.1 7.4 6.9 9.4 8.4 7.8 6.8 6.1 Bảng 30: Bảng trích điểm học tập sinh viên 92 s001001 s001004 s001025 s003001 s003002 s003003 s003004 s006001 s006002 s006004 s006018 s006023 s007001 s007002 s007005 s008001 s500300 s501120 s501127 s501128 s501130 s501302 s501303 s502001 s502002 s503001 s503002 s503003 s504002 s505001 s505002 s505003 s505004 s505005 s506001 s506002 s604001 HK1 0 0 0 0 0 0 0 2.2 0 0 0 0 0 0 0 0 0 HK2 0 0 0 6.8 3.7 0 6.6 0 2.2 0.2 8.8 0 0 0 0 0 0 0 0 HK3 5.4 0 0 6.8 7 6.8 6.6 6.4 6.8 0.2 8.8 0 0 0 0 6.7 0 0 0 7.6 Trang HK4 5.4 8.1 0 0 6.8 8.9 7 6.8 6.5 6.6 6.4 6.8 0.2 8.8 0 0 0 3.2 1.8 6.7 4.7 0 0 7.6 HK5 5.4 8.1 7.8 6.1 0 6.8 8.9 7 6.8 6.5 6.6 6.4 6.8 0.2 8.8 0 8.5 7.5 3.2 1.8 6.7 4.7 6.5 0 5.2 7.6 HK6 5.4 8.1 7.8 6.1 1.2 6.8 8.9 7 6.8 6.5 6.6 6.4 6.8 0.2 8.8 0 8.5 7.5 3.2 1.8 6.7 6.4 6.5 6.1 0.5 5.2 7.6 Bảng 31: Bảng trích điểm học tập sinh viên 109 s001001 s001004 s001025 s003001 s003002 s003003 s003004 s006001 s006002 s006004 s006018 s006023 s007001 s007002 s007005 s008001 s500300 s501120 s501127 s501128 s501130 s501302 s501303 s502001 s502002 s503001 s503002 s503003 s504002 s505001 s505002 s505003 s505004 s505005 s506001 s506002 s604001 HK1 0 3.7 0 0 0 0 3.8 0 6.2 0 0 0 0 0 0 0 0 0 3.6 HK2 0 3.7 3.6 0 1.9 0.2 0 3.8 4.1 0 6.2 3.2 1.2 0 0 0 0 0 0 0 0 3.6 HK3 0 5.5 3.6 0 1.9 6.4 0.2 0 3.8 4.1 0 6.2 3.2 1.2 0 5.5 1.5 0 0.9 1.7 0 0 0 5.2 Trang HK4 0 5.5 4.2 5.2 5.6 6.4 0.2 0 3.8 4.1 0 6.2 3.2 1.2 0 5.5 1.5 3.2 0.9 1.7 2.8 0 5.2 HK5 0 5.5 5.1 5.2 4.6 5.6 6.4 0.2 0 5.1 4.1 6.2 3.2 1.2 0 5.5 4.4 1.5 3.2 0.9 2.8 1.4 0 5.2 HK6 0 5.5 5.1 5.2 4.6 5.6 6.4 0.2 0 5.1 5.6 6.2 3.2 1.2 0 5.5 4.4 1.5 3.2 0.9 3.2 1.4 3.2 5.2 Bảng 31: Bảng trích điểm học tập sinh viên 117 s001001 s001004 s001025 s003001 s003002 s003003 s003004 s006001 s006002 s006004 s006018 s006023 s007001 s007002 s007005 s008001 s500300 s501120 s501127 s501128 s501130 s501302 s501303 s502001 s502002 s503001 s503002 s503003 s504002 s505001 s505002 s505003 s505004 s505005 s506001 s506002 s604001 HK1 0 0 0 0 0 0 8.2 0 0 0 0 0 0 0 0 0 0 HK2 0 5.2 0 8.3 4.8 0 8.2 0 9.2 9.8 0 0 0 0 0 0 0 0 HK3 7.2 5.2 4.9 5.8 8.3 4.8 5.6 8.2 0 9.2 9.8 0 7.8 9.5 0 7.2 9.6 0 0 0 Trang HK4 7.2 5.2 4.9 5.8 5.5 8.3 6.2 4.8 5.6 8.2 0 9.2 9.8 0 7.8 9.5 8.2 7.2 9.6 7.9 0 9.2 HK5 7.2 5.2 5.8 5.8 5.5 8.3 6.2 8.9 5.6 8.2 6.4 9 9.2 9.8 0 7.8 7.1 9.5 8.2 7.2 9.6 7.9 9.4 0 9.2 8.6 HK6 4.4 7.2 5.2 5.8 5.8 5.5 8.3 6.2 8.9 6.2 5.6 8.2 6.4 9 9.2 9.8 8.5 0 7.8 7.1 9.5 8.2 7.8 7.2 9.6 7.9 9.4 8.2 9.2 8.6 Bảng 32: Bảng trích điểm học tập sinh viên 215 s001001 s001004 s001025 s003001 s003002 s003003 s003004 s006001 s006002 s006004 s006018 s006023 s007001 s007002 s007005 s008001 s500300 s501120 s501127 s501128 s501130 s501302 s501303 s502001 s502002 s503001 s503002 s503003 s504002 s505001 s505002 s505003 s505004 s505005 s506001 s506002 s604001 HK1 0 0 0 0 0 6.8 0 0 0 0 0 0 0 0 0 HK2 0 5.5 4.3 0 6.6 0 6.8 5.5 4.2 0 0 0 0 0 0 0 0 HK3 0 6.7 5.5 4.3 0 6.6 0 6.8 5.5 4.2 0 2.8 4.2 0 4.9 7.4 0 0 0 Trang HK4 0 6.7 5.5 4.3 0 6.6 0 6.8 5.5 4.2 0 2.8 4.2 0 4.9 7.4 0 0 0 HK5 0 6.7 5.5 4.3 6.8 8.7 6.6 9.5 6.8 5.5 4.2 0 2.8 8.5 4.2 0 4.9 7.4 8.5 0 6.3 HK6 0 6.7 5.5 4.3 6.8 8.7 6.6 9.5 6.8 5.5 4.2 0 2.8 8.5 4.2 0 4.9 7.4 8.5 0 6.3 Bảng 33: Bảng trích điểm học tập sinh viên 122 s001001 s001004 s001025 s003001 s003002 s003003 s003004 s006001 s006002 s006004 s006018 s006023 s007001 s007002 s007005 s008001 s500300 s501120 s501127 s501128 s501130 s501302 s501303 s502001 s502002 s503001 s503002 s503003 s504002 s505001 s505002 s505003 s505004 s505005 s506001 s506002 s604001 HK1 0 7.1 0 0 0 8.3 10 0 6.5 0 0 0 0 0 0 0 0 0 5.1 HK2 0 7.1 6.2 8.1 5.2 0 8.3 8.2 10 0 6.5 9.2 8.8 0 0 0 0 0 0 0 0 5.1 HK3 0 7.1 6.2 7.2 8.1 5.2 0 8.3 8.2 10 0 6.5 9.2 8.8 0 8.5 8.5 0 7.8 7.2 0 0 0 5.1 Trang HK4 0 7.1 6.2 7.2 8.1 7.5 5.2 7.3 8.3 8.2 10 0 6.5 9.2 8.8 0 8.5 8.5 7.8 7.8 7.2 7.5 0 5.1 HK5 0 7.1 6.2 7.2 8.1 7.5 5.2 6.8 7.3 8.3 8.2 10 6.5 9.2 8.8 0 8.5 8.2 8.5 7.8 7.8 7.2 7.5 9.4 0 7.5 5.1 HK6 5.4 0 7.1 6.2 7.2 8.1 7.5 5.2 6.8 7.3 8.3 8.2 10 6.5 9.2 8.8 0 8.5 8.2 8.5 7.8 8.4 7.8 7.2 7.5 9.4 8.8 7.5 5.1 PHẦN LÝ LỊCH TRÍCH NGANG Họ tên: Lê Minh Châu Ngày tháng năm sinh: 31/08/1983 Nơi sinh: TP.HCM Địa liên lạc: C005 chung cƣ 120 căn, Khu đô thị An Phú An Khánh, P.An Phú, Q.2, TP.HCM Địa Email: lmchau31@gmail.com QUÁ TRÌNH ĐÀO TẠO THỜI GIAN TRƢỜNG ĐÀO TẠO 2002 - 2006 Trƣờng Đại Học Khoa Học Tự Nhiên – ĐHQG TP HCM 2014 - 2018 Trƣờng Đại Học Bách Khoa – ĐHQG TP.HCM CHUYÊN NGÀNH Toán – Tin học TRÌNH ĐỘ Cử nhân Khoa Học Máy Tính Thạc sĩ QÚA TRÌNH CƠNG TÁC THỜI GIAN 2012 - 2015 2015 - 2018 ĐƠN VỊ CÔNG TÁC Ngân hàng TMCP Phƣơng Đơng Cơng ty cổ phần chứng khốn Bảo Việt Trang VỊ TRÍ CƠNG TÁC Chun viên Chuyên viên ... hình chủ đề hƣớng thời gian, đề tài đƣa phƣơng pháp tiếp cận khác việc gom cụm liệu giáo dục Trên sở kết cụm đạt đƣợc theo mơ hình chủ đề hƣớng thời gian, phƣơng pháp phân tích cụm theo sinh viên... 12 Chƣơng KHAI PHÁ CỤM TRÊN DỮ LIỆU GIÁO DỤC VỚI MÔ HÌNH CHỦ ĐỀ HƢỚNG THỜI GIAN 3.1 Mơ hình tổng quát Dựa vào tảng lý thuyết trình bày, đề tài đề xuất sử dụng mơ hình chủ đề hƣớng thời gian/ động... mơ hình chủ đề hƣớng thời gian có phù hợp cho khai phá cụm liệu học tập sinh viên hay không?  Q.4.1.4: Bao nhiêu cụm tối ƣu khai phá cụm sử dụng mơ hình chủ đề hƣớng thời gian? 4.2 Mơi trƣờng

Ngày đăng: 18/04/2021, 19:59

Mục lục

    NHIỆM VỤ LUẬN VĂN THẠC SĨ

    TÓM TẮT LUẬN VĂN

    1.1 Lí do chọn đề tài

    1.2 Mục tiêu nghiên cứu

    1.3 Ý nghĩa khoa học

    1.4 Ý nghĩa thực tiễn

    1.5 Phạm vi thực hiện đề tài

    2.1 Nền tảng lý thuyết

    2.1.1 Mô hình chủ đề ẩn

    2.1.1.1 Phương pháp phân tích mô hình chủ đề ẩn