II. NHIỆM VỤ VÀ NỘI DUNG: Tìm hiểu lý thuyết và các công trình liên quan về mô hình chủ đề và mô hình chủ đề hướng thời gian. Mô hình hóa dữ liệu học tập của sinh viên khoa Khoa Học Máy Tính, trường Đại học Bách Khoa TP.HCM theo mô hình chủ đề hướng thời gian. Thực nghiệm mô hình chủ đề, mô hình chủ đề hướng thời gian và giải thuật KMeans trên dữ liệu học tập của sinh viên. Phân tích đánh giá cụm nhằm xác định tiến độ học tập của sinh viên và các môn học ảnh hưởng đen kết quả học tập của sinh viên. Trực quan hóa các cụm chủ đề.
ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA LÊ MINH CHÂU KHAI PHÁ CỤM HƯỚNG THỜI GIAN TRÊN DỮ LIỆU GIÁO DỤC Ngành: KHOA HỌC MÁY TÍNH Mã số: 60480101 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 06 năm 2018 ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Lê Minh Châu MSHV: 7140818 Ngày, tháng, năm sinh: 31/08/1983 Nơi sinh: TP.Hồ Chí Minh Ngành: Khoa Học Máy Tính Mã số : 60480101 I TÊN ĐỀ TÀI: Khai phá cụm hướng thời gian liệu giáo dục II NHIỆM VỤ VÀ NỘI DUNG: - Tìm hiểu lý thuyết cơng trình liên quan mơ hình chủ đề mơ hình chủ đề hướng thời gian Mơ hình hóa liệu học tập sinh viên khoa Khoa Học Máy Tính, trường Đại học Bách Khoa TP.HCM theo mơ hình chủ đề hướng thời gian Thực nghiệm mơ hình chủ đề, mơ hình chủ đề hướng thời gian giải thuật K-Means liệu học tập sinh viên Phân tích đánh giá cụm nhằm xác định tiến độ học tập sinh viên môn học ảnh hưởng đen kết học tập sinh viên Trực quan hóa cụm chủ đề III NGÀY GIAO NHIỆM VỤ: 15/01/2018 IV NGÀY HOÀN THÀNH NHIỆM VỤ: 17/06/2018 V CÁN BỘ HƯỚNG DẪN : TS Võ Thị Ngọc Châu TP HCM, ngày 17 tháng 06 năm 2018 CÁN BỘ HƯỚNG DẪN TRƯỞNG KHOA KH & KTMT (Họ tên chữ ký) (Họ tên chữ ký) LỜI CÁM ƠN Tôi xin gửi lời cám ơn chân thành đến sâu sắc đến TS Võ Thị Ngọc Châu - khoa Khoa học máy tính - Trường ĐH Bách Khoa TP.HCM Trong suốt trình thực đề tài, Cô bỏ nhiều công sức thời gian tận tình hướng dẫn tạo điều kiện để tơi hồn thành tốt luận vãn Tôi gửi lời cám ơn chân thành đến Thầỵ Cơ khoa Khoa học máy tính Các Thầy Cơ tận tình dạy trang bị kiến thức, tạo điều kiện để tơi hồn thành luận vãn Tôi xin gửi lời cám ơn đến gia đình, đồng nghiệp, bạn bè tạo điều kiện giúp đỡ thời gian tinh thần thời gian tơi hồn thành luận vãn Trong thời gian thực luận văn, hỗ trợ giúp đỡ Thầy Cơ, gia đình, bạn bè đồng nghiệp Tơi cố gắng hồn thành luận vãn với hết khả thân Tuy nhiên khơng tránh khỏi thiếu sót Kính mong q Thầy Cơ bạn tận tình bảo góp ý để luận vãn hồn thiện TP Hồ Chí Minh, ngày 17 tháng 06 năm 2018 Học viên Lê Minh Châu TÓM TẮT LUẬN VĂN Trong năm gần đây, khả tính tốn máy tính nâng lên tầm cao lượng liệu ngày lớn Việc nghiên cứu liệu lớn ứng dụng học máy xử lý liệu dần trở thành nhu cầu cấp thiết Trong toán xử lý liệu, tốn gom cụm liệu ln thách thức không nhỏ với cộng đồng nhà khoa học liệu Giải thuật mơ hình chủ đề Latent Dirichlet Allocation (LDA) đề xuất giải pháp ứng dụng tảng toán học thống kê việc giải toán gom cụm.Hiện nay, nhiều nghiên cứu mở rộng mơ hình LDA nhằm đáp ứng u cầu đa dạng khai phá liệu văn bản, bật số mơ hình chủ đề hướng thời gian Dynamic Topic Model (DTM) với tính xác định tiến triển chủ đề theo khung thời gian Trong luận văn này, đề tài đề xuất áp dụng mơ hình chủ đề hướng thời gian DTM giải pháp cho toán gom cụm phân tích liệu học tập sinh viên khoa Khoa Học Máy Tính, trường Đại Học Bách Khoa TP.HCM, theo thời gian Từ việc phân tích đặc trưng cụm sinh viên cụm mơn học, q trình học tập sinh viên học kỳ môn học ảnh hưởng đến kết học tập sinh viên xác định cách nhanh chóng hiệu Kết đạt từ giải pháp đề tài cho thấy vượt trội mơ hình DTM khám phá cụm so với mơ hình khác (LDA, K-Means) Giá trị độ đo perplexity mơ hình cụm đạt từ mơ hình DTM thường tốt đánh giá liệu học kỳ khóa 2006 ABSTRACT In recent years, the computing power of computers has risen to a new height and the amount of data is growing Research big data and apply machine learning in data processing are gradually becoming an urgent needed In data processing problems, the problem of clustering data is always a challenge to the data scientists The Latent Dirichlet Allocation (LDA) algorithm was proposed as a statistical mathematical platform solution for solving clustering problems Currently, many of research extend the LDA algorithm to meet diverse requứements in text data mining, most notably Dynamic Topic Model (DTM), with the ability to determine the evolution of topics of a collection of documents over time The thesis propose to apply DTM as a solution for clustering problems and to analyze student records at Computer Science Faculty, Ho Chi Minh city University Of Technology By analyzing the characteristics of a student cluster or subject cluster, the learning process of the students in each semester as well as subjects affecting the student's academic performance is determined quickly and effective The results obtained from the proposed solution show that DTM is better than others (LDA, K-Means) in cluster discovery The perplexity value of this model is usually better when evaluated student records of the six semesters in 2006 course LỜI CAM ĐOAN Tơi xin cam đoan ngồi kết quả, thông tin tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc, kết trình bày luận văn tơi thực chưa sử dụng để lấy chứng chỉ, cấp khác TP HCM, ngày 17 tháng 06 năm 2018 Học viên Lê Minh Châu Mục Lục NHIỆM VỤ LUẬN VÀN THẠC sĩ LỜI CÁM ƠN TÓM TẮT LUẬN VÀN ABSTRACT LỜI CAM ĐOAN Chương .1 1.1 Lí chọn đề tài .1 1.2 Mục tiêu nghiên cứu 1.3 Ý nghĩa khoa học .2 1.4 Ý nghĩa thực tiễn 1.5 Phạm vi thực đề tài Chương .3 2.1 Nền tảng lý thuyết 2.1.1 Mơ hình chủ đề ẩn 2.1.1.1 Phương pháp phân tích mơ hình chủ đề ẩn 2.1.1.2 Mơ hình sinh mơ hình chủ đề ẩn 2.1.1.3 Ước lượng tham số suy diễn với mơ hình Gibbs Sampling cho mơ hình chủ đề ẩn 2.1.2 Mơ hình chủ đề hướng thời gian 2.1.2.1 Mô tả giải thuật .5 2.1.2.2 Ước lượng tham số theo phương pháp lọc Kalman 2.1.2.2.1 Giới thiệu 2.1.2.2.2 Phương pháp lọc Kalman mơ hình chủ đề hướng thời gian 2.1.3 Định dạng Blei's lda-c 2.1.4 Phương pháp đánh giá mơ hình sử dụng Perplexity 10 2.2 Các nghiên cứu liên quan .10 2.2.1 Áp dụng mơ hình chủ đề phân tích chứng khốn [15] 10 2.2.2 Áp dụng mơ hình chủ đề hướng thờigian phân tích báo khoa học [11] 11 Chương .13 3.1 Mơ hình tổng qt 13 3.2 Phương hướng giải .15 3.3 Dữ liệu minh họa 15 3.4 Phương pháp phân tích cụm 17 4.3.1 Phân tích cụm theo sinh viên .17 4.3.2 Phân tích cụm theo mơn học 18 Chương .19 4.1 Câu hỏi thực nghiệm 19 4.2 Môi trường thực nghiệm 19 4.3 Chuẩn bị liệu .20 4.4 Kết thực nghiệm đánh giá 21 4.4.1 Mơ hình DTM .21 4.4.2 Mơ hình LDA .25 4.4.3 Giải thuật K-Means 28 4.4.4 So sánh phương pháp .30 4.4.4.1 So sánh chất lượng mẫu chuyển cụm 30 4.4.4.2 So sánh độ đo perplexity 33 4.4.5 Trực quan hóa cụm .34 Chương .41 5.1 Các nội dung thực .41 5.2 Mức độ đạt đề tài 41 5.3 Hướng phát triển .41 TÀI LIỆU THAM KHẢO 42 PHỤ LỤC PHÀN LÝ LỊCH TRÍCH NGANG .9 DANH MỤC VIẾT TẮT Từ Nguyên văn BOW Bag of Words pLSA Probabilistic Latent Semantic Analysis LDA Latent Dirichlet Allocation DTM Dynamic Topic Model GS-SGLD Gibbs Sample - Stochastic Gradient Langevin Dynamics NIPS Neural Information Processing Systems S&P5OO Standard & Poor’s 500 Stock Index Chương GIỚI THIỆU TỔNG QUAN 1.1 Lí chọn đề tài Nghiên cứu ứng dụng khai phá liệu vào quản lý giáo dục đào tạo xem cần thiết cho nhà quản lý giáo dục, giúp công tác quản lý hoạch định chiến lược giáo dục ngày hiệu Gần có cơng trình nghiên cứu ứng dụng kỹ thuật khai phá diệu đem lại nhiều lợi ích công tác quản lý giáo dục Nghiên cứu Lê Thanh Minh [6] sử dụng khai phá luật kết hợp logic mờ kết thi tốt nghiệp THPT THCS cho mục tiêu đánh giá hiệu đào tạo cung cấp thông tin cần thiết cho trình nâng cao chất lượng học sinh Luận văn thạc sĩ Phan Đình Thế Huân [16] nghiên cứu phương pháp khai mỏ tìm luật kết hợp ttên liệu giáo dục ứng dụng thực nghiệm liệu kết học tập sinh viên trường Đại học Tôn Đức Thắng, nhằm hỗ trợ đánh giá dự đoán kết học tập sinh viên, qua nâng cao chất lượng đào tạo Nghiên cứu Nguyễn Thị Vân Hảo [19] đề xuất sử dụng giải thuật máy học định mạng Bayes dự đoán kết học tập sinh viên đại học sau đại học Trường Đại học cần Thơ Nhóm tác giả trường Đại học Quốc Gia St.Agustin, Peru nghiên cứu hệ thống khuyến nghị khóa học trực tuyến sử dụng LDA [8], [24] Hệ thống phân tích mơ tả ngắn khóa học trực tuyến từ Cousera, Udacity, Edx thực hiên phân cụm khóa học liên quan để người dùng dễ dàng tra cứu khóa học phù hợp Bên cạnh tìm hướng tiếp cận ừong khai phá liệu giáo dục, đề tài sử dụng mơ hình chủ đề hướng thời gian đặc điểm liệu cần khai thác thông tin bảng điểm sinh viên Bảng điểm sinh viên có thay đổi theo học kỳ năm học.Do vậy, ta cần tìm giải thuật gom cụm mà cụm có liên kết thời gian Trang I-Urr sinh VICE eno học kỹ n-.ìm 2006 Xả c sui vm ần - ữt M &iri crủ Sinh Viên Hình 21: Hình ảnh cụm sinh viên (LDA) cho học kỳ năm 2006 cum linh V í Ẻn cbo h Ợc kỳ isỏm 2000 n H m Hình 22: Hình ảnh cụm sinh viên (LDA) cho học kỳ năm 2006 Chương KẾT LUẬN VÀ ĐÈ XUẤT 5.1 Các nội dung thực Đề tài thực dựa sở việc ắp dụng nội dung sau: - lìm hiểu lý thuyết cơng trình liên quan mơ hình chủ đề mơ hình chủ đề hướng thời gian - Mơ hình hóa liệu học tập sinh viên với mơ hình chủ đề hướng thời gian - Phân tích cụm theo mục tiêu sau : Xác định q trình học tập sinh viên từ phân loại sinh viên gặp khó khăn việc học tập Xác định nhóm mơn học ảnh hưởng đen trình học tập sinh viên - So sánh đánh giá cụm mơ hình LDA, mơ hình DTM K-Means - Trực quan hóa cụm 5.2 Mức độ đạt đề tài Đề tài xác định đặc trưng cụm sinh viên cụm môn học Từ đó, phân loại nhóm sinh viên học tốt, học khơng tốt có chuyển biến kết học tập Bằng việc so sánh, đánh giá kết cụm giải thuật (DTM, LDA, K- Means) đề tài cho thấy phù hợp mô hình DTM cho khai phá cụm liệu học tập sinh viên 5.3 Hướng phát triển Một số hướng cải tiến cho đề tài: - Dựa vào phân tích cụm kết tìm được sử dụng thực tiễn cho mơ hình hỗ ừợ định hệ hỗ ừợ định lĩnh vực giáo dục - Tự động hóa cơng đoạn phân tích cụm - Phân tích cụm phải gắn liền với trực quan hóa (bổ sung biểu đồ so sánh, trực quan hóa cụm mơn học , ) TÀI LIỆU THAM KHẢO [1] Deerwester, s Dumais, T Landauer, G Furnas, and R Harshman (1990), “Indexing by latent semantic analysis”, Journal of the American Society of Information Science , tập 41, 391-407 [2] Baeza-Yates, B Ribeữo-Neto (1999), “Modern Information Retrieval”, ACM Press , Addison-Wesley, New York [3] T.Hofmann (1999), ’’Probabilistic latent semantic analysis”, Computer Science Division, University of California, Berkeley & International Computer Science Institute, Berkeley, CA [4] Thomas P.Minka (2000),’’Estimating a Dirichlet distribution” ,Technical report, M.I.T [5] T.Hofmann (2001),“Unsupervised learning by probabilistic latent semantic indexing”, Machine Learning ,tập 42,177-196 [6] Lê Thanh Minh (2002),”Khai khoáng điểm thi tot nghiệp phục vụ đánh giá phân loại học sinh”,luận văn Thạc sĩ,Đại học Khoa học Tự nhiên,TP.HCM [7] Nguyễn Quốc Thông (2002),’’Phát triển số ứng dụng khai thác liệu vào giáo dục đào tạo”,luận văn Thạc sĩ,Đại học Khoa học Tự nhiên,TP.HCM [8] David M.Blei,Andrew Y.Ng,Michael LJordan (2003),“Latent Dirichlet Allocation” Journal of Machine Learning Research,tập 3,993-1022 [9] Markus Koskela, Jorma Laaksonen, and Erkki Oja(2004), ’’Entropy-based measures for clustering and SOM topology preservation applied to content-based image indexing and retrieval”, Laboratory of Computer and Information Science, Helsinki University of Technology, Finland [10] Gregor Heinrich (2005),“Parameter Estimation for Text Analysis**,Technical report, University of Leipzig,Sachsen,Germany [11] David M.Blei, John D.Lafferty (2006),“Dynamic Topic Model”, Proceedings of the 23 rd international Conference on Machine Learning ICML ’06,113-120 [12] Greg Welch,Gary Bishop (2006),”An introduction to the Kalman Filter”,University of North Carolina,North Carolina [13] Xuerui Wang,Andrew McCallum (2006),’’Topics over Time:A Non-Markov ContinuousTime Model of Topical Trends”,University of Massachusetts,Massachusetts [14] Jiawei Han and Micheline Kamber (2006),“Data Mining: Concepts and Techniques, nd edition”, Morgan Kaufmann Publishers, San Francisco,CA [15] Gabriel Doyle, Charles Elkan (2009),’’Financial Topic Model”,University of California ,San Diego ,CA [16] Phan Đình Thế Huân (2009),”Nghiên cứu ứng dụng phương pháp khai mỏ luật kết hợp liệu giáo dục”,luận văn Thạc sĩ.Đại học Khoa học Tự nhiên ,TP.HCM [17] Xuan-Hieu Phan,Cam-Tu Nguyen,Dieu-Thu Le,Le-Minh Nguyen, Susumu Horiguchi, Senior Member,IEEE Quang-Thuy Ha (2011),“A Hidden Topic-Based Framework toward Building Applications with Short Web Documents”, IEEE, tập 23 (7),961-975 [18] William M.Darling (2011 ),“A theoretical and practical implementation tutorial on topic modeling and Gibbs sampling Technical report,University of Guelph ,Guelph,Canada [19] Nguyen Thị Vân Hảo (201 l),”Xây dựng hệ thống dự đoán kết tốt nghiệp phổ thông trung học”,luận văn Thạc sĩ,Đại học Lạc Hồng ,Đồng Nai [20] Ali Daud (2012),“Using time topic modeling for semantics-based dynamic research interest finding”, Knowledge- Based Systems,tập 26 ,154-163 [21] Nguyen Đăng Nhượng (2012),’’Khai phá liệu kết học tập học sinh trường cao đẳng nghề Văn Lang Hà Nội”,luận văn Thạc sĩ,Đại học Công nghệ,ĐHQGHN [22] Thi-Tuoi Nguyen, Tri-Thanh Nguyen Quang-Thuy Ha (2013),’’Applying Hidden Topics in Ranking Social Update Streams on Twitter”,IEEE RIVF, 180-185 [23] ĐỖ Thanh Nghị,Phạm Nguyen Khang,Nguyễn Minh Trung Trịnh Trung Hưng (2014),’’Phát môn học quan trọng ảnh hưởng đến kết học tập sinh viên ngành Cơng Nghệ Thơng Tin”,Tạp chí khoa học trường Đại học cần Thơ,tập 33,49-57 [24] Rel Guzman Apaza,Elizabeth Vera Cervantes,Laura Cruz Quispe,Jose Ochoa Luna (2014),’’Online Courses Recommendation based on LDA”,National University of StAgustin ,Arequipa, Peru [25] Amab Bhadury, Jianfei Chen, Jun Zhu, Shixia Liu (2016), ’’Scaling up Dynamic Topic Models, Tsinghua University, China [26] Nguyen Xuân Long (2017), “Unsupervised learning,hierarchical models and inference algorithms”, Michigan Institute for Data Science, University of Michigan, Michigan [27] Perplexity, https://en.wikipedia.org/wiki/Perplexity [28] Perplexity in LDA Model, http://cfss.uchicago.edu/fall2016/text02.html [29] https://github.com/RaReTechnologies/gensim/ttee/develop/docs/notebooks/datasets Bảng 31: Bảng trích điểm học tập sinh viên 109 PHỤ LỤC Trang Bảng 31: Bảng trích điểm học tập sinh viên 109 sOOlOOl S001004 S001025 S003001 S003002 S003003 S003004 S006001 S006002 S006004 S006018 S006023 S007001 S007002 S007005 S008001 S500300 S501120 S501127 S501128 S501130 S501302 S501303 S502001 S502002 S5O3OO1 S5O3OO2 S5O3OO3 S504002 S5O5OO1 S5O5OO2 S5O5OO3 S5O5OO4 S5O5OO5 S5O6OO1 S506002 SÓ04001 HK1 0 5.7 0 0 0 0 0 8.2 0 0 0 0 0 0 0 0 0 HK2 0 5.7 6.8 0 4.9 4.7 0 6.3 0 8.2 6.6 0 0 0 0 0 0 0 0 HK3 0 5.7 6.8 6.3 4.9 5.9 0 6.3 0 8.2 6.6 0 7.8 4.5 0 5.8 7.5 0 0 0 Trang HK4 0 5.7 6.8 6.3 6.4 4.9 6.2 5.9 8.4 6.3 0 8.2 6.6 0 7.8 4.5 5.8 7.5 5.8 0 5 HK5 0 5.7 6.8 6.3 6.4 8.6 6.2 5.9 8.4 6.3 8.2 6.6 0 7.8 8.3 6.5 5.8 7.5 5.8 5.4 0 6.9 HK6 0 5.7 6.8 6.3 6.4 8.6 6.2 5.9 6.4 8.4 6.3 8.2 6.6 0 7.8 8.3 6.5 5.8 7.5 7.2 5.4 6.7 6.8 6.9 Bảng 31: Bảng trích điểm học tập sinh viên 109 sOOlOOl S001004 S001025 S003001 S003002 S003003 S003004 S006001 S006002 S006004 S006018 S006023 S007001 S007002 S007005 S008001 S500300 S501120 S501127 S501128 S501130 S501302 S501303 S502001 S502002 S5O3OO1 S5O3OO2 S5O3OO3 S504002 S5O5OO1 S5O5OO2 S5O5OO3 S5O5OO4 S5O5OO5 S5O6OO1 S506002 SÓ04001 HK1 0 7.5 0 0 0 4.1 0 0 0 0 0 0 0 0 0 0 0 HK2 0 7.5 4.5 1.5 1.4 0 4.1 3.2 0 2.8 4.3 0 0 0 0 0 0 0 0 2.8 2.8 HK3 0 7.5 4.5 1.5 1.4 0 4.1 3.2 0 2.8 4.3 0 6.8 8.2 0 7.4 69 0 0 0 3.6 Trang HK4 0 7.5 4.5 1.5 1.4 0 4.1 3.2 0 8.2 4.3 0 6.8 8.2 0 7.4 69 4.8 0 4.2 3.6 HK5 0 7.5 7.1 5.4 1.5 1.4 6.8 7.8 3.2 0 8.5 8.2 4.3 0 6.8 8.2 8.2 0 7.4 69 4.8 9.4 0 4.2 HK6 0 7.5 7.1 5.4 1.5 1.4 6.8 7.8 3.2 0 8.5 8.2 4.3 0 6.8 8.2 8.2 6.1 7.4 69 9.4 8.4 7.8 6.1 6.1 6.8 Bảng 31: Bảng trích điểm học tập sinh viên 109 sOOlOOl S001004 S001025 S003001 S003002 S003003 S003004 S006001 S006002 S006004 S006018 S006023 S007001 S007002 S007005 S008001 S500300 S501120 S501127 S501128 S501130 S501302 S501303 S502001 S502002 S503001 S503002 S503003 S504002 S505001 S505002 S505003 S505004 S505005 S506001 S506002 SÓ04001 HK1 0 0 0 0 0 0 0 2.2 0 0 0 0 0 0 0 0 0 HK2 0 0 0 6.8 3.7 0 6.6 0 2.2 0.2 8.8 0 0 0 0 0 0 0 0 HK3 5.4 0 0 6.8 7 6.8 6.6 6.4 6.8 0.2 8.8 0 0 0 0 6.7 0 0 0 7.6 Trang HK4 5.4 8.1 0 0 6.8 8.9 7 6.8 6.5 6.6 6.4 6.8 0.2 8.8 0 0 0 3.2 1.8 6.7 4.7 0 0 7.6 HK5 5.4 8.1 7.8 6.1 0 6.8 8.9 7 6.8 6.5 6.6 6.4 6.8 0.2 8.8 0 8.5 7.5 3.2 1.8 6.7 4.7 65 0 5.2 7.6 HK6 5.4 8.1 7.8 6.1 1.2 6.8 8.9 7 6.8 6.5 6.6 6.4 6.8 0.2 8.8 0 8.5 7.5 3.2 1.8 6.7 6.4 6.5 6.1 0.5 5.2 7.6 Bảng 31: Bảng trích điểm học tập sinh viên 109 HK2 0 3.7 3.6 0 1.9 0.2 0 3.8 4.1 0 6.2 3.2 1.2 0 0 0 0 0 0 0 0 HK3 0 5.5 3.6 0 1.9 6.4 0.2 0 3.8 4.1 0 6.2 3.2 1.2 0 5.5 1.5 0 0.9 1.7 0 0 0 HK4 0 5.5 4.2 5.2 5.6 6.4 0.2 0 3.8 4.1 0 6.2 3.2 1.2 0 5.5 1.5 3.2 0.9 1.7 2.8 0 HK5 0 5.5 5.1 5.2 4.6 5.6 6.4 0.2 0 5.1 4.1 6.2 3.2 1.2 0 5.5 4.4 1.5 3.2 0.9 2.8 1.4 0 HK6 0 5.5 5.1 5.2 4.6 5.6 6.4 0.2 0 5.1 5.6 6.2 3.2 1.2 S506001 S506002 HK1 0 3.7 0 0 0 0 3.8 0 6.2 0 0 0 0 0 0 0 0 0 SÓ04001 3.6 3.6 5.2 5.2 5.2 5.2 sOOlOOl S001004 S001025 S003001 S003002 S003003 S003004 S006001 S006002 S006004 S006018 S006023 S007001 S007002 S007005 S008001 S500300 S501120 S501127 S501128 S501130 S501302 S501303 S502001 S502002 S503001 S503002 S503003 S504002 S505001 S505002 S505003 S505004 S505005 Trang 0 5.5 4.4 1.5 3.2 0.9 3.2 1.4 3.2 Bảng 31: Bảng trích điểm học tập sinh viên 117 sOOlOOl S001004 S001025 S003001 S003002 S003003 S003004 S006001 S006002 S006004 S006018 S006023 S007001 S007002 S007005 S008001 S500300 S501120 S501127 S501128 S501130 S501302 S501303 S502001 S502002 S5O3OO1 S5O3OO2 S5O3OO3 S504002 S5O5OO1 S5O5OO2 S5O5OO3 S5O5OO4 S5O5OO5 S5O6OO1 S506002 SÓ04001 HK1 0 0 0 0 0 0 8.2 0 0 0 0 0 0 0 0 0 0 HK2 0 5.2 0 8.3 4.8 0 8.2 0 9.2 9.8 0 0 0 0 0 0 0 0 HK3 7.2 5.2 4.9 5.8 8.3 4.8 5.6 8.2 0 9.2 9.8 0 7.8 9.5 0 7.2 96 0 0 0 HK4 7.2 5.2 4.9 5.8 5.5 8.3 6.2 4.8 5.6 8.2 0 9.2 9.8 0 7.8 9.5 8.2 7.2 96 7.9 0 9.2 HK5 7.2 5.2 5.8 5.8 5.5 8.3 6.2 8.9 5.6 8.2 6.4 9 9.2 9.8 0 7.8 7.1 9.5 8.2 7.2 96 7.9 9.4 0 9.2 8.6 HK6 4.4 7.2 5.2 5.8 5.8 5.5 8.3 6.2 8.9 6.2 5.6 8.2 6.4 9 9.2 9.8 8.5 6 6 6 Trang 0 7.8 7.1 9.5 8.2 7.8 7.2 96 7.9 9.4 8.2 9.2 8.6 Bảng 32: Bảng trích điểm học tập sinh viên 215 sOOlOOl S001004 S001025 S003001 S003002 S003003 S003004 S006001 S006002 S006004 S006018 S006023 S007001 S007002 S007005 S008001 S500300 S501120 S501127 S501128 S501130 S501302 S501303 S502001 S502002 S5O3OO1 S5O3OO2 S5O3OO3 S504002 S5O5OO1 S5O5OO2 S5O5OO3 S5O5OO4 S5O5OO5 S5O6OO1 S506002 SÓ04001 HK1 0 0 0 0 0 6.8 0 0 0 0 0 0 0 0 0 HK2 0 5.5 4.3 0 6.6 0 6.8 5.5 4.2 0 0 0 0 0 0 0 0 HK3 0 6.7 5.5 4.3 0 6.6 0 6.8 5.5 4.2 0 2.8 4.2 0 4.9 7.4 0 0 0 Trang HK4 0 6.7 5.5 4.3 0 6.6 0 6.8 5.5 4.2 0 2.8 4.2 0 4.9 7.4 0 0 0 HK5 0 6.7 5.5 4.3 6.8 8.7 6.6 9.5 6.8 5.5 4.2 0 2.8 8.5 4.2 0 4.9 7.4 8.5 0 6.3 HK6 0 6.7 5.5 4.3 6.8 8.7 6.6 9.5 6.8 5.5 4.2 0 2.8 8.5 4.2 0 4.9 7.4 8.5 0 6.3 Bảng 32: Bảng trích điểm học tập sinh viên 215 Trang Bảng 32: Bảng trích điểm học tập sinh viên 215 sOOlOOl S001004 S001025 S003001 S003002 S003003 S003004 S006001 S006002 S006004 S006018 S006023 S007001 S007002 S007005 S008001 S500300 S501120 S501127 S501128 S501130 S501302 S501303 S502001 S502002 S5O3OO1 S5O3OO2 S5O3OO3 S504002 S5O5OO1 S5O5OO2 S5O5OO3 S5O5OO4 S5O5OO5 S5O6OO1 S506002 SÓ04001 HK1 0 7.1 0 0 0 8.3 10 0 6.5 0 0 0 0 0 0 0 0 0 5.1 HK2 0 7.1 6.2 8.1 5.2 0 8.3 8.2 10 0 6.5 9.2 8.8 0 0 0 0 0 0 0 0 5.1 HK3 0 7.1 6.2 7.2 8.1 5.2 0 8.3 8.2 10 0 6.5 9.2 8.8 0 8.5 8.5 0 7.8 7.2 0 0 0 5.1 Trang HK4 0 7.1 6.2 7.2 8.1 7.5 5.2 7.3 8.3 8.2 10 0 6.5 9.2 8.8 0 8.5 8.5 7.8 7.8 7.2 7.5 0 5.1 HK5 0 7.1 6.2 7.2 8.1 7.5 5.2 6.8 7.3 8.3 8.2 10 6.5 9.2 8.8 0 8.5 8.2 8.5 7.8 7.8 7.2 7.5 9.4 0 7.5 5.1 HK6 5.4 0 7.1 6.2 7.2 8.1 7.5 5.2 6.8 7.3 8.3 8.2 10 6.5 9.2 8.8 0 8.5 8.2 8.5 7.8 8.4 7.8 7.2 7.5 9.4 8.8 7.5 5.1 PHẦN LÝ LỊCH TRÍCH NGANG Họ tên: Lê Minh Châu Ngày tháng năm sinh: 31/08/1983 Nơi sinh: TP.HCM Địa liên lạc: C005 chung cư 120 căn, Khu đô thị An Phú An Khánh, P.An Phú, Q.2, TP.HCM Đĩa Email: lmchau31 @ email.com Ờ Trang 10 ... mơ hình chủ đề hướng thời gian, đề tài đưa phương pháp tiếp cận khác việc gom cụm liệu giáo dục Trên sở kết cụm đạt theo mô hình chủ đề hướng thời gian, phương pháp phân tích cụm theo sinh viên... TÊN ĐỀ TÀI: Khai phá cụm hướng thời gian liệu giáo dục II NHIỆM VỤ VÀ NỘI DUNG: - Tìm hiểu lý thuyết cơng trình liên quan mơ hình chủ đề mơ hình chủ đề hướng thời gian Mơ hình hóa liệu học tập... Chương KHAI PHÁ CỤM TRÊN DỮ LIỆU GIÁO DỤC VỚI MƠ HÌNH CHỦ ĐỀ HƯỚNG THòi GIAN 3.1 Mơ hình tổng quát Dựa vào tảng lý thuyết trình bày, đề tài đề xuất sử dụng mơ hình chủ đề hướng thời gian/ động