Bài viết này đề xuất giải pháp dùng kỹ thuật phân rã ma trận tích hợp mạng xã hội (Social Matrix Factorization)trong xây dựng Hệ trợ giảng thông minh (Intelligent Tutoring System ITS). Trước hết chúng tôi điểm lại các khái niệm chính trongITS cũng như Kỹ thuật phân rã ma trận trong Hệ thống gợi ý, sau đó đề xuất mô hình dự đoán kết quả học tập của người học trongITS. Thực nghiệm trên tập dữ liệu thu thập từ thực tế cho thấy việc tích hợp thêm mối quan hệ xã hội của người học có khả năng làmtăng độ chính xác của mô hình dự đoán trong ITS.
Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX “Nghiên cứu ứng dụng Công nghệ thông tin (FAIR'9)”; Cần Thơ, ngày 4-5/8/2016 DOI: 10.15625/vap.2016.00023 GIẢI PHÁP TÍCH HỢP MẠNG XÃ HỘI TRONG XÂY DỰNG HỆ TRỢ GIẢNG THÔNG MINH Huỳnh Lý Thanh Nhàn1,3, Lê Huy Thập1, Nguyễn Thái Nghe2 Khoa Công nghệ Thông tin, Trường Đại học Lạc Hồng Khoa Công nghệ Thông tin & Truyền Thông, Trường Đại học Cần Thơ Khoa Kỹ thuật Công nghệ Môi trường, Trường Đại học An Giang hltnhan@agu.edu.com, lhthap1007@gmail.com, ntnghe@cit.ctu.edu.vn TÓM TẮT — Bài viết đề xuất giải pháp dùng kỹ thuật phân rã ma trận tích hợp mạng xã hội (Social Matrix Factorization) xây dựng Hệ trợ giảng thông minh (Intelligent Tutoring System - ITS) Trước hết điểm lại khái niệm ITS Kỹ thuật phân rã ma trận Hệ thống gợi ý, sau đề xuất mơ hình dự đốn kết học tập người học ITS Thực nghiệm tập liệu thu thập từ thực tế cho thấy việc tích hợp thêm mối quan hệ xã hội người học có khả làm tăng độ xác mơ hình dự đốn ITS Từ khố —Hệ thống gợi ý, hệ trợ giảng thông minh, khai phá liệu giáo dục, mạng xã hội giáo dục I GIỚI THIỆU Hệ trợ giảng thông minh hệ thống có khả tùy chỉnh phản hồi kết tức cho người học mà khơng cần can thiệp hay trợ giúp giáo viên Hệ trợ giảng thông minh (ITS)1 cấu thành từ ba lĩnh vực khác nhau: Khoa học máy tính, giáo dục, tâm lý học Theo hệ thống mà ITS có thành phần khác nhau, chất ITS có bốn thành phần chính: (1) Mơ hình liên quan đến việc học tập sinh viên (Student Model), (2) Khối kiến thức liên quan lĩnh vực học (Domain Knowledge), (3) Mơ hình liên quan đến việc dạy giáo viên (Instructor/Tutoring Model) (4) Giao diện người dùng (User Interface), minh họa Hình [6] Hình Sự cấu thành thành phần ITS Để có phản hồi thích hợp cho người học, công việc quan trọng “Student Model” dự đoán kết học tập sinh viên người học giải vấn đề (bài tập) cụ thể Tuy vậy, nghiên cứu này, chưa thảo luận việc xây dựng hệ trợ giảng thông minh cụ thể, mà tập trung vào công việc quan trọng “Student Model” sử dụng mơ hình để dự đốn lực học tập sinh viên với kết xác tốt Dự đốn lực học tập sinh viên có vai trò quan trọng lợi ích thảo luận nhiều nghiên cứu trước [1][2][4] Nhiều nghiên cứu xuất dự đoán lực học tập sinh viên từ phương pháp kỹ thuật truyền thống định, máy học vector hỗ trợ SVM, mô hình mạng Bayes, trình bày tài liệu [9]10], đến kỹ thuật gần hệ thống gợi ý (Reccomender Systems – RS) tìm thấy tài liệu [3][7][11] Tuy nhiên, đa số giải thuật thuộc nhóm RS tập trung khai thác với thuật tốn s , giải thuật chưa tận dụng hết vấn để m rộng nâng cao giải thuật mối quan hệ user thông tin b sung cho item http://en.wikipedia.org/wiki/Intelligent_tutoring_system 182 GIẢI PHÁP T PM N I TRON N TR IẢN T N MIN Với phát triển mạng xã hội trực tuyến ngày tăng làm cho việc tích hợp mạng xã hội vào RS ngày nhiều nhà nghiên cứu quan tâm Họ thực nghiệm kết cho thấy việc gợi ý đánh giá người dùng thông qua việc b sung thêm mối quan hệ bạn bè đạt độ xác tốt [13][14] iải pháp tích hợp hướng tiếp cận để giải vấn đề người dùng (cold-start) RS Sử dụng việc tích hợp mạng xã hội khơng giống việc tìm người dùng giống (similar user) mà sử dụng thành phần quan hệ hệ thống khác (facebook, twister,zalo…) b sung thông tin vào hệ thống RS làm cho việc dự đoán đạt kết tốt Bài viết đề xuất hướng tiếp cận tích hợp thơng tin mạng xã hội cho hệ trợ giảng thông minh, đặc biệt Student Model để dự đoán lực học tập sinh viên nhằm tận dụng thông tin từ mạng xã hội họ (đơn giản mối quan hệ bạn b lớp học, ta giả định “Nếu A bạn B, A học tốt chăm học ảnh hư ng đến B” ngược lại mối quan hệ khác có liệu), từ xây dựng thuật toán cho hướng tiếp cận đề xuất Phương pháp đề xuất thực nghiệm tập liệu thực tế đánh giá thông qua độ đo lỗi RMSE (Root Mean Squared Error) Kết cho thấy tích hợp mối quan hệ xã hội sinh viên giảm độ lỗi RMSE, tức mơ hình có khả dự đốn hiệu Sau giới thiệu phần Trong phần hai, báo trình bày nghiên cứu liên quan mật thiết với giải pháp đề xuất Phần ba phần giới thiệu giải pháp tích hợp mạng xã hội sinh viên, phần có trình bày phương pháp s (Matrix Factorization) cách thức tích hợp mạng xã hội vào Giải pháp đề xuất thử nghiệm qua tập liệu thực tế kết thực nghiệm trình bày phần bốn Phần cuối kết luận II NHỮNG NGHIÊN CỨU LIÊN QUAN Trong nghiên cứu [3] [11], tác giả ứng dụng kỹ thuật phân rã ma trận (Matrix Factorization - MF) vào toán dự đoán lực học tập sinh viên (Student-Model), kỹ thuật mang lại kết khả quan cho việc ứng dụng RS vào khai phá liệu giáo dục Tuy nhiên, kết đo độ lỗi RMSE cao chưa tận dụng vấn đề m rộng tích hợp vào giải thuật sơ để nâng cao hiệu dự đoán Nhiều nghiên cứu [13][14][15] nâng cao độ xác dự đốn kỹ thuật MF nhờ tận dụng mối quan hệ xã hội người dùng nhiều cách Trong tài liệu [12] tác giả làm phép so sánh phương pháp tích hợp mạng xã hội vào MF chọn phương pháp tốt Hạn chế giải thuật phụ thuộc vào hỗ trợ mối quan hệ tập liệu Kết thí nghiệm nghiên cứu cho thấy tích hợp mối quan hệ nâng cao hiệu thuật toán Tuy nhiên, nghiên cứu đưa giải ứng dụng cho toán thương mại giải trí Vì vậy, báo đưa hướng tiếp cận sử dụng mối quan hệ xã hội người dùng, hay “StudentModel” mối quan hệ bạn bè lớp học để tích hợp vào giải thuật Matrix Factorization để giải toán dự đoán lực học tập sinh viên Hệ trợ giảng thông minh III GIẢI PHÁP ĐỀ XUẤT Để tích hợp mạng xã hội vào kỹ thuật phân ma trận, trước tiên viết trình bày tương đồng chuyển đ i liệu sẵn có định dạng cần thiết thuật tốn Sau trình bày ngắn gọn kỹ thuật (baseline), kỹ thuật phân rã ma trận (xem thêm viết [11]) giới thiệu chi tiết hướng tiếp cận tích hợp mạng xã hội, mối quan hệ bạn bè sinh viên lớp A Chuyển đổi liệu định dạng thuật toán Trong hệ thống gợi ý (Recommender systems – RS) cấu thành danh sách người dùng (user - u), danh sách đối tượng hát, phim, sản phẩm (item – i) đánh giá (ratings - r) số đánh giá người dùng u đối tượng i Tương tự, toán dự đoán điểm học tập sinh viên mơ hình “Student-Model” có danh sách sinh viên s, danh sách môn học c điểm g Như vậy, việc dự đoán đánh giá người dùng toán xếp hạng (rating prediction) RS tương đương với toán dự đốn điểm sinh viên [3][11] (xem hình 2) Sự ánh xạ biểu diễn sau: {User Student} {Item Course} {Ratings Gradings} Hình Sự tương đồng toán dự đoán lực học tập sinh viên với toán xếp hạng Huỳnh Lý Thanh Nhàn, Lê Huy Thập, Nguyễn Thái Nghe 183 Ngoài ra, để tích hợp mạng xã hội người học vào kỹ thuật phân rã ma trận, mối quan hệ bạn bè sinh viên lớp chuyển thành ma trận quan hệ dạng nhị phân (như hình 3) để tích hợp vào giải thuật dự đốn Nếu hai người bạn lớp thể giá trị 1, không lớp có giá trị ma trận Hình Sự chuyển đ i quan hệ bạn b thành ma trận mối quan hệ B Kỹ thuật phân rã ma trận (Matrix Factorization - MF) Kỹ thuật phân rã ma trận việc chia ma trận lớn R thành hai ma trận W H có kích thước nhỏ nhiều so với ma trận R, cho R xây dựng lại từ hai ma trận nhỏ xác tốt [5], nghĩa Hình Minh họa kỹ thuật phân rã ma trận | | | | cho sinh viên s, môn học c ma trận mà dòng s véctơ bao gồm K nhân tố tiềm ẩn (latent factors) mô tả | | | | ma trận mà dòng c véctơ bao gồm K nhân tố tiềm ẩn mô tả cho Gọi w h phần tử tương ứng hai ma trận W H, hay w h véctơ bao gồm K nhân tố tiềm ẩn mô tả cho sinh viên s mơn học c, điểm số g sinh viên s môn học c dự đốn b i cơng thức: K gˆ sc wsk hck ws hcT (1) k 1 tham số mơ hình (còn gọi ma trận nhân tố tiềm ẩn) mà cần phải xác định cách tối ưu hóa tối thiểu (min) hàm mục tiêu (3) theo điều kiện đó, chẳng hạn RMSE (Root Mean Squared Error) RMSE gsi gˆ si 2 test | D | s,c,gDtest (2) Tối ưu hóa hàm mục tiêu theo phương pháp giảm dốc ngẫu nhiên (Stochastic Gradient Descent - SGD) [11] MF ( s ,c , g )D train K ( g sc wsk hck ) W k 1 F H Với λ hệ số tắc hóa (0 ≤ λ