Giải pháp hỗ trợ sinh viên lập kế hoạch học tập dựa trên tiếp cận tập thô

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	8
Dung lượng	506,45 KB

Nội dung

Bài viết này đề xuất một phương pháp mới trong dự đoán kết quả học tập của sinh viên nhằm hỗ trợ sinh viên lập kế hoạch học tập phù hợp. Thực nghiệm trên dữ liệu thực tế để xác định các sinh viên có thuộc diện “cảnh báo” hay “không cảnh báo” đã cho thấy phương pháp này có khả năng dự đoán tốt hơn so với các phương pháp khai phá dữ liệu tiêu biểu như Cây quyết định, láng giềng lân cận và một số phương pháp sinh luật khác. Tiếp cận tập thô cũng đã cho thấy nó rất hiệu quả trong trường hợp dữ liệu mất cân bằng.

Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX “Nghiên cứu ứng dụng Công nghệ thông tin (FAIR'9)”; Cần Thơ, ngày 4-5/8/2016 DOI: 10.15625/vap.2016.00019 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ Lê Đức Thắng1, Trương Thị Hải2, Nguyễn Thái Nghe1, Huỳnh Xuân Hiệp1 Khoa CNTT&TT, Trường Đại học Cần Thơ Khoa Công Nghệ, Trường Đại học Phú Xuân {ldthang,ntnghe,hxhiep}@cit.ctu.edu.vn, trnhai208@gmail.com TÓM TẮT—Lý thuyết tập thô (rough set theory) xây dựng tảng tốn học vững ứng dụng nhiều lĩnh vực, đặc biệt ứng dụng khoa học máy tính giải toán phân lớp (đa nhãn đơn nhãn), phân cụm luật kết hợp Dựa tiếp cận tập thô, viết đề xuất phương pháp dự đoán kết học tập sinh viên nhằm hỗ trợ sinh viên lập kế hoạch học tập phù hợp Thực nghiệm liệu thực tế để xác định sinh viên có thuộc diện “cảnh báo” hay “không cảnh báo” cho thấy phương pháp có khả dự đốn tốt so với phương pháp khai phá liệu tiêu biểu Cây định, láng giềng lân cận số phương pháp sinh luật khác Tiếp cận tập thô cho thấy hiệu trường hợp liệu cân Từ khóa—Lý thuyết tập thơ; bảng định; luật định; liệu cân bằng; lựa chọn môn học I GIỚI THIỆU Lý thuyết tập thô (rough set theory) - Zdzislaw Pawlak đề xuất năm 1982 [14] - xây dựng tảng tốn học vững ứng dụng nhiều lĩnh vực, đặc biệt ứng dụng khoa học máy tính giải tốn phân lớp (đa nhãn đơn nhãn), phân cụm luật kết hợp Bài viết đề xuất sử dụng lý thuyết tập thô xây dựng hệ thống hỗ trợ giáo dục đào tạo, đặc biệt việc dự đoán kết học tập sinh viên Thật vậy, dự đoán kết học tập sinh viên xác hữu ích nhiều ngữ cảnh khác trường đào tạo đại học sau đại học Chẳng hạn, xác định ứng viên xuất sắc để tham gia đội tuyển tin học, cấp học bổng nhằm khuyến khích họ nỗ lực học tập, hay việc xác định sinh viên có lực yếu để có biện pháp thích hợp nhằm hỗ trợ họ học tập tốt Thời gian gần đây, số lượng sinh viên bị buộc thơi học có chiều hướng tăng nhiều trường đại học (chẳng hạn Đại học Cần Thơ, hàng năm có 150 sinh viên thuộc diện buộc học kết học tập yếu [4]) thường tập trung vào sinh viên học năm thứ ba năm thứ tư Một phần ngun nhân sinh viên khơng có kế hoạch học tập phù hợp Hiện tượng gây tổn thất lớn cho thân sinh viên, gia đình tồn xã hội Chính việc phát sớm học viên yếu để giúp họ lập kế hoạch học tập cho ph hợp nhu cầu cần thiết Dự đoán kết học tập sinh viên nhiều nhà nghiên cứu quan tâm, [1][2][3][5][7][8][10][11] Hàng năm có hội thảo quốc tế chuyên lĩnh vực (xem chi tiết www.educationaldatamining.org), ta tìm thấy nghiên cứu gần Tuy nhiên phần lớn nghiên cứu tập trung vào việc ứng dụng kỹ thuật khai phá liệu (data mining) dự đoán kết học tập sinh viên [12][13] Nghiên cứu đề xuất phương pháp dự đoán kết học tập sinh viên dựa tiếp cận tập thô Trước hết, viết giới thiệu ưu điểm lý thuyết tập thô, d ng để đơn giản hóa thơng tin trước sinh luật định, tập luật thu tối tiểu bao hàm thông tin mong muốn Sau đề xuất ứng dụng cho tốn dự đốn/phân lớp (prediction/classification) sinh viên thuộc diện cảnh báo học vụ hay khơng, từ hỗ trợ họ lập kế hoạch học tập phù hợp Thực nghiệm liệu thực tế cho thấy phương pháp có khả dự đoán tốt so với phương pháp khai phá liệu truyền thống khác Cây định, láng giềng lân cận, SVM,… đặc biệt trường hợp liệu cân (imbalanced data) Trong phần tiếp theo, viết giới thiệu ngắn gọn lý thuyết tập thô minh họa cho toán phân lớp dựa luật sinh ra, sau mơ hình đề xuất kết thực nghiệm II LÝ THUYẾT TẬP THÔ A Hệ thống thông tin định Thông thường hệ thống biểu diễn tri thức mô tả hệ thống thông tin định, bốn DIS = (U, A{d}, V, f ) Ở đó, U tập hợp hữu hạn đối tượng; A tập hợp hữu hạn thuộc tính điều kiện, dA thuộc tính định Mỗi thuộc tính a  A{d} định nghĩa hàm thông tin f a : U  Va , với Va miền giá trị a, V tập hợp Va Một hệ thống thông tin định mô tả bảng định ví dụ sau 152 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ Bảng ảng định U x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 a1 2 1 3 A a2 2 1 1 {d} a3 3 4 1 2 3 B Quan hệ đẳng trị Với tập thuộc tính điều kiện B  A , quan hệ theo B, ký hiệu Ind ( B), định nghĩa sau [16]: Ind(B)  (x, y)  U  U / f b (x)  f b ( y) b  B Ind(B) quan hệ tương đương Ký hiệu U/Ind(B) tập hợp tất lớp tương đương, lớp tương đương gọi tập hợp sơ cấp Với thuộc tính b  B với tập hợp sơ cấp SB  U / Ind(B) đối tượng SB có giá trị b, ký hiệu fb ( S B ) Với thuộc tính điều kiện d, tập hợp lớp tương đương U/Ind(d) gọi phân hoạch U Theo Bảng ta có: U / Ind(A)  x1 , x , x , x , x , x10, x , x , x , x  U / Indd  x1 , x , x , x , x , x , x10, x , x , x  C Xấp xỉ xấp xỉ - Tập thô Với tập X  U , xấp xỉ xấp xỉ X theo B  A ký hiệu định nghĩa sau: BX  tập đối tượng thuộc tập hợp sơ cấp theo B nằm X, BX  tập đối tượng thuộc tập hợp sơ cấp theo B có phần tử chung với X Với X  x1, x , x , x , x  B  A ta có : A(X)  x1 , x , x , x  A(X)  x1 , x , x , x , x , x    Để diễn đạt cách xác tập X  U dùng B(X), B(X) , gọi tập thô X Giả sử phân hoạch U / Indd có r lớp: D1 , D , ,D r , xấp xỉ xấp xỉ theo B  A phân hoạch ký hiệu định nghĩa sau:   BU / Indd  B(D1 ), B(D ), ,B(D r ) BU / Indd  B(D1 ), B(D ), ,B(D r ) t D d-t ; d-nhân d-rút gọn thu c tính Thuộc tính điều kiện a i  B  A thuộc tính d-thừa việc sử dụng khơng ảnh hưởng đến xấp xỉ phân hoạch U / Inddtheo , tức là: B(U / Indd)  B  a i (U / Indd) , ngược lại, a i thuộc tính d-khơng thể thiếu Tập hợp tất thuộc tính điều kiện d-không thể thiếu được gọi d-nhân Tập tối tiểu thuộc tính điều kiện phân biệt tất lớp tương đương U / Indd gọi d-r t gọn Để tìm d-rút gọn d-nhân , trước tiên ma trận d-phân biệt  xây dựng tập hợp đối tượng sử dụng Đây ma trận vng, đối xứng, có số dịng số cột số đối tượng Phần tử ( x i , x j ) ma trận      tập hợp tất thuộc tính điều kiện phân biệt đối tượng x i x j :  x i , x j  a  A / f a x i   f a x j dnhân tập hợp phần tử đơn ma trận d-phân biệt Để tính d-rút gọn , người ta dùng hàm d-phân biệt f d (A) , hàm bool có cơng thức dạng tuyển chuẩn tắc định nghĩa sau: f d(A)    x i U x j U, j i     x i , x j Mỗi nguyên nhân nguyên tố công thức f d (A) tương ứng với d-rút gọn A E d- t ọ d- ủ t ịt t Sau đơn giản hóa hệ thống thơng tin r t gọn tập hợp thuộc tính , ch ng ta tiếp tục đơn giản hóa r t gọn nhân giá trị thuộc tính Cách tìm d-r t gọn d-nhân giá trị thuộc tính giống Lê Đức Thắng, Trương Thị Hải, Nguyễn Thái Nghe, Huỳnh Xuân Hiệp 153 tìm d-r t gọn d-nhân tập hợp thuộc tính, dựa ma trận phân biệt  Nhưng thay tính hàm dd phân biệt phải tính nhiều hàm d-phân biệt cho đối tượng theo công thức: f i (A)   x j U, j i     x i , x j , nguyên nhân nguyên tố d-rút gọn giá trị thuộc tính Khi ch ng ta quan tâm đến giá trị thuộc tính d-rút gọn giá trị thuộc tính III SINH LUẬT TỪ BẢNG QUYẾT ĐỊNH Từ kết chúng tơi đề xuất thủ tục phân tích bảng định (U, A d , V, f ) để nhận luật định tối ưu phục vụ việc phân lớp/dự đoán sau: ây dựng ma trận d-phân biệt  có phần tử xác định bởi:  x i , x j  a  A / f a x i   f a x j      ây dựng hàm d- phân biệt:    xi , x j f d(A)   x i U x j U, j i   Chọn nguyên nhân nguyên tố f d(A) làm d- r t gọn, gọi B t gọn ma trận d-phân biệt  theo B ây dựng hàm d- phân biệt cho đối tượng x i  U : d f i ( A)    x j U, j i      xi , x j    x i , x j  b  B / f b (x i )  f b (x j ) Mỗi nguyên nhân nguyên tố f id(A) cho biết thuộc tính có giá trị cần quan tâm đối tượng x i (các giá trị không cần quan tâm thay *) ây dựng bảng định r t gọn (U,  d , V, f ) với giá trị thuộc tính cần quan tâm ây dựng quan hệ bảng định rút gọn: ( x, y)  U  U / b  B : f b ( x )  f b ( y)   Ind (B)  | f b ( x )  *  | f ( y)  *   b  Mỗi lớp S U / Ind(B) sinh luật theo cách sau:  b  f b (S)  *  d  f d (S) bS Ví dụ minh họa Chúng ta ảng 1, với thuộc tính điều kiện A  a1, a , a 3 thuộc tính định d ta có: Trước tiên ma trận d-phân biệt  xây dựng sau (ký hiệu a1a 2a nghĩa a1, a , a 3) Bảng Ma trận d-phân biệt 154 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ Hàm d-phân biệt tính là: f d(A)  a1a  a 2a Theo kết có hai d-rút gọn a1, a  , a , a 3 d-nhân a  Hai d-rút gọn chọn để đơn giản hóa Bảng iả sử ch ng ta chọn a1, a  t gọn ma trận d-phân biệt  theo a1, a  , kết ảng Bảng Ma trận d-phân biệt r t gọn ây dựng hàm {d}-phân biệt cho đối tượng: f1d(A)  a1a , f 2d(A)  a1  a , f3d(A)  a1a , f 4d(A)  a , f5d(A)  a1 , f 6d(A)  a1 , f 7d(A)  a1  a , f8d(A)  a1 , f9d(D)  a1a , d(A)  a  a f10 ây dựng bảng định r t gọn sau c ng: Bảng U x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 t gọn ảng a1 a2 * * 1 * * 2 * * * {d} 2 3 uan hệ Ind{a1, a } cho kết sau: U / Inda1, a   x1, x , x , x , x , x , x10, x , x , x8  Khi ch ng ta có luật định: a1   a   d  a2   d  a1   d  Trong toán dự đoán kết học tập sinh viên, a1, a2,…an thuộc tính đầu vào (predictors) d thuộc tính kết cần dự đốn (target attribute) Ví dụ, luật sinh có dạng: “Giới tính” = “Nam”  “trình độ anh văn” = “chưa có chứng chỉ”  …  “điểm TB học kỳ trước” = “Cảnh báo”  “Điểm TB học kỳ này” = “Cảnh báo” Dựa luật thế, ta phân lớp (dự đoán) kết sinh viên (tương tự luật sinh từ định) Chi tiết mơ hình thuộc tính, liệu mô tả phần Lê Đức Thắng, Trương Thị Hải, Nguyễn Thái Nghe, Huỳnh Xuân Hiệp 155 IV DỰ ĐOÁN KẾT QUẢ HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THƠ Tương tự tốn khác khai phá liệu, việc xây dựng hệ thống dự đoán kết học tập thực dựa quy trình chuẩn CRISP-DM (CRoss Industry Standard Process for Data Mining) Quy trình bao gồm sáu giai đoạn, bao gồm: Tìm hiểu vấn đề, tìm hiểu liệu, tiền xử lý liệu, mơ hình hóa, đánh giá mơ hình triển khai ứng dụng Trong viết này, tập trung việc đề xuất đánh giá mơ hình, chi tiết khác vui lòng xem thêm [4][8] A Phát biểu vấ đề Vấn đề cần dự đoán dựa thông tin nhân học sinh viên (như giới tính, độ tuổi, trình độ nh văn, điểm tuyển sinh đầu vào,…) điểm trung bình học kỳ trước để dự đốn điểm trung bình học kỳ Việc dự đoán giúp thân sinh viên giáo viên cố vấn học tập hỗ trợ sinh viên lập kế hoạch học tập cho phù hợp nhằm giảm bớt tình trạng cảnh báo học vụ buộc học, quy chế đào tạo sinh viên hai học kỳ liên tiếp có điểm trung bình 0.8 (thang điểm 4) bị buộc học Cụ thể, nghiên cứu dự đốn điểm trung bình học kỳ (cuối năm thứ 3) dựa thông tin nhân học điểm trung bình học kỳ Tuy nhiên, việc dự đoán cho học kỳ khác hoàn toàn tương tự [3] [8] B Dữ liệu Để có tập liệu cho mơ hình dự đốn, nhóm tác giả tìm hiểu thu thập liệu từ hệ thống thực tế trường Đại học Cần Thơ [3][8], từ tiến hành tiền xử lý liệu cách loại bỏ giá trị dư thừa thiếu (missing), số lượng mẫu tin (mỗi mẫu tin tương ứng với sinh viên) lại 19530 mẫu tin Sau loại bỏ thuộc tính thừa, 14 thuộc tính quan trọng cịn lại dùng cho việc dự đốn, mơ tả bảng (dữ liệu kế thừa từ nghiên cứu [8]) Bảng Các thuộc tính dùng cho dự đốn STT GPA_Sem5 Infomation Gain 0.429 FOS Faculty Gender EntryMark Age Range 0.177 0.131 0.089 0.039 0.032 Ngành học Khoa học Giới tính Điểm tuyển sinh đại học Độ tuổi 10 English Skill Policy Priority Family Job School Rank 0.023 0.016 0.014 0.012 Trình độ anh văn ia đình diện sách Nghề nghiệp gia đình Trong liệu thu thập được, có 285 trường phổ thông trung học mà sinh viên học trước vào trường đại học Cần Thơ Vì trường học xếp theo giá trị liên tục dựa chênh lệch tỷ lệ tốt nghiệp Tỷ lệ tính sau: Rank = AVG(Tỷ lệ tốt nghiệp đại học) – AVG(Tỷ lệ đầu vào đại học ) [8] Giá trị rank từ đến 10 Quê quán Khu vực ưu tiên Dân tộc Tôn giáo 11 12 13 14 C P ươ - Thuộc tính Province Area Priority Ethnic Religious p 0.010 0.004 0.001 0.001 Diễn giải Điểm trung bình học kỳ p Đầu vào: 14 thuộc tính mơ tả Bảng (gồm kết học kỳ trước) Kỹ thuật: Sinh luật định theo tiếp cận tập thơ, từ tiến hành phân lớp kết học tập Đầu ra: Kết học tập học kỳ Trong nghiên cứu này, ch ng quan tâm đến việc phân lớp nhị phân (binary classification) với hai giá trị “Cảnh báo” “Không cảnh báo” V KẾT QUẢ THỰC NGHIỆM A Dữ liệu thực nghiệm Như mô tả phần trước, tập liệu gồm có 19530 dịng 14 thuộc tính Thuộc tính cần dự đốn có phân phối 15 5/1 tương ứng với hai lớp „cảnh báo‟/ „không cảnh báo‟ Tập liệu thuộc dạng cân (imbalanced data) có 8.01% thuộc lớp số (minority class) [7][9] 156 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ B Các kỹ thuật k dù để so sánh Chúng so sánh phương pháp đề xuất dùng lý thuyết tập thô (đặt tên RSRule) với phương pháp phổ biến khác data mining như: láng giềng lân cận (kNN), máy học véctơ hỗ trợ (SVM) phương pháp sinh luật khác Decision Tree, Conjunctive Rule, Decision Table PART [15] Các phương pháp cài đặt sẵn công cụ Weka (www.cs.waikato.ac.nz/ml/weka) C Kết Pháp kiểm tra chéo đường (5-folds cross validation) sử dụng để so sánh kết Ở đây, tập liệu cân nên độ đo xác (accuracy) tỏ khơng phù hợp Thay vào đó, ch ng tơi trình bày chi tiết kết ma trận nhầm lẫn (confusion matrix) Hình 1, tỷ lệ True Positive (true positive trường hợp số sinh viên thuộc diện “Cảnh báo” dự đoán đ ng – ta quan tâm đến đối tượng nhiều hơn) độ đo -Mean [3][9] Rõ ràng sử dụng độ xác từ Hình ta dễ dàng xác định kỹ thuật ConjunctiveRule có độ xác 17965/19530 = 91.98% cao RSRule, RSRule đạt (523+17347)/19530 = 91.5% Tuy nhiên kết khơng có ý nghĩa tất sinh viên thuộc diện “Cảnh báo” bị dự đoán sai (phương pháp Conjunctive Rule), mặc d đối tượng mà ta cần dự đoán Do vậy, Bảng chúng tơi trình bày số lượng tỷ lệ sinh viên thuộc diện “Cảnh báo” học vụ mơ hình dự đốn đ ng, ta thấy RSRule tỏ hiệu phương pháp khác Hình Kết dự đốn thể Confusion matrix Bên cạnh ch ng tơi trình bày kết so sánh phương pháp độ đo -Mean, độ đo hay sử dụng trường hợp liệu cân [3][9], kết Hình Thực nghiệm cho thấy tiếp cận tập thô RSRule cho kết dự đoán tốt Bảng Tỷ lệ SV bị "Cảnh báo" mơ hình dự đốn đ ng Kỹ thuật Số lượng SV bị "Cảnh báo" dự đoán Tỷ lệ % (trong tổng số 1565 SV bị "Cảnh báo") Conjunctive Rule 0.00 kNN 277 17.70 SVM 333 21.28 Decision Tree 468 29.90 PART 488 31.18 Decision Table 507 32.40 RSRule 523 33.42 Lê Đức Thắng, Trương Thị Hải, Nguyễn Thái Nghe, Huỳnh Xuân Hiệp 157 Hình So sánh độ đo -Mean Từ kết cho thấy tiếp cận tập thô đề xuất cho toán dự đoán kết học tập phù hợp Đặc biệt phân lớp môi trường liệu cân Tuy nhiên, việc so sánh với phương pháp dành riêng cho loại liệu thực tương lai VI KẾT LUẬN Bài viết đề xuất phương pháp sử dụng lý thuyết tập thô dự đoán kết học tập sinh viên nhằm hỗ trợ sinh viên lập kế hoạch học tập phù hợp Thực nghiệm liệu thực tế để xác định sinh viên có thuộc diện “cảnh báo” hay “khơng cảnh báo” cho thấy phương pháp có khả dự đoán tốt so với phương pháp khai phá liệu truyền thống khác Cây định, láng giềng lân cận, đặc biệt trường hợp liệu cân Chúng tiếp tục mở rộng sang lĩnh vực khác tương lai TÀI LIỆU THAM KHẢO [1] Bekele, R and Menzel, W 2005 A Bayesian approach to predict performance of a student (BAPPS): A case with Ethiopian students Proceedings of the International Conference on Artifi Intell and Applications (AIA-2005) [2] Delavari N & Beikzadeh M R & Shirazi M R A 2004 A New Model for Using Data Mining in Higher Educational System Proceedings of 5th Inter Conf on Information Technology Based Higher Education and Training [3] H He and E arcia, “Learning from imbalanced data,” IEEE Transactions on Knowledge and Data Engineering, vol 21, no 9, pp 1263–1284, September 2009 [4] Huỳnh Lý Thanh Nhàn, Nguyễn Thái Nghe 2013 Hệ thống dự đoán kết học tập gợi ý lựa chọn môn học Kỷ yếu Hội thảo quốc gia lần thứ XVI: Một số vấn đề chọc lọc CNTT&TT, 110-118 NXB Khoa học Kỹ thuật [5] Minaei-Bidgoli, B., Kashy, D A., Kortemeyer, G., and Punch, W F 2003 Predicting student performance: an application of data mining methods with an educational web-based system Proceedings of 33rd Annual Conference on Frontiers in Education (FIE 2003) [6] Nguyễn Thái Nghe, Huỳnh Xuân Hiệp 2012 Ứng dụng kỹ thuật phân rã ma trận đa quan hệ xây dựng hệ trợ giảng thông minh Kỷ yếu Hội thảo quốc gia lần thứ XV: Một số vấn đề chọn lọc CNTT&TT, 470-477 NXB Khoa học Kỹ thuật ISBN: 893-5048-931578 [7] Nguyen Thai-Nghe, Andre Busche, and Lars Schmidt-Thieme 2009 Improving Academic Performance Prediction by Dealing with Class Imbalance, in Proceedings of the 9th IEEE Inter Conf on Intell Syst Design and Applications (ISDA 2009), 878-883 IEEE CS [8] Nguyen Thai-Nghe, Paul Janecek, and Peter Haddawy 2007 A comparative analysis of techniques for predicting academic performance, Proceedings of the 37th IEEE Frontiers in Education, 7-12 IEEE Xplore [9] Nguyen Thai-Nghe, Zeno Gantner, and Lars Schmidt-Thieme 2010 Cost-Sensitive Learning Methods for Imbalanced Data, Proceedings of IEEE Inter Joint Conf on Neural Networks, ISBN 978-1-4244-6916-1 IEEE Xplore [10] Nguyễn Thị Thanh Thủy, Nguyễn Trần uốc Vinh Ứng dụng khai phá liệu xây dựng cơng cụ dự đốn kết học tập sinh viên Kỷ yếu Hội nghị SV NCKH lần thứ 8, Đại học Đà Nẵng, 2012 158 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ [11] Romero, C., Ventura, S., Espejo, P.G., Hervas, C 2008 Data Mining Algorithms to Classify Students Proceedings of the First Inter Conf on Educational Data Mining, 8-17 [12] Romero, Cristobal, and Sebastian Ventura 2013 Data mining in education Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery 3.1 (2013): 12-27 [13] V Ramesh, P Parkavi and K Ramar Article: Predicting Student Performance: A Statistical and Data Mining Approach International Journal of Computer Applications 63(8):35-39, February 2013 [14] Walczak, B., and D L Massart "Rough sets theory." Chemometrics and intelligent laboratory systems, 47.1 (1999): 1-16 [15] Witten, Ian H., and Eibe Frank Data Mining: Practical machine learning tools and techniques Morgan Kaufmann, 2005 [16] Walczak, B., and D L Massart "Rough sets theory." Chemometrics and intelligent laboratory systems 47.1 (1999): 1-16 DECISION SUPPORT FOR ACADEMIC STUDY PLANNING BASED ON ROUGH SET APPROACH Le Duc Thang, Truong Thi Hai, Nguyen Thai Nghe, Huynh Xuan Hiep ABSTRACT—Rough set theory was conducted on stability mathematic background, thus, it has been applied in many areas, especially in computer science for machine learning problems (e.g., classification, clustering, and association rules) Based on rough set theory, this work proposes a new approach in predicting student study results to support their academic study planning Experimental results show that the proposed approach work well on binary classification problem, especially when the data set is imbalanced Keywords— Rough set theory; decision table; decision rule; imbalanced data; academic study planning ... dựng cơng cụ dự đốn kết học tập sinh viên Kỷ yếu Hội nghị SV NCKH lần thứ 8, Đại học Đà Nẵng, 2012 158 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ [11] Romero, C.,... VI KẾT LUẬN Bài viết đề xuất phương pháp sử dụng lý thuyết tập thô dự đoán kết học tập sinh viên nhằm hỗ trợ sinh viên lập kế hoạch học tập phù hợp Thực nghiệm liệu thực tế để xác định sinh viên. .. „không cảnh báo‟ Tập liệu thuộc dạng cân (imbalanced data) có 8.01% thuộc lớp số (minority class) [7][9] 156 GIẢI PHÁP HỖ TRỢ SINH VIÊN LẬP KẾ HOẠCH HỌC TẬP DỰA TRÊN TIẾP CẬN TẬP THÔ B Các kỹ thuật

Ngày đăng: 25/11/2020, 23:59