Thực nghiệm giải thuật trên bộ dữ liệu nghỉ, bỏ học của học sinh * Kết quả tạo luật.

Một phần của tài liệu Ứng dụng thuật toán phân lớp dựa trên luật kết hợp dự báo vào giải bài toán dự báo tình hình nghỉ bỏ học của học sinh trung học trên địa bàn thành phố hồ chí minh (Trang 89 - 91)

- Giai đoạn 4: Đánh giá độ chính xác của phân lớp.

3.5.2. Thực nghiệm giải thuật trên bộ dữ liệu nghỉ, bỏ học của học sinh * Kết quả tạo luật.

* Kết quả tạo luật.

Bộ tham số được sử dụng CT= 0.05, GSR= 0.99, MGV = 0.7, Decay_Factor = 2/3

Các tập luật sinh ra từ tập dữ liệu Nghỉ bỏ học của học sinh có từ 1 đến 2 thuộc tính phản ánh quy luật của tập dữ liệu dùng để dự báo cho các tập dữ liệu thử nghiệm để biết một học sinh với thông tin được cung cấp có khả năng nghỉ bỏ học trong tương lai hay không.

Bảng 3.25 Các luật được tạo ra trên bộ dữ liệu học sinh

STT Nội dung luật

1 {Sớm tuổi = 2  Class = 1}; 2 {Nghiện ma túy = 2  Class = 1} 3 {Học lực = 2  Class = 1}

4 {Hạnh kiểm = 2, Sớm tuổi = 1  Class = 1} 5 {Mồ côi = 1, Hút thuốc lá = 1  Class = 1}

6 {Nghiện ma túy = 4, Nghiện game = 4,  Class = 0} 7 {Vi phạm nội quy = 4, Bảo lưu = 4  Class = 0} 8 {Trễ tuổi = 5  Class = 0}

9 {Học lực = 5, Hạnh kiểm = 5  Class = 0}

* Độ chính xác của các luật trên bộ dữ liệu huấn luyện

Độ chính xác của các luật được tính toán trên cơ sở dữ liệu huấn luyện cho độ chính xác trên 98% được trình bày tại bảng 3.18.

Bảng 3.26 Độ chính xác của các luật trên bộ dữ liệu học sinh

STT Luật kết hợp nc ntot k Laplace

Accuracy

1 {Sớm tuổi = 2  Class = 1}; 29 29 2 0.968 2 {Nghiện ma túy = 2  Class = 1} 149 149 2 0.993 2 {Nghiện ma túy = 2  Class = 1} 149 149 2 0.993 3 {Học lực = 2  Class = 1} 152 152 2 0.994 4 {Hạnh kiểm = 2, Sớm tuổi = 1  Class = 1} 62 62 2 0.984 5 {Mồ côi = 1, Hút thuốc lá = 1  Class = 1} 53 53 2 0.982 6 {Nghiện ma túy = 4, Nghiện game = 4,  Class = 0} 58 58 2 0.983 7 {Vi phạm nội quy = 4, Bảo lưu = 4  Class = 0} 63 63 2 0.985 8 {Trễ tuổi = 5  Class = 0} 181 181 2 0.995 9 {Học lực = 5, Hạnh kiểm = 5  Class = 0} 66 66 2 0.985

nc: là số tuple thỏa cả 2 vế của luật; ntot: là số tuple thỏa vế trái của luật; k: là số lớp

* Tính độ chính xác phân lớp khi áp dụng các luật trên bộ dữ liệu thử nghiệm

của tập dữ liệu là Correct = 403 giao dịch, số giao dịch có nhãn dự đoán không trùng với nhãn đang có là Wrong = 57 giao dịch. Độ chính xác của phân lớp được tính bằng công thức (9) cho kết quả Accuracy = 87.6%

Một phần của tài liệu Ứng dụng thuật toán phân lớp dựa trên luật kết hợp dự báo vào giải bài toán dự báo tình hình nghỉ bỏ học của học sinh trung học trên địa bàn thành phố hồ chí minh (Trang 89 - 91)