ỨNG DỤNG GIẢI THUẬT CPAR-GR VÀO DỰ BÁO TÌNH HÌNH NGHỈ BỎ

Một phần của tài liệu Ứng dụng thuật toán phân lớp dựa trên luật kết hợp dự báo vào giải bài toán dự báo tình hình nghỉ bỏ học của học sinh trung học trên địa bàn thành phố hồ chí minh (Trang 109)

- Sử dụng luật kết hợp để phát hiện lỗi vòng bi [4] là công trình của nhóm tác giả

4. ỨNG DỤNG GIẢI THUẬT CPAR-GR VÀO DỰ BÁO TÌNH HÌNH NGHỈ BỎ

VÀO DỰ BÁO TÌNH HÌNH NGHỈ BỎ HỌC CỦA HỌC SINH.

Cách tiếp cận để giải bài toán dự báo tình hình nghỉ bỏ học của học sinh bằng phương pháp sử dụng luật phân lớp kết hợp được tiến hành qua 3 giai đoạn.

4.1. Thu giảm số chiều của tập dữ liệu.

Tập dữ liệu huấn luyện thu thập được có 15 thuộc tính, Thống kê T-test được sử dụng để chọn các tính năng quan trọng có ý nghĩa cao đối với phân lớp. Được thực hiện bằng hàm Mattest trong MATLAB 7.0.1. Nó tính toán giá trị p và điểm t cho từng thuộc tính. Các thuộc tính có giá trị p nhỏ hơn hoặc bằng 0.05 được coi là đáng kể. Các thuộc tính ít quan trọng hơn (tức là lớn hơn 0.05) được xóa khỏi bộ dữ liệu. Sau quá trình thu giảm số chiều tập dữ liệu còn lại 14 thuộc tính quan trọng đáng kể cho quá trình huấn luyện tạo luật.

4.2. Xây dựng phân lớp kết hợp (AC).

Sử dụng CPAR-GR trên tập dữ liệu huấn luyện để tạo ra luật kết hợp (CAR). Khi các luật phân lớp kết hợp được tạo thì cũng được sắp xếp dựa trên độ chính xác Laplace. Độ chính xác Laplace là một trong những thước đo đánh giá luật kết hợp được sử dụng trong FOIL (Quinlan & Cameron 1993), PRM (Yin & Han

4.3. Sử dụng luật để tiến hành phân lớp cho tập thử nghiệm tập thử nghiệm

Từ k luật tốt nhất từ mỗi lớp thỏa mãn bộ huấn luyện đã cho được chọn theo độ chính xác Laplace. Độ chính xác Laplace trung bình của k luật tốt nhất từ mỗi lớp được xác định. Một lớp có độ chính xác Laplace trung bình cao nhất được chọn làm nhãn lớp cho bộ thử nghiệm. Luồng công việc chi tiết liên quan đến phương pháp này được phác thảo trong dưới.

Hình 0.1 Các giai đoạn phân lớp kết hợp

Một phần của tài liệu Ứng dụng thuật toán phân lớp dựa trên luật kết hợp dự báo vào giải bài toán dự báo tình hình nghỉ bỏ học của học sinh trung học trên địa bàn thành phố hồ chí minh (Trang 109)

Tải bản đầy đủ (PDF)

(112 trang)