.25 Biểu đồ đánh giá hiệu quả của các mơ hình khai phá dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) tìm hiểu phương pháp xây dựng và khai thác kho dữ liệu điểm dựa trên kỹ thuật OLAP 04 (Trang 68 - 69)

Hình 4.25 là ví dụ mơ tả biểu đồ Lift Chart để đánh giá hiệu quả của các mơ hình khai phá dữ liệu với trường hợp học l c trung bình khá Trong đĩ, đường màu đỏ ở trên cùng biểu diễn đường lý tưởng cho các mơ hình Đường chéo (đường màu xanh nước biển) biểu diễn kết quả của việc chọn ngẫu nhiên, đường màu xám thẳng đứng xác định tỷ lệ phần tr m dữ liệu kiểm tra trên tồn bộ tập dữ liệu và kết quả được thể hiện trong bảng Mining Legend Các đường cịn lại là các đường d đốn của mỗi mơ hình, cụ thể được chú thích trong bảng Mining Legend.

Giả sử, với vị trí thanh thẳng đứng màu xám đặt tại vị trí trục X là 40% thì đối với mơ hình Model1_Decisiontree, nếu ta lấy ra 40% tổng số sinh viên trong cơ sở dữ liệu nguồn, thì sẽ cĩ 62,96% sinh viên đạt loại học l c trung bình khá, đối với mơ hình Model2-Decisiontree là 55,56%, mơ hình Model1-Naivebayes là 70.37% ...

Cột Predict Probability cho biết xác suất d đốn, giá trị này chính là giá trị ngưỡng của mơ hình d đốn Với mơ hình Model1-Decisiontree thì xác suất d đốn trong trường hợp này là 64,28%, cĩ nghĩa đây là giá trị tin cậy cho mỗi trường hợp d đốn, mơ hình Model1-Decisiontree là 79,94%...Nhìn vào các giá trị trong cột Predict Probability, ta cĩ thể thấy rằng, mơ hình Model3-Naivebayes cĩ xác suất d đốn cao nhất, đạt giá trị là 95,17%.

Giá trị trong cột Score dùng để đánh giá hiệu quả của mơ hình, khi giá trị Score của mơ hình càng cao thì mơ hình đĩ được đánh giá là càng tốt. Qua việc kiểm chứng mơ hình trên các giá trị của thuộc tính d đốn bằng Lift Chart, mơ hình Model3-Naivebayes luơn cho hiệu quả cao nhất, với giá trị Score bằng 0.96 và các xác suất d đốn của mơ hình cũng rất cao khi thử với các giá trị của thuộc tính d đốn

Như vậy, chúng ta cĩ thể l a chọn mơ hình Model3-Naivebayes với các thơng số l a chọn như đã phân tích ở trên (Maximum_Input_Attribute = 6;

Maximum_Output_Attribute = 1; Maximum_States = 100;

Minimum_Dependency_Probability =0.1) để làm mơ hình khai phá dữ liệu.

4.2.4. Sử dụng mơ hình khai phá để dự đốn học lực cuối khĩa của sinh viên:

Sau khi phân tích các mơ hình và l a chọn được mơ hình Model3-Naivebayes làm mơ hình khai phá dữ liệu, chúng tơi đã sử dụng dữ liệu điểm của sinh viên lớp cao đẳng Tin06 khĩa 2011-2014 để xây d ng một tập dữ liệu dùng trong d báo, để nhằm đối chiếu giữa dữ liệu d đốn của mơ hình và kết quả học l c cuối khĩa của sinh viên. Khi xây d ng tập dữ liệu d đốn học l c cho sinh viên lớp cao đẳng Tin 06, chúng tơi chọn các thuộc tính dữ liệu đầu vào và thuộc tính khĩa tương ứng với các thuộc tính trong mơ hình khai phá và bỏ đi cột học l c cuối khĩa. Mơ hình khai phá dữ liệu sử dụng để d đốn kết quả học tập của sinh viên lớp cao đẳng Tin06 được xây d ng như trong hình 4.26

Một phần của tài liệu (LUẬN văn THẠC sĩ) tìm hiểu phương pháp xây dựng và khai thác kho dữ liệu điểm dựa trên kỹ thuật OLAP 04 (Trang 68 - 69)

Tải bản đầy đủ (PDF)

(76 trang)