.28 Kết quả phân lớp dùng thuật tốn Nạve Bayes trong Weka

Một phần của tài liệu (LUẬN văn THẠC sĩ) tìm hiểu phương pháp xây dựng và khai thác kho dữ liệu điểm dựa trên kỹ thuật OLAP 04 (Trang 71 - 72)

Kết quả đầu ra khi dùng thuật tốn Nạve Bayes trong Weka được hiển thị dưới dạng ma trận nhầm lẫn và đưa ra các thơng số cơ bản để đánh giá độ chính xác của mơ hình. Kết quả trong hình 4.28 cho thấy:

Số trường hợp phân lớp chính xác là 88.57%;

Độ chính xác Precision cho trường hợp học l c trung bình khá là 0.909; học l c khá là 0.877; học l c giỏi là 0.6; học l c trung bình và yếu là 0. Trong khi đĩ, kết quả đưa ra dưới dạng ma trận nhầm lẫn của mơ hình Model3-Naivebayes trong BI thu được như trong hình 4 29:

Hình 4.29 Kết quả phân lớp của mơ hình Model3-Naivebayes trong BI dưới dạng ma trận nhầm lẫn

Với kết quả phân lớp thu được của mơ hình Model3-Naivebayes, ta tính tốn được các giá trị như sau:

Số trường hợp phân lớp chính xác là 84%.

So sánh giữa kết quả của mơ hình d báo sử dụng Weka và mơ hình d báo sử dụng cơng cụ BI, chúng ta cĩ thể thấy với mơ hình d báo sử dụng phần mềm Weka cho kết quả tốt hơn, nhưng s chênh lệch giữa hai kết quả là rất nhỏ. Vì vậy, khi cân nhắc để l a chọn cơng cụ khai phá dữ liệu để giải quyết bài tốn d đốn kết quả học tập của sinh viên, chúng tơi đã so sánh với một số yếu tố khác để chọn l a được cơng cụ phù hợp cho bài tốn cần giải quyết.

Qua quá trình th c nghiệm phân tích và khai thác dữ liệu bằng bộ cơng cụ BI được tích hợp trong SQL Server Data Tools, kết hợp với việc sử dụng kỹ thuật OLAP, chúng tơi thấy rằng với việc sử dụng phương pháp này cĩ một số ưu điểm nổi bật so với phương pháp khai phá dữ liệu truyền thống như sau:

+ Tính dễ sử dụng:

Nếu người phân tích sử dụng các cơng cụ khai thác dữ liệu truyền thống như Matlab hay Weka thì yêu cầu đặt ra là người sử dụng phải đưa các dữ liệu vào theo một số định dạng nhất định. Vì vậy, người dùng cần kết xuất dữ liệu theo đúng định dạng. Việc kết nối từ các phần mềm này đến cơ sở dữ liệu rất phức tạp Do đĩ, việc tải dữ liệu vào để làm nguồn cho việc khai thác dữ liệu thiếu s linh hoạt.

Một phần của tài liệu (LUẬN văn THẠC sĩ) tìm hiểu phương pháp xây dựng và khai thác kho dữ liệu điểm dựa trên kỹ thuật OLAP 04 (Trang 71 - 72)

Tải bản đầy đủ (PDF)

(76 trang)