7. Bố cục luận văn
2.5.4. Ƣớc tính độ chính xác của mô hình
Ƣớc tính độ chính xác của mô hình b ng cách sử dụng k-fold crops validation với k=10.
Tập dữ liệu ban đầu đƣợc chia ng u nhiên thành 10 tập con (fold) có kích thƣớc xấp xỉ nhau S1, S2, …, S10. Quá trình học và test đƣợc thực hiện 10 lần. Tại lần lặp thứ 10, S10 là tập dữ liệu kiểm tra, các tập còn lại hợp thành tập dữ liệu đào tạo gọi là R10
Độ chính xác là toàn bộ số phân lớp đúng từ 10 lần lặp chia cho tổng số m u của tập dữ liệu ban đầu.
Dữ liệu ban đầu ở đây là: 1745 khách hàng. Thời gian sử dụng > 7,5
?
Fold 1:
Hình 2.11. Fold 1 với CSDL 1724 bảng ghi của khách hàng
Fold 2:
Fold 10:
Hình 2.13. Fold 10 với CSDL 1724 bảng ghi của khách hàng
Độ chính xác của mô hình = trung bình độ chính xác của 10 fold hoặc độ
chính xác của mô hình = tổng dự đoán chính xác của 10 fold / tổng số m u của dữ liệu ban đầu.
KẾT LUẬN CHƢƠNG 2
Trong chƣơng này, tôi đã phân tích hiện trang và các yếu tố ảnh hƣởng đến rủi ro trong bảo hiểm xe cơ giới.
So sánh kết quả phân lớp giữa 2 thuật toán C4.5 và Random Forest. Phân tích đã trình bày chi tiết quá trình tính toán, chọn lựa các thuộc tính nh m xây dựng một cây quyết định trực quan có khả năng phân loại đúng đắn tập dữ liệu cho trƣớc để xây dựng hệ thống hỗ trợ đánh giá rủi ro trong bảo hiểm xe cơ giới.
Trong chƣơng tiếp đến, tôi sẽ trình bày phƣơng pháp xây dựng, cài đặt và sau đó tiến hành kiểm thử ứng dụng.
CHƯƠNG 3 XÂY DỰNG VÀ THỬ NGHIỆM ỨNG DỤNG