Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

95 83 0
Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM NGUYỄN THỊ THU AN ỨNG DỤNG THUẬT TOÁN RỪNG NGẪU NHIÊN MỜ ĐỂ XÂY DỰNG HỆ THỐNG TRỢ GIÚP ĐÁNH GIÁ RỦI RO TRONG BẢO HIỂM XE CƠ GIỚI LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng - Năm 2017 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM NGUYỄN THỊ THU AN ỨNG DỤNG THUẬT TOÁN RỪNG NGẪU NHIÊN MỜ ĐỂ XÂY DỰNG HỆ THỐNG TRỢ GIÚP ĐÁNH GIÁ RỦI RO TRONG BẢO HIỂM XE CƠ GIỚI Chuyên ngành: Hệ thống thông tin Mã số: 61.49.01.04 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Người hướng dẫn khoa học: TS Nguyễn Trần Quốc Vinh Đà Nẵng - Năm 2017 LỜI CAM ĐOAN Tôi xin cam đoan: - Những nội dung luận văn thực hướng dẫn trực tiếp TS Nguyễn Trần Quốc Vinh - Mọi tham khảo dùng luận văn trích dẫn rõ ràng trung thực tên tác giả, tên cơng trình, thời gian địa điểm công bố - Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Tác giả luận văn Nguyễn Thị Thu An MỤC LỤC MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nghiên cứu 3 Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Dự kiến kết Ý nghĩa khoa học thực tiễn luận văn Bố cục luận văn CHƯƠNG NGHIÊN CỨU TỔNG QUAN 1.1 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1.1 Sơ lược khai phá liệu 1.1.2 Các kỹ thuật áp dụng khai phá liệu 1.1.3 Các bước xây dựng hệ thống khai phá liệu 1.1.4 Ứng dụng khai phá liệu 10 1.1.5 Khó khăn khai phá liệu 10 1.2 PHÂN LỚP TRONG KHAI PHÁ DỮ LIỆU 10 1.2.1 Phân lớp liệu 10 1.2.2 Quá trình phân lớp liệu 11 1.2.3 Các vấn đề liên quan đến phân lớp liệu 14 1.3 CÂY QUYẾT ĐỊNH 17 1.3.1 Cây định ID3 17 1.3.2 Cây định mờ (Fuzzy Decision tree) 21 1.4 RỪNG NGẪU NHIÊN 30 1.4.1 Rừng ngẫu nhiên (Random Forest) 30 1.4.2 Rừng ngẫu nhiên mờ (Fuzzy Random Forest) 31 1.4.3 Mơ hình phân lớp với rừng ngẫu nhiên mờ 33 KẾT CHƯƠNG 37 CHƯƠNG ỨNG DỤNG RỪNG NGẪU NHIÊN MỜ TRONG CÔNG TÁC ĐÁNH GIÁ RỦI RO VÀ BỒI THƯỜNG BẢO HIỂM XE CƠ GIỚI 38 2.1 KHÁI QUÁT VỀ THỊ TRƯỜNG BẢO HIỂM XE CƠ GIỚI 38 2.2 ĐÁNH GIÁ RỦI RO XE CƠ GIỚI 39 2.2.1 Khái niệm rủi ro 39 2.2.2 Khái niệm đánh giá rủi ro 39 2.2.3 Phạm vi bảo hiểm 40 2.2.4 Quy trình đánh giá rủi ro bảo hiểm xe giới 40 2.2.5 Các yếu tố ảnh hưởng đến rủi ro bảo hiểm xe giới 40 2.3 PHÂN TÍCH HIỆN TRẠNG 41 2.3.1 Chỉ số lĩnh vực kinh doanh bảo hiểm xe giới 41 2.3.2 Giải pháp xây dựng hệ thống trợ giúp đánh giá rủi ro bảo hiểm xe giới 42 2.4 ỨNG DỤNG RỪNG NGẪU NHIÊN MỜ 42 2.4.1 Phân tích liệu 42 2.4.2 Mờ hóa liệu 44 2.4.3 Xây dựng ngẫu nhiên mờ 46 2.5.4 Mơ hình tổng qt 48 2.4.5 Ước tính độ xác mơ hình 48 KẾT CHƯƠNG 50 CHƯƠNG XÂY DỰNG VÀ THỬ NGHIỆM ỨNG DỤNG 51 3.1 CHỨC NĂNG HỆ THỐNG 51 3.1.1 Phân tích yêu cầu 51 3.1.2 Các chức 55 3.2 THỬ NGHIỆM ỨNG DỤNG 56 3.3 ĐÁNH GIÁ ĐỘ CHÍNH XÁC 60 3.3.1 Mô hình Random Forest 60 3.3.2 Mơ hình Fuzzy Random Forest 62 2.3.3 So sánh độ xác mơ hình Random Forest Fuzzy Random Forest 64 KẾT CHƯƠNG 64 KẾT LUẬN 65 DANH MỤC TÀI LIỆU THAM KHẢO QUYẾT ĐỊNH GIAO ĐỀ TÀI (BẢN SAO) PHỤ LỤC DANH MỤC CÁC TỪ VIẾT TẮT Tiếng Việt CSDL : Cơ sở liệu CNTT : Công nghệ thông tin KPDL : Khai phá liệu MDSD : Mục đích sử dụng MH : Máy học STBT : Số tiền bồi thường SL : Số lượng TGSD Thời gian sử dụng XCG Xe giới Tiếng nước CART Classification and Regression Trees DBMS Database Management System KDD Knowledge Discovery in Database FRF Fuzzy Random Forest OOB Out of Bag RF Random Forest DANH MỤC CÁC BẢNG Số hiệu Tên bảng bảng Trang 2.1 Số liệu kinh doanh chi nhánh Quảng Ngãi 41 2.2 Thống kê tình hình bồi thường tổn thất 42 2.3 Mẫu liệu 10 khách hàng 44 2.4 Giá trị hàm membership 10 liệu khách hàng 47 2.5 Mẫu bootstrap 10 khách hàng 47 3.1 Ví dụ khách hàng cần tư vấn 59 3.2 So sánh độ xác Random Forest Fuzzy Random Forest 64 DANH MỤC CÁC HÌNH Số hiệu Tên hình hình Trang 1.1 Quá trình khám phá tri thức 1.2 Xây dựng mơ hình phân lớp 12 1.3 Ước lượng độ xác 13 1.4 Phân lớp liệu 13 1.5 Ước lượng độ xác mơ hình 16 1.6 Ví dụ K-fold croos validation - fold 16 1.7 Ví dụ K-fold croos validation-fold 17 1.8 Ví dụ K-fold croos validation-fold 17 1.9 Xây dựng định theo thuật toán ID3 18 1.10 Đồ thị hàm thuộc tập mờ A 23 1.11 Hình biểu diễn chức thành phần Nhiệt độ 25 1.12 Hình biểu diễn chức thành phần Gió 26 1.13 Biểu diễn chức thành phần Ùn tắc giao thông 26 1.14 Xây dựng Fuzzy ID3 29 2.1 Đồ thị hàm membership 46 2.2 Bước tách nút lần 47 2.3 Mô hình tổng quát Fuzzy Random Forest để phân lớp 48 2.4 Fold với CSDL 1957 bảng ghi khách hàng 49 2.5 Fold với CSDL 1957 bảng ghi khách hàng 49 2.6 Fold 10 với CSDL 1957 bảng ghi khách hàng 50 3.1 Biểu đồ ca sử dụng tổng quát 51 3.2 Phân rã ca sử dụng huấn luyện liệu 52 3.3 Phân rã ca sử dụng Tư vấn 52 Số hiệu Tên hình hình Trang 3.4 Biểu đồ hoạt động huấn luyện liệu 53 3.5 Biểu đồ hoạt động tư vấn 53 3.6 Biểu đồ cho hoạt động đăng nhập 53 3.7 Biểu đồ cho hoạt động huấn luyện liệu 54 3.8 Biểu đồ cho hoạt động tư vấn 54 3.9 Triển khai hệ thống 55 3.10 Màn hình Đăng nhập hệ thống 56 3.11 Màn hình Menu 56 3.12 Màn hình tải liệu huấn luyện 57 3.13 Giao diện mơ hình phân lớp Random Forest 57 3.14 Giao diện mơ hình phân lớp Fuzzy Random Forest 58 3.15 Giao diện ứng dụng tư vấn 59 3.16 Mô hình Cây quyế t đinh ̣ Random Forest 60 3.17 Đô ̣ chiń h xác của mô hin ̀ h Random Forest- fold1 61 3.18 Kết độ xác mơ hình Random Forest 62 3.19 Mơ hình định Fuzzy Random Forest 62 3.20 3.21 Độ xác mơ hình Fuzzy Random Forest – Fold Kết độ xác mơ hình Fuzzy Random Forest 63 64 ... THU AN ỨNG DỤNG THUẬT TOÁN RỪNG NGẪU NHIÊN MỜ ĐỂ XÂY DỰNG HỆ THỐNG TRỢ GIÚP ĐÁNH GIÁ RỦI RO TRONG BẢO HIỂM XE CƠ GIỚI Chuyên ngành: Hệ thống thông tin Mã số: 61.49.01.04 LUẬN VĂN THẠC SĨ HỆ THỐNG... nhiên, thuật toán rừng ngẫu nhiên mờ chưa sử dụng Vì tơi chọn đề tài: ? ?Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro bảo hiểm xe giới? ?? để làm luận văn thạc... giá bồi thường rủi ro bảo hiểm xe giới 3 Hiện nay, có số cơng trình nghiên cứu sử dụng để xây dựng hệ thống đánh giá rủi ro xe giới như: thuật toán C4.5, thuật toán rừng nhẫu nhiên, thuật toán

Ngày đăng: 24/04/2022, 15:20

Hình ảnh liên quan

DANH MỤC CÁC BẢNG Số hiệu  - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

hi.

ệu Xem tại trang 8 của tài liệu.
Hình 1.1. Quá trình khám phá tri thức - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 1.1..

Quá trình khám phá tri thức Xem tại trang 17 của tài liệu.
Hình 1.2. Xây dựng mô hình phân lớp - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 1.2..

Xây dựng mô hình phân lớp Xem tại trang 22 của tài liệu.
Hình 1.5. Ước lượng độ chính xác của mô hình - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 1.5..

Ước lượng độ chính xác của mô hình Xem tại trang 26 của tài liệu.
Hình 1.9. Xây dựng cây quyết định theo thuật toán ID3 - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 1.9..

Xây dựng cây quyết định theo thuật toán ID3 Xem tại trang 28 của tài liệu.
Hình 1.10. Đồ thị hàm thuộc tập mờ A - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 1.10..

Đồ thị hàm thuộc tập mờ A Xem tại trang 33 của tài liệu.
Hình 1.11. Hình biểu diễn chức năng thành phần của Nhiệt độ - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 1.11..

Hình biểu diễn chức năng thành phần của Nhiệt độ Xem tại trang 35 của tài liệu.
Hình 1.12. Hình biểu diễn chức năng thành phần của Gió - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 1.12..

Hình biểu diễn chức năng thành phần của Gió Xem tại trang 36 của tài liệu.
Hình 1.13. Biểu diễn chức năng thành phần Ùn tắc giao thông - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 1.13..

Biểu diễn chức năng thành phần Ùn tắc giao thông Xem tại trang 36 của tài liệu.
Hình 1.14. Xây dựng cây con Fuzzy ID3 - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 1.14..

Xây dựng cây con Fuzzy ID3 Xem tại trang 39 của tài liệu.
Phân lớp mờ được P.Bonissone và các cộng sự đưa ra hai dạng mô hình được gọi là  Mô hình 1 (Strategy 1) và Mô hình 2 (Strategy 2) như sau:  - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

h.

ân lớp mờ được P.Bonissone và các cộng sự đưa ra hai dạng mô hình được gọi là Mô hình 1 (Strategy 1) và Mô hình 2 (Strategy 2) như sau: Xem tại trang 44 của tài liệu.
Bảng 2.1. Số liệu kinh doanh tại chi nhánh Quảng Ngãi - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Bảng 2.1..

Số liệu kinh doanh tại chi nhánh Quảng Ngãi Xem tại trang 51 của tài liệu.
Bảng 2.3. Mẫu dữ liệu 10 khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Bảng 2.3..

Mẫu dữ liệu 10 khách hàng Xem tại trang 54 của tài liệu.
Bảng 2.5. Mẫu bootstrap 1 của 10 khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Bảng 2.5..

Mẫu bootstrap 1 của 10 khách hàng Xem tại trang 57 của tài liệu.
Bảng 2.4. Giá trị hàm membership của 10 dữ liệu khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Bảng 2.4..

Giá trị hàm membership của 10 dữ liệu khách hàng Xem tại trang 57 của tài liệu.
2.5.4. Mô hình tổng quát - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

2.5.4..

Mô hình tổng quát Xem tại trang 58 của tài liệu.
Hình 2.4. Fold1 với CSDL 1957 bảng ghi của khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 2.4..

Fold1 với CSDL 1957 bảng ghi của khách hàng Xem tại trang 59 của tài liệu.
Hình 2.5. Fol d2 với CSDL 1957 bảng ghi của khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 2.5..

Fol d2 với CSDL 1957 bảng ghi của khách hàng Xem tại trang 59 của tài liệu.
Hình 2.6. Fold 10 với CSDL 1957 bảng ghi của khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 2.6..

Fold 10 với CSDL 1957 bảng ghi của khách hàng Xem tại trang 60 của tài liệu.
Hình 3.1. Biểu đồ ca sử dụng tổng quát - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.1..

Biểu đồ ca sử dụng tổng quát Xem tại trang 61 của tài liệu.
Hình 3.2. Phân rã ca sử dụng huấn luyện dữ liệu - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.2..

Phân rã ca sử dụng huấn luyện dữ liệu Xem tại trang 62 của tài liệu.
Hình 3.5. Biểu đồ hoạt động tư vấn - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.5..

Biểu đồ hoạt động tư vấn Xem tại trang 63 của tài liệu.
Hình 3.7. Biểu đồ tuần tự cho hoạt động huấn luyện dữ liệu - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.7..

Biểu đồ tuần tự cho hoạt động huấn luyện dữ liệu Xem tại trang 64 của tài liệu.
Hình 3.8. Biểu đồ tuần tự cho hoạt động tư vấn - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.8..

Biểu đồ tuần tự cho hoạt động tư vấn Xem tại trang 64 của tài liệu.
Hình 3.10. Màn hình Đăng nhập hệ thống - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.10..

Màn hình Đăng nhập hệ thống Xem tại trang 66 của tài liệu.
Hình 3.12. Màn hình tải dữ liệu huấn luyện - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.12..

Màn hình tải dữ liệu huấn luyện Xem tại trang 67 của tài liệu.
Bảng 3.1. Ví dụ về khách hàng cần tư vấn - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Bảng 3.1..

Ví dụ về khách hàng cần tư vấn Xem tại trang 69 của tài liệu.
Hình 3.17. Độ chính xác của mô hình Random Forest- fold1 - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.17..

Độ chính xác của mô hình Random Forest- fold1 Xem tại trang 71 của tài liệu.
Hình 3.18. Kết quả độ chính xác của mô hình Random Forest - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.18..

Kết quả độ chính xác của mô hình Random Forest Xem tại trang 72 của tài liệu.
Hình 3.20. Độ chính xác của mô hình Fuzzy Random Forest – Fold1 - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

Hình 3.20..

Độ chính xác của mô hình Fuzzy Random Forest – Fold1 Xem tại trang 73 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan