1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới

95 95 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 95
Dung lượng 5,86 MB

Nội dung

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM NGUYỄN THỊ THU AN ỨNG DỤNG THUẬT TOÁN RỪNG NGẪU NHIÊN MỜ ĐỂ XÂY DỰNG HỆ THỐNG TRỢ GIÚP ĐÁNH GIÁ RỦI RO TRONG BẢO HIỂM XE CƠ GIỚI LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng - Năm 2017 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM NGUYỄN THỊ THU AN ỨNG DỤNG THUẬT TOÁN RỪNG NGẪU NHIÊN MỜ ĐỂ XÂY DỰNG HỆ THỐNG TRỢ GIÚP ĐÁNH GIÁ RỦI RO TRONG BẢO HIỂM XE CƠ GIỚI Chuyên ngành: Hệ thống thông tin Mã số: 61.49.01.04 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Người hướng dẫn khoa học: TS Nguyễn Trần Quốc Vinh Đà Nẵng - Năm 2017 LỜI CAM ĐOAN Tôi xin cam đoan: - Những nội dung luận văn thực hướng dẫn trực tiếp TS Nguyễn Trần Quốc Vinh - Mọi tham khảo dùng luận văn trích dẫn rõ ràng trung thực tên tác giả, tên cơng trình, thời gian địa điểm công bố - Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Tác giả luận văn Nguyễn Thị Thu An MỤC LỤC MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nghiên cứu 3 Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Dự kiến kết Ý nghĩa khoa học thực tiễn luận văn Bố cục luận văn CHƯƠNG NGHIÊN CỨU TỔNG QUAN 1.1 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1.1 Sơ lược khai phá liệu 1.1.2 Các kỹ thuật áp dụng khai phá liệu 1.1.3 Các bước xây dựng hệ thống khai phá liệu 1.1.4 Ứng dụng khai phá liệu 10 1.1.5 Khó khăn khai phá liệu 10 1.2 PHÂN LỚP TRONG KHAI PHÁ DỮ LIỆU 10 1.2.1 Phân lớp liệu 10 1.2.2 Quá trình phân lớp liệu 11 1.2.3 Các vấn đề liên quan đến phân lớp liệu 14 1.3 CÂY QUYẾT ĐỊNH 17 1.3.1 Cây định ID3 17 1.3.2 Cây định mờ (Fuzzy Decision tree) 21 1.4 RỪNG NGẪU NHIÊN 30 1.4.1 Rừng ngẫu nhiên (Random Forest) 30 1.4.2 Rừng ngẫu nhiên mờ (Fuzzy Random Forest) 31 1.4.3 Mơ hình phân lớp với rừng ngẫu nhiên mờ 33 KẾT CHƯƠNG 37 CHƯƠNG ỨNG DỤNG RỪNG NGẪU NHIÊN MỜ TRONG CÔNG TÁC ĐÁNH GIÁ RỦI RO VÀ BỒI THƯỜNG BẢO HIỂM XE CƠ GIỚI 38 2.1 KHÁI QUÁT VỀ THỊ TRƯỜNG BẢO HIỂM XE CƠ GIỚI 38 2.2 ĐÁNH GIÁ RỦI RO XE CƠ GIỚI 39 2.2.1 Khái niệm rủi ro 39 2.2.2 Khái niệm đánh giá rủi ro 39 2.2.3 Phạm vi bảo hiểm 40 2.2.4 Quy trình đánh giá rủi ro bảo hiểm xe giới 40 2.2.5 Các yếu tố ảnh hưởng đến rủi ro bảo hiểm xe giới 40 2.3 PHÂN TÍCH HIỆN TRẠNG 41 2.3.1 Chỉ số lĩnh vực kinh doanh bảo hiểm xe giới 41 2.3.2 Giải pháp xây dựng hệ thống trợ giúp đánh giá rủi ro bảo hiểm xe giới 42 2.4 ỨNG DỤNG RỪNG NGẪU NHIÊN MỜ 42 2.4.1 Phân tích liệu 42 2.4.2 Mờ hóa liệu 44 2.4.3 Xây dựng ngẫu nhiên mờ 46 2.5.4 Mơ hình tổng qt 48 2.4.5 Ước tính độ xác mơ hình 48 KẾT CHƯƠNG 50 CHƯƠNG XÂY DỰNG VÀ THỬ NGHIỆM ỨNG DỤNG 51 3.1 CHỨC NĂNG HỆ THỐNG 51 3.1.1 Phân tích yêu cầu 51 3.1.2 Các chức 55 3.2 THỬ NGHIỆM ỨNG DỤNG 56 3.3 ĐÁNH GIÁ ĐỘ CHÍNH XÁC 60 3.3.1 Mô hình Random Forest 60 3.3.2 Mơ hình Fuzzy Random Forest 62 2.3.3 So sánh độ xác mơ hình Random Forest Fuzzy Random Forest 64 KẾT CHƯƠNG 64 KẾT LUẬN 65 DANH MỤC TÀI LIỆU THAM KHẢO QUYẾT ĐỊNH GIAO ĐỀ TÀI (BẢN SAO) PHỤ LỤC DANH MỤC CÁC TỪ VIẾT TẮT Tiếng Việt CSDL : Cơ sở liệu CNTT : Công nghệ thông tin KPDL : Khai phá liệu MDSD : Mục đích sử dụng MH : Máy học STBT : Số tiền bồi thường SL : Số lượng TGSD Thời gian sử dụng XCG Xe giới Tiếng nước CART Classification and Regression Trees DBMS Database Management System KDD Knowledge Discovery in Database FRF Fuzzy Random Forest OOB Out of Bag RF Random Forest DANH MỤC CÁC BẢNG Số hiệu Tên bảng bảng Trang 2.1 Số liệu kinh doanh chi nhánh Quảng Ngãi 41 2.2 Thống kê tình hình bồi thường tổn thất 42 2.3 Mẫu liệu 10 khách hàng 44 2.4 Giá trị hàm membership 10 liệu khách hàng 47 2.5 Mẫu bootstrap 10 khách hàng 47 3.1 Ví dụ khách hàng cần tư vấn 59 3.2 So sánh độ xác Random Forest Fuzzy Random Forest 64 DANH MỤC CÁC HÌNH Số hiệu Tên hình hình Trang 1.1 Quá trình khám phá tri thức 1.2 Xây dựng mơ hình phân lớp 12 1.3 Ước lượng độ xác 13 1.4 Phân lớp liệu 13 1.5 Ước lượng độ xác mơ hình 16 1.6 Ví dụ K-fold croos validation - fold 16 1.7 Ví dụ K-fold croos validation-fold 17 1.8 Ví dụ K-fold croos validation-fold 17 1.9 Xây dựng định theo thuật toán ID3 18 1.10 Đồ thị hàm thuộc tập mờ A 23 1.11 Hình biểu diễn chức thành phần Nhiệt độ 25 1.12 Hình biểu diễn chức thành phần Gió 26 1.13 Biểu diễn chức thành phần Ùn tắc giao thông 26 1.14 Xây dựng Fuzzy ID3 29 2.1 Đồ thị hàm membership 46 2.2 Bước tách nút lần 47 2.3 Mô hình tổng quát Fuzzy Random Forest để phân lớp 48 2.4 Fold với CSDL 1957 bảng ghi khách hàng 49 2.5 Fold với CSDL 1957 bảng ghi khách hàng 49 2.6 Fold 10 với CSDL 1957 bảng ghi khách hàng 50 3.1 Biểu đồ ca sử dụng tổng quát 51 3.2 Phân rã ca sử dụng huấn luyện liệu 52 3.3 Phân rã ca sử dụng Tư vấn 52 Số hiệu Tên hình hình Trang 3.4 Biểu đồ hoạt động huấn luyện liệu 53 3.5 Biểu đồ hoạt động tư vấn 53 3.6 Biểu đồ cho hoạt động đăng nhập 53 3.7 Biểu đồ cho hoạt động huấn luyện liệu 54 3.8 Biểu đồ cho hoạt động tư vấn 54 3.9 Triển khai hệ thống 55 3.10 Màn hình Đăng nhập hệ thống 56 3.11 Màn hình Menu 56 3.12 Màn hình tải liệu huấn luyện 57 3.13 Giao diện mơ hình phân lớp Random Forest 57 3.14 Giao diện mơ hình phân lớp Fuzzy Random Forest 58 3.15 Giao diện ứng dụng tư vấn 59 3.16 Mô hình Cây quyế t đinh ̣ Random Forest 60 3.17 Đô ̣ chiń h xác của mô hin ̀ h Random Forest- fold1 61 3.18 Kết độ xác mơ hình Random Forest 62 3.19 Mơ hình định Fuzzy Random Forest 62 3.20 3.21 Độ xác mơ hình Fuzzy Random Forest – Fold Kết độ xác mơ hình Fuzzy Random Forest 63 64 ... THU AN ỨNG DỤNG THUẬT TOÁN RỪNG NGẪU NHIÊN MỜ ĐỂ XÂY DỰNG HỆ THỐNG TRỢ GIÚP ĐÁNH GIÁ RỦI RO TRONG BẢO HIỂM XE CƠ GIỚI Chuyên ngành: Hệ thống thông tin Mã số: 61.49.01.04 LUẬN VĂN THẠC SĨ HỆ THỐNG... nhiên, thuật toán rừng ngẫu nhiên mờ chưa sử dụng Vì tơi chọn đề tài: ? ?Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro bảo hiểm xe giới? ?? để làm luận văn thạc... giá bồi thường rủi ro bảo hiểm xe giới 3 Hiện nay, có số cơng trình nghiên cứu sử dụng để xây dựng hệ thống đánh giá rủi ro xe giới như: thuật toán C4.5, thuật toán rừng nhẫu nhiên, thuật toán

Ngày đăng: 24/04/2022, 15:20

HÌNH ẢNH LIÊN QUAN

DANH MỤC CÁC BẢNG Số hiệu  - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
hi ệu (Trang 8)
Hình 1.1. Quá trình khám phá tri thức - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 1.1. Quá trình khám phá tri thức (Trang 17)
Hình 1.2. Xây dựng mô hình phân lớp - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 1.2. Xây dựng mô hình phân lớp (Trang 22)
Hình 1.5. Ước lượng độ chính xác của mô hình - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 1.5. Ước lượng độ chính xác của mô hình (Trang 26)
Hình 1.9. Xây dựng cây quyết định theo thuật toán ID3 - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 1.9. Xây dựng cây quyết định theo thuật toán ID3 (Trang 28)
Hình 1.10. Đồ thị hàm thuộc tập mờ A - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 1.10. Đồ thị hàm thuộc tập mờ A (Trang 33)
Hình 1.11. Hình biểu diễn chức năng thành phần của Nhiệt độ - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 1.11. Hình biểu diễn chức năng thành phần của Nhiệt độ (Trang 35)
Hình 1.12. Hình biểu diễn chức năng thành phần của Gió - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 1.12. Hình biểu diễn chức năng thành phần của Gió (Trang 36)
Hình 1.13. Biểu diễn chức năng thành phần Ùn tắc giao thông - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 1.13. Biểu diễn chức năng thành phần Ùn tắc giao thông (Trang 36)
Hình 1.14. Xây dựng cây con Fuzzy ID3 - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 1.14. Xây dựng cây con Fuzzy ID3 (Trang 39)
Phân lớp mờ được P.Bonissone và các cộng sự đưa ra hai dạng mô hình được gọi là  Mô hình 1 (Strategy 1) và Mô hình 2 (Strategy 2) như sau:  - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
h ân lớp mờ được P.Bonissone và các cộng sự đưa ra hai dạng mô hình được gọi là Mô hình 1 (Strategy 1) và Mô hình 2 (Strategy 2) như sau: (Trang 44)
Bảng 2.1. Số liệu kinh doanh tại chi nhánh Quảng Ngãi - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Bảng 2.1. Số liệu kinh doanh tại chi nhánh Quảng Ngãi (Trang 51)
Bảng 2.3. Mẫu dữ liệu 10 khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Bảng 2.3. Mẫu dữ liệu 10 khách hàng (Trang 54)
Bảng 2.5. Mẫu bootstrap 1 của 10 khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Bảng 2.5. Mẫu bootstrap 1 của 10 khách hàng (Trang 57)
Bảng 2.4. Giá trị hàm membership của 10 dữ liệu khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Bảng 2.4. Giá trị hàm membership của 10 dữ liệu khách hàng (Trang 57)
2.5.4. Mô hình tổng quát - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
2.5.4. Mô hình tổng quát (Trang 58)
Hình 2.4. Fold1 với CSDL 1957 bảng ghi của khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 2.4. Fold1 với CSDL 1957 bảng ghi của khách hàng (Trang 59)
Hình 2.5. Fol d2 với CSDL 1957 bảng ghi của khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 2.5. Fol d2 với CSDL 1957 bảng ghi của khách hàng (Trang 59)
Hình 2.6. Fold 10 với CSDL 1957 bảng ghi của khách hàng - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 2.6. Fold 10 với CSDL 1957 bảng ghi của khách hàng (Trang 60)
Hình 3.1. Biểu đồ ca sử dụng tổng quát - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.1. Biểu đồ ca sử dụng tổng quát (Trang 61)
Hình 3.2. Phân rã ca sử dụng huấn luyện dữ liệu - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.2. Phân rã ca sử dụng huấn luyện dữ liệu (Trang 62)
Hình 3.5. Biểu đồ hoạt động tư vấn - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.5. Biểu đồ hoạt động tư vấn (Trang 63)
Hình 3.7. Biểu đồ tuần tự cho hoạt động huấn luyện dữ liệu - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.7. Biểu đồ tuần tự cho hoạt động huấn luyện dữ liệu (Trang 64)
Hình 3.8. Biểu đồ tuần tự cho hoạt động tư vấn - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.8. Biểu đồ tuần tự cho hoạt động tư vấn (Trang 64)
Hình 3.10. Màn hình Đăng nhập hệ thống - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.10. Màn hình Đăng nhập hệ thống (Trang 66)
Hình 3.12. Màn hình tải dữ liệu huấn luyện - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.12. Màn hình tải dữ liệu huấn luyện (Trang 67)
Bảng 3.1. Ví dụ về khách hàng cần tư vấn - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Bảng 3.1. Ví dụ về khách hàng cần tư vấn (Trang 69)
Hình 3.17. Độ chính xác của mô hình Random Forest- fold1 - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.17. Độ chính xác của mô hình Random Forest- fold1 (Trang 71)
Hình 3.18. Kết quả độ chính xác của mô hình Random Forest - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.18. Kết quả độ chính xác của mô hình Random Forest (Trang 72)
Hình 3.20. Độ chính xác của mô hình Fuzzy Random Forest – Fold1 - Ứng dụng thuật toán rừng ngẫu nhiên mờ để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới
Hình 3.20. Độ chính xác của mô hình Fuzzy Random Forest – Fold1 (Trang 73)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN