(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu

89 3 0
(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu(Luận văn thạc sĩ) Phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe bằng mô hình học sâu

LỜI CAM ĐOAN Tôi Mai Quốc Thái học viên khóa 2018B ngành Khoa Học Máy Tính Tơi xin cam đoan luận văn tơi nghiên cứu, tìm hiểu phát triển hướng dẫn TS Nguyễn Thành Sơn, khơng có chép từ tài liệu, cơng trình nghiên cứu người khác mà khơng ghi rõ nguồn trích dẫn Các số liệu, kết nên luận văn trung thực Tôi xin chịu trách nhiệm lời cam đoan Học viên Mai Quốc Thái iii LỜI CẢM TẠ Lời đầu tiên, em xin gửi lời cảm ơn chân thành sâu sắc đến TS Nguyễn Thành Sơn, thầy tận tình hướng dẫn để em hồn thành luận văn Em xin gửi lời cảm ơn lời chúc sức khỏe tới quý thầy cô môn Khoa học máy tính, Khoa Cơng nghệ Thơng tin, trường đại học Sư Phạm Kỹ Thuật TP Hồ Chí Minh tạo điều kiện thuận lợi việc trao đổi hướng dẫn vấn đề mà em gặp phải lúc hoàn thành luận văn Tp.HCM, ngày 27 tháng 11 năm 2020 Học viên Mai Quốc Thái iv MỤC LỤC NHIỆM VỤ NGHIÊN CỨU .i LÝ LỊCH KHOA HỌC ii LỜI CAM ĐOAN iii LỜI CẢM TẠ iv DANH SÁCH CÁC BẢNG ix DANH SÁCH CÁC HÌNH x ĐẶT VẤN ĐỀ xii Đặt vấn đề xii Mục tiêu, đối tượng, phạm vi nghiên cứu xiii Nhiệm vụ hướng tiếp cận xiv Kết đạt xiv Ý nghĩa thực tiễn đề tài xv Chương TỔNG QUAN 16 1.1 Giới thiệu hệ thống thu thập liệu ô tô 16 1.2 Các khái niệm 17 1.2.1 Quãng đường xe 17 1.2.2 Gia tốc 17 1.2.3 Vận tốc 18 1.2.4 Thời gian sử dụng xe 18 1.2.5 Vị trí 18 1.3 Các cơng trình nghiên cứu liên quan dựa khái niệm UBI 18 v 1.4 Áp dụng mơ hình học sâu giải toán phân loại khách hàng 21 1.5 Giới thiệu ứng dụng loại khách hàng mua bảo hiểm ô tô dựa hành vi sử dụng xe 21 1.5.1 Ý tưởng khoa học 21 1.5.2 Giới thiệu ứng dụng 22 Chương CƠ SỞ LÝ THUYẾT 23 2.1 Các mơ hình phân loại liệu liên quan 23 2.1.1 Phân lớp mơ hình học máy 23 2.1.2 Phân lớp mơ hình mạng neural 24 2.1.3 Giới thiệu mơ hình học sâu DNN 25 2.1.3.1 Kiến trúc tổng quát DNN 26 2.1.3.2 Trọng số liên kết (Connection Weights): 27 2.1.3.3 Hàm tổng (Summation Function): 27 2.1.3.4 Hàm chuyển đổi (Transformation Function): 28 2.1.4 Giới thiệu mơ hình học sâu CNN 29 2.1.4.1 Kiến trúc tổng quát CNN 29 2.1.4.2 Hàm kích hoạt 30 2.1.5 Giới thiệu mơ hình học sâu RNN-LSTM 33 2.2 Lựa chọn mơ hình học sâu CNN-LSTM để áp dụng vào tốn phân lớp khách hàng mua bảo hiểm tơ 37 Chương XÂY DỰNG ỨNG DỤNG PHÂN LOẠI KHÁCH HÀNG MUA BẢO HIỂM Ô TÔ DỰA TRÊN HÀNH VI SỬ DỤNG XE 39 3.1 Tập liệu 39 vi 3.2 Tiền xử lý tập liệu 40 3.3 Kiến trúc hệ thống 42 3.3.1 Lớp mạng CNN lớp tổng hợp (Pooling) 42 3.3.2 Lớp mạng RNN-LSTM 44 3.3.3 Lớp Dropout 45 3.3.4 Phân lớp hành vi lái xe 46 3.4 Huấn luyện hệ thống mạng 46 3.4.1 Hàm chi phí 46 3.4.2 Công thức tối ưu hàm chi phí (cost function) 46 3.5 Đánh giá mơ hình 47 3.5.1 Sử dụng F1-score 47 3.5.2 Sử dụng Accuracy 47 3.5.3 Sử dụng AUC (Area Under Curve) 47 3.6 Thiết kế giao diện ứng dụng 47 3.7 Chương trình xử lý 51 3.7.1 Xử lý trang phân lớp 52 3.7.2 Xử lý trang huấn luyện 55 Chương THỬ NGHIỆM, ĐÁNH GIÁ KẾT QUẢ 57 4.1 Thực nghiệm đánh giá ứng dụng 57 4.1.1 Tổ chức ứng dụng 57 4.1.2 Môi trường thực nghiệm 58 4.1.3 Đánh giá ứng dụng 60 vii 4.2 Đánh giá độ xác mơ hình học sâu DeepConvLSTM giải tốn 61 Chương KẾT LUẬN VÀ KIẾN NGHỊ 65 5.1 Kết đạt 65 5.2 Hạn chế 65 5.3 Hướng phát triển 65 TÀI LIỆU THAM KHẢO 67 PHỤ LỤC 69 viii DANH SÁCH CÁC BẢNG BẢNG TRANG Bảng 1.1: Mối quan hệ vận tốc quãng đường phanh an toàn 18 Bảng 4.1: Thơng số lớp mơ hình 60 Bảng 4.2: So sánh thời gian huấn luyện độ xác mơ hình 60 Bảng 4.3: Kết thực nghiệm thông qua liệu kiểm tra 62 Bảng 4.4: Thực nghiêm mơ hình CNN 62 Bảng 4.5: Thực nghiêm mơ hình LSTM-15 63 ix DANH SÁCH CÁC HÌNH HÌNH TRANG Hình 1.1: Sơ đồ chi phí bảo hiểm dựa quãng đường 17 Hình 1.2: Mơ tả ứng dụng 22 Hình 2.1: Phân loại khách hàng mơ hình học máy 23 Hình 2.2: Sơ đồ đơn giản mạng neural nhân tạo 25 Hình 2.3: Kiến trúc tổng quát DNN 26 Hình 2.4: Cấu trúc mạng DNN đơn giản 27 Hình 2.5: Minh họa cách tính tổng điểm mạng 28 Hình 2.6: Minh họa cách hoạt động hàm chuyển đổi 28 Hình 2.7: Mơ hình tích chập 30 Hình 2.8: Mơ hình mạng nơ ron CNN 30 Hình 2.9: Đồ thị Hàm tuyến tính 31 Hình 2.10: Đồ thị Hàm bước nhị phân 31 Hình 2.11: Đồ thị Hàm Sigmoid 32 Hình 2.12: Đồ thị Hàm Tanh 32 Hình 2.13: Đồ thị Hàm ReLU 33 Hình 2.14 Mơ hình RNN tổng quát 34 Hình 2.15: Cấu trúc liên kết mạng RNN 34 Hình 2.16: Cấu trúc mạng RNN-LTSM 35 Hình 2.17 Cổng trạng thái LTSM 35 Hình 2.18 Cổng xem xét dự liệu t-1 36 Hình 2.19 Mơ hình tính tốn thơng cell 36 Hình 2.20: Cập nhật thơng tin cell 36 Hình 2.21: Xử lý liệu đầu cell 37 x Hình 2.22: Lưu đồ tính tốn mạng CNN-LSTM 38 Hình 2.23: Sơ đồ tính tốn CNN-LSTM 38 Hình 3.1: Cấu trúc liệu 40 Hình 3.2: Hình dạng đặc tính RPM (vịng tua máy/phút) lớp B C [22] 40 Hình 3.3: Mơ cửa sổ trượt [22] 41 Hình 3.4: Mơ tả hệ thống xử lý qua lớp [22] 42 Hình 3.5: Mơ hình xử lý CNN 43 Hình 3.6: Mơ tả cấu tạo nơron mạng RNN-LSTM [22] 44 Hình 3.7: Cấu trúc cell mạng RNN-LSTM 45 Hình 3.8 So sánh khác hai mơ hình khơng có, có sử dụng lớp Dropout 46 Hình 3.9: Giao diện trang ứng dụng 48 Hình 3.10: Giao diện trang phân lớp 49 Hình 3.11: Giao diện trang huấn luyện 50 Hình 3.12: Giao diện trang đánh giá 51 Hình 3.13: Lưu đồ ứng dụng 52 Hình 3.14: Lưu đồ tổng quan trang phân lớp 53 Hình 3.15: Lưu đồ chức mở liệu 54 Hình 3.16: Lưu đồ xử lý chức phân lớp 55 Hình 3.17: Lưu đồ trang huấn luyện 56 Hình 4.1: Ứng dụng trình huấn luyện 58 Hình 4.2: Sau trình phân lớp 59 xi ĐẶT VẤN ĐỀ Đặt vấn đề Ngành công nghiệp ô tô giới nói chung nước ta nói riêng liên tục có bước chuyển phát triển khơng ngừng, với cách mạng cơng nghiệp lần thứ tư góp phần đưa ngành tơ đến vị trí cao với công nghệ tiên tiến xe tự hành, hệ thống viễn thông - thông tin ô tô (telematic), trợ lý ảo,… bên cạnh có ứng dụng khẳng định vị trí quan trọng hệ thống bảo hiểm dựa hành vi lái xe (UBI – Usage Based Insurance) Thật với mức tăng trưởng ngành ô tô bảo hiểm tơ loại bảo hiểm quan trọng cung cấp bảo vệ tài cách giảm thiểu thiệt hại trách nhiệm pháp lý từ tai nạn xe Nhưng để đạt điều cơng ty bảo hiểm phải có bước phân loại khách hàng dựa vào hành vi lái xe để đưa gói bảo hiểm xe phù hợp với loại khác hàng, từ giúp công ty bảo hiểm đạt lợi nhuận tối đa thu hút nhiều khách hàng Tuy nhiên, việc phân loại khách hàng công ty bảo hiểm thường thực thủ công phụ thuộc vào chủ quan người bán bảo hiểm Để đưa dự đốn xác khách hàng nhằm lựa chọn gói bảo hiểm chương trình khuyến thích hợp, cần xây dựng mơ hình xử lý liệu lớn (big data) thu thập từ khách hàng thơng qua hệ thống viễn thông - thông tin ô tô (telematic) Đề tài sâu vào phân tích đưa mơ hình dự báo hay phân loại khách hàng chuẩn bị mua bảo hiểm dựa vào hành vi sử dụng xe họ nhằm hỗ trợ người bán bảo hiểm đưa định xác gói bảo hiểm chương trình khuyến phù hợp với khách hàng xii Bước 7: Có thể phân tích liệu UBI thơng qua biểu đồ nhằm củng cố định người dùng Một số tính mở rộng: Thay đổi ngôn ngữ: 77 Làm rõ nghĩa kết phân lớp cách thêm ToolTip, StatusTip hình bên Một số chức phần Setting để thay đổi giao diện biểu đồ UBI nhằm giúp dễ phân tích 78 79 PHÂN LOẠI KHÁCH HÀNG MUA BẢO HIỂM Ô TÔ THEO HÀNH VI SỬ DỤNG XE BẰNG MƠ HÌNH HỌC SÂU Classifying Customers Who Buy Car Insurance Based On Their Car Use Behavior payment offers By Applying Deep Learning Model Mai Quoc Thai1 1Trường đại học Sư phạm Kỹ thuật TP.HCM TÓM TẮT Ngành cơng nghiệp tơ giới nói chung nước ta nói riêng liên tục có bước chuyển phát triển khơng ngừng, với cách mạng cơng nghiệp lần thứ tư góp phần đưa ngành tơ đến vị trí cao với cơng nghệ tiên tiến xe tự hành, hệ thống viễn thông - thông tin ô tô (telematic), trợ lý ảo,… Với mức tăng trưởng ngành tơ bảo hiểm tô loại bảo hiểm quan trọng cung cấp bảo vệ tài cách giảm thiểu thiệt hại trách nhiệm pháp lý từ tai nạn xe Nhưng để đạt điều cơng ty bảo hiểm phải tiến hành phân loại khách hàng dựa vào hành vi lái xe để đưa gói bảo hiểm xe phù hợp với loại khác hàng, từ giúp cơng ty bảo hiểm đạt lợi nhuận tối đa thu hút nhiều khách hàng Tuy nhiên, việc phân loại khách hàng cơng ty bảo hiểm địi hỏi phải có phân tích kỹ thuật phức tạp Để giải vấn đề cần có ứng dụng phân loại khách hàng với độ xác cao phải xử lý liệu lớn nhiều chiều Đề tài sâu vào phân tích xây dựng ứng dụng phân loại khách hàng chuẩn bị mua bảo hiểm dựa vào hành vi sử dụng xe họ thơng qua việc kết hợp hai mơ hình học sâu CNN LSTM nhằm hỗ trợ người bán bảo hiểm đưa định xác gói bảo hiểm chương trình khuyến phù hợp với khách hàng dựa liệu UBI Từ khóa: liệu UBI; CNN; LSTM; phân loại bảo hiểm ô tô ABSTRACT Profiling driver behaviors and designing appropriate pricing models are essential for auto insurance companies to gain profits and attract customers (drivers) Because of human driving behaviors are personalized and unique, and the automobile UBI(Usage Based Insurance) data of drivers could be helpful to automatically identify different driving behaviors therefore the insurance companies can provide the better insurance payment offers But how to classification those customers base on the UBI data This paper provides a method to apply deep learning algorithm (DeepConvLSTM) by fusing convolutional neural networks (CNN) and recurrent neural 80 networks (LSTM) which is more suitable for time series UBI data The application will base on the customer's data (UBI) to classify thier behaviors to support the insurance companies determind their customer payment offers With the strength of CNN model, the processing time will be improved and the accuracy is higher by using the LSTM model to process the time serie data Keywords: UBI data; Deeplearning; CNN; LSTM; Usage Based Insurance GIỚI THIỆU việc giải u cầu tốn địi hỏi Với phát triển mạnh công nghệ việc xử lý liệu lớn nhiều chiều nên tác giả truyền nhận liệu tạo tiền đề cho nhiều hướng đến sử dụng mơ hình học sâu ngành cơng nghiệp phát triển, lĩnh CNN(Convolutional Neural Network), vực cơng nghệ thu thập liệu ô tô LSTM (Long Short Term Memory) kết hợp không ngoại lệ Nhiều ứng dụng liên quan thu hai mơ hình (DeepConvLSTM) để tậng thập liệu người dùng đẩy mạnh phục dụng ưu điểm mà hai mơ hình mang vụ nhiều cho nhu cầu phân tích kỹ thuật, quản lại nhằm tăng độ xác thời gian xử lý lý, đánh giá, bảo dưỡng v.v… Trong phải kể đến liệu UBI (Usage Based Insurance) CÁC CƠNG TRÌNH NGHIÊN CỨU LIÊN QUAN loại liệu thu thập Cơng trình nghiên cứu Bing He thông qua hệ thống cảm biến xe nhằm công đề cập báo ghi lại trình sử dụng xe người dùng “Profiling Driver Behavior for Personalized liệu kèm với phương thức tính Insurance Pricing and Maximal Profit” [1] tốn, chuẩn hóa liệu nhằm phục vụ cho Bài báo nêu khái niệm chung để ngành bảo hiểm cứu trợ xây dựng phân loại khách hàng theo tiêu chí Nhận thấy tiềm loại liệu nhu cầu phân tích liệu UBI cho việc phân loại đánh giá khách hàng thông qua lịch sử hành vi lái xe báo trình bày việc xây dựng ứng dụng phân loại khách hàng dựa hành vi họ phản ánh thu thập thông qua liệu UBI Để xử lý liệu lớn nhiều chiều tác giả tham khảo nghiên cứu có liên quan trước đó[1][2], kết đưa mơ hình học sâu có nhiều ưu điểm “trả phí theo cách bạn lái xe” áp dụng PROFILE-PRICE-PROFIT (PPP) tảng dựa vào để xây dựng nên cơng thức tính tốn dự báo giá, nhiên điểm hạn chế áp dụng AI mức độ học máy để tính tốn liệu phức tạp chưa áp dụng học sâu, liệu báo chủ yếu xây dựng qua bốn trường gồm: thời gian lái xe, vận tốc, độ tăng/giảm tốc, loại đường Các liệu nên giải toán phạm vi hẹp nên thiếu tính khách quan, mơ hình sau xây dựng khó 81 khăn việc cập nhật lại tốn có liệu phải chuẩn hóa lấy mẫu theo thay đổi, giải thuật chưa sử dụng mơ hình cửa sổ trượt (sliding window) Khi loại liệu quan trọng khác (dữ liệu phanh xe, liệu có dạng 𝜒 ∊ ℝ hành trình chuyến xe,…) để xử lý dẫn đến 𝜒 = (𝜒 , 𝜒 , 𝜒 , … , 𝜒 có sai số Shaimaa M Hegazy, Mohamed N Moustafa, “Classifying Aggressive Drivers for Better Traffic Signal Control” [2] Tác giả đưa mơ hình dự báo tình hình giao thơng áp dụng mơ hình học sâu, ứng dụng sử dụng liệu lớn vị trí phương tiện để dự báo tình trạng kẹt xe Nhìn chung với nghiên cứu cung cấp thêm kiến thức để nắm rõ cách thức tổ chức áp dụng học sâu để giải quết toán phân lớp CÁC KHÁI NIỆM CƠ BẢN 3.1 Dữ liệu UBI Tập liệu UBI (data set) sử dụng để đánh giá mơ hình Ocslab [3] Những liệu thu thập thông qua hệ thống thu thập liệu Hàn Quốc nhằm phục vụ thi “Bảo mật thông tin R&D 2018” [4] × ,𝜒 ) Trong 𝑁 số chiều 𝜒 , 𝑀 số lượng mẫu (những cửa sổ trượt) tập liệu 𝜒 3.2 Mơ hình học sâu CNN Mơ hình CNN bao gồm kết hợp nhiều lớp tích chập lại với mà lớp có tính tốn hàm kích hoạt phi tuyến (nonlinear activation function) ReLU hay để tạo thông tin trừu tượng cho lớp Hay nói khác mơ hình CNN liên kết lớp với mà kết đầu lớp trước trừu tượng hóa thơng qua hàm kích hoạt đầu vào lớp tích chập Đến giai đoạn cuối kết hợp lại tất đặc trưng lại với đầu hồn chỉnh để tiến hành phân tích hay áp dụng vào tốn cụ thể Dữ liệu bao gồm 94,401 mẫu, chia thành 10 lớp đại diện, ký hiệu từ A đến I tương ứng cho lớp hành vi lái xe khác với A tốt Các mẫu lấy mẫu khoảng thời gian (8 sáng – 11 tối), với tần số lấy mẫu 1Hz Hình 1.Mơ hình mạng nơ ron CNN 3.3 Mơ hình học sâu LSTM Tất đặc tính (features) đưa trực Mơ hình LSTM hệ thống mạng nơron tiếp vào mơ hình mà khơng thơng qua phát triển với ý tưởng kết nối thông giải thuật lựa chọn (features selection) tin từ lớp trước lại với nhằm hỗ Nhưng trước đưa vào mơ hình loại trợ cho việc xử lý lớp Tùy vào ứng 82 dụng mà việc thu thập liệu xa hay Vì biên độ liệu lớn nên gần lớp xử lý Lấy ví dụ chúng trước đưa vào mơ hình học sâu chúng cần ta cần xử lý câu nhận dạng “hôm phải chuẩn hóa theo cơng thức sau: [thời_tiết_tốt] [sinh_viên] đến [trường] 𝜒̅ = [bình_thường]” có thơng tin sinh_viên (𝜒 − 𝑚𝑒𝑎𝑛(𝜒 )) 𝑠𝑡𝑑(𝜒 ) 𝜒 = (𝜒̅ , 𝜒̅ , 𝜒̅ , … , 𝜒̅ dự đốn từ trường mà khơng cần , 𝜒̅ ) nhiều thông tin xa sinh_viên, để xử Với 𝑚𝑒𝑎𝑛(𝜒 ) 𝑠𝑡𝑑(𝜒 ) lý dự đốn từ [bình_thường] cần trung bình độ lệch chuẩn chiều thứ nth mạng phải hỗ trợ nhớ lâu (LSTM-Long loại liệu (feature) short term memory) Do đầu vào mơ hình học sâu ma trận số nên ta cần xử lý liệu dạng sổ trượt cho tính năng, nhằm chia liệu thành đoạn rời để đưa vào mơ hình tính tốn Cụ thể đoạn liệu se có độ rộng Tx , với chu kì trượt Hình 2.Minh họa mối liên kết tế bào thuộc mô hình LSTM cửa sổ nhỏ độ rộng Tx/2 đảm bảo liệu sau phân đoạn không bị đặc trưng Với liệu có 𝑁 XÂY DỰNG ỨNG DỤNG chiều số lượng mẫu xi Dx = Tx × 4.1 Tiền xử lý liệu Tất đặc tính (features) đưa trực tiếp vào mơ hình mà khơng thơng qua 𝑁 hay cịn biểu diễn dạng: 𝑥 = (𝜒̅ giải thuật lựa chọn (features selection) , 𝜒̅ , 𝜒̅ , … , 𝜒̅ ) ∊ ℝ , (𝑡 Nhưng trước đưa vào mơ hình loại = 𝑇 , 𝑇 + ∆𝑡, 𝑇 + 2∆𝑡, … ) liệu phải chuẩn hóa lấy mẫu theo mơ hình cửa sổ trượt (sliding window) Khi liệu có dạng 𝜒 ∊ ℝ × 𝜒 = (𝜒 , 𝜒 , 𝜒 , … , 𝜒 ,𝜒 ) Trong 𝑁 số chiều 𝜒 , 𝑀 số lượng mẫu (những cửa sổ trượt) tập liệu 𝜒 Hình 3.Minh họa trình xử lý liệu 4.2 Kết hợp hai mơ hình học sâu 83 Mơ hình DeepConvLSTM phát 4.3 Các hàm cơng thức đánh giá triển từ báo [5] nghiên cứu Hàm chi phí: mơ hình học sâu cải tiến Trong đề tài tác giả dựa kết mơ hình đó, báo tác giả dựa nghiên cứu báo [5] để đưa lựa nghiên cứu để áp dụng vào tốn chọn tối ưu hàm chi phí cross- phân loại khách hàng mua bảo hiểm dựa entropy Hàm chi phí thích hợp với chuẩn liệu UBI tốn phân lớp có nhiều lớp mơ hình học sâu Cụ thể mơ hình học sâu bao gồm kết hợp hai mơ hình CNN LSTM Hai mơ hình mạnh riêng kết hợp chúng lại thu kết tốt phức tạp tập liệu có nhiều đặc tính (feature) 𝐽 (𝑤) = − sử dụng chúng riêng lẻ (𝑦 ( ) log 𝑦 𝑥 + − 𝑦 log(1 − 𝑦(𝑥 ( ) ))) Với (𝑥 ( ) , 𝑦 ( ) ) mẫu đầu vào nhãn thứ i, 𝑦(𝑥 ) kết dự đốn mẫu 𝑥 Đánh giá qua cơng thức Accuracy: Độ xác tính tốn dựa tỷ lệ dự đoán so với tổng số mẫu Hình 4.Mơ tả mơ hình học sâu áp dụng vào tốn[5] Ta dễ dàng thấy mơ hình bao gồm mơ hình học sâu mạnh CNN chịu nhiệm vụ cho phần tiền xử lý, rút trích đặt 𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = Trong giải thuật đưa dự đoán cho cửa sổ liệu (window data), mẫu dự đốn làm tăng tỷ lệ Accuracy Đánh giá qua AUC: trưng LSTM phần xử lý tính tốn cho phân lớp Với hỗ trợ mơ hình CNN liệu đầu vào tinh giảm loại bỏ thơng tin thừa từ tiết kiệm thời AUC thơng số đánh giá độ xác tốn phân lớp nhị phân Độ xác tính tốn theo cơng thức sau: 𝐴𝑈𝐶 (𝑇𝑃 𝑟𝑎𝑡𝑒) gian cho tồn q trình huấn luyện, riêng = với mạnh mơ hình LSTM nhận liệu xử lý từ trước để tiến hành phân lớp làm tăng độ xác cho toán 𝑆ố 𝑚ẫ𝑢 𝑑ự đ𝑜á𝑛 đú𝑛𝑔 𝑇ổ𝑛𝑔 𝑠ố 𝑚ẫ𝑢 𝑇𝑟𝑢𝑒𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒 𝐹𝑎𝑙𝑠𝑒𝑁𝑎𝑔𝑎𝑡𝑖𝑣𝑒 + 𝑇𝑟𝑢𝑒𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒 Trong độ xác AUC tính theo tỷ lệ số mẫu dự đốn xác (True positive) với tổng số mẫu dự đốn FalseNagative + TruePositive 84 Thực thi mơ hình: lớp chịu trách 4.4 Tổ chức ứng dụng Ứng dụng viết ngôn ngữ nhiệm thực thi mơ hình học sâu cách python phiên 3.7 sử dụng thư viện gọi thư viện Tensorflow gọi Tensorflow 2.3.1 hỗ trợ thiết kế mơ lớp hình học sâu Cụ thể cấu trúc ứng dụng gồm KẾT QUẢ THỰC NGHIỆM 5.1 Môi trường thực nghiệm Ứng dụng cài đặt chạy thử phần: Giao diện thơng số, cấu hình: lớp phần cứng máy tính: giao tiếp trực tiếp với người dùng cách - Hệ điều hành: Windows 10 64bit cho phép người dùng nhập thông tin đầu - Chip xử lý: Intel Core Duo vào để tùy chỉnh mơ hình học sâu trước T6570, 2.10GHz (2CPUs) khởi chạy - Bộ nhớ RAM: 4G Huấn luyện phân lớp: lớp chịu - Chip xử lý đồ họa: Khơng có trách nhiệm chuyển thơng số từ lớp giao diện vào mơ hình tiến hành khởi chạy Bên thơng tin cấu hình cho lớp mơ hình huấn luyện phân lớp Nói mơ hình bao gồm DeepConvLSTM cách khác lớp lớp thiết kế (mơ hình kết hợp CNN+LSTM), mơ hình tồn ứng dụng lớp chịu trách nhiệm CNN mô hình LSTM Tác giả tiến hành trung chuyển liệu đầu vào so sánh trực tiếp ba mơ hình để chịu trách nhiệm gọi thư viện Tensorflow dễ dàng thấy tối ưu kết hợp mơ để thực thi hình CNN LSTM với hai mơ hình cịn lại chúng hoạt động riêng lẻ Bảng 1.Thông số lớp mơ hình 85 Bảng 2.So sánh thời gian huấn luyện độ xác mơ hình 5.2 So sánh độ xác mơ hình Sau trình huấn luyện cần Như Bảng ta thấy mơ hình đánh giá mơ hình thơng qua tập kiểm LSTM-15 có số độ xác cao tra chuẩn bị sẵn hồn tồn tách biệt hai mơ hình cịn lại hỗ trợ với tập liệu UBI dùng trình 15 đặc trưng, 15 đặc trưng phải chọn huấn luyện, thu kết sau: thông qua giải thuật tiền xử lý liệu, dẫn đến khó khăn việc mở rộng hệ thống Mơ hình CNN có tốc độ huấn luyện ấn tượng (3 giây/epoch Bảng 2) nhiên độ xác thấp so với hai mơ hình cịn lại, CNN xử lý rời rạc hóa liệu phân lớp nhiên liệu dạng liên tục nên lớp RMM-LSTM phát huy mạnh việc xử lý loại liệu mày Mô hình học sâu DeepConvLSTM có độ cao mơ hình CNN thời gian huấn luyện chưa nhanh CNN mà Bảng Kết thực nghiệm mô hình tất 51 chiều liệu phép xử lý khơng DeepConvLSTM thơng qua chọn lọc mơ hình LSTM Kết luận mơ hình DeepConcLSTM lai ghép hai mơ hình CNN LSTM từ có mạnh so với mơ hình truyền thống tốc độ huấn luyện, độ xác, số chiều liệu lớn… 5.3 Đánh giá tập liệu thực tế 86 Bảng Kết thực nghiệm mơ hình LSTM Qua so sánh nhận thấy mơ hình kết hợp DeepConvLSTM đạt độ xác tương đối cao 86.70% cao mơ hình CNN với độ xác 80% Và với ưu mơ hình LSTM đạt độ xác cao 93.33% Tuy nhiên đánh giá cách khách quan mơ mơ hình kết hợp DeepConvLSTM tối ưu mơ hình CNN độ xác thời gian thực thi độ mở rộng mơ hình LSTM Bảng Kết thực nghiệm mơ hình CNN KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Bài báo trình bày cấu trúc giải thuật tiền xử lý liệu UBI, với lý thuyết mơ hình học sâu để từ làm sở để xây dựng ứng dụng phân loại khách hàng mua bảo hiểm thông qua hành vi lái xe Là tiền đề phát triển, cải tiến cho nghiên cứu thuộc lĩnh vực phân loại bảo hiểm với tập liệu lớn nhiều chiều, dựa tập liệu UBI Ứng dụng cài đặt thành công mơ hình DeepConvLSTM (Deep learning Convolution and Long Short Term Memory), CNN (Convolution Neural Network) LSTM (Long Short Term Memory) để áp dụng vào toán phân loại Ứng dụng đáp ứng yêu cầu đề tài dùng liệu lớn theo chuẩn UBI để 87 phân loại hành vi lái xe khách hàng, nhằm từ hổ trợ cho tốn chi trả gói - Xử lý liệu trực tuyến thơng qua mơ hình điện tốn đám mây liệu lớn bảo hiểm theo lớp phân loại tương ứng - Cải tiến phần huấn luyện liệu để giảm thời gian huấn luyện tăng hiệu Hướng phát triển: đầu mơ hình - Liên kết trung tâm liệu để mở rộng nguồn liệu dùng cho mơ hình huấn luyện 88 TÀI LIỆU THAM KHẢO [23] Bing He, Dian Zhang, Siyuan Liu, Hao Liu and Dawei Han, “Profiling Driver Behavior for Personalized Insurance Pricing and Maximal Profit”, 2018 IEEE International Conference on Big Data, pp 1387–1396, 2018 [24] S M Hegazy and M N Moustafa, "Classifying aggressive drivers for better traffic signal control," 2017 IEEE 20th International Conference on Intelligent Transportation Systems (ITSC), Yokohama, 2017, pp 702-707 [25] Driving Dataset [(accessed on 11 March 2020)]; Available online: http://ocslab.hksecurity.net/Datasets/driving-dataset [26] AI/ML Based Driver Classification Challenge Track [(accessed on 11 March 2020)]; Available online: http://datachallenge.kr/challenge18/vehicle/introduction/ [27] Jun Zhang, ZhongCheng Wu, Fang Li, Chengjun Xie, Tingting Ren, Jie Chen, Liu Liu, “A Deep learning framework for Driving Behavior Identification on In-Vehicle CAN-BUS Sensor Data,” Sensors 2019, doi:10.3390/s19061356 [28] Nguyen V., Nguyen M., Choi J., Kim Y “NLOS Identification in WLANs Using Deep LSTM with CNN Features,” Sensors, pp 18:4057, 2018 [29] AI/ML Based Driver Classification Challenge Track [(accessed on 11 March 2020)]; Available online: http://datachallenge.kr/challenge18/vehicle/introduction/ [30] Li X cnnPlusLSTM [(accessed in March 2020)]; Available online: https://github.com/lixiaoyu0575/cnnPlusLSTM/ [31] Saeed A Implementing a CNN for Human Activity Recognition in Tensorflow [(accessed in March 2020)]; Available online: http://aqibsaeed.github.io/2016-11-04-human-activity-recognition-cnn/ 89 Tác giả chịu trách nhiệm viết: Tp HCM, ngày 28 tháng 12 năm Họ tên: Mai Quốc Thái 2020 Đơn vị: Trường ĐH Sư Phạm Kỹ Thuật Tp Hồ Chí Minh Điện thoại: 0903165751 Xác nhận giáo viên hướng dẫn (Ký & ghi rõ họ tên) Email: quocthai11095@gmail.com TS Nguyễn Thành Sơn ... khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe mơ hình học sâu DeepConvLSTM  Xây dựng ứng dụng phân loại khách hàng mua bảo hiểm dựa hành vi lái xe thông qua giải thuật học sâu nghiên cứu... sâu CNN-LSTM để áp dụng vào toán phân lớp khách hàng mua bảo hiểm ô tô 37 Chương XÂY DỰNG ỨNG DỤNG PHÂN LOẠI KHÁCH HÀNG MUA BẢO HIỂM Ô TÔ DỰA TRÊN HÀNH VI SỬ DỤNG XE 39 3.1... cấu hình chọn lựa thơng số mơ hình cách khoa học để vận dụng vào toán Nắm bước xây dựng ứng dụng phân loại khách hàng mua bảo hiểm ô tô theo hành vi sử dụng xe mơ hình học sâu Cài đặt ứng dụng

Ngày đăng: 13/12/2022, 19:34

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan