TỔNG QUAN
Lý do chọn đề tài
Trong những năm gần đây, việc mua bảo hiểm du lịch đã trở nên ngày càng phổ biến và quan trọng đối với các khách hàng khi đi du lịch.Đặc biệt là sau covid-19 thì tầm quan trọng của việc bảo vệ bản thân và tài sản được đặt lên hàng đầu Ngay cả khi bạn nghỉ ngơi sau một thời gian dài chìm đắm trong công việc,thì chắc chắn bạn có thể lựa chọn đi du lịch , dã ngoại, , Không có một điều gì là chắc chắn bởi có thể xảy ra các sự cố bất ngờ như tai nạn, bệnh tật hoặc mất mát tài sản.
Một trong những lý do đáng nói tới đó là thị trường bảo hiểm du lịch đang phát triển: Ngành công nghiệp du lịch và bảo hiểm đang trên đà phát triển mạnh mẽ, đặc biệt với sự gia tăng về số lượng du khách và các loại hình du lịch khác nhau.Thị trường bảo hiểm du lịch thường biến đổi nhanh chóng và phụ thuộc vào nhiều yếu tố khác nhau như thời tiết, sự kiện, xu hướng du lịch và kinh tế. Áp dụng máy học để dự đoán xu hướng khách hàng mua bảo hiểm du lịch giúp công ty bảo hiểm nắm bắt được sự thay đổi của thị trường và điều chỉnh chiến lược kinh doanh một cách linh hoạt Điều này giúp tạo ra sự đột phá cạnh tranh và cung cấp giá trị gia tăng cho khách hàng.
Nhóm nghiên cứu muốn tạo ra một hệ thống để dự đoán xem một khách hàng có mua bảo hiểm du lịch hay không thông qua nhiều yếu tố Nhóm hy vọng rằng việc phân tích dữ liệu sẽ giúp trả lời một số câu hỏi về cách các yếu tố khác nhau ảnh hưởng đến quyết định của khách hàng khi mua bảo hiểm du lịch và xác định nguyên nhân góp phần vào quyết định của họ Kết quả nghiên cứu có thể hỗ trợ các công ty bảo hiểm trong việc xác định chính sách và biện pháp để tăng khả năng khách hàng mua bảo hiểm du lịch, đồng thời giảm thiểu việc khách hàng không mua bảo hiểm hoặc chuyển sang công ty bảo hiểm khác.
Mục tiêu nghiên cứu
Mục tiêu là nghiên cứu xu hướng mua và hành vi khách hàng khi mua bảo hiểm du lịch.
Bài toán 1: Phát hiện điểm đặc thù của dữ liệu.
Bài toán 2: Dự đoán liệu khách hàng có quan tâm đến việc mua bảo hiểm du lịch hay không.
Bài toán 3: Phân cụm/nhóm khách hàng có khả năng cao tham gia bảo hiểm khi đi du lịch.
Đối tượng nghiên cứu
Một công ty du lịch & lữ hành đang cung cấp gói bảo hiểm du lịch cho khách hàng của họ Dữ liệu được cung cấp cho gần 2000 khách hàng trước đây của công ty và được yêu cầu xây dựng một mô hình thông minh có thể dự đoán liệu khách hàng có quan tâm đến việc mua gói bảo hiểm du lịch hay không dựa trên các thông số nhất định được đưa ra dưới đây.
QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ
BÀI TOÁN 2: DỰ ĐOÁN VIỆC MUA BẢO HIỂM DU LỊCH CỦA KHÁCH HÀNG
Bước 1: Chọn dữ liệu File “BHDL” và chọn cột “Bảo hiểm du lịch” làm Target.
Bước 2: Mở File “Data”, nối File và 3 phương pháp SVM, Tree và Logistic Regression với Test and Score Nối Test and Score với Confusion Matrix để thực hiện kết quả và đánh giá ma trận nhầm lẫn
Bước 3: Liên kết phương pháp tốt nhất và File “Insurance_forecast” với Predictions để đánh giá và phân loại dữ liệu đầu vào.
Bước 4: Xuất kết quả dự báo qua Data Table, nhận xét và đánh giá.
Hình 2 Mô hình phân lớp dự đoán khả năng mua hoặc không mua bảo hiểm du lịch của khách hàng
Hình 4 Kết quả của Logistic Regression
Sai lầm loại 2: Dự đoán là không có nhiều người mua bảo hiểm nhưng thực tế vẫn có người mua bảo hiểm Nếu như sai lầm này càng lớn, thì các công ty bảo hiểm sẽ khó tiếp cận và phát triển được sản phẩm bảo hiểm du lịch theo nhu cầu và tệp khách hàng Từ đó, làm giảm doanh thu đáng kể của công ty
Sai lầm loại 2 của phương pháp Tree là nhỏ nhất trong ba phương pháp trên
Sử dụng phương pháp Tree và không cần xét đến Test and Score Kết quả dự báo.
Hình 6 Kết quả dự báo khách hàng mua hoặc không mua bảo hiểm du lịch
Kết luận về bài toán 2
Theo bảng đánh giá kết quả, ma trận nhầm lẫn của phương pháp Tree có sai lầm loại 2 bằng 194 là nhỏ nhất trong ba phương pháp: Logistics Regression, SVM, Tree.
Việc mua bảo hiểm du lịch còn phụ thuộc rất nhiều vào nhiều điều kiện và yếu tố khác nhau của khách hàng Tuy nhiên, thông qua kết quả dự báo, chúng ta có thể xác định được những tệp khách hàng tiềm năng khác nhau , cũng như là nhu cầu của khách hàng về sản phẩm bảo hiểm du lịch Từ đó, giúp các công ty bảo hiểm thiết kế ra những sản phẩm mới phù hợp với thị hiếu của khách hàng.
BÀI TOÁN 3: PHÂN CỤM/NHÓM KHÁCH HÀNG CÓ KHẢ NĂNG
Bước 3: Dùng phương pháp K-means, thực hiện chia từ 2 đến 10 nhóm, xem xét chia bao nhiêu cụm thì tối ưu nhất
Bước 4: Dùng Silhouette Plot để minh họa dữ liệu Dữ liệu từ Silhouette được minh họa trên Data table
Bước 5: Tìm đặc điểm của các nhóm mua bảo hiểm du lịch Bước 6: Đánh giá và kết luận
Hình 7 Mô hình dây dựng bài toán phân cụm/nhóm có khả năng tham gia bảo hiểm
Hình 8 Kết quả của phương pháp K-means
Theo như kết quả của K-means, ta phân tách data thành 2 nhóm vì số điểm Silhouette của 2 nhóm tiệm cận 1 nhất và giảm dần khi chia thành nhiều nhóm.
Hình 9 Kết quả Silhouette Plot 3.3 Đánh giá kết quả & kết luận
Thông qua các kết quả từ Distribution, ta có được những thông tin như:
Hình 10 Phân bố số lượng người mua bảo hiểm dựa theo độ tuổi của 2 nhóm
Những người đã từng mua bảo hiểm du lịch có tần suất nhiều nhất ở độ tuổi >= 34 đối với nhóm C1 và có tần suất nhiều nhất ở độ tuổi < 26 đối với nhóm C2 Cụ thể số người từng mua bảo hiểm du lịch ở độ tuổi 25 là 83 người thuộc nhóm C2 và số người từng mua bảo hiểm du lịch ở độ tuổi 34 là 113 người thuộc nhóm C1.
Ngoài ra, số người ít mua bảo hiểm du lịch nhất của 2 nhóm C1, C2 thuộc vào các độ tuổi như:
Số người thuộc nhóm C1 thường ít có xu hướng mua bảo hiểm du lịch khi ở độ tuổi 25-26, số lượng chỉ có 9 người mua ở độ tuổi này.
Số người thuộc nhóm C2 thường ít có xu hướng mua bảo hiểm du lịch khi ở độ tuổi 27 và 30 tuổi với số lượng lần lượt là 8 và 11 người.
Hình 11 Phân bố số lượng người mua bảo hiểm dựa theo loại công việc của 2 nhóm
Những người từng mua bảo hiểm du lịch có tần suất nhiều nhất ở loại hình công việc Tư nhân đối với đồng thời nhóm C1 và nhóm C2
Cụ thể số người từng mua bảo hiểm du lịch ở loại hình công việc Tư nhân ở nhóm C1 là 239 khách hàng, nhóm C2 chạm mức 331 khách hàng
Ngoài ra số người ít mua bảo hiểm du lịch nhất của hai nhóm C1, C2 đều nằm ở loại hình công việc Nhà nước, cụ thể như:
Nhóm C1 với những khách hàng làm công việc loại hình Nhà nước có xu hướng ít mua bảo hiểm du lịch hơn khi chỉ có 118 khách hàng đã mua bảo hiểm.
Nhóm C2 với những khách hàng làm công việc loại hình Nhà nước có xu hướng ít mua bảo hiểm du lịch hơn khi chỉ có 22 khách hàng đã mua bảo hiểm.
Hình 12 Phân bố số lượng người mua bảo hiểm dựa theo bằng tốt nghiệp của 2 nhóm
Những người từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những người đã tốt nghiệp ở cả hai nhóm C1, C2.
Cụ thể ở nhóm C1, số lượng khách hàng đã Tốt nghiệp mua bảo hiểm du lịch nằm ở con số 299 khách hàng, ở nhóm C2 chạm mức 312 khách hàng
Mặt khác , số người ít mua bảo hiểm du lịch nhất nằm ở hai nhóm C1, C2 đều là nhóm khách chưa Tốt nghiệp, cụ thể :
- Nhóm C1 những khách hàng chưa Tốt nghiệp có xu hướng ít mua bảo hiểm du lịch hơn khi chỉ có 58 khách hàng.
- Nhóm C2 những khách hàng chưa Tốt Nghiệp có xu hướng ít mua bảo hiểm du lịch hơn khi chỉ có vỏn vẹn 41 khách hàng
Hình 13 Phân bố số lượng người mua bảo hiểm dựa theo thu nhập thường niên của 2 nhóm
Những người từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những người có thu nhập ở mức 700.000 - 800.000 INR/năm ở nhóm C1 và ở nhóm C2 với những người có thu nhập 1.300.000 INR/năm.
Cụ thể ở nhóm C1, số lượng khách hàng với mức thu nhập 700.000 - 800.000 INR/năm mua bảo hiểm du lịch nằm ở con số 52 khách hàng, ở nhóm C2 khách hàng có mức thu nhập 1.300.000 INR/năm chạm mức 160 khách hàng.
Mặt khác , số người ít mua bảo hiểm du lịch nhất nằm ở nhóm C1 với những người có mức thu nhập dưới 300.000 INR/năm , C2 là nhóm khách có mức thu nhập từ 800.000 - 900.000 INR/năm, cụ thể :
Nhóm C1 có xu hướng ít mua bảo hiểm du lịch hơn khi chỉ có 6 khách hàng.
Nhóm C2 có xu hướng ít mua bảo hiểm du lịch hơn khi chỉ có vỏn vẹn 1
Hình 14 Phân bố số lượng người mua bảo hiểm dựa theo số thành viên gia đình của 2 nhóm
Những người đã từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những gia đình với 6 thành viên đối với nhóm C1 và có tần suất nhiều nhất ở gia đình có 3 thành viên đối với nhóm C2 Cụ thể số người từng mua bảo hiểm du lịch ở gia đình 3 thành viên là 85 người thuộc nhóm C2 và số người từng mua bảo hiểm du lịch ở gia đình có 6 thành viên là 79 người thuộc nhóm C1.
Ngoài ra, số người ít mua bảo hiểm du lịch nhất của 2 nhóm C1, C2 thuộc vào các gia đình có đặc điểm như:
Số người thuộc nhóm C1 thường ít có xu hướng mua bảo hiểm du lịch khi ở trong gia đình với 2 thành viên, số lượng chỉ có 8 người mua ở độ tuổi này.
Số người thuộc nhóm C2 thường ít có xu hướng mua bảo hiểm du lịch khi ở trong gia đình với 8 thành viên ,số lượng chỉ có 5 người.
Hình 15 Phân bố số lượng người mua bảo hiểm dựa theo bệnh mãn tính của 2 nhóm
Những người đã từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những người không bị bệnh mãn tính đối với cả nhóm C1 và nhóm C2 Cụ thể số người từng mua bảo hiểm du lịch không mắc bệnh mãn tính là 246 khách hàng thuộc nhóm C1 và số người từng mua bảo hiểm du lịch là 259 người thuộc nhóm C2.
Ngoài ra, số người ít mua bảo hiểm du lịch nhất là bệnh nhân mắc bệnh mãn tính ở cả nhóm C1, C2, cụ thể:
Số người thuộc nhóm C1 thường ít có xu hướng mua bảo hiểm du lịch số lượng chỉ có 111 người mua
Số người thuộc nhóm C2 thường ít có xu hướng mua bảo hiểm du lịch số lượng chỉ có 94 người.
Hình 16 Phân bố số lượng người mua bảo hiểm dựa theo việc thường xuyên đi du lịch của 2 nhóm
Những người đã từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những người thường xuyên đi du lịch đối với nhóm C2 và có tần suất nhiều nhất ở những người không thường xuyên đi du lịch đối với nhóm C1 Cụ thể số người từng mua bảo hiểm du lịch thường xuyên đi du lịch là 195 người thuộc nhóm C2 và số người từng mua bảo hiểm du lịch không thường xuyên đi du lịch là 313 người thuộc nhóm C1.
Ngoài ra, số người ít mua bảo hiểm du lịch nhất của nhóm C1 là những người có đi du lịch thường xuyên, C2 thuộc những người không đi du lịch thường xuyên, cụ thể:
Số người thuộc nhóm C1 thường ít có xu hướng mua bảo hiểm du lịch số lượng chỉ có 44 người mua ở độ tuổi này.
Số người thuộc nhóm C2 thường ít có xu hướng mua bảo hiểm du lịch số lượng đạt 158 người.
Hình 17 Phân bố số lượng người mua bảo hiểm dựa theo việc đã du lịch nước ngoài của 2 nhóm
Những người đã từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những người đã đi du lịch nước ngoài đối với nhóm C2 và có tần suất nhiều nhất ở những người chưa đi du lịch nước ngoài đối với nhóm C1.
Cụ thể số người từng mua bảo hiểm du lịch đã từng đi nước ngoài là 280 người thuộc nhóm C2 và số người từng mua bảo hiểm du lịch chưa đi du lịch nước ngoài là 339 người thuộc nhóm C1.
Ngoài ra, số người ít mua bảo hiểm du lịch nhất của nhóm C1 là những người đã đi du lịch nước ngoài, C2 thuộc những người chưa đi du lịch nước ngoài, cụ thể:
Số người thuộc nhóm C1 thường ít có xu hướng mua bảo hiểm du lịch số lượng chỉ có 18 người mua ở độ tuổi này.
Số người thuộc nhóm C2 thường ít có xu hướng mua bảo hiểm du lịch số lượng đạt 73 người.
Tốt nghiệp: Đã tốt nghiệp ( 42,11% )
Thu nhập thường niên: 700000 – 800000 INR ( 7,32% )
Số thành viên gia đình: 6 ( 11,13% )
Thường xuyên du lịch: Không ( 44,08% )
Đã du lịch nước ngoài: Không ( 47,75% )
Loại công việc: Tư nhân ( 46,62% )
Tốt nghiệp: Đã tốt nghiệp ( 43,94% )
Thu nhập thường niên: 1300000 - 1400000 INR ( 22,54% )
Số thành viên gia đình: 3 ( 11,97% )
Thường xuyên du lịch: Có ( 27,46% )
Đã du lịch nước ngoài: Có ( 39,44% )
Hình 18 Kết quả của Feature Statistic Từ các thông số kết quả của bảng Feature Statistic, nhóm rút ra các kết luận về các đặc tính trung bình của những người từng mua bảo hiểm như sau:
Những người có tỷ lệ mua bảo hiểm du lịch nhiều nhất nằm ở độ tuổi 34.
Những người có tỷ lệ mua bảo hiểm du lịch nhiều nhất thường làm việc tư nhân
Những người có tỷ lệ mua bảo hiểm du lịch nhiều nhất thường đã tốt nghiệp
Những người có tỷ lệ mua bảo hiểm du lịch nhiều nhất thường có thu nhập thường niên là 1400000 INR
Những người có tỷ lệ mua bảo hiểm du lịch nhiều nhất thường có 4 thành viên gia đình
Những người có tỷ lệ mua bảo hiểm du lịch nhiều nhất thường không mắc bệnh mãn tính
Kết luận của bài toán phân cụm