Ứng dụng mô hình máy học để dự đoán xu hướng mua bảo hiểm du lịch tại Ấn Độ

MỤC LỤC

BÀI TOÁN BÀI TOÁN PHÁT HIỆN ĐIỂM ĐẶC THÙ CỦA DỮ LIỆU

Mô tả bài toán 1

Sử dụng các hàm thống kê thông dụng, công cụ, lược đồ biểu đồ cua EXCEL để phát hiện các điểm đặc thù của bộ dữ liệu.

Chạy mô hình và kết quả

Từ dữ liệu thu nhập được, trong 1987 đối tượng có khoảng 36% là có bảo hiểm và 64% là không có bảo hiểm, điều này chứng tỏ càng nhiều khách hàng chưa sẵn sàng bỏ tiền ra để mua bảo hiểm du lịch. Số liệu cho thấy độ tuổi khách hàng dao động từ 25- 35 tuổi, đây cũng chính là độ tuổi thích đi du lịch và khám phá nhiều nơi nhất. Tiêu biểu là nhóm tuổi 28, có tận 506 lượng khách đi du lịch nhưng lại có số người mua bảo hiểm du lịch khụng cao, chỉ chiếm ẳ khỏch hàng khụng cú bảo hiểm.Trong đú độ tuổi từ dưới 26 tuổi và trên 33 tuổi có xu hướng mua bảo hiểm du lịch nhiều hơn có thể là vì họ dưới 26 tuổi thì họ ít đi hoặc có khi là chưa đi du lịch bao giờ nên có nhiều lo lắng và nhiều sự chuẩn bị hơn, còn ở độ tuổi 33 trở lên thì chắc chắn là đã có kinh nghiệm được đi du lịch nhiều nên biết rằng mua bảo hiểm du lịch là một sự chuẩn bị rất cần thiết.

Nhóm khách hàng thuộc lĩnh vực nhà nước:Tổng số khách hàng: 570 Số khách hàng không mua bảo hiểm du lịch: 430 và số khách hàng có mua bảo hiểm du lịch: 140. Nhóm khách hàng thuộc lĩnh vực nhà nước có tỷ lệ mua bảo hiểm du lịch thấp hơn so với tổng cộng khách hàng, có thể là do yếu tố đặc thù của lĩnh vực này hoặc sự thay đổi trong nhu cầu và ưu tiên của khách hàng. Số lượng người có bằng tốt nghiệp nhưng không mua bảo hiểm du lịch (1081) cao hơn số người có bằng tốt nghiệp và mua bảo hiểm du lịch (611).

Điều này có thể cho thấy một số người không đánh giá cao hoặc không nhận thức đầy đủ về tầm quan trọng của bảo hiểm du lịch, dù có trình độ học vấn cao. Điều này có thể ám chỉ rằng việc không có bằng tốt nghiệp có thể ảnh hưởng đến khả năng nhận thức về tầm quan trọng của bảo hiểm du lịch. Điều này có thể cho thấy một số người nhận ra tầm quan trọng của việc mua bảo hiểm du lịch nhưng không có khả năng tài chính hoặc ý thức đủ để mua nó.

Ở mức thu nhập từ 300000- 1300000 INR thì khách hàng hầu như không quan tâm nhiều đến bảo hiểm du lịch khi có những dịp đi chơi, có thể có nhiều yếu tố khách quan như thu nhập không ổn định, chi phí du lịch, hoặc phí bảo hiểm quá cao khiến họ không mua được bảo hiểm. Dựa trên dữ liệu về mức độ mua bảo hiểm du lịch trong các nhóm thành viên gia đình khác nhau, có thể thấy rằng mức độ ảnh hưởng của bảo hiểm du lịch lờn số thành viờn gia đỡnh khụng rừ ràng. Tuy cú một số nhúm thành viờn gia đình mua bảo hiểm du lịch nhiều hơn những nhóm khác, nhưng tỷ lệ mua bảo hiểm vẫn không cao ở cả các nhóm.

Điều này có thể cho thấy rằng việc mua bảo hiểm du lịch không phụ thuộc quá nhiều vào số lượng thành viên gia đình Bệnh mãn tính. Trong khi đó 552 người có bệnh thì tỷ lệ người mua bảo hiểm lại cao hơn không có bệnh bởi vì họ ý thức được nhiều rủi ro hơn và đánh giá. Trong 1987 người thì số lượng người thường xuyên đi du lịch không cao, một số có thể cho rằng đi xa nhiều rất nhiều rủi ro mà không thể lường trước, một số còn cho rằng đã từng đi du lịch nhiều rồi không bị sao và chủ quan không mua bảo hiểm.

Kết quả thông qua từ bài toán

Những người có kinh nghiệm du lịch trong quá khứ có nhiều khả năng mua bảo hiểm du lịch hơn. Ngược lại các nhóm đối tượng ít đi nước ngoài hoặc chưa bao giờ đi sẽ không có xu hướng nhắm tới việc mua bảo hiểm liền.

BÀI TOÁN 2: DỰ ĐOÁN VIỆC MUA BẢO HIỂM DU LỊCH CỦA KHÁCH HÀNG

Xây dựng mô hình

Mô hình phân lớp dự đoán khả năng mua hoặc không mua bảo hiểm du lịch của khách hàng.

Đánh giá kết quả

Sai lầm loại 2: Dự đoán là không có nhiều người mua bảo hiểm nhưng thực tế vẫn có người mua bảo hiểm. Nếu như sai lầm này càng lớn, thì các công ty bảo hiểm sẽ khó tiếp cận và phát triển được sản phẩm bảo hiểm du lịch theo nhu cầu và tệp khách hàng. Sai lầm loại 2 của phương pháp Tree là nhỏ nhất trong ba phương pháp trên.

Sử dụng phương pháp Tree và không cần xét đến Test and Score Kết quả dự báo. Theo bảng đánh giá kết quả, ma trận nhầm lẫn của phương pháp Tree có sai lầm loại 2 bằng 194 là nhỏ nhất trong ba phương pháp: Logistics Regression, SVM, Tree. Việc mua bảo hiểm du lịch còn phụ thuộc rất nhiều vào nhiều điều kiện và yếu tố khác nhau của khách hàng.

Tuy nhiên, thông qua kết quả dự báo, chúng ta có thể xác định được những tệp khách hàng tiềm năng khác nhau , cũng như là nhu cầu của khách hàng về sản phẩm bảo hiểm du lịch. Từ đó, giúp các công ty bảo hiểm thiết kế ra những sản phẩm mới phù hợp với thị hiếu của khách hàng.

Hình 4. Kết quả của Logistic Regression
Hình 4. Kết quả của Logistic Regression

BÀI TOÁN 3: PHÂN CỤM/NHểM KHÁCH HÀNG Cể KHẢ NĂNG CAO THAM GIA BẢO HIỂM DU LỊCH

Số người thuộc nhóm C1 thường ít có xu hướng mua bảo hiểm du lịch khi ở độ tuổi 25-26, số lượng chỉ có 9 người mua ở độ tuổi này. Cụ thể số người từng mua bảo hiểm du lịch ở loại hình công việc Tư nhân ở nhóm C1 là 239 khách hàng, nhóm C2 chạm mức 331 khách hàng.  Nhóm C1 với những khách hàng làm công việc loại hình Nhà nước có xu hướng ít mua bảo hiểm du lịch hơn khi chỉ có 118 khách hàng đã mua bảo hiểm.

 Nhóm C2 với những khách hàng làm công việc loại hình Nhà nước có xu hướng ít mua bảo hiểm du lịch hơn khi chỉ có 22 khách hàng đã mua bảo hiểm. Những người đã từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những gia đình với 6 thành viên đối với nhóm C1 và có tần suất nhiều nhất ở gia đình có 3 thành viên đối với nhóm C2. Cụ thể số người từng mua bảo hiểm du lịch ở gia đình 3 thành viên là 85 người thuộc nhóm C2 và số người từng mua bảo hiểm du lịch ở gia đình có 6 thành viên là 79 người thuộc nhóm C1.

 Số người thuộc nhóm C1 thường ít có xu hướng mua bảo hiểm du lịch khi ở trong gia đình với 2 thành viên, số lượng chỉ có 8 người mua ở độ tuổi này.  Số người thuộc nhóm C2 thường ít có xu hướng mua bảo hiểm du lịch khi ở trong gia đình với 8 thành viên ,số lượng chỉ có 5 người. Những người đã từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những người không bị bệnh mãn tính đối với cả nhóm C1 và nhóm C2.

Cụ thể số người từng mua bảo hiểm du lịch không mắc bệnh mãn tính là 246 khách hàng thuộc nhóm C1 và số người từng mua bảo hiểm du lịch là 259 người thuộc nhóm C2.  Những người đã từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những người thường xuyên đi du lịch đối với nhóm C2 và có tần suất nhiều nhất ở những người không thường xuyên đi du lịch đối với nhóm C1. Cụ thể số người từng mua bảo hiểm du lịch thường xuyên đi du lịch là 195 người thuộc nhóm C2 và số người từng mua bảo hiểm du lịch không thường xuyên đi du lịch là 313 người thuộc nhóm C1.

 Những người đã từng mua bảo hiểm du lịch có tần suất nhiều nhất ở những người đã đi du lịch nước ngoài đối với nhóm C2 và có tần suất nhiều nhất ở những người chưa đi du lịch nước ngoài đối với nhóm C1. Cụ thể số người từng mua bảo hiểm du lịch đã từng đi nước ngoài là 280 người thuộc nhóm C2 và số người từng mua bảo hiểm du lịch chưa đi du lịch nước ngoài là 339 người thuộc nhóm C1. Nhóm đã nhận thấy những điểm đáng chú ý sau, nhóm C2 là nhóm có trình độ học vấn cao, có mức lương cao thường có xu hướng mua bảo hiểm nhiều hơn.

Nhìn chung, từ kết quả phân cụm số người với trình độ học vấn cao và mức thu nhập cao đang có xu hướng mua bảo hiểm du lịch nhiều hơn. Đặc điểm đặc thù của 2 nhóm chiếm phần lớn đều là những nhân viên có độ tuổi không quá lớn cũng không quá già, thu nhập và trình độ học vấn cao.

Hình 8. Kết quả của phương pháp K-means
Hình 8. Kết quả của phương pháp K-means