ĐÁNH GIÁ RỦI RO XE CƠ GIỚI

Một phần của tài liệu Ứng dụng khai phá dữ liệu để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới (Trang 43)

7. Bố cục luận văn

2.2. ĐÁNH GIÁ RỦI RO XE CƠ GIỚI

2.2.1. Khái niệm rủi ro

Rủi ro là khái niệm đầu tiên cần đề cập khi nói về bảo hiểm vì rủi ro và bảo hiểm gắn liền với nhau nhƣ hình với bóng, có rủi ro mới có bảo hiểm. Vậy rủi ro là gì?

Rủi ro là một điều không may mắn, không lƣờng trƣớc đƣợc về khả năng xảy ra, về thời gian và không gian xảy ra, cũng nhƣ mức độ nghiêm trọng và hậu quả của nó [5].

Rủi ro đƣợc xem là sự không may mắn, sự tổn thất mất mát về tài sản hay là sự giảm sút lợi nhuận thực tế so với lợi nhuận dự kiến. Rủi ro còn đƣợc hiểu là những bất trắc ngoài ý muốn xảy ra trong quá trình kinh doanh, sản xuất của doanh nghiệp, tác động xấu đến sự tồn tại và phát triển của một

doanh nghiệp. Tóm lại, theo quan điểm này thì rủi ro là những thiệt hại, mất mát, hoặc các yếu tố liên quan đến nguy hiểm, khó khăn có thể xảy ra cho con ngƣời.

2.2.2. Khái niệm về đánh giá rủi ro

Mọi công việc đều tiềm ẩn những rủi ro trong đó. Chúng ta muốn công việc tiến hành một cách hiệu quả và an toàn thì nên tiến hành thực hiện công tác đánh giá rủi ro cho chính công việc đó.

Đánh giá rủi ro là quá trình tìm hiểu những rủi ro có thể và sẽ liên quan tới công việc của bạn. Hãy chỉ ra cụ thể những rủi ro có thể gặp. Xây dựng những biện pháp kiểm soát để thực thi công việc một cách hiệu quả nhất, an toàn nhất, nh m tránh gây tai nạn cho con ngƣời, hƣ hại tài sản, thiết bị và tổn thƣơng môi trƣờng.

Đánh giá rủi ro là một trong những nhiệm vụ hết sức quan trọng trong công tác quản lý rủi ro. Có làm tốt công việc đánh giá rủi ro thì mới có thể thực hiện đƣợc công tác quản lý rủi ro. Đối với ngƣời khai thác bảo hiểm việc đánh giá rủi ro sẽ giúp họ quyết định có nhận bảo hiểm hay không, mức phí bao nhiêu. Nếu việc điều tra đánh giá rủi ro đƣợc thực hiện một cách đầy đủ, kỹ lƣỡng, kết hợp với những công cụ, chƣơng trình tính phí bảo hiểm thì cán bộ khai thác hoàn toàn có thể tính toán ngay đƣợc một cách chính xác tỷ lệ phí. Điều này giúp cho việc chủ động, nhanh chóng trong khai thác, trách đƣợc tình trạng phải tham khảo, hỏi han, tốn kém mất thời gian.

2.2.3. Phạm vi bảo hiểm

Phạm vi bảo hiểm là phạm vi giới hạn những rủi ro mà theo thoả thuận nếu những rủi ro đó xảy ra thì nhà bảo hiểm sẽ chịu trách nhiệm bồi thƣờng cho chủ phƣơng tiện. Cũng nhƣ các nghiệp vụ bảo hiểm khác, bảo hiểm vật chất xe cơ giới cũng chỉ nhận bảo hiểm cho những rủi ro ng u nhiên, bất ngờ gây thiệt hại phần vật chất thân xe. Thông thƣờng, những rủi ro đƣợc bảo

hiểm bao gồm:

+ Tai nạn do đâm va, lật đổ;

+ Cháy, nổ, bão lụt, sét đánh, động đất, mƣa đá; + Mất cắp toàn bộ xe;

+ Tai nạn do rủi ro bất ngờ khác gây nên.

2.2.4. Quy trình đánh giá rủi ro trong bảo hiểm xe cơ giới

Quy trình tác nghiệp đòi hỏi cán bộ thẩm định vừa phải có trình độ chuyên môn nghiệp vụ cao, vừa phải có nhiều kinh nghiệm thực tiễn. Kết quả đánh giá rủi ro tốt sẽ làm giảm thiểu chi phí bồi thƣờng tổn thất đồng thời nâng cao hiệu quả trong khai thác bảo hiểm xe cơ giới [4][5].

Tại Công ty Cổ phần Bảo hiểm AAA tại Quảng Ngãi, việc phân tích và đánh giá rủi ro xe cơ giới đƣợc quy định thực hiện tối đa trong vòng 2 tiếng kể từ lúc nhận hồ sơ của khách hàng.

2.2.5. Các yếu tố ảnh hƣởng đến rủi ro trong bảo hiểm xe cơ giới

Cùng với sự phát triển kinh tế của đất nƣớc, số lƣợng xe ô tô ngày càng tăng mạnh trong khi cơ sở hạ tầng giao thông chƣa phát triển theo kịp d n đến rủi ro tai nạn giao thông ngày càng tăng. Bên cạnh đó, nhiều phƣơng tiện tham gia giao thông không đáp ứng đƣợc yêu cầu kỹ thuật và ý thức chấp hành pháp luật của ngƣời điều khiển phƣơng tiện chƣa cao cũng là những nguyên nhân chính góp phần gia tăng tai nạn.

Mặt khác, mức độ rủi ro của xe cơ giới còn bị tác động bởi các yếu tố sau:

- Mục đích sử dụng xe

- Phạm vi địa bàn hoạt động - Thời gian sử dụng

2.3. PHÂN TÍCH HIỆN TRẠNG

2.3.1. Chỉ số trong lĩnh vực kinh doanh bảo hiểm xe cơ giới

Trong lĩnh vực kinh doanh bảo hiểm xe cơ giới, chúng ta cần quan tâm đến những chỉ số sau:

Tổng doanh thu: Tổng số tiền thu về từ phí bảo hiểm.

Bồi thƣờng: Tổng số tiền chi trả cho khách hàng khi có tổn thất xảy ra. Hoa hồng: Số tiền phải trích lại cho môi giới hoặc đại lý. Theo quy định của Bộ Tài Chính, số tiền hoa hồng cho nghiệp vụ là 7% doanh thu.

Chi phí tiếp thị: Số tiền bỏ ra cho các hoạt động quảng cáo, hội nghị khách hàng…Chi phí này chiếm 15% doanh thu.

Chi phí quản lý: Số tiền để thanh toán các khoản chi phí cố định nhƣ điện, nƣớc, văn phòng phẩm, lƣơng nhân viên, …Chiếm tỉ lệ là 20% tổng doanh thu.

Nhƣ vậy, lợi nhuận sẽ là số tiền còn lại sau khi lấy tổng doanh thu trừ

các khoản chi phí nêu trên.

Bảng 2.1. Số liệu kinh doanh tại chi nhánh Quảng Ngãi

Thông số Năm 2012 Năm 2013 Năm 2014

Doanh thu 2.774.376.445 2.974.376.445 3.798.373.525 Bồi thường 1.979.779.201 1.895.379.001 1.783.179.423 Hoa hồng 106.206.750 195.250.770 231.830.142 Tiếp thị 306.156.467 306.156.467 407.093.843 Quản lý 306.156.467 345.745.725 701.276.973 Lợi nhuận 106.471.563 231.844.482 674.993.144

Bảng 2.2. Thống kê tình hình bồi thường tổn thất

Hồ sơ Năm 2012 Năm 2013 Năm 2014

Hợp đồng bảo hiểm 1075 1462 1824

Tổng hồ sơ bồi thường 505 562 657

Ta nhận thấy r ng tỉ lệ bồi thƣờng tổn thất cao, nó sẽ là nguyên nhân trực tiếp ảnh hƣởng đến lợi nhuận của toàn công ty. Vì thế, để tăng lợi nhuận thì phải đẩy mạnh doanh thu đồng thời giảm chi phí. Ở đây ta chỉ xét đến vấn đề làm sao để tiết kiệm đƣợc chi phí?

Để giảm chi phí xuống thì chúng ta phải làm tốt công tác đánh giá rủi ro để giảm thiểu chi phí bồi thƣờng. Ngoài ra, phải tiết kiệm tối đa các khoản chi phí cố định, cắt giảm nhân sự…

Chính vì những lý do đó. Việc sử dụng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới sẽ giúp chi nhánh tiết kiệm đƣợc thời gian, nhân sự, hạn chế chi phí bồi thƣờng góp phần tăng hiệu quả kinh doanh.

2.3.2. Giải pháp xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới bảo hiểm xe cơ giới

Với một khối lƣợng dữ liệu lớn về hoạt động kinh doanh trong bảo hiểm xe cơ giới trong các năm qua, chúng ta cần có một phƣơng pháp phân tích dữ liệu một cách khoa học, trên cơ sở đó đƣa ra những dự đoán về mức độ rủi ro của xe cơ giới. Từ đó, ngƣời quản lý sẽ cân đối đƣợc giữa doanh thu và bồi thƣờng để đƣa ra quyết định nh m đảm bảo hiệu quả kinh doanh.

Giải pháp sử dụng cây quyết định rất phù hợp để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới. Nó có thể xử lý đƣợc khối lƣợng lớn dữ liệu với tốc độ tính toán nhanh. Việc học tập và phân loại của cây quyết định rất đơn giản, nhanh chóng và có độ chính xác cao.

2.4. SO SÁNH KẾT QUẢ PHÂN LỚP GIỮA 2 THUẬT TOÁN C4.5 VÀ RANDOM FOREST

Thực hiện so sánh và đánh giá trên phần mềm Weka với phƣơng pháp đánh giá độ chính xác b ng 10-fold croos validation [6]

+ Đối với phƣơng pháp cây quyết định b ng C4.5 (J4.8)

Hình 2.1. Thông số của thuật toán xây dựng cây quyết định bằng C4.5

- Confidence factor: Cắt tỉa những cây giá trị nhỏ hơn cho thấy cắt tỉa nhiều.

- Debug: Nếu điều này đƣợc thiết lập để thực thông tin bổ sung đƣợc hiển thị trên giao diện điều khiển.

- MinNumObj: Hiển thị số lƣợng tối thiểu của các trƣờng hợp trên mỗi lá - Numfolds: Hiển thị số lƣợng dữ liệu đƣợc sử dụng để cắt tỉa.

- Reduced error pruning: Cắt tỉa giảm lỗi đƣợc sử dụng hay không.

- Seed: đƣợc sử dụng cho các dữ liệu ng u nhiên khi giảm tỉa lỗi đƣợc sử dụng.

- Sub - tree Raising: Đƣợc sử dụng cho giá trị - cây tăng khi chúng ta cắt tỉa đƣợc sử dụng.

- Use Laplace: Ở lá đƣợc làm nhẵn dựa trên Laplace. + Đối với phƣơng pháp Random Forest

Hình 2.2. Thông số của Random Forest

-MaxDepth: Cho thấy chiều sâu tối đa của cây, nếu = 0 là không giới hạn.

-numFeatures: Số thuộc tính đƣợc sử dụng trong khi lựa chọn ng u nhiên.

-numTrees: Số lƣợng cây đƣợc tạo ra.

Bảng 2.3. Sử dụng phần mềm Weka so sánh độ chính xác giữa thuật toán C4.5 và Random Forest TT Dữ liệu Số lƣợng bảng ghi Thuộc tính Ramdon Forest J-48 Trƣờng hợp Phân loại chính xác Trƣờng hợp Phân loại không chính xác Trƣờng hợp Phân loại chính xác Trƣờng hợp Phân loại không chính xác 1. Lymph 148 19 81.08% 18.91% 77.02% 22.97% 2. Sonar 208 61 80.77% 19.23% 71.15% 28.84% 3. Heart-h 270 14 77.89% 22.10% 80.95% 19.04% 4. Heart-c 303 14 81.51% 18.48% 77.56% 22.44% 5. Balance Scale 625 25 80.48% 19.52% 76.64% 23.36% 6. Vehicle 846 19 77.06% 22.93% 72.45% 27.54% 7. Creditg 1000 21 72.50% 27.50% 70.50% 29.50% 8. Segment 2310 20 97.66% 2.33% 96.92% 3.07% 9. Waveform 5000 41 81.94% 18.06% 75.30% 24.70% 10. Letter 20,000 17 94.71% 5.29% 87.98% 12.02%

Kết quả trên cho thấy phần lớn phƣơng pháp sử dụng thuật toán Random Forest cho kết quả chính xác cao hơn. Đặc biệt với bộ dữ liệu càng lớn thì Random Forest cho kết quả chính xác tốt hơn, còn đối với phƣơng pháp sử dụng thuật toán C4.5 (J-48 đƣợc cắt tỉa) thì lại tiện dụng với bộ dữ liệu nhỏ.

2.5. ỨNG DỤNG CÂY QUYẾT ĐỊNH 2.5.1. Phân tích dữ liệu 2.5.1. Phân tích dữ liệu

Có rất nhiều yếu tố ảnh hƣởng đến tỉ lệ rủi ro trong bảo hiểm xe cơ giới nhƣ đã nêu ở trên. Tuy nhiên ở đây, chúng ta chú trọng phân tích các tập thuộc tính với những yếu tố chính trong bảng dữ liệu nhƣ sau:

Bảng 2.4. Bảng dữ liệu mẫu của 10 khách hàng

Các thuộc tính Thuộc tính phân loại TT Mục Đích sử dụng Thời gian sử dụng Kinh nghiệm lái xe Giới tính Bảo dƣỡng định kỳ Số tiền bồi thƣờng Khu vực

để xe Phạm vi hoạt đông Rủi ro 1 Kinh

doanh 6 3 Nam Có 10 Gara

Trong

tỉnh THẤP 2 Kinh

doanh 8 7 Nam Không 30 Không

Trong tỉnh TB 3 Không kinh doanh

12 6 Nữ Không 50 Không Trong

tỉnh CAO 4 Chuyên dụng 11 6 Nam Có 10 Gara Trong tỉnh TB 5 Kinh

doanh 12 11 Nam Có 20 Gara

Ngoài

tỉnh TB 6 Kinh

doanh 12 12 Nam Không 50 Không

Ngoài tỉnh CAO 7 Không kinh doanh

7 2 Nam Có 10 Gara Trong tỉnh THẤP

8

Không kinh doanh

5 4 Nữ Không 40 Gara Trong

tỉnh TB 9 Kinh

doanh 14 7 Nam Không 50 Gara

Trong

tỉnh TB 10 Chuyên

dụng 9 4 Nam Không 50 Gara

Ngoài

Trong đó:

Thuộc tính Mục đích sử dụng là loại thộc tính Nominal có giá trị [kinh doanh, không kinh doanh, chuyên dụng]

+ Xe kinh doanh: Là xe có cấp Giấy phép kinh doanh vận tải b ng xe ô tô, thƣờng dùng trong các doanh nghiệp vận tải và chuyên chở khách…

+ Xe không kinh doanh: Là xe sử dụng cá nhân trong cá hộ gia đình, các doanh nghiệp tƣ nhân…

+ Xe chuyên dụng: Là xe sử dụng trong các lĩnh vực đặc thù nhƣ xe trong các cơ qua nhà nƣớc, cứu thƣơng, cứu hỏa …

Thuộc tính Thời gian sử dụng là loại thuộc tính Numeric có giá trị [3, 6, 9, 12]

Nếu xe mới sản xuất, n m trong thời gian từ 1 đến 3 năm thì có giá trị b ng 3 và là xe có rủi ro là thấp nhất. Ngƣợc lại, xe sản xuất càng lâu năm, thì nguy cơ rủi ro càng cao.

Thuộc tính Kinh nghiệm lái xe là loại thuộc tính Numeric có giá trị

[3, 6, 9, 12]

Nếu kinh nghiệm lái xe càng lâu năm, thì nguy cơ rủi ro càng thấp. Ngƣợc lại kinh nghiệm lái xe càng ít thì nguy cơ rủi ro càng cao.

Thuộc tính bảo dƣỡng định kỳ là loại thộc tính Nominal có giá trị

[Có, Không]

Nếu chủ xe thƣờng xuyên bảo dƣỡng, kiểm tra định kỳ, thì chắc chắn sẽ giảm thiểu đƣợc rủi ro.

Thuộc tính Khu vực để xe là loại thộc tính Nominal có giá trị [Gara, Không]

Đây cũng là yếu tố ảnh hƣởng đến mức độ rủi ro của xe tham gia bảo hiểm. Vì nếu xe không có gara, thì nguy cơ va quẹt xe nơi đậu đỗ là rất cao

Thuộc tính Số tiền bồi thƣờng là loại thuộc tính Numeric có giá trị

[20, 30, 40, 50]

Là tỉ lệ % của số tiền bồi thƣờng so với tổng phí bảo hiểm của năm trƣớc đó. Nếu tỉ lệ này trên 50% có nghĩa là hợp đồng này trƣớc đó có tại nang, đồng nghĩa với tỉ lệ rủi ro cao.

Thuộc tính Giới tính là loại thộc tính Nominal có giá trị [Nam, Nữ] Thông thƣờng khi mới lái xe (kinh nghiệm lái xe =< 3 năm), thì nguy cơ rủi ro của nữ thƣờng là cao hơn so với nam.

Thuộc tính Phạm vi hoạt động là loại thộc tính Nominal có giá trị

[Trong tỉnh, Ngoài tỉnh]

Nếu xe hoạt động trên địa bàn càng rộng (ngoài tỉnh). Thì khả năng gặp rủi ro càng cao. Ngƣợc lại nếu xe hoạt động trong tỉnh, thì nguy cơ rủi ro là thấp, thƣờng chỉ va chạm vỏ xe là chủ yếu.

Trong đó:

+ Numeric: Là các giá trị số hay giá trị liên tục.

+ Nominal: Là các giá trị định danh hay giá trị không liên tục.

Các yếu tố trên chính là các tập thuộc tính, dựa vào tập thuộc tính này ta sẽ dự đoán giá trị cho thuộc tính đích Rủi ro. Đây là thuộc tính phân loại.

2.5.2. Xây dựng mô hình phân lớp với Random Forest

Xây dựng mô hình phân lớp với dữ liệu đầu vào là bảng dữ liệu của 1724 hồ sơ khách hàng với 9 thuộc tính và thuộc tính cần phân lớp là: RỦI RO, nhƣ sau:

Trƣớc hết xác định 2 giá trị quan trọng của Random Forest là numTree (số cây của rừng) và numFeatures (số biến đƣợc lựa chọn để chia nút).

Ta xây dựng Random Forest gồm numTree cây phân lớp. Mỗi cây phân lớp đƣợc xây dựng với các bƣớc sau:

Bƣớc 1: Tạo tập huấn luyện b ng các sử dụng bootstrap

Hình 2.3. Tạo bootstrap

Bƣớc 2: Xây dựng một cây quyết định ng u nhiên

Hình 2.4. Cấu trúc cây ngẫu nhiên

Cây đƣợc xây dựng từ trên xuống với mỗi nút của cây (không phải nút lá) ta lấy ng u nhiên n thuộc tính từ 9 thuộc tính (n<9).

Ví dụ: Ở đây chọn ng u nhiên 5 thuộc tính (n=5), trong 9 thuộc tính để tính thuộc tính chia tốt nhất.

Bảng 2.5. Bảng thuộc tính ngẫu nhiên để chia nút

CÁC THUỘC TÍNH Thời gian sử dụng Bảo dƣỡng định kỳ Số tiền bồi thƣờng Khu vực để xe Mục đích sử dụng

Bƣớc 3: Chọn nút chia tốt nhất b ng cách tính theo giá trị GAIN. Lập lại nhƣ vậy với mỗi nút cho đến khi cây không thể chia nữa.

Dữ liệu đào tạo [1724 khách hàng]

Dữ liệu huấn luyện [1724 khách hàng]

Cuối cùng ta đƣợc Random Forest với numTree cây.

Hình 2.5. Mô hình Random Forest với numtree cây

Giả sử ta kiểm tra 1 trƣờng hợp khách hàng mới gồm các thuộc tính nhƣ sau:

Bảng 2.6. Bảng thuộc tính của khách hàng mới

Mục Đích sử dụng Thời gian sử dụng Kinh nghiệm lái xe Giới tính Bảo dƣỡng định kỳ Số tiền bồi thƣờng Khu vực để xe Phạm vi hoạt đông Rủi ro Kinh

doanh 6 12 Nam Có 10 Gara

Trong

tỉnh Thấp Mô hình chạy hết qua các cây với mỗi cây sẽ cho 1 dự đoán, và kết quả cuối cùng là sự bỏ phiếu của các cây có kết quả lớn nhất.

Ví dụ với 10 cây: Kết quả dự đoán lần lƣợt là: Thấp, Thấp, Thấp, Thấp, Trung Bình, Thấp, Trung Bình, Trung Bình, Thấp, Thấp,

Một phần của tài liệu Ứng dụng khai phá dữ liệu để xây dựng hệ thống trợ giúp đánh giá rủi ro trong bảo hiểm xe cơ giới (Trang 43)