Input:
Tập n các hồ sơ mua bảo hiểm, gồm các thông tin về khách hàng mua và được bảo hiểm và các thông tin về việc mua bảo hiểm của khách hàng. Các thông tin này được coi là một tập dữ liệu hỗn hợp có các thuộc tính số thuộc tính thứ tự, và thuộc tính định danh.
K mức độ rủi ro từ các thông tin khách hàng cung cấp theo ý kiến của các chuyên gia có kinh nghiệm.
Output:
Đưa ra k nhóm khách hàng có sự giống nhau là lớn nhất và dựa theo sự đánh giá của các chuyên gia để có thể đưa ra các mẫu khách hàng với các mức độ rủi ro tương ứng.
Tất cả những thông tin khách hàng cung cấp đều quan trọng nhưng trong đó có những thông tin quan trọng hơn. Mỗi thông tin khách hàng cung cấp ta gán cho chúng một trọng số theo kinh nghiệm của các chuyên gia.
Bảng sau gồm các thuộc tính dùng để đánh giá các mức độ rủi ro:
Số
TT Tên thuộc tính Kiểu thuộc tính Các giá trị có thể 1 Tuồi của người được bảo hiểm Số 1÷60
2 Nghề nghiệp của người được bảo hiểm Định danh 3 Loại nghề nghiệp của người được bảo
hiểm Thứ tự 1: An toàn2:Bình thường
3: Hơi nguy hiểm 4: Nguy hiểm 4 Thu nhập của người được bảo hiểm Số
5 Quan hệ với người được bảo hiểm Định danh 6 Bệnh của người được bảo hiểm Định danh
7 Tuồi của người mua bảo hiểm Số 1÷60
8 Nghề nghiệp của người mua bảo hiểm Định danh 9 Loại nghề nghiệp của người mua bảo
hiểm
Thứ tự 1: An toàn 2:Bình thường 3: Hơi nguy hiểm 4: Nguy hiểm 10 Thu nhập gia đình của người mua bảo
hiểm Số
11 Bệnh của người mua bảo hiểm Định danh 12 Tên bảo hiểm đăng kí mua Định danh
13 Số tiền mua bảo hiểm Số
14 Số năm mua bảo hiểm Số 5÷60 (tùy từng bảo hiểm)
Vì thuộc tính bệnh của khách thì có rất nhiều các bệnh khách nhau do đó trong chương trình ứng dụng để đơn giản em chuyển thuộc tính bệnh thành các cấp độ tình trạng của sức khỏe từ 1 đến 10 theo cấp độ nguy hiểm tăng dần 1: Hoàn toàn khỏe mạnh và tăng dần đến 10 là các bệnh nghiêm trọng ung thư, tiểu đường, bệnh về tim mạch. Với cấp độ 10 khách hàng sẽ khó có cơ hội mua bảo hiểm hoặc được mua nhưng với phí sẽ rất cao. Do đó thuộc tính bệnh sẽ được coi như thuộc tính có thứ tự trong chương trình ứng dụng
Tương tự như vậy với thuộc tính nghề nghiệp, em xin bỏ thuộc tính nghề nghiệp, thay vào đó sẽ xét theo mức độ nguy hiểm của nghề nghiệp theo thuộc tính loại nghề nghiệp.