Chương 3 Mô hình khai phá dữ liệu dịch vụ khách hàng Ngân hàng quân đội
3.3 Một mô hình phân cụm tích lũy dữ liệu khách hàng tại Ngân hàng quân đội
Qua những phân tích ở phần trên, có thể thấy rõ ràng rằng việc xây dựng một ứng dụng có khả năng dự đoán, phân tích dữ liệu khách hàng đã có để đưa ra những khuyến nghị, những trợ giúp cho các nhà quản lý trong việc đưa ra định hướng, đưa ra những chiến lược hướng tới khách hàng để nhằm làm giảm thiểu rủi ro, tăng hiệu quả của công việc giới thiệu sản phẩm dịch vụ mới tới khách hàng, tìm kiếm khách hàng mới và duy trì khách hàng sẵn có là một yêu cầu rất quan trọng đối với Ngân hàng Quân đội.
Đối với nội dung của đề tài tốt nghiệp này sẽ tập trung xây dựng ứng dụng có khả năng dự đoán hành vi của người dùng một khi họ đăng ký là khách hàng mới của Ngân hàng Quân đội. Điều này có nghĩa là khi có một khách hàng mới đăng ký mở tài khoản tại Ngân hàng Quân đội, ứng dụng sẽ dựa trên những thông tin của tập khách hàng sẵn có từ trước để thực hiện quá trình phân tích đánh giá nhằm phân loại khách hàng, từ đó tìm ta được khách hàng này thuộc tập khách hàng mẫu nào, và dựa trên đó có thể suy đoán được hành vi của khách hàng này. Việc suy đoán ra hành vi của khách hàng này là công việc quan trọng, bởi vì nó sẽ ảnh hưởng trực tiếp tới việc giới thiệu các sản phẩm dịch vụ của ngân hàng tới khách hàng.
Trên cơ sở những tìm hiểu ở bên trên cộng với việc xác định rõ mục đích của công việc phân loại khách hàng, đề tài sẽ tập trung chủ yếu vào việc xây dựng ứng dụng nhằm phân cụm tập hợp dữ liệu khách hàng của Ngân hàng Quân đội. Để thực hiện được công việc dự đoán hành vi của khách hàng, ứng dụng sẽ được cài đặt theo phương pháp phân cụm sử dụng thuật toán k-means kết hợp với tích lũy bằng chứng để đưa ra được
kết quả phân cụm của khách hàng một cách chính xác. Đối với phương pháp phân cụm sử dụng thuật toán k-means, ứng dụng sẽ tiến hành gộp dữ liệu khách hàng mới và những dữ liệu khách hàng cũ vào, tiến hành phân cụm thành các tập con. Dựa trên đặc tính của những tập con đó thông qua dữ liệu cũ, ứng dụng sẽ tiến hành dự đoán hành vi của những dữ liệu mới đưa vào. Mô hình thực hiện việc cài đặt được chỉ ra như hình bên dưới đây: Tập dữ liệu khách hàng cũ (đã được gán nhãn) Tập dữ liệu khách hàng mới (chưa gán nhãn) Bộ phân cụm tích lũy bằng chứng K- means Kết quả phân cụm lần 1 Kết quả phân cụm lần 2 Kết quả phân cụm lần n ….. Kết quả dự đoán
Hình 3.5 Mô hình tính toán dữ liệu phương pháp phân cụm tích lũy dựa trên k-means
Kết quả đầu ra sẽ được điều chỉnh theo những tham số đầu vào sao cho đảm bảo hợp lý ở một mức độ cho phép. Các kết quả đầu ra cũng được tập hợp lại và so sánh để có thể đánh giá xu hướng một cách chính xác nhất có thể.
Dữ liệu sử dụng cho quá trình lấy mẫu sẽ được lấy từ cơ sở dữ liệu của Ngân hàng Quân đội. Tuy nhiên dữ liệu này sẽ trải qua một quá trình làm mịn để đảm bảo rằng sẽ loại bỏ được những thuộc tính dư thừa và những giá trị bị thiếu của thuộc tính. Dữ liệu đầu ra của quá trình này sẽ đảm bảo đáp ứng cho ứng dụng hoạt động một cách hiệu quả.