Để đánh giá việc tìm hiểu phương pháp phân cụm tích lũy bằng chứng, cần phải có một công cụ cho phép chạy thuật toán cài đặt phân cụm tích lũy để lấy kết quả đầu ra,
đem so sánh với mong muốn kết quả thực tế nhằm xem xét độ chính xác của việc dự đoán khi sử dụng phương pháp này. Hiện nay phương pháp phân cụm tích lũy là phương pháp tương đối mới trên thế giới nên các ứng dụng mã nguồn mở chưa hỗ trợ việc cài đặt thuật toán này. Với mong muốn có thể đánh giá được tính đúng đắn của phương pháp, trong phạm vi luận văn này sẽ xây dựng một công cụ ở mức độ đơn giản để hỗ trợ cho việc cài đặt thuật toán phân cụm tích lũy k-means.
Hình 4.1: Giao diện ứng dụng cài đặt thuật toán phân cụm tích lũy dựa trên phương pháp k-means
Việc xây dựng công cụ phân tích này mới chỉ ở mức độ đơn giản. Nó bao gồm phần mềm cài đặt thuật toán phân cụm tích lũy k-means có kết nối đến cơ sở dữ liệu Oracle (dữ liệu đã được chuẩn bị sẵn như mô tả ở phần trên nhằm đảm bảo ứng dụng có thể hoạt động tốt).
Như mô tả trên hình, giao diện sẽ hiển thị số dòng dữ liệu đầu vào, các thông số tham số cần thiết cho quá trình phân cụm. Một cải tiến đáng kể là việc sử dụng giá trị k nhỏ nhất và lớn nhất. Thuật toán sẽ lựa chọn ngẫu nhiên một giá trị k trong khoảng trên, sau đó sẽ chạy thuật toán k-means. Tùy theo số lần lặp lại mà ta sẽ xây dựng lên được ma trận kết hợp A, sau đó bắt đầu xây dựng lại các cụm theo thuật toán SL(Single Link). Theo cách này, số lượng cụm sau quá trình chạy thuật toán sẽ không còn phụ thuộc vào tham số là số cụm đưa vào ban đầu.
Để phục vụ cho mục đích dự đoán kết quả như đã đặt ra, giao diện chương trình còn cho phép nhập các thông tin liên quan đến bản ghi của khách hàng mới. Khách hàng này có thể ở hai dạng: đã tham gia một dịch vụ, hoặc chưa tham gia dịch vụ này. Ứng dụng sẽ tiến hành phân cụm cả bản ghi của khách hàng này để đưa khách hàng vào một nhóm (cụm) các khách hàng cụ thể. Sau đó dựa trên tính chất của nhóm này sẽ đưa ra dự đoán cho hành vi của khách hàng này trong tương lai.
Các kết quả được liệt kê ở phía bên dưới sẽ cho biết kết quả tính toán dự đoán hành vi của khách hàng là gì. Dựa trên kết quả này, phía Ngân hàng Quân đội sẽ có những chính sách tương ứng để khuyến khích khách hàng sử dụng những dịch vụ mà có khả năng cao là họ sẽ dùng.