Một trong những trở ngại lớn trong ứng dụng các thuật toán học có giám sát như rừng ngẫu nhiên là thuật toán cần dữ liệu và thời gian để tìm ra các khuôn mẫu hành vi của người tiêu dùng. Do đó, bài toán thống kê dữ liệu phân luồng gián tiếp sẽ nhằm mục đích giải quyết trở ngại ban đầu khi ứng dụng thuật toán vào trang thương mại điện tử. Dữ liệu tại phân luồng gián tiếp sẽ được tổng hợp từ lịch sử mua sắm của tập khách hàng sẵn có ví dụ: tổng số lượng đơn hàng công, tổng số lượng giỏ hàng, tổng giá trị giao dịch trên toàn hệ thống. Phân luồng dữ liệu gián tiếp không chỉ thích hợp cho việc phân tích lịch sử mua hàng của tập khách hàng nội tại mà còn phù hợp để đánh giá tiềm năng và khuynh hướng mua sắm của tập khách hàng tiềm năng. Bài toán thống kê dữ liệu phân luồng gián tiếp nhận đầu vào là các dữ liệu được thống kê và tổng hợp từ các lịch sử mua sắm, những hoạt động và tương tác của khách hàng . Từ dữ liệu đã được tổng hợp, bài toán sẽ cho ra kết quả là một tỷ lệ phần trăm cho khả năng thực hiện mua hàng sắm tới của từng khách hàng hiện tại trong hệ thống. Kết quả dự đoán chủ yếu dựa trên số lượng giỏ hàng hoàn thành và số lượng đơn hàng thành công của khách hàng tại trang thương mại điện tử.
Mục tiêu của bài toán thống kê dữ liệu phân luồng gián tiếp là tổng hợp toàn bộ thông tin giao dịch mua sắm thành công và thất bại cũng như những đánh giá và nhận xét của tập khách hàng sẵn có tại trang thương mại điện tử. Những thống kê này một phần hỗ trợ dịch vụ phân tích đưa ra dự đoán bỏ rơi giỏ hàng trong thời gian hình thành khuôn mẫu hành vi, phần khác thử nghiệm khả năng tổng hợp và truy vấn dữ liệu thống kê của trang thương mại điện tử. Ngoài mục tiêu hỗ trợ và thử nghiệm, kết quả của bài toán cũng đánh giá khuynh hướng tiêu dùng và thái độ tin tưởng của khách hàng đối với trang thương mại điện tử dựa trên lịch sử mua sắm. Những đánh giá trên góp phần hoàn thiện mục tiêu chung của luận văn là tổng hợp khuôn mẫu hành động mua sắm của khách hàng.
32