Phân tích dữ liệu: từ những hóa đơn đặt hàng của khách hàng chúng ta có thể dự đoán được xu hướng mua hàng của người dùng. Từ đó khi khách hàng chọn mua hàng này thì hệ thống sẽ giới thiệu những mặt hàng mà người dùng khác đã mua với sác xuất cao. Thuật toán Apriori giúp giải quyết vấn đề này. Tìm ra những danh sách những sản phẩm mua cùng sản phẩm này
CHƯƠNG – KHAI PHÁ DỮ LIỆU ÁP DỤNG WEBSITE BÁN HÀNG 2.1 – Thiết kế liệu để sử dụng kmeans Phân tích liệu: từ hóa đơn đặt hàng khách hàng dự đoán xu hướng mua hàng người dùng Từ khách hàng chọn mua hàng hệ thống giới thiệu mặt hàng mà người dùng khác mua với sác xuất cao Thuật toán Apriori giúp giải vấn đề Tìm danh sách sản phẩm mua sản phẩm Thuật toán lấy liệu bảng OrderDetail (Chi tiết hóa đơn) làm liệu sở để đưa vào thuật tốn phân tích Sau phân tích tốn xong thuật toán đưa danh sách sản phẩm mua sản phẩm Xét CSDL bảng order details Bảng bảng chi tiết hóa đơn bán hàng cữa hàng, bảng thống kê khách hàng mua gì, khách thường có xu hướng mua với giỏ hàng (ví dụ khách hay mua trứng với sữa, hành, mua bia với lạc với nem, ) Đây nguồn liệu quý cữa hàng, khơng biết khai thác nó, bảng lưu lại thông tin bán hàng cữa hàng,nhưng biết cách khai thác nguồn liệu này, ta biết khách hàng thường muốn kết hợp với để mua, bà biết thơng tin tư vấn mua hàng cho khách hàng tiếp theo, đưa kết tư vấn trúng đích, khả nang mua hàng khách hàng tiềm cao nhiều Hình - 8: CSDL bảng OrderDetail (Chi tiết hóa đơn) Thuật tốn select tồn bảng OrderDetail sau lọc thành hóa đơn, hóa đơn có số lượng sản phẩm mua hàng không giới hạn Nếu sở liệu Order Details nhiều, tức cữa hàng lớn nhiều giao dịch khơng thể lấy tồn liệu bán hàng cữa hàng để khai thác mà cần phải khoanh vùng liệu, xem đâu liệu quan trọng Ở liệu giao dịch lớn, ta xét xu hướng mua hàng vòng tháng, quý để phân tích liệu, tức ta lọc liệu bán hàng cữa hàng vòng tháng quý gần nhất, gần xu hướng thời, không lặp lại xu hướng cũ, không cập nhật xu Nếu liệu giao dịch nhỏ cho máy phân tích tồn tài ngun bán hàng, phân tích vòng tháng đến năm gần để tránh việc sử dụng lại xu hướng cũ, không cập nhật thị hiếu mua hàng khách hàng Sau học xong, sử dụng luật kết hợp sinh áp dụng vào website bán hàng 2.2 Sử dụng luật kết hợp Apriori xây dựng toán Ví dụ minh họa sau: Bảng - 1: Dữ liệu ví dụ lọc tháng gần Id 10 11 12 Order_Id 1 2 3 3 4 Product_Id 0001 0003 0004 0002 0003 0005 0001 0002 0003 0005 0002 0005 Bảng - 2: Dữ liệu thuật toán lấy Orde r Product 0001-0003-004 0002-0003-0003-0005 0001-0002-0003-0005 0002-0005 Lựa chọn độ hỗ trợ tối thiểu (minsupp): tùy thuộc vào số lượng mặt hàng có cữa hàng nhiều hay để xác định minsupp Nếu cữa hàng có mặt hàng độ kết hợp mặt hàng với lớn, phải lựa chọn minsupp lớn, ngược lại cữa hàng có nhiều mặt hàng (ví dụ siêu thị), khách hàng có nhiều lựa chọn kèm nhau, minsupp nhỏ phù hợp lấy nhiều kết hợp Ở ví dụ lấy minsupp=2, ta quét bảng 3.2, thu kết quả: - Lần quét 1: product-sets 0001 0002 0003 0004 0005 - - - support 3 Bỏ product {0004}, số lần xuất danh sách hóa đơn mua hàng support=1 < minsupp, tức mặt hàng không phổ biến, người mua hàng chọn lựa, mà mua (Ví dụ siêu thị mặt hàng máy phát điện mua, khơng phổ biến,mà khơng phổ biến kết hợp với mặt hàng trở nên không phổ biến, ngược lại mặt hàng trứng, sữa nhiều người mua, phổ biến) Kết thu sau lần quét làm tiền đề cho lần quét 2: product-sets 0001 0002 0003 0005 support 3 product-sets 0001-0002 0001-0003 0001-0005 0002-0003 0002-0005 0003-0005 support 2 Lần quét 2: - Bỏ cặp kết hợp product {0001-0002},{0001-0005}, số lần xuất cặp mua danh sách hóa đơn mua hàng support=1 < minsupp, tức cặp mặt hàng không phổ biến, người mua hàng chọn lựa kèm với nhau, mà mua kèm (Ví dụ trứng hay mua, tỏi hay mua, người mua trứng tỏi mua kèm chúng với nhau) - Kết thu sau lần quét làm tiền đề cho lần quét 3: product-sets 0001-0003 0002-0003 0002-0005 0003-0005 - - - support 2 Lần quét 3: product-sets support 0001-0002-0003 0001-0002-0005 0001-0003-0005 0002-0003-0005 Bỏ cặp kết hợp product {0001-0002-0003},{0001-0002-0005},{0001-00030005}, số lần xuất cặp mua danh sách hóa đơn mua hàng support=1 < minsupp Kết thu sau lần quét làm tiền đề cho lần quét 4: product-sets support 0002-0003-0005 Do cặp nữa, khơng cịn kết hợp nữa, thuật toán dừng Kết thu qua giải thuật thu cặp 2, cặp 3, thỏa mãn điều kiện minsupp Thuật toán Apriori xây dựng có vịng lặp vơ hạn, kiểm tra thỏa mãn điều khiện dừng Khi có nhiều liệu, vài nghìn dịng, có tới vài triệu dịng thuật tốn phân tích liệu lâu Vậy nên chúng tơi chọn Winform thay Webform để tránh bị trình duyệt Sau tuần, tháng cho chạy thuật tốn lần hay cịn gọi cho máy học, hệ thống lấy bảng OrderDetail từ CSDL để đưa phân tích sau lưu vào bảng Apriori để Website select danh sách sản phẩm mua theo sản phẩm 2.3 Ứng dụng kết học Apriori xây dựng website bán sách - Với giao diện trang chủ website Đăng nhập, đăng ký(thơng tin người dùng) Giỏ hàng Logo Tìm kiếm Menu Giới thiệu shop - Menu trái - Nhóm sản phẩm sách - Tìm kiếm theo mức giá - Hỗ trợ trực tuyến Fanpage Facebook Slide show >>Sách id=0001 id=0003 >>Sách xem nhiều id=0002 id=0004 id=0005 Thơng tin cơng ty - - Ví dụ khách hàng chọn sản phẩm bất kỳ, chẳng hạn sản phẩm có id=0003 Khi trang detail sản phẩm có id=0003 xuất hiện, giới thiệu chi tiết sản phầm Tiếp theo sách bạn nên tham khảo, sử dụng kết luật kết hợp vừa học qua lần quét liệu ta thu Với giỏ hàng lúc có sản phâm id=0003, ta lấy kết lần quét 2, tức sản phẩm id=0003 kết hợp với id=0001, id=0002 thỏa mãn điều kiện phổ biến Đăng nhập, đăng ký(thông tin người dùng) Giỏ hàng Logo Tìm kiếm Fanpage Facebook Menu Giới thiệu shop Slide show - Menu trái - Nhóm sản phẩm sách - Tìm kiếm theo mức giá - Hỗ trợ trực tuyến >>Giới thiệu chi tiết Sách - Mã sách: 0003 id=0003 - Tến sách: - Giá bán: - Giới thiệu tóm tắt sách >>Các sách bạn nên tham khảo: id=0001 id=0002 Thông tin công ty - Tiếp theo chọn tiếp sản phẩm có id=0001, lúc có mua kèm {0003,0001}, lấy kết qt lần 3, bảng qt lần khơng có sản phẩm mà có cặp {0003,0001} kết hợp thỏa mãn, tức lúc khơng có tư vấn mua kèm Đăng nhập, đăng ký(thông tin người dùng) Giỏ hàng Logo Tìm kiếm Fanpage Facebook Menu Giới thiệu shop Slide show - Menu trái - Nhóm sản phẩm sách - Tìm kiếm theo mức giá - Hỗ trợ trực tuyến >>Giới thiệu chi tiết Sách - Mã sách: 0001 id=0001 - Tến sách: - Giá bán: - Giới thiệu tóm tắt sách >>Các sách bạn nên tham khảo: Thông tin công ty - Ngược lại khách hàng chọn tiếp sản phẩm có id=0002, lúc có mua kèm {0003,0002}, lấy kết quét lần 3, bảng quét lần có sản phẩm id=0005 cặp {0003,0001} kết hợp thỏa mãn minsupp Đăng nhập, đăng ký(thông tin người dùng) Giỏ hàng Logo Tìm kiếm Fanpage Facebook Menu Giới thiệu shop Slide show - Menu trái - Nhóm sản phẩm sách - Tìm kiếm theo mức giá - Hỗ trợ trực tuyến >>Giới thiệu chi tiết Sách - Mã sách: 0003 id=0002 - Tến sách: - Giá bán: - Giới thiệu tóm tắt sách >>Các sách bạn nên tham khảo: Thông tin công ty - Nếu số lượng sản phẩm trang web nhiều, số lượng giao dịch lớn, số lượng kết hợp thỏa mãn luật kết hợp trở nên phong phú hơn, thấy rõ ưu điểm tối ưu ứng dụng giải thuật luật kết hợp Apriori xây dựng website bán sách online