Dữ liệu và bối cảnh thử nghiệm

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phân tích hành vi người dùng bỏ giỏ hàng trên các trang thương mại điện tử (Trang 31 - 33)

Trong thử nghiệm nhằm so sánh hiệu năng phân loại của bốn thuật toán: cây quyết định, rừng ngẫu nhiên, máy hỗ trợ vector và K hàng xóm gần nhất; dữ liệu người dùng được thu thập từ các tệp nhật ký máy chủ của một công ty phân phối và bán lẻ thời trang hàng đầu tại Đức. Dữ liệu được tạo bằng cách trích xuất các hoạt động mua sắm trực tuyến theo trình tự thời gian của khách hàng từ các tệp lưu trữ lịch sử hành động mua sắm. Mỗi tệp nhật ký ghi lại các hoạt động mua sắm và tiêu dùng trong một phiên sử dụng của người dùng, ví dụ các hành động như đăng nhập, thanh toán giỏ hàng, xem thông tin chi tiết sản phẩm, thêm sản phẩm vào giỏ hàng v...v. Dữ liệu bao gồm 3.511.037 phiên mua sắm trong khoảng thời 3 tháng gian từ

ngày 1 tháng 2 năm 2019 đến ngày 30 tháng 4 năm 2019 [24]. Từ dữ liệu thu thập được, 18 tiêu chí dữ liệu được lựa chọn và trình bày trong bảng mô tả sau.

Bảng 2.1: Bảng mô tả và chỉ mục dữ liệu dùng cho so sánh 4 thuật toán

Chỉ mục dữ liệu Mô tả dữ liệu

SCA Phân loại giỏ hàng bị bỏ rơi

BASKETS_BB Số lượng giỏ hàng được chuyển đổi thành đơn hàng BASKETS Số lượng giỏ hàng được khởi tạo trong phiên mua

sắm

LOGS Số lần đăng nhập của khách hàng

LOGS_CUST_STEP2 Số lượng khách hàng thực hiện giao dịch bước thanh toán

LOGS_NEWCUST_STEP2 Số lượng khách hàng mới thực hiện giao dịch đến bước thanh toán

PIS Số lượt xem tổng thể PIS_AP Số lượt xem giỏ hàng PIS_DV Số lượt xem sản phẩm

PIS_PL Số lượt xem danh mục sản phẩm PIS_SDV Số lượt xem sản phẩm qua tìm kiếm PIS_SR Số lượt tìm kiếm sản phẩm

POSITIONS Số loại sản phẩm trong giỏ hàng QUANTITY Số lượng sản phẩm trong giỏ hàng VALUE_BB Tổng giá trị của giỏ hàng

NEW_CUST Khách hàng mới

WEB_CUST Khách hàng sử dụng máy tính cá nhân MOBILE_CUST Khách hàng sử dụng thiết bị di động

(Nguồn: [24] Rausch, Theresa & Derra, Nicholas & Wolf, Lukas (2020), “Predicting online shopping cart abandonment with machine learning approaches” International Journal of Market Research.)

Trong tổng số hơn 3,5 triệu phiên mua sắm của người tiêu dùng, có 520.653 (63,41% tổng số giỏ hàng) trường hợp người tiêu dùng bỏ rơi giỏ hàng và 300.395 (36,59% tổng số giỏ hàng) giỏ hàng được chuyển đổi thành công thành đơn hàng. Do vậy, tập dữ liệu có sự phân lập rõ rệt về tỷ lệ giỏ hàng thành công và giỏ hàng bị bỏ rơi, giúp đánh giá độ chính xác của các thuật toán dễ dàng hơn.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu phân tích hành vi người dùng bỏ giỏ hàng trên các trang thương mại điện tử (Trang 31 - 33)

Tải bản đầy đủ (PDF)

(58 trang)