Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 58 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
58
Dung lượng
1,7 MB
Nội dung
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - TRẦN PHÚC ĐỊNH NGHIÊN CỨU PHÂN TÍCH HÀNH VI NGƯỜI DÙNG BỎ GIỎ HÀNG TRÊN CÁC TRANG THƯƠNG MẠI ĐIỆN TỬ LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) Hà Nội - 2021 download by : skknchat@gmail.com HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - TRẦN PHÚC ĐỊNH NGHIÊN CỨU PHÂN TÍCH HÀNH VI NGƯỜI DÙNG BỎ GIỎ HÀNG TRÊN CÁC TRANG THƯƠNG MẠI ĐIỆN TỬ CHUYÊN NGÀNH: MÃ SỐ: KHOA HỌC MÁY TÍNH 8.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS Trần Đình Quế Hà Nội - 2021 download by : skknchat@gmail.com i LỜI CAM ĐOAN Tôi xin cam đoan luận văn cơng trình nghiên cứu độc lập riêng tơi hướng dẫn PGS.TS Trần Đình Quế Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình khác Các nguồn tài liệu trích dẫn liệt kê danh mục tài liệu tham khảo theo quy định Tôi xin chịu trách nhiệm tính xác trung thực luận văn Học viên Trần Phúc Định download by : skknchat@gmail.com ii LỜI CẢM ƠN Lời đầu tiên, xin trân trọng cảm ơn thầy hướng dẫn PGS TS Trần Đình Quế, thầy tận tình hướng dẫn tơi q trình nghiên cứu việc hoàn thành luận văn Xin chân thành cảm ơn Thầy, Cô thuộc Khoa Đào tạo Sau đại học – Học Viện Cơng Nghệ Bưu Chính Viễn Thơng tận tình giảng dạy cho tơi thời gian học tập Do giới hạn kiến thức khả lý luận thân cịn nhiều thiếu sót hạn chế, kính mong dẫn đóng góp Thầy, Cơ để luận văn tơi hồn thiện Xin chân thành cảm ơn! Hà Nội, ngày 18 tháng 05 năm 2021 Trần Phúc Định download by : skknchat@gmail.com iii MỤC LỤC MỞ ĐẦU CHƯƠNG I: TỔNG QUAN VỀ HÀNH VI NGƯỜI DÙNG TRONG THƯƠNG MẠI ĐIỆN TỬ 1.1 Giới thiệu khái niệm, đời, hình thành phát triển thương mại điện tử 1.1.1 Khái niệm thương mại điện tử .4 1.1.2 Sự đời, hình thành phát triển thương mại điện tử 1.2 Tiềm khai thác liệu người dùng thương mại điện tử 1.2.1 Phân tích giỏ hàng điện tử 1.2.2 Dự đoán nhu cầu thị trường .8 1.2.3 Đánh giá phân khúc thị trường 1.2.4 Phòng chống gian lận thương mại 10 1.3 Giới thiệu giỏ hàng điện tử hành vi bỏ rơi giỏ hàng .10 1.3.1 Khái niệm giỏ hàng điện tử 10 1.3.2 Khuynh hướng sử dụng giỏ hàng điện tử người tiêu dùng 11 1.3.3 Bỏ rơi giỏ hàng mua sắm trực tuyến 12 1.4 Kết luận 13 CHƯƠNG 2: PHÂN TÍCH HÀNH VI BỎ RƠI GIỎ HÀNG .14 2.1 Các yếu tố định bỏ rơi giỏ hàng .14 2.1.1 Trải nghiệm người dùng không tốt 14 2.1.2 Chi phí vận chuyển cao, đơn hàng không minh bạch 15 2.1.3 Nhận thức rủi ro từ người dùng trực tuyến 17 2.2 Thuật toán định rừng ngẫu nhiên 18 2.2.1 Thuật toán định .18 2.2.2 Thuật toán rừng ngẫu nhiên 20 2.3 Ứng dụng học máy dự đoán người dùng bỏ rơi giỏ hàng .22 2.3.1 Dữ liệu bối cảnh thử nghiệm .23 2.3.2 So sánh kết thuật toán 25 download by : skknchat@gmail.com iv 2.4 Kết luận 27 CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ 28 3.1 Phát biểu toán 30 3.1.1 Bài tốn phân tích dự đốn phân luồng trực tiếp .30 3.1.2 Bài toán thống kê liệu phân luồng gián tiếp 31 3.1.3 Tổng hợp toán trình tự phân tích 32 3.2 Cấu trúc hệ thống liệu .34 3.2.1 Cấu trúc trang thương mại điện tử dịch vụ phân tích 34 3.2.2 Cấu trúc liệu .36 3.3 Thử nghiệm đánh giá .39 3.3.1 Thống kê phân tích khn mẫu liệu 39 3.3.2 Thử nghiệm thực tế 42 3.4 Kết luận 45 KẾT LUẬN 47 DANH MỤC TÀI LIỆU THAM KHẢO .48 download by : skknchat@gmail.com v DANH MỤC BẢNG BIỂU Bảng 2.1: Bảng mô tả mục liệu dùng cho so sánh thuật toán 24 Bảng 3.1: Bảng mục liệu phân luồng trực tiếp 37 Bảng 3.2: Bảng mục liệu phân luồng gián tiếp 38 download by : skknchat@gmail.com vi DANH MỤC HÌNH VẼ Hình 2.1: lý khách hàng bỏ rơi giỏ hàng trực tuyến Hoa Kỳ 16 Hình 2.2: 10 lý người tiêu dùng bỏ rơi giỏ hàng bước tốn 17 Hình 2.3: Mơ hình thuật tốn định 19 Hình 2.4: Mơ hình thuật tốn rừng ngẫu nhiên 21 Hình 2.5: Biểu đồ so sánh độ xác thuật tốn 25 Hình 2.6: Biểu đồ so sánh tốc độ xử lý thuật toán 26 Hình 3.1: Sơ đồ tiến trình phân tích liệu dự báo bỏ rơi giỏ hàng 29 Hình 3.2: Sơ đồ trình tự phân tích lịch sử hoạt động phiên mua sắm 32 Hình 3.3: Cấu trúc trang thương mại điện tử dự đoán bỏ rơi giỏ hàng 34 Hình 3.4: Kết phân tích với biến số thay đổi kích thước thử nghiệm 40 Hình 3.5: Kết phân tích với biến số thay đổi số lượng ước tính 40 Hình 3.6: Kết phân tích với biến số thay đổi trạng thái ngẫu nhiên 41 Hình 3.7: Kết dự đốn ứng dụng dự đốn thực tế 42 Hình 3.8: Mức độ quan trọng thuộc tính phiên mua sắm 43 Hình 3.9: So sánh thời gian trung bình phiên mua sắm thành cơng bỏ rơi 44 download by : skknchat@gmail.com MỞ ĐẦU Trong năm gần đây, cách mạng khoa học công nghệ 4.0 đem lại nhiều thay đổi tích cực mặt đời sống người Nhu cầu mua bán, giao dịch trực tuyến qua mạng Internet dần trở nên phổ biến ngày phát triển Bên cạnh thuận lợi tiện nghi phủ nhận, thương mại điện tử bộc lộ nhiều vấn đề cho khách mua hàng lòng tin với sản phẩm, bảo mật liệu, phụ thuộc vào đơn vị vận chuyển, hay sẵn sàng sản phẩm Đối với người bán hàng, thách thức lớn không đề cập vấn đề người dùng bỏ rơi giỏ hàng mua sắm trực tuyến Bên cạnh thuận lợi tiện nghi phủ nhận, thương mại điện tử bộc lộ nhiều vấn đề cho khách mua hàng lòng tin với sản phẩm, bảo mật liệu, phụ thuộc vào đơn vị vận chuyển, hay sẵn sàng sản phẩm Đối với người bán hàng, thách thức lớn không đề cập vấn đề người dùng bỏ rơi giỏ hàng mua sắm trực tuyến Theo thống kê độc lập từ học viện Baymard, 69% tổng số lượng giỏ hàng bị bỏ rơi không toán giao dịch mua sắm thương mại điện tử [2] Tỉ lệ bỏ rơi giỏ hàng cao tất yếu giảm tỉ lệ chuyển đổi đơn hàng, từ giảm doanh thu cho người bán nói riêng cho trang thương mại điện tử nói chung, gia tăng chi phí lưu kho sản phẩm nhiều tác động tiêu cực khác Không vậy, người mua hàng có định kiến tiêu cực nảy sinh thái độ thận trọng trước tần suất giao dịch hạn chế người dùng sàn thương mại điện tử Nhận thấy vấn đề tồn mua hàng trực tuyến, luận văn “Nghiên cứu phân tích hành vi người dùng bỏ giỏ hàng trang thương mại điện tử” ứng dụng khả khai thác phân tích liệu máy tính để dự đốn tỉ lệ bỏ rơi giỏ hàng trực tuyến Trên sở đó, hình thành khn mẫu tiêu dùng mua sắm đặc trưng khách hàng trang thương mại điện tử Đồng thời, nghiên cứu đưa đưa yếu tố dẫn đến hành vi bỏ rơi giỏ hàng số phân tích dựa liệu thống kê download by : skknchat@gmail.com Trong mua sắm trực tuyến, hành vi bỏ rơi giỏ hàng điện tử hiểu “một giao dịch mua hàng có kế hoạch rõ ràng lại không toán” [6] Một nghiên cứu thống kê cho thấy, giao dịch mua bán trực tuyến có đến giao dịch bị bỏ ngỏ lãng quên người tiêu dùng nhiều lý khác [15] Ở khía cạnh tâm lý người, hành vi bỏ rơi giỏ hàng người dùng giỏ hàng trực tuyến sử dụng không túy giỏ hàng siêu thị; mà cịn sử dụng danh sách mua hàng, cách để xem trước phụ phí (thuế, phí vận chuyến), hay đơn mục đích giải trí [7] Một số cơng trình nghiên cứu liên quan khác khai thác phân tích cách thức sử dụng giỏ hàng trực tuyến dựa kĩ thuật học sâu Köhn, Dennis & Lessmann, Stefan & Schaal, Markus [6] hay khám phá vấn nạn bỏ rơi giỏ hàng - vấn đề rủi ro danh tiếng Moore S and Mathews S [15] phần khai thác khuynh hướng tiêu dùng thương mại điện tử, hành vi mua sắm người tiêu dùng hành vi sử dụng giỏ hàng trực tuyến Tuy nhiên, nghiên cứu thực độc lập, dựa lượng liệu có sẵn khơng đổi theo thời gian với mục đích chủ yếu để tham chiếu lý luận cho nghiên cứu Chính vậy, luận văn thực nghiên cứu phân tích tập liệu động thay đổi theo thời gian sử dụng thực tế khách hàng, nâng cao tính ứng dụng kết nghiên cứu đồng thời phản ánh tiêu chí đặc trưng dẫn đến hành vi bỏ rơi giỏ hàng phù hợp với đối tượng thương mại điện tử Với định hướng nghiên cứu ứng dụng, luận văn sử dụng phương pháp thu thập, tổng hợp thống kê hoạt động, lịch sử mua sắm giao dịch thương mại người dùng trang thương mại điện tử Từ liệu tổng hợp, việc dự đoán người dùng bỏ rơi giỏ hàng chia thành hai luồng xử lý luồng xử lý trực tiếp ứng dụng thuật toán rừng ngẫu nhiên luồng xử lý gián tiếp xử dụng kết thống kê từ lịch sử mua hàng Luận văn xây dựng hệ thống kết hợp trang thương mại điện tử dịch vụ phân loại dự đoán hành vi bỏ rơi giỏ hàng sử dụng hoạt động người dùng theo thời gian thực Trên sở thông tin liệu download by : skknchat@gmail.com 36 3.2.2 Cấu trúc liệu Đối với phân luồng trực tiếp, liệu thử nghiệm luận văn bao gồm tất phiên mua sắm 188 khách hàng đăng nhập khách hàng vãng lai khác tổng hợp từ trang thương mại điện tử cung cấp vật liệu xây dựng thiết bị vệ sinh phòng tắm khoảng thời gian từ ngày 01 tháng 12 năm 2020 đến ngày 15 tháng 02 năm 2021 - khoảng 2,5 tháng Trong thời gian đó, Gần 10.000 hoạt động tiêu dùng trực tuyến trang thương mại điện tử ghi lại tổng hợp thành 1.173 phiên mua sắm khác Các hoạt động tiêu dùng ghi lại cách lưu nhật ký yêu cầu tài nguyên (yêu cầu xem sản phẩm, xem giỏ hàng, thêm sản phẩm vào giỏ hàng, toán, v.v) người dùng đến trang thương mại điện tử Với ưu xây dựng phát triển dựa tảng Magento 2, nhật ký yêu cầu tài nguyên trích xuất qua việc ứng dụng chế “sự kiện – người quan sát” Trong đó, người dùng khởi tạo yêu cầu tài nguyên, kiện phát toàn hệ thống kèm theo tồn thơng tin ngữ cảnh hoạt động, tình trạng hệ thống, trạng thái phiên đăng nhập, v.v Bằng cách khởi tạo “người quan sát” để bắt kiện yêu cầu tài nguyên người dùng, việc truy xuất liệu phục vụ cho phân luồng trực tiếp hồn tồn đạt qua trình phần tách tổng hợp liệu đính kèm kiện Đồng thời, q trình lưu nhật ký hành động, liệu phiên mua sắm tổng hợp tính tốn để ln trạng thái Các liệu dạng chuỗi (device_type, origin) dạng số thập phân (total_cart_value, average_interval) tinh chỉnh chuyển đổi sang dạng số nguyên để chuẩn hóa liệu đầu vào cho thuật toán rừng ngẫu nhiên Chỉ mục liệu phân luồng trực tiếp tham khảo dựa nghiên cứu dự đoán bỏ rơi giỏ hàng Rausch, Theresa & Derra, Nicholas & Wolf, Lukas (2020) [24] Ngoài ra, số liệu loại thiết bị truy cập (device_type), nguồn gốc khách hàng (origin) thời gian trung bình hành động (average_interval) bổ sung vào phân luồng trực tiếp đặc tính sẵn có hệ thống Bảng 3.1 mô tả chi tiết mục liệu có ghi phiên mua sắm download by : skknchat@gmail.com 37 Bảng 3.1: Bảng mục liệu phân luồng trực tiếp STT Chỉ mục liệu Định nghĩa customer_id ID định danh khách hàng trường hợp khách hàng đăng nhập vào hệ thống cart_id ID định danh giỏ hàng device_type Loại thiết bị truy cập phiên mua sắm Phân loại thiết bị truy cập: ● Máy tính ● Điện thoại ● Máy tính bảng origin Nguồn gốc truy cập Phân loại nguồn gốc truy cập: Quảng cáo: người dùng truy cập từ trang quảng cáo ● Trực tiếp: người dùng truy cập trực tiếp địa ● Giới thiệu: người dùng truy cập trực tiếp địa với mã giới thiệu cá nhân hay tổ chức khác ● Điều hướng: người dùng truy cập từ đường dẫn điều hướng khác ● Khác: người dùng truy cập thông qua phương thức khác total_view Tổng số lượt xem total_product_view Tổng số lượt xem sản phẩm total_cart_view Tổng số lượt xem giỏ hàng total_category_view Tổng số lượt xem danh mục sản phẩm total_search Tổng số lượt tìm kiếm sản phẩm 10 total_item_qty Tổng số lượng mặt hàng giỏ hàng download by : skknchat@gmail.com 38 11 total_cart_value Tổng giá trị giỏ hàng 12 average_interval Trung bình thời gian hành động Đối với phân luồng gián tiếp, liệu thu thập tổng hợp sau dịch vụ dự đoán bỏ rơi giỏ hàng tích hợp vào trang thương mại điện tử Trong đó, thành phần ngoại vị dịch vụ dự đoán yêu cầu truy xuất lịch sử mua sắm, nhận xét đánh giá tài khoản khách hàng trang thương mại điện tử Dữ liệu khách hàng tổng hợp tính tốn để đưa tỷ lệ tổng số lượng giao dịch thành công, thất bại thái độ tiêu dùng khách mua hàng qua nhận xét đánh giá sản phẩm Số lượng ghi tổng hợp với số lượng khách hàng có tăng theo thời gian trường hợp trang thương mại điện tử có thêm khách hàng đăng ký tài khoản Thống kê liệu không bao gồm giao dịch khách hàng vãng lai ghi thiếu định danh khách hàng Bảng 3.2 mô tả chi tiết mục liệu có ghi tổng hợp lịch sử mua sắm khách hàng Bảng 3.2: Bảng mục liệu phân luồng gián tiếp STT Chỉ mục Định nghĩa customer_id Định danh khách hàng total_order Tổng số lượng đơn hàng total_complete_order Tổng số lượng đơn hàng hoàn thành life_time_sale Tổng giá trị đơn hàng hệ thống total_cart Tổng số lượng giỏ hàng total_complete_cart Tổng số lượng giỏ hàng thành công total_abandon_cart Tổng số lượng giỏ hàng bị bỏ rơi average_cart_total Trung bình giá trị giỏ hàng total_rating Tổng số lượng đánh giá sản phẩm download by : skknchat@gmail.com 39 10 total_review Tổng số lượng nhận xét sản phẩm 11 average_rating_score Trung bình điểm đánh giá sản phẩm 12 average_review_length Trung bình độ dài nhận xét sản phẩm 13 total_wishlist Tổng số lượng sản phẩm mong muốn 14 total_login Tổng số lần đăng nhập 15 total_product_view Tổng số lần xem sản phẩm 16 total_product_search Tổng số lần tìm kiếm sản phẩm 17 cart_abandon_rate Tỷ lệ bỏ rơi giỏ hàng 18 average_order_total Trung bình giá trị đơn hàng 3.3 Thử nghiệm đánh giá 3.3.1 Thống kê phân tích khn mẫu liệu Dữ liệu hoạt động hành vi mua sắm người tiêu dùng trang thương mại điện tử sau trình thu thập xử lý sử dụng làm liệu huấn luyện cho thuật toán rừng ngẫu nhiên để phân loại khn mẫu hành vi Q trình huấn luyện đòi hỏi liệu phân chia thành nhóm liệu khác nhằm phục vụ mục đích huấn luyện, thử nghiệm so sánh độ xác dự đoán phân loại Do vậy, ba đối số kích thước thử nghiệm (test size), trạng thái ngẫu nhiên (random state) số lượng ước tính (number of estimators) cân nhắc để thuật tốn khơng đưa kết với độ xác cao mà thời gian thực phải tối ưu Trong đó, đối số có vai trị sau: Kích thước thử nghiệm: tỉ lệ phân chia liệu tập liệu huấn luyện tập liệu thử nghiệm Trạng thái ngẫu nhiên: quán lần xáo trộn liệu để đạo tạo Số lượng ước tính: số lượng định khởi tạo trước đưa kết phân loại cuối download by : skknchat@gmail.com 40 Tập liệu phân tích bao gồm 1.173 ghi nhật ký phiên mua sắm người dùng, đó, với thay đổi đối số, tổng thời gian thực phân tích dự đốn giao động từ 0,08 đến 0,2 giây với mức giao động độ xác từ 80% đến 95% Các đối số ban đầu khởi tạo với giá trị là: kích thước thử nghiệm – 0.1; trạng thái ngẫu nhiên - 10 số lượng ước tính - 10 Qua lần phân tích dự đốn, giá trị đối số tăng thêm 10 đơn vị mức tối đa là: kích thước thử nghiệm – 0.5; trạng thái ngẫu nhiên - 50 số lượng ước tính – 50 Các đối số khơng có thay đổi giá trị có giá trị sở lúc khởi tạo ban đầu Sau đó, kết phân tích liệu, độ xác dự đốn thời gian thực so sánh tương quan biểu thị hình 3.4, hình 3.5 hình 3.6 92 0.098 90.9707 90 0.096 88.1988 88 86.5116 86.9403 86 0.094 0.092 84 0.09 82 80.0371 80 0.088 0.086 78 0.084 76 74 0.082 0.1 0.2 0.3 Độ xác 0.4 0.5 Thời gian (giây) Hình 3.4: Kết phân tích với biến số thay đổi kích thước thử nghiệm download by : skknchat@gmail.com 41 95 0.2 94.4444 0.18 94 93 92.5926 92.5926 0.14 92 91 0.16 0.12 90.7407 0.1 90 0.08 88.8889 89 0.06 88 0.04 87 0.02 86 10 20 30 Độ xác 40 50 Thời gian (giây) Hình 3.5: Kết phân tích với biến số thay đổi số lượng ước tính 92 0.096 90.7407 0.095 90 88 87.0371 86 85.1852 0.094 0.093 85.1852 0.092 84 0.091 81.4815 82 0.09 80 0.089 78 0.088 76 0.087 10 20 30 Độ xác 40 50 Thời gian (giây) Hình 3.6: Kết phân tích với biến số thay đổi trạng thái ngẫu nhiên download by : skknchat@gmail.com 42 Qua kết độ xác tương quan với thời gian thực phân tích dự đốn, thấy tăng giá trị số lượng ước tính, thời gian thực phân tích tăng lên cách rõ rệt Kết dự đốn việc tăng giá trị số lượng ước tính gia tăng số lượng định q trình huấn luyện, từ việc thực định tổng hợp kết rừng ngẫu nhiên lâu tốn nhiều tài nguyên Ở chiều ngược lại, việc thay đổi kích cỡ thử nghiệm trạng thái ngẫu nhiên không ảnh hưởng nhiều đến thời gian thực tác vụ phân loại mà thay đổi giá trị làm thời gian thực giao động 1/100 giây Từ bảng so sánh kết xác thời gian thực tác vụ, kết luận với đối số có giá trị là: kích thước thử nghiệm – 0.1; trạng thái ngẫu nhiên – 10; số lượng ước tính – 10 cho kết tối ưu với độ xác khoảng 90% thời giạn thực nhiện khoảng 0,09 giây Do vậy, ba giá trị sử dụng trình ứng dụng thực tế việc phân loại người tiêu dùng bỏ rơi giỏ hàng 3.3.2 Thử nghiệm thực tế Quá trình ứng dụng thử nghiệm người dùng thực tế dịch vụ phân loại dự đoán hành vi bỏi rơi giỏ hàng tiến hành thời gian khoảng tuần Với 230 phiên mua sắm trực tuyến nhóm khác hàng khách hàng vãng lai, khách hàng khác hàng cũ Khác hàng vãng lai tệp khách hàng lần đầu truy cập sử dụng dịch vụ mua sắm trang thương mại điện tử Tệp khách hàng chủ yếu đến từ chương trình khoảng cáo tiếp thị, số đến từ gợi ý cơng cụ tìm kiếm có từ khóa liên quan Khác hàng khách hàng có tài khoản biết đến trang thương mại điện tử chưa có đơn hàng giao dịch giỏ hàng thành cơng Cuối khách hàng cũ hay tệp khách hàng có đơn hàng giao dịch thành cơng có tài khoản trang thương mại điện tử download by : skknchat@gmail.com 43 80 72.21 70 58.64 60 50 43.86 40 30 20 10 Khách vãng lai Khách hàng Khách hàng cũ Độ xác Hình 3.7: Kết dự đốn ứng dụng dự đoán thực tế Từ biểu đồ kết dự đốn, thấy độ xác với tệp khách hàng cũ cao đáng kể so liệu khác hàng vãng lai khách hàng Nhóm khách hàng cũ khơng có nhiều thơng tin cho q trình phân loại mà họ có niềm tin định trang thương mại điện tử nên việc hồn tất giao dịch mua sắm hồn tồn dự đốn Ngồi độ xác tệp khác hàng, thuật tốn rừng ngẫu nhiên cịn đưa thống kê mức độ quan trọng thuộc tính liệu Qua thống kê này, người dùng ứng dụng để tối ưu hóa thuật tốn trình phân loại tối ưu chức trang thương mại điện tử để giảm thiểu tỷ lệ bỏ rơi giỏ hàng, gia tăng số lượng đơn hàng chuyển đổi thành công download by : skknchat@gmail.com 44 Nguồn gốc khách hàng 2.34 Số lượng sản phẩm 4.83 Loại thiết bị 5.89 Lượt xem thể loại 6.53 Lượt tìm sản phẩm 6.82 Giá trị giỏ hàng 7.41 Lượt xem sản phẩm 8.19 Tổng lượt xem 12.06 Lượt xem giỏ hàng 14.91 Thời gian trung bình 30.97 10 15 20 25 30 35 Mức độ quan trọng Hình 3.8: Mức độ quan trọng thuộc tính phiên mua sắm Qua thống kê hình 3.8, thời gian trung bình hoạt động người tiêu dùng thuộc tính quan trọng định hành vi bỏ rơi giỏ hàng phiên mua sắm với mức độ quan trọng 30% Thời gian trung bình lâu tỷ lệ người tiêu dùng bỏi rơi giỏ hàng cao ngược lại, thời gian ngắn tỷ lệ bỏ rơi giỏ hàng thấp Bên cạnh đó, lượt xem giỏ hàng tổng lượt xem toàn trang thương mại điện tử thuộc tính có mức độ quan trọng tương đối rõ rệt, đạt mức 15% 13% Số lượt xem giỏ hàng người tiêu dùng tăng cao phần thể mức độ cân nhắc người mua sắm trước thực giao dịch download by : skknchat@gmail.com 45 60 49.93 50 40 30 24.89 20 13.97 8.54 10 4.3 3.04 Phiên mua sắm thành công Thời gian nhỏ (giây) Thời gian trung bình (giây) Phiên mua sắm bỏ rơi Thời gian lớn (giây) Hình 3.9: So sánh thời gian trung bình phiên mua sắm thành cơng bỏ rơi Biểu đồ so sánh hình 3.9 cho thấy khác biệt rõ rệt thời gian trung bình hành động người dùng hồn thành giỏ hàng người dùng bỏ rơi giỏ hàng Có thể thấy, thời gian trung bình phiên mua sắm thành công dao động từ giây đến khoảng 15 giây, với mức trung bình phổ biến 8,54 giây Ở chiều ngược lại, phiên mua sắm có giỏ hàng bị bỏ rơi có mức dao động lớn từ giây đến khoảng 50 giây, với mức trung bình 25 giây Như kết luận rằng, thời gian trung bình hành động người dùng vượt qua khoảng 15 đến 20 giây, phiên mua sắm có tỷ lệ bỏ rơi giỏ hàng lớn giá trị vượt qua ngưỡng tối đa phiên mua sắm thành công gần chạm mốc trung bình phiên mua sắm có tượng bỏ rơi giỏ hàng 3.4 Kết luận Trong chương ba, luận văn tập trung vào trình hai tốn phân tích thống kê liệu tương ứng với hai phân luồng trực tiếp dán tiếp dự đoán hành vi bỏ rơi giỏ hàng người tiêu dùng Dựa phát biểu hai toán, chương ba làm sáng tỏ trình tự phân tích tổng hợp kết hai phân luồng để đưa kết dự đoán cuối Đồng thời, luận văn trình bày cấu trúc hệ thống trang download by : skknchat@gmail.com 46 thương mại điện tử dịch vụ phân tích mơ tả chi tiết, kích cỡ cách thu thập liệu thử nghiệm Trong thử nghiệm đánh giá thực tế, luận văn tìm giá trị tối ưu cho đối số thuật tốn rừng ngẫu nhiên, từ đưa kết thử nghiệm thực tế với tập khách hàng cũ (khách hàng có tài khoản có giao dịch thành cơng) có dự đốn bỏ rơi giỏ hàng xác 72,21% Ngồi ra, thuật toán rừng ngẫu nhiên chương ba đưa tiêu chí thời gian trung bình hành động đóng vai trị quan trọng định bỏ rơi giỏ hàng tiêu dùng Trong đó, thời gian trung bình phiên mua sắm thành cơng 8,5 giây phiên mua sắm có tượng bỏ rơi giỏ hàng, thời gian trung bình hành động cao gần gấp lần (24,9 giây) download by : skknchat@gmail.com 47 KẾT LUẬN Sau trình tìm hiểu, nghiên cứu ứng dụng, luận văn “Nghiên cứu phân tích hành vi người dùng bỏ giỏ hàng trang thương mại điện tử” đáp ứng nội dung trình bày đề cương Cụ thể, luận văn đạt số kết sau: Giới thiệu tổng quan thương mại điện tử giới Việt Nam năm gần làm rõ tiềm khai thác liệu tiêu dùng hoạt động mua sắm khách hàng Trình bày vấn đề bỏ rơi giỏ hàng điện tử mua sắm trực tuyến yếu tố dẫn đến tượng Trình bày thuật tốn học máy có giám sát định rừng ngẫu nhiên; đồng thời, so sánh hiệu rừng ngẫu nhiên với thuật toán phân loại khác để làm sáng tỏ mức độ phù hợp tác vụ phân loại dự đoán bỏ rơi giỏ hàng Ứng dụng thuật toán rừng ngẫu nhiên, xây dựng dịch vụ phân tích tích hợp hệ thống trang thương mại điện tử để thử nghiệm phân tích dự đốn hành vi bỏ rơi giỏ hàng Trên kết thu từ thử nghiệm thực tế, luận văn đưa thời gian trung bình hành động yếu tố định bỏ rơi giỏ hàng người dùng mua sắm trực tuyến Trong tương lai, đề tài nghiên cứu ứng dụng luận văn mở rộng nhiều phương diện thuật toán sử dụng tảng thương mại điện tử áp dụng Trong đó, hướng nghiên cứu phát triển cụ thể hóa sau: Nghiên cứu thêm thuật toán học máy để đa dạng hóa thuật tốn sử dụng đối chiếu kết tác vụ dự đoán hành vi bỏ rơi giỏ hàng Ứng dụng dịch vụ phân tích dự đốn bỏ rơi giỏ hàng tảng thương mại điện tử khác ví dụ: BigCommerce, Shopify, WooCommerce, v.v download by : skknchat@gmail.com 48 DANH MỤC TÀI LIỆU THAM KHẢO [1] Al Imran, Md Abdullah (2014), “A Study On Amazon: Information Systems, Business Strategies And E-Crm” University of Liberal Arts Bangladesh [2] Baymard Institute Research Team (2017), 41 Cart Abandonment Rate Statistics, Baymard Institute Available: https://baymard.com/lists/cart-abandonment-rate [3] Breiman L (2001), Random Forests Machine Learning Vol 45 No 1, pp 5–32 [4] Bucklin RE and Sismeiro C (2003), “A Model of Web Site Browsing Behavior Estimated on Clickstream Data” Journal of Marketing Research Vol 40 No 03, pp 249–267 [5] Chipman HA, George EI and McCulloch RE (1998), “Bayesian CART Model Research” Journal of the American Statistical Association, pp 935–948 [6] Cho J (2004), “Likelihood to abort an online transaction: influences from cognitive evaluations, attitudes, and behavioral variables” Information & Management, pp 827-838 [7] Close Scheinbaum, Angeline & Kukar-Kinney, Monika & Benusa, Kyle (2012), “Towards a Theory of Consumer Electronic Shopping Cart Behavior” Motivations of E-Cart Use and Abandonment, pp 156-230 [8] Dowling, G.R (1986), “Perceived risk: the concept and its measurement” Psychology and Marketing, Vol No 3, pp 193-210 [9] Friedman J (2001), “Greedy Function Approximation: A Gradient Boosting Machine” The Annals of Statistics, pp 1189–1232 [10] Hasan, Layla & Morris, Anne & Probets, Steve (2009), “Using Google Analytics to Evaluate the Usability of E-Commerce Sites” [11] Köhn, Dennis & Lessmann, Stefan & Schaal, Markus (2020), “Predicting Online Shopping Behaviour from Clickstream Data using Deep Learning” Berlin Expert Systems with Applications Journal [12] Leiner, Barry & Cerf, Vinton & Clark, David & Kahn, Robert & Kleinrock, et al (2009), “A Brief History of the Internet Computer Communication Review”, ACM SIGCOMM Computer Communication Review, pp 22-31 download by : skknchat@gmail.com 49 [13] Liaw A and Wiener M (2002) Classification and Regression by randomForest R News 2(3): 18–22 [14] Montgomery AL, Li S, Srinivasan K, et al (2004), “Modeling Online Browsing and Path Analysis Using Clickstream Data” Marketing Science Vol 23 No 04, pp 579–595 [15] Moore S and Mathews S (2006), “An exploration of online shopping cart abandonment syndrome – a matter of risk and reputation” Journal of Website Promotion, pp 71-88 [16] Moro S, Cortez P and Rita P (2014), “A data-driven approach to predict the success of bank telemarketing” Decision Support Systems & Technology Security Magazine, pp 22–31 [17] Nayak, Richi (2003) Data Mining for Web-Enabled Electronic Business Applications, Queensland University of Technology, Brisbane, Australia [18] Nielson, J (1996), “Response times: the three important limits” Neilson Norman Group Science Journal 2010, pp 34-55 [19] Opitz D and Maclin R (1999), “Popular Ensemble Methods: An Empirical Study” Journal of Artificial Intelligence Research Vol 11, pp 169–198 [20] Ouellet M (2010), “Recovering lost sales through an automated shopping cart abandonment strategy” Listrak Information & Technology Journal, pp 18-24 [21] Rajamma, R., Paswan, A., & Hossain, M (2009), “Why shoppers abandon shopping carts? Perceived waiting time, risk, and transaction inconvenience” Journal of Product & Brand Management, pp 188–197 [22] Rajini, G., & Krithika, M (2017), “Risk Factors Discriminating Online Metropolitan Women Shoppers: A Behavioural Analysis” International Journal of Cyber Behaviour, Psychology and Learning (IJCBPL), pp 52-64 [23] Ranganathan, C and Ganapathy, S (2002), “Key dimensions of business-tobusiness websites” Information and Management,Vol 39, pp 457-65 download by : skknchat@gmail.com 50 [24] Rausch, Theresa & Derra, Nicholas & Wolf, Lukas (2020), “Predicting online shopping cart abandonment with machine learning approaches” International Journal of Market Research [25] Rastegari, Hamid & Md Noor, Mohd (2008), “Data mining and e-commerce : methods, applications, and challenges” Islamic Azad University Annual Journal, pp 15-24 [26] Shahriari, Shahrzad & Shahriari, Mohammadreza & gheiji, Saeid (2015), “ECommerce And It Impacts On Global Trend And Market” International Journal of Research, pp 49-55 [27] Statista Research Team (2020), Available: https://www.statista.com/statistics/272391/us-retail-e-commerce-sales-forecast [28] Szymanski, D.M and Henard, D.H (2001), “Customer satisfaction: a metaanalysis of the empirical evidence” Journal of the Academy of Marketing Science Vol 29 No 1, pp 16-35 [29] Vafeiadis T, Diamantaras KI, Sarigiannidis G, et al (2015), “A comparison of machine learning techniques for customer churn prediction” Simulation Modelling Practice and Theory Vol 55, pp 1–9 [30] Williams N, Zander S and Armitage G (2006), “A preliminary performance comparison of five machine learning algorithms for practical IP traffic flow classification” ACM SIGCOMM Computer Communication Review Vol 36 No 5, pp 5–16 [31] Wolfinbarger, M and Gilly, M.C (2001), “Shopping online for freedom, control and fun” California Management Review, Vol 43 No 2, pp 34-55 [32] Wu, Lihua & Deng, Tian (2016), “Web Data Mining and Its Implication in Ecommerce” International Conference on Education, Management, Computer and Society [33] Zheng B and Liu B (2018), “A scalable purchase intention prediction system using extreme gradient boosting machines with browsing content entropy” International Conference on Consumer Electronics (ICCE) 2018 download by : skknchat@gmail.com ... thiệu giỏ hàng điện tử hành vi bỏ rơi giỏ hàng 1.3.1 Khái niệm giỏ hàng điện tử Giỏ hàng trang thương mại điện tử phần mềm có giao diện, hỗ trợ người dùng mua sắm sản phẩm dịch vụ Giỏ hàng điện tử. .. luận văn chia thành chương sau: CHƯƠNG - Tổng quan hành vi người dùng thương mại điện tử: Trình bày tổng quan thương mại điện tử tiềm khai thác liệu người dùng CHƯƠNG - Phân tích hành vi bỏ rơi giỏ. .. ? ?Nghiên cứu phân tích hành vi người dùng bỏ giỏ hàng trang thương mại điện tử? ?? ứng dụng khả khai thác phân tích liệu máy tính để dự đoán tỉ lệ bỏ rơi giỏ hàng trực tuyến Trên sở đó, hình thành khn