Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 65 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
65
Dung lượng
2,82 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TRƢƠNG THỊ MINH NGỌC TƢ VẤN TRONG THƢƠNG MẠI ĐIỆN TỬ DỰA TRÊN PHÂN TÍCH MẪU PHỔ BIẾN TỪ DỮ LIỆU NHẬT KÝ TRUY CẬP CỦA KHÁCH HÀNG LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN Hà Nội – 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TRƢƠNG THỊ MINH NGỌC TƢ VẤN TRONG THƢƠNG MẠI ĐIỆN TỬ DỰA TRÊN PHÂN TÍCH MẪU PHỔ BIẾN TỪ DỮ LIỆU NHẬT KÝ TRUY CẬP CỦA KHÁCH HÀNG Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60 48 01 04 LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: TS PHAN XUÂN HIẾU Hà Nội – 2015 LỜI CẢM ƠN Để quãng đường này, lời xin gửi lời biết ơn chân thành sâu sắc tới thầy Ts Phan Xuân Hiếu, người thầy, người anh vô nhiệt thành dẫn dắt, truyền nhiệt huyết cho toàn trình, giúp vững vàng trưởng thành đường nghiên cứu học tập Thời gian qua khoảng kỷ niệm sâu sắc với tôi, học tập tham gia nghiên cứu trường, phòng thí nghiệm công nghệ tri thức (KT Lab) Trung tâm Công nghệ tích hợp liên ngành Giám sát trường (FIMO) Xin gửi lời cảm ơn tới tất thầy cô bạn học sẵn sàng hỗ trợ giúp đỡ Tôi xin bày tỏ lòng biết ơn chân thành tới Thầy, Cô giáo anh chị bạn môn Hệ thống thông tin, Khoa Công nghệ thông tin, người nhiệt tình giúp mở rộng kiến thức Công nghệ thông tin nói chung Hệ thống thông tin nói riêng, kiến thức quý báu có ích với giai đoạn tương lai Tôi xin gửi lời cảm ơn chân thành tới Ban Giám hiệu Nhà trường, Phòng Đào tạo sau đại học, Đại học Công nghệ - Đại học Quốc gia Hà Nội tạo điều kiện tốt giúp suốt trình học tập Qua tất gửi đến gia đình thân yêu tình cảm mình, cảm ơn bố mẹ luôn tin tưởng, luôn chỗ dựa vững chắc, cảm ơn anh chị em dành điều kiện để giúp tập trung vào nghiên cứu Hà Nội, ngày 30 tháng 10 năm 2015 Học viên Trƣơng Thị Minh Ngọc LỜI CAM ĐOAN Tôi xin cam đoan nội dung trình bày luận văn tự nghiên cứu tìm hiểu dựa tài liệu trình bày theo ý hiểu thân dƣới hƣớng dẫn trực tiếp Thầy TS Phan Xuân Hiếu Các nội dung nghiên cứu, tìm hiểu kết thực nghiệm hoàn toàn trung thực Luận văn chƣa đƣợc công bố công trình Trong trình thực luận văn tham khảo đến tài liệu số tác giả, ghi rõ tên tài liệu, nguồn gốc tài liệu, tên tác giả liệt kê mục “DANH MỤC TÀI LIỆU THAM KHẢO” cuối luận văn Học viên Trƣơng Thị Minh Ngọc MỤC LỤC CHƢƠNG KHÁI QUÁT BÀI TOÁN TƢ VẤN SẢN PHẨM THƢƠNG MẠI 1.1 Tổng quan toán tƣ vấn thƣơng mại điện tử 1.2 Các hƣớng tiếp cận mô hình hệ gợi ý 12 1.3 Thách thức hệ gợi ý 13 1.4 Đánh giá ứng dụng hệ gợi ý 14 1.4.1 Đánh giá hệ gợi ý 14 1.4.2 Thiết kế ứng dụng cho hệ thống gợi ý thực 15 CHƢƠNG LÝ THUYẾT KHAI PHÁ MẪU PHỔ BIẾN VÀ LUẬT KẾT HỢP 16 2.1 Những định nghĩa chung toán tìm mẫu phổ biến luật kết hợp .16 2.2 Những hƣớng tiếp cận khai phá mẫu phổ biến, luật kết hợp 17 2.2.1 Những hƣớng tiếp cận luật kết hợp 17 2.2.2 Những thuật toán 21 2.3 Luật kết hợp hệ gợi ý 23 2.4 Thuật toán tìm kiếm tập phổ biến luật kết hợp 24 2.4.1 Thuật toán FP-Growth 24 2.4.2 Thuật toán FPClose 28 2.4.3 Thuật toán FIN .29 CHƢƠNG ỨNG DỤNG MẪU PHỔ BIẾN VÀ LUẬT KẾT HỢP ĐỂ GỢI Ý SẢN PHẨM TRONG THƢƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM 34 3.1 Bài toán gợi ý sản phẩm tìm kiếm mẫu phổ biến luật kết hợp .34 3.2 Gợi ý sản phẩm dựa mẫu phổ biến 36 3.3 Gợi ý sản phẩm dựa luật kết hợp 37 3.4 Mô tả liệu .38 3.5 Mô tả hệ thống gợi ý cho ngƣời dùng 40 CHƢƠNG THỰC NGHIỆM, PHÂN TÍCH VÀ ĐÁNH GIÁ 46 4.1 Kết chạy thuật toán tìm kiếm tập phổ biến .46 4.2 Kết gợi ý sản phẩm cho ngƣời dùng .51 CHƢƠNG KẾT LUẬN 57 5.1 Những vấn đề đƣợc giải luận văn 57 5.2 Hƣớng hay hƣớng áp dụng cho đề tài luận văn 58 CÁC CÔNG TRÌNH KHOA HỌC VÀ SẢN PHẨM ĐÃ CÔNG BỐ .59 TÀI LIỆU THAM KHẢO .60 DANH MỤC HÌNH VẼ Hình 3.1 Gợi ý Amazon 34 Hình 3.2 Phân bố liệu sản phẩm thu thập đƣợc 39 Hình 3.3 Ví dụ thông tin sản phẩm item 39 Hình 3.4 Ví dụ transaction – lƣợt truy cập ngƣời dùng .40 Hình 3.5 Quy trình giải toán 41 Hình 3.6 Mô hình bƣớc tiền xử lý 41 Hình 3.7 Mô hình bƣớc tìm mẫu phổ biến luật kết hợp 42 Hình 3.8 Định dạng tập phổ biến tìm đƣợc 43 Hình 3.9 Định dạng luật kết hợp tìm đƣợc 43 Hình 3.10 Định dạng đầu tập phổ biến đƣợc đánh mục 43 Hình 3.11 Định dạng đầu phần Y luật đƣợc đánh mục 44 Hình 3.12 Mô hình bƣớc gợi ý cho ngƣời dùng 44 Hình 4.1 So sánh thời gian chạy thuật toán 46 Hình 4.2 Thống kê thời gian trung bình chạy thuật toán 46 Hình 4.3 So sánh nhớ tối đa sử dụng 47 Hình 4.4 Thống kê nhớ tối đa sử dụng thuật toán .47 Hình 4.5 Thống kê số tập phổ biến tìm đƣợc 47 Hình 4.6 Giao diện gợi ý cho ngƣời dùng .53 Hình 4.7 Gợi ý cho ngƣời dùng theo sản phẩm mẹ bé 54 Hình 4.8 Gợi ý cho mặt hàng phụ kiện công nghệ 55 Hình 4.9 Gợi ý cho mặt hàng đồ gia dụng 55 Hình 4.10 Gợi ý cho mặt hàng đồng hồ 56 DANH MỤC TỪ VIẾT TẮT Từ viết tắt CSDL (DB) RS AR FP Giải nghĩa Cơ sở liệu (database) Recommender system Association rule Frequent pattern DANH MỤC TỪ KHÓA Từ khóa Recommender system Association rule Frequent pattern Ngữ nghĩa Hệ gợi ý Luật kết hợp Mẫu phổ biến MỞ ĐẦU Những tác giả đầu ngành mở đầu cho toán tìm mẫu phổ biến [1] từ năm 1993 Jiawei Han Charu C Aggarwal tổng hợp vấn đề hƣớng tiếp cận, phƣơng pháp thuật toán, dành cho nhiều loại liệu nhiều công trình nghiên cứu “Frequent pattern mining” [2] xuất năm 2014 Cho thấy sức hấp dẫn đề tài xong suốt 20 năm qua Ứng dụng cho toán maketing tìm kiếm mẫu phổ biến tập liệu mua hàng khách, tìm sản phẩm hay đƣợc mua nhất, hay gợi ý xem sản phẩm xem sản phẩm Thử đặt giả thiết nhƣ ngƣời xem nhấp chuột tìm kiếm xem sản phẩm thời trang nhƣ „đầm xòe nơ‟ mà họ quan tâm website, website gợi ý „đầm kim sa nhũ‟ hoặc/và „đầm dự tiệc sang trọng‟ hoặc/và „giầy cao gót dây lịch‟ hoặc/và „ví xách trang nhã‟ với giải thích sản phẩm thƣờng đƣợc nhiều ngƣời dùng khác xem với nhiều lần, nhận thấy ngữ cảnh xem hàng ngƣời dùng muốn tìm kiếm trang phục dự tiệc, gợi ý sản phẩm đồng theo loại sản phẩm phù hợp, gợi đƣợc nhiều liên quan sản phẩm không tính đến chúng thuộc chủng loại, nội dung Đặc biệt gợi ý thƣơng mại điện tử Việt Nam, lý để chọn hƣớng tiếp cận tìm tập phổ biến phụ thuộc vào tập liệu thu thập đƣợc từ khách hàng Dữ liệu mà luận văn thu thập đƣợc từ website thƣơng mại Việt Nam, với số lƣợng mặt hàng lên tới 238.000 sản phẩm chủ yếu mặt hàng thời trang, gia dụng, thực phẩm, phụ kiện công nghệ … Hƣớng tiếp cận cũ nhƣ hƣớng lọc nội dung (content-based) dù có kết tốt nhƣng không đủ tinh tế để hiểu ngƣời dùng, thƣờng gợi ý đƣợc nhiều sản phẩm số lƣợng sản phẩm liên quan với lớn, mà theo tâm lý ngƣời dùng việc gợi ý nhiều không gây đƣợc kết tốt [3], xem xét gợi ý phù hợp thú vị cho ngƣời dùng vấn đề cần nghiên cứu Những công trình đƣợc nghiên cứu cho hệ gợi ý có nhiều bƣớc tiến vƣợt trội, nhiều phƣơng pháp mang lại hiệu cao xu hƣớng nhƣ hƣớng lọc cộng tác (collaborative filtering) dựa vào cộng đồng ngƣời dùng sử dụng liệu đánh giá (rating) họ sản phẩm Nhƣng quay trở áp dụng cho ngƣời dùng Việt Nam với sản phẩm thƣơng mại khó khăn việc thu thập liệu, lý ngƣời dùng Việt Nam thƣờng có thói quen đánh giá (rating) hay bình luận (comment) sản phẩm, kết thực tế thu thập liệu đƣợc từ website thƣơng mại mà luận văn làm thực nghiệm Hơn hành vi chủ yếu ngƣời dùng tìm kiếm thông tin sản phẩm, hành vi mua trực tuyến dẫn đến khó khăn thu thập khai phá liệu kiểu hành vi này, theo khảo sát Google vào năm 2015 [4] số 73% ngƣời dùng xem hàng có 17% định mua hàng trực tuyến lại thực mua bán ngoại tuyến Ngoài theo trang alexa.com1 trang chuyên thống kê website khắp giới mức độ ngƣời truy cập, số lƣợng tìm kiếm, đánh giá năm 2015 thống kê website thƣơng mại điện tử đứng đầu Việt Nam nhƣ vatgia.com, 5giay.vn, lazada.vn, chotot.vn…có đánh giá rating cho sản phẩm đƣợc mua dùng ngƣời dùng Với hƣớng tìm kiếm tập phổ biến để gợi ý, luận văn có tham khảo trang web thƣơng mại điện tử thành công giới Amazon2 (theo alexa3), dựa tìm luật kết hợp xếp chúng theo độ tin cậy, tìm biến thể khác nhƣ đo độ không thích quan hệ ngƣời dùng Điều tùy thuộc vào liệu lấy đƣợc, hay không thu đƣợc mức độ xem quan tâm từ rating, hành vi phản hồi ẩn khách hàng, liệu thu thập đƣợc website làm thực nghiệm Với hƣớng ứng dụng tập phổ biến luật kết hợp vào toán gợi ý sản phẩm thƣơng mại, luận văn tìm hiểu nghiên cứu vấn đề liên quan đến khâu xây dựng ứng dụng nhƣ xác định đối tƣợng gợi ý, đối tƣợng liệu thu thập đƣợc từ nhật ký phiên truy cập ngƣời dùng trang thƣơng mại điện tử Việt Nam; khảo sát phƣơng pháp để khai phá mẫu phổ biến luật kết hợp, tìm hiểu vấn đề độ đo, chọn ngƣỡng, khó khăn thách thức triển khai; đến vấn đề đánh giá liệu, chất lƣợng tập phổ biến luật kết hợp, hiển thị gợi ý,… Luận văn tập trung giải khâu thực nghiệm, nhận định vấn đề khó khăn gặp phải nhƣ vấn đề nhớ sử dụng, thời gian chạy, phân hoạch liệu gốc, đánh mục ngƣợc cho tập phổ biến tập luật tìm đƣợc, đƣa gợi ý cho cá nhân ngƣời dùng, đƣa giải thích cho gợi ý Sau tìm phƣơng hƣớng giải quyết, rút học kinh nghiệm có đƣợc Hy vọng từ việc khai thác liệu thực tế áp dụng phƣơng pháp kỹ thuật đƣợc công bố nhà nghiên cứu uy tín toàn giới đƣa lại kết có ý nghĩa, đóng góp phần để triển khai ứng dụng thƣơng mại điện tử Việt Nam nói riêng ứng dụng công nghệ thông tin vào đời sống nói chung Luận văn chia nội dung làm năm chƣơng chính: Chƣơng 1: Khái quát toán tƣ vấn sản phẩm thƣơng mại Ở chƣơng mở đầu nêu tổng quan toán gợi ý, hƣớng tiếp cận, phƣơng pháp giải quyết, thách thức đánh giá ứng dụng, đặc biệt cho thƣơng mại điện tử Chƣơng 2: Lý thuyết mẫu phổ biến luật kết hợp Có nội dung nêu định nghĩa chung toán tìm kiếm tập phổ biến, hƣớng tiếp cận, http://www.alexa.com/topsites/countries/VN www.amazon.com http://www.alexa.com/topsites/category/Top/Shopping ứng dụng phƣơng pháp khai phá tập phổ biến luật kết hợp vào toán gợi ý thƣơng mại Trong nêu chi tiết thuật toán đƣợc áp dụng luận văn Chƣơng 3: Ứng dụng khai phá mẫu phổ biến để gợi ý sản phẩm đƣợc xem thƣơng mại điện tử Việt Nam Chƣơng chƣơng luận văn phát biểu toán cụ thể mà luận văn cần giải quyết, sau đƣa mô hình giải toán Chƣơng 4: Thực nghiệm đánh giá Đây phần nêu lên kết đạt đƣợc suốt trình thực hiện, đề cập đến khó khăn vấn đề vƣớng mắc phát sinh Sau đánh giá kết đạt đƣợc chi tiết bƣớc thực Chƣơng 5: Kết luận Tổng kết lại nội dung luận văn, đƣa hƣớng hƣớng áp dụng thực tế Tiếp theo nêu vài ví dụ tiêu biểu cho tập phổ biến tập luật thu đƣợc chủng loại mặt hàng Ví dụ với mặt hàng thời trang nữ Luật kết hợp tìm đƣợc 622616 ==> 120220 #SUP: 238 #CONF: 0.48081 #LIFT: 118.92281 #HM: 0.00245 #COS: 0.2648 #CONV: 1.91828 Bikini biển họa tiết ==> Đồ bơi short hoa trắng 607202 ==> 599206 #SUP: 507 #CONF: 0.8099 #LIFT: 80.10887 #HM: 0.0031 #COS: 0.3172 #CONV: 5.20732 Đầm Thu Thảo Hoa Vai MD1712 ==> Đầm HH Thu Thảo D10014NM Luật thứ hai thể xem sản phẩm „Đầm Thu Thảo Hoa Vai MD1712‟ sản phẩm „Đầm HH Thu Thảo D10014NM‟ đƣợc xem với độ hỗ trợ 507 lần, độ tin cậy 0.8099, có nghĩa số lần hai sản phẩm đƣợc xem với 507 lần, 81% xem sản phẩm đầu xem sản phẩm thứ hai Độ đo thú vị lift 80, có nghĩa độ tƣơng quan thuận lớn Độ đo HM 0.0031hệ số hài hòa hai độ đo support confidence Độ đo cosine 0.3172 dùng thay lift Độ đo conviction 1.918 Tƣơng tự với luật khác Tập phổ biến tìm đƣợc 58831 529749 #SUP: 104 Áo Sơ mi pha ren hồng Full size ÁO THUN NỮ Ý VY -AT.0565 525969 525997 589878 #SUP: 26 A42 ÁO SƠ MI VIỀN MÀU BE A70 ÁO SƠ MI CỔ TRỤ TAY PHỒNG Áo vest nẹp báo -508959 598058 #SUP: 628 Đầm Kim Sa Nhũ Ánh Kim Nâu ĐẦM VOAN CỔ ĐỖ Tập phổ biến thứ hai đƣợc mô tả tập sản phẩm „A42 ÁO SƠ MI VIỀN MÀU BE‟, „A70 ÁO SƠ MI CỔ TRỤ TAY PHỒNG‟ „Áo vest nẹp báo‟ đƣợc xem 26 lần Đây chủng loại có số lƣợng mặt hàng lớn, lƣợng xem CSDL nhiều chiếm khoảng 3/5 số lƣợng transaction, tập phổ biến luật tìm đƣợc trung bình có độ hỗ trợ lên tới 100 lƣợt xem nhau, có sản phẩm đƣợc xem tới 600 lần với độ tin cậy lên tới 90%, thƣờng mặt hàng quần áo đƣợc xem có đồng loại, kiểu dáng, mẫu thời trang Nhờ có số độ tin 49 cậy cho thấy mức liên quan sản phẩm cao so với việc đƣa sản phẩm đồng loại dựa nội dung Ví dụ nhƣ với mặt hàng đồng hồ Luật tìm đƣợc: 506020 ==>504651 506005 506006 506009 506010 506013 506014 506015 506016 506026 506172 #SUP: 23 #CONF: 0.92 Đồng Hồ Để Bàn - Hoa Đào Xuân ==> Tranh Đồng Hồ - Thuận Bƣờm Xuôi Gió Tranh Đồng Hồ - HL13605 Tranh Đồng Hồ - BB1308 Tranh Đồng Hồ SueMall - HL13604 Tranh Đồng Hồ - DV121551 Tranh Đồng Hồ - DV12145 Đồng Hồ Để Bàn - Hoa Sứ Đỏ Tranh Đồng Hồ SueMall - BB1309 Đồng Hồ Để Bàn - Hoa Đồng Tiền Đồng Hồ Để Bàn - Hoa Tím Tinh Khiết Tranh Đồng Hồ - NT13903 Tập phổ biến tìm đƣợc 506009 506010 506011 506014 506015 506016 506024 506026 506172 #SUP: 21 Tranh Đồng Hồ SueMall - HL13604 Tranh Đồng Hồ - DV121551 Tranh Đồng Hồ - DV12152 Đồng Hồ Để Bàn - Hoa Sứ Đỏ Tranh Đồng Hồ SueMall - BB1309 Đồng Hồ Để Bàn - Hoa Đồng Tiền Đồng Hồ Để Bàn - Hoa Lan Đất Đồng Hồ Để Bàn - Hoa Tím Tinh Khiết Tranh Đồng Hồ - NT13903 575601 663361 #SUP: 36 Đồng hồ đeo tay ROLEX ZR 12 cực sành điệu 2014 ! Đồng hồ Oriando nam tính - 998 Mặt hàng đồng hồ đƣợc ngƣời xem nhiều lúc, nhƣ tập mẫu phổ biến tìm đƣợc loại mặt hàng thƣờng dài, trung bình khoảng sản phẩm lần xem, sản phẩm đƣợc xem có độ tƣơng tự nội dung Ví dụ cho mặt hàng mẹ bé Tập luật tìm đƣợc: 371359 493489 ==> 371377 #SUP: 27 #CONF: 0.72973 Combo đồ sọc ngang cho mẹ bé Combo đầm đôi xinh cho mẹ bé ==> Combo bộáo+váysọc cho mẹ bé -567170 ==> 629176 #SUP: 50 #CONF: 0.20243 Đầm công sở Bà bầu Thanh lịch MH ==> Đầm bầu thun phối tay voan 50 Tập phổ biến: 371359 371377 493489 #SUP: 27 Combo đồ sọc ngang cho mẹ bé Combo bộáo+váysọc cho mẹ bé Combo đầm đôi xinh cho mẹ bé Ví dụ cho mặt hàng phụ kiện công nghệ 344044 357400 ==> 378377 #SUP: #CONF: DÂY CÁP KẾT NỐI OTG Đầu Chia Âm Thanh ==> Chân Máy Điện Thoại Mobile Holder - Giá 90.000 621658 665062 ==> 569719 #SUP: #CONF: 0.57143 Pin dự phòng SONY 10000mah cực đẹp Vip Mua tặng 1.PIN DỰ PHÕNG POWERBANK 20000mAh có đèn pin ==> Pin dự phòng POWER BANK 20.000mAh Tập phổ biến: 569719 621658 #SUP: 31 Pin dự phòng POWER BANK 20.000mAh Pin dự phòng SONY 10000mah cực đẹp Vip 383251 203803 #SUP: 12 Headphone Beat Nhét Tai CÓ MÍC TAI NGHE ZIN IPHONE Mặt hàng phụ kiện công nghệ tƣơng đối tập liệu transaction số mặt hàng không nhiều khoảng 5000 sản phẩm, số lần xem dòng sản phẩm không lớn, hƣớng giải chia liệu sử dụng độ hỗ trợ cho dòng hàng lần Vấn đề đƣợc đề cập có thực nghiệm, nhiên trình thực nghiệm nhận thấy việc „chẻ dọc‟ liệu làm tính quan hệ với chủng loại mặt hàng khác Đối với liệu vào thực tế lớn nhiều xem xét đến phƣơng pháp Từ liệu nhận thấy loại hàng đƣợc xem nhiều, nhận định đối tƣợng ngƣời dùng phần lớn phụ nữ họ quan tâm nhiều đến lĩnh vực thời trang, phụ kiện thời trang, số lƣợt xem transaction cho dòng hàng liên quan đến thời trang lên tới 10 lần, cho mặt hàng đồng hồ lên tới 16 lần Việc sử dụng luật kết hợp để tìm kiếm tập luật mang lại nhiều ý nghĩa, đặc biệt với hành vi xem sản phẩm ngƣời dùng thƣờng có xu hƣớng xem sản phẩm tƣơng tự để đƣa định 4.2 Kết gợi ý sản phẩm cho ngƣời dùng Sau đánh số tập phổ biến luật, việc gợi ý cho ngƣời dùng dễ dàng hơn, ví dụ muốn gợi ý cho ngƣời dùng số sản phẩm tƣơng tự nhƣ sản phẩm họ xem, tập phổ biến tìm đƣợc đƣợc định dạng nhƣ sau: 156954=[156954 139338 #SUP: 10, 51 139332 156954 #SUP: 16, 139358 156954 #SUP: 17, 525994 156954 #SUP: 10, 229376 156954 #SUP: 13, 266908 156954 #SUP: 17, 525997 156954 #SUP: 26, 530845 156954 #SUP: 10, 286236 156954 #SUP: 18, 540917 156954 #SUP: 22, 559420 156954 #SUP: 13, 525969 156954 #SUP: 31, 250020 156954 #SUP: 11, 397893 156954 #SUP: 33] Áo sơ mi chiffon cổ đính ngọc trai= Áo sơ mi chiffon cổ đính ngọc trai, Áo sơ mi Double Layer Collar, #SUP: 10.0; Áo sơ mi Hoa hồng, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 16.0; Áo sơ mi đính ngọc trai, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 17.0; A105 ÁO SƠ MI CỔ BẺ, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 10.0; ÁO SƠ MI HOẠ TIẾT BÔnG SÕ, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 13.0; ÁO SƠ MI ĐỎ ĐÍNH NÖT THỜI TRANG, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 17.0; A70 ÁO SƠ MI CỔ TRỤ TAY PHỒNG, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 26.0; Áo voan đính nơ vai 0113, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 10.0; ÁO SƠ MI REN NGẮN TAY THỜI TRANG, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 18.0; Áo sơ mi Caro tay dài phong cách - MSP 71, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 22.0; Áo voan ren tay phối nút cổ, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 13.0; A42 ÁO SƠ MI VIỀN MÀU BE, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 31.0; Áo vai nơ tay cánh tiên, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 11.0; ÁO CHẤM BI TAY DÀI CÁCH ĐIỆU, Áo sơ mi chiffon cổ đính ngọc trai, #SUP: 33.0; Những tập luật tìm đƣợc đƣợc định dạng nhƣ sau: 156954=[139332 #SUP: 16 #CONF: 0.06531 #LIFT: 94.48509 #HM: 0.0012 #COS: 0.0612 #CONV: 1.06913, 139338 #SUP: 10 #CONF: 0.04082 #LIFT: 104.94164 #HM: 0.0012 #COS: 0.05099 #CONV: 1.04215, 139358 #SUP: 17 #CONF: 0.06939 #LIFT: 91.83253 #HM: 0.0012 #COS: 0.06219 #CONV: 1.07375, 229376 #SUP: 13 #CONF: 0.05306 #LIFT: 26.21614 #HM: 0.0012 #COS: 0.02906 #CONV: 1.0539, 250020 #SUP: 11 #CONF: 0.0449 #LIFT: 5.50362 #HM: 0.0012 #COS: 0.01225 #CONV: 1.03847, 266908 #SUP: 17 #CONF: 0.06939 #LIFT: 30.64434 #HM: 0.0012 #COS: 0.03592 #CONV: 1.07213, 286236 #SUP: 18 #CONF: 0.07347 #LIFT: 17.50679 #HM: 0.0012 #COS: 0.02794 #CONV: 1.07477, 397893 #SUP: 33 #CONF: 0.13469 #LIFT: 16.29804 #HM: 0.00121 #COS: 0.0365 #CONV: 1.14611, 525969 #SUP: 31 #CONF: 0.12653 #LIFT: 15.61929 #HM: 0.00121 #COS: 0.03463 #CONV: 1.13559, 525994 #SUP: 10 #CONF: 0.04082 #LIFT: 36.21063 #HM: 0.0012 #COS: 0.02995 #CONV: 1.04138, 525997 #SUP: 26 #CONF: 0.10612 #LIFT: 32.06375 #HM: 0.00121 #COS: 0.04545 #CONV: 1.11502, 530845 #SUP: 10 #CONF: 0.04082 #LIFT: 9.76635 #HM: 0.0012 #COS: 0.01555 #CONV: 1.0382, 540917 #SUP: 22 #CONF: 0.0898 #LIFT: 15.61018 #HM: 0.00121 #COS: 0.02917 #CONV: 1.09233, 559420 #SUP: 13 #CONF: 0.05306 #LIFT: 7.3654 #HM: 0.0012 #COS: 0.0154 #CONV: 1.04843] Áo sơ mi chiffon cổ đính ngọc trai= Áo sơ mi Hoa hồng,; Áo sơ mi Double Layer Collar,; Áo sơ mi đính ngọc trai,; ÁO SƠ MI HOẠ TIẾT BÔnG SÕ,; Áo vai nơ tay cánh tiên,; ÁO SƠ MI ĐỎ ĐÍNH NÖT THỜI TRANG,; 52 ÁO SƠ MI REN NGẮN TAY THỜI TRANG,; ÁO CHẤM BI TAY DÀI CÁCH ĐIỆU,; A42 ÁO SƠ MI VIỀN MÀU BE,; A105 ÁO SƠ MI CỔ BẺ,; A70 ÁO SƠ MI CỔ TRỤ TAY PHỒNG,; Áo voan đính nơ vai 0113,; Áo sơ mi Caro tay dài phong cách - MSP 71,; Áo voan ren tay phối nút cổ,; Sử dụng cách đƣợc nêu 3.2 3.3 để chọn tập phổ biến luật kết hợp số để đƣa gợi ý cho ngƣời dùng thông qua giao diện web mô việc gợi ý cho ngƣời dùng nhƣ hình 4.6 4.7 Hình 4.6 Giao diện gợi ý cho ngƣời dùng 53 Hình 4.7 Gợi ý cho ngƣời dùng theo sản phẩm mẹ bé Ví dụ khác thời trang nữ, ngƣời xem nhấp chuột sản phẩm „Đầm Kim Sa Nhũ Ánh Kim Nâu’ hệ thống liệt kê hàng loạt tập phổ biến có chứa sản phẩm Đầm Kim Sa Nhũ Ánh Kim Nâu Set Chân váy Vintage áo voan hoa bật 508959 634507 #SUP: 228 Đầm Kim Sa Nhũ Ánh Kim Nâu Đầm Kim Sa Nhũ Ánh Kim Xanh 508959 662544 #SUP: 796 Đầm Kim Sa Nhũ Ánh Kim Nâu Đầm Xòe Poly : 13023100 508959 282185 #SUP: 240 Đầm Kim Sa Nhũ Ánh Kim Nâu ĐẦM LIỀN VOAN TRẮNG HỒNG 508959 598361 #SUP: 362 Đầm Kim Sa Nhũ Ánh Kim Nâu Đầm Công Sở 508959 533035 #SUP: 336 Những luật có vế trái X sản phẩm xem 508959 ==> 621656 #SUP: 735 #CONF: 0.10165 Đầm Kim Sa Nhũ Ánh Kim Nâu ==> Đầm Họa tiết bƣớm -508959 607202 ==> 599206 #SUP: 86 #CONF: 0.86 Đầm Kim Sa Nhũ Ánh Kim Nâu Đầm Thu Thảo Hoa Vai MD1712 ==> Đầm HH Thu Thảo D10014NM Dựa vào độ hỗ trợ liệt kê sản phẩm hay đƣợc xem với độ hỗ trợ giảm dần „Đầm Kim Sa Nhũ Ánh Kim Xanh’, „ĐẦM LIỀN VOAN TRẮNG HỒNG‟, 54 Ví dụ gợi ý thời trang cho thấy đƣợc liên quan sản phẩm, việc thể độ đo hỗ trợ số lần đƣợc xem cho thấy đƣợc chất lƣợng gợi ý, ngƣời dùng có sở đƣa định xem Sau trình bầy số ví dụ gợi ý cho mặt hàng khác Đƣợc đƣa gợi ý tiếp: Hình 4.8 Gợi ý cho mặt hàng phụ kiện công nghệ đƣợc gợi ý: Hình 4.9 Gợi ý cho mặt hàng đồ gia dụng 55 gợi ý tiếp: Hình 4.10 Gợi ý cho mặt hàng đồng hồ 56 CHƢƠNG KẾT LUẬN 5.1 Những vấn đề đƣợc giải luận văn Trong trình tìm hiểu để đƣa cách giải cho toán ứng dụng Luận văn nêu lại mảng kiến thức tổng quan toán lớn hệ gợi ý, hƣớng tiếp cận, phƣơng pháp giải quyết, ứng dụng đánh giá… Với hƣớng sử dụng luật kết hợp cho toán gợi ý, luận văn đề cập đến vấn đề liên quan đến tập phổ biến luật kết hợp Từ đƣa phƣơng pháp lý áp dụng cho toán luận văn Cụ thể là: Tư vấn thương mại điện tử dựa nhật ký truy cập khách hàng khai phá mẫu phổ biến luật kết hợp Bài toán nhận định rõ đầu đầu vào phƣơng pháp thực Áp dụng cho ngữ cảnh ngƣời dùng xem sản phẩm thƣơng mại điện tử website, hệ thống đƣa gợi ý cho riêng ngƣời dùng với tùy biến cá nhân Với hƣớng gợi ý gồm hai hƣớng nhỏ: 1) gợi ý nhóm sản phẩm hay đƣợc xem sản phẩm ngƣời dùng xem nhiều lần (frequent viewed together) 2) xem sản phẩm xem sản phẩm nhiều lần (viewed this also viewed that) Chính sử dụng thuật toán khai phá tập phổ biến luật kết hợp Cũng từ đặc điểm liệu thu đƣợc mà luận văn định áp dụng hƣớng khai phá luật kết hợp, thay hƣớng hiệu đƣợc nghiên cứu áp dụng năm gần lọc cộng tác (collaborative filtering) không thu thập đƣợc liệu cần thực tế website thƣơng mại Việt Nam; hay hƣớng đƣợc sử dụng nhiều từ trƣớc tới gợi ý theo lọc nội dung (content-based) với số lƣợng gợi ý đƣa nhiều Luận văn có phần để trình bày nghiên cứu đƣa lựa chọn thuật toán tìm tập phổ biến luật kết hợp Bằng việc sử dụng thuật toán đƣợc công bố từ trƣớc đến nay, thông qua thực nghiệm trực tiếp liệu luận văn chọn thuật toán phù hợp dựa theo hai tiêu chí thời gian chạy nhớ sử dụng Kết chạy thực nghiệm chứng minh đƣợc nhận định trƣớc đó, cho thuật toán hiệu thuật toán kia, kết minh chứng tính khoa học lựa chọn sử dụng phƣơng pháp Tuy thực nghiệm dừng lại bƣớc ngoại tuyến offline, chƣa có điều kiện áp dụng bƣớc khảo sát nhóm ngƣời dùng đánh giá môi trƣờng thực tế Nhƣng kết mang lại có ý nghĩa định tính khả thi áp dụng triển khai phƣơng pháp dùng luật kết hợp Từ kết chạy từ thuật toán cho thấy phần nhu cầu thói quen ngƣời dùng xem sản phẩm trang thƣơng mại điện tử Có thể giúp hiểu ý định hành vi ngƣời dùng trực tuyến đầu vào cho toán xác định ý định ngƣời dùng Toàn quy trình giải toán gợi ý đƣa luận văn có sử dụng tham khảo hệ thống lớn triển khai thƣơng mại điện tử đƣợc nêu phần 3.2 Những bƣớc thực nghiệm dựa mô hình để triển khai Quá trình xây 57 dựng thực nghiệm trình thử nghiệm so sánh, đúc rút đƣợc nhiều học cách tƣ duy, giải vấn đề đƣợc đặt giải toán 5.2 Hƣớng hay hƣớng áp dụng cho đề tài luận văn Luận văn thực nghiệm liệu thực thu thập đƣợc website thƣơng mại điện tử Việt Nam, có sử dụng phƣơng pháp tìm kiếm luật kết hợp đƣợc công bố nhà nghiên cứu đầu lĩnh vực nghiên cứu này, đƣợc kiểm nghiệm kết công bố qua nhiều liệu, báo hay ứng dụng, việc áp dụng Việt Nam mẻ tiềm Ngoài yếu tố ứng dụng, kết luận văn mong đóng góp vào vấn đề gần toán thƣơng mại hiểu yếu tố ngƣời dùng Trả lời câu hỏi phân tích để hiểu thói quen ngƣời dùng: ngƣời dùng thƣờng có hành vi nhƣ duyệt web, thƣờng xem sản phẩm, lƣợng quan tâm? Họ có hài lòng với sản phẩm gợi ý đƣa định sử dụng mua sản phẩm không? Xem nhiều nghĩa quan tâm đặc biệt hay không hài lòng với sản phẩm đƣợc gợi ý cố tìm kiếm phù hợp hơn? Chiến lƣợc chọn lựa tốt? Về vấn đề quan trọng thực tế ứng dụng nhƣng chƣa đƣợc giải luận văn mở rộng liệu, liệu transaction item đƣợc cập nhật thêm mới, hƣớng tiếp tới nghiên cứu ứng dụng giải thuật có khả thực thi nhanh hiệu Góp phần nâng cao hiệu suất hệ gợi ý Dữ liệu sử dụng luận văn dừng lại hành vi xem, để xác định thêm hành vi có tính thƣơng mại cao nhƣ mua, thuê, chuyển nhƣợng, chia sẻ… cần kết hợp nhiều nghiên cứu ngƣời dùng chuyên sâu Học viên tham gia triển khai hƣớng nghiên cứu có báo nghiên cứu [55] Hƣớng kết hợp thu thập liệu dạng hành vi mua trang thƣơng mại điện tử, tìm kiếm mẫu phổ biến đƣa gợi ý xác định ngƣời dùng có ý định mua thông qua mạng xã hội hay comment họ, thay cần liệu ngƣời dùng khứ Đây dạng gợi ý cổng thông tin liên kết website mua bán, mạng xã hội, hay cộng đồng số Ngoài để gợi ý tốt cho nhóm ngƣời dùng hay liệu mới, áp dụng hệ gợi ý đƣợc xây dựng luận văn kết hợp với hƣớng tiếp cận khác nhƣ lai với lọc nội dung lọc cộng tác, giúp tận dụng đƣợc ƣu điểm loại tiếp cận Hy vọng vấn đề đƣợc đề cập luận văn từ lớn đến nhỏ, từ cách tiếp cận cho toán gợi ý đến vƣớng mắc giải bƣớc thực hiện, giúp phần đƣa cách giải quyết, cách tƣ toán thực tế nói chung toán gợi ý nói riêng, góp phần chứng minh đƣợc tính khả thi hƣớng gợi ý luật kết hợp cho thƣơng mại điện tử Việt Nam 58 CÁC CÔNG TRÌNH KHOA HỌC VÀ SẢN PHẨM ĐÃ CÔNG BỐ [55] T Luong, T Tran, Q Truong, T Truong, T Phi, and X Phan, “Learning to Filter User Explicit Intents in Online Vietnamese Social Media Texts.” ACIIDS, 2016 59 TÀI LIỆU THAM KHẢO [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] R Agrawal, T Imieliński, and A Swami, “Mining association rules between sets of items in large databases,” ACM SIGMOD Record, vol 22, no pp 207– 216, 1993 J H Charu C Aggarwal, “Frequently partern mining.” Springer, New York, 2014 M G D Bollen, BP Knijnenburg, MC Willemsen, “Understanding choice overload in recommender systems.” RecSys ‟10, pp 63–70, 2010 “The consumer barometer survey 2015.” Google, 2015 J Leskovec, R Anand, and J Ullman, “Recommendation Systems,” Mining of Massive Datasets pp 305–339, 2011 F Ricci, L Rokach, B Shapira, and P B Kantor, “Recommender Systems Handbook.” Springer, New York, pp 27–46, 2011 J L Herlocker, J a Konstan, L G Terveen, and J T Riedl, “Evaluating collaborative filtering recommender systems,” ACM Transactions on Information Systems (TOIS), vol 22, no pp 5–53, 2004 J J Sandvig, B Mobasher, and R Burke, “Robustness of collaborative recommendation based on association rule mining,” RecSys ’07 Proc 2007 ACM Conf Recomm Syst., no October 2015, pp 105–112, 2007 B Joseph, P Ii, D Peppers, M Rogers, and N M Tichy, “Do you want to keep your customers forever,” HarvardBusinessReview, no June, 2012 “Báo cáo thƣơng mại điện tử Việt Nam 2014,” Cục Thương mại điện tử Công nghệ thông tin - Bộ Công Thương, p 53, 2014 N Tintarev and J Masthoff., “Effective explanations of recommendations: usercentered design.” Proceedings of the 2007 ACM conference on Recommender systems, pp 153–156, 2007 P Pu and L Chen, “Trust Building with Explanation Interfaces,” Proc 11th Int Conf Intell user interfaces - IUI ’06, pp 93–100, 2006 L Chen and P Pu, “A cross-cultural user evaluation of product recommender interfaces,” Proc 2008 ACM Conf Recomm Syst - RecSys ’08, p 75, 2008 P Melville and V Sindhwani, “Recommender Systems,” Encyclopedia of Machine Learning, vol pp 1–21, 2010 T Di Noia, R Mirizzi, V C Ostuni, D Romito, and M Zanker, “Linked open data to support content-based recommender systems,” Proc 8th Int Conf Semant Syst - I-SEMANTICS ’12, no December 2015, p 1, 2012 G Adomavicius and a Tuzhilin, “Toward the Next Generation of Recommender Systems: a Survey of the State of the Art and Possible Extensions,” IEEE Trans Knowl Data Eng., vol 17, no 6, pp 734–749, 2005 A M Rashid, I Albert, D Cosley, S K Lam, S M McNee, J a Konstan, and J Riedl, “Getting to Know You: Learning New User Preferences in 60 [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] Recommender Systems,” Int Conf Intell User Interfaces, IUI 2002, pp 127– 134, 2002 Y Hijikata, “Offline Evaluation for Recommender Systems.” Journal of the Japanese Society for Artificial Intelligence, p Vol 29, No 6, pp 658–689, 2014 K Garg and D Kumar, “Comparing the Performance of Frequent Pattern Mining Algorithms,” Int J Comput Appl., vol 69, no 25, pp 21–28, 2013 A M Said, P D D Dominic, and A B Abdullah, “A comparative study of FPgrowth variations,” International Journal of Computer Science and Network Security, vol 9, no pp 266–272, 2009 P J Azevedo and A M Jorge, “Comparing Rule Measures for Predictive Association Rules,” Ecml, vol 4701, pp 510–517, 2007 A Geyer-schulz and M Hahsler, “Evaluation of Recommender Algorithms for an Internet Information Broker based on Simple Association Rules and on the Repeat-Buying Theory,” In Pract., no July, pp 100–114, 2002 M J Zaki and C Hsiao, “CHARM: An efficient algorithm for closed association rule mining,” 2nd SIAM International Conf on Data Mining pp 457–473, 1999 T Burdick, D., Calimlim, M., Flannick, J., Gehrke, J., & Yiu, “Mafia: a maximal frequent itemset algorithm.” IEEE TKDE Journal, 17(11), pp 1490– 1504., 2005 B Liu, W Hsu, and Y Ma, “Mining Association Rules with Multiple,” Kdd-99 pp 337–341, 1999 J Han, “Data Mining : Concepts and Techniques,” Lect Notes Comput Sci Dep Univ Illinois Urbana-Champaign, 2014 J Han, H Cheng, D Xin, and X Yan, “Frequent pattern mining: current status and future directions,” Data Mining and Knowledge Discovery, vol 15 pp 55– 86, 2007 W Wang, J Yang, and P S Yu, “Efficient mining of weighted association rules (WAR),” Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining - KDD ’00 pp 270–274, 2000 G Grahne and J Zhu, “Fast algorithms for frequent itemset mining using FPtrees,” IEEE Trans Knowl Data Eng., vol 17, no 10, pp 1347–1362, 2005 G Liu, H Lu, J Yu, W Wang, and X Xiao, “AFOPT: An Efficient Implementation of Pattern Growth Approach.,” Fimi 2003 B Goethals and M Zaki, “Workshop on frequent itemset mining implementations,” Data Min Work Freq Itemset Min., 2003 J Li, X Zhang, G Dong, K Ramamohanarao, and Q Sun, “Efficient Mining of High Confidence Association Rules without Support Thresholds,” Principles of Data Mining and Knowledge Discovery PKDD’99, LNAI 1704, Prague, Czech 61 [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] Republic pp 406–411, 1999 J Li and N Cercone, “A rough set based model to rank the importance of association rules,” Rough Sets, Fuzzy Sets, Data Mining, Granul Comput., pp 109–118, 2005 R Agrawal and R Srikant, “Fast algorithms for mining association rules,” Proceeding VLDB ’94 Proc 20th Int Conf Very Large Data Bases, vol 1215, pp 487–499, 1994 M J Zaki, “Scalable algorithms for association mining.” Knowledge and Data Engineering, IEEE Transactions on 12.3, pp 372–390, 2000 M Holsheimer, “a Perspective on databases and data mining,” KDD-95 Proc., no October, pp 150–156, 2005 Y H Cho, J K Kim, and S H Kim, “A personalized recommender system based on web usage mining and decision tree induction,” Expert Syst Appl., vol 23, no 3, pp 329–342, 2002 P.-N Tan, M Steinbach, and V Kumar, “Association Analysis: Basic Concepts and Algorithms,” Introd to Data Min., pp 327–414, 2005 J Han and J Pei, “Mining frequent patterns by pattern-growth,” ACM SIGKDD Explorations Newsletter, vol 2, no pp 14–20, 2000 J Han, J Pei, and Y Yin, “Mining frequent patterns without candidate generation,” ACM SIGMOD Record, vol 29, no pp 1–12, 2000 J Han, J Pei, and Y Yin, “Mining frequent patterns without candicate generation.” Data Mining and Knowledge Discovery, Kluwer Academic Publishers., pp 53–87, 2004 Z H Deng and S L Lv, “Fast mining frequent itemsets using Nodesets,” Expert Syst Appl., vol 41, no 10, pp 4505–4512, 2014 Z Deng, Z Wang, and J Jiang, “A new algorithm for fast mining frequent itemsets using N-lists,” Sci China Inf Sci., vol 55, no 9, pp 2008–2030, 2012 B Sarwar, G Karypis, J Konstan, and J Riedl, “Analysis of recommendation algorithms for e-commerce,” Organization, vol 5, no 1/2, pp 158–167, 2000 “Www.Philippe-Fournier-Viger.Com.” 62 63 [...]... theo từng bộ dữ liệu [1] Tập phổ biến có tính chất là „tất cả các tập con của tập phổ biến đều là tập phổ biến Tập phổ biến đóng (closed frequent pattern) [23] là tập phổ biến và không tồn tại tập nào bao nó có cùng độ phổ biến nhƣ nó Tập phổ biến cực đại (maximal frequent pattern) [24] là tập phổ biến và không có tồn tại tập nào bao nó là tập phổ biến Là trƣờng hợp nén có mất thông tin các tập phổ biến. .. Thách thức chính của khai phá mẫu phổ biến từ dữ liệu lớn là thƣờng sinh ra rất nhiều mẫu thỏa mãn ngƣỡng minsup, nhất là khi chọn mẫu minsup thấp Theo định lý Apriori mẫu (tập mục) là phổ biến thì các mẫu con của nó cũng phổ biến, dẫn đến một mẫu lớn có thể chứa cơ số mũ các tập mẫu con nhỏ hơn Hai ý tƣởng khai phá tập phổ biến đóng và tập phổ biến cực đại đƣợc đề xuất để giải quyết vấn đề này Tại cùng... với dữ liệu thƣa, và những thuật toán để khai phá những tập phổ biến là tất cả tập phổ biến, tập phổ biến cực đại, tập phổ biến đóng Ở đây luận văn chỉ nêu thuật toán khai phá tập phổ biến đóng Dựa theo khái niệm về tập phổ biến đóng đƣợc nêu ở định nghĩa trong phần 2.1 FPClose cần xác định tất cả những tập phổ biến mới là đóng, sử dụng cây phổ biến đóng CFI-Tree (closed frequent item tree- một biến. .. tối đa có thể có trong transaction Thuộc tính của node-link: Bất kỳ item phổ biến 𝑖𝑘 nào, tất cả các mẫu phổ biến có thể đều chứa 𝑖𝑘 lấy ra đƣợc bởi theo node-link bắt đầu từ head của 𝑖𝑘 trong header của FP-Tree Thuộc tính của đƣờng tiền tố (prefix path): để tính mẫu phổ biến cho nốt 𝑖𝑘 trong path P, chỉ đƣờng tiền tố con của nốt 𝑖𝑘 đƣợc xem xét lấy ra, số đếm tần xuất của mọi nốt trong cây tiền... mảnh (Fragment growth) với a là một itemset trong DB (Database), B là mẫu cơ sở điều kiện của a, và b là một itemset trong B, support của a ∪ b =support của b trong B Sự tăng mẫu (pattern growth) với a là một itemset trong DB, B là mẫu cơ sở điều kiện của a, và b là một itemset trong B, thì a ∪ b là phổ biến trong DB nếu và chỉ nếu b là phổ biến trong B Sinh mẫu đƣờng FP-Tree đơn (single FP-Tree path):... và cập nhật mô hình ngay trong khi tạo gợi ý ở thời gian thực Do số lƣợng các chủng loại mặt hàng trên trang thƣơng mại điện tử là cực lớn, khách hàng có thể lựa chọn trong số hàng triệu sản phẩm từ cũ đến mới, vô cùng đa dạng về chủng loại, hình thức Những sản phẩm đƣợc gợi ý có thể dựa trên việc chọn ra sản phẩm đƣợc mua nhiều nhất, mới nhất, hay sở thích riêng biệt của từng ngƣời dùng đƣợc phân tích. .. để trả lời các câu hỏi trên nhƣ khai phá dựa trên ràng buộc, khai phá những mẫu không hoàn thiện, hoặc đƣợc nén, độ đo độ thú vị, phân tích độ tƣơng quan 20 Trong khai phá dựa trên ràng buộc (constraint-based) [27], một cách hiệu quả là dựa trên từng ngƣời dùng cụ thể, phân tích tìm ra những ràng buộc của ngƣời dùng đó bằng việc liệt kê phân loại những tƣơng tác của ngƣời dùng trong quá trình khai phá... thực nghiệm ngoại tuyến đầu tiên phải kể đến tập dữ liệu, những đặc tính cần xem xét là tập dữ liệu này thuộc miền nào (giải trí hay thƣơng mại hay giáo dục…), thông tin chứa bên trong, số lƣợng, phân bố của mẫu yêu cầu phải là dữ liệu mô tả hành vi thực của ngƣời dùng, đƣợc tinh chỉnh loại bỏ những dữ liệu thừa, nếu lấy mẫu phải theo phân bố gần với dữ liệu thực, nếu lấy thực tế cần mô tả, quan sát... 9 ý những mẫu sản phẩm cùng đƣợc xem nhiều bởi những ngƣời dùng khác – các mẫu phổ biến Tình hình sử dụng hệ gợi ý trong thƣơng mại điện tử ở Việt Nam Cũng theo báo cáo thƣơng mại điện tử 2014 ở Việt Nam của Cục thƣơng mại và công nghệ thông tin –Bộ Công thƣơng [10] đã đƣa ra các số liệu thống kê đáng chú ý về các sàn giao dịch thƣơng mại điện tử: các loại sản phẩm đƣợc quan tâm nhiều nhất của ngƣời...CHƢƠNG 1 KHÁI QUÁT BÀI TOÁN TƢ VẤN SẢN PHẨM THƢƠNG MẠI Chƣơng đầu tiên của luận văn sẽ nêu tổng quan về bài toán tƣ vấn trong thƣơng mại điện tử, những vấn đề từ cũ đến mới đƣợc cập nhật theo những hội nghị và những công bố nổi tiếng trong lĩnh vực này 1.1 Tổng quan bài toán tƣ vấn trong thƣơng mại điện tử Ngƣời dùng (user) internet hiện nay mỗi ngày có thể cần tìm hiểu ... TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TRƢƠNG THỊ MINH NGỌC TƢ VẤN TRONG THƢƠNG MẠI ĐIỆN TỬ DỰA TRÊN PHÂN TÍCH MẪU PHỔ BIẾN TỪ DỮ LIỆU NHẬT KÝ TRUY CẬP CỦA KHÁCH HÀNG Ngành: Công nghệ thông tin Chuyên ngành:... liệu Bƣớc tiền xử lý liệu: có đầu vào nhật ký truy cập khách hàng thông tin tất sản phẩm Trong thông tin tất sản phẩm thu thập đƣợc gồm thông tin mô tả, hình ảnh Nhật ký truy cập phiên truy cập. .. nhiều mẫu thỏa mãn ngƣỡng minsup, chọn mẫu minsup thấp Theo định lý Apriori mẫu (tập mục) phổ biến mẫu phổ biến, dẫn đến mẫu lớn chứa số mũ tập mẫu nhỏ Hai ý tƣởng khai phá tập phổ biến đóng tập phổ