Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 68 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
68
Dung lượng
2,09 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ LƢU NGỌC TUẤN HỆ THỐNG HỖ TRỢ TƢ VẤN TRONG THƢƠNG MẠI ĐIỆN TỬ LUẬN VĂN THẠC SĨ Hà Nội - 2010 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ LƢU NGỌC TUẤN HỆ THỐNG HỖ TRỢ TƢ VẤN TRONG THƢƠNG MẠI ĐIỆN TỬ Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60 48 05 LUẬN VĂN THẠC SĨ NGƢỜI HƢỚNG DẪN KHOA HỌC: TS Lê Anh Cƣờng Hà Nội - 2010 LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Hệ thống hỗ trợ tư vấn thương mại điện tử” thực hướng dẫn TS Lê Anh Cường giảng viên chính, trường đại học Công Nghệ, Đại học quốc gia Hà Nội Mọi trích dẫn tài liệu tham khảo mà tơi sử dụng luận văn có ghi rõ nguồn gốc Tơi xin hồn tồn chịu trách nhiệm lời cam đoan LỜI CẢM ƠN Để hoàn thành luận văn này, xin gửi lời cảm ơn sâu sắc tới thầy cô giáo Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội người mang đến cho học viên kiến thức hữu ích khơi dậy chúng tơi niềm say mê học tập nghiên cứu khoa học Đặc biệt, xin chân thành cảm ơn thầy giáo TS.Lê Anh Cường, mơn Khoa học máy tính, Trường Đại học Công Nghệ - Đại học Quốc gia Hà Nội người tận tình dẫn giúp đỡ tơi hồn thành luận văn Tơi gửi lời cảm ơn sâu sắc tới thầy giáo PGS.TS Hà Quang Thụy thầy cô giáo môn Các hệ thống thơng tin đóng góp ý kiến, gợi ý giúp đỡ tơi hồn thành luận văn Xin cảm ơn bạn học lớp chia sẻ với kinh nghiệm học tập quý báu Cảm ơn đồng nghiệp quan quan tâm tạo điều kiện giúp đỡ trình thực luận văn Tơi xin cảm ơn người thân gia đình, xin bày tỏ lịng biết ơn sâu sắc bố mẹ dành tình cảm yêu thương, động viên, giúp đỡ cảm ơn tất bố mẹ dành cho Về phương diện thân, hồn thành khóa học tơi ln cố gắng phấn đấu học tập nghiên cứu không ngừng Cuối cùng, tơi hy vọng luận văn đem lại giá trị hữu ích thiết thực MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ MỞ ĐẦU CHƢƠNG - TỔNG QUAN VỀ HỆ TƢ VẤN 10 1.1 Khái quát hệ tƣ vấn .10 1.2 Hệ tƣ vấn chức hệ tƣ vấn .11 1.3 Tiếp cận hệ tƣ vấn 12 1.4 Kiến trúc hệ tƣ vấn 14 1.5 Mơ hình hóa tốn .15 1.6 Các ứng dụng hệ tƣ vấn 18 1.7 Mục tiêu luận văn 20 CHƢƠNG - CÁC PHƢƠNG PHÁP TƢ VẤN 22 2.1 Phƣơng pháp tiếp cận dựa nội dung 22 2.1.1 Xây dựng hệ tư vấn theo phương pháp tiếp cận dựa nội dung 22 2.1.1.1 Hệ thống tư vấn dựa nội dung hàm kinh nghiệm 23 2.1.1.2 Hệ thống tư vấn dựa nội dung mơ hình 24 2.1.2 Các hạn chế phương pháp tiếp cận dựa nội dung 25 2.1.2.1 Giới hạn phân tích nội dung .25 2.1.2.2 Quá cụ thể (overspecialization) 25 2.1.2.3 Vấn đề khách hàng .25 2.2 Phƣơng pháp tiếp cận dựa cộng tác .26 2.2.1 Xây dựng hệ tư vấn theo phương pháp tiếp cận dựa cộng tác 26 2.2.1.1 Hệ thống tư vấn dựa cộng tác hàm kinh nghiệm 26 2.2.1.2 Hệ thống tư vấn dựa cộng tác mơ hình 27 2.2.2 Các hạn chế phương pháp tiếp cận dựa cộng tác .28 2.2.2.1 Vấn đề khách hàng 28 2.2.2.2 Vấn đề sản phẩm .29 2.2.2.3 Sự thưa thớt liệu đánh giá .29 2.3 Phƣơng pháp tiếp cận kết hợp 30 3.1.1 Kết hợp thuộc tính khách hàng sản phẩm .30 3.1.2 Thực tư vấn nội dung trước, thực tư vấn dựa cộng tác sau 31 3.1.3 Thực tư vấn cộng tác trước, thực tư vấn dựa nội dung sau 32 CHƢƠNG - CÁC MƠ HÌNH HỌC MÁY 34 3.1 Mô hình phân lớp Nạve Bayes .34 3.1.1 Lý thuyết Bayes 34 3.1.2 Mơ hình phân lớp Nạve Bayes 35 3.2 Mơ hình phân lớp máy vector hỗ trợ (SVMs) .36 3.2.1 Lý thuyết học thống kê 37 3.2.2 Lý thuyết SVM 39 3.2.2.1 Các phân lớp tuyến tính 39 3.2.2.2 SVM tuyến tính cho huấn luyện phân chia 40 3.2.2.3 Siêu phẳng tối ưu 41 3.2.2.4 Các vector hỗ trợ 42 3.2.2.5 SVM tuyến tính cho tập huấn luyện tống quát 43 3.2.3 SVM khơng tuyến tính kết hợp phương pháp nhân 44 CHƢƠNG - THỰC NGHIỆM VÀ KẾT QUẢ ĐÁNH GIÁ 47 4.1 Mô tả liệu .47 4.2 Các độ đo đánh giá mô hình phân lớp 51 4.3 Kết thực nghiệm 52 4.3.1 Phương pháp tư vấn dựa nội dung .53 4.3.2 Phương pháp tư vấn dựa cộng tác 55 4.3.3 Phương pháp tư vấn kết hợp thuộc tính khách hàng sản phẩm 56 4.3.4 Phương pháp tư vấn kết hợp thực tư vấn dựa nội dung trước áp dụng phương pháp tư vấn cộng tác sau 57 4.3.5 Phương pháp tư vấn kết hợp thực tư vấn dựa cộng tác trước áp dụng phương pháp tư vấn dựa nội dung sau 58 4.4 Đánh giá kết .59 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 61 TÀI LIỆU THAM KHẢO 63 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình Các phương pháp tư vấn kỹ thuật áp dụng 13 Hình Kiến trúc hệ thống hỗ trợ tư vấn 14 Hình Ví dụ thuộc tính khách hàng sản phẩm 17 Hình Ma trận đánh giá khách hàng - sản phẩm 17 Hình Phân hệ tư vấn Amazon 19 Hình Hệ tư vấn phim MovieLens 20 Hình Ví dụ hệ tư vấn dựa lọc nội dung với sản phẩm phim 22 Hình Ví dụ hệ tư vấn dựa lọc cộng tác với sản phẩm phim 26 Hình Mơ hình tư vấn dựa nội dung trước, tư vấn dựa cộng tác sau 31 Hình 10 Mơ hình tư vấn dựa cộng tác trước, tư vấn dựa nội dung sau 32 Hình 11 Siêu phẳng phân chia tuyến tính khơng gian hai chiều 39 Hình 12 Các siêu phẳng phân chia tập liệu huấn luyện 40 Hình 13 Siêu phẳng với lề lớn γ 40 Hình 14 Siêu phẳng tối ưu 41 Hình 15 Các vector hỗ trợ 43 Hình 16 Biến nới lỏng ξ 43 Hình 17 Ánh xạ từ khống gian cũ sang không gian đặc trưng 45 Hình 18 Cấu trúc bảng Rating 48 Hình 19 Cấu trúc bảng Item 49 Hình 20 Cấu trúc bảng User 50 Hình 21 Cấu trúc bảng liệu đào tạo liệu kiểm tra 50 Hình 22 Kết sau thực phân lớp 51 Hình 23 Thực nghiệm với phương pháp tư vấn dựa nội dung (5 nhãn) 54 Hình 24 Thực nghiệm với phương pháp tư vấn dựa nội dung (2 nhãn) 54 Hình 25 Thực nghiệm tư vấn dựa cộng tác (5 nhãn) 55 Hình 26 Thực nghiệm với phương pháp tư vấn dựa cộng tác (2 nhãn) 56 Hình 27 Thực nghiệm với phương pháp kết hợp thuộc tính khách hàng sản phẩm (2 nhãn) 57 Hình 28 Bảng test với dựa nội dung trước, tư vấn dựa cộng tác sau 58 Hình 29 Bảng test với tư vấn dựa cộng tác trước, tư vấn dựa nội dung sau 59 MỞ ĐẦU Ngày với phát tiển không ngừng hệ thống mạng toàn cầu Internet, khách hàng hệ thống thông tin đặc biệt website thương mại điện tử bước làm quen sử dụng thường xuyên giao dịch điện tử nhiều lĩnh vực như: chứng khốn, bảo hiểm, tài chính, ngân hàng, công nghệ, viễn thông,… Tuy nhiên, với khối lượng thông tin khổng lồ, khách hàng thường gặp khó khăn việc tìm kiếm lựa chọn thơng tin cần thiết phù hợp để giải vấn đề định Ví dụ khách hàng muốn gửi tiền vào ngân hàng phải lựa chọn sản phẩm ngân hàng cho phù hợp, khách hàng nên lựa chọn sản phẩm tiền gửi bảo hiểm hay khơng, có sách khuyến khích ngân hàng hay khơng? Lợi ích rủi ro gặp phải đâu sản phẩm tốt với khách hàng? Khách hàng có q nhiều lựa chọn khơng đủ thời gian tri thức để đánh giá sản phẩm phù hợp đưa định tối ưu Mặt khác, từ phía nhà cung cấp sản phẩm, công ty doanh nghiệp ln mong muốn sản phẩm tốt đến với khách hàng Làm hỗ trợ khách hàng việc lựa chọn sản phẩm khách hàng ln có so sánh đánh giá sản phẩm để có định lựa chọn tốt Và khách hàng mua quan tâm tới sản phẩm cần giới thiệu tới khách hàng sản phẩm khác, cần phải đề xuất tới khách hàng sản phẩm hợp lý Các nhà cung cấp quan tâm tới trình giới thiệu sản phẩm mới, sản phẩm phù hợp với đối tượng khách hàng mà sản phẩm chưa có đánh giá từ khách hàng,… Xuất phát từ vấn đề cịn hạn chế q trình tương tác khách hàng với sản phẩm doanh nghiệp thương mại điện tử, hệ tư vấn hình thành phát triển để hỗ trợ tốt cho khách hàng doanh nghiệp có định tốt Các website với hệ thống giao dịch điện tử cần thiết có hệ thống tư vấn tốt giúp thu lợi nhuận không nhỏ Bởi đó, khách hàng tìm thấy sản phẩm mà họ ưa thích họ có xu hướng mua Ngược lại, họ khơng tìm thấy sản phẩm họ quan tâm họ khơng khơng mua mà rời bỏ tìm đến nơi cung cấp dịch vụ tốt Hệ thống tư vấn trở thành lĩnh vực nghiên cứu quan trọng xuất phát từ cơng trình nghiên cứu việc xây dựng hệ thống lọc cộng tác Sự phát triển đồng thời từ ứng dụng mang tính thực tiễn nghiên cứu mang tính khoa học đưa hệ tư vấn trợ thành lĩnh vực quan trọng việc hỗ trợ người trình khai thác thông tin Trong năm gần đây, hệ tư vấn khơng ngừng phát triển hồn thiện, nhiên tương lai địi hỏi có cải thiện để đưa phương pháp hiệu tư vấn hiệu áp dựng nhiều ứng dụng thực tế Việc cải tiến bao gồm phương pháp tốt để xác định hành vi khách hàng, thông tin sản phẩm cho khách hàng sản phẩm cần tư vấn, đưa nhiều phương pháp để thuận lợi việc tư vấn, có số để đánh giá hiệu hệ tư vấn Với nghiên cứu tìm hiểu hệ hỗ trợ tư vấn, luận văn hoàn thành với mục đích nhiệm vụ sau: Trình bày tổng quan hệ tư vấn với chức nhiệm vụ hệ tư vấn thương mại điện tử Kiến trúc hệ tư vấn trình xây dựng hệ tư vấn hồn chỉnh Mơ hình hóa tốn tư vấn chuyển từ yêu cầu thực tế thành toán khai phá xử lý liệu lĩnh vực cơng nghệ thơng tin Trình bày ba phương pháp tiếp cận tư vấn để xây dựng mở rộng hệ tư vấn Đồng thời đưa hạn chế tồn phương pháp Kết hợp nghiên cứu hai kỹ thuật đánh giá dựa hàm kinh nghiệm đánh giá dựa mơ hình để giải toán hệ tư vấn Khảo sát liệu chuẩn thực xây dựng chương trình thực nghiệm Kết thực nghiệm so sánh đánh giá phương pháp tư vấn mơ hình phân lớp Nội dung luận văn thiết kế thành 04 chương: Chƣơng Tổng quan hệ tư vấn: Giới thiệu khái quát hệ thống hỗ trợ tư vấn với chức hệ tư vấn Trình bày nội dung kiến trúc mơ hình hóa tốn tư vấn thương mại điện tử Chƣơng Các phương pháp tư vấn: Trình bày phương pháp tiếp cận để xây dựng hệ tư vấn với phương pháp tư vấn dựa nội dung, tư vấn dựa cộng tác phương pháp lai Đưa ưu điểm hạn chế phương pháp 52 Độ đo Recall cho lớp số lượng đối tượng kiểm tra phân lớp tổng số đối tượng phân lớp vào lớp Độ đo Recall lớp E1 xác định theo công thức: Recall = tp fn Độ đo F1 (F-Measure) Độ đo F1 kết hợp độ đo Precision độ đo Recall Độ đo F xác định theo công thức : F1 precision * recall precision recall 4.3 Kết thực nghiệm Áp dụng mơ hình triển khai phương pháp tư vấn trình bày chương II với tập liệu MovieLens chia sẻ từ dự án nghiên cứu “GroupLens” trường đại học Minnesota, Mỹ sử dụng mơ hình Nạve Bayes làm trung tâm chương trình Đồng thời, liệu chạy thực nghiệm công cụ Weka [38] với mơ hình phân lớp SVM (sử dụng thư viện LIBSVM [18]) Trong đó, sử dụng SVM với hàm nhân Radial có tham số mặc định Chương trình chạy thử nghiệm đưa kết tương ứng Kết chương trình đánh giá theo hai tiêu chí chính: Tiêu chí 1: Đánh giá kết dự đốn chương trình so với kết đánh giá thực tế khách hàng sản phẩm lưu trữ liệu kiểm tra Ví dụ, theo kết chương trình dự đốn khách hàng A đánh giá sản phẩm X với điểm đánh giá điểm, thực tế liệu lưu trữ khách hàng A đánh giá sản phẩm X điểm chương trình dự đốn khơng xác Chương trình coi dự đốn xác cho kết đánh giá khách hàng sản phẩm theo liệu thực tế Tiêu chí 2: 53 Đánh giá kết dự đốn chương trình theo mức độ quan tâm sản phẩm khách hàng Nếu chia mức độ quan tâm khách hàng với sản phẩm thành lớp: Có quan tâm tới sản phẩm khách hàng có đánh giá sản phẩm với đánh giá thuộc tập {4,5} Không quan tâm tới sản phẩm khách hàng có đánh giá sản phẩm với đánh giá thuộc tập {1,2,3} Chương trình coi dự đốn xác với kết thực tế có đánh giá khách hàng có mức độ quan tâm không quan tâm tới sản phẩm Đối với phương pháp kết hợp, thực chạy thực nghiệm để kiểm tra kết theo tiêu chí 4.3.1 Phƣơng pháp tƣ vấn dựa nội dung Kết thực nghiệm theo hai tiêu chí phương pháp tư vấn dựa nội dung hai mơ hình phân lớp mô tả bảng đây: Theo tiêu chí 1: Phân lớp theo SVM (thực Weka) Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Kết phân lớp Các độ đo Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) 175 70 405 618 123 0.549 0.126 0.205 42 96 740 1103 211 0.193 0.044 0.071 50 154 1648 2698 632 0.302 0.318 0.310 32 120 1730 3793 1103 0.358 0.560 0.436 20 58 940 0.336 0.235 0.277 2390 1049 Phân lớp theo phương pháp Nạve Bayes (thực chương trình) Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Kết phân lớp Các độ đo Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) 388 77 370 375 181 0.505 0.279 0.359 110 131 816 876 259 0.277 0.060 0.098 116 152 1898 2352 664 0.359 0.366 0.362 88 67 1595 3835 1193 0.402 0.566 0.470 67 46 614 0.415 0.366 0.389 2099 1631 54 Naïve Bayes SVM 0.60 0.60 0.50 0.50 0.40 0.40 Recall Precision SVM 0.30 0.30 0.20 0.20 0.10 0.10 0.00 0.00 Naïve Bayes Rating Rating Hình 23 Thực nghiệm với phương pháp tư vấn dựa nội dung (5 nhãn) Từ kết thực nghiệm cho thấy, kết phân lớp với phương pháp tư vấn dựa nội dung hai mơ hình phân lớp tương đối đạt tỉ lệ khơng cao Số lượng mẫu dự đốn mơ hình phân lớp Nạve Bayes đạt 39,42% số mẫu dự đốn mơ hình SVM đạt 33,81% Theo tiêu chí 2: Phân lớp theo SVM (thực Weka) Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Kết phân lớp Các độ đo Quan tâm (Interesting) Khơng quan tâm (Non-Interest) Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) Quan tâm (Interesting) 16052 365 0.832 0.978 0.899 Không quan tâm (Non-Interest) 3243 340 0.482 0.095 0.159 Phân lớp theo phương pháp Naïve Bayes (thực chương trình) Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Kết phân lớp Các độ đo Quan tâm (Interesting) Khơng quan tâm (Non-Interest) Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) Quan tâm (Interesting) 15881 536 0.847 0.967 0.903 Không quan tâm (Non-Interest) 2877 706 0.568 0.197 0.293 Hình 24 Thực nghiệm với phương pháp tư vấn dựa nội dung (2 nhãn) Kết thực nghiệm cho thấy, phân lớp với nhãn mang lại hiệu tư vấn cao mơ hình phân lớp Nạve Bayes SVM Số lượng mẫu đốn Nạve Bayes đạt 82,93% kết với SVM 81,96% 55 4.3.2 Phƣơng pháp tƣ vấn dựa cộng tác Theo tiêu chí 1: Phân lớp theo SVM (thực Weka) Kết phân lớp Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Các độ đo Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) 161 55 389 663 123 0.619 0.116 0.195 28 79 724 1159 202 0.196 0.036 0.061 36 128 1602 2818 598 0.299 0.309 0.304 22 99 1702 3912 1043 0.355 0.577 0.439 13 42 936 0.334 0.222 0.267 2478 988 Phân lớp theo phương pháp Naïve Bayes (thực chương trình) Kết phân lớp Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) 241 151 541 403 55 0.394 0.173 0.241 120 133 980 852 107 0.221 0.061 0.095 136 173 1848 2633 392 0.340 0.357 0.348 76 110 1512 4187 893 0.392 0.618 0.479 38 36 549 2614 1220 0.457 0.274 0.343 SVM Naïve Bayes SVM 0.70 0.70 0.60 0.60 0.50 0.50 0.40 0.40 Recall Precision Các độ đo 0.30 0.30 0.20 0.20 0.10 0.10 0.00 0.00 Rating Naïve Bayes Rating Hình 25 Thực nghiệm tư vấn dựa cộng tác (5 nhãn) Nhìn vào kết thực nghiệm, phân lớp phương pháp tư vấn dựa cộng tác cho kết tương đối thấp mơ hình phân lớp Nạve Bayes mơ 56 hình SVM Số lượng mẫu đốn mơ hình Nạve Bayes đạt 38,15% số mẫu mơ hình SVM đạt 33,71% Theo tiêu chí 2: Phân lớp theo SVM (thực Weka) Kết phân lớp Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Các độ đo Quan tâm (Interesting) Không quan tâm (Non-Interest) Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) Quan tâm (Interesting) 16071 346 0.833 0.979 0.900 Không quan tâm (Non-Interest) 3219 364 0.513 0.102 0.170 Phân lớp theo phương pháp Naïve Bayes (thực chương trình) Kết phân lớp Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Các độ đo Quan tâm (Interesting) Không quan tâm (Non-Interest) Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) Quan tâm (Interesting) 15848 569 0.844 0.965 0.900 Không quan tâm (Non-Interest) 2938 645 0.531 0.180 0.269 Hình 26 Thực nghiệm với phương pháp tư vấn dựa cộng tác (2 nhãn) Kết thực nghiệm cho thấy, phân lớp với nhãn mang lại hiệu tư vấn cao mơ hình phân lớp Nạve Bayes SVM Số lượng mẫu đốn Nạve Bayes đạt 82,47% kết với SVM 82,18% 4.3.3 Phƣơng pháp tƣ vấn kết hợp thuộc tính khách hàng sản phẩm Theo tiêu chí 2: Phân lớp theo SVM (thực Weka) Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Kết phân lớp Các độ đo Quan tâm (Interesting) Khơng quan tâm (Non-Interest) Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) Quan tâm (Interesting) 16103 314 0.832 0.981 0.901 Không quan tâm (Non-Interest) 3240 343 0.522 0.096 0.162 57 Phân lớp theo phương pháp Nạve Bayes (thực chương trình) Bộ liệu huấn luyện kiểm tra Kết nhận phân lớp Kết phân lớp Các độ đo Quan tâm (Interesting) Khơng quan tâm (Non-Interest) Chính xác (Precision) Hồi tưởng (Recall) Độ đo F1 (F-Measure) Quan tâm (Interesting) 15979 438 0.843 0.973 0.904 Không quan tâm (Non-Interest) 2966 617 0.585 0.172 0.266 Hình 27 Thực nghiệm với phương pháp kết hợp thuộc tính khách hàng sản phẩm (2 nhãn) Kết phương pháp kết hợp cho thấy số lượng mẫu đoán Nạve Bayes đạt 82,98% kết với SVM 82,23% Kết tốt kết với phương pháp lọc dựa nội dung lọc dựa cộng tác đơn lẻ 4.3.4 Phƣơng pháp tƣ vấn kết hợp thực tƣ vấn dựa nội dung trƣớc áp dụng phƣơng pháp tƣ vấn cộng tác sau Sau áp dụng phương pháp tư vấn dựa nội dung, khách hàng chương trình rút trích nhiều 20 sản phẩm (Số lượng sản phẩm lấy tùy chỉnh chương trình) mà theo dự đốn chương trình khách hàng có mối quan tâm lớn Các liệu kiểm tra xây dựng từ phương pháp tư vấn dựa nội dung lưu trữ vào bảng sở liệu MySQL theo cấu trúc sau: Tên Trƣờng UserID Mã khách hàng Kiểu liệu int(10) ItemID Mã sản phẩm int(10) Rating Đánh giá khách hàng int(2) sản phẩm (thực tế) Kết dự đoán đánh giá khách int(2) hàng sản phẩm chương trình theo phương pháp tư vấn dựa nội dung Điểm đánh giá lớn tương double ứng chương trình theo phương pháp tư vấn dựa nội CBRat CBScore Mô tả Câu lệnh thực CREATE TABLE `u1cbcf` ( `UserID` int(10) NOT NULL DEFAULT '0', `ItemID` int(10) NOT NULL DEFAULT '0', `Rating` int(2) DEFAULT '0', `CBRat` int(2) DEFAULT NULL, `CBScore` double DEFAULT NULL, `CFRat` int(2) DEFAULT 58 CFRat CFScore dung Kết dự đoán đánh giá khách int(2) hàng sản phẩm chương trình theo phương pháp tư vấn dựa cộng tác Điểm đánh giá lớn tương double ứng chương trình theo phương pháp tư vấn dựa cộng tác '0', `CFScore` double DEFAULT NULL, PRIMARY KEY (`UserID`,`ItemID`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8; Hình 28 Bảng test với dựa nội dung trước, tư vấn dựa cộng tác sau Sau thực rút trích liệu bảng liệu kiểm tra với 432 khách hàng có mức độ quan tâm cao tới 967 sản phẩm với 6043 mẫu kiểm tra Chương trình tiếp tục sử dụng phương pháp tư vấn dựa cộng tác liệu kiểm tra để đưa kết dự đốn cuối chương trình đánh giá khách hàng với sản phẩm Kết thực nghiệm theo phương pháp tư vấn dựa cộng tác chọn 425 khách hàng 603 sản phẩm với 4518 đánh giá quan tâm Đối chiếu với liệu thử nghiệm, số lượng mẫu kiểm tra đạt 3215 mẫu độ đắn phương pháp đạt 71,15% 4.3.5 Phƣơng pháp tƣ vấn kết hợp thực tƣ vấn dựa cộng tác trƣớc áp dụng phƣơng pháp tƣ vấn dựa nội dung sau Sau áp dụng phương pháp tư vấn dựa cộng tác, khách hàng chương trình rút trích nhiều 20 sản phẩm (Số lượng sản phẩm lấy tùy chỉnh chương trình) mà theo dự đốn chương trình khách hàng có mối quan tâm lớn Các liệu kiểm tra xây dựng từ phương pháp tư vấn dựa nội dung lưu trữ vào bảng sở liệu MySQL theo cấu trúc sau: Tên Trƣờng UserID Mã khách hàng Kiểu liệu int(10) ItemID Mã sản phẩm int(10) Rating Đánh giá khách hàng int(2) sản phẩm (thực tế) Mô tả Câu lệnh thực CREATE TABLE `u1cbcf` ( `UserID` int(10) NOT NULL DEFAULT '0', `ItemID` int(10) NOT NULL DEFAULT '0', 59 CFRat CFScore CBRat CBScore Kết dự đoán đánh giá khách int(2) hàng sản phẩm chương trình theo phương pháp tư vấn dựa cộng tác Điểm đánh giá lớn tương double ứng chương trình theo phương pháp tư vấn dựa cộng tác Kết dự đoán đánh giá khách int(2) hàng sản phẩm chương trình theo phương pháp tư vấn dựa nội dung Điểm đánh giá lớn tương double ứng chương trình theo phương pháp tư vấn dựa nội dung `Rating` int(2) DEFAULT '0', `CBRat` int(2) DEFAULT NULL, `CBScore` double DEFAULT NULL, `CFRat` int(2) DEFAULT '0', `CFScore` double DEFAULT NULL, PRIMARY KEY (`UserID`,`ItemID`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8; Hình 29 Bảng test với tư vấn dựa cộng tác trước, tư vấn dựa nội dung sau Sau thực rút trích liệu bảng liệu kiểm tra với 456 khách hàng có mức độ quan tâm cao tới 650 sản phẩm với 6532 mẫu kiểm tra Chương trình tiếp tục sử dụng phương pháp tư vấn dựa nội dung liệu kiểm tra để đưa kết dự đoán cuối chương trình đánh giá khách hàng với sản phẩm Kết thực nghiệm theo phương pháp tư vấn dựa nội dung chọn 411 khách hàng 536 sản phẩm với 4977 đánh giá quan tâm Đối chiếu với liệu thử nghiệm, số lượng mẫu kiểm tra đạt 3725 mẫu độ đắn phương pháp đạt 74,84% 4.4 Đánh giá kết Qua kết thực nghiệm cho thấy chương trình với mơ hình phân lớp Naïve Bayes xây dựng cho kết tương đối giống với kết thực nghiệm với mơ hình SVM thực Weka Kết thực nghiệm phân lớp liệu theo lớp (theo tiêu chí 1) cho kết thấp với hai phương pháp tư vấn dựa nội dung tư vấn dựa cộng tác Tuy nhiên, xét mức độ có quan tâm không quan tâm khách hàng với sản phẩm (theo tiêu chí 2) kết phân lớp tương đối tốt đáp ứng yêu cầu toán phân lớp 60 Thực nghiệm với phương pháp kết hợp thuộc tính khách hàng sản phẩm cho kết tốt phương pháp tư vấn dựa nội dung tư vấn dựa cộng tác thực đơn lẻ với hai mơ hình Nạve Bayes SVM Kết thực nghiệm với phương pháp kết hợp tư vấn dựa nội dung thực trước, tư vấn cộng tác thực sau (đạt 71,15%) tư vấn cộng tác thực trước, tư vấn nội dung thực sau (đạt 74,84%) chưa thực cao Tuy nhiên hai phương pháp có khả đưa tư vấn với vấn đề khách hàng sản phẩm 61 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Từ nghiên cứu tìm hiểu hệ tư vấn cho thấy hệ tư vấn lĩnh vực nghiên cứu có ý nghĩa vai trị thực tiễn to lớn Sự phát triển đồng thời từ ứng dụng mang tính thực tế nghiên cứu mang tính khoa học đưa hệ tư vấn trợ thành lĩnh vực quan trọng việc hỗ trợ người q trình khai thác thơng tin Luận văn tìm hiểu cách đầy đủ tốn hệ hỗ trợ tư vấn thương mại điện tử Luận văn trình bày đầy đủ ba phương pháp tư vấn tư vấn dựa nội dung, tư vấn dựa cộng tác tư vấn kết hợp hai phương pháp Đồng thời đưa giới hạn hạn chế phương pháp Từ trình bày đề xuất ba kỹ thuật phương pháp kết hợp là: Kết hợp thuộc tính khách hàng thuộc tính sản phẩm thành thuộc tính chung để thực tư vấn Phương pháp tư vấn kết hợp thực tư vấn dựa nội dung trước, tư vấn dựa cộng tác sau Phương pháp tư vấn kết hợp thực tư vấn dựa cộng tác trước, tư vấn dựa nội dung sau Luận văn giới thiệu kỹ thuật để áp dụng phương pháp tư vấn với hai kỹ thuật sử dụng kỹ thuật dựa hàm kinh nghiệm kỹ thuật dựa mơ hình Tiếp theo, luận văn trình bày hai mơ hình phân lớp sử dụng phổ biến mơ hình phân lớp Nạve Bayes mơ hình phân lớp SVM Trên sở với việc sử dụng liệu tư vấn phim (MovieLens) GroupLens chia sẻ phục vụ công việc nghiên cứu, luận văn xây dựng chương trình chạy thử nghiệm mơ hình phân lớp Nạve Bayes đồng thời sử dụng thư viện LIBSVM kết hợp vào ứng dụng Weka để kiểm thử liệu Kết thực nghiệm so sánh đánh giá mơ hình Trong q trình tìm hiểu nghiên cứu hệ tư vấn, nhận thấy hầu hết nghiên cứu hệ tư vấn chưa giải vấn đề xử lý kiểu liệu đa phương tiện với loại liệu đồ họa, ảnh, audio, video,… Do đó, hướng nghiên cứu tương lai hệ tư vấn giải vấn đề xử lý kiểu liệu Một hướng nghiên cứu khác nhà khoa học đưa xây dựng ngơn ngữ truy vấn [13] phục vụ tư vấn cho khách hàng Tạo điều kiện cho 62 khách hàng tương tác với hệ thống tư vấn cách dễ dàng thân thiện Dựa ngôn ngữ truy vấn, khách hàng chủ động tương tác với hệ thống để đưa yêu cầu cần tư vấn cho khách hàng Là cán làm việc lĩnh vực tài ngân hàng, chúng tơi nhận thấy ứng dụng hệ tư vấn cho ngân hàng, cơng ty tài vơ hữu ích thiết thực Vì vậy, hướng phát triển cho đề tài luận văn kết hợp đồng thời nghiên cứu phát triển phương pháp tư vấn kỹ thuật để nâng cao độ xác tư vấn với xây dựng ứng dụng thương mại điện tử phục vụ tư vấn sản phẩm cho khách hàng bán chéo sản phẩm lĩnh vực tài ngân hàng Tóm lại, hệ tư vấn chủ đề có ý nghĩa thực tiễn sâu rộng có phạm vi nghiên cứu ứng dụng rộng lớn Luận văn thực tìm hiểu nghiên cứu phần hệ hỗ trợ tư vấn thương mại điện tử Bước đầu nghiên cứu làm thực nghiệm cho số kết tương đối khả quan 63 TÀI LIỆU THAM KHẢO Tiếng Anh ACM Homepage http://recsys.acm.org/2010 Amazon home page http://www.amazon.com/ Andreas Mild and Martin Natter “Collaborative filtering or regression models for internet recommendation system?” Journal of Targeting, Measurement and Analysis for Marketing, 2002,Vol 10, Nr 4, pp 304-313 Balabanovic, M and Y Shoham “Fab: Content-based, collaborative recommendation” Communications of the ACM, p66-72, 1997 Basu, C., H Hirsh, and W Cohen “Recommendation as classification: Using social and content-based information in recommendation” In Recommender Systems Papers from 1998 Workshop Technical Report WS-9808 AAAI Press, 1998 Bernhard S., Isabelle G., Jason W., Statistical Learning and Kernel Methods in Bioinformatics, 2003 Billsus, D and M Pazzani “Learning collaborative information filters” In International Conference on Machine Learning, Morgan Kaufmann Publishers, 1998 Breese, J S., D Heckerman, and C Kadie “Empirical analysis of predictive algorithms for collaborative filtering” In Proceedings of the Fourteenth Conference on Uncertainty in Artificial Intelligence, Madison, WI, 1998 Chien, Y-H and E I George “A bayesian model for collaborative filtering” In Proc of the 7th International Workshop on Artificial Intelligence and Statistics, 1999 10 Chihiro Ono, Yoichi Motomura, Hideki Asoh, “A Study of Probabilistic Models for Integrating Collaborative and Content-based Recommendation,” p162-168, Multidisciplinary IJCAI-05 Workshop on Advances in Preference Handling Ronen Brafman and Ulrich Junker (organizers) July 31 - August 1, 2005 Edinburgh, Scotland 64 11 Claypool, M., A Gokhale, T Miranda, P Murnikov, D Netes, and M Sartin “Combining content-based and collaborative filters in an online newspaper” In ACM SIGIR'99 Workshop on Recommender Systems: Algorithms and Evaluation, August 1999 12 D Pavlov, E Manavoglu, D Pennock, and C Giles “Collaborative filtering with maximum entropy” IEEE Intelligent Systems, Special Issue on Mining the Web Actionable Knowledge, 2004 13 G.Adomavicius, A.Tuzhilin Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art and Possible Extensions, IEEE Transactions on Knowledge and Data Engineering, 2005 A4 Grouplens home page http://www.grouplens.org 14 IMDB home page http://www.imdb.com/ 15 Janusz Sobecki, “Implementations of Web-based Recommender Systems Using Hybrid Methods”, International Journal of Computer Science & Applications Vol Issue 3, pp 52-64 16 J Salter and N Antonopoulos, “CinemaScreen recommender agent: Combining collaborative and content-based filtering,” IEEE Intell Syst.,vol 21, no 1, pp 35–41, Jan./Feb 2006 17 J.Wang, A Vries, and M Reinders, “Unifying user-based and item-based collaborative filtering approaches by similarity fusion,” in Proc SIGIR Conf., 2006, pp 501–508 18 Library for Support Vector Machines home page: http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 19 Linden, G., B Smith, and J York “Amazon.com Recommendations: Itemto-Item Collaborative Filtering” IEEE Internet Computing, Jan-Feb/ 2003 20 Mark van Setten, Mettina Veenstra, Anton Nijholt, Betsy van Dijk “CaseBased Reasoning as a Prediction Strategy for Hybrid Recommender Systems” 21 Mooney, R J., P N Bennett, and L Roy “Book recommending using text categorization with extracted information” In Recommender Systems Papers from 1998 Workshop Technical Report WS-98-08 AAAI Press, 1998 65 22 MovieLens home page http://movielens.umn.edu 23 M.Vozalis, K.G.Margaritis, “Collaborative filtering enhanced by demographic correlation,” in: Proceedings of the AIAI Symposium on Professional Practice in AI, Part of the 18th World Computer Congress, Toulouse, France, 2004, pp 393-402 24 Pazzani, M A framework for collaborative, content-based and demographic filtering Artificial Intelligence Review, pages 393-408, December 1999 25 Pazzani M., & Billsus, D (1997) “Learning and Revising User Profiles: The identification of interesting web sites” Machine Learning 27, p313-331 26 P Li, S Yamada, “A movie recommender system based on inductive learning,” in: Proceedings of the IEEE Conference on Cybernetics and Intelligent Systems, vol 1, December 2004, pp 318-323 27 Prem Melville, R Mooney, and R.Nagarajan “Content-boosted collaborative filtering” Proceedings of the SIGIR-2001 Workshop on Recommender Systems, New Orleans, LA, September 2001 28 P.Resnick, N Iakovou, M Sushak, P Bergstrom, and J Riedl,“GroupLens: An Open Architecture for Collaborative Filtering of Netnews” Proc 1994 Computer Supported Cooperative Work Conf.,1994 29 Rickard Coster “The Architecture and Implementation of a System for Collaborative and Content-based Filtering”,November 28, 2002 30 Si, L and R Jin Flexible Mixture Model for Collaborative Filtering In Proceedings of the 20th International Conference on Machine learning,Washington, D.C., August 2003 31 Soboroff, I and C Nicholas “Combining content and collaboration in text filtering” In 43 IJCAI'99 Workshop: Machine Learning for Information Filtering, August 1999 32 Support Vector Machines (SVMs) home page http://www.svms.org/survey/ 33 Ungar, L H., and D P Foster “Clustering methods for collaborative filtering” In Recommender Systems Papers from 1998 Workshop Technical Report WS-98-08 AAAI Press, 1998 66 34 U Shardanand and P Maes, “Social Information Filtering: Algorithms for Automating „Word of Mouth‟” Proc Conf Human Factors in Computing Systems, 1995 35 X Jin, Y Zhou, and B Mobasher, “A maximum entropy web recommendation system: Combining collaborative and content features,” in Proc ACM SIGKDD Conf., 2005, pp 612–617 36 Van Setten, M (2002) Experiments with a recommendation technique that learns category interests Proceedings of IADIS WWW/Internet 2002, Lisbon, Portugal, pp 722-725 37 Wendy Kogel “Faster Training of Neural Networks for Recommender Systems” Worcester Polytechnic Institue , May 2002 38 Weka homepage http://www.cs.waikato.ac.nz/ml/weka/ 39 Wikipedia homepage http://en.wikipedia.org