Nghiên cứu phương pháp mô hình hóa hành vi người dùng dựa trên dữ liệu web Nghiên cứu phương pháp mô hình hóa hành vi người dùng dựa trên dữ liệu web Nghiên cứu phương pháp mô hình hóa hành vi người dùng dựa trên dữ liệu web luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI TRẦN TRUNG HIẾU Trần Trung Hiếu HỆ THỐNG THƠNG TIN NGHIÊN CỨU PHƯƠNG PHÁP MƠ HÌNH HĨA HÀNH VI NGƯỜI DÙNG DỰA TRÊN DỮ LIỆU WEB LUẬN VĂN THẠC SĨ KHOA HỌC HỆ THỐNG THÔNG TIN CLC2017B Hà nội - 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Trần Trung Hiếu NGHIÊN CỨU PHƯƠNG PHÁP MƠ HÌNH HĨA HÀNH VI NGƯỜI DÙNG DỰA TRÊN DỮ LIỆU WEB Chuyên ngành : Hệ thống thông tin LUẬN VĂN THẠC SĨ KHOA HỌC HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC : TS Nguyễn Bình Minh Hà Nội - 2018 CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn : Trần Trung Hiếu Đề tài luận văn: Nghiên cứu phương pháp mơ hình hóa hành vi người dùng dựa liệu web Chuyên ngành: Hệ thống thông tin Mã số SV: CBC17019 Tác giả, Người hướng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày 27/10/2018 với nội dung sau: - Chỉnh sửa cơng thức precision recall có mục 1.4 phương pháp đánh giá sai số, chương sở lý thuyết - Chỉnh sửa trình bày chi tiết phần quy trình tổng quát khai phá hành vi người dùng có mục 2.2.1, chương mơ hình hóa hành vi - Chỉnh sửa phần nêu rõ ưu điểm việc sử dụng thuật tốn Nạve Bayes việc phân loại liệu text mục 2.2.4 huấn luyện, chương mơ hình hóa hành vi - Bổ sung tài liệu tham khảo chứng minh ưu điểm việc lựa chọn thuật tốn Nạve Bayes việc phân loại liệu bình luận người dùng - Chỉnh sửa hình 2.10 kiến trúc thành phần hệ thống, chương mơ hình hóa hành vi Ngày 18 tháng 11 năm 2018 Giáo viên hướng dẫn Tác giả luận văn CHỦ TỊCH HỘI ĐỒNG MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH VẼ 10 MỞ ĐẦU 12 CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 15 1.1 Tổng quan hành vi người dùng 15 1.1.1 Khái niệm 15 1.1.2 Yếu tố ảnh hưởng hành vi người dùng 15 1.2 Khai phá liệu 16 1.2.1 Khái niệm 16 1.2.2 Quá trình khai phá tri thức 17 1.2.3 Các phương pháp khai phá liệu 18 1.3 Hệ gợi ý 24 1.3.1 Giới thiệu 24 1.3.2 Xây dựng ma trận Utility 25 1.3.3 Gợi ý dựa nội dung 26 1.3.4 Lọc cộng tác 28 1.4 Phương pháp đánh giá sai số 36 1.4.1 Đánh giá độ xác dự đốn 36 1.4.2 Đánh giá việc sử dụng dự đoán 37 CHƯƠNG 2: MƠ HÌNH HĨA HÀNH VI 39 2.1 Cơ sở mơ hình hóa hành vi 39 2.1.1 Giới thiệu toán 39 2.1.2 Hành vi người dùng liệu web 40 2.2 Quá trình khai phá hành vi 41 2.2.1 Quy trình tổng quát 41 2.2.2 Lựa chọn liệu 42 2.2.3 Tiền xử lý liệu 43 2.2.4 Huấn luyện 48 2.2.5 Dự báo 53 2.2.6 Biểu diễn kết 55 2.3 Kiến trúc hệ thống 55 2.3.1 Kiến trúc phân tầng 55 2.3.2 Kiến trúc thành phần hệ thống 56 CHƯƠNG 3: THỬ NGHIỆM 59 3.1 Mô tả liệu 59 3.1.1 Giới thiệu nguồn gốc liệu 59 3.1.2 Cấu trúc liệu 59 3.1.3 Phân bố liệu 62 3.2 Phân tích tốn 63 3.3 Quá trình khai phá hành vi 65 3.3.1 Lựa chọn liệu 65 3.3.2 Tiền xử lý liệu 66 3.3.3 Huấn luyện dự báo 69 3.3.4 Biểu diễn kết 73 3.4 Thiết kế hệ thống 74 3.4.1 Mơ hình thiết kế 74 3.4.2 Chức thành phần 75 3.5 Kết thu nhận xét 75 3.5.1 Kết dự đoán dựa kết hợp click rating 75 3.5.2 Kết phân loại phê bình 78 KẾT LUẬN 81 TÀI LIỆU THAM KHẢO 83 LỜI CAM ĐOAN Tôi – Trần Trung Hiếu, học viên cao học khóa CLC2017B – cam kết Luận văn tốt nghiệp cơng trình nghiên cứu thân tơi hướng dẫn TS Nguyễn Bình Minh – Viện Cơng Nghệ Thông Tin Truyền Thông – Đại học Bách Khoa Hà Nội Các kết Luận văn tốt nghiệp trung thực, khơng chép tồn văn cơng trình khác Hà Nội, ngày 20 tháng năm 2018 Tác giả luận văn Trần Trung Hiếu LỜI CẢM ƠN Trước hết, tác giả xin gửi lời cảm ơn chân thành tới thầy cô giáo trường Đại học Bách Khoa Hà Nội nói chung thầy Viện Cơng Nghệ Thơng Tin Truyền Thông môn Hệ thống thông tin nói riêng Các thầy, giúp đỡ tác giả suốt trình học tập Viện Tác giả xin gửi lời cảm ơn sâu sắc đến thầy giáo TS Nguyễn Bình Minh tận tình giúp đỡ, trực tiếp bảo, chỉnh sửa, hướng dẫn tác giả suốt trình làm luận văn Trong thời gian làm việc với thầy, tác giả tiếp thu thêm kiến thức mà học tập tinh thần làm việc, thái độ nghiên cứu khoa học nghiêm túc, hiệu Cuối cùng, tác giả xin gửi lời cảm ơn chân thành tới gia đình, ban lãnh đạo công ty, đồng nghiệp bạn bè động viên, khuyến khích, đóng góp ý kiến tạo điều kiện cho tác giả trình học tập, nghiên cứu hoàn thành luận văn Trân trọng ! DANH MỤC CÁC BẢNG Bảng 3.1 Số liệu sai số trường hợp 76 Bảng 3.2 Số liệu sai số trường hợp 76 Bảng 3.3 Số liệu sai số trường hợp 76 Bảng 3.4 Số liệu sai số trường hợp 77 Bảng 3.5 Số liệu sai số toàn liệu xếp hạng 77 DANH MỤC CÁC HÌNH VẼ Hình 1.1 Khai phá liệu bước trình khai phá tri thức[11] 17 Hình 1.2 Phân tích tốn SVM 21 Hình 1.3 Ví dụ ma trận Utility dựa số user rate cho item 30 Hình 1.4 Ví dụ mô tả lọc cộng tác user-user, a) Ma trận Utility ban đầu b) Ma trận Utility chuẩn hóa c) ma trận user tương tự d) dự đốn ratings chuẩn hóa cịn thiếu e) ví dụ dự đốn rating chuẩn hóa f) dự đốn ratings cịn thiếu 31 Hình 1.5 Minh họa kỹ thuật phân rã ma trận 34 Hình 1.6 Minh họa ví dụ để tính precision recall 37 Hình 2.1 Một số hành vi liệu người dùng tương tác phản hồi sản phẩm 40 Hình 2.2 Quá trình khai phá hành vi 41 Hình 2.3 Biểu diễn quan hệ người dùng sản phẩm 42 Hình 2.4 Tiền xử lý liệu [3] 43 Hình 2.5 Phương pháp binning cho việc làm mịn liệu 45 Hình 2.6 Các ngoại lệ phát phân cụm 46 Hình 2.7 Biểu diễn quan hệ user item kỹ thuật phân rã ma trận 49 Hình 2.8 Biểu diễn kết gợi ý 55 Hình 2.9 Kiến trúc phân tầng hệ thống 56 Hình 2.10 Kiến trúc thành phần hệ thống 57 Hình 3.1 Biểu đồ thể số lượng review qua năm 62 Hình 3.2 Biểu đồ mơ tả tỉ trọng review nhóm danh mục 63 Hình 3.3 Hành vi người dùng liệu review Amazon 64 Hình 3.4 Biểu diễn quan hệ người dùng sản phẩm liệu thử nghiệm 65 Hình 3.5 Quy trình phân loại sản phẩm vào nhóm danh mục 66 Hình 3.6 Mơ tả số lượng review theo danh mục sau loại bỏ liệu review cũ 67 Hình 3.7 Mơ tả phân phối chuẩn Poison 68 10 Trong luận văn ta sử dụng công cụ spark.ml Mlib phát triển dựa giải thuật ALS với tham số cấu sau: numBlocks: Ta sử dụng 10 khối users items phân chia để tính tốn song song maxIter: số lần lặp tối tiếp tục tăng lần thêm lần lặp ta thu giá trị RMSE hội tụ rank: Số lượng nhân tố tiềm ẩn sử dụng mơ hình 10 regParam: Tham số chuẩn hóa ALS để mặc định 1.0 implicitPrefs: Đối với phản hồi tiềm ẩn click ta để giá trị true, phản hồi rõ ràng giá trị xếp hạng ta để giá trị false Trường hợp kết hợp click xếp hạng ta để giá trị false alpha: Là tham số áp dụng cho phản hồi tiềm ALS nhằm điều chỉnh độ tin cậy quan sát ưu tiên Giá trị tham số ta để mặc định nonnegative: để mặc định false Để huấn luyện liệu dựa kết hợp xếp hạng (r1ui ) click (r2ui ) Đầu tiên, ta tạo liệu kết hợp xếp hạng click theo công thức: r r1ui + 2ui θ rui = Trong ta thử nghiệm θ = θ = Tiếp theo, ta sử dụng liệu kết hợp với tỉ lệ 80% dùng để huấn luyện 20% dùng để đánh giá Dữ liệu huấn luyện ta đưa vào để tạo mơ hình ALSModel với tham số cấu Sau đó, dùng liệu cịn lại để đánh giá sai số mơ hình Như vậy, với mơ hình thu ta thực dự báo cho user 20 items 70 Xếp hạng Click Kết hợp Huấn luyện Dự báo Hình 3.10 Quy trình kết hợp huấn luyện dự báo hành vi click xếp hạng 3.3.3.2 Phân loại phê bình Trong phân loại phê bình, ta sử dụng phương pháp Naïve Bayes để phân loại Một thư viện điển hình có áp dụng thuật tốn Apache OpenNLP Thư viện công cụ dựa học máy để xử lý ngôn ngữ tự nhiên Trong luận văn này, ta áp dụng thư viện để thực cho tốn phân loại phê bình Từ đó, ta có quy trình phân loại thự sau: i Lần lượt duyệt nhóm danh mục phân loại bước tiền xử lý liệu để thực phân loại phê bình ii Từ liệu phê bình nhóm ta tạo liệu huấn luyện đánh giá có 50% liệu phê bình tích cực dựa tiêu chí overall lấy từ xuống theo giá trị overall 50% liệu phê bình tiêu cực dựa tiêu chí overall lấy từ lên theo giá trị overall Sau có chia liệu theo tỉ lệ 80% để huấn luyện 20% để đánh giá iii Đưa liệu huấn luyện vào huấn luyện để tạo mơ hình Sau dùng liệu cịn lại để thực đánh giá mơ hình 71 iv Sử dụng mơ hình huấn luyện để phân loại tồn liệu phê bình có nhóm danh mục thành hai loại phê bình tích cực phê bình tiêu cực v Từ liệu phê bình tích cực thu ta tiếp tục tạo liệu huấn luyện đánh giá dựa theo tiêu chí phê bình hữu ích phê bình có tỉ lệ người cho phê bình hữu ích so với số lượng người bình chọn 70% tương tự với phê bình khơng hữu ích 30% Sau ta chia liệu huấn luyện đánh giá theo tỉ lệ 8:2 vi Đưa liệu huấn luyện vào huấn luyện để tạo mơ hình vii Cuối sử dụng mơ hình huấn luyện để đánh giá tồn phê bình tích cực để có xác suất phê bình thuộc lớp phê bình hữu ích Tương tự ta làm với phê bình tiêu cực Phê bình Tạo liệu huấn luyện Huấn luyện Tích cực Phân loại Tiêu cực Tạo liệu huấn luyện Tạo liệu huấn luyện Huấn luyện Huấn luyện Tính xác suất Tính xác suất Hình 3.11 Quy trình phân loại phê bình 72 3.3.4 Biểu diễn kết Đối với kết gợi ý sản phẩm dựa việc kết hợp hành vi click xếp hạng bước dự báo huấn luyện, ta sử dụng để gợi ý danh sách sản phẩm mà người dùng quan tâm họ đăng nhập vào hệ thống cụ thể mô tả hình 3.12 Hình 3.12 Biểu diễn kết gợi ý sản phẩm website Còn với kết phân loại phê bình sử dụng việc hiển thị mặt tốt, mặt xấu sản phẩm người dùng click vào xem chi tiết sản phẩm Ngoài phê bình xếp theo thứ tự chất lượng phê bình dựa giá trị xác suất thuộc loại hữu ích Hình 3.13 Biểu diễn kết phân loại phê bình webs 73 3.4 Thiết kế hệ thống 3.4.1 Mơ hình thiết kế Dựa vào trình khai phá hành vi từ liệu review người dùng cho nhóm danh mục thiết bị điện tử, ta có mơ hình thiết hệ thống sau Original Data Data Filter Import Review Import Product Divide Category Database Recommend Review Recommend Rating API WEB Hình 3.14 Mơ hình thiết kế hệ thống 74 3.4.2 Chức thành phần Từ mơ hình thiết kế hệ thống, ta có chức thành phần hệ thống sau: Import Product: Đọc liệu sản phẩm từ file meta_Electronics.json chuyển đổi liệu từ chuỗi json sang liệu cấu trúc Sau đó, insert liệu vào database Import Review: Đọc liệu review từ file reviews_Electronics.json, chuyển đổi liệu từ chuỗi json insert vào database Data Filter: Làm liệu review cách loại bỏ liệu dư thừa ảnh hưởng đến trình huấn luyện dự báo hệ thống Divide Category: Kiểm tra phân loại sản phẩm thuộc nhóm danh mục Recommend Rating: Huấn luyện liệu hành vi click xếp hạng người dùng dựa phương pháp ALS Sau đó, đưa danh sách sản phẩm gợi ý cho người dùng Recommend Review: Sử dụng thuật tốn Nạve Bayes để phân loại liệu hành vi phê bình sản phẩm người dùng API: Cung cấp api để truy vấn lấy danh sách sản phẩm gợi ý, lấy thông tin sản phẩm nội dung phê bình kèm theo… Web: Tạo giao diện cho người dùng tương tác với hệ thống để lấy thông tin sản phẩm danh sách sản phẩm … 3.5 Kết thu nhận xét 3.5.1 Kết dự đoán dựa kết hợp click xếp hạng 3.5.1.1 Kết hợp click xếp hạng Với liệu dùng để thử nghiệm kết hợp click xếp hạng(rating) bao gồm: Số lượng người dùng: 1000 Số lượng sản phẩm liên quan: 26434 Số lượng rating: 60822 75 Số lượng click: 2105772 Ta thu kết giá trị sai số trường hợp sau: - Trường hợp 1: rui = rating Bảng 3.1 Số liệu sai số trường hợp Số vòng lặp - RMSE MSE MAE 2.8119 7.9065 2.2022 10 2.4659 6.0811 1.9257 15 2.4922 6.2111 1.9536 20 2.4301 5.9054 1.9106 Trường hợp 2: rui = click Bảng 3.2 Số liệu sai số trường hợp Số vòng lặp - RMSE MSE MAE 3.1275 9.7811 3.073 10 3.1259 9.7711 3.0718 15 3.1276 9.7817 3.0731 20 3.1282 9.7855 3.0733 Trường hợp 3: rui = rating/2 + click/4 Bảng 3.3 Số liệu sai số trường hợp Số vòng lặp RMSE MSE MAE 0.5999 0.3598 0.4383 10 0.6042 0.3651 0.4419 15 0.6065 0.3679 0.4434 20 0.6063 0.3677 0.4437 76 - Trường hợp 4: rui = rating/2 + click/8 Bảng 3.4 Số liệu sai số trường hợp Số vòng lặp RMSE MSE MAE 0.6004 0.3605 0.4371 10 0.6066 0.3679 0.4409 15 0.6066 0.3679 0.4412 20 0.6102 0.3723 0.4437 RMSE Trường hợp Trường hợp Trường hợp 3.5 2.5 1.5 0.5 10 15 20 Hình 3.15 Biểu diễn RMSE trường hợp 3.5.1.2 Xếp hạng Trong phần này, ta dùng toàn liệu xếp hạng thu thập sau trải qua bước tiền xử lý liệu ta có liệu đầu vào dùng để huấn luyện dự báo bao gồm: Số lượng người dùng: 182829 Số lượng sản phẩm liên quan: 176968 Số lượng rating: 1894015 Sau huấn luyện ta thu kết giá trị sai số sau Bảng 3.5 Số liệu sai số tồn liệu xếp hạng 77 Số vịng lặp 3.5.1.3 RMSE MSE MAE 3.0634 9.3845 2.2682 10 2.3644 5.5904 1.7879 15 2.1979 4.8306 1.6779 20 2.0844 4.3448 1.5977 Nhận xét Từ bảng số liệu sai số kể ta rút nhận xét sau: Việc kết hợp hành vi người dùng huấn luyện dự báo cho ta kết tốt so với việc xử lý hành vi riêng rẽ Trong phần hai liệu xếp hạng đưa vào huấn luyện nhiều phần một, nhiên lại cho kết tốt Từ đó, ta thấy bước tiền xử lý liệu đóng vai trị quan trọng trình khai phá hành vi người dùng 3.5.2 Kết phân loại phê bình Việc phân loại liệu hành vi phê bình sản phẩm người dùng ta thu kết biểu diễn sau REVIEW TEST 70000 60000 50000 40000 30000 20000 10000 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 REVIEW TEST Hình 3.16 Biểu diễn số lượng phê bình dùng để test danh mục 78 ACCURACY 100 90 80 70 60 50 40 30 20 10 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 ACCURACY Hình 3.17 Biểu diễn độ xác phân loại theo danh mục Sau phân loại thu phê bình tích cực phê bình tiêu cực Tiếp theo, ta có kết phân loại hữu ích phê bình tích cực phê bình tiêu cực sau POSITIVE REVIEW TEST 9000 8000 7000 6000 5000 4000 3000 2000 1000 ACCURACY 120 100 80 60 40 20 11 14 17 20 23 26 29 32 35 38 41 44 47 50 11 14 17 20 23 26 29 32 35 38 41 44 47 50 POSITIVE REVIEW TEST ACCURACY Hình 3.18 Biểu diễn số lượng phê bình tích cực dùng để test độ xác theo nhóm danh mục 79 NEGATIVE REVIEW TEST ACCURACY 3000 100 2500 80 2000 60 1500 40 1000 20 500 0 11 14 17 20 23 26 29 32 35 38 41 44 47 50 11 14 17 20 23 26 29 32 35 38 41 44 47 50 NEGATIVE REVIEW TEST ACCURACY Hình 3.19 Biểu diễn số lượng phê bình tiêu cực dùng để test độ xác theo nhóm danh mục Kết thử nghiệm phân loại phê bình cho thấy tỉ lệ xác trung bình phân loại phê bình tích cực tiêu cực phân loại độ hữu ích tương đối cao (80%: phân loại phê bình tích cực tiêu cực, 95%: phân loại hữu ích phê bình tích cực, 77%: phân loại hữu ích phê bình tiêu cực) Bên cạnh đó, độ xác nhóm danh mục tương đối ví dụ phân loại tích cực tiêu cực độ xác phân loại giao động khoảng 59% - 88% Như với kết phản ánh việc loại bỏ liệu dư thừa, phân loại sản phẩm vào nhóm danh mục q trình tiền xử lý liệu việc áp dụng thuật toán Naïve Bayes huấn luyện dự báo cho thấy tính đắn hiệu phương pháp 80 KẾT LUẬN Mơ hình hóa hành vi người dùng dựa liệu web đóng góp đáng kể mặt phương pháp luận việc nghiên cứu hành vi người dùng Trên sở này, cho phép khai phá hành vi người dùng tập liệu lớn để đưa gợi ý phù hợp cho người tiêu dùng hay kết phân tích dự báo giúp nhà phát triển, kinh doanh hiểu xu hướng hành vi người dùng tương lai Qua việc thực đề tài này, tác giả thu kết sau: Tìm hiểu số kỹ thuật khai phá liệu hệ gợi ý dựa hành vi người dùng sử dụng phổ biến Đưa mơ hình phù hợp cho tốn mơ hình hóa hành vi người dùng dựa liệu người dùng tương tác phản hồi sản phẩm Trong đó, có q trình khai phá hành vi kiến trúc hệ thống cho toán Trên sở mơ hình đưa ra, áp dụng liệu Amazon review sản phẩm người dùng vào mơ hình lựa chọn phương pháp gợi ý phù hợp thu kết thỏa mãn mục tiêu đề Bên cạnh đó, luận văn bộc lộ số mặt hạn chế sau: Việc thiếu liệu số hành vi người dùng dẫn đến việc kết hợp hành vi gợi ý cho kết khơng phản ánh tính đắn khách quan phương pháp Do hạn chế mặt thuật toán tài nguyên phần cứng hệ thống dẫn đến kết thu chưa đạt đến giá trị tối ưu Trên sở nghiên cứu, tác giả xin đưa định hướng phát triển cho đề tài sau: Áp dụng kỹ thuật xử lý ngôn ngữ tự nhiên việc phân tích ngữ nghĩa bình luận để việc phân loại xác Hồn thiện hệ thống để thu thập gợi ý cho người dùng từ hành vi tìm kiếm hay mua hàng… 81 Từ mơ hình nêu luận văn nghiên cứu để mở rộng mơ hình từ đáp ứng số tốn khác Cuối cùng, có nhiều cố gắng nhiên luận văn không tránh nhiều thiếu sót Rất mong tiếp nhận đóng gói ý kiến quý thầy cô bạn đọc để luận văn hoàn thiện ngày phát triển 82 TÀI LIỆU THAM KHẢO Sergio Hernández, Pedro Álvarez, Javier Fabra and Joaquín Ezpeleta (2017), Analysis of Users’ Behavior in Structured e-Commerce Websites, Department of Computer Science and Systems Engineering, Aragón Institute of Engineering Research, University of Zaragoza, Spain Bray, J.P(2008), Consumer Behaviour Theory: Approaches and Models, Bournemouth University, England Jiawei Han, Micheline Kamber, Jian Pei(2012), Data Mining Concepts and Techniques, Morgan Kaufmann Publishers Mansi Gera, Shivani Goel(2015), “Data Mining – Techniques, Methods and Algorithms: A Review on Tools and their Validity”, International Journal of Computer Applications Jure LesKovec, Anand Rajaraman, Jeff Ullman(2014), Mining of Massive Datasets, Stanford University, USA Lưu Nguyễn Anh thư, Nguyễn Thái Nghe(2015),”Phương pháp xây dựng hệ thống gợi ý sản phẩm sử dụng phản hồi tiềm ẩn”, Kỷ yếu Hội nghị Quốc gia lần VIII Nghiên cứu ứng dụng Trần Nguyễn Minh Thư, Phạm Xuân Hiền(2016),”Các phương pháp đánh giá hệ thống gợi ý”, Tạp chí Khoa học Trường Đại học Cần Thơ Oded Maimon, Lior Rokach, Introduction to knowledge discovery in databases, Department of industrial Engineering, Tel-Aviv University, Israel Haoming Li, Bangzheng He, Micheal Lublin, Yonathan Perez(2015), Matrix completion via Alternating Least Square, Stanford University, USA 10 Christopher D Manning, Prabhakar Raghavan, Hinrich Schutze(2008), Introduction to Information Retrieval, Cambridge University Press, England 83 11 Dipeeka K.Rathod, Neha Valmik(2014),”Overview of Data Mining Techniques”, Advances in Computer Science and Information Technology(ACSIT) 12 Hsiang-Fu Yu, Cho-Jui Hsieh, Si Si, Inderjit S Dhillon(2013), Parallel Matrix Factorization for Recommender Systems, Department of Computer Science, The University of Texas, USA 13 Payal Pahwa, Manju Papreja, Renu Miglani(2014), “Performance Analysis of Classification Algorithms”, International Journal of Computer Science and Mobile Computing 84 ... 2.1.2 Hành vi người dùng liệu web Trong tốn mơ hình hóa hành vi người dùng vi? ??c hành vi có tập liệu có vai trị quan trọng giúp ta phân tích lựa chọn phương pháp gợi ý phù hợp Hành vi người dùng. .. Trần Trung Hiếu NGHIÊN CỨU PHƯƠNG PHÁP MÔ HÌNH HĨA HÀNH VI NGƯỜI DÙNG DỰA TRÊN DỮ LIỆU WEB Chuyên ngành : Hệ thống thông tin LUẬN VĂN THẠC SĨ KHOA HỌC HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA... tạo người dùng( như click, view, comment…) Dữ liệu lưu trữ phương thức gọi chung liệu web Hành vi người dùng có liệu web có giá trị cần phải phát phân tích để cải thiện nội dung cấu trúc trang web