1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu giải pháp tư vấn lai sử dụng đồng huấn luyện

26 634 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 26
Dung lượng 682,8 KB

Nội dung

Nghiên cứu giải pháp tư vấn lai sử dụng đồng huấn luyệnNghiên cứu giải pháp tư vấn lai sử dụng đồng huấn luyệnNghiên cứu giải pháp tư vấn lai sử dụng đồng huấn luyệnNghiên cứu giải pháp tư vấn lai sử dụng đồng huấn luyệnNghiên cứu giải pháp tư vấn lai sử dụng đồng huấn luyệnNghiên cứu giải pháp tư vấn lai sử dụng đồng huấn luyệnNghiên cứu giải pháp tư vấn lai sử dụng đồng huấn luyện

HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG - NGUYỄN ĐỖ HẢI NGHIÊN CỨU GIẢI PHÁP TƢ VẤN LAI SỬ DỤNG ĐỒNG HUẤN LUYỆN Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2016 i Luận văn hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: PGS TS Từ Minh Phương Phản biện 1: ……………………………………………… Phản biện 2: ……………………………………………… Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Công nghệ Bưu Viễn thông Vào lúc: ngày tháng năm … Có thể tìm hiểu luận văn tại: - Thư viện Học viện Công nghệ Bưu Viễn thông ii MỤC LỤC MỞ ĐẦU .1 CHƢƠNG - GIỚI THIỆU Hệ t ố 1.1 tƣ vấ 1.1.1 Mục đích 1.1.2 Các thành phần 1.1.3 Một số tác vụ hệ thống tư vấn Một số p ƣơ 1.2 p áp tƣ vấ p át triển 1.2.1 Phương pháp tư vấn dựa lọc cộng tác 1.2.2 Phương pháp tư vấn dựa nội dung 1.2.3 Phương pháp tư vấn dựa thông tin cá nhân 1.2.4 Phương pháp tư vấn lai Kết luậ c ƣơ 1.3 .5 CHƢƠNG GIẢI PHÁP TƢ VẤN LAI SỬ DỤNG ĐỒNG HUẤN LUYỆN P ƣơ 2.1 p áp đồng huấn luyện 2.1.1 Tổng quan phương pháp đồng huấn luyện 2.1.2 Một số ứng dụng phương pháp đồng huấn luyện Đề xuất giải p áp tƣ vấn lai sử dụ 2.2 đồng huấn luyện 2.2.1 Mô tả toán 2.2.2 Giải pháp tổng thể 2.2.3 Một số phương pháp tính độ tin cậy Xây dựng giải p áp tƣ vấn 2.3 2.3.1 Xây dựng hồi quy 2.3.2 Đồng huấn luyện 2.3.3 Tổng hợp kết 2.4 Kết luậ c ƣơ .9 CHƢƠNG - THỰC NGHIỆM VÀ ĐÁNH GIÁ .11 3.1 Mô tả iệu 11 3.1.1 Mô tả liệu MovieLens 11 3.1.2 Thu thập thông tin bổ sung phim 11 3.2 P ƣơ p áp t nghiệm 12 iii 3.2.1 Phân chia liệu 12 3.2.2 Xây dựng mô hình hồi quy lọc cộng tác 12 3.2.3 Xây dựng mô hình hồi quy dựa nội dung 12 3.2.4 Đồng huấn luyện 12 3.2.5 Tổng hợp kết 12 3.3 Kết v đá iá 12 3.3.1 Các số đánh giá 12 3.3.2 Kết thực nghiệm 13 3.3.3 Nhận xét phân tích kết 13 3.4 Kết luậ c ƣơ 14 KẾT LUẬN 16 TÀI LIỆU THAM KHẢO 18 iv DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT Viết tắt Tiếng Anh Tiếng Việt API Application Programming Interface Thư viện lập trình ứng dụng CONFINE CONFidence estimation based on the Neighbors’ Errors Ước lượng độ tin cậy dựa sai số hàng xóm CONFIVE CONFidence estimation based on the Variance in the Envỉonment Ước lượng độ tin cậy dựa biến thiên môi trường MAE Mean Absolute Error Sai số tuyệt đối trung bình RMSE Root Mean Square Error Sai số bình phương trung bình SVM Support Vector Machine Máy vector tựa v DANH SÁCH BẢNG Bảng 3.1 - Kết đánh giá hiệu ba phương pháp qua vòng lặp 13 Bảng 3.2 - Bảng so sánh hiệu phương pháp tư vấn .13 vi DANH SÁCH HÌNH VẼ Hình 2.1 - Các bước xây dựng mô hình hồi quy lọc cộng tác Hình 2.2 - Các bước xây dựng mô hình hồi quy dựa nội dung MỞ ĐẦU Ngày nay, người sống thời đại số, nơi mà mạng Internet phổ biến khắp toàn cầu Mỗi người dùng Internet tiếp cận với nhiều nguồn thông tin khác Do họ tìm thấy bất cử thứ muốn Internet Tuy nhiên có vấn đề đặt thông tin thực cần thiết cho người dùng Internet hàng nghìn nguồn thông tin khác mạng Internet? Ví dụ vào trang Web để xem phim Netflix, có hàng trăm nghìn phim sở liệu Netflix đưa cho người dùng lựa chọn Và lúc này, người dùng khó khăn để tìm phim mà họ muốn xem số lượng lớn phim Để giải vấn đề này, hệ thống tư vấn [6][8][15][19] đời với nhiệm vụ đưa gợi ý giúp cho người dùng dễ dàng tìm thông tin mà cần tìm cách nhanh chóng xác Đã có nhiều nghiên cứu thực để tìm phương pháp tư vấn hiệu Một số phương pháp cho kết tốt như: phương pháp tư vấn dựa lọc cộng tác [8][19], phương pháp tư vấn theo nội dung [8], phương pháp tư vấn dựa thông tin cá nhân [15] phương pháp lai phương pháp Từ trước đến nay, phương pháp tư vấn tư vấn dựa nội dung, tư vấn dựa lọc cộng tác có hướng khai thác khía cạnh liệu khác để đưa tư vấn cách tốt Mỗi phương pháp tư vấn lại có số nhược điểm riêng vấn đề cold-start phương pháp lọc cộng tác, hay vấn đề thiếu thông tin phương pháp lọc theo nội dung Để giải vấn đề này, phương pháp tư vấn lai đời để kết hợp phương pháp tư vấn lại với để khắc phục nhược điểm Mục đích luận văn xây dựng hệ thống tư vấn lai vậy, phương pháp lai sử dụng luận văn phương pháp đồng huấn luyện Đây phương pháp dùng để kết hợp hai phương pháp tư vấn phương pháp tư vấn dựa lọc cộng tác phương pháp tư vấn dựa nội dung lại với Phương pháp đồng huấn luyện thường bổ sung dự đoán hai hồi quy lẫn để huấn luyện lại Tuy nhiên việc bổ sung toàn dự đoán chưa tính toán đến việc dự đoán sai dẫn đến việc sử dụng dự đoán sai ảnh hưởng đến độ xác mô hình hồi quy lại Để giải vấn đề này, phương pháp luận văn sử dụng cải tiến: trước bổ sung giá trị dự đoán hồi quy vào tập huấn luyện hồi quy lại, ta thêm bước ước lượng độ tin cậy dự đoán; dự đoán có độ tin cậy cao bổ sung vào liệu huấn luyện cho hồi quy lại Cải tiến cho phép giảm ảnh hưởng dự đoán sai tới vòng lặp đồng huấn luyện sau Có nhiều cách để tính toán độ xác dự đoán, luận văn lựa chọn hai phương pháp CONFINE CONFIVE [4] để tính độ tin cậy dự đoán mô hình hồi quy Luận văn có nội dung tiếp nối nghiên cứu học viên hệ tư vấn, số kết liên quan đăng tạp chí Information sciences [3] trinhg bày hội nghị SoCPAR 2013 [8] Với mục tiêu vậy, bố cục luận văn bao gồm bốn chương theo cấu trúc sau: Chƣơng 1: Giới thiệu Trình bày cách tổng quan mục tiêu, ý nghĩa thành phần hệ tư vấn Giới thiệu qua số phương pháp tư vấn phát triển ưu nhược điểm Chƣơng 2: Giải pháp tƣ vấn lai sử dụ đồng huấn luyện Nội dung chương làm sáng tỏ mặt lý thuyết cho hệ thống tư vấn mà luận văn định xây dựng Phần đầu chương sâu tìm hiểu phương pháp đồng huấn luyện Sau đó, luận văn đề xuất giải pháp tư vấn lai sử dụng đồng huấn luyện có cải tiến Cuối luận văn sâu vào bước để xây dựng nên hệ thống tư vấn sử dụng giải pháp đề xuất Chƣơng 3: Thực nghiệm đá giá Chương mô tả bước để triển khai giải pháp đề xuất chương vào thực tiễn Bên cạnh nội dung chương tiến hành đánh giá kết đạt thông qua số độ đo thường sử dụng cho toán tư vấn Kết luận Tổng kết toán, tóm tắt kết đạt chưa đạt Từ đề xuất mục tiêu hướng tới hướng nghiên cứu, phát triển 1.2.1.1 Giới thiệu chung 1.2.1.2 Phân loại phương pháp tư vấn dựa lọc cộng tác 1.2.2 Phương pháp tư vấn dựa nội dung 1.2.2.1 Giới thiệu chung 1.2.2.2 Phương pháp biểu diễn đối tượng tư vấn 1.2.2.3 Một số phương pháp xây dựng mô hình sở thích người dùng 1.2.3 Phương pháp tư vấn dựa thông tin cá nhân 1.2.4 Phương pháp tư vấn lai 1.3 Kết luậ c ƣơ Tóm lại, hệ thống tư vấn xây dựng nhằm mục đích đưa gợi ý cho người dùng số sản phẩm mà họ quan tâm dựa nhiều nguồn thông tin khác Các hệ thống tư vấn có ý nghĩa quan trọng không với người sử dụng hệ thống tư vấn, mà có ý nghĩa với nhà cung cấp dịch vụ tư vấn Có bốn phương pháp tư vấn hay sử dụng phương pháp tư vấn dựa lọc cộng tác, phương pháp tư vấn dựa nội dung, phương pháp tư vấn dựa thông tin cá nhân phương pháp lai Trong số đó, phương pháp tư vấn lai lên phương pháp tốt phương pháp kết hợp nhiều phương pháp tư vấn khác lại với để khắc phục nhược điểm Do đó, nội dung luận văn xây dựng phương pháp tư vấn lai kết hợp ba phương pháp tư vấn lại lại với phương pháp có tên phương pháp đồng huấn luyện Chương luận văn xây dựng sở lý thuyết cho phương pháp tư vấn lai sử dụng đồng huấn luyện CHƢƠNG GIẢI PHÁP TƢ VẤN LAI SỬ DỤNG ĐỒNG HUẤN LUYỆN Nội dung chương hai tìm hiểu phương pháp thường sử dụng để xây dựng hệ thống tư vấn lai có khả tận dụng liệu chưa gán nhãn có tên phương pháp đồng huấn luyện Từ tìm hiểu đó, luận văn đề xuất giải pháp tư vấn lai sử dụng phương pháp đồng huấn luyện để giải toán dự đoán đánh giá Phương pháp đồng huấn luyện trước [2][5] thường thêm tất giá trị dự đoán vào huấn luyện cho phân loại sau, nhiên dự đoán tồn số dự đoán lỗi mà ảnh hưởng đến xác bước Để giải vấn đề này, luận văn cải tiến thuật toán đồng huấn luyện thông thường bắng cách thêm vào trình đồng huấn luyện bước tính toán độ tin cậy dự đoán để loại bỏ dự đoán sai, từ chi có dự đoán sử dụng để huấn luyện cho bước đồng huấn luyện Có nhiều phương pháp tính độ tin cậy khác nhau, luận văn sử dụng hai phương pháp tính độ tin cậy thích hợp cho toán hồi quy phương pháp CONFINE [4] phương pháp CONFIVE [4] Sau loại bỏ ô dự đoán sai kết xác 2.1 P ƣơ p áp đồ uấ uyệ 2.1.1 Tổng quan phương pháp đồng huấn luyện Học bán giám sát kỹ thuật học máy thu hút nhiều ý nhà nghiên cứu số lượng lớn liệu chưa gán nhãn sử dụng để cải thiện hiệu thuật toán học máy sử dụng liệu có gán nhãn không đủ để làm điều Blum Mitchell [5] lần xem xét đến vấn dề chia thông tin mẫu liệu thành hai phần hai góc nhìn độc lập Ví dụ, trang Web biểu diễn từ xuất trang Web đó, bểu diễn từ xuất siêu liên kết trỏ tới trang Web Do cần sử dụng hai cách biểu diễn để phân loại trang Web Phương pháp phân chia đặc điểm đối tượng thành hai phần gọi đồng huấn luyện 2.1.2 Một số ứng dụng phương pháp đồng huấn luyện 2.1.2.1 Bài toán phân loại 2.1.2.2 Bài toán dự đoán đánh giá 2.2 Đề xuất iải p áp tƣ vấ sử dụ đồ uấ uyệ 2.2.1 Mô tả toán Đầu vào: - Tập người dùng , - Tập phim , - Ma trận đánh giá người dùng cho số phim Đầu ra: - Ma trận dự đoán đánh giá người dùng cho tất phim Giải pháp: Sử dụng phương pháp tư vấn để xây dựng nên mô hình dự đoán đánh giá cho ô thiếu ma trận ban đầu Cụ thể luận văn sử dụng phương pháp đồng huấn luyện để kết hợp phương pháp tư vấn lọc cộng tác phương pháp tư vấn dựa nội dung 2.2.2 Giải pháp tổng thể 2.2.3 Một số phương pháp tính độ tin cậy 2.2.3.1 CONFINE 2.2.3.2 CONFIVE 2.3 Xây dự iải p áp tƣ vấ Nội dung phần trình bày trình thực nghiệm để triển khai bước giải pháp tư vấn đề xuất Nội dung mô tả cách huấn luyện hai hồi quy dựa liệu có Tiếp theo, mô tả cách triển khai phương pháp đồng huấn luyện Cuối cùng, mô tả cách kết hợp kết hồi quy để đưa kết dự đoán cuối 2.3.1 Xây dựng hồi quy 2.3.1.1 Bộ hồi quy lọc cộng tác Hình 2.1 - Các bƣớc xây dựng mô hình hồi quy lọc cộng tác a Đầu vào: b Đầu ra: c Pha huấn luyện: d Pha dự đoán: 2.3.1.2 Bộ hồi quy dựa nội dung Hình 2.2 - Các bƣớc xây dựng mô hình hồi quy dựa nội dung a Đầu vào b Đầu c Biểu diễn đối tượng tư vấn d Pha huấn luyện e Pha dự đoán 2.3.2 Đồng huấn luyện Như trình bày phần đề xuất giải pháp, bước đồng huấn luyện lặp lặp lại k lần số bước Việc đồng huấn luyện có mục đích tận dụng dự đoán có độ tin cậy cao hồi quy làm liệu đầu vào cho liệu để cải thiện độ xác thuật toán Cụ thể, có ba bước cần lặp lại qua lần đồng huấn luyện bao gồm (1) tính toán với hồi quy lọc cộng tác , (2) tính toán với hồi quy dựa nội dung , (3) cập nhật lại hai hồi quy Nội dung phần luận văn trình bày cụ thể việc cần làm ba bước 2.3.2.1 Tính toán với hồi quy lọc cộng tác 2.3.2.2 Tính toán với hồi quy dựa nội dung 2.3.2.3 Cập nhật hai hồi quy 2.3.3 Tổng hợp kết Kết thúc trình đồng huấn luyện, ta thu hai hồi quy Hai hồi quy có khả đưa dự đoán cho ô thiếu ma trận đầu vào Như vậy, lúc ta có hai giá trị dự đoán cho cho ô tương ứng với giá trị dự đoán hai hồi quy cạnh ta tính độ tin cậy hai dự đoán là Bên Nhiệm vụ bước tổng hợp kết kết hợp hai giá trị dự đoán lại để giá trị dự đoán cuối 2.4 Kết uậ c ƣơ Như vậy, nội dung chương tìm hiều phương pháp đồng huấn luyện, từ đề xuất giải pháp tư vấn lai sử dụng phương pháp đồng huấn luyện 10 Giải pháp đề xuất để giải toán dự đoán đánh giá cách kết hợp phương pháp tư vấn lọc cộng tác phương pháp tư vấn dựa nội dung lại với Phần cuối chương trình bày nội dung cụ thể bước để xây dựng nên giải pháp đề xuất Cụ thể, phương pháp đồng huấn luyện phương pháp học bán giám sát, sử dụng để tận dụng số lượng lớn liệu chưa gán nhãn để cải thiện hiệu thuật toán học máy sử dụng liệu có gán nhãn không đủ để làm điều Phương pháp đồng huấn luyện áp dụng để giải toán phân loại văn bản, hay toán tư vấn Cụ thể luận văn đề xuất môt giải pháp tư vấn sử dụng phương pháp đồng huấn luyện kết hợp hai phương pháp tư vấn dựa lọc cộng tác tư vấn theo nội dung Giải pháp tư vấn lai sử dụng phương pháp đồng huấn luyện đề xuất luận văn giải toán dự đoán đánh giá người dùng cho phim Đầu vào hệ thống bao gồm tập người dùng, tập phim, ma trận đánh giá người cho số phim Giải pháp đề xuất bao gồm ba bước: - Xây dựng hai hồi quy: hồi quy lọc cộng tác hồi quy dựa nội dung, – Đồng huấn luyện, - Tổng hợp kết Như toàn chương xây dựng hệ thống tư vấn lai sử dụng phương pháp đông huấn luyện Nhiệm vụ chương xây dựng hệ thống thực nghiệm để kiểm tra tính đắn giải pháp đề 11 CHƢƠNG - THỰC NGHIỆM VÀ ĐÁNH GIÁ Để kiểm chứng độ xác giải pháp đề xuất, nội dung chương trình bày việc triển khai hệ thống thực nghiệm triển khai giải pháp Sau sử dụng số số để đánh giá hiệu hệ thống Cuối số nhận xét kết thu từ hệ thống 3.1 Mô tả iệu 3.1.1 Mô tả liệu MovieLens Trong luận văn này, hệ thống thực nghiệm sử dụng liệu đầu vào liệu MovieLens Bộ liệu MovieLens liệu thu thập dự án nghiên cứu GroupLens Mỗi người dùng liệu gán ID định danh nhất, họ có kèm theo số thông tin cá nhân tuổi, giới tính, nghề nghiệp zipcode Trong mức tuổi người dùng từ đến 73 tuổi, giới tính người dùng có hai lựa chọn nam nữ Nghề nghiệp người dùng có 21 loại Mỗi người dùng có 20 đánh giá cho phim Tương tự người dùng, phim gán ID định danh nhất, thông tin kèm theo phim có tiêu đề phim, ngày phát sóng, đường dẫn tới trang IMDb1, thể loại phim (bao gồm 19 thể loại) Mỗi phim xếp vào hay nhiều thể loại khác Tuy nhiên thông tin chưa đủ để mô tả nội dung phim, phần luận văn trình bày cách thu thập số nội dung phim 3.1.2 Thu thập thông tin bổ sung phim Như trình bày trên, thông tin phim liệu MovieLens không đủ để xây dựng phương pháp tư vấn dựa http://www.imdb.com/ 12 nội dung Do đó, luận văn thu thập thêm thông tin phim thông qua Web API có tên OMDb2 3.2 P ƣơ p áp t iệm 3.2.1 Phân chia liệu 3.2.2 Xây dựng mô hình hồi quy lọc cộng tác 3.2.2.1 Chuẩn bị đầu vào 3.2.2.2 Xây dựng mô hình hồi quy 3.2.2.3 Phương pháp dự đoán 3.2.3 Xây dựng mô hình hồi quy dựa nội dung 3.2.3.1 Chuẩn bị đầu vào 3.2.3.2 Xây dựng mô hình hồi quy 3.2.3.3 Phương pháp dự đoán 3.2.4 Đồng huấn luyện 3.2.4.1 Chuẩn bị đầu vào 3.2.4.2 Đồng huấn luyện 3.2.5 Tổng hợp kết 3.3 Kết v đá iá 3.3.1 Các số đánh giá Để đánh giá độ xác giải pháp đề xuất, sử dụng hai số đánh giá Root Mean Square Error (RMSE) Mean Absolute Error (MAE) RMSE MAE hai số thường sử dụng để đánh giá độ xác hồi quy http://www.omdbapi.com/ 13 3.3.2 Kết thực nghiệm 3.3.2.1 Kết với liệu tổng thể Bảng 3.1 - Kết đá iá iệu ba p ƣơ confine + no round p áp qua vòng lặp confine + round confive + round Loop RMSE MAE RMSE MAE RMSE MAE 0.91631 0.71726 0.91495 0.71639 0.91443 0.71548 0.91524 0.71671 0.91445 0.71568 0.91451 0.71620 0.91461 0.71593 0.92060 0.71838 0.91452 0.71587 0.91533 0.71632 0.91623 0.71714 0.91486 0.71637 0.91643 0.71784 0.91484 0.71633 0.91557 0.71640 10 0.91619 0.71715 0.91538 0.71644 0.91495 0.71639 Bảng 3.2 - Bảng so sánh hiệu p ƣơ p áp tƣ vấn CF RMSE 0.91635 MAE 0.71754 CBF 1.02161 0.78950 confine + no round 0.91461 0.71593 confine + round 0.91445 0.71568 confive + round 0.91443 0.71548 Baseline Cotraining 3.3.2.2 Kết với trường hợp Cold-start 3.3.3 Nhận xét phân tích kết 3.3.3.1 So sánh với phương pháp baseline Dựa vào Bảng 3.5 ta thấy phương pháp tư vấn lai dựa đồng huấn luyện đề xuất có tỷ lệ lỗi giảm so với phương pháp tư vấn phương pháp tư vấn dựa lọc cộng tác phương pháp tư vấn dựa nội dung Với ba cách lựa chọn độ tin cậy hai số RMSE MAE thấp so với hai phương pháp 3.3.3.2 So sánh phương pháp lựa chọn độ tin cậy 14 Theo Bảng 3.4, thấy, việc lựa chọn phương pháp CONFIVE có số RMSE MAE thấp so với phương pháp CONFINE tất vòng lặp từ đến 10 bước đồng huấn luyện, số RMSE phương pháp CONFIVE lớn hơn, đặc biệt vòng đầu tiên, số lớn so với phương pháp CONFINE khoảng 0.0019 Từ Bảng 3.4 ta thấy việc làm tròn đánh giá trước cho vào huấn luyện hồi quy khác Để kiểm chứng điều này, nhìn vào so sánh hai phương pháp CONFINE+No round CONFINE+Round, hai phương pháp sử dụng phương pháp tính độ tin cậy Chúng ta thấy rõ số RMSE MAE phương pháp CONFINE+Round thấp 3.3.3.3 Vấn đề Cold-start Từ Bảng 3.6 ta thấy giải pháp tư vấn lai sử dụng đồng huấn luyện cải thiện độ xác cho dự đoán với đối tượng đánh giá Cụ thể, 10 bin liệu, bin1 có số lượng đánh giá trung bình cho phim nhất, lại bin có số RMSE phương pháp tư vấn lai 1.0148, số thấp ba phương pháp 3.4 Kết uậ c ƣơ Tóm lại, nội dung chương mô tả lại cách xây dựng nên hệ thống tư vấn phương pháp lại sử dụng đồng huấn luyện để kết hợp phương pháp tư vấn lọc cộng tác phương pháp tư vấn dựa nội dung lại với Bộ liệu MovieLens sử dụng làm liệu đầu vào MovieLens liệu cung cấp thông tin đánh giá người dùng cho phim Bộ liệu chứa số thông tin người dùng phim Ngoài thông tin từ liệu MovieLens, hệ thống thu thập số thông tin phim IMDb Hệ thống tư vấn xây dựng qua ba bước Bước xây dựng hồi quy lọc cộng tác hồi quy dựa nội dung Bộ hồi quy dựa lọc cộng tác xây dựng phương pháp phân tích ma trận sử dụng công cụ 15 MyMedialite, hồi quy dựa nội dung xây dựng mô hình học máy SVM sử dụng công cụ SVM-Light Bước thứ hai trình đồng huấn luyện Ở bước này, có ba thủ tục lặp lặp lại (1) tính toán hồi quy lọc cộng tác, (2) tính toán hồi quy dựa nội dung (3) cập nhật lại hai hồi quy Bước cuối tổng hợp kết quả, bước sử dụng hai hồi quy tăng cường liệu đồng huấn luyện để dự đoán giá trị đánh giá chưa biết Bước tổng hợp kết sử dụng phương pháp voting để kết hợp hai giá trị dự đoán hai hồi quy đưa giá trị dự đoán cuối Kết thu từ trình thực nghiệm khả quan Cụ thể, số RMSE MAE giải pháp đề xuất giảm so với hai phương pháp tư vấn lọc cộng tác phương pháp tư vấn theo nội dung Ngoài việc sử dụng độ tin cậy CONFIVE làm tròn đánh giá trước bổ sung vào hồi quy làm tăng độ xác hệ thống Cuối cùng, giải pháp đề xuất phần giải vấn đề cold-start mà số RMSE phương pháp đề xuất nhỏ so với hai phương pháp lại 16 KẾT LUẬN Trên sở tìm hiểu việc xây dựng hệ thống tư vấn, cụ thể tác vụ dự đoán đánh giá người dùng cho đối tượng chưa đánh giá, luận văn đạt số kết sau: - Tìm hiểu cách cụ thể hệ thống tư vấn, khía cạnh tìm hiểu bao gồm mục đích, thành phần chính, tác vụ số phương pháp tư vấn phát triển - Nghiên cứu phương pháp đồng huấn luyện phương pháp học bán giám sát có khả tận dụng liệu chưa gán nhãn để tăng độ xác hệ thống Đưa ý tưởng việc sử dụng phương pháp đồng huấn luyện để xây dựng hệ thống tư vấn - Đề xuất giải pháp tư vấn lai sử dụng phương pháp đồng huấn luyện kết hợp phương pháp tư vấn lọc cộng tác phương pháp tư vấn dựa nội dung để giải toán dự đoán đánh giá - Ứng dụng hai phương pháp tính độ tin cậy CONFINE CONFIVE để tính toán độ tin cậy dự đoán mô hình hồi quy sử dụng phương pháp đồng huấn luyện - Tiến hành thực nghiệm cho giải pháp đề xuất dựa liệu MovieLens, từ đưa nhận xét kết thu Bên cạnh kết thu luận văn số hạn chế là: - Độ xác dự đoán hệ thống chưa cải thiện nhiều việc kết hợp kết dự đoán chưa hoàn toàn phù hợp - Luận văn giải vấn đề cold-start cho trường hợp phim chưa giải vấn đề cold-start cho người dùng Từ kết thu hạn chế nêu trên, thấy việc xây dựng nên hệ thống tư vấn nói chung việc giải toán dự đoán đánh 17 giá nói riêng cần trình nghiên cứu dài để cải tiến chúng Nội dung luận văn trình bày việc kết hợp hai phương pháp tư vấn lại với nhau, nhiên hệ thống tư vấn lai kết hợp nhiều phương pháp Hướng phát triển luận văn là: - Tìm kiếm phương pháp kết hợp kết dự đoán mô hình cách tốt để tăng độ xác dự đoán - Áp dụng thêm phương pháp tư vấn dựa thông tin cá nhân vào mô hình đồng huấn luyện để giải trường hợp cold-start cho người dùng 18 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt: [1] Từ Minh Phương, Học viện Công nghệ Bưu Viễn thông (2014), Giáo trình Trí tuệ nhân tạo [2] Nguyễn Việt Tân, Hoàng Vũ, Đặng Vũ Tùng, Từ Minh Phương (2014), “Phân loại liệu có liên kết sử dụng phương pháp đồng huấn luyện”, Tạp chí Khoa học DHQGHN: Khoa học Tư nhiên Công nghệ, Tập 30, Số 4, trang 48-57 Tài liệu tiếng Anh: [3] Ngo Xuan Bach, Nguyen Do Hai, Tu Minh Phuong (2016), “Personalized recommendation of stories for commenting in forum-based social media”, Information Sciences, pp 48-60 [4] S Briesemeister, J Rahrienführer, O Kohlbacher (2012), “No longer confidential: estimating the confidence of individual regression predictions”, PLoS ONE [5] A Blum, T Mitchell (1998), “Combining Labeled and Unlabeled Data with CoTraining”, In Proceedings of COLT, pp 92-100 [6] A Felfernig, M Jeran, G Ninaus, F Reinfrank, S Reiterer, M Stettinger (2014), “Basic approaches in recommendation systems”, In Recommendation Systems in Software Engineering, pp 15-37 [7] Ed Greengrass(2000), Information Retrieval: A Survey [8] Nguyen Do Hai, Tran Quang An, Ngo Xuan Bach, Tu Minh Phuong (2013), “What Should I Comment: Recommending Posts for Commenting”, International Conference of Soft Computing and Pattern Recognition, Hà Nội [9] J Han, M Kamber (2000), Data Mining: Concepts and Techniques [10] W Hill, L Stead, M Rosenstein, and G Furnas (1995), “Recommending and evaluating choices in a virtual community of use”, In Proceedings of the SIGCHI conference on Human factors in computing systems, pp 194–201 19 [11] Joachims, Freitag, Mitchell (1997), “WebWatcher: A Tour Guide for the World Wide Web”, In Proceedings of the 15th International Joint Conference on Artificial Intelligence, Nagoya, Japan, pp 770 -775 [12] Pazzani, Billsus (1997), “Learning and revising user profiles: The identification of interesting web sites”, Machine learning, 27(3), pp 313-331 [13] Prasad, Kumari (2012), “A categorical review of recommender systems”, International Journal of Distributed and Parallel Systems (IJDPS) Vol.3, No.5 [14] F Ricci, Lior Rokach, and Bracha Shapira (2011), Introduction to recommender systems handbook, Springer US [15] Laila Safoury, Akram Salah (2013), “Exploiting User Demographic Attributes for Solving Cold-Start Problem in Recommender System”, Lecture Notes on Software Engineering Vol 1, No [16] Shardanand, Maes, (1995, May), “Social information filtering: algorithms for automating “word of mouth” ” In Proceedings of the SIGCHI conference on Human factors in computing systems , pp 210-217 [17] Z Tao, M Cheung, J She, R Lam (2014), “Item Recommendation Using Collaborative Filtering in Mobile Social Games: A Case Study”, In Big Data and Cloud Computing (BdCloud), 2014 IEEE International Conference, pp 293-297 [18] Loren Terveen, Will Hill (2001), “Beyond Recommender Systems: Helping People Help Each Other”, HCI in the New Millennium 1, pp 487-509 [19] L Ungar, D Foster (1998), “Clustering methods for collaborative filtering”, In Proceedings of the Workshop on Recommendation Systems, AAAI Press, Menlo Park California

Ngày đăng: 02/12/2016, 04:03

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN