1. Trang chủ
  2. » Thể loại khác

MỘT MÔ HÌNH GIẢI QUYẾT VẤN ĐỀ KHỞI ĐẦU NGUỘI TRONG TƯ VẤN XÃ HỘI DỰA TRÊN PHƯƠNG PHÁP MA TRẬN NHÂN TỬ. KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY

51 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề MỘT MÔ HÌNH GIẢI QUYẾT VẤN ĐỀ KHỞI ĐẦU NGUỘI TRONG TƯ VẤN XÃ HỘI DỰA TRÊN PHƯƠNG PHÁP MA TRẬN NHÂN TỬ
Tác giả Nguyễn Hữu Tú
Người hướng dẫn PGS-TS Hà Quang Thụy, ThS. NCS. Lê Hoàng Quỳnh
Trường học Đại học Quốc gia Hà Nội, Trường Đại học Công nghệ
Chuyên ngành Công Nghệ Thông Tin
Thể loại Khóa luận tốt nghiệp Đại học hệ chính quy
Năm xuất bản 2017
Thành phố Hà Nội
Định dạng
Số trang 51
Dung lượng 3,74 MB

Nội dung

Khóa luận này trình bày vấn đề khởi đầu nguội trong hệ tư vấn xã hội, nhóm các phương pháp và hướng giải quyết dựa vào nghiên cứu của Uroš Ocepek và cộng sự.. Một đặc điểm quan trọng tro

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Nguyễn Hữu Tú

MỘT MÔ HÌNH GIẢI QUYẾT VẤN ĐỀ

KHỞI ĐẦU NGUỘI TRONG TƯ VẤN XÃ HỘI DỰA TRÊN PHƯƠNG PHÁP MA TRẬN NHÂN TỬ

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY

Ngành: Công Nghệ Thông Tin

HÀ NỘI - 2017

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Nguyễn Hữu Tú

MỘT MÔ HÌNH GIẢI QUYẾT VẤN ĐỀ

KHỞI ĐẦU NGUỘI TRONG TƯ VẤN XÃ HỘI

DỰA TRÊN PHƯƠNG PHÁP MA TRẬN NHÂN TỬ

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY

Cán bộ đồng hướng dẫn: ThS NCS Lê Hoàng Quỳnh

HÀ NỘI - 2017

Trang 3

VIETNAM NATIONAL UNIVERSITY, HANOI UNIVERSITY OF ENGINEERING AND TECHNOLOGY

Nguyen Huu Tu

A MODEL ADDRESSES THE COLD-START PROBLEM

IN SOCIAL RECOMMENDATION BASED ON THE MATRIX FACTORIZATION METHOD

Major: Information Technology

Supervisor: Assoc Prof Dr.Sc Ha Quang Thuy

Co-Supervisor: M.Sc Le Hoang Quynh

HANOI - 2017

Trang 4

LỜI CẢM ƠN

Lời đầu tiên, tôi xin gửi lời biết ơn chân thành đến thầy giáo PGS-TS Hà Quang Thụy đã tận tình chỉ bảo, hướng dẫn, giúp đỡ tôi trong suốt quá trình tôi thực hiện khóa luận

Tôi xin gửi lời cảm ơn chân thành đến các thầy, cô trong khoa Công nghệ thông tin, trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã truyền đạt cho tôi những kiến thức bổ ích để tôi có đủ hành trang, kiến thức phục vụ công việc sau này

Tôi xin cảm ơn tập thể sinh viên K58CLC Trường Đại học Công Nghệ đã ủng hộ

và khuyến khích tôi trong quá trình nghiên cứu và thực hiện khóa luận này

Tôi cũng xin gửi lời cảm ơn tới các thầy cô, anh chị và các bạn trong phòng thú nghiệm Công nghệ tri thức và khoa học dữ liệu KT-Lab, các bạn trong nhóm nghiên cứu khoa học “Tư vấn xã hội” đã cùng trao đổi, thảo luận để hoàn thành đề tài này Cuối cùng, tôi muốn gửi lời cảm vô hạn tới gia đình và bạn bè, những người thân yêu luôn bên cạnh, tin tưởng và động viên tôi trong suốt quá trình thực hiện đề tài này Xin cảm ơn!

Hà Nội, ngày 08 tháng 05 năm 2017

Sinh viên Nguyễn Hữu Tú

Trang 5

TÓM TẮT

Tóm tắt: Trong những năm gần đây, với sự phát triển mạnh mẽ các phương tiện xã

hội, thông tin có ích cho người dùng từ đây cũng ngày một nhiều hơn Tư vấn cho người dùng đọc gì, xem gì, đi đâu,… dựa trên dữ liệu phương tiện xã hội là một nhiệm

vụ quan trọng của tư vấn xã hội Nghiên cứu cải tiến hệ tư vấn xã hội, để có thể đưa ra các quyết định chính xác hơn và hỗ trợ cho người dùng nhiều hơn Hệ tư vấn cũng đứng trước nhiều thách thức cũng như các vấn đề cần phải giải quyết trong đó có vấn

đề khởi đầu nguội Khởi đầu nguội xảy ra khi một người dùng (user) hoặc mục (item) mới được thêm vào hệ thống mà chưa hề có bất kì đánh giá nào trong dữ liệu hệ thống

Hệ thống sẽ phải tính toán và đưa ra các quyết định tư vấn chính xác nhất cho người dùng hoặc mục này

Khóa luận này trình bày vấn đề khởi đầu nguội trong hệ tư vấn xã hội, nhóm các phương pháp và hướng giải quyết dựa vào nghiên cứu của Uroš Ocepek và cộng sự Khóa luận đề xuất một mô hình giải quyết cho vấn đề khởi đầu nguội trong tư vấn xã hội, mô hình sẽ được xây dựng dựa trên phương pháp ma trận nhân tử

Từ khóa: tư vấn xã hội, khởi đầu nguội, ma trận nhân tử

Trang 6

Abstract: In the recent years, with the strong development of social media, there are

many more and more useful information come to user Advising the user what to read, what to see, where to go, is an important mission of social recomendation Research

to improve the social recomendation system, to make more exactly decisions and to support more for users The recomendation system is also facing many challenges as well as problems that need to be addressed include cold-start Cold-start occurs when a new user or item is added to the system without any rating in the system data The system will have to calculate and make the most accurate consultation decisions for the user or item

This thesis presents the cold-start problem in the social recomendation system, a group of methods and a method based on research by Uroš Ocepek et al The thesis proposes a model for addressing the cold-start problem in social recomendation, which will be based on the matrix factorization method

Keywords: social recommendation, cold-start, matrix factorization

Trang 7

LỜI CAM ĐOAN

Tôi xin cam đoan các kỹ thuật sử dụng để giải quyết vấn đề khởi đầu nguội trong

tư vấn xã hội được trình bày trong khóa luận này do tôi thực hiện dưới sự hướng dẫn của PGS.TS Hà Quang Thụy Tất cả những tham khảo từ các nghiên cứu liên quan đều được nêu nguồn gốc một cách rõ ràng từ danh mục tài liệu tham khảo trong khóa luận Trong khóa luận, không có việc sao chép tài liệu, công trình nghiên cứu của người khác mà không chỉ rõ về tài liệu tham khảo

Hà Nội, ngày 08 tháng 05 năm 2017

Sinh viên Nguyễn Hữu Tú

Trang 8

MỤC LỤC

LỜI CẢM ƠN i

TÓM TẮT ii

ABSTRACT iii

LỜI CAM ĐOAN iv

MỤC LỤC v

Danh sách các thuật ngữ và từ viết tắt vii

Danh sách bảng ix

Danh sách hình vẽ x

Mở đầu 1

Chương 1 Hệ tư vấn xã hội vấn đề khởi đầu nguội 3

1.1 Hệ tư vấn và hệ tư vấn xã hội 3

1.1.1 Giới thiệu chung 3

1.1.2 Tư vấn xã hội 5

1.2 Vấn đề khởi đầu nguội trong hệ tư vấn 6

1.3 Bài toán xử lý khởi đầu nguội trong tư vấn xã hội 7

Tóm tắt chương 1 9

Chương 2 Các nhóm phương pháp cho vấn đề khởi đầu nguội nói chung và phương pháp ma trận nhân tử trong hệ tư vấn xã hội 10

2.1 Các nhóm phương pháp cho vấn đề khởi đầu nguội 10

2.1.1 Tận dụng các nguồn dữ liệu bổ sung 10

2.1.2 Chọn nhóm người sử dụng tương đồng nổi bật nhất 14

2.1.3 Tăng cường dự đoán sử dụng các phương pháp lai 16

2.1 Phương pháp ma trận nhân tử giải quyết vấn đề khởi đầu nguội 18

2.1.1 Giới thiệu ma trận nhân tử với hệ tư vấn 18

2.1.2 Ứng dụng ma trận nhân tử trong giải quyết vấn đề khởi đầu nguội 19

2.3 Ý tưởng mô hình giải quyết bài toán khóa luận 20

Tóm tắt chương 2 21

Chương 3 Mô hình xử lý khởi đầu nguội dựa trên phương pháp ma trận nhân tử 22

3.1 Giới thiệu mô hình 22

Trang 9

3.2 Các bước trong mô hình 23

3.2.1 Tìm người dùng tương đồng 24

3.2.2 Chọn thuộc tính có liên quan 26

3.2.3 Nhập giá trị còn thiếu 28

3.2.4 Tư vấn sử dụng ma trận nhân tử 29

Tóm tắt chương 3 30

Chương 4 Thực nghiệm và đánh giá 31

4.1 Giới thiệu phần mềm thực nghiệm 31

4.1.1 Đặt vấn đề 31

4.1.2 Project thực hiện quá trình thực nghiệm 31

4.2 Môi trường cài đặt project 32

4.3 Dữ liệu 33

4.4 Kết quả thực nghiệm và nhận xét 33

Tóm tắt chương 4 36

Kết luận 37

Kết quả đạt được 37

Định hướng tương lai 37

Tài liệu tham khảo 38

Tài liệu tiếng Việt 38

Tài liệu tiếng Anh 38

Trang 10

Danh sách các thuật ngữ và từ viết tắt

Tiếng Việt/Cụm từ đầy đủ Tiếng Anh/Từ viết tắt

Khởi đầu nguội tuyệt đối Absolute cold start

Người dùng khởi đầu nguội Cold Start user/CS-user

Khởi đầu nguội

Cold-start/CS

Lọc cộng tác Collaborative Filtering/CF

Hybrid User-based Fuzzy Collaborative Filtering

HU-FCF

Mục (“mặt hàng”, “dịch vụ”) Item

Mean absolute error MAE

Modification Intuitionistic Possiblistic Fuzzy Geographically Weighted Clustering

Trang 11

Phương tiện xã hội Social media

Tư vấn xã hội Social Recommendation

Độ lệch tiêu chuẩn Standar Deviation/SD

Người dùng User

Trang 12

Danh sách bảng

Bảng 1.1: Ma trận người dùng-mục 4

Bảng 2.1 Ma trận đánh giá người dùng - phim 18

Bảng 4.1: Thiết bị cài đặt thực nghiệm 31

Bảng 4.2: Các công cụ phần mềm sử dụng 31

Bảng 4.3: Thông tin về bộ dữ liệu 31

Trang 13

Danh sách hình vẽ

Hình 1.1: Tương tác giữ người dùng và các mục 3

Hình 1.2: Phân loại hệ tư vấn 4

Hình 1.3: Ví dụ về vấn đề khởi đầu nguội 7

Hình 1.4: Một phần bộ dữ liệu đầu vào 8

Hình 2.1: Sơ đồ thuật toán MIPFGWC-CS[6] 11

Hình 2.2: Sơ đồ thuật toán NHSM[12] 14

Hình 2.3: Sơ đồ thuật toán HU-FCF[7] 16

Hình 2.4: Minh họa cho ma trận nhân tử 19

Hình 3.1: Sơ đồ mô hình dựa trên phương pháp ma trận nhân tử[11] 22

Hình 4.1: Project thực hiện mô hình 30

Hình 4.2: Phát hiện người dùng khởi đầu nguội dựa vào số lượng đánh giá 33

Hình 4.3: Một đoạn dữ liệu người dùng – item tương đồng với CS-user 33

Hình 4.4: Kết quả dự đoán của phương pháp ma trận nhân tử không âm .34

Trang 14

Mở đầu

Sự bùng nổ công nghệ thông tin trong những năm đầu thế kỷ XXI là một bước tiến lớn với máy móc cũng như con người và cuộc sống của con người Các phương tiện xã hội với nhiều mục đích khác nhau trở nên phổ biến thông qua Internet Có thể

kể đến một số cái tên nổi bật như: Facebook, Twister, Youtube,… Lượng thông tin từ người dùng cung cấp đang ngày một lớn hơn, góp phần không nhỏ đối với khoa học thống kê và nghiên cứu dữ liệu Thông tin có được từ người dùng cũng là nguyên liệu quan trọng đối với hệ tư vấn xã hội Hệ tư vấn ngày càng đưa ra các kết quả tư vấn chính xác cũng như có giá trị hơn đối với người sử dụng

Hệ tư vấn đưa ra các gọi ý mua hàng, tương tác với sản phẩm giúp khách hàng hiểu rõ hơn về sản phẩm, doanh nghiệp Doanh nghiệp cũng từ các đánh giá phản hồi của khách hàng để hoàn thiện sản phẩm, làm hài lòng và ngày càng thu hút nhiều hơn lượng khách hàng quan tâm

Nhưng vấn đề mới cũng xuất hiện đối với hệ tư vấn cũng như hệ tư vấn xã hội, khi một người dùng mới vừa tham gia không lâu vào trang web bán hàng, trang phim hay video Hệ thống cũ chưa hề có thông tin hoặc quá ít thông tin từ người dùng này – vấn đề khởi đầu nguội Vậy phải làm thế nào để hệ tư vấn có thể đưa ra gợi ý chính xác với người dùng kia?

Một đặc điểm quan trọng trong hệ tư vấn xã hội đó là người dùng có thể bị tác động bởi nhiều người dùng khác, ví dụ người dùng có xu hướng thích xem các bộ phim có đánh giá phản hồi tốt, hoặc thích nghe các bài hát đang được nhiều người nghe,…Có nhiều giải pháp khác nhau đã được đưa ra, và khóa luận sẽ tập trung vào xây dựng một mô hình cho hệ tư vấn xã hội giải quyết vấn đề khởi đầu nguội

Khóa luận sẽ được trình bày thành các chương sau:

Chương 1: Hệ tư vấn xã hội và vấn đề khởi đầu nguội: Khóa luận giới thiệu tổng

quát về hệ tư vấn, tư vấn xã hội Khóa luận cũng trình bày sơ bộ về vấn đề khởi đầu nguội và bài toán khóa luận

Chương 2: Các nhóm hương pháp cho vấn đề khởi đầu nguội nói chung và

phương pháp ma trận nhân tử trong hệ tư vấn xã hội: Khóa luận trình bày ba nhóm

phương pháp giải quyết cho vấn đề khởi đầu nguội trong hệ tư vấn xã hội nói chung và

ý tưởng xây dựng mô hình khóa luận dựa trên phương pháp ma trận nhân tử

Trang 15

Chương 3: Mô hình xử lý khởi đầu nguội dựa trên phương pháp ma trận nhân

tử: Khóa luận trình bày tư tưởng chính của mô hình tư vấn xã hội dựa trên phương

pháp ma trận nhân tử, giải quyết vấn đề khởi đầu nguội Đồng thời khóa luận giới thiệu các bước và dữ liệu thực hiện mô hình

Chương 4: Thực nghiệm và đánh giá: Khóa luận trình bày một số thực nghiệm

việc đưa ra tư vấn địa điểm người dùng với vấn đề khởi đầu nguội và đánh giá theo mô hình ở chương 3

Phần kết luận: Tổng kết các kết quả đạt được, các vấn đề còn tồn tại và định

hướng phát triển tương lai

Trang 16

Chương 1 Hệ tư vấn xã hội vấn đề khởi đầu nguội

1.1 Hệ tư vấn và hệ tư vấn xã hội

1.1.1 Giới thiệu chung

Hệ tư vấn (Recommender Systems, Recommendation Systems) [3] là những hệ thống sử dụng công cụ phần mềm và kỹ thuật chọn lọc thông tin nhằm giới thiệu các sản phẩm (phim, sách, nhạc,…) hoặc các yếu tố xã hội (nhóm, bạn bè,…) có thể có ích cho người dùng Hay nói cách khác hệ tư vấn sẽ cố gắng lọc các thông tin có ích và đưa ra tư vấn dựa trên lịch sử hoạt động của người dùng Ví dụ, một tư vấn phổ biến của trang bán hàng Amazon: “những khách hàng mua mặt hàng giống như trong giỏ hàng của bạn cũng đã mua …”

Hệ tư vấn thường hướng tới cá nhân người dùng, ví dụ bạn là một người thích xem phim cũng như các đoạn video về khoa học trên kênh youtube.com, hệ tư vấn sẽ dựa trên lịch sử hoạt động của bạn trên trang web này và đưa ra các gợi ý mà có thể bạn sẽ quan tâm Những người có sở thích, mối quan tâm khác nhau sẽ nhận được những sự tư vấn khác nhau

Hình 1.1: Tương tác giữa người dùng và các mục

Như đã nói ở trên, đánh giá phản hồi của người dùng đối với sản phẩm có thể là nguyên liệu cần thiết cho một số hệ tư vấn hoạt động Ta xét trong một hệ tư vấn có

Trang 17

một tập người dùng U={u1,u2, ,un} và 1 tập mục I = {i1, i2, ,in} trong đó n là số

người dùng và m là số mục Một người dùng u i đánh giá một tập nhỏ các mục bằng

một số điểm nào đó Ma trận R ∈ Rn x m biểu thị ma trận đánh giá trong đó Rij là điểm

số mà người dùng u i dùng để đánh giá mục i j, ta sử dụng dấu “?” để biểu thị các đánh giá chưa biết Thông thường với số lượng mục và người dùng trong một hệ thống là rất lớn, người dùng có thể không có thói quen đánh giá các mục mình đã trải nghiệm hoặc các mục bị bỏ qua và không có cơ hội trở lại cho người dùng đánh giá Cho nên trong

ma trận user-item thường có rất nhiều giá trị bị khuyết Hoàn thành các dữ liệu bị khuyết này và đưa ra kết quả tư vấn chính xác nhất cho người dùng là nhiệm vụ quan trọng đối với hệ tư vấn

Bảng 1.1: Ma trận người dùng-mục London New York Paris Berlin Hanoi

Trang 18

● Các hệ tư vấn dựa trên nội dung: Các hệ tư vấn này có nguồn gốc từ nghiên cứu về sự truy hồi thông tin và lọc thông tin, chúng hoạt động dựa trên những hoạt động của người dùng trong quá khứ

● Các hệ tư vấn dựa trên lọc cộng tác: Các hệ tư vấn này sẽ dự đoán đánh giá của một người dựa trên những đánh giá của người khác

● Các hệ tư vấn lai: Kết hợp hai phương pháp trên

1.1.2 Tư vấn xã hội

Với sự phát triển chóng mặt của Internet, chúng ta có thể nắm được cả thế giới chỉ trong những thiết bị thông minh như máy tính, điện thoại,… Nhu cầu kết nối, chia

sẻ của con người cũng theo đó hình thành và phát triển Các ứng dụng web, các mạng

xã hội là những sản phẩm tất yếu, ngoài ra các sàn thương mại điện tử trực tuyến cũng thông qua đó giới thiệu các sản phẩm của mình đến với người tiêu dùng

Chúng ta biết đến khái niệm Web 2.0 (Dale Dougherty - 2004) với những đặc trưng như hợp tác, chia sẻ, sáng tạo giữa người dùng với nhau Phần mềm được cung cấp dưới dạng dịch vụ web, dễ dàng xây dựng và phát triển trên nhiều thiết bị,… Phương tiện xã hội (social media) cũng được hình thành từ đó Từ khi xuất hiện, Web 2.0 được chú trọng phát triển tính chất sâu xa cộng đồng, chính sự phát triển này đã tạo điều kiện cho phương tiện xã hội phát triển Ví dụ một người có thể tham gia vào một trang web chia sẻ hình ảnh, chia sẻ bài viết, video, nhạc,… hay những công trình nghiên cứu, ứng dụng, và những người dùng khác có thể bình luận, tương tác, phản hồi

Người dùng tham gia vào sẽ tương tác chia sẻ với nhau theo hệ thống phân cấp như quản trị viên, thành viên Người dùng có thể cũng chính là tác giả hoặc có vai trò cùng đóng góp của những nội dung trên phương tiện xã hội

Nội dung cơ bản của 2 định nghĩa có thể được trình bày như sau:

Trang 19

- Định nghĩa hẹp của tư vấn xã hội: Một đặc trưng quan trọng của các phương tiện xã hội là các mối quan hệ giữa người dùng với nhau, có thể đó là bạn bè cùng tham gia một trang mạng xã hội, quan hệ thứ bậc quản trị viên – thành viên, hay sự tác động về mặt tâm lý đến nhau là sự tin tưởng giữa các người dùng với nhau Và hệ tư vấn sẽ sử dụng các mối quan hệ này như một đầu vào bổ sung để cải thiện hiệu quả hệ tư vấn cũng như cải thiện chính các mối quan hệ

- Định nghĩa rộng của tư vấn xã hội: Ở định nghĩa rộng hơn của tư vấn xã hội,

hệ tư vấn bất kì nhắm đến lĩnh vực phương tiện xã hội Đối tượng là bất kì trong các phương tiện xã hội như người dùng, mục, thẻ, cộng đồng,…dữ liệu

sử dụng không giới hạn ở các mối quan hệ mà ngoài ra còn các tương tác và hành vi của người sử dụng

Các bài toán tư vấn xã hội:

● Tư vấn bạn bè: Các mối quan hệ của người dùng như bạn bè, theo dõi, bị theo dõi, người quen,…

● Tư vấn nội dung: Các loại thông tin trên các phương tiện xã hội mà người đó quan tâm như phim, ảnh, nhạc, tin tức,… hệ tư vấn qua đó đưa ra các gợi ý đọc gì, xem gì, nghe gì cho người dùng

● Tư vấn địa điểm[1]: Các thông tin địa lý, thông tin địa điểm du lịch, hệ tư vấn qua đó đưa ra các gợi ý nên đi đâu cho người dùng

1.2 Vấn đề khởi đầu nguội trong hệ tư vấn

Hệ tư vấn luôn có những cơ hội cũng như luôn phải đối đầu với các vấn đề như

dữ liệu thưa, các cuộc tấn công hay quyền riêng tư Giải quyết các vấn đề thách thức luôn là nhiệm vụ không hề đơn giản và cần những đầu tư nghiên cứu

Một vấn đề quan trọng đối với các hệ tư vấn (RS) đã gây rất nhiều sự chú ý của các nhà nghiên cứu đối với những người sử dụng mới đó là khởi đầu nguội, nó xảy ra khi có một người dùng mới mà đã được đăng ký vào hệ thống và không hề có các giá trị trước đó của người dùng này được tìm thấy trong các bản ghi lưu trữ, hoặc ngay cả khi có một số thông tin từ người dùng nhưng lại quá ít Vậy hệ tư vấn phải giải quyết như thế nào với những trường hợp này?

Trang 20

Hình 1.3: Ví dụ về vấn đề khởi đầu nguội

Vấn đề khởi đầu nguội có hai biến thể: người dùng mới (user) có vấn đề khởi đầu nguội và mục mới (item) có vấn đề khởi đầu nguội Ta cũng có thể chia nhỏ hơn theo tính chất của vấn đề khởi đầu nguội là khởi đầu nguội tương đối (partial cold start - user/item đã có một số giá trị đánh giá từ trước nhưng chưa đủ) và khởi đầu nguội tuyệt đối (absolute cold start - user/item chưa có bất kì một giá trị nào) Xét về mục trước, khi một mục mới được thêm vào hệ tư vấn, chưa hề có một đánh giá nào cho nên nó sẽ bị đẩy xuống dưới cùng danh sách tư vấn cho người dùng Để giải quyết vấn

đề này, sẽ có đội ngũ xếp hạng ban đầu cho mục mới Còn với người dùng mới thì sao? Các phương pháp lọc cộng tác hay lọc dựa trên nội dung thì cần phải có lịch sử người dùng trong khi thông tin này của người dùng trống rỗng hoặc lượng thông tin cung cấp không đủ, các hệ tư vấn rất khó để đưa ra quyết định tư vấn gì cho người dùng có vấn đề khởi đầu nguội này

Lý do này - vấn đề khởi đầu nguội - làm ảnh hưởng đến hiệu suất của hệ tư vấn,

nó trở thành một bài toán cần có sự đầu tư giải quyết

1.3 Bài toán xử lý khởi đầu nguội trong tư vấn xã hội

Ta sẽ xem xét một ví dụ sau: “Một trang web xem phim trực tuyến với hệ thống

có thông tin các đầu phim và người dùng Người dùng sau khi xem xong một bộ phim

sẽ được yêu cầu đánh giá theo mức điểm [0.5 – 4], các giá trị đánh giá phản hồi này cũng sẽ được lưu lại và sử dụng cho mục đích tư vấn các mục phim mà người dùng quan tâm và ưu thích, từ đó cải thiện dịch vụ chăm sóc khách hàng với trang web

Trang 21

Nhưng vấn đề xảy ra khi có một số người dùng vừa tham gia vào hệ thống, chưa có hoặc chưa có đủ nhiều giá trị đánh giá để hệ tư vấn có thể đưa ra các quyết định hỗ trợ Vậy hệ tư vấn phải giải quyết như thế nào?”

Ta có thể dựa vào đặc trưng của phương tiện xã hội, cụ thể hơn ở đây là trang xem phim trực tuyến và khách là các người dùng xem phim Đánh giá của người dùng

sẽ có xu hướng tác động lên nhau, ví dụ những phim được đánh giá cao thì sẽ thu hút nhiều người xem và có khả năng người dùng mới cũng quan tâm

Phát biểu bài toán:

Giả thiết trong một trang web xem phim, video, nghe nhạc hoặc một trang thương mại điện tử, các người dùng có cùng một mối quan tâm với một loại sản phẩm như phim, video,… Một người dùng mới tham gia vào hệ thống chưa có nhiều đánh giá trong lịch sử, và chưa đủ thông tin để hệ thống đưa ra các tư vấn, ta gọi người dùng này đang ở trạng thái khởi đầu nguội – khởi đầu nguội tương đối Đây là một trong những vấn đề ảnh hưởng đến kết quả của hệ tư vấn xã hội Khóa luận sẽ xây dựng một

mô hình giải quyết vấn đề khởi đầu nguội cho người dùng ở trạng thái khởi đầu nguội nói trên

Input: - Tập dữ liệu về người dùng, mục và các đánh giá của người dùng với các

mục trong quá khứ bao gồm: id_user, id_item, rating

- Người dùng ở trạng thái khởi đầu nguội

Hình 1.4: Một phần bộ dữ liệu đầu vào

Trang 22

Output: Hệ tư vấn sẽ đưa ra các kết quả tư vấn cho người dùng có vấn đề khởi

đầu nguội

Tóm tắt chương 1

Chương 1 đã trình bày tổng quát về hệ tư vấn, hệ tư vấn xã hội, sơ bộ về vấn đề khởi đầu nguội, cũng như đưa ra bài toán Khóa luận sẽ tập trung giải quyết bài toán về vấn đề khởi đầu nguộicủa người dùng trong tư vấn xã hội

Chương tiếp theo sẽ trình bày các giải pháp cho vấn đề khởi đầu nguội trong tư vấn xã hội nói chung và giải pháp và ý tưởng mô hình cho bài toán khóa luận

Trang 23

Chương 2 Các nhóm phương pháp cho vấn đề khởi đầu nguội nói chung và phương pháp ma trận nhân tử trong hệ tư vấn xã hội

Ngày nay, vấn đề khởi đầu nguội đối với hệ tư vấn đã nhận được nhiều sự quan tâm nghiên cứu của các nhà khoa học Khởi đầu nguội có thể xem là một trường hợp đặc biệt và cụ thể hơn của vấn đề dữ liệu thưa, vì xét trên một khía cạnh nhất định mục tiêu giải quyết vấn đề khởi đầu nguội là hoàn thành bằng cách dự đoán các giá trị còn

bị thiếu trong hệ tư vấn

Hướng tiếp cận chủ yếu cho vấn đề này là cải tiến kỹ thuật lọc cộng tác, hệ thống

sẽ tìm ra những người dùng hoặc mục (những đối tượng này không có vấn đề khởi đầu nguội) có khả năng cao nhất là sẽ tương tự với người dùng hoặc mục có vấn đề khởi đầu nguội, sau đó dựa trên dữ liệu phân tích sẽ đưa ra kết quả dự đoán cho người hoặc

mục Ta có thể chia thành hai hướng tiếp cận với kỹ thuật lọc cộng tác này: (1) tiếp cận dựa trên bộ nhớ, tức là với toàn bộ dữ liệu mà hệ thống thu thập được, sẽ được sử dụng cho việc tư vấn với người dùng, mục có vấn đề khởi đầu nguội (2) tiếp cận dựa trên mô hình, tức là với toàn bộ dữ liệu có được, chúng ta sẽ xây dựng một mô hình,

và chính mô hình đó sẽ đưa ra kết quả tư vấn

Ta có thể phân chia các phương pháp thành ba nhóm chính dựa vào đặc trưng người dùng có quan hệ với nhau, tác động đến các quyết định của nhau hay hành vi tương tác của mỗi người dùng sẽ trở thành một thành phần nguyên liệu đầu trong hệ tư vấn xã hội:

- Tận dụng các nguồn dữ liệu bổ sung

- Chọn nhóm người dùng tương đồng nổi bật

- Tăng cường dự đoán sử dụng các phương pháp lai

Sau đây tôi xin trình bày ba thuật toán đại diện cho ba nhóm phương pháp giải quyết vấn đề khởi đầu nguội theo cách phân chia trên

2.1.1 Tận dụng các nguồn dữ liệu bổ sung

Như đã nói ở trên, một trong những đặc trưng của hệ tư vấn xã hội là lượng thông tin bổ sung cho hệ thống có thể được mở rộng và trở nên phong phú hơn Trong nhóm phương pháp này, dữ liệu được sử dụng thêm trong đầu vào của hệ tư vấn có thể

là độ tin cậy, dòng thời gian, thông tin địa lý, thông tin nhân khẩu học,… Hệ tư vấn sẽ

sử dụng các thông tin này để đưa ra quyết định tư vấn chính xác nhất đối với người dùng hoặc mục có vấn đề khởi đầu nguội

Trang 24

Ta xét một thuật toán đại diện cho phương pháp này:

Thuật toán MIPFGWC-CS[6]

Về cơ bản của thuật toán MIPFGWC-CS[6] (Modification Intuitionistic Possiblistic Fuzzy Geographically Weighted Clustering) là sử dụng phân nhóm không

rõ ràng về vị trí người dùng, xác định người sử dụng tương tự như đối với tất cả các thuộc tính trong dữ liệu nhân khẩu học Dữ liệu nhân khẩu học có thể là dữ liệu về độ tuổi, giới tính, nghề nghiệp, thu nhập,… Thuật toán có để mô tả bằng sơ đồ dưới đây:

Hình 2.1: Sơ đồ thuật toán MIPFGWC-CS[6]

Trang 25

Thuật toán MIPFGWC đại diện cho nhóm các phương pháp sử dụng dữ liệu bổ sung Ta có thể tóm tắt thuật toán đại diện cho nhóm phương pháp này như sau:

MIPFGWC

Đầu vào:Dữ liệu nhân khẩu học về địa lý X, số lượng phần tử (cụm) –N

Dimention của tập dữ liệu r, ngưỡng ε, và các tham số khác m, η, τ, ai(i=1,3),

γj(j= 1, ) Các tham số địa lý α, β, γ, a, b, c, d

Đầu ra:Giá trị thành viên u’k và tâm V(t+1)

1: Đặt số cụm C, ngưỡng >0 và các tham số khác: m, η, τ >1, ai >0(i=1,3),

γj(j= 1, )

2: Khởi tạo tâm cụm Vj, j=1, tại t = 0

3: Đặt các tham số α, β, γ, a, b, c, d thỏa mãn α+β+γ =1

4: Sử dụng các công thức để tính các giá trị thành viên, mức độ không chắc

chắn và các giá trị điển hình, tương ứng

5: Thực hiện các sửa đổi về địa lý thông qua:

chuyển tiếp bước 7

7: Tính lại tâm cụm tại thời điểm t+1 bởi công thức:

Ngày đăng: 03/08/2022, 08:01

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Đỗ Tiến Long (2016). Một số kỹ thuật tư vấn xã hội hướng địa điểm và ứng dụng. Khóa luận tốt nghiệp, Trường ĐHCN-ĐHQGHN Sách, tạp chí
Tiêu đề: Một số kỹ thuật tư vấn xã hội hướng địa điểm và ứng dụng
Tác giả: Đỗ Tiến Long
Năm: 2016
[2] Nguyễn Quỳnh Nga (2015). Tư vấn nhóm xã hội dựa trên kỹ thuật tăng cường thích hợp. Khóa luận tốt nghiệp, Trường ĐHCN-ĐHQGHN Sách, tạp chí
Tiêu đề: Tư vấn nhóm xã hội dựa trên kỹ thuật tăng cường thích hợp
Tác giả: Nguyễn Quỳnh Nga
Năm: 2015
[3] Thái Thị Hoài (2015). Khai thác đặc trưng ngữ cảnh cục bộ và toàn bộ vào tư vấn xã hội. Khóa luận tốt nghiệp, Trường ĐHCN-ĐHQGHN.Tài liệu tiếng Anh Sách, tạp chí
Tiêu đề: Khai thác đặc trưng ngữ cảnh cục bộ và toàn bộ vào tư vấn xã hội
Tác giả: Thái Thị Hoài
Năm: 2015
[4] Kent, J. T. (1983). Information gain and a general measure of correlation. Biometrika, 70, 163–173 Sách, tạp chí
Tiêu đề: Information gain and a general measure of correlation
Tác giả: Kent, J. T
Năm: 1983
[5] Koren, Y., Bell, R., & Volinsky, C. (2009). Matrix factorization techniques for recommender systems. IEEE Computer, 42–49 Sách, tạp chí
Tiêu đề: Matrix factorization techniques for recommender systems
Tác giả: Koren, Y., Bell, R., & Volinsky, C
Năm: 2009
[6] L.H. Son. (2016). Dealing with the new user cold-start problem in recommender systems: A comparative review. Information Systems 58: 87-104 Sách, tạp chí
Tiêu đề: Dealing with the new user cold-start problem in recommender systems: A comparative review
Tác giả: L.H. Son
Năm: 2016
[7] L.H. Son. (2016).HU–FCF+: a hybrid user-based fuzzy collaborative filtering method in recommender systems. Expert Syst. Appl. 41: 207-222 Sách, tạp chí
Tiêu đề: HU–FCF+: a hybrid user-based fuzzy collaborative filtering method in recommender systems
Tác giả: L.H. Son
Năm: 2016
[8] L.H. Son, N.T.H. Minh, K.M. Cuong, N.V. Canh. (2013). An application of fuzzy geographically clustering for solving the cold-start problem in ecommender systems. Proceeding of 5th IEEE International Conference of Soft Computing and Pattern Recognition (SoCPaR2013): 44–49 Sách, tạp chí
Tiêu đề: An application of fuzzy geographically clustering for solving the cold-start problem in ecommender systems
Tác giả: L.H. Son, N.T.H. Minh, K.M. Cuong, N.V. Canh
Năm: 2013
[9] Mo, Q., & Draper, B. A. (2012). Semi-nonnegative matrix factorization for motion segmentation with missing data. Computer vision–ECCV 2012: 402–415 Sách, tạp chí
Tiêu đề: Semi-nonnegative matrix factorization for motion segmentation with missing data
Tác giả: Mo, Q., & Draper, B. A
Năm: 2012
[10] Robnik-Šikonja, M., & Kononenko, I. (2003). Theoretical and empirical analysis of relieff and rrelieff. Machine Learning , 53: 23–69 Sách, tạp chí
Tiêu đề: Theoretical and empirical analysis of relieff and rrelieff
Tác giả: Robnik-Šikonja, M., & Kononenko, I
Năm: 2003
[11] Uroš Ocepek, Joze Rugelj, Zoran Bosnic (2015).Improving matrix factorization recommendations for examples in cold start. Expert Systems with Applications 42. 6784–6794 Sách, tạp chí
Tiêu đề: Improving matrix factorization recommendations for examples in cold start
Tác giả: Uroš Ocepek, Joze Rugelj, Zoran Bosnic
Năm: 2015
[12] Z.Hu, H.Liu, A.Mian, H.Tian, X.Zhu (2014) A new user similarity model to improve the accuracy of collaborative filtering. Knowl.– BasedSystems 56: 156–166 Sách, tạp chí
Tiêu đề: A new user similarity model to improve the accuracy of collaborative filtering

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN