Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
1,56 MB
Nội dung
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN NGỌC THÀNH ỨNG DỤNG KỸ THUẬT LỌC CỘNG TÁC ĐỂ XÂY DỰNG HỆ THỐNG KHUYẾN NGHỊ SÁCH TẠI TRUNG TÂM HỌC LIỆU TRƯỜNG ĐẠI HỌC QUẢNG BÌNH Chuyên ngành: Khoa học máy tính Mã số: 8480101 TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2018 Công trình hồn thành TRƯỜNG ĐẠI HỌC BÁCH KHOA Người hướng dẫn khoa học: TS PHẠM XUÂN HẬU Phản biện 1: TS NGUYỄN VĂN HIỆU Phản biện 2: PGS.TS HUỲNH CÔNG PHÁP Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ họp Trường Đại học Bách khoa vào ngày 05 tháng 01 năm 2019 Có thể tìm hiểu luận văn tại: - Trung tâm Học liệu Truyền thông Đại học Đà Nẵng Trường Đại học Bách khoa - Thư viện Khoa Công nghệ thông tin Trường Đại học Bách khoa Đại học Đà Nẵng MỞ ĐẦU Lý chọn đề tài: Hiện nay, với phát triển cơng nghệ thơng tin, nhu cầu tìm kiếm, lựa chọn thông tin Internet ngày trở nên phổ biến lượng thông tin đưa lên Internet ngày tăng theo cấp số nhân Vì thách thức đặt người sử dụng phải đối mặt với kho thông tin khổng lồ việc họ khơng có đủ thời gian để xem xét lựa chọn tất sách, tất cá phim, tạp chí hay hát,… Họ khơng biết nên tìm xem phim gì, đọc sách phù hợp với sở thích, nhu cầu thân Cụ thể Trung tâm Học liệu Trường Đại học Quảng Bình, liệu Sách tham khảo nhiều, sinh viên đến Trung tâm Học liệu tìm tài liệu chủ yếu vào tìm kiếm, lần tìm kiếm kết tương đối nhiều gây cho nhiễu thông tin sinh viên đó, mặt khác sinh viên muốn truy cập tìm nguồi liệu sách tham khảo với sở thích tốn nhiều thời gian Hệ khuyến nghị chế tự động nhằm giúp người dùng nhận thông tin sản phẩm mà có khả người dùng thích Hệ khuyến nghị trở nên phổ biến năm gần sử dụng ứng dụng khác Chính tơi chọn đề tài luận văn “Ứng dụng kỹ thuật lọc cộng tác để xây dựng hệ thống khuyến nghị Sách Trung tâm Học liệu Trường đại học Quảng Bình” Mục đích nghiên cứu: Mục đích luận văn tìm hiểu hệ khuyến nghị ứng dụng kỹ thuật lọc cộng tác để xây dựng hệ thống khuyến nghị sách Trung tâm Học liệu Trường đại học Quảng Bình Đối tượng phạm vi nghiên cứu: Đối tượng nghiên cứu hệ thống khuyến nghị kỹ thuật lọc cộng tác hệ thống khuyến nghị Phạm vi đề tài tập trung nghiên cứu vào: kỹ thuật lọc cộng tác để xây dựng ứng dụng hệ khuyến nghị sách Trường Đại học Quảng Bình Phương pháp nghiên cứu: Dựa việc thu thập, nghiên cứu tìm hiểu hệ thống khuyến nghị từ tài liệu nghiên cứu công bố tạp chí, sách ngồi nước, đặc biệt trọng đến nghiên cứu chuyên sâu kỹ thuật lọc cộng tác áp dụng kỹ thuật lọc cộng tác vào ứng dụng thực tế Ý nghĩa khoa học thực tiễn đề tài: Ý nghĩa khoa học đề tài hiểu hệ thống khuyến nghị áp dụng kỹ thuật lọc cộng tác để xây dựng hệ thống khuyến nghị Ý nghĩa thực tiễn đề tài xây dựng hệ thống khuyến nghị sách cho Trung tâm học liệu, Trường Đại học Quảng Bình Cấu trúc luận văn: Nội dung luận văn xây dựng gồm chương, đó: Chương 1: Tổng quan hệ thống khuyến nghị Chương 2: Kỹ thuật lọc cộng tác Chương 3: Xây dựng hệ thống khuyến nghị Sách Trung tâm Học liệu Trường Đại học Quảng Bình Chương - GIỚI THIỆU TỔNG QUAN VỀ HỆ THỐNG KHUYẾN NGHỊ 1.1 Lọc thông tin Lọc thông tin (IF) lĩnh vực nghiên cứu trình cung cấp thơng tin thích hợp, ngăn ngừa gỡ bỏ thơng tin khơng thích hợp cho người dùng [6] Thơng tin cung cấp (cịn gọi sản phẩm) văn bản, trang web, phim, ảnh, dịch vụ dạng thông tin sản sinh từ phương tiện truyền thông Phạm vi ứng dụng lọc thông tin trải rộng nhiều ứng dụng thực tế khác khoa học máy tính Kiến trúc tổng quát hệ thống lọc thông tin Một hệ thống lọc thông tin tổng quát bao gồm bốn thành phần [6]: Thành phần phân tích liệu, thành phần mơ hình người dùng, thành phần học thành phần lọc Thành phần phân tích liệu có nhiệm vụ thu thập liệu sản phẩm từ nhà cung cấp thông tin (ví dụ tài liệu, thư điện tử, sách, báo, tạp chí, phim, ảnh ) Thành phần mơ hình người dùng “hiện” “ẩn” dùng để lấy thơng tin người dùng, giới tính, tuổi, nơi sinh sống thơng tin người dùng truy vấn trước để tạo nên hồ sơ người dùng Hồ sơ người dùng sau tạo chuyển đến thành phần học để thực nhiệm vụ huấn luyện Thành phần học thực huấn luyện tập hồ sơ phản hồi người dùng theo thuật toán học máy cụ thể Thuật toán học lấy liệu từ thành phần mô tả người dùng; lấy liệu sản phẩm biểu diễn từ thành phần lọc kết hợp với thông tin phản hồi người dùng để thực nhiệm vụ huấn luyện Kết trình học chuyển lại cho phận lọc để thực nhiệm vụ Thành phần lọc thành phần quan trọng hệ thống, có nhiệm vụ xem xét phù hợp hồ sơ người dùng biểu diễn liệu sản phẩm để đưa định phân bổ sản phẩm Nếu liệu sản phẩm phù hợp với hồ sơ người dùng, sản phẩm cung cấp cho người dùng 1.2 Hệ thống khuyến nghị Hệ khuyến nghị (Recommender Systems Recommendation Systems) hệ thống thiết kế để hướng người dùng đến đối tượng quan tâm, u thích, lượng thơng tin q lớn vượt q khả xử lý người dùng, hệ khuyến nghị công cụ phần mềm, kỹ thuật cung cấp đề xuất đối tượng hữu ích với người dùng Ví dụ minh họa hoạt động hệ thống khuyến nghị sách: Một người dùng đăng nhập vào hệ thống website sách, hệ thống website khuyến nghị cho người xem vài sách mà dự đốn người thích Tuy nhiên để nâng cao chất lượng khuyến nghị cho người dùng, hệ thông khuyến nghị cần sử dụng thông tin tất người dùng thông tin tất sản phẩm, sử dụng thuật toán để đưa khuyến nghị phù hợp cho người dùng 1.3 Ứng dụng hệ thống khuyến nghị Phạm vi ứng dụng hệ thống khuyến nghị rộng Nhất lĩnh vực bán hàng trực tuyến, thương mại điện tử, thiết bị gia dụng, sách báo, phim ảnh,… 1.4 Phát biểu toán khuyến nghị: Một cách hình thức, tốn khuyến nghị mơ tả sau: Cho U tập người dùng (Users); I tập sản phẩm (Items); R = U x I, tập đánh giá (Ratings) người dùng U đối tượng sản phẩm I gọi đánh giá (mức độ yêu thích) người dùng u với sản phẩm i Tìm tập sản phẩm khuyến nghị , cho sản phẩm dự đốn có khả phù hợp với nhu cầu người dùng 1.5 Các phương pháp lọc cho hệ thống khuyến nghị Các hệ thống khuyến nghị phân loại thành ba loại [2]: Khuyến nghị dựa vào phương pháp lọc theo nội dung (ContentBased Filtering Recommendation) khuyến nghị dựa vào phương pháp lọc cộng tác (Collaborative Filtering Recommendation) khuyến nghị dựa vào phương pháp lọc kết hợp (Hybrid Filtering Recommendation) 1.5.1 Phương pháp khuyến nghị dựa vào lọc nội dung: 1.5.1.1 Bài toán lọc theo nội dung Bài toán lọc theo nội dung phát biểu sau: Cho I= {i1, i2, , in} tập gồm n sản phẩm Nội dung sản phẩm i I ký hiệu Content(i) biểu diễn thông qua tập K đặc trưng nội dung I Tập đặc trưng sản phẩm i xây dựng kỹ thuật truy vấn thông tin để thực mục đích dự đốn sản phẩm khác tương tự với i Cho U={u1, u2, , um} tập gồm m người dùng Với người dùng u U, gọi ContentBasedProfile(u) hồ sơ người dùng u Hồ sơ người dùng u lịch sử truy cập đánh giá người sản phẩm thông tin khác tập hợp trình tương tác với hệ thống ContentBasedProfile(u) xây dựng cách phân tích nội dung sản phẩm mà người dùng u truy nhập đánh giá dựa kỹ thuật truy vấn thông tin Khuyến nghị dựa vào nội dung dự đốn sản phẩm có nội dung thích hợp với người dùng dựa tập hồ sơ sản phẩm Content(i) hồ sơ người dùng ContendBasedProfile(u) 1.5.1.2 Các phương pháp pháp lọc theo nội dung * Lọc dựa vào nhớ: Kỹ thuật dựa vào nhớ kỹ thuật sử dụng toàn tập hồ sơ sản phẩm tập hồ sơ người dùng để thực huấn luyện dự đoán Trong kỹ thuật này, sản phẩm tính tốn so sánh với tất hồ sơ người dùng Những sản phẩm có mức độ tương tự cao với hồ sơ người dùng dùng để khuyến nghị cho người dùng Để thực phương pháp lọc theo nội dung, ta cần giải hai vấn đề: thứ biểu diễn Content(i) dạng vector trọng số đặc trưng nội dung, thứ hai tính độ tương tự hồ sơ người dùng hồ sơ sản phẩm * Lọc dựa vào mơ hình: Kỹ thuật dựa mơ hình phương pháp sử dụng tập hồ sơ sản phẩm tập hồ sơ người dùng để xây dựng nên mơ hình huấn luyện Mơ hình dự đốn sau sử dụng kết mơ hình huấn luyện để sinh khuyến nghị cho người dùng Trong cách tiếp cận này, lọc nội dung sử dụng kỹ thuật học máy mạng Bayes, phân cụm, định, mạng nơron nhân tạo để tạo nên dự đoán 1.5.2 Phương pháp khuyến nghị dựa vào lọc cộng tác: Không giống phương pháp lọc theo nội dung, phương pháp lọc cộng tác (CF) khai thác khía cạnh liên quan đến thói quen sở thích người sử dụng sản phẩm để đưa dự đoán sản phẩm cho người dùng Chính vậy, lọc cộng tác lọc hiệu nhiều dạng sản phẩm khác hàng hóa, phim, ảnh, tài liệu, Cùng hệ khuyến nghị, người dùng khuyến nghị nhiều loại mặt hàng khác cho dù mặt hàng biểu diễn khơng gian đặc trưng nội dung khác Trong chương sâu tìm hiểu phương pháp 1.5.3 Phương pháp khuyến nghị dựa vào lọc kết hợp: Hệ thống khuyến nghị cho người dùng sản phẩm tương tự với số sản phẩm họ mua truy cập khứ sản phẩm người có sở thích giống họ ưa thích khứ 1.5.3.1 Phát biểu toán khuyến nghị dựa vào lọc kết hợp Cho tập người dùng U, tập sản phẩm I ma trận lọc cộng tác R={ rij }, i = 1…n, j = 1…m ma trận đánh giá, người dùng ui U đưa đánh giá cho số sản phẩm i I số ri Giá trị ri phản ánh mức độ ưa thích người dùng u sản phẩm i Tập C = {c1, c2,…, ck} tập k đặc trưng biểu diễn nội dung thông tin sản phẩm i Ví dụ i I người dùng u U I phim, ta biểu diễn nội dung phim thông qua đặc trưng Ci : “thể loại”, “đạo diễn”, “diễn viên”, “hãng sản xuất” đặc trưng nội dung khác phim; u U người dùng ta xem xét đặc trưng Ci : “tuổi”, “giới tính”, “nghề nghiệp” đặc trưng nội dung khác phản ánh thông tin cá nhân người dùng Bài toán lọc kết hợp dự đoán cho người dùng thời u sản phẩm i I chưa u đánh giá dựa ma trận đánh giá r đặc trưng nội dung C = {c1, c2, , ck} 1.5.3.2 Các kỹ thuật lọc kết hợp Lọc kết hợp tiếp cận theo bốn kỹ thuật chính: Kết hợp tuyến tính, kết hợp đặc tính lọc nội dung vào lọc cộng tác, kết hợp đặc tính lọc cộng tác vào lọc nội dung xây dựng mơ hình hợp lọc cộng tác lọc nội dung [6] Thứ nhất, Kết hợp tuyến tính kỹ thuật xây dựng hai lược đồ lọc nội dung lọc cộng tác độc lập Kết dự đốn tồn mơ hình lựa chọn từ kỹ thuật cho kết tốt Thứ hai, Kết hợp đặc tính lọc nội dung vào lọc cộng tác kỹ thuật dựa kỹ thuật lọc cộng tác túy trì hồ sơ người dùng tham biến tham khảo tính tốn tương tự cặp người dùng Thứ ba, Kết hợp đặc tính lọc cộng tác vào lọc nội dung kỹ thuật xem xét đánh giá người dùng lọc cộng tác thành phần hồ sơ người dùng Thứ tư, Mơ hình hợp kỹ thuật biểu diễn đặc trưng nội dung đánh giá người dùng mơ hình Kết dự đốn dựa mơ hình liệu hợp nội dung đánh giá người dùng Các kỹ thuật lọc cộng tác áp dụng cho hệ khuyến nghị phân thành hai hướng tiếp cận: kỹ thuật lọc dựa vào nhớ (Memory-Based Filtering) kỹ thuật lọc dựa vào mơ hình (ModelBased Filtering) 10 Chương - PHƯƠNG PHÁP LỌC CỘNG TÁC 2.1 Kỹ thuật lọc cộng tác 2.1.1 Lọc cộng tác Trong phương pháp này, hệ thống tính tốn độ tương tự người dùng hay sản phẩm từ người dùng khuyến nghị sản phẩm phù hợp người dùng có sở thích đánh giá trước 2.1.2 Bài tốn lọc cộng tác Bài toán lọc cộng tác: Cho danh sách người m người dùng U={u1, u2, , um} danh sách n sản phẩm I = {i1, i2, , in} rui đánh giá sản phẩm i người dùng u; r nhận giá trị từ đến Với r=0 sản phẩm i chưa đánh giá người dùng u Mỗi người dùng u có danh sách sản phẩm Iu, mà người dùng đánh giá sản phẩm Yêu cầu: Khuyến nghị danh sách Ip gồm n sản phẩm mà người dùng u thích nhất, cho: Ip Iu= Các bước trình khuyến nghị theo phương pháp lọc cộng tác dựa sản phẩm: Bước 1: Tiền xử lý liệu: Dữ liệu thu thập đánh giá sản phẩm người dùng Dữ liệu thu thường lớn nhiên số đánh giá khơng có ích q trình khuyến nghị theo phương pháp lọc cộng tác Đề xuất đưa để tối ưu liệu đầu vào: số sản phẩm người dùng loại bỏ người dùng đánh giá q sản phẩm, sản phẩm đánh giá Bước 2: Xây dựng Ma trận đánh giá, hàng danh sách người dùng, cột danh sách sản phẩm 11 Bước 3: Tính độ tương tự sản phẩm người dùng, xây dựng Ma trận tương tự sản phẩm Bước 4: Khuyến nghị cho người dùng sản phẩm mà họ chưa lựa chọn có khả phù hợp với sở thích của họ dựa vào dự đoán hệ thống 2.2 Các kỹ thuật lọc cộng tác 2.2.1 Kỹ thuật dựa lọc cộng tác dựa nhớ Các kỹ thuật dựa nhớ [6] sử dụng toàn ma trận đánh giá để sinh dự đoán sản phẩm cho người dùng Kỹ thuật thực theo hai bước: Tính tốn mức độ tương tự bước tạo nên dự đốn Tính tốn mức độ tương tự: Mơ tả khoảng cách, liên quan, hay trọng số hai người dùng u1 u2 (hoặc hai sản phẩm i1 i2) Dự đoán: Đưa dự đoán cho người dùng cần khuyến nghị cách xác định tập láng giềng người dùng (hoặc sản phẩm) Tập láng giềng người dùng (sản phẩm) cần khuyến nghị xác định dựa mức độ tương tự cặp người dùng sản phẩm Bước quan trọng giải thuật lọc cộng tác dựa sản phẩm tính tốn độ tương tự sản phẩm sau chọn sản phẩm mà tương đương để sử dụng công thức dự đốn Ý tưởng tính tốn độ tương tự hai sản phẩm i j là: chọn cặp người dùng mà đánh giá sản phẩm sau áp dụng kỹ thuật tính tốn độ tương tự để mơ tả độ tương tự Khoảng cách Manhattan, khoảng cách Euclidean, hệ số tương tự Cosine, hệ số tương quan Pearson, Thuật toán K-láng giềng gần 12 a) Hệ số tương tự Cosine Trong trường hợp này, sản phẩm biểu diễn thông qua véc-tơ m chiều không gian đánh giá người dùng Độ tương tự chúng đo dựa tính tốn cosine góc véc-tơ [3] Trong ma trận đánh giá m x n, độ tương tự hay sản phẩm i j, biểu diễn sim(i,j) cho công thức: ∑ ( ) √∑ √∑ Trong đó: rui đánh giá người dùng u với sản phẩm i ruj đánh giá người dùng u với sản phẩm j S tập người dùng đánh giá sản phẩm i,j Mỗi sản phẩm đánh giá n người dùng xác định véc-tơ n chiều công thức này, người dùng chọn người đánh giá sản phẩm i j Như theo công thức trên, kết cosine góc hợp véc-tơ Và đánh giá dương nên, cosine véc-tơ thể sản phẩm tự hoàn toàn với đánh giá người dùng, cosine véc-tơ 0, thể sản phẩm khơng tương tự b) Thuật tốn K-láng giềng gần (K-nearest neighbor) Có hai cách tiếp cận phương pháp lọc cộng tác theo kỹ thuật K láng giềng [5] dự đốn dựa tương tự người dùng (User_kNN) dựa mục tin (Item_kNN) Kỹ thuật K láng giềng dựa người dùng xác định độ tương tự hai người dùng thông qua việc so sánh đánh giá họ sản phẩm, sau dự đốn đánh giá sản phẩm i người 13 dùng u, thông qua đánh giá người dùng tương tự với người dùng u Độ tương tự người dùng tính theo Cosine Pearson ( ∑ ) √∑ √∑ Trong đó: rui đánh giá người dùng u với sản phẩm i ruj đánh giá người dùng u với sản phẩm j S tập người dùng đánh giá sản phẩm i, j Tương tự, kỹ thuật K láng giềng dựa mục tin (KNN) xác định độ tương tự dựa mục tin phương pháp Cosine Pearson Sau tính tốn độ tương tự người dùng hay sản phẩm, đánh giá người dùng u sản phẩm i dự đốn theo cơng thức bên dưới: ∑ ∑ Trong đó: () ( )| ( ) ( )| ( ): tập sản phẩm tương tự với sản phẩm i mà người dùng u đánh giá ruj : đánh người dùng u đánh giá sản phẩm j pui : dự đoán đánh giá người dùng u với sản phẩm i 2.2.2 Kỹ thuật lọc cộng tác dựa mơ hình Khác với phương pháp dựa nhớ, phương pháp dựa mơ hình (model-based) sử dụng kĩ thuật thống kê học máy liệu (các đánh giá biết) để xây dựng nên mơ hình Mơ 14 hình sau dùng để dự đoán hạng sản phẩm chưa đánh giá a) Mơ hình mạng Bayes: Mơ hình mạng Bayes biểu diễn sản phẩm đỉnh đồ thị, trạng thái đỉnh tương ứng với giá trị đánh giá người dùng sản phẩm đánh giá Cấu trúc mạng nhận biết từ tập liệu huấn luyện b) Mơ hình phân cụm: Một cụm tập đối tượng liệu có phần tử cụm giống nhiều nhất, khác nhiều phần tử thuộc cụm khác Các phương pháp phân cụm cho lọc cộng tác sử dụng để phân chia tập người dùng (hoặc tập sản phẩm) thành cụm người dùng (hoặc sản phẩm) có sở thích tương tự c) Mơ hình thống kê: Là phương pháp sử dụng cho phép người dùng thuộc về, mức độ đó, nhóm khác Và phân cấp nhóm đề xuất, để nhóm người dùng xem xét khơng có ý kiến tài ngun cụ thể, nhóm cao xem xét khuyến nghị 2.3 Tính tốn dự đốn khuyến nghi Bước quan trọng hệ thống lọc cộng tác đưa kết dự đoán Dự đoán đánh giá người dùng lên sản phẩm suy từ đánh giá người dùng sản phẩm lân cận Một số cơng thức dự đốn bản: dự đốn dựa trung bình đánh giá sản phẩm lân cận, dự đốn dựa tổng trọng số, dự đoán dựa 15 tổng trọng số với đánh giá trung bình người dùng, dự đốn dựa trung bình đánh giá sản phẩm lân cận 2.3.1 Cơng thức dự đốn dựa trung bình đánh giá sản phẩn lân cận 2.3.2 Cơng thức dự đoán dựa tổng trọng số Dự đoán đánh giá người dùng u với sản phẩm i cho công thức sau: ∑ ( ∑ | ) ( )| Iu: sản phẩm mà người dùng u đánh giá đánh giá sản phẩm j người dung u sim(i,j) độ tương tự sản phẩm i, j Tập sản phẩm lân cận của sản phẩm i Cơng thức tính tốn đánh giá người dùng u lên sản phẩm i dựa vào đánh giá người dùng u lên sản phẩm tương tự với i Tổng kết chương Trong chương này, luận văn trình bày phương pháp lọc cộng tác hệ thống khuyến nghị, toán lọc cộng tác hệ thống khuyến nghị, tìm hiểu kỹ thuật, thuật tốn tính tốn dự đốn khuyến nghị cho người dùng Trong chương tiếp theo, luận văn thử nghiệm áp dụng kỹ thuật, thuật toán phương pháp lọc cộng tác vào hệ thống khuyến nghị sách Trung tâm Học liệu – Trường Đại học Quảng Bình 16 Chương – XÂY DỰNG HỆ THỐNG KHUYẾN NGHỊ SÁCH TẠI TRUNG TÂM HỌC LIỆU TRƯỜNG ĐẠI HỌC QUẢNG BÌNH 3.1 Giới thiệu tốn Trung tâm Học liệu Trường Đại học Quảng Bình thành lập ngày 27/3/2013 sở Thư viện Trường ĐHQB Trung tâm hoạt động lĩnh vực thơng tin thư viện, có nhiệm vụ phục vụ hoạt động giảng dạy, học tập, đào tạo, nghiên cứu khoa học … góp phần quan trọng để nâng cao chất lượng đào tạo nguồn nhân lực; đồng thời địa điểm tổ chức Hội thảo, Hội nghị nước quốc tế Trường Đại học Quảng Bình Chiến lược phát triển Trung tâm Học liệu Trường Đại học Quảng Bình tổ chức xây dựng theo mơ hình Trung tâm thơng tin điện tử đại; trọng xây dựng hệ thống Thông tin-Thư viện Tuy nhiên hệ thống web trung tâm chưa có chức khuyến nghị sách cho người dùng Thiết nghĩ chức hay thịnh hành hệ thống thông tin Với hệ thống hy vọng giúp ích nhiều cho giảng viên sinh viên Trường Đại học Quảng Bình thuận tiện việc tìm kiếm thơng tin tài liệu đầu sách mà muốn tìm kiếm 3.2 Áp dụng kỹ thuật lọc cộng tác cho toán khuyến nghị sách: Bài tốn đặt ra: Tìm tập K=(u1, u2, …, uk) người dùng tương tự với người dùng cần khuyến nghị u Sau đó, dựa vào đánh giá tập người dùng gần (tập K người dùng) để tiến hành khuyến 17 nghị sản phẩm sách mà hệ thống dự đốn có khả phù hợp với người dùng u Tập người dùng người người dùng đăng ký hệ thống xác nhận Các đánh giá người dùng lên đầu sách dạng rating có điểm số từ đến tương ứng với độ thích người dùng từ dở đến hay Các điểm số rating người dùng đánh giá đầu sách mà người dùng đọc, tham khảo đưa đánh giá, lưu lại sở liệu Các bước tiến hành: Bước 1: Để tìm tập người dùng gần (tập K) sử dụng bốn phương pháp nêu để tính khoảng cách người dùng cần khuyến nghị u với người dùng khác uk Sau có tương tự người dùng cần khuyến nghị người dùng khác sim( u,uk) tơi dựa vào độ tương tự để tìm k người dùng gần (u1,u2,…uk) với u: k={mini sim(u,uk)} Để làm điều có sở liệu đánh giá người dùng lên đầu sách lưu sở liệu Ta tiến hành định nghĩa ma trận rating có kích thước m X n ; m số lượng người dùng, n số lượng đầu sách, giá trị ma trận điểm đánh giá người dùng lên đầu sách, ta quy ước giá trị giá trị mà người dùng chưa đánh giá đầu sách Để tìm tập người dùng gần tức tìm giống người dùng, sử dụng điểm đánh giá người dùng lên tất sản phẩm làm vector đại diện cho người dùng, so sánh vector với để tìm giống Có nhiều phương pháp để tính tốn độ giống vector, tơi trình bày chương Pearson, Cosine, 18 Dễ dàng nhận thấy phần tử đường chéo ma trận 1, có nghĩa người dùng cần khuyến nghị u hoàn toàn giống với người dùng khác uk Các giá trị nhận gần giá trị thể cho việc hai người dùng giống Bước 2: Tìm sản phẩm K-láng giềng đánh mà người dùng cần khuyến nghị chưa đánh giá để tiến hành khuyến nghị Áp dụng cho tốn cụ thể có trường hợp xảy : Thứ nhất, Khi số lượng người dùng láng giềng gần đánh giá sản phẩm i lúc hệ thống đề xuất người dùng cần khuyến nghị u sản phẩm phù hợp dựa vào sản phẩm đánh giá cao người dùng láng giềng mà người dùng cần khuyến nghị chưa đánh giá Thứ hai, Khi số lượng người dùng láng giềng nhiều tốn đặt có nhiều láng giềng đánh giá sản phẩm i giá trị đánh giá khác nhau, nên phải dự đoán xem đánh giá chung họ có cao hay khơng để khuyến nghị tốt cho người dùng u cho sản phẩm i Đánh giá dự đoán ruk giá trị dự đoán từ K láng giềng gần sản phẩm i Khi đó, cơng thức tính toán dự đoán đánh giá người cần khuyến nghị cho sản phẩm i sau: ∑ ( ) Trong đó: + rui kết dự đốn đánh giá người dùng u cần khuyến nghị cho sản phẩm i + + h( đánh giá người dùng uk cho sản phẩm i ) mức độ ảnh hưởng người dùng uk việc đưa dự đoán đánh giá ruk cho sản phẩm i , hi( thức sau: ) tính cơng 19 ( ) ( ∑ ) ( ) 3.3 Xây dựng hệ thống 3.3.1 Giới thiệu hệ thống Hệ thống khuyến nghị sách Trung tâm Học liệu Trường Đại học Quảng Binh xây dựng dạng website cung cấp thông tin sách có trung tâm giúp người dùng (cụ thể giảng viên sinh viên trường) xem mượn sách Khi người dùng đăng nhập vào hệ thống, người dùng nhận danh sách sách hệ thống khuyến nghị cho họ 3.3.2 Môi trường cài đặt hệ thống Môi trường cài đặt web thiết kế theo mơ hình MVC ( Model View Controller) dùng ngơn ngữ lập trình PHP kết hợp với hệ quản trị sở liệu MySQL 3.3.3 Các chức hệ thống Đăng nhập: Trang chủ hệ thống định danh địa Website, người dùng đăng nhập thơng qua địa Web để truy nhập vào trang chủ hệ thống Đăng ký: Cho phép người dùng thực ký tạo tài khoản hệ thống Người dùng phải cung cấp thông tin tên truy cập, mật khẩu, email,… Danh sách đầu sách: Chức cung cấp danh sách sách theo thể loại… Sách mới: Chức cung cấp danh sách sách vừa đưa vào kho liệu trung tâm Tóm tắt nội dung sách: Cung cấp thơng tin nội dung sách tóm tắt nội dung, năm sản xuất, số trang … Đánh giá sách người dùng: Hệ thống chế đánh giá 20 cho người dùng từ không hay hay, người dùng đánh giá sách mà đọc, mượn Chức khuyến nghị sách cho người dùng: chức quan trọng hệ thống, chức khuyến nghị sách thuật toán KNN để khuyến nghị sách phù hợp cho người dùng khác Những sách hệ thống khuyến nghị thể dạng danh sách xếp theo thứ tự ưu tiên giảm dần theo giá trị dự đoán nhằm giúp người dùng tìm sách mà u thích, với nhu cầu cách nhanh 3.3.4 Sơ đồ Use case Hình 3.2 Use case xem đầu sách khuyến nghị 21 3.3.5 Lược đồ Cơ sở liệu quan hệ Hình 3.4 Lược đồ sở liệu quan hệ 3.3.6 Giải thuật xử lý hệ thống Giải thuật hệ thống khuyến nghị cho người dùng 22 3.3.7 Một số hình ảnh hệ thống Hình 3.5 Giao diện website hệ thống KN sách 23 Hình 3.6 Giao diện người dùng mơ tả chi tiết sách Hình 3.10 Giao diện hệ thống KN sách cho người dùng 24 KẾT LUẬN VÀ KIẾN NGHỊ Luận văn trình bày tìm hiểu hệ thống khuyến nghị ứng dụng phương pháp lọc cộng tác hệ thống khuyến nghị Mục tiêu biết cách xây dựng hệ thống áp dụng kỹ thuật lọc cộng tác vào thực tiễn Luận văn tìm hiểu phương pháp hệ thống khuyến nghị, cụ thể sâu thuật toán, kỹ thuật phương pháp lọc cộng tác hệ thống khuyến nghị triển khai xây dựng hệ thống khuyến nghị sách cho người dùng Luận văn xây dựng ứng dụng khuyến nghị sách Trung tâm Học liệu Trường Đại học Quảng Bình Tuy nhiên, luận văn nhiều điểm hạn chế, luận văn mức độ nghiên cứu, tìm hiểu, mô thử nghiệm, chưa cài đặt ứng dụng hệ thống thực tế Trường Đại học Quảng Bình Những hạn chế đưa số hướng mở cho đề tài tiếp tục phát triển sau: Tiếp tục tìm hiểu phương pháp lọc nội dung phương pháp lọc kết hợp hệ thống khuyến nghị số thuật toán liên quan đến hệ thống khuyến nghị Tiếp tục nghiên cứu số kỹ thuật dự đốn khuyến nghị từ đưa kỹ thuật tối ưu để áp dụng cho hệ thống khuyến nghị Hoàn thiện chức hệ thống áp dụng ứng dựng vào hệ thống Trung tâm Học liệu – Trường Đại học Quảng Bình ... dụng kỹ thuật, thuật toán phương pháp lọc cộng tác vào hệ thống khuyến nghị sách Trung tâm Học liệu – Trường Đại học Quảng Bình 16 Chương – XÂY DỰNG HỆ THỐNG KHUYẾN NGHỊ SÁCH TẠI TRUNG TÂM HỌC... thống khuyến nghị kỹ thuật lọc cộng tác hệ thống khuyến nghị Phạm vi đề tài tập trung nghiên cứu vào: kỹ thuật lọc cộng tác để xây dựng ứng dụng hệ khuyến nghị sách Trường Đại học Quảng Bình Phương... hiểu hệ khuyến nghị ứng dụng kỹ thuật lọc cộng tác để xây dựng hệ thống khuyến nghị sách Trung tâm Học liệu Trường đại học Quảng Bình Đối tượng phạm vi nghiên cứu: Đối tượng nghiên cứu hệ thống khuyến