Bài viết đề xuất giải pháp xây dựng hệ thống gợi ý bài báo khoa học nhằm gợi ý cho người đọc những bài báo được hệ thống dự đoán là phù hợp với sở thích và lĩnh vực nghiên cứu của họ. Để xây dựng hệ thống, trước hết chúng tôi đề xuất phương pháp thu thập thông tin phản hồi (feedback) từ người dùng, sau đó đề xuất sử dụng phương pháp tập hợp các mô hình phân rã ma trận để dự đoán các phản hồi đó. Mời các bạn cùng tham khảo!
Thảo Quốc Gia 2015vềvềĐiện ĐiệnTử, Tử,Truyền TruyềnThông Thông TinTin (ECIT 2015) HộiHội Thảo Quốc Gia 2015 Công CôngNghệ NghệThông Thông (ECIT 2015) Hệ Thống Gợi Ý Bài Báo Khoa Học Sử Kim Anh Nguyễn Thái Nghe Trường Đại học Cần Thơ Email: {skanh,ntnghe}@ctu.edu.vn nghiên cứu khoa học, đặc biệt hỗ trợ cơng tác tìm kiếm, gợi ý nguồn tài nguyên học tập, gợi ý tài liệu, hay cụ thể gợi ý báo khoa học chưa khai thác tốt, giới có nghiên cứu liên quan xây dựng hệ thống gợi ý báo, sử dụng kỹ thuật láng giềng lân cận tìm kiếm theo ngữ nghĩa giới thiệu nghiên cứu [4, 7] Tóm tắt - Trong nghiên cứu này, đề xuất giải pháp xây dựng hệ thống gợi ý báo khoa học nhằm gợi ý cho người đọc báo hệ thống dự đốn phù hợp với sở thích lĩnh vực nghiên cứu họ Để xây dựng hệ thống, trước hết đề xuất phương pháp thu thập thông tin phản hồi (feedback) từ người dùng, sau đề xuất sử dụng phương pháp tập hợp mơ hình phân rã ma trận để dự đốn phản hồi Do báo khoa học phù hợp cho số đối tượng định lĩnh vực nên đề xuất áp dụng phương pháp gợi ý lọc theo ngữ cảnh đầu kết dự đốn từ gợi ý top-N báo phù hợp Sau xây dựng xong mơ hình gợi ý, bước việc phân tích, thiết kế cài đặt hệ thống quản lý báo đồng thời tích hợp giải thuật xây dựng vào hệ thống Khi có hệ thống hồn chỉnh, chúng tơi thu thập ý kiến phản hồi từ người dùng thực để đánh giá hiệu hệ thống Kết cho thấy khả gợi ý phù hợp cho người dùng đạt độ tin cậy tốt triển khai vào thực tế Trong viết này, đề xuất giải pháp “Xây dựng hệ thống gợi ý báo khoa học” dùng kỹ thuật phân rã ma trận [21][14] kết hợp với xử lý ngữ cảnh đầu [3] nhằm tối ưu hóa việc hiển thị nội dung báo phù hợp với đối tượng người đọc II Hệ thống gợi ý (Recommender Systems - RS) dạng hệ thống lọc thông tin (information filtering), sử dụng để dự đốn sở thích (preference) hay xếp hạng (rating) mà người dùng dành cho mục thơng tin (item) mà họ chưa xem xét tới khứ (item báo, phim, đoạn video clip, sách, ) [14] nhằm gợi ý mục thông tin “có thể quan tâm” người dùng Hệ thống gợi ý đưa gợi ý dựa q trình thu thập, xử lý phân tích liệu từ người dùng Dữ liệu chia làm loại tường minh (explicit) bằ ng cá ch yêu cầu người dùng phản hồi trực tiếp tiềm ẩn (implicit) bằ ng cách tự động suy luận dựa những tương tác người dùng với hệ thống như: số lần nhấp chuột, thời gian quan sát Từ khóa- Kỹ thuật phân rã ma trận, hệ thống gợi ý, lọc cộng tác, gợi ý báo khoa học I GIỚI THIỆU Ở trường đại học, bên cạnh cơng tác giảng dạy nghiên cứu khoa học nhiệm vụ quan trọng giảng viên Hoạt động nghiên cứu khoa học tất yếu trước xu phát triển ngày sâu rộng tất lĩnh vực giới Do đó, để đảm bảo chất lượng đào tạo vấn đề nghiên cứu khoa học phải đầu tư xuyên suốt, song hành với trình đào tạo mình, mà cơng trình khoa học trường không ngừng tăng lên Với lượng ngày tăng, việc tìm kiếm tốn thời gian việc tự động gợi ý báo thật đáp ứng u cầu nghiên cứu tìm kiếm thơng tin cán sinh viên đồng thời phù hợp với chuyên ngành, trình độ, lĩnh vực nghiên cứu người sử dụng vấn đề có ý nghĩa cần thiết Trong phần lớn trường hợp, toán gợi ý coi toán dự đoán việc xếp hạng (rating) sản phẩm (phim, sản phẩm tiêu dùng, sách, nhạc…) chưa người dùng biết đến Việc dự đoán thường dựa đánh giá có người dùng người dùng khác Ví dụ, báo dự đốn có xếp hạng cao dùng để gợi ý Bên cạnh đó, Hệ thống gợi ý (recommender systems) phát triển ứng dụng mạnh mẽ [1, 2, 8, 13] Đây lĩnh vực quan trọng khai phá liệu Những nghiên cứu ứng dụng lĩnh vực tăng mạnh năm gần đây, đặc biệt lĩnh vực thương mại Hệ thống gợi ý sản phẩm Ebay, Amazon, ; lĩnh vực giáo dục; lĩnh vực giải trí hệ thống gợi ý phim ảnh Movielens, Netflix, [2]; lĩnh vực khác [1, 2, 8, 16] Hệ thống gợi ý chứng minh ý nghĩa to lớn: giúp cho người sử dụng trực tuyến đối phó với tình trạng q tải thơng tin Hệ thống gợi ý trở thành công cụ mạnh mẽ phổ biến thương mại điện tử Mục đích hệ thống gợi ý dựa vào hành vi từ thói quen, nhu cầu khứ người sử dụng để dự đoán sở thích tương lai họ Một cách hình thức, gọi U tập tất người dùng I tập tất mục tin gợi ý máy tính, sách, phim ảnh, báo Để dự đoán xếp hạng Trong nước, có nhiều nhóm nghiên cứu xây dựng hệ thống gợi ý như: Hệ thống gợi ý môn học [9], gợi ý phim [19]; gợi ý hát [12]; lĩnh vực khác việc xây dựng giải thuật cho hệ thống gợi ý [10, 15, 13] Tuy vậy, việc xây dựng hệ thống gợi ý lĩnh vực ISBN: 978-604-67-0635-9 HỆ THỐNG GỢI Ý báo ứng với người dùng người ta đưa hàm rˆ : U x I R R tập thứ tự tồn phần (ví dụ số nguyên dương số thực tập xác định) Sau dự đoán, kết 388 388 Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) xếp giảm dần ta chọn top-N báo để gợi ý cho người dùng A Hệ thống xây dựng dạng website cung cấp thông tin báo giúp người dùng chọn báo mà cần đến Khi người dùng truy cập vào hệ thống, tìm kiếm, xem tải báo máy Ngồi ra, hệ thống phân loại báo theo thể loại, nhằm mang đến tiện lợi cho người sử dụng cung cấp thông tin chi tiết báo như: tên báo, tác giả, tóm tắt… Trong hệ thống gợi ý báo sử dụng Matrix Factorization (MF), state-of-the-art hệ thống gợi ý [1][20], với nhân tố phản hồi tiềm ẩn số lần click item nhân tố phản hồi tường minh (rate) mức độ quan tâm người dùng đến báo Tích hợp thơng tin dự đốn phương pháp tập hợp mơ hình cho hai nhân tố Với đặc điểm hệ thống gợi ý, hệ thống phải có chức thu thập phản hồi từ người dùng Thông thường hệ thống ghi nhận phản hồi người dùng hình thức ghi nhận giá trị xếp hạng cụ thể (thích (1) / khơng thích (0), từ đến 5) gọi phản hồi tường minh (explicit feedback) Tuy nhiên, với cách hệ thống thường khó ghi nhận nhiều phản hồi từ người dùng Vì người dùng phải tự thể phản hồi cách tường minh Điều bất tiện thường làm cho người dùng khơng thích Trong hệ thống gợi ý báo này, người dùng (giảng viên, sinh viên) xem user, báo khoa học item, người dùng đạt lần truy cập vào báo hay số bình chọn người dùng báo xem rating minh họa Hình Do đó, để tạo tiện lợi cho người dùng hệ thống thu thập nhiều phản hồi cách dễ dàng, hệ thống gợi ý báo này, đề xuất ghi nhận phản hồi người dùng dạng phản hồi tiềm ẩn (implicit feedback) Hệ thống tự động ghi nhận lại thông tin người dùng thông qua đăng ký tài khoản, giá trị phản hồi - trọng số xếp hạng ghi nhận số lần click vào báo người dùng lựa chọn báo truy xuất hay đăng nhập vào hệ thống Chức lưu trữ số lần chọn (click) xem báo hệ thống tự động cập nhật vào sở liệu đếm theo địa IP (IP address) người truy xuất Khi thực đăng nhập vào tài khoản, hệ thống so sánh IP address người dùng lưu trữ lại số liệu theo tài khoản người sử dụng sử dụng làm trọng số (rate) cho xếp hạng người sử dụng Hình Minh họa kỹ thuật phân rã ma trâ ̣n Mục tiêu kỹ thuật phân rã ma trận X thành ma trận nhỏ W H cho ta xây dựng lại X từ ma trận (1) Với W H là ma trận W =ℜ U ×K H =ℜ I ×K (2) K: số nhân tố tiềm ẩn (latent factors) K