1. Trang chủ
  2. » Tất cả

187-382-1-SM (1)

10 2 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

Kỷ yếu Hội nghị Quốc gia lần thứ VIII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 DOI: 10.15625/vap.2015.000185 MỘT TIẾP CẬN TRONG XÂY DỰNG HỆ THỐNG GỢI Ý THEO NGỮ CẢNH Lư Chân Thiện1 Nguyễn Thái Nghe2 Khoa Kỹ thuật Công nghệ, Trường Cao đẳng Cộng đồng Kiên Giang, E-mail: lcthien_kgcc@yahoo.com Khoa Công nghệ Thông tin Truyền thơng, Trường Đại học Cần Thơ, E-mail: ntnghe@cit.ctu.edu.vn Tóm tắt - Hệ thống gợi ý (Recommender Systems - RS) ứng dụng rộng rãi nhiều lĩnh vực (như thương mại điện tử, giải trí, giáo dục, ) nhằm dự đốn sở thích người dùng nhờ vào thông tin cá nhân phản hồi (đánh giá) họ Bài viết đề xuất giải pháp xây dựng hệ thống gợi ý theo ngữ cảnh, áp dụng cho gợi ý du lịch nhằm gợi ý điểm du lịch phù hợp với du khách Hệ thống kết hợp phương pháp gợi ý dựa ngữ cảnh đầu vào (contextual prefiltering), tích hợp với kỹ thuật phân rã ma trận (matrix factorization) xử lý ngữ cảnh đầu (contextual post-filtering) nhằm tăng độ xác cho hệ thống Sau xây dựng hệ thống tích hợp giải thuât gợi ý, thu thập thông tin từ người dùng thực nhằm đánh giá hiệu hệ thống đề xuất Thực nghiệm cho thấy việc ứng dụng giải pháp hỗ trợ phát triển du lịch hồn tồn khả thi Từ khóa: Hệ thống gợi ý theo ngữ cảnh, hệ thống gợi ý du lịch, kỹ thuật phân rã ma trận, lọc cộng tác I GIỚI THIỆU Ngành du lịch năm qua phát triển mạnh mẽ, đem lại lợi ích to lớn kinh tế - xã hội, góp phần thúc đẩy ngành sản xuất dịch vụ phát triển Với tiềm du lịch đa dạng phong phú, Việt Nam nước có nhiều danh lam thắng cảnh, từ thu hút khơng khách du lịch nước Tuy nhiên, khách du lịch thường gặp phải nhiều khó khăn đến thành phố lạ lẫm Họ cần phải nhờ đến trợ giúp hướng dẫn viên du lịch phải dựa vào sách hướng dẫn hay đồ để có thơng tin mà họ cần tìm Tuy nhiên trợ giúp có hạn chế định như: Khách du lịch khó tìm thấy thơng tin chi tiết địa điểm du lịch cần tham quan để có chuẩn bị cần thiết Hoặc là, hướng dẫn viên du lịch thường hướng dẫn cho đoàn khách, họ theo tour du lịch định sẵn tham quan điểm du lịch chính, điểm du lịch thú vị lại khơng tham quan, cách địa điểm gần Như làm để hỗ trợ khách du lịch dễ dàng tìm thấy địa điểm phù hợp với họ, phù hợp với điều kiện ngữ cảnh xung quanh (như thời tiết, tâm trạng, bạn đồng hành, ) Để đáp ứng địi hỏi trên, việc ứng dụng cơng nghệ hệ thống gợi ý với yếu tố ngữ cảnh cho kết phù hợp Hệ thống gợi ý (Recommender Systems - RS) dạng kỹ thuật lọc thông tin, RS ứng dụng rộng rãi nhiều lĩnh vực (như thương mại điện tử, giải trí, giáo dục, ) nhằm dự đốn sở thích người dùng nhờ vào thơng tin cá nhân phản hồi (đánh giá) họ Bài viết đề xuất giải pháp xây dựng hệ thống gợi ý dựa ngữ cảnh, sau ứng dụng giải pháp cho toán gợi ý điểm du lịch Hệ thống vận hành Web để hỗ trợ khách du lịch nhằm đem lại thoải mái tiện dụng tối đa cho họ tham gia vào hệ thống Để thực hiện, nghiên cứu phương pháp có đề xuất phương pháp xây dựng hệ thống cách kết hợp phương pháp gợi ý dựa ngữ cảnh đầu vào (contextual pre-filtering), tích hợp với kỹ thuật phân rã ma trận (matrix factorization) xử lý ngữ cảnh đầu (contextual post-filtering), đồng thời tìm hiểu đề xuất hướng khắc phục vấn đề người dùng hệ thống Sau xây dựng hệ thống hồn chỉnh, chúng tơi thu thập ý kiến phản hồi từ người dùng thực, từ đánh giá hiệu hệ thống xây dựng II HỆ THỐNG GỢI Ý (RECOMMENDER SYSTEMS - RS) VÀ CÁC NGHIÊN CỨU LIÊN QUAN Hệ thống gợi ý (RS) hệ thống có khả dự đoán cung cấp cho người dùng thông tin, sản phẩm hay dịch vụ mà họ thích/quan tâm RS đưa gợi ý dựa phản hồi khứ người dùng (như bình luận, đánh giá,…) sản phẩm, hát, phim, điểm du lịch, Các hệ thống gợi ý tiếng có như: gợi ý sản phẩm Amazon/Ebay, gợi ý phim/video clip NetFlix/Youtube,… RS cho thấy ý nghĩa to lớn việc giúp người dùng giải tình trạng tải thơng tin Có hai loại mơ hình RS nghiên cứu ứng dụng thực tiễn là: hệ thống gợi ý chiều (2D RS) hệ thống gợi ý theo ngữ cảnh (đa chiều, thông thường chiều – 3D RS) A Hệ thống gợi ý hai chiều Trong hệ thống gợi ý chiều có hai khái niệm người dùng (user) mục tin (item) cần gợi ý đến cho người dùng Quá trình gợi ý dựa vào phản hồi (feedbacks/rating) người dùng đối tượng Ví dụ, đánh giá người dùng sản phẩm mà họ mua Amazon từ  đến  Nhiệm vụ RS dự đoán đánh giá người dùng item mà họ chưa thấy/mua sau gợi ý cho họ Một cách hình thức, gọi U tập người dùng (users); I tập mục tin (items) Tập I lớn, từ hàng trăm ngàn (sách, CD,…) đến hàng triệu (như báo, tin,…) R tập giá trị đánh giá người dùng mục tin 486 MỘT TIẾP CẬ ẬN TRONG XÂY Y DỰNG HỆ TH HỐNG GỢI Ý TH HEO NGỮ CẢNH H Thông T thườngg liệu đượcc biểu diễn troong ma trận chiều, t dịng user, u cột item v m ô đánh giá user t item tươnng ứng) Với m người dùnng u ∈ U, cần tìm mục i ∈ I (u chưa xem//mua i) chho hàm h ̂ đo độ pphù hợp (xếp hạng/đánh h giáá) người dù ùng u đạt giá trị lớn trêên i: ̂: U × I → R (11) Các kỹ thuật RS R thường đượ ợc phân thành ba nhóm [1]: Dựa t nội dung (content-baseed filtering): người n dùng đư ược gợi ý nhữ ững item tươngg tự item i đượ ợc họ đáánh giá cao; - Lọc ccộng tác (collaaborative filteering): người dùng d gợ ợi ý sản phhẩm mà nhữngg người sở thích với họ h đánh giá cao Đây kỹ thuật thư ường sử dụng nhất; - Lai ghép (hybrid): kết hợp phương p pháp - Ý tưởnng kỹ k thuật lọc cộộng tác dự đoán đ độ phù hợp h item i đánh giiá người dùng d u dựa trêên tập t N(ui,i) người dùng ui i, ui ngườ ời có sở thích t với u Ví dụ, để gợi ý điểm du lịch cho ngườ ời dùng d u, đầu tiêên hệ thống lọọc cộng tác tìm m ngườ ời dùng khác có c sở thích với u Sau đó, nơ họ đán nh giá g cao đượ ợc dùng để gợii ý cho u B B Hệ thống gợi g ý theo ngữ ữ cảnh (Contexxt-aware RS) Thông thường RS hai chiều,, người ta thườ ờng biểu diễnn liệu vào ma m trận user-ittem chhỉ quan tâm đếến người n dùng vvà mục tin khhơng quan tâm m đến thôông tin ngữ cảnh c (context)) bên ngồi có tác động đếến q định củaa người dùng hay không “T Thông tin ngữ ữ cảnh nhữnng thơng tin có c thể mơ tả đư hồn cảnnh thự ực thể” t [3] Ví dụụ: thời gian, nơi n chốn, thời tiết, tâm trạngg,… nhữngg thơng tin ngữ ữ cảnh, chúngg ảnh hưởng h đến đánnh giá g người dùng item, từ đ dẫn đến ảnh hưởng củủa gợi ý RS đ chiều, hàm ̂ bổ sun ng thêm thôngg tin ngữ cảnh h (context) trở thành: Với hệ thống gợi ý đa ̂: U × I × C → R (C thhông tin ngữ cảnh) c m địịa điểm du lịch h, ngữ cảnh thờ ời ví dụ, ttrong hệ thốngg gợi ý du lịchh, user khácch du lịch, item gian g (buổi sánng/tối, cuối tuuần, mùa, lễ, tết,…), t bạn đồng đ hành (đi mình, đii với bạn trai//bạn gái, vớ ới gia đình, trrẻ nhỏ…) n Nhữngg đánh giá chho điểm du d lịch người dùng phụ ụ thuộc vào nhhững ngữ cảnhh Ví dụ vàào buổi b tối mùa xxn gia đình địa đ điểm ABC C hấp dẫn nhất, n k bạạn gái có thhể địa điểm đ khơng k phù hợpp Không gian gợi ý ba b chiều có thhể mơ tả t khối lập phương n Hình 1 Ơ tơ đậm cho c biết số s R(101,7,1) R = có ý nghĩa người dùng có mã số 1011 đánh giá sảnn phẩm có mã số điều kiện thời gian g có mã số với v giá trị đánnh giá Trong T khối lậpp phương y, khơng phải có c giá trị, nhữ ững khơng có c giá trị d người n dùng chhưa đánh giá Mục tiêu củaa hệ thống gợii ý dự đoánn giá trị nhữ ững cịn thiếếu đó, từ đưa đ lời gợi ý đến đ với người dùng Hình Minh họa cho khơng gian gợi ý ba chiều (ng guồn [3]) h thống gợi ý đa chiều có thhể tóm tắt t sau [3]]: Các phương pháp tiếếp cận hệ • Xử lý ngữ ữ cảnh đầu vàào (Contextuaal pre-filteringg): Trong tiếpp cận này, thô ông tin ngữ ữ cảnh sử s dụng để lự ựa chọn hoặcc xây dựng cáác thiết lập cóó liên quan đếến liệu (xếếp hạng) Sauu lọc thônng tin ngữ cảnnh, hệ thống đa đ chiều trrở thành hệ thhống hai chiềuu ta sử dụng k phương phááp gợi ý truyềền thống t liệệu chọn Lư L Chân Thiện, Nguyễn N Thái Nghhe • • 48 87 Xử lý ngữ ữ cảnh đầu raa (Contextual post-filtering)): Trong tiếp cận này, ngữ cảnh thông tiin ban đầu bị bỏ qua xếếp hạng đượcc dự đoán bằnng cách sử dụụng phư ương pháp gợii ý truyền thống toàn b liệu Saau đó, gợi ý điềuu chỉnh cho mỗ ỗi người sử dụụng cáchh sử dụng thơng tin theo o ngữ cảnh Mơ hình hhóa ngữ cảnh (Contextual modeling): m Ph hương pháp nàày xây dựng m mơ hình dự d đốn Ví dụụ, mơ hình nàày đưaa xác suất m người dùùng cụ thể chọọn sản phhẩm cụ thể tro ong bối cảảnh cụ thể Saau xác suấất dùùng để điều chhỉnh tìm raa gợi ý phù hợ ợp C C Các nghiênn cứu liên qua an Hiện cũũng có nhiiều nghiên ứu xây dựnng hệ thống gợ ợi ý hỗ trợ duu lịch, đa phần sử dụng phươnng pháp p lọc theoo nội dung (coontent-based filtering) (Geediminas Adomavicius andd Alexander Tuzhilin, T 20088), (Francescco Ricci, R 2002), ((Linaza et al., 2011) Ngoàii ra, có c nhiều nghiêên cứu xây dự ựng hệ thống gợi g ý du lịch thiết bị b di d động, trrình bày g (José et al., 2012), (Damiaanos et al., 2014), (Gavalass et al., 2013) (Manuel ( et al , 2012) Ở cchúng đề đ xuất xây dự ựng hệ thống gợi ý có tích hợp phươ ơng pháp xử lý ngữ cảnnh đầu vào, kếết hợp h với kỹ thuuật phân rã maa trận (matrixx factorizationn) (Koren et all., 2009) (Ngu uyễn Thái Nghhe, 2013), xử x lý ngữ cản nh đầu đ III PHƯƠ ƠNG PHÁP ĐỀ Đ XUẤT n cảnh, chúúng đề xuấtt kết hợp phương p pháp minh họaa Hình 2: Để xâyy dựng hệ thốnng gợi ý theo ngữ Trước T tiên xử lý thông tin ngữ n cảnh đầu vào, dùng kỹ thuật phân p rã ma trậận để dự đoánn kết quả, sau xử lý thơnng tin t ngữ cảnh đđầu Hình Qu uy trình gợi ý thheo ngữ cảnh A A Xử lý thôngg tin ngữ cảnh h đầu vào Phươngg pháp dù ùng điều kiện ngữ cảnh c cung cấấp trực tiếp từ người dùngg (sở thích, tâm m trạng,…) t hoặcc từ môi trườn ng (thời gian, thời t tiết, vị trí tại,…) sau s truy vấnn, tìm kiếm nhhững nguồn tàài nguyên thícch hợp h để đư ưa gợi ý Dữ D liệu đầu vàào tập bao b gồm: ngư ười dùng, đối tượng, t ngữ cảảnh đánh đ giá tươnng ứng ứ Sau dùùng điều kiện n ngữ cảnh hiệện ngườ ời dùng cung cấp để lọc tập liệu có ó liên quan đếến ngữ cảnh đóó Sau S lọc taa bỏ qu ua thông tin ngữ n cảnh, toánn gợi ý đa chiềều lúc trở dạng toán gợi ý haai chiều c minnh họa Hình H Từ đâây, ta ápp dụng bất kỳỳ phương phápp gợi ý hai chhiều để dự ự đoán item m cho c người dùnng Lợi ích củủa việc làà tái sử dụng tất n phương g pháp gợi ý hai chiều sauu chiều nggữ cảnh c thuu giảm Hình Sử dụụng phương phááp Pre-filtering Ví dụ: Giả sử ta có tập liệu ngữ ữ cảnh gợi ý du d lịch Bảảng 1, gồm: người n dùng (usser), địa điểm m du lịch (item m), c thông tin nngữ cảnh (thờii gian, bạn đồồng hành, thời tiết) đánh giá ngườii dùng địaa điểm du lịchh tương ứng Bảảng Minh hoạạ tập liệu duu lịch với ngữ cảnh user 1 2 3 item 5 time Cuối tuần C C Cuối tuần Lễ - tết Ngàày tuần Lễ - tết Lễ - tết C Cuối tuần Lễ - tết Bạn Đồngg hành Bạn bè b Một m Gia đìình Bạn bè b Gia đìình Gia đìình Bạn bè b Gia đìình Thời tiết Trời nắng Trời âm u T xannh Trời Trời nắng T xannh Trời T xannh Trời Trời nắng T xannh Trời raate 5 488 MỘT TIẾP CẬ ẬN TRONG XÂY Y DỰNG HỆ TH HỐNG GỢI Ý TH HEO NGỮ CẢNH H Để gợi ý cho người dùng d với thông tin ngữ ữ cảnh là: (dịp Lễ - tết, cù ùng Gia đình, Trời xaanh) ta sử dụnng phương p pháp xxử lý ngữ cảnhh đầu vào để lọc l (các dònng tô đậậm) tập liệu u Bảng Bảng Tập liệu l sau sử dụng Pre-filteriing user item ratee 3 4 Như vậậy sau xử lý xong ta tập liệu hai chhiều Lúc này, ta áp dụng thuậật toán hệ h thống t gợi ý truuyền thống đểể dự đoán xếpp hạng gợi ý cho người dùng Trong b viết này, chúng c sử dụng d tronng n phươngg pháp lọc cộn ng tác dựa mơ hình đóó kỹ thuật phân p rã ma trậận (Matrix Facctorization - MF) M tập d liệu xxử lý ngữ cảnhh đầu vào Kỹỹ thuật MF cóó độ tin cậy caao so với kỹ thuật khác nayy (Koren et all., 2009) B B Kỹ thuật phhân rã ma trậận (Matrix Facctorization - MF) M Kỹ thuậật phân rã ma trận việc chhia ma trậận lớn X thànhh hai ma trận có c kích thước nhỏ W v H, cho ta t có c thể xây dựnng lại X từ hai ma trận nhỏ h c xác càngg tốt, nghĩa X ~ WHT, minh họa troong Hình Hình Minhh họa kỹ thuật phân p rã ma trận Trong đđó, W∈ℜ|U|×KK ma trrận mà dòòng u véctơ v bao gồm m K nhân tố tiiềm ẩn (latentt factors) mơ tả t người n dùng u;; H∈ℜ|I|×K ma trậận mà dòng i vééctơ bao gồm m K nhân tố tiềềm ẩn mô tả cho c item i Gọọi wuk hik cáác phần tử tươ ơng ứng haai ma trận W H, xếp x hạng người dùng u mục tin i dự đoáán b công thức:: K rˆui = ∑ wuk hik = w.hT (1 1) k =1 Như vậậy, vấn đề thenn chốt kỹ thuật MF làm đểể tìm giáá trị hai th ham số W H H Hai tham số s n có bằằng cách tối ưu hóa hàm mụục tiêu (objecttive function) Trong RS, hààm mục tiêu củủa MF hay đượ ợc sử dụng nh hư sau: s O MF = ∑ u ,i∈D train ( rui − rˆui ) = K ⎛ ⎞ ⎜ rui − ∑ wuk hik ⎟ ∑train t k =1 ⎝ ⎠ u ,i∈D (22) Một troong kỹ thuật dùng d để tối ưu hóa hàm mụcc tiêu dùng SGD S (Stochasstic Gradient Descent) D Để tốối ưu hóa hàm m mục tiêu (2), trrước tiên ta khhởi tạo giiá trị ngẫu nhiiên cho W vàà H, sau từ ừng bước cập nhật n giá trị củ chúng c cho đếnn hàm mụcc tiêu hội tụ vvề giá trị nhỏ n (convergeence) Để làm m điều đóó, ta cần phải xxác định nêên tăng t hay nên ggiảm giá trịị W H qua lần cập nhật, vậậy cần phải tìm m đạo hàm từnng phần chhúng: ∂ O MF = −2(ruii − rˆui )hik ∂wuk 3) (3 ∂ MF O = −2(rui − rˆui )wuk ∂hik (4 4) Lư L Chân Thiện, Nguyễn N Thái Nghhe 48 89 Sau khii tìm đạo hàm,, phần tử c W H sẽẽ cập nhậật ngược hướn ng với giá trị củ đạo hàm, quua công thức: wuknkew = wukold − β ⋅ hikneew = hikold − β ⋅ ∂ O MF = wukold + 2β ⋅ (rui − rˆui )hik ∂wuk ∂ MF O = hikold + 2β ⋅ (rui − rˆui ) wuk ∂hik 5) (5 (6 6) Trong đ β tốc độ học (learning rate, < β

Ngày đăng: 25/09/2020, 08:31

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN