1. Trang chủ
  2. » Luận Văn - Báo Cáo

SOME METHODS OF RECOMMENDER SYSTEM AND ITS APPLICATION IN E-COMMERCE - Full 10 điểm

15 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Một Số Phương Pháp Gợi Ý Và Ứng Dụng Trong Thương Mại Điện Tử
Tác giả Hồng Thị Hà, Ngơ Nguyễn Thức
Trường học Học viện Nông nghiệp Việt Nam
Chuyên ngành Công nghệ thông tin
Thể loại bài báo
Năm xuất bản 2021
Thành phố Hà Nội
Định dạng
Số trang 15
Dung lượng 2,22 MB

Nội dung

Vietnam J Agri Sci 2021, Vol 19, No 4 : 520 - 534 T ạ p chí Khoa h ọ c Nông nghi ệ p Vi ệ t Nam 2021, 19(4 ): 520 - 534 www vnua edu vn 520 M Ộ T S Ố PH ƯƠ NG PHÁP G Ợ I Ý VÀ Ứ NG D Ụ NG TRONG TH ƯƠ NG M ẠI ĐIỆ N T Ử Hoàng Th ị Hà 1* , Ngô Nguy ễ n Th ứ c 2 1 Khoa Công ngh ệ thông tin, H ọ c vi ệ n Nông nghi ệ p Vi ệ t Nam 2 Sinh viên K57 - Khoa Công ngh ệ thông tin, H ọ c vi ệ n Nông nghi ệ p Vi ệ t Nam * Tác gi ả liên h ệ : htha@vnua edu vn Ngày nh ậ n bài: 20 07 2020 Ngày ch ấ p nh ận đăng: 2 9 03 2020 TÓM T Ắ T H ệ g ợ i ý (Recommender System) là công c ụ đư ợ c thi ế t k ế nh ằ m cung c ấ p nh ữ ng khuy ế n ngh ị h ữ u ích v ề s ả n ph ẩ m, d ị ch v ụ ,…cho ngư ờ i dùng H ệ g ợ i ý d ự a trên d ữ li ệ u v ề m ố i quan h ệ gi ữ a ngư ờ i dùng, s ả n ph ẩ m và các hành vi c ủ a ngư ờ i dùng trong qu á kh ứ đ ố i v ớ i s ả n ph ẩ m đ ể đưa ra nh ữ ng g ợ i ý thông minh, phù h ợ p v ớ i s ở thích c ủ a t ừ ng khách hàng H ệ g ợ i ý giúp khách hàng nhanh chóng đ ị nh v ị đư ợ c nh ữ ng s ả n ph ẩ m h ọ quan tâm đ ể t ừ đó đưa ra quy ế t đ ị nh đúng đ ắ n khi mua s ắ m online Trong bài báo này, chúng tôi trình bày t ổ ng quan m ộ t s ố phương pháp g ợ i ý, đánh giá đi ể m m ạ nh, đi ể m y ế u, so sánh hi ệ u qu ả th ự c hi ệ n c ủ a m ỗ i phương pháp Chúng tôi ch ỉ ra l ợ i ích mà các h ệ g ợ i ý mang l ạ i cho thương m ạ i đi ệ n t ử , đ ồ ng th ờ i nêu ra nh ữ ng thách th ứ c và gi ả i pháp kh ắ c p h ụ c K ế t qu ả th ự c nghi ệ m c ủ a chúng tôi trên 4 t ậ p d ữ li ệ u chu ẩ n (Movielens, Epinions, BookCrossing, LastFM) cho th ấ y m ỗ i phương pháp đ ề u có nh ữ ng ưu đi ể m và h ạ n ch ế riêng, không có phương pháp nào là t ố t nh ấ t trên t ấ t c ả các tiêu chí Ngoài ra, chúng tôi c ũ ng đưa ra quy trình chung đ ể xây d ự ng h ệ g ợ i ý trong các website thương m ạ i và th ự c hi ệ n tích h ợ p các k ỹ thu ậ t h ệ g ợ i ý trong website thương m ạ i đi ệ n t ử kh ắ c ph ụ c v ấ n đ ề ngư ờ i dùng m ớ i, s ả n ph ẩ m m ớ i (v ấ n đ ề này còn g ọ i là “Cold start problem” ) c ủ a các phươ ng pháp g ợ i ý cá nhân hóa T ừ khóa: H ệ g ợ i ý, l ọ c c ộ ng tác, g ợ i ý d ự a trên n ộ i dung, h ệ g ợ i ý k ế t h ợp, thương mại điệ n t ử Some Methods of Recommender System and its Application in E-Commerce ABSTRACT The designed recommender system is a tool to provide important suggestions forusers or customers Based on the datasets of user relationships, products, andprevious behavior of consumers, smart recommendations for the preferences of eachconsumer are given, which helps consumers tomake good decisions while shopping online In this article, we present an overview of some methodologies of recommendation systems, techniques of recommender systems, and evaluate the strengths and weaknesses of each technique, as well as comparedsome benefits of recommender systems in e-commerce Moreover, we report some challenges that the recommender systems are facing and list some solutions to solve these challenges Our experimental results on the four datasets ( Movielens 100k , Epinions,BookCrossing, LastFM ) showed that there was n o best recommendation algorithm in all evaluation metrics Finally, we buil t an e - commerce website that integrate d some different techniques of recommender systems such as non - personalized methods, personalized methods to recommend the right product for ea ch customer The experimental system gives some diverse suggestions to overcom e the problem "Cold start problem" of personalized methods Keywords: Recommender systems, collaborative filtering, content-based filtering, hyper filtering, E-Commerce 1 Đ Ặ T V Ấ N Đ Ề Trong nh Ăng nëm gæn đåy, cùng vĆ i s ă ph ổ bi ế n c û a m äng Internet và máy tính, thþĄng m äi điệ n t ā đã phát triể n nhanh chóng trên ph ä m vi toàn c æu ThþĄng mäi điệ n t ā đã thay đổ i hình th Ā c giao d ð ch truy ề n th ố ng Ngày càng có nhi ều ngþą i l ă a ch ọ n hình th Ā c mua s í m tr ă c tuy ến Trong khi đò, để m ć r ộ ng th ð trþą ng kinh doanh, các doanh nghi ệp đã xåy dă ng Ā ng d ý ng thþĄng mäi điệ n t ā và cung c ç p r ç t nhi ề u s â n ph è m trên website Tuy nhiên, khi thông tin Hoàng Th ị Hà, Ngô Nguy ễ n Th ứ c 521 quá nhi ề u, khách hàng s ẽ t ố n th ąi gian để tìm s â n ph è m h ọ c æn Điề u này, làm gi â m s ă hài lòng và s ă trung thành c û a khách Để gi â i quy ế t v çn đề này, ý tþć ng chính c û a các chuyên gia thþĄng mäi điệ n t ā là thi ế t l ê p h ệ th ố ng g ợ i ý thông minh nh ì m khám phá ra các m ặ t hàng phù h ợ p nh ç t cho t ÿng ngþą i dùng V Ć i h ệ th ố ng g ợ i ý t ă độ ng, khách hàng có th ể nhanh chóng truy c êp đþợ c s â n ph è m h ợ p v Ć i s ć thích và nhu c æ u c û a h ọ , ti ế t ki ệ m th ą i gian tìm s â n ph è m cho ngþą i dùng (Thomas, 2006) Nh Ă ng nëm g æ n đåy, các k ỹ thu ê t h ệ g ợ i đã và đang đþ ợ c nghiên c Ā u, Ā ng d ý ng ć nhi ề u lïnh v ă c Trong thþĄng m ä i đi ệ n t ā , h ệ g ợ i ý mang l ä i nhi ề u l ợ i ích cho c â ngþ ą i cung c ç p d ð ch v ý và ngþ ą i s ā d ý ng d ð ch v ý (Ionos, 2017) H æ u h ế t các công ty thþĄng m ä i l Ć n nhþ: Amazon (Amazon com), CDNOW ( www cdnow com), eBay (eBay c om), Alibaba (Alibaba com ), MovieFinder (MovieFinder com), Y outube com, F acebook com, „ đ ề u s ā d ý ng các k ỹ thu ê t g ợ i ý trong website c û a h ọ đ ể nâng cao tr â i nghi ệ m cho khách hàng, nâng cao ch ç t lþ ợ ng d ð ch v ý và tëng doanh thu bán hàng Tuy nhiên, ć Vi ệ t Nam - m ộ t qu ố c gia có r ç t nhi ề u ti ề m nëng v ề thþĄng m ä i đi ệ n t ā (Vi ễ n Thông, 2020) l ä i có s ố lþ ợ ng website thþĄng m ä i tích h ợ p h ệ g ợ i ý không nhi ề u (Nguy ễ n Hùng Düng & Nguy ễ n Thái Nghe, 2013) Hi ệ n Vi ệ t Nam đang cò 44% doanh nghi ệ p đã tham gia xåy d ă ng website thþĄng m ä i, nhþng ch î có 32% doanh nghi ệ p đþ ợ c đánh giá cao kênh bán hàng thông qua trang web (Nguy ễ n Thanh Hþng, 2019) Bài báo này trình bày t ổ ng quan các phþĄng pháp gợi ý, đánh giá hiệ u qu â c û a các thu ê t toán g ợ i ý (Content - based, user - based và item - based) trên m ộ t s ố t ê p d Ă li ệ u chu è n bao g ồ m: Movielens, Epinions, BookCrossing và LastFM Chúng tôi th â o lu ê n nh Ă ng đi ể m m ä nh, đi ể m y ế u c û a m ỗ i phþĄng pháp, thách th Ā c và gi â i pháp kh í c ph ý c khi xây d ă ng h ệ g ợ i ý trong thþĄng m ä i đi ệ n t ā Đ ồ ng th ą i, chúng tôi đþa ra quy trình xåy d ă ng h ệ g ợ i ý trong các website thþĄng m ä i và th ă c hi ệ n cài đ ặ t các k ỹ thu ê t h ệ g ợ i ý trong website thþĄng m ä i đi ệ n t ā K ế t qu â cài đ ặ t cho th ç y, khi website đ þ ợ c tích h ợ p các ph þĄ ng pháp h ệ g ợ i ý h ệ th ố ng s ẽ t ă đ ộ ng đþ a ra nh Ă ng g ợ i ý thông minh, đ a d ä ng t Ć i ng þ ą i dùng 2 CÁC K Ỹ THU Ậ T H Ệ G Ợ I Ý Các k ỹ thu ê t h ệ g ợi ý thþąng đþợ c chia thành hai nhóm chính là: h ệ g ợ i ý cá nhân hóa và h ệ g ợ i ý không cá nhân hóa Chúng tôi t ê p trung gi Ć i thi ệ u tóm t ít phþĄng pháp gợ i ý không cá nhân hóa và m ộ t s ố thu ê t toán g ợ i ý cá nhân hóa tiêu bi ểu thþąng đþợ c s ā d ý ng trong các trang thþĄng mäi điệ n t ā 2 1 H ệ g ợ i ý không cá nhân hóa (non - personalized recommend er system s ) Là nhòm phþĄng pháp không dă a vào h ồ sĄ cá nhân t ÿ ng khách hàng mà ch î d ăa vào đặ c tính c û a s â n ph è m (s â n ph è m m Ć i) và đánh giá t ÿ c ộ ng đ ồ ng nhþ: s â n ph è m bán ch ä y nh ç t, s â n ph è m đþ ợ c đánh giá t ố t nh ç t,„ (Singh, 2019) 2 2 H ệ g ợ i ý cá nhân hóa (personalized recommend er system s ) Nhòm phþĄng pháp này đþợc đánh giá là mang l ä i hi ệ u qu â cao đố i v Ći thþĄng m äi điệ n t ā N ế u doanh nghi ệ p hi ể u rõ t ÿ ng khách hàng c û a mình d ă a trên nh Ă ng gì h ọ tþĄng tác và mua hàng trên m ä ng, doanh nghi ệ p có th ể tþ vç n cho khách hàng nh Ă ng s â n ph è m phù h ợ p v Ć i mong mu ố n và s ć thích c ûa khách hĄn (Google & Temasek, 2018) Khách hàng s ẽ ti ế t ki ệm đþợ c th ą i gian tìm ki ế m s â n ph èm, mua đþợ c nh Ă ng mòn hàng đúng sć thích T ÿ đò, doanh nghiệ p s ẽ tëng đþợ c s ố lþợng ngþąi mua hàng, tëng giá trð đĄn hàng, tëng doanh số bán hàng Theo nghiên c Ā u c û a Schafer & cs (2001) , n ế u doanh nghi ệ p s ā d ý ng phþĄng pháp g ợ i ý cá nhân hòa đ ể g ā i email t Ć i khách hàng thì t ỷ l ệ giao d ð ch thông qua email cao hĄn g ç p hai l æ n so v Ć i các email đþ ợ c g ā i không áp d ý ng phþĄng pháp này (Stephan, 2019) Do đò, các phþĄng pháp g ợ i ý cá nhån hòa làm tëng m Ā c đ ộ tþĄng tác và chuy ể n đ ổ i trong giao d ð ch thþĄng m ä i đi ệ n t ā M ộ t s ố phþĄng pháp gợ i ý thu ộ c lo ä i cá nhân hóa nh þ sau: M ộ t s ố ph ươ ng pháp g ợ i ý và ứ ng d ụ ng trong th ươ ng m ại điệ n t ử 522 2 2 1 G ợ i ý d ự a trên n ộ i dung (Content- based filtering) PhþĄng pháp gợ i ý này d ă a trên mô t â c û a s â n ph è m và profile c û a t ÿng ngþą i dùng (không quan tåm đến ngþą i dùng khác) G ợ i ý d ă a trên n ộ i dung s ẽ thu th ê p h ồ sĄ cûa ngþą i dùng: h ọ tên, gi Ć i tính, ngh ề nghi ệ p và tþĄng tác c ûa cá nhån ngþą i dùng trên các s â n ph è m, sau đò so sánh đặc điể m các s â n ph èm trong cĄ s ć d Ă li ệ u v Ći đặc điể m các s â n ph è m mà khách hàng đã quan tåm để g ợ i ý cho khách hàng 2 2 2 L ọ c c ộ ng tác (Collaborative Filtering - CF) L ọ c c ộ ng tác g ợ i ý s â n ph è m t Ći ngþą i dùng d ă a trên l ð ch s ā tþĄng tác sâ n ph è m c û a chính ngþąi dùng đò kế t h ợ p quan điể m c û a nh Ă ng ngþąi dùng khác Đåy là kỹ thu ê t m änh và đã đþợ c áp d ý ng khá thành công trong các h ệ th ống thþĄng mä i l Ć n L ọ c c ộ ng tác thu th ê p ph â n h ồ i t ÿ nhi ều ngþąi dùng đố i v Ć i s â n ph è m, lþu trĂ ph â n h ồ i c û a ngþąi dùng dþĆ i d ä ng ma tr ên ngþą i dùng (users) - s â n ph è m (items) M ỗ i dòng là m ột vectĄ chĀ a giá tr ð ph â n h ồ i c û a ngþąi dùng đố i v Ć i các s â n ph èm Sau đò, tính độ tþĄng tă gi Ă a các users ho ặ c gi Ă a các items trong h ệ th ố ng, tìm ra m ối tþĄng quan và đþa ra g ợ i ý phù h ợp Độ tþĄng tă gi Ă a các user ho ặ c gi Ăa các item đþợ c tính theo công th Ā c Cosin ho ặ c Pearson B â ng 1 là ma tr ê n bi ể u di ễn đánh giá cû a ngþą i dùng trên các s â n ph è m Hình 1 Mô hình h ệ g ợ i ý d ự a trên n ộ i dung B â ng 1 Ma tr ậ n bi ể u di ễn ngườ i dùng - s â n ph ẩ m c ủ a ti ế p c ậ n l ọ c c ộ ng tác Hoàng Th ị Hà, Ngô Nguy ễ n Th ứ c 523 Cò hai phþĄng pháp lọ c c ộ ng tác: User-based: D ă đoán dă a trên s ă tþĄng tă gi Ăa các users Ý tþć ng quan tr ọ ng c ûa phþĄng pháp này là nh Ăng khách hàng tþĄng tă có xu hþĆ ng s ā d ý ng nh Ă ng s â n ph èm tþĄng tă (Singh & Pramod, 2019) N ế u hai khách hàng A, B có l ð ch s ā đánh giá các sâ n ph èm tþĄng tă nhau thì User-baseds ẽ d ă đoán khách hàng A có kh â nëng sẽ quan tâm t Ć i nh Ă ng s â n ph è m chþa đþợ c tr â i nghi ệm nhþng đã đþợ c khách hàng B thích và ngþợ c l äi PhþĄng pháp này phân tích ma tr ê n user- item để tìm ra nh Ă ng ngþąi dùng tþĄng tă Item-based : D ă đoán dă a trên s ă tþĄng tă gi Ă a các items Hai s â n ph èm i và i’ đã đþợ c c ộng đồng đánh giá tþĄng tă nhau thì có th ể s ẽ đþợc đánh giá tþĄng tă b ć i nh Ăng ngþą i dùng còn l äi PhþĄng pháp này phån tích ma trê n user- item để nh ê n di ệ n các s â n ph èm tþĄng tă Ngày nay, k ỹ thu ê t l ọ c c ộng tác đþợ c s ā d ý ng khá ph ổ bi ến trên các trang thþĄng m äi điệ n t ā l Ćn nhþ Amazon, Tiki, Youtube và Facebook 2 2 3 Phương pháp kế t h ợ p (hybrid method) PhþĄng pháp này kế t h ợ p gi Ă a k ỹ thu ê t g ợ i ý d ă a trên n ộ i dung và l ọ c c ộ ng tác K ỹ thu ê t này đþợ c xem là khá hi ệ u qu â và gi â i quy ế t đþợ c v çn đề “cold - start problem” trong rç t nhi ề u nghiên c Āu Trang thþĄng mäi điệ n t ā điển hình đã Ā ng d ýng phþĄng pháp này là Spotify com H ọ đã tích hợp phþĄng pháp hệ g ợ i ý t ổ ng h ợp để t ä o ra danh sách các bài hát hàng tu æ n cho t ÿ ng khách hàng riêng bi ệ t Website đã tổ ng h ợ p d Ă li ệu ngþą i dùng d ă a trên thói quen nghe nh ä c và nh Ăng ngþąi dùng tþĄng tă để t ä o ra m ột danh sách các bài hát độc đáo phù h ợ p v Ć i s ć thích c û a t ÿ ng khách hàng 2 3 M ụ c tiêu c ủa các phương pháp gợ i ý M ý c tiêu c ûa các phþĄng pháp gợi ý đþợ c th ể hi ệ n trong b â ng 2 Hình 2 Ti ế n trình l ọ c c ộ ng tác Hình 3 L ọ c c ộ ng tác d ự a trên User-based và Item-based M ộ t s ố ph ươ ng pháp g ợ i ý và ứ ng d ụ ng trong th ươ ng m ại điệ n t ử 524 Hình 4 Mô hình h ệ g ợ i ý k ế t h ợ p B â ng 2 M ụ c tiêu khái ni ệ m c ủa các phương pháp gợ i ý Phương pháp (Methods) Mục tiêu (concept goals) Đầu vào (Inputs) Gợi ý không cá nhân hóa (N on - personalized recommender systems ) Gợi ý những sản phẩm mà người dùng có thể thích dựa trên sản phẩm mới hoặc ý kiến cộng đồng Lọc dựa trên nội dung (Content - based filtering) Gợi ý những sản phẩm khách hàng có thể thích dựa trên hồ sơ cá nhân của người dùng và độ tương tự giữa các sản phẩm trong cơ sở dữ liệu với những sản phẩm mà khách hàng đã thích trong quá khứ Thuộc tính (item attributes) của sản phẩm hoặc Profiles của người dùng Lọc cộng tác (Collaborative Filtering) Gợi ý những sản phẩm mà người dùng có thể thích dựa trên những người dùng có sở thích tương tự Đánh giá của User + Đánh giá của cộng đồng Phương p háp kết hợp (Hybrid method) Gợi ý những sản phẩm mà người dùng có thể thích dựa trên việc kết hợp Content - based filtering và Collaborative Filtering Thuộc tính của sản phẩm+ đánh giá của Users và cộng đồng 3 VAI TRÒ C Ủ A H Ệ G Ợ I Ý TRONG TH ƯƠ NG M Ạ I ĐI Ệ N T Ử Trong thþĄng mäi điệ n t ā , h ệ g ợ i ý đòng vai trñ nhþ m ộ t “chuyên gia” thông minh h ỗ tr ợ khách hàng trong quá trình tìm và ch ọ n mua s â n ph è m H ệ g ợ i ý thúc đ è y thþĄng m ä i đi ệ n t ā (Schafer & cs , 2001) theo các cách sau: - Chuy ể n khách vãng lai thành ng þą i mua hàng (Converting Browsers into Buyers): Khách vãng lai thþąng ghé thëm w ebsite để xem trang web mà không mua hàng Các h ệ th ố ng g ợ i ý s ẽ hi ể u nhu c æ u c û a khách, hi ể n th ð nh Ă ng s â n ph è m mà khách thích, ho ặc đang muố n tìm mua B ì ng cách này, h ệ th ố ng s ẽ chuy ể n nh Ă ng khách vãng lai thành khách mua hàng - Tëng cþą ng bán chéo (Increasing Cross - sell): Các h ệ th ố ng g ợ i ý c â i thi ệ n bán chéo b ì ng cách đ ề xu ç t các m ặ t hàng liên quan đ ế n s â n ph è m, các s â n ph è m ph ý ki ệ n b ổ sung cho khách mua hàng - Xây d ă ng lòng trung thành (Building Loyalty): Trong chi ến lþợ c kinh doanh, vi ệc đä t đþợ c lòng trung thành c ûa ngþą i tiêu dùng là m ột điề u c æ n thi ế t Khi lòng trung thành c û a khách hàng tëng lên, lợ i nhu ên cüng sẽ tëng lên (Reichheld & F , 1993) Các h ệ th ố ng g ợ i ý c â i ti ế nlòng trung thành b ì ng cách tìm hi ể u, thu th ê p thông tin, nhu c æ u, s ć thích và các m ố i quan tâm c û a khách T ÿ đò, s ā d ý ng các thu ê t toán thông minh cá nhån hòa đ ể g ợ i ý phù h ợ p chot ÿ ng khách hàng, giúp h ọ hài lòng, có ni ề m tin quay l ä i trang web đ ể mua hà ng V Ć i nh Ă ng kh â nëng trên, hệ g ợ i ý mang l ä i tr â i nghi ệ m t ố t cho khách hàng, giúp khách hàng gi â m th ą i gian tìm ki ế m s â n ph è m, nâng cao t ỷ l ệ chuy ể n đ ổ i mua hàng, c â i thi ệ n vi ệ c b ó gi ó hàng và gi Ă khách quay tr ć l ä i mua hàng T ÿ đò, h ệ g ợ i ý giúp các thþĄ ng nhån tëng giá tr ð đĄn hàng trung bình, tëng doanh thu bán hàng (Dias & cs , 2008; Jordan, 2016; Stephan, 2019) Hoàng Th ị Hà, Ngô Nguy ễ n Th ứ c 525 4 THÁCH TH Ứ C C Ủ A H Ệ G Ợ I Ý TRONG TH ƯƠ NG M ẠI ĐIỆ N T Ử VÀ GI Ả I PHÁP KH Ắ C PH Ụ C 4 1 V ấn đề khách hàng m ớ i, s â n ph ẩ m m ớ i (Cold-startproblem) M ộ t trong nh Ă ng thách th Ā c đ ố i v Ć i b ç t k ỳ h ệ th ố ng g ợ i ý nào là v ç n đ ề ngþ ą i dùng m Ć i (new user) ho ặ c s â n ph è m m Ć i (new item) H ồ sĄ c û a ngþ ą i dùng r ỗ ng và h ọ chþa x ế p h ä ng b ç t k ỳ s â n ph è m nào Vì v ê y, các gi â i thu ê t g ợ i ý không th ể hi ể u đþ ợ c khách hàng và kh ông d ă đoán đþ ợ c s ć thích, nhu c æ u c û a h ọ (Sharma & Gera, 2013) V ç n đ ề này g ọ i là “ Cold start problem” và có th ể đþ ợ c gi â i quy ế t b ì ng cách s ā d ý ng h ệ g ợ i ý không cá nhån hòa đ ể g ợ i ý nh Ă ng s â n ph è m m Ć i, nh Ă ng s â n ph è m bán ch ä y, nh Ă ng s â n ph è m đþ ợ c nhi ề u n gþ ą i đánh giá cao, (Schafer & cs , 2007; Mohamed & cs , 2019) 4 2 V ấ n đ ề kh â năng m ở r ộ ng và hi ệ u su ấ t th ờ i gian th ự c Khi lþ ợ ng d Ă li ệ u ngày càng l Ć n d æ n lên, làm th ế nào đ ể các h ệ g ợ i ý làm vi ệ c hi ệ u qu â đang là m ố i quan tâm c û a các nhà khoa h ọ c và c û a doanh nhân s ā d ý ng h ệ th ố ng thþĄng m ä i đi ệ n t ā V Ć i website l Ć n, h ệ th ố ng ph â i t ä o ra các g ợ i ý trong vñng đĄn v ð giây trong khi ph ý c v ý hàng trëm ho ặ c hàng ngàn ngþ ą i tiêu dùng cùng m ộ t lúc S ố lþ ợ ng yêu c æ u g ợ i ý đ ồ ng th ą i ngày càng l Ć n, s ố lþ ợ ng s â n ph è m ngày càng tëng, hành vi tþĄng tác c û a ngþ ą i dùng trên các s â n ph è m ngày càng nhi ề u Hi ệ n t ä i, đ ể gi â i quy ế t ph æ n nào v ç n đ ề này ngoài vi ệ c đ æ u tþ l Ć n hĄn cho các h ệ th ố ng tính toán m ä nh c æ n ph â i áp d ý ng thêm các thu ê t toán gi â m chi ề u, x ā lý song song và đ ặ c bi ệ t nên ch ä y các thu ê t toán offline đ ể có th ể g ợ i ý online nhanh hĄn (Khusro & cs , 2016) Tuy nhiên, đåy là v ç n đ ề khó và đang là m ộ t thách th Ā c c û a các h ệ th ố ng g ợ i ý 4 3 V ấ n đ ề thưa th ớ t c ủ a d ữ li ệ u đánh giá (Sparsity ) M ộ t thách th Ā c n Ăa đố i v Ć i h ệ g ợ i ý t ä i các trang thþĄng mäi điệ n t ā là s ă thþa thĆ t v ề d Ă li ệu khách hàng đánh giá sâ n ph è m R ç t nhi ề u website, lþợng khách hàng đánh giá trênsâ n ph è m r ç t ít, nên các thu ê t toán g ợi ý khò đoán đþợ c s ć thích c ûa ngþąi dùng Đåy cüng là mộ t v çn đề l Ć n c û a các h ệ g ợ i ý (Sharma & Gera, 2013) B ć i d Ă li ệ u ph âi đû l Ć n các thu ê t toán g ợ i ý m Ć i có nh Ă ng g ợ i ý chính xác Các nhà khoa h ọ c đã và đang cố g í ng nghiên c Āu để làm gi â m v ç n đề này, nhþng hiệ n v é n còn là m ộ t bài toán khó c æn đþợ c nghiên c Ā u nhi ều hĄn DþĆi đåy là mộ t s ố gi âi pháp đþợc đề xu ç t (Khusro & cs , 2016): Gi â i pháp 1: S ā d ý ng mô hình g ợi ý đa chi ề u (Adomavicius & cs , 2005) và s ā d ý ng các k ỹ thu ê t hi ệ u qu â gi â i quy ế t bài toán d ă đoán đố i v Ć i ma tr ên thþa nhþ giâ i pháp c û a Xue & cs (2015), gi â i pháp c û a Lei & cs (2019) Gi â i pháp 2: D ă a trên nh Ă ng ph â n h ồ i ti ề m è n c ûa ngþąi dùng (implicit feedback) nhþ: lð ch s ā xem hàng, mua hàng„ để b ổ sung d Ă li ệ u vào ma tr ên ngþą i dùng - s â n ph è m nh ì m h ä n ch ế m Ā c đ ộ thþa c û a ma tr ê n ít ngþ ą i dùng đánh giá Gi â i pháp 3: Chia s ẻ thông tin ngþą i dùng gi Ă a các trang web không có c änh tranh, đặ c bi ệ t có th ể khai thác thêm d Ă li ệ u t ÿ các trang m ä ng xã h ội Thông tin ngþą i dùng càng nhi ề u, càng đæy đû s ẽ giúp các thu ê t toán g ợ i ý hi ể u khách hàng hĄn và tþ vçn chính xác hĄn Lþu ý, các bên khi chia s ẻ d Ă li ệu ngþą i dùng ph â i cam k ế t ch î dùng d Ă li ệu đþợ c chia s ẻ để ph ý c v ý tþ v ç n t ốt hĄ n và có trách nhi ệ m b â o v ệ thông tin ngþą i dùng 5 ĐÁNH GIÁ CÁC PHƯƠ NG PHÁP G Ợ I Ý 5 1 Điể m m änh và điể m y ế u c ủ a các phương pháp h ệ g ợ i ý B â ng 3 là k ế t lu ê n c û a chúng tôi v ề nh Ă ng þu điể m và h ä n ch ế c ûa các phþĄng pháp hệ g ợ i ý 5 2 Đánh giá độ chính xác c ủ a các ph ươ ng pháp g ợ i ý 5 2 1 D ữ li ệ u th ự c nghi ệ m Chúng tôi đánh giá hiệ u qu â th ă c hi ệ n c û a các thu ê t toán content-based, user-based, item based đã đþợ c gi Ć i thi ệ u ć trên b ì ng cách ch ä y th ā nghi ệ m trên 4 t ê p d Ă li ệ u chu è n: Movielens M ộ t s ố ph ươ ng pháp g ợ i ý và ứ ng d ụ ng trong th ươ ng m ại điệ n t ử 526 (GroupLens, 1998) , Epinions ( Trademark Notice, 2003) , BookCrossing ( University of Freiburg , 2004) , LastFM ( Group L ens , 2011 ) 5 2 2 Ph ươ ng pháp đá nh giá và môi tr ườ ng th ử nghi ệ m a Ph ươ ng pháp đá nh giá Chúng tôi chia t ê p d Ă li ệ u ra làm 2 ph æ n, l ç y ng é u nhiên 70% t ê p d Ă li ệ u để training và 30% d Ă li ệ u còn l äi để testing Chúng tôi th ă c hi ệ n 5 l æ n l ặ p trên các t ê p d Ă li ệu Độ đo NRMSE (Normalized Root Mean Square Error) và th ą i gian th ă c hi ện (time) đþợ c chúng tôi s ā d ýng để đánh giá hiệ u qu â c û a các thu ê t toán Độ đo N RMSE dù ng để xác đð nh sai s ố chu è n hóa c û a các thu êt toán và đþợ c xác đð nh b ì ng công th Ā c: max min RMSE NRMSE Rating Rating   Trong đò:   n 2 i i 1 1 RMSE p r n    v Ć i n là s ố quan sát, p i là giá tr ð d ă đoán đánh giá cû a s â n ph è m i và r i là giá tr ð đánh giá th ă c t ế c û a s â n ph è m i Rating max , Rating min l æn lþợt là điể m l Ć n nh ç t và nh ó nh çt cho phép ngþą i dùng đánh giá b Môi trườ ng th ử nghi ệ m Môi trþąng đþợ c s ā d ý ng th ā nghi ệ m là máy tính Intel(R) Corei5-6300U, CPU @ 2 5GHz, RAM 8GB và ngôn ng Ă Python trên h ệ điề u hành Microsoft Window 10 B â ng 3 Điể m m änh và điể m y ế u c ủa các phương pháp gợ i ý STT Phương pháp Điểm mạnh Điểm yếu 1 Gợi ý không cá nhân hóa ( N on - personalized recommender systems ) 1 Đơn giản 2 Gợi ý không phụ thuộc vào dữ liệu của khách hàng trên hệ thống nên áp dụng được cho mọi khách hàng, giúp tăn g cơ hội chuyển đổi khách hàng 1 Gợi ý chung chung, không cá nhân hóa đến từng khách hàng Vì vậy mọi khách đều có kết quả gợi ý giống nhau 2 Lọc dựa trên nội dung ( Content - based filtering ) 1 Hệ thống k hông sử dụng dữ liệu của người dùng khác mà vẫn gợi ý được những sản phẩm phù hợp với sở thích của từng khác hhàng riêng biệt 2 Có khả năng gợi ý được cả những sản phẩm mới cho người dùng 1 Hệ thống phải phân tích và dò tìm tất cả các đặc trưng của sả n phẩm để tạo ra danh sách gợi ý, nên có thể chậm hoặc nếu hồ sơ về sản phẩm không đúng có thể dẫn đến gợi ý sai 2 Không thể gợi ý nếu khách hàng không có lịch sử đánh giá xem/thích các sản phẩm trên hệ thống Với khách hàng mới, hệ thống không thể cung cấ p gợi ý phù hợp 3 Không gợi ý được thêm các sở thích mới của khách 4 Lọc cộng tác ( Collaborative Filtering ) 1 Hệ thống không cần sử dụng đến hồ sơ nhân khẩu học của người dùng để gợi ý sản phẩm 2 Có khả năng dự đoán được sở thích và nhu cầu của ngư ời dùng mà không cần hiểu sản phẩm 3 Có thể gợi ý tới người dùng những sản phẩm bên ngoài sở thích đang có Nhữngnhững sản phẩm này có thể phù hợp sở thích mới của họ 1 Không thể gợi ý nếu khách hàng chưa từng tương tác với các mặt hàng 2 Không thể g ợi ý được các sản phẩm mới hoặc sản phẩm chưa được ai đánh giá 3 Khi lượng sản phẩm lớn nhưng số lượng khách hàng đánh giá không nhiều thì phương pháp này không hiệu quả 5 Phương pháp tổng hợp ( Hybrid method ) 1 Kết hợp tất cả các ưu điểm của phương pháp Content - based filtering và Collaborative Filtering 1 Không thể gợi ý cho người dùng mới 2 Khi lượng sản phẩm lớn nhưng số lượng khách hàng đánh giá không nhiều thì phương pháp này không hiệu quả Hoàng Th ị Hà, Ngô Nguy ễ n Th ứ c 527 B â ng 4 Thông tin các t ậ p d ữ li ệ u th ử nghi ệ m Dat asets #Items #Users # Rating Range Rating Mô tả Movielens 100K 1,700 1,000 100,000 1÷5 Chứa đánh giá của người dùng trên các các bộ phim Mỗi bộ phim có các đặc trưng (id, title, realise date, type, rating, time ) Epinion 138,738 49,290 139,738 1÷5 Chứa quan điểm của người dùng về các sản phẩm thương mại BookCrossing 271,379 278,858 1,149,780 1÷10 Chứa đánh giá của người dùng về sách LastFM 17,632 1,892 92,834 Số lần các bài hát được bật bởi users Chứa danh sách top những bài hát được người dùng nghe nhiều nhất ( 2100 users and 18,745) 5 2 3 K ế t qu â th ử nghi ệ m K ế t qu â ć b â ng 5 cho th ç y, thu ê t toán Content - based c ó th ą i gian ch ä y nhanh hĄn User - based và Item - based, nhþng đ ộ chính xác không cao Gi Ă a thu ê t toán User - based và Item - based, n ế u xét v ề sai s ố c û a d ă đoán thìti ế p c ê n l ọ c c ộ ng tác d ă a trên s â n ph è m (Item - based) cho sai s ố th ç p hĄn (hay cho đ ộ chính xác cao hĄn) ti ế p c ê n l ọ c c ộ ng tác d ă a trênngþ ą i dùng (User - based) v Ć i t ỷ l ệ 3/4 t ê p d Ă li ệ u Tuy nhiên, xét v ề th ą i gian th ă c hi ệ n thì phþĄ ng pháp l ọ c c ộ ng tác d ă a trên ngþ ą i dùng th ă c hi ệ n nhanh hĄn nhi ề u so v Ć i phþĄng pháp l ọ c c ộ ng tác d ă a trên s â n ph è m c â giai đo ä n hu ç n luy ệ n (training) và giai đo ä n ki ể m th ā (testing) ć c â 4 t ê p d Ă li ệ u Do đò, cò th ể nói phþĄng pháp l ọ c c ộ ng tác d ă a trên User - based s ẽ có kh â nëng m ć r ộ ng (scability) t ố t hĄn phþĄng pháp Item - based V ì v ê y, khó có thu ê t toán nào là t ố t nh ç t trên m ọ i tiêu chí Tùy theo m ý c đích g ợ i ý và Ā ng d ý ng th ă c t ế đ ể ch ọ n phþĄng pháp g ợ i ý phù h ợ p 6 TÍCH H Ợ P H Ệ G Ợ I Ý TRONG H Ệ TH Ố NG BÁN HÀNG TR Ự C TUY Ế N Để th ā nghi ệ m tr ă c quan h ệ g ợ i ý Ā ng d ý ng trong thþĄng mäi điệ n t ā , chúng tôi ti ế n hành xây d ă ng h ệ th ố ng bán sách tr ă c tuy ế n tích h ợ p v Ć i các thu ê t toán g ợ i ý đã trình bày ć trên H ệ th ố ng s ā d ý ng thu ê t toán g ợ i ý không cá nhån hòa để hi ể n th ð các s â n ph è m m Ć i, s â n ph è m bán ch ä y nh ç t, s â n ph è m đþ ợ c þa thích nh ç t Đ ặ c bi ệ t, h ệ th ố ng tích h ợ p m ộ t s ố k ỹ thu ê t g ợ i ý cá nhån hòa nhþ: phþĄng pháp g ợ i ý d ă a trên n ộ i dung, phþĄng pháp g ợ i ý l ọ c c ộ ng tác đ ể thông báo cho khách hàng nh Ă ng s â n ph è m h ọ có th ể thích, h ỗ tr ợ khách hàng trong quá trình tìm mua s â n ph è m 6 1 T ổ ng quan v ề cách ti ế p c ậ n Cách ti ế p c ê n t ổ ng quan c ûa chúng tôi đþợ c th ể hi ệ n trong hình 5 6 2 Lu ồ ng x ử lý chính trong h ệ th ố ng Lu ồ ng x ā lý chính trong h ệ th ống đþợ c th ể hi ệ n trong h ình 6 Gi â i thích: H ệ th ố ng s ẽ ki ể m tra xem khách hàng cò đëng nh ê p hay không N ế u khách hàng cò đëng nh ê p, h ệ th ố ng s ẽ ki ể m tra xem khách hàng đã cò đ ộ tþĄngt ă v Ć i ngþ ą i khác hay chþa, n ế u có thì s ẽ s ā d ý ng mô hình l ọ c c ộ ng tác đ ể hi ể n th ð thông ti n g ợ i ý, ngþ ợ c l ä i h ệ th ố ng s ẽ ki ể m tra xem khách hàng có thông tin cá nhân đ ể quy ế t đ ð nh l ă a ch ọ n mô hình nhân kh è u h ọ c ho ặ c không cá nhån đ ể đþa ra g ợ i ý cho khách hàng Trþ ą ng h ợ p g ợ i ý d ă a trên mô hình không cá nhân thì s ẽ đþa ra nh Ă ng s â n ph è m m Ć i, s â n ph è m bán ch ä y, s â n ph è m đþ ợ c nhi ề u khách hàng quan tâm Trong trþą ng h ợp khách hàng không đëng nh ê p, h ệ th ố ng s ẽ ki ể m tra l ð ch s ā khách hàng đã tÿ ng truy c ê p vào trang web d ă a vào IP máy tính mà khách hàng truy c ê p, h ệ th ố ng s ẽ lþu vế t l ä i l ð ch s ā quá trình truy c ê p N ế u có thông tin d ăa theo đð a ch î IP, h ệ th ố ng s ẽ đþa ra g ợ i ý v ề nh Ă ng s â n ph èm mà khách hàng đã t ÿ ng xem M ộ t s ố ph ươ ng pháp g ợ i ý và ứ ng d ụ ng trong th ươ ng m ại điệ n t ử 528 B â ng 5 Sai s ố d ự đoán và thờ i gian th ự c hi ệ n trung bình 5 l ầ n ch ä y c ủ a các ph ươ ng pháp l ọ c c ộ ng tác Dataset Thuật toán NRMSE Thời g ian(sec) Training testing Movielens (100K) Content - based 0,317 0,093 0,027 User - based 0,280 1,126 3,107 Item - based 0,288 0,147 7,793 Epinion User - based 0,285 6,515 158,91 Item - based 0,254 7,518 3869,7 BookCrossing User - based 0,248 9,126 171,73 Item - based 0,282 20,142 4030,5 LastFM User - based 0,0131 4,313 165,398 Item - based 0,0103 39,326 4431,387 Ghi chú: giá tr ị t ố t nh ấ t c ủ a các tiêu chí trên m ỗ i t ậ p d ữ li ệu được tô đậ m Hình 5 T ổ ng quan v ề cách ti ế p c ậ n 6 3 Ti ế n trình g ợ i ý trong h ệ th ố ng website thương mä i Ti ế n trình g ợ i ý s â n ph è m trong h ệ th ố ng thþĄng mäi điệ n t ā đþợ c th ể hi ệ n trong h ình 7 Ti ế n trình này bao g ồ m 3 giai đo ä n: Giai đoä n 1: Thu th êp thông tin ngþą i dùng Để có th ể d ă đoán đþợ c s ć thích c ûa ngþą i dùng, h ệ th ố ng ph â i h ọ c m ộ t mô hình ngþ ą i dùng (User model) Mô hình ngþ ą i dùng mà chúng tôi thu th ê p là các d Ă li ệ u c û a ngþ ą i dùng nhþ: thông tin cá nhån, thông tin l ð ch s ā tþĄng tác c û a ngþ ą i dùng trên s â n ph è m Giai đoä n 2: S ā d ý ng các thu ê t toán g ợ i ý : Giai đo ä n này, chúng tôi s ā d ý ng d Ă li ệ u thu th ê p đþ ợ c ć giai đo ä n 1 và d Ă li ệ u s â n ph è m đ ể ch ä y 2 nhóm thu ê t toán: - Nhóm 1: S ā d ý ng thu ê t toán g ợ i ý không cá nhân hóa (Non - personalized) để g ợ i ý các s â n ph è m m Ć i, s â n ph è m bán ch ä y, s â n ph è m đþợ c nhi ều ngþąi đánh giá - Nhóm 2: S ā d ý ng nhóm thu ê t toán cá nhån hòa đã trình bày ć m ýc 2 2 để g ợ i ý cho khách hàng: thu ê t toán nhân kh è u h ọ c, thu ê t toán g ợ i ý d ă a trên n ộ i dung (content - based) , thu ê t toán l ọ c c ộ ng tác (Collaborative fi ltering) đ ể đoán các s â n ph è m phù h ợ p v Ć i khách hàng Giai đoä n 3: G ợ i ý: Giai đoän này, cën cĀ vào t ÿng đặc điể m c û a khách hàng, h ệ th ố ng s ẽ d ă đoán và gợ i ý nh Ă ng s â n ph è m mà khách hàng có th ể thích 6 4 M ộ t s ố giao di ệ n k ế t qu â chính ứ ng v ớ i 3 giai đoä n g ợ i ý c ủ a h ệ th ố ng 6 4 1 Trang đánh giá sả n ph ẩ m Giao di ện đánh giá sâ n ph èm đþợ c th ể hi ệ n trong h ình 8 Tương tác c ủ a User - item (User product interacti ons) (products cataluge) Thông tin v ề U sers (products cataluge) (peocduct Thông tin v ề s ả n ph ẩ m (products cataluge) (Peocduct Recommender System Danh sách các s ả n ph ẩ m g ợ i ý cho khách Hoàng Th ị Hà, Ngô Nguy ễ n Th ứ c 529 Hình 6 Lu ồ ng x ử lý chính trong h ệ th ố ng Hình 7 Ti ế n trình g ợ i ý trong h ệ th ố ng 6 4 2 M ộ t s ố trang hu ấ n luy ệ n mô hình - Trang th ố ng kê đánh giá s â n ph è m c û a ng þ ą i dùng đþ ợ c th ể hi ệ n trong hình h ình 9 - Trang đo lþ ą ng đ ộ tþĄng t ă gi Ă a các ngþ ą i dùng đþ ợ c th ể hi ệ n trong h ình 10 6 4 3 Các k ế t qu ả g ợ i ý s ả n ph ẩ m a Đố i v ớ i khách hàng m ớ i N ế u là khách hàng m Ć i (khách hàng chþa đánh giá bç t k ỳ s â n ph è m nào), khi h ọ tìm ki ế m m ộ t s â n ph è m, h ệ th ố ng s ẽ hi ể n th ð danh sách nh Ă ng s â n ph è m m Ć i và nh Ă ng s â n ph è m tþĄng tă mà nhi ều ngþąi quan tåm để g ợ i ý cho khách hàng b Đ ố i v ớ i khách hàng thành viên N ế u khách hàng là thành viên c û a h ệ th ố ng, t ÿng cò đánh giá sâ n ph è m, website s ẽ g ợ i ý nh Ă ng s â n ph è m m Ć i, s â n ph è m nhi ề u ngþą i quan tâm, s â n ph èm tþĄng tă Ngoài ra, h ệ th ố ng còn d ăa vào độ tþĄng tă gi Ăa các ngþą i Thu th ậ p thông tin (Information collection) H ọ c (Learning) D ự đoán/G ợ i ý (Recommender System) Ph ả n h ồ i (Feedback) M ộ t s ố ph ươ ng pháp g ợ i ý và ứ ng d ụ ng trong th ươ ng m ại điệ n t ử 530 dùng để hi ể n th ð nh Ă ng s â n ph è m mà khách hàng chþa đþợ c tr â i nghi ệ m nhþng đã đþợ c các khách hàng tþĄng tă khác đánh giá cao - Trang g ợ i ý nh Ă ng s â n ph èm ngþą i dùng có th ể thích đþợ c th ể hi ệ n trong hình 12 - Trang hi ể n th ð nh Ă ng s â n ph è m khách hàng đã xem hoặc đã mua đþ ợ c th ể hi ệ n trong h ình 13 - Trang g ợ i ý s â n ph è m có th ể đþợ c mua cùng nhau đþợ c th ể hi ệ n trong h ình 14 Nhþ vê y, b ì ng vi ệ c xây d ă ng m ộ t Ā ng d ý ng thþĄng mäi điệ n t ā có tích h ợp đa dä ng các phþĄng pháp hệ g ợi ý, website đã tă động đþa ra cho khách hàng các g ợi ý khá thông minh, đa d ä ng, tr ă c quan, phù h ợ p v Ć i t ÿ ng cá nhân khách hàng và đã khí c ph ýc đþợ c v çn đề ngþą i dùng m Ć i, s â n ph è m m Ć i V Ć i nh Ă ng kh â nëng trên cho th ç y, h ệ g ợ i ý mang l ä i tr â i nghi ệ m t ố t chokhách hàng, giúp khách hàng gi â m th ą i gian tìm ki ế m s â n ph è m, tëng đ ộ hài lñng, tëng c Ą h ộ i mua hàng v à nâng cao t ỷ l ệ chuy ể n đ ổ i mua hàng Hình 8 Giao di ện đánh giá sâ n ph ẩ m c ủa ngườ i dùng Hình 9 Giao di ệ n k ế t qu â đánh giá sâ n ph ẩ m c ủa ngườ i dùng Hoàng Th ị Hà, Ngô Nguy ễ n Th ứ c 531 Hình 10 Giao di ện đo lường độ tương tự gi ữa các ngườ i dùng Hình 11 Giao di ệ n g ợ i ý cho ngư ờ i dùn g m ớ i M ộ t s ố ph ươ ng pháp g ợ i ý và ứ ng d ụ ng trong th ươ ng m ại điệ n t ử 532 Hình 12 Giao di ệ n g ợ i ý các s â n ph ẩm ngườ i dùng có th ể thích Hình 13 Giao di ệ n hi ể n th ị nh ữ ng s â n ph ẩm người dùng đã xem/mua Hình 14 Giao di ệ n g ợ i ý các s â n ph ẩ m hay mua cùng nhau Hoàng Th ị Hà, Ngô Nguy ễ n Th ứ c 533 7 K Ế T LU Ậ N H ệ g ợ i ý có vai trò r ç t quan tr ọ ng trong thþĄn g m äi điệ n t ā Nó là m ộ t trong nh Ăng vü khí m ä nh m ẽ giúp nhi ề u doanh nghi ệp tëng doanh s ố bán hàng, là m ộ t trong nh Ă ng nhân t ố t ä o nên s ă thành công c ûa các trang thþĄng mä i điệ n t ā và s ẽ đþợ c Ā ng d ý ng r ộ ng rãi trong tþĄng lai Trong nghiên c Ā u này, chúng tôi đã trình bày t ổ ng quan v ề h ệ g ợ i ý, khám phá nh Ă ng tác độ ng c û a h ệ g ợi ý đố i v Ći thþĄng mäi điệ n t ā B ì ng th ă c nghi ệm, chúng tôi đã so sánh đþợ c hi ệ u qu â th ă c hi ệ n c ûa các phþĄng pháp gợ i ý Content-based, User-based và Item-based, đánh giá đþợ c nh Ăng đ i ể m m änh, điể m y ế u c û a m ỗi phþĄng pháp gợ i ý Ngoài ra, chúng tôi báo cáo thách th Ā c c ûa các phþĄng pháp gợ i ý khi áp d ýng trong thþĄng mäi điệ n t ā và ch î ra gi â i pháp kh í c ph ý c Cu ối cùng, chúng tôi đã xåy d ă ng thành công h ệ th ố ng bán hàng tr ă c tuy ế n có tích h ợp các phþĄng pháp gợ i ý khác nhau, bao g ồ m k ỹ thu ê t g ợ i ý không cá nhân hóa (Non-personalized) và các k ỹ thu ê t g ợ i ý cá nhân hóa hi ệ u qu â nhþ: gợ i ý d ă a trên n ộ i dung (Content-based filtering), l ọ c c ộ ng tác (User- based, Item-based) Qua đò, ngþąi đọ c hi ểu đþợ c n ề n t â ng lý thuy ế t h ệ g ợi ý, điể m m änh, điể m y ế u c û a các h ệ g ợi ý cüng nhþ quy trình xåy d ă ng m ộ t Ā ng d ýng thþĄng mäi điệ n t ā có tích h ợp các phþĄng pháp g ợ i ý trong th ă c t ế HþĆ ng nghiên c Āu trong tþĄng lai cûa lïnh v ă c này còn khá r ộ ng m ć, đặ c bi ệ t là các k ỹ thu ê t g ợ i ý cá nhân hóa Chúng tôi s ẽ ti ế p t ý c nghiên c Ā u, c â i ti ế n Ā ng d ý ng các thu ê t toán g ợ i ý trong lïnh vă c e- commerce, lïnh vă c e - learning đ ể tr ợ giúp ngþ ą i dùng trong quá trình mua hàng, tìm ki ế m tài li ệ u cüng nhþ h ỗ tr ợ quá trình h ọ c t ê p tr ă c tuy ế n L Ờ I C ẢM ƠN Chúng tôi c âm Ąn Khoa Công nghệ thông tin, H ọ c vi ệ n Nông nghi ệ p Vi ệt Nam đã tä o điề u ki ệ n t ố t nh çt để chúng tôi th ă c hi ệ n nghiên c Ā u này TÀI LI Ệ U THAM KH Ả O Adomavicius G , Sankaranarayanan R , Sen S & Tuzhilin A (2005) Incorporating contextual information in recommender systems using a multidimensional approach ACM Transactions on Information Systems (TOIS) pp 103-145 Dias M B , Locher D , Li M , El-Deredy W & Lisboa P J (2008) The value of personalised recommender systems to e-business: a case study Proceedings of the 2008 ACM conference on Recommender systems pp 291-294 GroupLens (1998) MovieLens 100K Dataset, Retrieved from https://grouplens org/datasets/ movielens/ on October 03, 2020 Grouplens (2011) Last FM Retrieved from https://grouplens org/datasets/hetrec-2011 on October 03, 2020 Google & Temasek (2018) Báo cáoReport e-Conomy SEA 2018, Retrieved from https://www thinkwithgoogle com/_qs/documents/ 6730/Report_e-Conomy_SEA_2018_by_Google_ Temasek_v pdf on March 20, 2020 Ionos (2017) Recommendation systems in e- commerce US: IONOS Inc Retrieved from https://www ionos com/digitalguide/online-mark eting/online-sales/how-to-use-recommendation- systems-in-e-commerce on May 15, 2020 Jordan T (2016) New insight from Experian Marketing Services helps brands prepare for the holiday season https://www experianplc com Khusro S , Ali Z & Ullah I (2016) Recommender systems: issues, challenges, and research opportunities In Information Science and Applications (ICISA) 2016 Springer In Information Science and Applications (ICISA) Lei Tang, Zongtao Duan, Yishui Zhu, Junchi Ma & Zihang Liu (2019) Recommendation for Ridesharing Groups Through Destination Prediction on Trajectory Data IEEE Transactions on Intelligent Transportation Systems 99: 14 Mohamed M H , Khafagy M H & Ibrahim M H (2019) Recommender Systems Challenges and Solutions survey International Conference on Innovative Trends in Computer Engineering (ITCE) Nguy ễn Hùng Dũng & Nguyễ n Thái Nghe (2013) H ệ th ố ng g ợ i ý s ả n ph ẩ m trong bán hàng tr ự c tuy ế n s ử d ụ ng k ỹ thu ậ t l ọ c c ộ ng tác T ạ p chí Khoa h ọ c, Trường Đạ i h ọ c C ần Thơ 31: 15 Nguy ễn Thanh Hưng (2019) Báo cáo ch ỉ s ố thương m ại điệ n t ử 2019 Hi ệ p h ội thương mại điệ n t ử Vi ệ t Nam Reichheld & F F (1993) Loyalty-based management Harvard business review 71(2): 64-73 M ộ t s ố ph ươ ng pháp g ợ i ý và ứ ng d ụ ng trong th ươ ng m ại điệ n t ử 534 Schafer Ben J , Joseph Konstan & John Riedl (2001) E - commence Recommendation Applications Data Mining and Knowledge Discovery 5(1 - 2): 115 - 153 Sharma L & Gera A (2013) A survey of recommendation system: Research challenges International Journal of Engineering Trends and Technology (IJETT) 4(5): 1989-1992 Singh P (2019) A Survey of Recommendation Systems in Electronic Commerce Apress, Berkeley, CA pp 123-157 Stephan S (2019) Personalized Product Recommendation Tips and Stats Retrieved fromhttps://www barilliance com/personalized- product-recommendations-stats/ on Feb 25, 2020 Thomas T (2006) Designing recommender systems for e-commerce: an integration approach ACM International Conference Proceeding Series ACM press New York, USA 8 Trademark Notice (2003) Epinions dataset Retrieved from http://www trustlet org/epinions html on October 03, 2020 University of Freiburg (2004) BookCrossing, Retrieved from http://www2 informatik uni- freiburg de/~cziegler/BX/ on October 03, 2020 Vi ễn Thông (2020) Thương mại điệ n t ử Vi ệ t Nam 2020 s ẽ ra sao? Truy c ậ p t ừ https://vnexpress net/kinh-doanh/thuong-mai-dien- tu-viet-nam-2020-se-ra-sao-4045309 html, ngày10 tháng 3 năm 2020 Xue A Y , Qi J , Xie X , Zhang R , Huang J & Li Y (2015) Solving the data sparsity problem in destination p rediction The VLDB Journal 24(2): 219 - 243

Vietnam J Agri Sci 2021, Vol 19, No 4: 520-534 Tạp chí Khoa học Nơng nghiệp Việt Nam 2021, 19(4): 520-534 www.vnua.edu.vn MỘT SỐ PHƯƠNG PHÁP GỢI Ý VÀ ỨNG DỤNG TRONG THƯƠNG MẠI ĐIỆN TỬ Hồng Thị Hà1*, Ngơ Nguyễn Thức2 1Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam 2Sinh viên K57 - Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam *Tác giả liên hệ: htha@vnua.edu.vn Ngày nhận bài: 20.07.2020 Ngày chấp nhận đăng: 29.03.2020 TÓM TẮT Hệ gợi ý (Recommender System) công cụ thiết kế nhằm cung cấp khuyến nghị hữu ích sản phẩm, dịch vụ,…cho người dùng Hệ gợi ý dựa liệu mối quan hệ người dùng, sản phẩm hành vi người dùng khứ sản phẩm để đưa gợi ý thơng minh, phù hợp với sở thích khách hàng Hệ gợi ý giúp khách hàng nhanh chóng định vị sản phẩm họ quan tâm để từ đưa định đắn mua sắm online Trong báo này, trình bày tổng quan số phương pháp gợi ý, đánh giá điểm mạnh, điểm yếu, so sánh hiệu thực phương pháp Chúng lợi ích mà hệ gợi ý mang lại cho thương mại điện tử, đồng thời nêu thách thức giải pháp khắc phục Kết thực nghiệm tập liệu chuẩn (Movielens, Epinions, BookCrossing, LastFM) cho thấy phương pháp có ưu điểm hạn chế riêng, khơng có phương pháp tốt tất tiêu chí Ngồi ra, chúng tơi đưa quy trình chung để xây dựng hệ gợi ý website thương mại thực tích hợp kỹ thuật hệ gợi ý website thương mại điện tử khắc phục vấn đề người dùng mới, sản phẩm (vấn đề gọi “Cold start problem”) phương pháp gợi ý cá nhân hóa Từ khóa: Hệ gợi ý, lọc cộng tác, gợi ý dựa nội dung, hệ gợi ý kết hợp, thương mại điện tử Some Methods of Recommender System and its Application in E-Commerce ABSTRACT The designed recommender system is a tool to provide important suggestions forusers or customers Based on the datasets of user relationships, products, andprevious behavior of consumers, smart recommendations for the preferences of eachconsumer are given, which helps consumers tomake good decisions while shopping online In this article, we present an overview of some methodologies of recommendation systems, techniques of recommender systems, and evaluate the strengths and weaknesses of each technique, as well as comparedsome benefits of recommender systems in e-commerce Moreover, we report some challenges that the recommender systems are facing and list some solutions to solve these challenges Our experimental results on the four datasets (Movielens100k, Epinions,BookCrossing, LastFM) showed that there was no best recommendation algorithm in all evaluation metrics Finally, we built an e-commerce website that integrated some different techniques of recommender systems such as non-personalized methods, personalized methods to recommend the right product for each customer The experimental system gives some diverse suggestions to overcome the problem "Cold start problem" of personalized methods Keywords: Recommender systems, collaborative filtering, content-based filtering, hyper filtering, E-Commerce ĐẶT VẤN ĐỀ đổi hình thĀc giao dðch truyền thống Ngày cú nhiu ngỵi la chn hỡnh thc mua sím trăc Trong nhĂng nëm gỉn đåy, vĆi să phổ tuyến Trong đò, để mć rộng th trỵng kinh bin cỷa mọng Internet v mỏy tớnh, thỵng doanh, cỏc doanh nghip ó xồy dng Āng dýng mäi điện tā phát triển nhanh chóng trờn thỵng in t v cung cỗp rỗt nhiu sõn phọm vi ton cổu Thỵng in tā thay phèm website Tuy nhiên, thông tin 520 Hồng Thị Hà, Ngơ Nguyễn Thức nhiều, khách hàng tốn thąi gian tỡm ng ỵa nhng gi ý thụng minh, đa däng sân phèm họ cæn Điều này, làm giõm s hi ti ngỵi dựng lũng v s trung thnh cỷa khỏch giõi quyt vỗn ny, ý tỵng chớnh cỷa cỏc chuyờn gia CC K THUT H GI í thỵng in t l thiết lêp hệ thống gợi ý thơng minh nhìm khám phá mặt hàng Các kỹ thuờt h gi ý thỵng ỵc chia phự hp nhỗt cho tng ngỵi dựng Vi h thng thnh hai nhúm là: hệ gợi ý cá nhân hóa gợi ý tă động, khách hàng nhanh chóng hệ gợi ý khơng cá nhân hóa Chúng tơi têp truy cờp ỵc sõn phốm hp vi s thớch v nhu trung gii thiu túm tớt phỵng phỏp gi ý cỉu cûa họ, tiết kiệm thąi gian tìm sân phèm khơng cá nhân hóa số tht tốn gi ý cỏ cho ngỵi dựng (Thomas, 2006) nhõn húa tiờu biu thỵng ỵc s dýng cỏc trang thỵng in t NhĂng nëm gæn đåy, kỹ thuêt hệ gi ó v ang ỵc nghiờn cu, ng dýng nhiều lïnh 2.1 Hệ gợi ý khơng cá nhân hóa (non- vc Trong thỵng in t, h gi ý mang personalized recommender systems ) läi nhiều lợi ích cho cõ ngỵi cung cỗp dch vý v ngỵi s dýng dðch vý (Ionos, 2017) Hæu hết Là nhũm phỵng phỏp khụng da vo h s cỏc cụng ty thỵng ln nhỵ: Amazon cỏ nhõn tÿng khách hàng mà chỵ dăa vào đặc (Amazon.com), CDNOW (www.cdnow.com), tính cûa sân phèm (sân phèm mĆi) đánh giá eBay (eBay.com), Alibaba (Alibaba.com), t cng ng nhỵ: sõn phốm bỏn chọy nhỗt, sõn MovieFinder (MovieFinder.com), Youtube.com, phốm ỵc ỏnh giỏ tt nhỗt, (Singh, 2019) Facebook.com,„ sā dýng kỹ thuêt gợi ý website cûa họ để nâng cao trâi nghiệm 2.2 Hệ gợi ý cá nhân hóa (personalized cho khỏch hng, nõng cao chỗt lỵng dch vý v recommender systems) tëng doanh thu bán hàng Tuy nhiên, ć Việt Nam - mt quc gia cú rỗt nhiu tim nởng v Nhũm phỵng phỏp ny ỵc ỏnh giỏ l thỵng in t (Vin Thụng, 2020) lọi cú s mang lọi hiu quõ cao i vi thỵng in t lỵng website thỵng tớch hp h gi ý Nếu doanh nghiệp hiểu rõ tÿng khách hàng cûa không nhiều (Nguyễn Hùng Düng & Nguyễn mỡnh da trờn nhng gỡ h tỵng tỏc v mua Thái Nghe, 2013) Hiện Việt Nam cò 44% hng trờn mọng, doanh nghip cú th tỵ vỗn cho doanh nghiệp tham gia xåy dăng website khỏch hng nhng sõn phốm phự hp vi mong thỵng mọi, nhỵng chợ cú 32% doanh nghip mun v s thớch cỷa khỏch hn (Google & ỵc ỏnh giá cao kênh bán hàng thông qua Temasek, 2018) Khỏch hng s tit kim ỵc trang web (Nguyn Thanh Hỵng, 2019) thi gian tỡm kim sõn phốm, mua ỵc nhng mòn hàng sć thích Tÿ đị, doanh nghiệp Bài báo ny trỡnh by tng quan cỏc tởng ỵc s lỵng ngỵi mua hng, tởng giỏ tr phỵng phỏp gợi ý, đánh giá hiệu quâ cûa đĄn hàng, tëng doanh số bán hàng thuêt toán gợi ý (Content-based, user-based item-based) số têp dĂ liệu chuèn bao Theo nghiên cĀu cûa Schafer & cs (2001), gồm: Movielens, Epinions, BookCrossing doanh nghip s dýng phỵng phỏp gi ý cỏ LastFM Chúng tơi thâo ln nhĂng điểm nhân hịa để gāi email tĆi khách hàng tỷ lệ mänh, im yu cỷa mi phỵng phỏp, thỏch giao dch thụng qua email cao hn gỗp hai lổn thc giâi pháp khíc phýc xây dăng hệ gợi so vi cỏc email ỵc gi khụng ỏp dýng phỵng ý thỵng in t ng thi, chỳng tụi phỏp ny (Stephan, 2019) Do ũ, cỏc phỵng ỵa quy trình xåy dăng hệ gợi ý pháp gợi ý cá nhån hòa làm tëng mĀc độ tỵng website thỵng v thc hin ci t cỏc k tỏc v chuyn i giao dch thỵng thuờt h gi ý website thỵng in t in t Kt quõ ci t cho thỗy, website ỵc tớch hp cỏc phỵng phỏp h gi ý h thng s t Mt s phỵng phỏp gợi ý thuộc loäi cá nhõn húa nhỵ sau: 521 Một số phương pháp gợi ý ứng dụng thương mại điện tử 2.2.1 Gợi ý dựa nội dung (Content- ngỵi dựng ũ kt hp quan im cỷa nhng based filtering) ngỵi dựng khỏc ồy l k thuờt mọnh v ó ỵc ỏp dýng khỏ thnh cụng cỏc h Phỵng phỏp gi ý ny da trờn mụ tõ cỷa thng thỵng ln Lc cng tỏc thu thờp sõn phốm v profile cỷa tng ngỵi dựng phõn hi t nhiu ngỵi dựng i vi sõn phốm, (khụng quan tồm n ngỵi dựng khỏc) Gi ý lỵu tr phõn hi cỷa ngỵi dựng dỵi dọng ma dăa nội dung thu thêp hồ sĄ cỷa ngỵi trờn ngỵi dựng (users) - sõn phốm (items) Mỗi dùng: họ tên, giĆi tính, nghề nghiệp v tỵng dũng l mt vect cha giỏ tr phõn hi cỷa tỏc cỷa cỏ nhồn ngỵi dựng trờn cỏc sõn phốm, ngỵi dựng i vi cỏc sõn phốm Sau đị, tính sau đị so sánh đặc điểm sõn phốm c tỵng t gia cỏc users giĂa items sć dĂ liệu vĆi đặc điểm sân phèm mà khách hệ thống, tỡm mi tỵng quan v ỵa hng ó quan tåm để gợi ý cho khách hàng gi ý phự hp tỵng t gia cỏc user gia cỏc item ỵc tớnh theo cụng thĀc Cosin 2.2.2 Lọc cộng tác (Collaborative Pearson Filtering - CF) Bâng ma biểu diễn đánh giá cûa Lc cng tỏc gi ý sõn phốm ti ngỵi dựng ngỵi dựng trờn cỏc sõn phốm da trờn lch s tỵng tỏc sõn phốm cỷa chớnh Hình Mơ hình hệ gợi ý dựa nội dung Bâng Ma trận biểu diễn người dùng - sân phẩm tiếp cận lọc cộng tác 522 Hoàng Th H, Ngụ Nguyn Thc Cũ hai phỵng phỏp lc cng tỏc: in t ln nhỵ Amazon, Tiki, Youtube Facebook User-based: D oỏn da trờn s tỵng t gia cỏc users í tỵng quan trng cỷa phỵng 2.2.3 Phng phỏp kt hp phỏp ny l nhng khỏch hng tỵng t cú xu (hybrid method) hỵng s dýng nhng sõn phốm tỵng t (Singh & Pramod, 2019) Nu hai khỏch hng A, Phỵng phỏp ny kt hp gia k thuêt gợi B có lðch sā đánh giá sân phốm tỵng t trờn ni dung v lọc cộng tác Kỹ tht User-basedsẽ dă đốn khỏch hng A ny ỵc xem l khỏ hiu quâ giâi có khâ nëng quan tâm ti nhng sõn phốm ỵc vỗn cold - start problem rỗt chỵa ỵc trõi nghim nhỵng ó ỵc khỏch nhiu nghiờn cu Trang thỵng in t hng B thớch v ngỵc lọi Phỵng phỏp ny in hỡnh ó ng dýng phỵng phỏp ny l phân tích ma user-item để tìm nhĂng Spotify.com H ó tớch hp phỵng phỏp h gi ngỵi dựng tỵng t ý tổng hợp để täo danh sách hát hàng tuæn cho tÿng khách hàng riêng biệt Website Item-based : Dă đoán dăa să tỵng t ó tng hp d liu ngỵi dựng da thói giĂa items Hai sân phèm i i ó ỵc quen nghe nhọc v nhng ngỵi dựng tỵng t cng ng ỏnh giỏ tỵng t để täo danh sách cỏc bi hỏt c ỏo phự ỵc ỏnh giỏ tỵng t bi nhng ngỵi dựng hp vi s thớch cỷa tng khỏch hng cũn lọi Phỵng phỏp ny phồn tích ma user-item để nhên diện sân phèm tỵng t 2.3 Mc tiờu ca cỏc phng phỏp gợi ý Ngày nay, kỹ thuêt lọc cộng tác ỵc s Mýc tiờu cỷa cỏc phỵng phỏp gi ý ỵc dýng khỏ ph bin trờn cỏc trang thỵng th hin bõng Hình 2.Tiến trình lọc cộng tác Hình Lọc cộng tác dựa User-based Item-based 523 Một số phương pháp gợi ý ứng dụng thương mại điện tử Hình Mơ hình hệ gợi ý kết hợp Bâng Mục tiêu khái niệm phương pháp gợi ý Phương pháp (Methods) Mục tiêu (concept goals) Đầu vào (Inputs) Gợi ý không cá nhân hóa Gợi ý sản phẩm mà người dùng thích Thuộc tính (item attributes) sản phẩm (Non-personalized dựa sản phẩm ý kiến cộng đồng Profiles người dùng recommender systems) Lọc dựa nội dung Gợi ý sản phẩm khách hàng thích dựa Đánh giá User + Đánh giá cộng (Content-based filtering) hồ sơ cá nhân người dùng độ tương tự đồng sản phẩm sở liệu với sản Thuộc tính sản phẩm+ đánh giá Lọc cộng tác (Collaborative phẩm mà khách hàng thích khứ Users cộng đồng Filtering) Phương pháp kết hợp Gợi ý sản phẩm mà người dùng thích (Hybrid method) dựa người dùng có sở thích tương tự Gợi ý sản phẩm mà người dùng thích dựa việc kết hợp Content-based filtering Collaborative Filtering VAI TRÒ CỦA HỆ GỢI Ý TRONG - Xây dăng lòng trung thành (Building THƯƠNG MẠI ĐIỆN TỬ Loyalty): Trong chin lỵc kinh doanh, vic đät ỵc lũng trung thnh cỷa ngỵi tiờu dựng l Trong thỵng in t, h gi ý địng vai điều cỉn thiết Khi lịng trung thnh cỷa trủ nhỵ mt chuyờn gia thụng minh h trợ khách hàng tëng lên, lợi nhuên cüng tëng lên khách hàng trình tìm chọn mua (Reichheld & F., 1993) Các hệ thống gợi ý câi sân phèm Hệ gợi ý thúc ốy thỵng in t tinlũng trung thnh bỡng cách tìm hiểu, thu (Schafer & cs., 2001) theo cách sau: thêp thơng tin, nhu cỉu, sć thích mối quan tâm cûa khách Tÿ đò, sā dýng thuêt - Chuyển khách vóng lai thnh ngỵi mua toỏn thụng minh cỏ nhån hòa để gợi ý phù hợp hàng (Converting Browsers into Buyers): Khách chotÿng khách hàng, giúp họ hài lũng, cú nim vóng lai thỵng ghộ thởm website xem trang tin quay läi trang web để mua hàng web mà không mua hàng Các hệ thống gợi ý hiểu nhu cæu cûa khách, hiển thð nhĂng sân VĆi nhĂng khâ nëng trên, hệ gợi ý mang läi phèm mà khách thích, muốn tìm trâi nghiệm tốt cho khách hàng, giúp khách mua Bìng cách này, hệ thống chuyển nhĂng hàng giâm thąi gian tìm kiếm sân phèm, nâng khách vãng lai thành khách mua hàng cao tỷ lệ chuyển đổi mua hàng, câi thiện việc bó gió hàng giĂ khách quay tr lọi mua hng - Tởng cỵng bán chéo (Increasing Cross- Tÿ đò, hệ gợi ý giỳp cỏc thỵng nhồn tởng giỏ sell): Cỏc h thng gợi ý câi thiện bán chéo bìng trð đĄn hàng trung bỡnh, tởng doanh thu cỏch xuỗt cỏc mt hàng liên quan đến sân bán hàng (Dias & cs., 2008; Jordan, 2016; phèm, sân phèm phý kiện bổ sung cho Stephan, 2019) khách mua hàng 524 Hồng Thị Hà, Ngơ Nguyễn Thức THÁCH THỨC CỦA HỆ GỢI Ý TRONG website, lỵng khỏch hng ỏnh giỏ trờnsõn THNG MẠI ĐIỆN TỬ VÀ GIẢI PHÁP phốm rỗt ớt, nờn cỏc thuờt toỏn gi ý khũ đoán KHẮC PHỤC ỵc s thớch cỷa ngỵi dựng ồy cüng vỗn ln cỷa cỏc hệ gợi ý (Sharma & Gera, 4.1 Vấn đề khách hàng mới, sân phẩm 2013) Bći dĂ liệu phâi đû lĆn thuêt toán gợi (Cold-startproblem) ý mĆi có nhĂng gợi ý xác Các nhà khoa học cố gíng nghiên cĀu để làm giâm vỗn Mt nhng thỏch thc i vi bỗt k ny, nhỵng hin vộn cũn l mt bi toỏn khú h thng gi ý no l vỗn ngỵi dựng mi (new cổn ỵc nghiờn cu nhiu hn Dỵi ồy l mt user) hoc sõn phốm mi (new item) H s cỷa s giõi phỏp ỵc xuỗt (Khusro & cs., 2016): ngỵi dựng rng v h chỵa xp họng bỗt k sõn phốm no Vỡ vờy, giâi thuêt gợi ý Giâi pháp 1: Sā dýng mơ hình gợi ý đa hiểu ỵc khỏch hng v khụng d oỏn ỵc s chiều (Adomavicius & cs., 2005) sā dýng thích, nhu cæu cûa họ (Sharma & Gera, 2013) kỹ thuêt hiệu quâ giâi toán dă đoán Vỗn ny gi l Cold start problem v cú th i vi ma trờn thỵa nhỵ giõi phỏp cỷa Xue & ỵc giõi quyt bỡng cỏch s dýng h gợi ý không cs (2015), giâi pháp cûa Lei & cs (2019) cá nhån hòa để gợi ý nhĂng sân phèm mĆi, nhĂng sân phèm bán chäy, nhĂng sân phèm Giâi pháp 2: Dăa nhĂng phõn hi tim ỵc nhiu ngỵi ỏnh giỏ cao, (Schafer & cs., ốn cỷa ngỵi dựng (implicit feedback) nhỵ: lðch 2007; Mohamed & cs., 2019) sā xem hàng, mua hàng„ để bổ sung dĂ liệu vào ma trờn ngỵi dựng - sân phèm nhìm hän chế 4.2 Vấn đề khâ m rng v hiu sut mc thỵa cỷa ma trờn ớt ngỵi dựng ỏnh giỏ thi gian thực Giâi pháp 3: Chia sẻ thụng tin ngỵi dựng Khi lỵng d liu ngy lĆn dỉn lên, giĂa trang web khơng có cänh tranh, đặc làm để hệ gợi ý làm việc hiệu quâ biệt khai thác thêm dĂ liệu tÿ trang mối quan tâm cûa nhà khoa học mọng xó hi Thụng tin ngỵi dựng cng nhiu, cỷa doanh nhõn s dýng h thng thỵng đỉy đû giúp tht tốn gợi ý hiểu điện tā VĆi website lĆn, hệ thống phâi täo khỏch hng hn v tỵ vỗn chớnh xỏc hn Lỵu ý, cỏc gi ý vủng n v giây phýc bên chia sẻ dĂ liu ngỵi dựng phõi cam vý hng trởm hoc hng ngn ngỵi tiờu dựng kt chợ dựng d liu ỵc chia s phýc vý tỵ cựng mt lỳc S lỵng yờu cổu gi ý ng thi vỗn tốt hĄn có trách nhiệm bâo vệ thơng tin ngy cng ln, s lỵng sõn phốm ngy cng ngỵi dựng tởng, hnh vi tỵng tỏc cỷa ngỵi dùng sân phèm ngày nhiều Hiện täi, để giâi ĐÁNH GIÁ CÁC PHƯƠNG PHÁP GỢI í quyt phổn no vỗn ny ngoi vic ổu tỵ ln hn cho cỏc h thng tớnh toỏn mọnh cæn phâi 5.1 Điểm mänh điểm yếu áp dýng thêm thuêt toán giâm chiều, xā lý phương pháp hệ gợi ý song song đặc biệt nên chäy tht tốn offline để gợi ý online nhanh hĄn (Khusro Bâng kết luên cûa nhĂng & cs., 2016) Tuy nhiờn, ồy l vỗn khú v ỵu im v họn ch cỷa cỏc phỵng phỏp hệ thách thĀc cûa hệ thống gợi ý gợi ý 4.3 Vấn đề thưa thớt liệu đánh giá 5.2 Đánh giá độ xác phương (Sparsity) pháp gợi ý Một thách thĀc nĂa đối vĆi hệ gợi ý tọi cỏc 5.2.1 D liu thc nghim trang thỵng in t l s thỵa tht v d Chúng đánh giá hiệu quâ thăc cûa liệu khỏch hng ỏnh giỏ sõn phốm Rỗt nhiu thuêt toán content-based, user-based, item based ỵc gii thiu trờn bỡng cỏch chọy thā nghiệm têp dĂ liệu chuèn: Movielens 525 Một số phương pháp gợi ý ứng dụng thương mại điện tử (GroupLens, 1998), Epinions (Trademark NRMSE  RMSE Notice, 2003), BookCrossing (University of Freiburg, 2004), LastFM (GroupLens, 2011) Ratingmax  Ratingmin 5.2.2 Phương pháp đánh giá môi trường Trong đò: thử nghiệm RMSE  n pi  ri 2 a Phương pháp đánh giá Chúng chia têp dĂ liệu làm phæn, n1 lỗy ngộu nhiờn 70% tờp d liu training vĆi n số quan sát, pi giá trð dă đoán 30% dĂ liệu cịn läi để testing Chúng tơi thăc đánh giá cûa sân phèm i ri giá trð đánh giá læn lặp têp dĂ liệu.Độ đo thăc tế cûa sân phèm i NRMSE (Normalized Root Mean Square Error) thi gian thc hin (time) ỵc chỳng tụi s Ratingmax, Ratingmin lổn lỵt l im ln nhỗt dýng ỏnh giỏ hiu quõ cỷa cỏc thuờt toỏn v nhú nhỗt cho phộp ngỵi dùng đánh giá Độ đo NRMSE dùng để xác đðnh sai số b Môi trường thử nghiệm chn hóa cûa tht tốn ỵc xỏc nh bỡng cụng thc: Mụi trỵng ỵc s dýng th nghim l máy tính Intel(R) Corei5-6300U, CPU @ 2.5GHz, RAM 8GB ngôn ngĂ Python hệ điều hành Microsoft Window 10 Bâng Điểm mänh điểm yếu phương pháp gợi ý STT Phương pháp Điểm mạnh Điểm yếu Gợi ý không cá nhân Đơn giản Gợi ý chung chung, khơng cá nhân hóa đến khách hàng Vì khách hóa (Non-personalized Gợi ý khơng phụ thuộc vào liệu có kết gợi ý giống recommender khách hàng hệ thống nên áp dụng systems) cho khách hàng, giúp tăng hội chuyển đổi khách hàng Lọc dựa nội dung Hệ thống không sử dụng liệu người Hệ thống phải phân tích dị tìm tất (Content-based dùng khác mà gợi ý sản đặc trưng sản phẩm để tạo danh filtering) phẩm phù hợp với sở thích khác sách gợi ý, nên chậm hồ sơ hhàng riêng biệt sản phẩm không dẫn đến Có khả gợi ý sản gợi ý sai phẩm cho người dùng Không thể gợi ý khách hàng không có lịch sử đánh giá xem/thích sản phẩm hệ thống.Với khách hàng mới, hệ thống cung cấp gợi ý phù hợp Không gợi ý thêm sở thích khách Lọc cộng tác Hệ thống không cần sử dụng đến hồ sơ Không thể gợi ý khách hàng chưa (Collaborative nhân học người dùng để gợi ý tương tác với mặt hàng Filtering) sản phẩm Không thể gợi ý sản phẩm Có khả dự đốn sở thích nhu sản phẩm chưa đánh giá cầu người dùng mà không cần hiểu sản phẩm Khi lượng sản phẩm lớn số lượng khách hàng đánh giá không nhiều Có thể gợi ý tới người dùng sản phương pháp không hiệu phẩm bên ngồi sở thích có Nhữngnhững sản phẩm phù hợp sở thích họ Phương pháp tổng Kết hợp tất ưu điểm phương Không thể gợi ý cho người dùng hợp (Hybrid method) pháp Content-based filtering Collaborative Filtering Khi lượng sản phẩm lớn số lượng khách hàng đánh giá khơng nhiều phương pháp không hiệu 526 Hồng Thị Hà, Ngơ Nguyễn Thức Bâng Thông tin tập liệu thử nghiệm Datasets #Items #Users # Rating Range Rating Mô tả Movielens 100K 1,700 1,000 100,000 1÷5 Chứa đánh giá người dùng các Epinion 138,738 49,290 139,738 1÷5 phim Mỗi phim có đặc trưng (id, BookCrossing 271,379 278,858 1,149,780 title, realise date, type, rating, time ) LastFM 17,632 1÷10 1,892 92,834 Số lần hát Chứa quan điểm người dùng bật sản phẩm thương mại users Chứa đánh giá người dùng sách Chứa danh sách top hát người dùng nghe nhiều (2100 users and 18,745) 5.2.3 Kết quâ thử nghiệm thuêt gi ý cỏ nhồn hũa nhỵ: phỵng phỏp gi ý da trờn ni dung, phỵng phỏp gi ý lọc cộng Kết quâ ć bâng cho thỗy, thuờt toỏn tỏc thụng bỏo cho khách hàng nhĂng sân Content - based có thąi gian chäy nhanh hĄn phèm họ thích, h tr khỏch hng User-based v Item-based, nhỵng xác q trình tìm mua sân phèm khơng cao GiĂa tht tốn User-based Item-based, xét sai số cûa dă đoán 6.1 Tổng quan cách tiếp cận thìtiếp cên lọc cộng tác da trờn sõn phốm (Item-based) cho sai s thỗp hn (hay cho độ Cách tiếp cên tổng quan cỷa chỳng tụi ỵc chớnh xỏc cao hn) tip cên lọc cộng tác dăa thể hỡnh trờnngỵi dựng (User - based) vi t l 3/4 têp dĂ liệu Tuy nhiên, xét thąi gian thăc 6.2 Luồng xử lý hệ thng thỡ phỵng phỏp lc cng tỏc da trờn ngỵi dựng thc hin nhanh hn nhiu so vi phỵng Lung x lý chớnh h thng ỵc thể pháp lọc cộng tác dăa sân phèm câ giai hin hỡnh oọn huỗn luyn (training) giai đoän kiểm thā (testing) ć câ têp dĂ liệu Do đị, cị thể nói Giâi thớch: H thng s kim tra xem khỏch phỵng phỏp lọc cộng tác dăa User - based hàng cị đëng nhêp hay khơng Nếu khách hàng có khâ nëng mć rộng (scability) tốt hĄn cò ởng nhờp, h thng s kim tra xem khỏch phỵng pháp Item - based Vì vêy, khó có tht hng ó cũ tỵngt vi ngỵi khỏc hay chỵa, toỏn no l tt nhỗt trờn mi tiờu Tựy theo có sā dýng mơ hình lọc cộng tác để mýc đích gợi ý Āng dýng thăc tế để chọn hiển thð thông tin gi ý, ngỵc lọi h thng s phỵng phỏp gợi ý phù hợp kiểm tra xem khách hàng có thơng tin cá nhân để đðnh lăa chọn mô hình nhân khèu học TÍCH HỢP HỆ GỢI Ý TRONG HỆ THỐNG không cá nhồn ỵa gi ý cho khỏch BN HNG TRỰC TUYẾN hng Trỵng hp gi trờn mụ hỡnh khụng cỏ nhõn thỡ s ỵa nhng sân phèm mĆi, sân Để thā nghiệm trăc quan hệ gợi ý Āng dýng phèm bán chäy, sân phốm ỵc nhiu khỏch thỵng in t, chỳng tiến hành hàng quan tâm xây dăng hệ thống bán sách trăc tuyến tích hợp vĆi thuêt tốn gợi ý trình bày ć Trong trỵng hp khỏch hng khụng ởng nhêp, hệ thống kiểm tra lðch sā khách hàng Hệ thống sā dýng thuêt toán gợi ý không cá tÿng truy cêp vào trang web dăa vào IP nhån hòa để hiển thð sân phèm mĆi, sân máy tính mà khách hàng truy cờp, h thng s phốm bỏn chọy nhỗt, sõn phốm ỵc ỵa thớch lỵu vt lọi lch s quỏ trỡnh truy cờp Nu cú nhỗt c bit, hệ thống tích hợp số kỹ thơng tin da theo a chợ IP, h thng s ỵa gợi ý nhĂng sân phèm mà khách hàng tÿng xem 527 Một số phương pháp gợi ý ứng dụng thương mại điện tử Bâng Sai số dự đoán thời gian thực trung bình lần chäy phương pháp lọc cộng tác Dataset Thuật toán NRMSE Thời gian(sec) Movielens (100K) Content - based 0,317 Training testing Epinion User - based 0,280 BookCrossing Item - based 0,288 0,093 0,027 LastFM User - based 0,285 Item - based 0,254 1,126 3,107 User - based 0,248 Item - based 0,282 0,147 7,793 User - based 0,0131 Item - based 0,0103 6,515 158,91 7,518 3869,7 9,126 171,73 20,142 4030,5 4,313 165,398 39,326 4431,387 Ghi chú: giá trị tốt tiêu chí tập liệu tơ đậm Thông tin sản phẩm Thông tin Tương tác User-item (products cataluge) Users (User product interactions) (products cataluge) (Peocduct (products cataluge) Recommender System (peocduct Danh sách sản phẩm gợi ý cho khách Hình Tổng quan cách tiếp cận 6.3 Tiến trình gợi ý hệ thống website sân phèm mĆi, sân phèm bán chäy, sân phèm thương mäi ỵc nhiu ngỵi ỏnh giỏ Tin trỡnh gợi ý sân phèm hệ thống - Nhúm 2: S dýng nhúm thuờt toỏn cỏ thỵng in t ỵc th hin hỡnh nhồn hịa trình bày ć mýc 2.2 để gợi ý cho khách hàng: thuêt toán nhân khèu học, tht Tiến trình bao gồm giai độn: toán gợi ý dăa nội dung (content - based), Giai độn 1: Thu thêp thơng tin ngỵi dựng thuờt toỏn lc cng tỏc (Collaborative filtering) cú th d oỏn ỵc s thớch cỷa ngỵi để đoán sân phèm phù hợp vĆi khách hàng dựng, h thng phõi hc mt mụ hỡnh ngỵi dựng (User model) Mụ hỡnh ngỵi dựng m Giai đoän 3: Gợi ý: Giai đoän này, cën cĀ chỳng tụi thu thờp l cỏc d liu cỷa ngỵi dùng vào tÿng đặc điểm cûa khách hàng, hệ thống s nhỵ: thụng tin cỏ nhồn, thụng tin lch s tỵng d oỏn v gi ý nhng sõn phốm m khỏch tỏc cỷa ngỵi dựng trờn sõn phốm hàng thích Giai độn 2: Sā dýng tht tốn gợi ý: Giai độn này, sā dýng dĂ liệu thu 6.4 Một số giao diện kết quâ ứng với thêp ỵc giai oọn v d liu sõn phốm để giai đoän gợi ý hệ thống chäy nhóm tht tốn: - Nhóm 1: Sā dýng tht tốn gợi ý khơng 6.4.1 Trang đánh giá sản phẩm cá nhân hóa (Non - personalized) để gợi ý Giao diện đánh giá sân phốm ỵc th hin 528 hình Hồng Thị Hà, Ngơ Nguyễn Thức Hình Luồng xử lý hệ thống Thu thập thông tin Phản hồi (Information collection) (Feedback) Học (Learning) Dự đoán/Gợi ý (Recommender System) Hình Tiến trình gợi ý hệ thống 6.4.2 Một số trang huấn luyện mơ hình kiếm sân phèm, hệ thống hiển thð danh - Trang thống kê đánh giá sân phèm cûa sách nhĂng sân phèm mĆi nhĂng sân phèm tỵng t m nhiu ngỵi quan tồm gi ý cho ngỵi dựng ỵc th hin hình hình khách hàng - Trang o lỵng tỵng t gia cỏc ngỵi b Đối với khách hàng thành viên dùng ỵc th hin hỡnh 10 Nếu khách hàng thành viên cûa hệ 6.4.3 Các kết gợi ý sản phẩm thống, tÿng cò đánh giá sân phèm, website gợi ý nhĂng sân phèm mĆi, sân phèm nhiều a Đối với khách hàng ngỵi quan tõm, sõn phốm tỵng tă Ngoài ra, Nếu khách hàng mĆi (khách hng chỵa h thng cũn da vo tỵng t gia cỏc ngỵi ỏnh giỏ bỗt k sõn phốm nào), họ tìm 529 Một số phương pháp gợi ý ứng dụng thương mại điện tử dùng để hiển thð nhĂng sân phốm m khỏch Nhỵ vờy, bỡng vic xõy dng mt ng dýng hng chỵa ỵc trõi nghim nhỵng ó ỵc cỏc thỵng in t cú tớch hp a dọng cỏc khỏch hng tỵng t khỏc ỏnh giỏ cao phỵng phỏp h gi ý, website ó t ng ỵa cho khách hàng gợi ý thông minh, đa - Trang gợi ý nhng sõn phốm ngỵi dựng dọng, trc quan, phự hp vi tng cỏ nhõn khỏch cú th thớch ỵc thể hình 12 hàng khíc phýc ỵc vỗn ngỵi dựng mĆi, sân phèm mĆi VĆi nhĂng khâ nëng cho - Trang hin th nhng sõn phốm khỏch thỗy, h gi ý mang läi trâi nghiệm tốt chokhách hàng xem ó mua ỵc th hin hng, giỳp khỏch hng giâm thąi gian tìm kiếm hình 13 sân phèm, tëng độ hài lñng, tëng cĄ hội mua hàng nâng cao tỷ lệ chuyển đổi mua hàng - Trang gi ý sõn phốm cú th ỵc mua cựng ỵc th hin hỡnh 14 Hỡnh Giao diện đánh giá sân phẩm người dùng Hình Giao diện kết quâ đánh giá sân phẩm người dùng 530 Hồng Thị Hà, Ngơ Nguyễn Thức Hình 10 Giao diện đo lường độ tương tự người dùng Hình 11 Giao diện gợi ý cho người dùng 531 Một số phương pháp gợi ý ứng dụng thương mại điện tử Hình 12 Giao diện gợi ý sân phẩm người dùng thích Hình 13 Giao diện hiển thị sân phẩm người dùng xem/mua Hình 14 Giao diện gợi ý sân phẩm hay mua 532 Hồng Thị Hà, Ngơ Nguyễn Thức KẾT LUẬN TÀI LIỆU THAM KHẢO Hệ gợi ý có vai trũ rỗt quan trng Adomavicius G., Sankaranarayanan R., Sen S & thỵng in t Nú l mt nhĂng vü Tuzhilin A (2005) Incorporating contextual khí mänh mẽ giúp nhiều doanh nghiệp tëng information in recommender systems using a doanh số bán hàng, nhĂng nhân tố multidimensional approach ACM Transactions on täo nên să thành công cûa trang thỵng Information Systems (TOIS) pp 103-145 in t v s ỵc ng dýng rng rói tỵng lai Dias M.B., Locher D., Li M., El-Deredy W & Lisboa P.J (2008) The value of personalised Trong nghiên cĀu này, chúng tơi trình recommender systems to e-business: a case study bày tổng quan hệ gợi ý, khám phá nhĂng tác Proceedings of the 2008 ACM conference on động cỷa h gi ý i vi thỵng in t Recommender systems pp 291-294 Bìng thăc nghiệm, chúng tụi ó so sỏnh ỵc hiu quõ thc hin cỷa cỏc phỵng phỏp gi ý GroupLens (1998) MovieLens 100K Dataset, Content-based, User-based Item-based, Retrieved from https://grouplens.org/datasets/ ỏnh giỏ ỵc nhng im mọnh, im yu cỷa movielens/ on October 03, 2020 mi phỵng phỏp gợi ý Ngồi ra, chúng tơi báo cáo thách thĀc cỷa cỏc phỵng phỏp gi ý ỏp Grouplens (2011) Last.FM Retrieved from dýng thỵng in t v chỵ giâi pháp khíc phýc Cuối cùng, chúng tơi xåy https://grouplens.org/datasets/hetrec-2011 on dăng thành công hệ thống bỏn hng trc tuyn cú tớch hp cỏc phỵng phỏp gợi ý khác nhau, October 03, 2020 bao gồm kỹ tht gợi ý khơng cá nhân hóa (Non-personalized) kỹ thuêt gợi ý cá Google & Temasek (2018) Bỏo cỏoReport e-Conomy nhõn húa hiu quõ nhỵ: gi ý dăa nội dung (Content-based filtering), lọc cộng tác (User- SEA 2018, Retrieved from based, Item-based) Qua ũ, ngỵi c hiu ỵc nn tâng lý thuyết hệ gợi ý, điểm mänh, điểm https://www.thinkwithgoogle.com/_qs/documents/ yu cỷa cỏc h gi ý cỹng nhỵ quy trỡnh xồy dng mt ng dýng thỵng in t cú tớch 6730/Report_e-Conomy_SEA_2018_by_Google_ hp cỏc phỵng phỏp gi ý thăc tế Temasek_v.pdf on March 20, 2020 Hỵng nghiờn cu tỵng lai cỷa lïnh văc rộng mć, đặc biệt kỹ Ionos (2017) Recommendation systems in e- thuêt gợi ý cá nhân hóa Chúng tơi tiếp týc commerce US: IONOS Inc Retrieved from nghiên cĀu, câi tiến Āng dýng thuêt toán gợi https://www.ionos.com/digitalguide/online-mark ý lïnh văc e-commerce, lïnh văc eting/online-sales/how-to-use-recommendation- e-learning tr giỳp ngỵi dựng quỏ systems-in-e-commerce on May 15, 2020 trình mua hàng, tỡm kim ti liu cỹng nhỵ h tr quỏ trỡnh học têp trăc tuyến Jordan T (2016) New insight from Experian Marketing Services helps brands prepare for the LỜI CẢM ƠN holiday season https://www.experianplc.com Chúng câm Ąn Khoa Công nghệ thông Khusro S., Ali Z & Ullah I (2016) Recommender tin, Học viện Nông nghiệp Việt Nam täo systems: issues, challenges, and research điều kin tt nhỗt chỳng tụi thc hin opportunities In Information Science and nghiên cĀu Applications (ICISA) 2016 Springer In Information Science and Applications (ICISA) Lei Tang, Zongtao Duan, Yishui Zhu, Junchi Ma & Zihang Liu (2019) Recommendation for Ridesharing Groups Through Destination Prediction on Trajectory Data IEEE Transactions on Intelligent Transportation Systems 99: 14 Mohamed M.H., Khafagy M.H & Ibrahim M.H (2019) Recommender Systems Challenges and Solutions survey International Conference on Innovative Trends in Computer Engineering (ITCE) Nguyễn Hùng Dũng & Nguyễn Thái Nghe (2013) Hệ thống gợi ý sản phẩm bán hàng trực tuyến sử dụng kỹ thuật lọc cộng tác Tạp chí Khoa học, Trường Đại học Cần Thơ 31: 15 Nguyễn Thanh Hưng (2019) Báo cáo số thương mại điện tử 2019 Hiệp hội thương mại điện tử Việt Nam Reichheld & F.F (1993) Loyalty-based management Harvard business review 71(2): 64-73 533 Một số phương pháp gợi ý ứng dụng thương mại điện tử Schafer Ben J., Joseph Konstan & John Riedl (2001) International Conference Proceeding Series ACM E-commence Recommendation Applications press New York, USA Data Mining and Knowledge Discovery 5(1-2): 115-153 Trademark Notice (2003) Epinions dataset Retrieved from http://www.trustlet.org/epinions.html on Sharma L & Gera A (2013) A survey of October 03, 2020 recommendation system: Research challenges International Journal of Engineering Trends and University of Freiburg (2004) BookCrossing, Technology (IJETT) 4(5): 1989-1992 Retrieved from http://www2.informatik.uni- freiburg.de/~cziegler/BX/ on October 03, 2020 Singh P (2019) A Survey of Recommendation Systems in Electronic Commerce Apress, Viễn Thông (2020) Thương mại điện tử Việt Nam Berkeley, CA pp 123-157 2020 sao? Truy cập từ https://vnexpress.net/kinh-doanh/thuong-mai-dien- Stephan S (2019) Personalized Product tu-viet-nam-2020-se-ra-sao-4045309.html, ngày10 Recommendation Tips and Stats Retrieved tháng năm 2020 fromhttps://www.barilliance.com/personalized- product-recommendations-stats/ on Feb 25, 2020 Xue A.Y., Qi J., Xie X., Zhang R., Huang J & Li Y (2015) Solving the data sparsity problem in Thomas T (2006) Designing recommender systems destination prediction The VLDB Journal for e-commerce: an integration approach ACM 24(2): 219-243 534

Ngày đăng: 29/02/2024, 13:26

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN