Bài viết đưa ra quy trình chung để xây dựng hệ gợi ý trong các website thương mại và thực hiện tích hợp các kỹ thuật hệ gợi ý trong website thương mại điện tử khắc phục vấn đề người dùng mới, sản phẩm mới (vấn đề này còn gọi là “Cold start problem”) của các phương pháp gợi ý cá nhân hóa.
Vietnam J Agri Sci 2021, Vol 19, No 4: 520-534 Tạp chí Khoa học Nơng nghiệp Việt Nam 2021, 19(4): 520-534 www.vnua.edu.vn MỘT SỐ PHƯƠNG PHÁP GỢI Ý VÀ ỨNG DỤNG TRONG THƯƠNG MẠI ĐIỆN TỬ Hồng Thị Hà1*, Ngơ Nguyễn Thức2 Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam Sinh viên K57 - Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam * Tác giả liên hệ: htha@vnua.edu.vn Ngày nhận bài: 20.07.2020 Ngày chấp nhận đăng: 29.03.2020 TÓM TẮT Hệ gợi ý (Recommender System) công cụ thiết kế nhằm cung cấp khuyến nghị hữu ích sản phẩm, dịch vụ,…cho người dùng Hệ gợi ý dựa liệu mối quan hệ người dùng, sản phẩm hành vi người dùng khứ sản phẩm để đưa gợi ý thông minh, phù hợp với sở thích khách hàng Hệ gợi ý giúp khách hàng nhanh chóng định vị sản phẩm họ quan tâm để từ đưa định đắn mua sắm online Trong báo này, chúng tơi trình bày tổng quan số phương pháp gợi ý, đánh giá điểm mạnh, điểm yếu, so sánh hiệu thực phương pháp Chúng tơi lợi ích mà hệ gợi ý mang lại cho thương mại điện tử, đồng thời nêu thách thức giải pháp khắc phục Kết thực nghiệm tập liệu chuẩn (Movielens, Epinions, BookCrossing, LastFM) cho thấy phương pháp có ưu điểm hạn chế riêng, khơng có phương pháp tốt tất tiêu chí Ngồi ra, chúng tơi đưa quy trình chung để xây dựng hệ gợi ý website thương mại thực tích hợp kỹ thuật hệ gợi ý website thương mại điện tử khắc phục vấn đề người dùng mới, sản phẩm (vấn đề gọi “Cold start problem”) phương pháp gợi ý cá nhân hóa Từ khóa: Hệ gợi ý, lọc cộng tác, gợi ý dựa nội dung, hệ gợi ý kết hợp, thương mại điện tử Some Methods of Recommender System and its Application in E-Commerce ABSTRACT The designed recommender system is a tool to provide important suggestions forusers or customers Based on the datasets of user relationships, products, andprevious behavior of consumers, smart recommendations for the preferences of eachconsumer are given, which helps consumers tomake good decisions while shopping online In this article, we present an overview of some methodologies of recommendation systems, techniques of recommender systems, and evaluate the strengths and weaknesses of each technique, as well as comparedsome benefits of recommender systems in e-commerce Moreover, we report some challenges that the recommender systems are facing and list some solutions to solve these challenges Our experimental results on the four datasets (Movielens100k, Epinions,BookCrossing, LastFM) showed that there was no best recommendation algorithm in all evaluation metrics Finally, we built an e-commerce website that integrated some different techniques of recommender systems such as non-personalized methods, personalized methods to recommend the right product for each customer The experimental system gives some diverse suggestions to overcome the problem "Cold start problem" of personalized methods Keywords: Recommender systems, collaborative filtering, content-based filtering, hyper filtering, E-Commerce ĐẶT VẤN ĐỀ Trong nhĂng nëm gæn đåy, vĆi să phổ biến cûa mäng Internet v mỏy tớnh, thỵng in t ó phỏt trin nhanh chúng trờn phọm vi ton cổu Thỵng in tā thay 520 đổi hình thĀc giao dðch truyền thng Ngy cng cú nhiu ngỵi la chn hỡnh thc mua sím trăc tuyến Trong đị, để mć rộng th trỵng kinh doanh, cỏc doanh nghip ó xồy dng ng dýng thỵng in t v cung cỗp rỗt nhiều sân phèm website Tuy nhiên, thông tin Hồng Thị Hà, Ngơ Nguyễn Thức q nhiều, khách hàng tốn thąi gian để tìm sân phèm họ cỉn Điều này, làm giâm să hài lòng să trung thnh cỷa khỏch giõi quyt vỗn ny, ý tỵng chớnh cỷa cỏc chuyờn gia thỵng in t thiết lêp hệ thống gợi ý thơng minh nhìm khỏm phỏ cỏc mt hng phự hp nhỗt cho tng ngỵi dựng Vi h thng gi ý t ng, khỏch hng cú th nhanh chúng truy cờp ỵc sõn phèm hợp vĆi sć thích nhu cỉu cûa họ, tit kim thi gian tỡm sõn phốm cho ngỵi dựng (Thomas, 2006) NhĂng nëm gæn đåy, kỹ thuêt hệ gi ó v ang ỵc nghiờn cu, ng dýng nhiu lùnh vc Trong thỵng in t, h gi ý mang lọi nhiu li ớch cho cõ ngỵi cung cỗp dch vý v ngỵi s dýng dch vý (Ionos, 2017) Hổu ht cỏc cụng ty thỵng ln nhỵ: Amazon (Amazon.com), CDNOW (www.cdnow.com), eBay (eBay.com), Alibaba (Alibaba.com), MovieFinder (MovieFinder.com), Youtube.com, Facebook.com,„ sā dýng kỹ thuêt gợi ý website cûa họ để nâng cao trâi nghiệm cho khỏch hng, nõng cao chỗt lỵng dch vý v tởng doanh thu bán hàng Tuy nhiên, ć Việt Nam - mt quc gia cú rỗt nhiu tim nởng v thỵng in t (Vin Thụng, 2020) lọi cú s lỵng website thỵng tớch hp h gi ý khụng nhiu (Nguyễn Hùng Düng & Nguyễn Thái Nghe, 2013) Hiện Việt Nam cò 44% doanh nghiệp tham gia xåy dng website thỵng mọi, nhỵng chợ cú 32% doanh nghip ỵc ỏnh giỏ cao kờnh bỏn hng thụng qua trang web (Nguyn Thanh Hỵng, 2019) Bi bỏo ny trỡnh by tng quan cỏc phỵng phỏp gi ý, ỏnh giỏ hiu quâ cûa thuêt toán gợi ý (Content-based, user-based item-based) số têp dĂ liệu chuèn bao gồm: Movielens, Epinions, BookCrossing LastFM Chúng thâo luên nhĂng im mọnh, im yu cỷa mi phỵng phỏp, thỏch thc giâi pháp khíc phýc xây dăng hệ gợi ý thỵng in t ng thi, chỳng tụi ỵa quy trỡnh xồy dng h gi ý cỏc website thỵng v thc hin ci t cỏc k thuờt h gi ý website thỵng in t Kt quõ ci t cho thỗy, website ỵc tớch hp cỏc phỵng phỏp h gi ý h thng s t ng ỵa nhng gi ý thụng minh, a dọng ti ngỵi dựng CC K THUT H GI í Cỏc k thuờt h gi ý thỵng ỵc chia thành hai nhóm là: hệ gợi ý cá nhân hóa hệ gợi ý khơng cá nhân hóa Chỳng tụi tờp trung gii thiu túm tớt phỵng phỏp gợi ý khơng cá nhân hóa số tht toỏn gi ý cỏ nhõn húa tiờu biu thỵng ỵc s dýng cỏc trang thỵng in t 2.1 Hệ gợi ý khơng cá nhân hóa (nonpersonalized recommender systems ) L nhũm phỵng phỏp khụng da vo h s cá nhân tÿng khách hàng mà chỵ dăa vào đặc tính cûa sân phèm (sân phèm mĆi) đánh giá t cng ng nhỵ: sõn phốm bỏn chọy nhỗt, sõn phốm ỵc ỏnh giỏ tt nhỗt, (Singh, 2019) 2.2 H gi ý cỏ nhõn húa (personalized recommender systems) Nhũm phỵng phỏp ny ỵc ỏnh giỏ l mang lọi hiu quõ cao i vi thỵng in t Nu doanh nghip hiểu rõ tÿng khách hàng cûa dăa nhĂng gỡ h tỵng tỏc v mua hng trờn mọng, doanh nghip cú th tỵ vỗn cho khỏch hng nhng sõn phèm phù hợp vĆi mong muốn sć thích cûa khách hĄn (Google & Temasek, 2018) Khách hàng tiết kim ỵc thi gian tỡm kim sõn phốm, mua ỵc nhĂng mịn hàng sć thích Tÿ đị, doanh nghiệp s tởng ỵc s lỵng ngỵi mua hng, tởng giỏ trð đĄn hàng, tëng doanh số bán hàng Theo nghiên cĀu cûa Schafer & cs (2001), doanh nghiệp sā dýng phỵng phỏp gi ý cỏ nhõn hũa gi email tĆi khách hàng tỷ lệ giao dðch thơng qua email cao hn gỗp hai lổn so vi cỏc email ỵc gi khụng ỏp dýng phỵng phỏp ny (Stephan, 2019) Do ũ, cỏc phỵng phỏp gi ý cỏ nhồn hũa lm tởng mc tỵng tỏc v chuyn i giao dch thỵng in t Mt s phỵng phỏp gi ý thuc loọi cỏ nhõn húa nhỵ sau: 521 Một số phương pháp gợi ý ứng dụng thng mi in t Filtering - CF) ngỵi dựng ũ kt hp quan im cỷa nhng ngỵi dựng khỏc ồy l k thuờt mọnh v ó ỵc ỏp dýng khỏ thnh cụng cỏc h thng thỵng ln Lc cng tỏc thu thờp phõn hi t nhiu ngỵi dựng i vi sõn phốm, lỵu tr phõn hi cỷa ngỵi dựng dỵi dọng ma trờn ngỵi dựng (users) - sân phèm (items) Mỗi dòng vectĄ chĀa giá tr phõn hi cỷa ngỵi dựng i vi cỏc sõn phốm Sau ũ, tớnh tỵng t gia cỏc users giĂa items hệ thống, tìm mối tỵng quan v ỵa gi ý phự hp tỵng t gia cỏc user hoc gia cỏc item ỵc tính theo cơng thĀc Cosin Pearson Lọc cộng tác gi ý sõn phốm ti ngỵi dựng da trờn lch s tỵng tỏc sõn phốm cỷa chớnh Bõng l ma trờn biu din ỏnh giỏ cỷa ngỵi dựng trờn sân phèm 2.2.1 Gợi ý dựa nội dung (Contentbased filtering) Phỵng phỏp gi ý ny da trờn mụ tõ cỷa sõn phốm v profile cỷa tng ngỵi dựng (khụng quan tồm n ngỵi dựng khỏc) Gi trờn ni dung s thu thờp h s cỷa ngỵi dựng: h tờn, gii tớnh, ngh nghip v tỵng tỏc cỷa cỏ nhồn ngỵi dựng trờn cỏc sõn phốm, sau đò so sánh đặc điểm sân phèm cĄ sć dĂ liệu vĆi đặc điểm sân phèm mà khách hàng quan tåm để gợi ý cho khách hàng 2.2.2 Lọc cộng tác (Collaborative Hình Mơ hình hệ gợi ý dựa nội dung Bâng Ma trận biểu diễn người dùng - sân phẩm tiếp cận lọc cộng tác 522 Hồng Thị Hà, Ngơ Nguyn Thc Cũ hai phỵng phỏp lc cng tỏc: User-based: D oỏn da trờn s tỵng t gia cỏc users í tỵng quan trng cỷa phỵng phỏp ny l nhng khỏch hng tỵng t cú xu hỵng s dýng nhng sõn phốm tỵng t (Singh & Pramod, 2019) Nu hai khách hàng A, B có lðch sā đánh giá sõn phốm tỵng t thỡ User-baseds d oỏn khỏch hàng A có khâ nëng quan tâm tĆi nhĂng sõn phốm chỵa ỵc trõi nghim nhỵng ó ỵc khỏch hng B thớch v ngỵc lọi Phỵng phỏp ny phõn tớch ma trờn user-item tỡm nhng ngỵi dựng tỵng t Item-based : D oỏn da trờn s tỵng tă giĂa items Hai sân phèm i i’ ó ỵc cng ng ỏnh giỏ tỵng t thỡ cú th s ỵc ỏnh giỏ tỵng t bi nhng ngỵi dựng cũn lọi Phỵng phỏp ny phồn tớch ma trờn user-item nhờn din cỏc sõn phốm tỵng t Ngy nay, k thuờt lc cng tỏc ỵc s dýng khỏ ph bin trờn cỏc trang thỵng in t ln nhỵ Amazon, Tiki, Youtube v Facebook 2.2.3 Phng (hybrid method) phỏp kt hp Phỵng phỏp ny kt hp gia kỹ thuêt gợi ý dăa nội dung lọc cng tỏc K thuờt ny ỵc xem l khỏ hiu quõ v giõi quyt ỵc vỗn cold - start problem rỗt nhiu nghiờn cu Trang thỵng in t in hỡnh ó ng dýng phỵng phỏp ny l Spotify.com H ó tớch hp phỵng phỏp h gi ý tổng hợp để täo danh sách hát hàng tuæn cho tÿng khách hàng riêng biệt Website tng hp d liu ngỵi dựng da trờn thúi quen nghe nhọc v nhng ngỵi dựng tỵng t tọo danh sách hát độc đáo phù hợp vĆi sć thích cûa tÿng khách hàng 2.3 Mục tiêu phương pháp gợi ý Mýc tiêu cûa cỏc phỵng phỏp gi ý ỵc th hin bõng Hình 2.Tiến trình lọc cộng tác Hình Lọc cộng tác dựa User-based Item-based 523 Một số phương pháp gợi ý ứng dụng thương mại điện tử Hình Mơ hình hệ gợi ý kết hợp Bâng Mục tiêu khái niệm phương pháp gợi ý Phương pháp (Methods) Mục tiêu (concept goals) Đầu vào (Inputs) Gợi ý khơng cá nhân hóa (Non-personalized recommender systems) Gợi ý sản phẩm mà người dùng thích dựa sản phẩm ý kiến cộng đồng Lọc dựa nội dung (Content-based filtering) Gợi ý sản phẩm khách hàng thích dựa hồ sơ cá nhân người dùng độ tương tự sản phẩm sở liệu với sản phẩm mà khách hàng thích khứ Thuộc tính (item attributes) sản phẩm Profiles người dùng Lọc cộng tác (Collaborative Filtering) Gợi ý sản phẩm mà người dùng thích dựa người dùng có sở thích tương tự Đánh giá User + Đánh giá cộng đồng Phương pháp kết hợp (Hybrid method) Gợi ý sản phẩm mà người dùng thích dựa việc kết hợp Content-based filtering Collaborative Filtering Thuộc tính sản phẩm+ đánh giá Users cộng đồng VAI TRÒ CỦA HỆ GỢI Ý TRONG THƯƠNG MI IN T Trong thỵng in t, h gi ý ũng vai trủ nhỵ mt chuyờn gia thụng minh hỗ trợ khách hàng trình tìm chọn mua sõn phốm H gi ý thỳc ốy thỵng điện tā (Schafer & cs., 2001) theo cách sau: - Chuyn khỏch vóng lai thnh ngỵi mua hng (Converting Browsers into Buyers): Khỏch vóng lai thỵng ghộ thởm website để xem trang web mà không mua hàng Các hệ thống gợi ý hiểu nhu cæu cûa khách, hiển thð nhĂng sân phèm mà khách thích, muốn tìm mua Bìng cách này, hệ thống chuyển nhĂng khỏch vóng lai thnh khỏch mua hng - Tởng cỵng bán chéo (Increasing Crosssell): Các hệ thống gợi ý câi thin bỏn chộo bỡng cỏch xuỗt cỏc mt hng liên quan đến sân phèm, sân phèm phý kiện bổ sung cho khách mua hàng 524 - Xây dăng lũng trung thnh (Building Loyalty): Trong chin lỵc kinh doanh, vic ọt ỵc lũng trung thnh cỷa ngỵi tiờu dựng điều cỉn thiết Khi lịng trung thành cûa khách hàng tëng lên, lợi nhuên cüng tëng lên (Reichheld & F., 1993) Các hệ thống gợi ý câi tiếnlịng trung thành bìng cách tìm hiểu, thu thêp thơng tin, nhu cỉu, sć thích mối quan tâm cûa khách Tÿ đị, sā dýng tht tốn thơng minh cá nhån hòa để gợi ý phù hợp chotÿng khách hàng, giúp họ hài lịng, có niềm tin quay läi trang web để mua hàng VĆi nhĂng khâ nëng trên, hệ gợi ý mang läi trâi nghiệm tốt cho khách hàng, giúp khách hàng giâm thąi gian tìm kiếm sân phèm, nâng cao tỷ lệ chuyển đổi mua hàng, câi thiện việc bó gió hàng giĂ khách quay trć läi mua hàng Tÿ đò, hệ gợi ý giúp cỏc thỵng nhồn tởng giỏ tr n hng trung bỡnh, tëng doanh thu bán hàng (Dias & cs., 2008; Jordan, 2016; Stephan, 2019) Hồng Thị Hà, Ngơ Nguyễn Thức THÁCH THỨC CỦA HỆ GỢI Ý TRONG THƯƠNG MẠI ĐIỆN TỬ VÀ GIẢI PHÁP KHẮC PHỤC 4.1 Vấn đề khách hàng mới, sân phẩm (Cold-startproblem) Một nhĂng thách thc i vi bỗt k h thng gi ý no l vỗn ngỵi dựng mi (new user) hoc sõn phốm mi (new item) H s cỷa ngỵi dựng rng v h chỵa xp họng bỗt k sõn phốm no Vì vêy, giâi tht gợi ý khơng thể hiểu ỵc khỏch hng v khụng d oỏn ỵc s thớch, nhu cổu cỷa h (Sharma & Gera, 2013) Vỗn ny gi l Cold start problem v cú th ỵc giâi bìng cách sā dýng hệ gợi ý khơng cá nhån hòa để gợi ý nhĂng sân phèm mĆi, nhng sõn phốm bỏn chọy, nhng sõn phốm ỵc nhiu ngỵi ỏnh giỏ cao, (Schafer & cs., 2007; Mohamed & cs., 2019) 4.2 Vấn đề khâ mở rộng v hiu sut thi gian thc Khi lỵng d liu ngày lĆn dæn lên, làm để hệ gợi ý làm việc hiệu quâ mối quan tâm cûa nhà khoa học cûa doanh nhõn s dýng h thng thỵng in t Vi website lĆn, hệ thống phâi täo gợi ý vñng đĄn vð giây phýc vý hàng trởm hoc hng ngn ngỵi tiờu dựng cựng mt lỳc S lỵng yờu cổu gi ý ng thi ngy cng ln, s lỵng sõn phốm ngy cng tởng, hnh vi tỵng tỏc cỷa ngỵi dựng trờn cỏc sõn phốm ngy cng nhiu Hin tọi, giõi quyt phổn no vỗn ny ngoi vic ổu tỵ ln hn cho cỏc hệ thống tính tốn mänh cỉn phâi áp dýng thêm thuêt toán giâm chiều, xā lý song song đặc biệt nên chäy tht tốn offline để gợi ý online nhanh hĄn (Khusro & cs., 2016) Tuy nhiờn, ồy l vỗn khú v ang l thách thĀc cûa hệ thống gợi ý 4.3 Vấn đề thưa thớt liệu đánh giá (Sparsity) Một thách thĀc nĂa đối vĆi hệ gợi ý täi cỏc trang thỵng in t l s thỵa tht v d liu khỏch hng ỏnh giỏ sõn phốm Rỗt nhiu website, lỵng khỏch hng ỏnh giỏ trờnsõn phốm rỗt ớt, nờn cỏc thuờt toỏn gi ý khũ oỏn ỵc s thớch cỷa ngỵi dựng ồy cỹng l mt vỗn đề lĆn cûa hệ gợi ý (Sharma & Gera, 2013) Bći dĂ liệu phâi đû lĆn thuêt toán gợi ý mĆi có nhĂng gợi ý xác Các nhà khoa học cố gíng nghiên cĀu lm giõm vỗn ny, nhỵng hin vộn cũn l mt bi toỏn khú cổn ỵc nghiờn cu nhiu hn Dỵi ồy l mt s giõi phỏp ỵc xuỗt (Khusro & cs., 2016): Giõi phỏp 1: S dýng mơ hình gợi ý đa chiều (Adomavicius & cs., 2005) sā dýng kỹ thuêt hiệu quâ giâi bi toỏn d oỏn i vi ma trờn thỵa nhỵ giâi pháp cûa Xue & cs (2015), giâi pháp cûa Lei & cs (2019) Giâi pháp 2: Dăa nhĂng phõn hi tim ốn cỷa ngỵi dựng (implicit feedback) nhỵ: lðch sā xem hàng, mua hàng„ để bổ sung dĂ liu vo ma trờn ngỵi dựng - sõn phốm nhỡm họn ch mc thỵa cỷa ma trờn ớt ngỵi dùng đánh giá Giâi pháp 3: Chia sẻ thông tin ngỵi dựng gia cỏc trang web khụng cú cọnh tranh, đặc biệt khai thác thêm dĂ liệu tÿ cỏc trang mọng xó hi Thụng tin ngỵi dựng cng nhiều, đỉy đû giúp tht tốn gợi ý hiu khỏch hng hn v tỵ vỗn chớnh xỏc hn Lỵu ý, cỏc bờn chia s d liu ngỵi dựng phõi cam kt chợ dựng d liu ỵc chia s phýc vý tỵ vỗn tt hn v cú trỏch nhim bõo v thụng tin ngỵi dựng ĐÁNH GIÁ CÁC PHƯƠNG PHÁP GỢI Ý 5.1 Điểm mänh điểm yếu phương pháp hệ gợi ý Bâng kết luên cûa nhĂng þu điểm hän chế cûa phþĄng pháp hệ gợi ý 5.2 Đánh giá độ xác phương pháp gợi ý 5.2.1 Dữ liệu thực nghiệm Chúng đánh giá hiệu quâ thăc cûa thuêt toỏn content-based, user-based, item based ó ỵc gii thiu bìng cách chäy thā nghiệm têp dĂ liệu chuèn: Movielens 525 Một số phương pháp gợi ý ứng dụng thương mại điện tử (GroupLens, 1998), Epinions (Trademark Notice, 2003), BookCrossing (University of Freiburg, 2004), LastFM (GroupLens, 2011) 5.2.2 Phương pháp đánh giá môi trường thử nghiệm a Phương pháp đánh giá Chúng chia tờp d liu lm phổn, lỗy ngộu nhiờn 70% têp dĂ liệu để training 30% dĂ liệu cịn läi để testing Chúng tơi thăc lỉn lặp têp dĂ liệu.Độ đo NRMSE (Normalized Root Mean Square Error) v thi gian thc hin (time) ỵc sā dýng để đánh giá hiệu quâ cûa thuêt toán Độ đo NRMSE dùng để xác đðnh sai s chuốn húa cỷa cỏc thuờt toỏn v ỵc xác đðnh bìng cơng thĀc: NRMSE RMSE Rating max Rating Trong đò: RMSE n pi ri n vĆi n số quan sát, pi giá trð dă đoán đánh giá cûa sân phèm i ri giá trð đánh giá thăc tế cûa sân phèm i Ratingmax, Ratingmin lổn lỵt l im ln nhỗt v nhú nhỗt cho phộp ngỵi dựng ỏnh giỏ b Mụi trng th nghim Mụi trỵng ỵc s dýng th nghim l mỏy tính Intel(R) Corei5-6300U, CPU @ 2.5GHz, RAM 8GB ngơn ngĂ Python hệ điều hành Microsoft Window 10 Bâng Điểm mänh điểm yếu phương pháp gợi ý STT Phương pháp Gợi ý không cá nhân hóa (Non-personalized recommender systems) Đơn giản Lọc dựa nội dung (Content-based filtering) Hệ thống không sử dụng liệu người dùng khác mà gợi ý sản phẩm phù hợp với sở thích khác hhàng riêng biệt Điểm mạnh Gợi ý không phụ thuộc vào liệu khách hàng hệ thống nên áp dụng cho khách hàng, giúp tăng hội chuyển đổi khách hàng Có khả gợi ý sản phẩm cho người dùng Điểm yếu Gợi ý chung chung, khơng cá nhân hóa đến khách hàng Vì khách có kết gợi ý giống Hệ thống phải phân tích dị tìm tất đặc trưng sản phẩm để tạo danh sách gợi ý, nên chậm hồ sơ sản phẩm khơng dẫn đến gợi ý sai Không thể gợi ý khách hàng khơng có lịch sử đánh giá xem/thích sản phẩm hệ thống.Với khách hàng mới, hệ thống cung cấp gợi ý phù hợp Khơng gợi ý thêm sở thích khách Lọc cộng tác (Collaborative Filtering) Hệ thống không cần sử dụng đến hồ sơ nhân học người dùng để gợi ý sản phẩm Có khả dự đốn sở thích nhu cầu người dùng mà không cần hiểu sản phẩm Có thể gợi ý tới người dùng sản phẩm bên ngồi sở thích có Nhữngnhững sản phẩm phù hợp sở thích họ 526 Phương pháp tổng hợp (Hybrid method) Kết hợp tất ưu điểm phương pháp Content-based filtering Collaborative Filtering Không thể gợi ý khách hàng chưa tương tác với mặt hàng Không thể gợi ý sản phẩm sản phẩm chưa đánh giá Khi lượng sản phẩm lớn số lượng khách hàng đánh giá khơng nhiều phương pháp khơng hiệu Không thể gợi ý cho người dùng Khi lượng sản phẩm lớn số lượng khách hàng đánh giá khơng nhiều phương pháp khơng hiệu Hồng Thị Hà, Ngơ Nguyễn Thức Bâng Thơng tin tập liệu thử nghiệm Datasets #Items #Users # Rating Range Rating Mô tả Movielens 100K 1,700 1,000 100,000 1÷5 Chứa đánh giá người dùng các phim Mỗi phim có đặc trưng (id, title, realise date, type, rating, time ) Epinion 138,738 49,290 139,738 1÷5 Chứa quan điểm người dùng sản phẩm thương mại BookCrossing 271,379 278,858 1,149,780 1÷10 Chứa đánh giá người dùng sách LastFM 17,632 1,892 92,834 Số lần hát bật users Chứa danh sách top hát người dùng nghe nhiều (2100 users and 18,745) 5.2.3 Kết quõ th nghim Kt quõ bõng cho thỗy, tht tốn Content - based có thąi gian chäy nhanh hn User-based v Item-based, nhỵng chớnh xỏc khụng cao GiĂa thuêt toán User-based Item-based, xét sai số cûa dă đốn thìtiếp cên lọc cộng tác dăa trờn sõn phốm (Item-based) cho sai s thỗp hn (hay cho độ xác cao hĄn) tiếp cên lọc cộng tỏc da trờnngỵi dựng (User - based) vi t l 3/4 têp dĂ liệu Tuy nhiên, xét thąi gian thc hin thỡ phỵng phỏp lc cng tỏc da trờn ngỵi dựng thc hin nhanh hn nhiu so vi phỵng pháp lọc cộng tác dăa sân phèm câ giai oọn huỗn luyn (training) v giai oọn kim th (testing) ć câ têp dĂ liệu Do đò, cò thể núi phỵng phỏp lc cng tỏc da trờn User - based có khâ nëng mć rộng (scability) tốt hĄn phỵng phỏp Item - based Vỡ vờy, khú cú thuờt toỏn no l tt nhỗt trờn mi tiờu Tựy theo mýc đích gợi ý Āng dýng thăc tế chn phỵng phỏp gi ý phự hp TCH HỢP HỆ GỢI Ý TRONG HỆ THỐNG BÁN HÀNG TRỰC TUYẾN Để thā nghiệm trăc quan hệ gợi ý Āng dýng thỵng in t, chỳng tụi tin hnh xây dăng hệ thống bán sách trăc tuyến tích hợp vĆi tht tốn gợi ý trình bày ć Hệ thống sā dýng tht tốn gợi ý khơng cá nhån hòa để hiển thð sân phèm mĆi, sõn phốm bỏn chọy nhỗt, sõn phốm ỵc ỵa thớch nhỗt c bit, h thng tớch hp mt s k thuờt gi ý cỏ nhồn hũa nhỵ: phỵng phỏp gi trờn ni dung, phỵng phỏp gi ý lc cộng tác để thông báo cho khách hàng nhĂng sân phèm họ thích, hỗ trợ khách hàng trình tìm mua sân phèm 6.1 Tổng quan cách tiếp cận Cách tiếp cên tổng quan cûa chúng tụi ỵc th hin hỡnh 6.2 Lung x lý hệ thống Luồng xā lý h thng ỵc th hin hỡnh Giõi thớch: Hệ thống kiểm tra xem khách hàng cò đëng nhêp hay khơng Nếu khách hàng cị đëng nhêp, hệ thống kiểm tra xem khách hàng cò độ tỵngt vi ngỵi khỏc hay chỵa, nu cú thỡ s sā dýng mơ hình lọc cộng tác để hiển thð thụng tin gi ý, ngỵc lọi h thng s kim tra xem khách hàng có thơng tin cá nhân để đðnh lăa chọn mơ hình nhân khèu học khụng cỏ nhồn ỵa gi ý cho khỏch hng Trỵng hp gi trờn mụ hỡnh khụng cỏ nhõn thỡ s ỵa nhng sõn phốm mi, sõn phốm bỏn chọy, sõn phốm ỵc nhiu khỏch hng quan tõm Trong trỵng hp khỏch hng khụng ởng nhờp, hệ thống kiểm tra lðch sā khách hàng tÿng truy cêp vào trang web dăa vào IP máy tớnh m khỏch hng truy cờp, h thng s lỵu vết läi lðch sā q trình truy cêp Nếu có thơng tin dăa theo đða chỵ IP, hệ thống ỵa gi ý v nhng sõn phốm m khỏch hàng tÿng xem 527 Một số phương pháp gợi ý ứng dụng thương mại điện tử Bâng Sai số dự đoán thời gian thực trung bình lần chäy phương pháp lọc cộng tác Dataset Movielens (100K) Epinion BookCrossing LastFM Thuật toán NRMSE Thời gian(sec) Training testing Content - based 0,317 0,093 0,027 User - based 0,280 1,126 3,107 Item - based 0,288 0,147 7,793 User - based 0,285 6,515 158,91 Item - based 0,254 7,518 3869,7 User - based 0,248 9,126 171,73 Item - based 0,282 20,142 4030,5 User - based 0,0131 4,313 165,398 Item - based 0,0103 39,326 4431,387 Ghi chú: giá trị tốt tiêu chí tập liệu tô đậm Thông tin Users (products cataluge) Recommender System Thông tin sản phẩm (products cataluge) (peocduct (Peocduct Tương tác User-item (User product interactions) (products cataluge) Danh sách sản phẩm gợi ý cho khách Hình Tổng quan cách tiếp cận 6.3 Tiến trình gợi ý hệ thống website thương mäi sân phèm mĆi, sân phèm bán chäy, sân phèm ỵc nhiu ngỵi ỏnh giỏ Tin trỡnh gi ý sõn phốm h thng thỵng in t ỵc th hình - Nhóm 2: Sā dýng nhóm tht tốn cá nhån hịa trình bày ć mýc 2.2 để gợi ý cho khách hàng: thuêt toán nhân khèu học, thuêt toán gợi ý dăa nội dung (content - based), thuêt toán lọc cộng tác (Collaborative filtering) để đoán sân phèm phù hợp vĆi khách hàng Tiến trình bao gồm giai độn: Giai độn 1: Thu thờp thụng tin ngỵi dựng cú th d oỏn ỵc s thớch cỷa ngỵi dựng, h thng phõi hc mt mụ hỡnh ngỵi dựng (User model) Mụ hỡnh ngỵi dựng m chỳng tụi thu thờp l cỏc d liu cỷa ngỵi dựng nhỵ: thụng tin cỏ nhồn, thụng tin lch s tỵng tỏc cỷa ngỵi dựng trờn sân phèm Giai đoän 3: Gợi ý: Giai đoän này, cën cĀ vào tÿng đặc điểm cûa khách hàng, hệ thống dă đoán gợi ý nhĂng sân phèm mà khách hàng thích Giai độn 2: Sā dýng tht tốn gợi ý: Giai độn này, chúng tụi s dýng d liu thu thờp ỵc giai đoän dĂ liệu sân phèm để chäy nhóm tht tốn: 6.4 Một số giao diện kết q ứng với - Nhóm 1: Sā dýng tht tốn gợi ý khơng cá nhân hóa (Non - personalized) để gi ý cỏc Giao din ỏnh giỏ sõn phốm ỵc thể hình 528 giai độn gợi ý hệ thống 6.4.1 Trang đánh giá sản phẩm Hồng Thị Hà, Ngơ Nguyễn Thức Hình Luồng xử lý hệ thống Thu thập thơng tin (Information collection) Phản hồi (Feedback) Học (Learning) Dự đoán/Gợi ý (Recommender System) Hình Tiến trình gợi ý hệ thống 6.4.2 Một số trang huấn luyện mơ hình - Trang thng kờ ỏnh giỏ sõn phốm cỷa ngỵi dựng ỵc th hin hỡnh hỡnh - Trang o lỵng tỵng t gia cỏc ngỵi dựng ỵc th hin hình 10 6.4.3 Các kết gợi ý sản phẩm a Đối với khách hàng Nếu khách hng mi (khỏch hng chỵa ỏnh giỏ bỗt k sõn phèm nào), họ tìm kiếm sân phèm, hệ thống hiển thð danh sách nhĂng sân phèm mĆi v nhng sõn phốm tỵng t m nhiu ngỵi quan tåm để gợi ý cho khách hàng b Đối với khách hàng thành viên Nếu khách hàng thành viên cûa hệ thống, tÿng cò đánh giá sân phèm, website gợi ý nhĂng sân phèm mĆi, sân phèm nhiều ngỵi quan tõm, sõn phốm tỵng t Ngoi ra, h thng cũn da vo tỵng t gia cỏc ngỵi 529 Một số phương pháp gợi ý ứng dụng thương mại điện tử dùng để hiển thð nhĂng sõn phốm m khỏch hng chỵa ỵc trõi nghim nhỵng ó ỵc cỏc khỏch hng tỵng t khỏc ỏnh giỏ cao - Trang gi ý nhng sõn phốm ngỵi dựng cú th thớch ỵc th hin hỡnh 12 - Trang hiển thð nhĂng sân phèm khách hàng xem hoc ó mua ỵc th hin hỡnh 13 - Trang gi ý sõn phốm cú th ỵc mua cựng ỵc th hin hỡnh 14 Nhỵ vờy, bỡng vic xõy dng mt ng dýng thỵng in t cú tớch hp a dọng cỏc phỵng phỏp h gi ý, website ó t ng ỵa cho khỏch hng gợi ý thông minh, đa däng, trăc quan, phù hợp vĆi tÿng cá nhân khách hàng khớc phýc ỵc vỗn ngỵi dựng mi, sõn phốm mi Vi nhng khõ nởng trờn cho thỗy, h gi ý mang läi trâi nghiệm tốt chokhách hàng, giúp khách hàng giâm thąi gian tìm kiếm sân phèm, tëng độ hài lñng, tëng cĄ hội mua hàng nâng cao tỷ lệ chuyển đổi mua hàng Hình Giao diện đánh giá sân phẩm người dùng Hình Giao diện kết quâ đánh giá sân phẩm người dùng 530 Hồng Thị Hà, Ngơ Nguyễn Thức Hình 10 Giao diện đo lường độ tương tự người dùng Hình 11 Giao diện gợi ý cho người dùng 531 Một số phương pháp gợi ý ứng dụng thương mại điện tử Hình 12 Giao diện gợi ý sân phẩm người dùng thích Hình 13 Giao diện hiển thị sân phẩm người dùng xem/mua Hình 14 Giao diện gợi ý sân phẩm hay mua 532 Hồng Thị Hà, Ngơ Nguyễn Thức KẾT LUẬN Hệ gợi ý có vai trũ rỗt quan trng thỵng in t Nú nhĂng vü khí mänh mẽ giúp nhiều doanh nghiệp tëng doanh số bán hàng, nhĂng nhân tố täo nên să thành công cûa trang thỵng in t v s ỵc ng dýng rng rói tỵng lai Trong nghiờn cu ny, chỳng tơi trình bày tổng quan hệ gợi ý, khám phá nhĂng tác động cûa hệ gợi ý đối vi thỵng in t Bỡng thc nghim, chỳng tụi ó so sỏnh ỵc hiu quõ thc hin cỷa cỏc phỵng phỏp gi ý Content-based, User-based v Item-based, ỏnh giỏ ỵc nhng im mọnh, im yu cỷa mi phỵng phỏp gợi ý Ngồi ra, chúng tơi báo cáo thách thĀc cỷa cỏc phỵng phỏp gi ý ỏp dýng thỵng in t v chợ giõi phỏp khớc phýc Cuối cùng, xåy dăng thành công hệ thống bán hàng trăc tuyến có tích hợp phỵng phỏp gi ý khỏc nhau, bao gm k thuờt gợi ý khơng cá nhân hóa (Non-personalized) kỹ thuờt gi ý cỏ nhõn húa hiu quõ nhỵ: gi ý dăa nội dung (Content-based filtering), lọc cộng tác (Userbased, Item-based) Qua ũ, ngỵi c hiu ỵc nn tõng lý thuyết hệ gợi ý, điểm mänh, điểm yếu cûa cỏc h gi ý cỹng nhỵ quy trỡnh xồy dng mt ng dýng thỵng in t cú tớch hp cỏc phỵng phỏp gi ý thc t Hỵng nghiờn cu tỵng lai cỷa lùnh vc ny cũn khỏ rộng mć, đặc biệt kỹ thuêt gợi ý cá nhân hóa Chúng tơi tiếp týc nghiên cĀu, câi tiến Āng dýng thuêt toán gợi ý lùnh vc e-commerce, lùnh vc e-learning tr giỳp ngỵi dùng trình mua hàng, tìm kiếm tài liệu cỹng nhỵ h tr quỏ trỡnh hc tờp trc tuyn LỜI CẢM ƠN Chúng câm Ąn Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam täo iu kin tt nhỗt chỳng tụi thc hin nghiờn cĀu TÀI LIỆU THAM KHẢO Adomavicius G., Sankaranarayanan R., Sen S & Tuzhilin A (2005) Incorporating contextual information in recommender systems using a multidimensional approach ACM Transactions on Information Systems (TOIS) pp 103-145 Dias M.B., Locher D., Li M., El-Deredy W & Lisboa P.J (2008) The value of personalised recommender systems to e-business: a case study Proceedings of the 2008 ACM conference on Recommender systems pp 291-294 GroupLens (1998) MovieLens 100K Dataset, Retrieved from https://grouplens.org/datasets/ movielens/ on October 03, 2020 Grouplens (2011) Last.FM Retrieved from https://grouplens.org/datasets/hetrec-2011 on October 03, 2020 Google & Temasek (2018) Báo cáoReport e-Conomy SEA 2018, Retrieved from https://www.thinkwithgoogle.com/_qs/documents/ 6730/Report_e-Conomy_SEA_2018_by_Google_ Temasek_v.pdf on March 20, 2020 Ionos (2017) Recommendation systems in ecommerce US: IONOS Inc Retrieved from https://www.ionos.com/digitalguide/online-mark eting/online-sales/how-to-use-recommendationsystems-in-e-commerce on May 15, 2020 Jordan T (2016) New insight from Experian Marketing Services helps brands prepare for the holiday season https://www.experianplc.com Khusro S., Ali Z & Ullah I (2016) Recommender systems: issues, challenges, and research opportunities In Information Science and Applications (ICISA) 2016 Springer In Information Science and Applications (ICISA) Lei Tang, Zongtao Duan, Yishui Zhu, Junchi Ma & Zihang Liu (2019) Recommendation for Ridesharing Groups Through Destination Prediction on Trajectory Data IEEE Transactions on Intelligent Transportation Systems 99: 14 Mohamed M.H., Khafagy M.H & Ibrahim M.H (2019) Recommender Systems Challenges and Solutions survey International Conference on Innovative Trends in Computer Engineering (ITCE) Nguyễn Hùng Dũng & Nguyễn Thái Nghe (2013) Hệ thống gợi ý sản phẩm bán hàng trực tuyến sử dụng kỹ thuật lọc cộng tác Tạp chí Khoa học, Trường Đại học Cần Thơ 31: 15 Nguyễn Thanh Hưng (2019) Báo cáo số thương mại điện tử 2019 Hiệp hội thương mại điện tử Việt Nam Reichheld & F.F (1993) Loyalty-based management Harvard business review 71(2): 64-73 533 Một số phương pháp gợi ý ứng dụng thương mại điện tử Schafer Ben J., Joseph Konstan & John Riedl (2001) E-commence Recommendation Applications Data Mining and Knowledge Discovery 5(1-2): 115-153 Sharma L & Gera A (2013) A survey of recommendation system: Research challenges International Journal of Engineering Trends and Technology (IJETT) 4(5): 1989-1992 Singh P (2019) A Survey of Recommendation Systems in Electronic Commerce Apress, Berkeley, CA pp 123-157 Stephan S (2019) Personalized Product Recommendation Tips and Stats Retrieved fromhttps://www.barilliance.com/personalizedproduct-recommendations-stats/ on Feb 25, 2020 Thomas T (2006) Designing recommender systems for e-commerce: an integration approach ACM 534 International Conference Proceeding Series ACM press New York, USA Trademark Notice (2003) Epinions dataset Retrieved from http://www.trustlet.org/epinions.html on October 03, 2020 University of Freiburg (2004) BookCrossing, Retrieved from http://www2.informatik.unifreiburg.de/~cziegler/BX/ on October 03, 2020 Viễn Thông (2020) Thương mại điện tử Việt Nam 2020 sao? Truy cập từ https://vnexpress.net/kinh-doanh/thuong-mai-dientu-viet-nam-2020-se-ra-sao-4045309.html, ngày10 tháng năm 2020 Xue A.Y., Qi J., Xie X., Zhang R., Huang J & Li Y (2015) Solving the data sparsity problem in destination prediction The VLDB Journal 24(2): 219-243 ... phương pháp gợi ý Mýc tiêu cûa cỏc phỵng phỏp gi ý ỵc th hin bõng Hình 2.Tiến trình lọc cộng tác Hình Lọc cộng tác dựa User-based Item-based 523 Một số phương pháp gợi ý ứng dụng thương mại điện. .. IP, hệ thống ỵa gi ý v nhng sõn phốm m khỏch hàng tÿng xem 527 Một số phương pháp gợi ý ứng dụng thương mại điện tử Bâng Sai số dự đoán thời gian thực trung bình lần chäy phương pháp lọc cộng tác... lường độ tương tự người dùng Hình 11 Giao diện gợi ý cho người dùng 531 Một số phương pháp gợi ý ứng dụng thương mại điện tử Hình 12 Giao diện gợi ý sân phẩm người dùng thích Hình 13 Giao diện