1. Trang chủ
  2. » Công Nghệ Thông Tin

Gợi ý sản phẩm dựa trên ước đoán quan điểm khách hàng

9 31 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Bài viết đề xuất giải pháp gợi ý sản phẩm dựa trên tính năng. Hệ thống sẽ thu thập ý kiến/bình luận của khách hàng về các nhóm sản phẩm cần gợi ý, sử dụng các kỹ thuật của lĩnh vực khai phá quan điểm để xác định được quan điểm của khách hàng.

Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018 DOI: 10.15625/vap.2018.00025 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG Trần Thị Thúy1, Trương Quốc Định2, Nguyễn Văn Thọ3, Huỳnh Trung Long4 Khoa Kỹ thuật Công nghệ, Trường Đại học Cửu Long Khoa Công nghệ Thông tin & Truyền thông, Trường Đại học Cần Thơ Trung tâm Y tế quận Bình Thủy, TP Cần Thơ Sở Thông tin Truyền thông thành phố Cần Thơ tranthithuy@mku.edu.vn, tqdinh@cit.ctu.edu.vn, nguyenthoytct@gmail.com, trunglong159753@gmail.com TÓM TẮT: Hiện nay, khai thác quan điểm khách hàng thơng qua bình luận, phản hồi ứng dụng ngày nhiều hệ thống gợi ý, đặc biệt trang web thương mại điện tử Phần lớn hệ thống đưa gợi ý dựa ước đoán điểm đánh giá tổng thể sản phẩm mà chưa trọng đến điểm tính sản phẩm Hướng tiếp cận gợi ý sản phẩm chưa với nhu cầu khách hàng trường hợp họ quan tâm tới chi tiết tính sản phẩm Để giải vấn đề nêu trên, báo này, đề xuất giải pháp gợi ý sản phẩm dựa tính Hệ thống thu thập ý kiến/bình luận khách hàng nhóm sản phẩm cần gợi ý, sử dụng kỹ thuật lĩnh vực khai phá quan điểm để xác định quan điểm khách hàng Mỗi bình luận khách hàng hệ thống xử lý để thu thông tin: tên sản phẩm, tính năng, quan điểm (xấu, bình thường, tốt) phục vụ xây dựng CSDL cho bước gợi ý Kết thực nghiệm nhóm sản phẩm điện thoại di động với 10000 bình luận tiếng Việt khẳng định tính khả thi giải pháp mà đề xuất Từ khóa: Hệ thống gợi ý, bình luận, quan điểm, khai phá quan điểm I GIỚI THIỆU Trong thời đại bùng nổ thông tin với gia tăng số lượng thiết bị có khả kết nối duyệt web việc xây dựng hệ thống gợi ý (Recommender Systems) việc cần thiết Mục đích hệ thống gợi ý hỗ trợ người dùng (users) tìm kiếm thơng tin cần thiết cách dự đốn sở thích (preferences) hay xếp hạng (rating) mà người dùng dành cho đối tượng thơng tin (item) mà họ chưa xem xét tới khứ Hệ thống gợi ý ứng dụng rộng rãi nhiều lĩnh vực khác như: lĩnh vực giải trí (gợi ý hát - LastFM - www.last.fm, gợi ý phim - LastFM - www.last.fm), lĩnh vực học thuật (gợi ý báo – ResearchGate – www.researchgate.net) đặc biệt lĩnh vực thương mại điện tử (Amazon – www.amazon.com) Đối với lĩnh vực thương mại điện tử, hệ thống gợi ý giúp người dùng giảm “chi phí giao dịch” cách hỗ trợ tìm chọn lựa sản phẩm phù hợp với nhu cầu [1], giúp người kinh doanh tăng lợi nhuận bán nhiều sản phẩm [2] Các hệ thống gợi ý phân thành dạng dự đốn xếp hạng (rating prediction) tức dự đoán giá trị xếp hạng mà người dùng đánh giá cho mục tin dự đốn mục tin (item prediction) nghĩa ước lượng xác suất người dùng thích mục tin [3] Trong lĩnh vực thương mại điện tử, với hệ thống cho phép người dùng phản hồi cách tường minh thông qua việc xếp hạng (ví dụ đưa điểm đánh giá từ  đến ) sản phẩm gợi ý sản phẩm dự đốn có điểm xếp hạng cao Hiện nhiều trang web thương mại điện tử phát triển hệ thống đánh giá thông qua chế giá trung bình cho sản phẩm để giúp khách hàng định mua hàng Tuy nhiên, việc đánh giá cách tổng quan chưa đủ độ tin cậy chưa hẳn phản ánh chất lượng thực tế sản phẩm, đặc biệt nhóm sản phẩm có nhiều tính năng/thuộc tính khác [4] (ví dụ: điện thoại đánh giá chung tốt chưa hẳn có dung lượng pin lớn) Việc gợi ý sản phẩm phù hợp theo nhiều tính mà người dùng quan tâm dựa hướng tiếp cận dự đoán xếp hạng không khả thi trang web thương mại điện tử hỗ trợ người dùng đánh giá theo tính sản phẩm Tuy nhiên thời đại mà mạng xã hội phát triển phần lớn trang thương mại điện tử cho phép người dùng đưa ý kiến bình luận người dùng bày tỏ quan điểm cách rõ ràng chi tiết tính sản phẩm, ví dụ như: Màn hình hiển thị đẹp lớn Bình luận trở thành cơng cụ đắc lực để khách hàng phản ánh ý kiến sản phẩm dịch vụ Thực tế, khách hàng ngày có nhiều quyền lực mối quan hệ nhà sản xuất – khách hàng Cuộc khảo sát từ PowerReviews cho kết 57% người mua sắm đọc đánh giá trực tuyến để có thêm thơng tin mà cịn thích truy cập vào trang web thương mại điện tử cung cấp dịch vụ đánh giá1 Người dùng trang thương mại điện tử tin “Những lời đánh giá phản ánh phần trải nghiệm sử dụng sản phẩm, thế, họ sử dụng chúng nhiều hơn” Như vậy, việc đánh giá tổng hợp quan điểm khách hàng thơng qua bình luận cho thông tin hài lịng/khơng hài lịng khách hàng tính sản phẩm từ giúp đưa gợi ý phù hợp với yêu cầu khách hàng Trong phạm vi nghiên cứu này, đặt quan tâm đến việc phân tích ý kiến khách hàng chức cụ thể sản phẩm Dữ liệu đầu vào tập sản phẩm, tập tính tập https://www.retaildive.com/news/the-power-of-online-reviews/368614/ 192 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG bình luận tương ứng với sản phẩm Với bình luận người dùng, chúng tơi tiến hành trích xuất tính năng, từ nói lên quan điểm đồng thời dự đoán điểm đánh giá cho chức sản phẩm Phần lại báo tổ chức sau Trong phần II chúng tơi trình bày tổng quan lĩnh vực khai phá quan điểm bình luận người dùng/khách hàng Kiến trúc hệ thống gợi ý sản phẩm dựa phân tích quan điểm khách hàng trình bày phần III Phần IV mô tả kết đạt mơ hình đề xuất dựa liệu thu thập tự động 10.000 bình luận (tiếng Việt) khách hàng sản phẩm thuộc nhóm hàng điện thoại di động Kết bước đầu cho thấy tính hiệu mơ hình mà đề xuất Phần V thảo luận số ưu nhược điểm mơ hình đề xuất định hướng nghiên cứu tương lai II NGHIÊN CỨU LIÊN QUAN Lĩnh vực khai phá quan điểm bình luận khách hàng thu hút quan tâm nhiều nhà nghiên cứu ngồi nước tính chất quan trọng lĩnh vực ứng dụng rộng rãi Để thực khai phá quan điểm, nhiều nghiên cứu việc xây dựng từ điển cảm xúc (SentiWordNet) Esuli cộng nghiên cứu xây dựng từ điển cảm xúc cho ngôn ngữ tiếng Anh [5] với thông tin từ vựng, điểm số cho quan điểm tích cực điểm số cho quan điểm tiêu cực Từ điển cảm xúc xem bước khởi đầu nguồn tài nguyên mở cho nghiên cứu khai phá quan điểm ngôn ngữ Anh Trong nghiên cứu tương tự [6], Baccianella cộng trình bày giải pháp xây dựng từ điển cảm xúc phiên 3.0 (SentiWordNet 3.0 – http://sentiwordnet.isti.cnr.it/) Đây xem phiên nâng cấp SentiWordNet 1.0, nhiên số lượng từ vựng chưa đầy đủ chưa thể bao phủ hết tất miền ngữ nghĩa Từ điển cảm xúc tiếng Việt nhận quan tâm nhiều nhà nghiên cứu nước, bật cơng trình tác giả Nguyễn Hồng Nam cộng [7] với kết sau từ điển cảm xúc tiếng Việt VietSentiWordNet (https://github.com/sonvx/VietSentiWordNet) Các tác giả ban đầu thực dịch từ có từ loại tính từ, trạng từ động từ thuộc từ điển SentiWordNet 3.0 sang tiếng Việt, sử dụng từ điển Anh –Việt, từ điển tiếng Việt để lọc nhiễu Ở khía cạnh khai phá quan điểm, nghiên cứu chia thành dạng tốn lớn xác định quan điểm câu có tính chất so sánh (liên quan đến nhiều đối tượng) rút trích quan điểm liên quan đến đối tượng Có khơng nhiều cơng trình mà đối tượng nghiên cứu câu bình luận có tính chất so sánh Một số Jindal Liu [8] hướng nghiên cứu đến việc xác định quan điểm câu bình luận có tính chất so sánh Các tác giả đề xuất phương pháp học có giám sát để xác định câu dạng so sánh, đưa luật để xác định đối tượng quan điểm so sánh, kết bước đầu cho thấy tính khả thi giải pháp đề xuất Rút trích quan điểm câu bình luận liên quan đến đối tượng thực mức đoạn mức câu Yue Lu [9] giải vấn đề xác định quan điểm chức tóm tắt bình luận ngắn Văn tiền xử lý thành đoạn theo định dạng , với headterm tên nhóm theo cấu trúc PLSA (Probability Latent Semantic Analysis) Sau đó, việc đánh giá đoạn văn phán đốn dự đốn cục phán đốn tồn cục Chúng tổng hợp để có đánh giá chức Brody Elhadad [10] sử dụng mơ hình chủ đề (topic model) để tìm tính Sau đó, với tính năng, tiến hành trích xuất tồn tính từ thích hợp xây dựng sơ đồ liên kết Một giải thuật lan truyền nhãn sử dụng sơ đồ để học điểm phân cực cảm xúc tính từ Mơ hình Sauper [11], Sauper Bazilay [12] không sử dụng đoạn mà thay vào “snippets” snippet câu ngắn hay đoạn ngắn Tuy nhiên, vấn đề hiệu chỉnh nhãn cảm xúc không giải tốt mơ hình Mơ hình dùng seed word để xác định bất đối xứng trước hỗ trợ hai loại cảm xúc: tích cực tiêu cực cách xác định bất đối xứng cho nhiều loại cảm xúc không rõ ràng Lakkaraju [13] thử giải vấn đề đặt nhãn cảm xúc cách giả thiết toàn đánh giá sinh biến trả đối xứng chủ đề cảm xúc xem đặc trưng Tuy nhiên, cách mà nhãn cảm xúc liên kết với đánh giá lúc học Lazaridou [14] cố gắng liên kết nhãn cảm xúc với đánh giá ký hiệu Kronecker áp dụng cho loại cảm xúc: tích cực, trung lập tiêu cực Tuy nhiên phương pháp không xây dựng hay xác định từ cảm xúc, nguồn tri thức quan trọng phục vụ đánh giá quan điểm Baumgarten cộng nghiên cứu [15] tập trung xác định tập từ khóa giúp phân loại rút trích quan điểm Các từ khóa sử dụng để phân lớp thơng điệp ngắn (short message), loại thông điệp chủ yếu xuất trang mạng xã hội từ xác định quan điểm tiềm ẩn thông điệp Đóng góp nghiên cứu xây dựng tập từ khóa giúp xác định quan điểm bình luận tham khảo tốt cho nghiên cứu tương tự sau Mạng xã hội nơi nhiều người dùng bày tỏ quan điểm vấn đề nóng thời diễn Đặc thù bình luận mạng xã hội ngắn chứa nhiều từ “lóng” việc xác định quan điểm dựa vào bình luận mạng xã hội địi hỏi cách tiếp cận đặc thù Các hướng tiếp cận cho lớp tốn là: kỹ thuật phân tích từ vựng (lexical analysis) [16, 17], kỹ thuật máy học (machine learning based analysis) [18, 19] kỹ thuật lai (hybrid analysis) [20, 21] Trong hướng tiếp cận kỹ thuật dựa máy học cho kết tốt địi hỏi phải có tập liệu huấn luyện đủ lớn hướng tiếp cận phân tích từ vựng lại khơng u cầu tri thức sẵn có Dù theo cách tiếp cận tính xác mơ hình đề xuất ln thay đổi theo miền ứng dụng Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 193 Các nghiên cứu nói nhiều có mặt chưa tối ưu thực tập liệu tiếng nước vốn phân tích xây dựng cấu trúc ngữ pháp chặt chẽ ưu điểm có từ điển cảm xúc kèm Vấn đề khai phá quan điểm ý kiến/bình luận tiếng Việt ứng dụng vào toán gợi ý sản phẩm, đặc biệt gợi ý sản phẩm theo tính chưa nghiên cứu công bố nhiều Việt Nam Chính lẽ đó, báo này, chúng tơi nhắm đến xây dựng hệ thống gợi ý sản phẩm theo tính dựa kỹ thuật khai phá quan điểm bình luận website thương mại điện tử III MƠ HÌNH ĐỀ XUẤT Bài tốn chúng tơi nhắm đến giải nghiên cứu đưa sản phẩm gợi ý theo tính mà người dùng quan tâm, ví dụ như: tìm điện thoại có hình đánh giá tốt hệ thống gợi ý Samsung galaxy S8 tìm điện thoại có pin dùng khoảng thời gian dài hệ thống gợi ý Nokia Để đưa gợi ý thuộc dạng vừa nêu, cần xây dựng CSDL gợi ý, CSDL bao gồm nhiều mục tin, mục tin có cấu trúc sau: , , Kiến trúc hệ thống cho phép xây dựng CSDL gợi ý giới thiệu hình kiến trúc hệ thống gợi ý sản phẩm thể hình Bộ thu thập liệu Bình luận Dữ liệu huấn luyện Mơ hình chủ đề cho tính Tiền xử lý liệu Dữ liệu xây dựng CSDL gợi ý Bình luận Tập bình luận phù hợp Bình luận n Xác định tính Xác định tính Xác định tính Xác định từ cảm xúc Xác định từ cảm xúc Xác định từ cảm xúc Phán đoán quan điểm Phán đoán quan điểm Phán đoán quan điểm Từ điển cảm xúc TỔNG HỢP ĐIỂM TÍNH NĂNG THEO SẢN PHẨM CSDL GỢI Ý Hình Kiến trúc hệ thống xây dựng sở liệu gợi ý Danh sách tính quan tâm Lọc liệu theo tính Tổng hợp tính điểm cho sản phẩm Danh sách sản phẩm gợi ý Chọn 10 sản phẩm tốt Hình Kiến trúc hệ thống gợi ý sản phẩm theo tính CSDL GỢI Ý GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG 194 3.1 Hệ thống xây dựng CSDL gợi ý Môđun lấy liệu Cho phép thu thập liệu bình luận từ trang web thương mại điện tử có cung cấp chức bình luận (ví dụ http://fptshop.com, http://www.thegioididong.com…) liên quan đến nhóm sản phẩm cần gợi ý Dữ liệu thu thập được, cho nhóm sản phẩm, phân chia cách ngẫu nhiên thành tập liệu: tập liệu huấn luyện tập liệu xây dựng CSDL gợi ý Tập liệu huấn luyện dùng để xây dựng mơ hình chủ đề cho tính sản phẩm với từ điển cảm xúc Tập liệu xây dựng CSDL gợi ý dùng để tính điểm tính cho sản phẩm Bên cạnh việc thu thập liệu bình luận thu thập kèm theo điểm đánh giá (số ) mà người dùng đánh giá cho sản phẩm tương ứng kèm theo bình luận Mơđun xây dựng mơ hình chủ đề cho tính Để xác định câu bình luận người dùng nêu quan điểm chức sản phẩm chúng tơi cần thiết phải xây dựng mơ hình chủ đề (topic model) cho tính Mơ hình chủ đề Griffiths Steyvers đề xuất lần vào năm 2004 [22] Một cách tổng quát, mô hình chủ đề xem mơ hình thống kê cho phép khám phá chủ đề “trừu tượng” tiềm ẩn bên tập tài liệu (collection of documents) Trong ngữ cảnh hệ thống mà chúng tơi xây dựng, mơ hình chủ đề cho tính hiểu đơn giản danh sách từ khóa đại diện cho tính năng, nghĩa đề cập đến từ khóa biết nói đến tính sản phẩm Bảng minh họa cho danh sách từ khóa đại diện cho số tính điện thoại Bảng Mơ hình chủ đề cho số tính điện thoại Tính Màn hình Bộ nhớ Danh sách từ khóa đại diện Màn hình, display, screen, hiển thị Bộ nhớ trong, nhớ, ROM Q trình tạo lập từ khóa đại diện cho tính tóm lược qua bước sau: Duyệt qua bình luận có nhãn chủ đề tính sản phẩm Với bình luận, sử dụng cơng cụ vnTagger [23] để tách từ gán từ loại Các từ khóa có nhãn danh từ chung giữ lại xem từ khóa đại diện cho tính sản phẩm Tổng hợp danh sách từ khóa trả bước 1, từ khóa có thêm thơng tin số lượt mà từ khóa trả Các từ khóa xếp theo thứ tự giảm dần số lượt trả Trả N từ khóa đầu danh sách có bước N từ khóa đại diện cho tính sản phẩm Mơđun xây dựng từ điển cảm xúc Bắt đầu Đọc câu bình luận điểm đánh giá Cịn bình luận? sai Kết thúc Tách từ, xác định bốn (Sản phẩm i; Tính j; Từ cảm xúc k; Điểm -d) - Đọc số lượt xuất từ cảm xúc k: fk - Đọc điểm đánh giá từ cảm xúc k: sk - Tính điểm đánh giá mới: sknew = (sk * fk + d) /(fk+1) Cập nhật điểm đánh giá sknew cho từ cảm xúc k Hình Giải thuật xây dựng từ điển cảm xúc Như đề cập phần trên, để đưa gợi ý sản phẩm theo tính mà người dùng quan tâm, hệ thống cần có liệu dạng , , Nguồn thông tin để xây dựng liệu gợi ý bình luận với điểm đánh giá (số ) mà người dùng dành cho sản phẩm tương ứng Tuy nhiên, có nhận xét điểm đánh giá khơng tương ứng với tính người dùng cho điểm đánh giá tốt hay Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 195 khơng tốt mà người dùng hài lịng hay khơng hài lịng với tính đề cập đến bình luận Một lý khác cho việc xây dựng từ điển cảm xúc cách dùng từ để biểu đạt quan điểm người dùng khác từ cảm xúc điểm đánh giá lại khác Do vậy, mục tiêu môđun xây dựng từ điển cảm xúc, ngữ cảnh hệ thống chúng tơi xây dựng, xác định điểm đánh giá tương ứng với từ cảm xúc (, ) Phương pháp xây dựng từ điển cảm xúc thể hình Mơđun xây dựng CSDL gợi ý Sử dụng tập bình luận thu thập từ trang mạng xã hội, trang web thương mại điện tử, với bình luận, hệ thống thực bước tách từ, giữ lại danh từ riêng, danh từ chung, trạng từ tính từ Mơ hình chủ đề cho tính sử dụng để xác thực tính mà bình luận đề cập đến Kết bước phân tích ba: , , Từ điển cảm xúc sử dụng để xác định điểm đánh giá cho tính câu bình luận Điểm đánh giá tính vào điểm tổng tính sản phẩm tương ứng CSDL gợi ý Hình minh họa bước quy trình xây dựng CSDL gợi ý hệ thống Bắt đầu Đọc câu bình luận Cịn bình luận? sai Kết thúc Rút trích ? sai - Đọc số lượt xuất tính j sản phẩm i: fij - Đọc điểm đánh giá tại: sij - Tính điểm đánh giá mới: sijnew = (sij * fij + sk) /(fij+1) Truy xuất điểm đánh giá từ cảm xúc k: sk Cập nhật điểm đánh giá sijnew cho tính j sản phẩm i đọc CSDL gợi ý ghi Hình Các bước xây dựng CSDL gợi ý Hệ thống thực gợi ý cho người dùng theo cách: theo tính không Trong trường hợp người dùng không quan tâm đến tính cụ thể hệ thống thực tính điểm cho sản phẩm theo tổng điểm tính Điểm đánh giá tổng quan cho sản phẩm tính theo cơng thức ∑ wij điểm tính j sản phẩm pi Trong trường hợp người dùng xác định danh sách tính (theo thứ tự giảm dần độ ưu tiên), điểm gợi ý cho sản phẩm tính theo cơng thức ∑ j trọng số cho tính j tương ứng, trọng số xem tham số hệ thống, người dùng xác lập theo nguyên tắc > > … > m Hình minh họa danh mục điện thoại thông minh hệ thống gợi ý cho người dùng người dùng chọn quan tâm đến tính năng: hình, cảm ứng, thiết kế camera GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG 196 3.2 Hệ thống gợi ý Hình Danh mục điện thoại gợi ý theo tính năng: hình, cảm ứng, thiết kế, camera IV THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 4.1 Dữ liệu thực nghiệm Chúng tơi thực nghiệm tính khả thi hệ thống đề xuất dựa bình luận thu thập từ trang thương mại điện tử http://fptshop.com, http://www.thegioididong.com liên quan đến nhóm sản phẩm điện thoại thơng minh Lý chúng tơi thực nghiệm nhóm sản phẩm nhóm sản phẩm có số lượt bình luận lớn trang web bán hàng thương mại điện tử Chúng sử dụng công cụ jsoup (https://jsoup.org/) cho việc tải nội dung trang web dạng mã nguồn HTML thực phân tích thẻ HTML để giữ lại thông tin cần thiết: tên sản phẩm, câu bình luận mức  đánh giá Do website FPT shop Thế giới di động có số lượng trang lớn, nên chúng tơi thiết lập thông số: số sản phẩm (theo mức độ quan tâm giảm dần) n_sp; số trang bình luận sản phẩm n_page Trong ngữ cảnh nghiên cứu này, thiết lập n_sp = 50 n_page=10 tương ứng Tổng số bình luận chúng tơi thu thập 14.872 bình luận, khoảng 1/3 số bình luận (4.872) dùng làm tập liệu huấn luyện cho việc xây dựng mơ hình chủ đề cho tính từ điển cảm xúc 10.000 bình luận cịn lại (bao gồm bình luận số ) sử dụng để đánh giá tính đắn mơ hình đề xuất Nếu hệ thống dự đốn số  bình luận xem Các bình luận chúng tơi tiền xử lý để bỏ qua bình luận trùng lặp (các bình luận giống người dùng, bình luận khơng nói đến đặc tính khơng phát từ cảm xúc) Ở giai đoạn này, thực bước chuẩn hóa tên sản phẩm tên gọi Ví dụ: Iphone plus 64GB Iphone plus màu táo đỏ đưa tên Iphone plus 4.2 Thực nghiệm Tính khả thi hệ thống kiểm định theo kịch Kịch 1: kiểm chứng việc phán đoán điểm đánh giá tương ứng với bình luận Kịch 2: kiểm chứng việc phán đoán quan điểm khách hàng tiêu cực, trung tính hay tích cực Vì điểm bình luận khách hàng đánh giá từ  đến  nên đề xuất chia điểm đánh giá thành mức:  đến  tiêu cực, là trung tính từ  đến  tích cực Kết kiểm chứng 10.000 bình luận điện thoại có thị trường khoảng thời gian từ năm 2017 đến năm 2018 biểu diễn bảng Bảng Kết đánh giá hệ thống theo kịch Kịch Kịch Kịch Độ xác 74,59% 82,64% Kết đạt khả quan đối chiếu với kết cơng trình nghiên cứu khác, nghiên cứu không kiểm chứng tập liệu lý ngơn ngữ bình luận, phần cho thấy tính hợp lý mơ hình mà chúng tơi đề xuất Chẳng hạn theo công bố tác giả Bauman cộng [24] kết dự đốn điểm xếp hạng khách hàng vào khoảng 82% Mặc dù kết Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 197 kiểm chứng đáp ứng kỳ vọng đề ra, nhiên có số vấn đề tồn thực tế mà hệ thống chưa giải cách triệt để Thứ vấn đề sử dụng từ câu bình luận: từ viết tắt, từ đa nghĩa từ mang nghĩa “bóng” Bảng trình bày số câu bình luận có chứa từ mà hệ thống chúng tơi đề xuất chưa xử lý Bảng Một số bình luận hệ thống khơng thể xử lý Tên sản phẩm Bình luận Điểm đánh giá (số ) Kí tự „k‟ diễn tả cho 1000 tiếng Việt khơng thống, từ viết tắt cho chữ “khơng”, “khó” Chuỗi “đc” từ viết tắt cho chữ “được” “địa chỉ” Asus_Zenfone Max_Pro ok đáng đồng tiền bát gạo Hệ thống không nhận dạng (No.00393814) ngữ “đáng đồng tiền bát gạo” Vấn đề thứ hai ảnh hưởng nhiều đến độ xác yếu tố người việc cho điểm đánh giá Ở muốn nói đến cách cho điểm đánh giá người dùng khác khác Ví dụ câu bình luận có ý nói sản phẩm chất lượng trung bình điểm đánh giá lại số bình luận có quan điểm tiêu cực có điểm đánh giá Bảng minh họa cho số trường hợp bình luận điểm đánh giá không tương ứng Asus_Zenfone Max_Pro (No.00393814) camera 16 m tiếc hình hd nên hình ảnh k đc đẹp cho Lý Bảng Một số bình luận điểm đánh giá khơng tương xứng Sản phẩm Bình luận Đánh giá Asus_Zenfone Max_Pro (No.00393814) Máy sử dụng ổn Asus_Zenfone Max (No.00415196) Chụp hình ổn Asus_Zenfone Max_Pro (No.00393814) Máy dày nặng Nokia 3310 (No.00349644) Tuy nhiên đồ làm nhựa bóng nên cầm trơn tay V KẾT LUẬN Trong báo đề xuất giải pháp xây dựng hệ thống gợi ý sản phẩm theo tính dựa việc thu thập phân tích quan điểm khách hàng nhóm sản phẩm tương ứng Giải pháp mà chúng tơi xây dựng có đồng thời ưu điểm so với hệ thống gợi ý khác: 1- Sản phẩm gợi ý theo tính nên phù hợp với yêu cầu người dùng Đặc biệt nhóm sản phẩm/dịch vụ có nhiều tính năng, khía cạnh khác Sản phẩm gợi ý có tính người dùng mong muốn tìm kiếm tốt dựa quan điểm khách hàng sử dụng sản phẩm/dịch vụ 2- Hệ thống thể xu hướng tiêu dùng khách hàng theo thời gian Hệ thống đề xuất thực nghiệm tập liệu bao gồm gần 15.000 bình luận sản phẩm điện thoại thơng minh 1/3 dùng làm tập liệu huấn luyện 2/3 dùng làm tập liệu kiểm thử Hai kịch thực nghiệm đề xuất cho kết khả quan, đặc biệt bình luận ngơn ngữ tiếng Việt, ngơn ngữ chưa có cơng cụ phân tích văn phạm chuẩn xác Chúng tơi phân tích đánh giá vấn đề tồn mà hệ thống chưa giải yếu tố người việc sử dụng từ ngữ việc đưa điểm đánh giá Bên cạnh chúng tơi nghĩ quan điểm người dùng bình luận phán đốn xác từ cảm xúc không xử lý cách riêng lẻ mà kết hợp với tính sản phẩm Ví dụ thuật ngữ “pin trâu” xử lý có quan điểm tích cực cho tính dung lượng pin điện thoại, xử lý riêng lẻ thuật ngữ bị bỏ qua Đây hướng nghiên cứu mà nhắm đến nghiên cứu VI TÀI LIỆU THAM KHẢO [1] Hu R, Pu P Potential acceptance issues of personality-ASED recommender systems In: Proceedings of ACM conference on recommender systems (RecSys‟09), New York City, NY, USA; October 2009 p 22–5 198 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG [2] Pu P, Chen L, Hu R A user-centric evaluation framework for recommender systems In: Proceedings of the fifth ACM conference on Recommender Systems (RecSys‟11), ACM, New York, NY, USA; 2011 p 57–164 [3] Pilaszy I., & Tikk D (2009) Recommending new movies: Even a few ratings are more valuable than metadata In Proceedings of the Third ACM Conference on Recommender Systems (RecSys 2009), (p 93-100) NY, ACM [4] Wei R., Xu H A Formal Cost-Effectiveness Analysis Model for Product Evaluation in E-Commerce In: SEKE, p 287–293, 2013 [5] Esuli A, Sebastiani F Sentiwordnet: A Publicly Available Lexical Resource for Opinion Mining In: Proceedings of the 5th Conference on Language Resources and Evaluation, p 417-412, 2006 [6] Baccianella S., A Esuli, and F Sebastiani SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining In: Proceedings of the International Conference on Language Resources and Evaluation, p.17-23, 2010 [7] Nguyen H N., et al Domain Specific Sentiment Dictionary for Opinion Mining of Vietnamese Text In: Proceedings of the 8th International Workshop on Multidisciplinary Trends in Artificial Intelligence, p.136-148 [8] Nitin Jindal and Bing Liu 2006 Identifying comparative sentences in text documents In Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval (SIGIR '06) ACM, New York, NY, USA, 244-251 [9] Yue Lu, ChengXiang Zhai, and Neel Sundaresan Rated aspect summarization of short comments In: Proceedings of the 18th international conference on World wide web, pp 131–140, 2009 [10] Samuel Brody and Noemie Elhadad An unsupervised aspect-sentiment model for online reviews In: Proceeding HLT ‟10 Human Language Technologies: The 2010 Annual Conference of the North American, Chapter of the Association for Computational Linguistics, pp 804–812, 2010 [11] C Sauper, Aria Haghighi, and Regina Barzilay Content Models with Attitude In: Proceeding HLT ‟11 Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies - Volume 1, pp 350–358 [12] Christina Sauper and Regina Barzilay Automatic Aggregation by Joint Modeling of Aspects and Values Journal of Artificial Intelligence Research, Volume 46, pp 89-127, 2013 [13] Himabindu Lakkaraju, Chiranjib Bhattacharyya, Srujana Merugu, and Indrajit Bhattacharya Exploiting Coherence for the Simultaneous Discovery of Latent Facets and associated Sentiments In: Proceedings of the Eleventh SIAM International Conference on Data Mining, SDM 2011, p 498–509 [14] Angeliki Lazaridou, Ivan Titov, and Caroline Sporleder A Bayesian Model for Joint Unsupervised Induction of Sentiment, Aspect and Discourse Representations In: Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, ACL 2013, p pages 1630–1639 [15] M Baumgarten, M D Mulvenna, N Rooney, and J Reid 2013 Keyword-Based Sentiment Mining using Twitter Int J Ambient Comput Intell 5, (April 2013), 56-69 [16] Lucie Flekov, Oliver Ferschk and Iryna Gurevych UKPDIPF: A Lexical Semantic Approach to Sentiment Polarity Prediction in Twitter Data In: Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval 2014), Dublin, Ireland, pp 704-710, 23-24 August (2014) [17] W Y Wang and D Yang 2015 That‟s so annoying!!!: A lexical and frame-semantic embedding based data augmentation approach to automatic categorization of annoying behaviors using #petpeeve tweets In Empirical Methods in Natural Language Processing (EMNLP) [18] Le B., Nguyen H (2015) Twitter Sentiment Analysis Using Machine Learning Techniques In: Le Thi H., Nguyen N., Do T (eds) Advanced Computational Methods for Knowledge Engineering Advances in Intelligent Systems and Computing, vol 358 Springer, Cham [19] Aliaksei Severyn and Alessandro Moschitti 2015 Twitter Sentiment Analysis with Deep Convolutional Neural Networks In Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR '15) ACM, New York, NY, USA, 959-962 [20] A C Pandey, D S Rajpoot, M Saraswat Twitter sentiment analysis using hybrid cuckoo search method Information Processing & Management, vol 53, no 4, pp 764-779, 2017 [21] F Balage, P Pedro and T A S Pardo NILC-USP: A Hybrid System for Sentiment Analysis in Twitter Messages In: Proceedings of the Seventh International Workshop on Semantic Evaluation (SemEval 2013), Georgia, 2013, pp 568-572 [22] T L Griffiths and M Steyvers Finding scientific topics Proceedings of the National Academy of Sciences of the United States of America, 101(Suppl 1):5228 5235, 2004 [23] P Le-Hong An empirical study of maximum entropy approach for part-of-speech tagging of Vietnamese texts In: Proceedings of Traitement Automatique des Langues Naturelles (TALN-2010), Montreal, Canada, 2010 Trần Thị Thúy, Trương Quốc Định, Nguyễn Văn Thọ, Huỳnh Trung Long 199 [24] Konstantin Bauman, Bing Liu, and Alexander Tuzhilin 2017 Aspect Based Recommendations: Recommending Items with the Most Valuable Aspects Based on User Reviews In Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '17) ACM, New York, NY, USA, 717-725 DOI: https://doi.org/10.1145/3097983.3098170 PRODUCT RECOMMENDATION SYSTEM BASED ON CUSTOMER REVIEWS ANALYSIS Tran Thi Thuy, Truong Quoc Dinh, Nguyen Van Tho, Huynh Trung Long ABSTRACT: Nowadays, many e-commerce websites implement recommendation function which is based on customer reviews/feedbacks analysis The majority of these systems make the suggestions by using only the overall product ratings By using this approach, systems may suggest products that are not relevant to the customer needs, especially in the case that they take into account only several product features To deal with this problem, in this paper, we propose construct a feature-based recommendation system The proposed system will collect customer reviews/feedbacks concerning given product and then uses natural language processing techniques to discover customer opinion Experimental results conducted on 10.000 Vietnamese smartphone reviews show the feasibility of proposed system ... hợp tính điểm cho sản phẩm Danh sách sản phẩm gợi ý Chọn 10 sản phẩm tốt Hình Kiến trúc hệ thống gợi ý sản phẩm theo tính CSDL GỢI Ý GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG 194... Phán đoán quan điểm Phán đoán quan điểm Phán đoán quan điểm Từ điển cảm xúc TỔNG HỢP ĐIỂM TÍNH NĂNG THEO SẢN PHẨM CSDL GỢI Ý Hình Kiến trúc hệ thống xây dựng sở liệu gợi ý Danh sách tính quan. ..192 GỢI Ý SẢN PHẨM DỰA TRÊN ƯỚC ĐOÁN QUAN ĐIỂM KHÁCH HÀNG bình luận tương ứng với sản phẩm Với bình luận người dùng, chúng tơi tiến hành trích xuất tính năng, từ nói lên quan điểm đồng thời dự đoán

Ngày đăng: 30/09/2021, 15:38

Xem thêm:

HÌNH ẢNH LIÊN QUAN

III. MÔ HÌNH ĐỀ XUẤT - Gợi ý sản phẩm dựa trên ước đoán quan điểm khách hàng
III. MÔ HÌNH ĐỀ XUẤT (Trang 3)
Hình 1. Kiến trúc hệ thống xây dựng cơ sở dữ liệu gợi ý - Gợi ý sản phẩm dựa trên ước đoán quan điểm khách hàng
Hình 1. Kiến trúc hệ thống xây dựng cơ sở dữ liệu gợi ý (Trang 3)
Bảng 1. Mô hình chủ đề cho một số tính năng của điện thoại - Gợi ý sản phẩm dựa trên ước đoán quan điểm khách hàng
Bảng 1. Mô hình chủ đề cho một số tính năng của điện thoại (Trang 4)
Hình 4. Các bước xây dựng CSDL gợi ý - Gợi ý sản phẩm dựa trên ước đoán quan điểm khách hàng
Hình 4. Các bước xây dựng CSDL gợi ý (Trang 5)
Hình 5. Danh mục điện thoại gợi ý khi theo tính năng: màn hình, cảm ứng, thiết kế, camera - Gợi ý sản phẩm dựa trên ước đoán quan điểm khách hàng
Hình 5. Danh mục điện thoại gợi ý khi theo tính năng: màn hình, cảm ứng, thiết kế, camera (Trang 6)
Bảng 4. Một số bình luận và điểm đánh giá không tương xứng - Gợi ý sản phẩm dựa trên ước đoán quan điểm khách hàng
Bảng 4. Một số bình luận và điểm đánh giá không tương xứng (Trang 7)
Bảng 3. Một số bình luận hệ thống không thể xử lý - Gợi ý sản phẩm dựa trên ước đoán quan điểm khách hàng
Bảng 3. Một số bình luận hệ thống không thể xử lý (Trang 7)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w