Hệ thống hoạt động dựa trên việc sử dụng tri thức về sản phẩm, của chuyên gia hay những tri thức học được dựa theo hành vi, sở thích hay thói quen của người dùng trong quá khứ liên quan
Phương pháp khuyến nghị dựa trên nội dung (Content-based
Hệ thống phân tích và sử dụng thông tin về sản phẩm, như các đặc điểm, thuộc tính, mô tả và nội dung để tạo ra các gợi ý sản phâm cho người dùng Khi một người dùng đã đánh giá một sản phẩm, hệ thống sẽ phân tích thông tin về sản phẩm đó, tìm kiếm các sản phẩm tương tự và đề xuất chúng cho người dùng Hay nói cách khác, hành vi mua và đánh giá của người dùng được kết hợp với thông tin sẵn có của sản phẩm
Hình 2 5 Hình ảnh khuyến nghị dựa trên nội dung (Conteni-based)
24 Ở phương pháp này, các mô tả sản phẩm (gắn nhãn theo xếp hạng) được dùng làm dữ liệu đầu vào để tạo nên mô hình hồi quy hoặc phân loại dành riêng cho người dùng (Aggarwal,2016) Một cách thường được sử dụng để tạo ra mô hình trong phương pháp content-based recommender là sử dụng các thuật toán học máy, chăng hạn như thuật toán Natve Bayes hoặc thuật toán học tập SVM (Support Vector Machine), Neural Networks (/sinkaye, 2015) Khi duoc ap dung vao dữ liệu đầu vào, các thuật toán này sẽ xác định các mối quan hệ giữa các đặc điểm sản phâm và nhãn xếp hạng của người dùng
Phương pháp khuyến nghị dựa trên nội dung khắc phục được những hạn chế của phương pháp lọc cộng tác đó là khả năng đề xuất các mục tin kế cả khi không có đữ liệu đánh giá cho mục tin đó Điều này làm cho phương pháp này phù hợp cho các hệ thống mới hoặc không có nhiều người dùng Ngoài ra, nếu hồ sơ của người dùng thay đổi, phương pháp này vẫn có thế điều chỉnh các đề xuất trong một thời gian ngắn Nó có thể quản lý các tình huống khi các người dùng khác nhau không chia sẻ các mặt hàng giống nhau, nhưng chỉ giống nhau về các đặc tính bên trong
Trong nhiều trường hợp, phương pháp khuyến nghị đựa trên nội dung đưa ra những đề xuất quá rõ ràng, tương tự nhau vì nó tận đụng các từ khóa của nội dung sản phẩm đó
Nếu người dùng chưa từng tiêu thụ sản phẩm có chứa từ khóa nảo đó, thì những sản phẩm này sẽ không có cơ hội được đề xuất đến người dùng Do đó, các kết quả đề xuất được đưa ra thiếu tính đa dạng Ngoài ra, do phương pháp nay không sử dụng thông tin về hành vi của người dùng để đưa ra khuyến nghị, nó có thế dẫn đến sự giới hạn trong khả năng khuyến nghị Ví dụ, nếu một người dùng thường xuyên xem các video về nấu ăn, nhưng chỉ vì lý đo nào đó không xem một thời gian, phương pháp khuyến nghị dựa trên nội dung có thê không khuyến nghị các video mới về nấu ăn cho họ
Vi dụ hệ thống đề xuất bài hát của Spotify sử dụng thuật toán phân tích nội dung chăng hạn như thê loại, ca sĩ, tác giả, giai điệu, v.v., sau đó so sánh với lịch sử phát nhạc của người dùng để đưa ra các gợi ý bài hát tương tự Nếu một người dùng thường nghe nhạc pop và rock, hệ thông đề xuất của Spotify có thể gợi ý cho người dùng các bài hát pop và rock khác mà họ có thê thích dựa trên các đặc điểm của những bài hát mà họ đã nghe trước đó
2.6.5 Knowledge-based recommender system (Khuyén nghi dwa trén tri thirc)
Phương pháp khuyến nghị dựa trên tri thức đặc biệt hữu ích cho các sản phâm không được mua nhiều lần, chang hạn như hàng xa xỉ pham, bat động sản, dịch vụ tải chính Số lượng đánh giá sẵn có cho những sản phâm trong trường hợp này là ít và không đủ đữ liệu đề thực hiện bằng các phương pháp khuyến nghị trước đó Ngoài ra, mỗi sản phẩm lại có những chỉ tiết và mô tả sản phẩm khác nhau Ví dụ, các sản phâm bất động sản có nhiều chỉ tiết khác nhau như tiện tích, vị trí, giá cả, tiện ích xung quanh, và các yếu tô thiết kế khác Trong trường hợp khác, người dùng có thể chỉ quan tâm đến một tô hợp cụ thê một vài chỉ tiết trong các chỉ tiết kế trên, khi đó rất khó đề liên kết đủ đánh giá với số lượng tô hợp lớn
Phương pháp khuyến nghị được tính toán độc lập với các xếp hạng cá nhân của người dùng: hoặc đựa trên sự tương đồng giữa các yêu cầu của khách hàng với sản phẩm, hoặc dựa trên các quy tắc khuyến nghị rõ ràng (/annach và cộng sự, 2010) Việc chỉ định rõ yêu cầu sẽ đem lại sự kiểm soát lớn hơn của người dùng đối với quá trình khuyến nghị
LI Hệ thống khuyến nghị dựa trên tri thức được chia thành 2 loại: Khuyến nghị dựa trên ràng buộc (Constraint-based) và dựa vào trường hợp (Case-based) (Aggarwal, 2016)
Khuyến nghị dựa trên ràng buộc (Constraint-based): Cho phép người dùng chỉ định các yêu câu về thuộc tính của sản phẩm, và hệ thống có nhiệm vụ cô gắng đưa ra kết quả đề xuất dựa vào yêu cầu của người dùng Nếu không có kết quả nào được tìm thấy hoặc số lượng kết quả trả về quá ít, người đùng phải điều
26 chỉnh yêu cầu Quá trình tìm kiếm được lặp đi lặp lại cho đến khi người dùng tìm được kêt quả mà họ mong muôn
FOR HOME BUYING (constraint-example.com) EXAMPLE OF HYPOTHETICAL CONSTRAINT-BASED INTERFACE
| WOULD LIKE TO BUY A HOUSE SATISFYING THE FOLLOWING REQUIREMENTS:
MIN BR f MAX BR Vv MIN BATH Vv ‘MAX BATH "‹4 MIN PRICE Vv MAX PRICE Y HOME STYLE Vv ZIP CODE
Hinh 2 6 Hinh anh vi du vé giao dién ban đâu cho trình giới thiệu dựa trên sự ràng
27 buộc ¡ Khuyến nghị đựa vào trường hợp (Case-based): Cho phép người dùng chỉ định những trường hợp cụ thể làm chuẩn Hệ thống sử dụng các độ đo tương đồng đề tìm các sản phâm tương tự với các trường hợp đã được xác định Kết quả tra về thường được sử đụng như các trường hợp làm chuân mới với một số điều chỉnh tương tác bởi người dùng Ví đụ, khi người đùng thấy một kết quả trả về gân giống với những gì họ muốn, họ có thế một truy vấn lần nữa với mục tiêu đó, nhưng với một số thuộc tính được thay đối theo sở thích của họ Quá trình tương tác này được sử dụng đề hướng người dùng đên các mục tiêu của họ.
INTERFACE FOR HOME BUYING (critique-example.com) EXAMPLE OF HYPOTHETICAL CASE-BASED RECOMMENDATION
| WOULD LIKE TO BUY A HOUSE SIMILAR TO ONE WITH THE FOLLOWING FEATURES:
NUMBEROFBR = i NUMBER OF BATH [i HomesTve =
| WOULD LIKE TO BUY AN HOUSE JUST LIKE THE ONE AT THE FOLLOWING ADDRESS: wy v
Hình 2 7 Hình ảnh Vĩ dụ về giao điện ban đâu cho trình giới thiệu dụta vào trường hop (Case-based)
Phương pháp dựa vào tri thức khắc phục được các trường hợp gặp vấn đề khởi động lạnh khi không có sẵn nhiều dữ liệu Tuy nhiên, vì sử dụng các thuộc tính liên quan đến nội dung, hệ thống khuyến nghị dựa trên tri thức sẽ thừa hưởng một số nhược điểm giống như các hệ thống dựa trên nội dung Ví đụ, các khuyến nghị đôi khi có thé trở nên dễ đoán vì không tận dụng được đánh giá của các người dùng khác
2.6.6 Demographic Recommender Systems (Khuyén nghi theo nhan khẩu học)
Hệ thống đưa ra các đề xuất dựa trên hồ sơ nhân khẩu học của người dùng, chang han như tuổi, giới tính, địa chỉ, nghề nghiệp, sở thích, Hệ thống sử dụng những thông tin này đề đề xuất các sản phâm phù hợp với nhóm đối tượng người dùng nhất định Ý tưởng của hệ thống là các phân khúc nhân khẩu học khác nhau sẽ nhận được các đề xuất khác nhau
28 Ứng dụng cho phương pháp khuyến nghị dựa trên nhân khẩu học có thê là một trang web bán sách Trang web này sẽ khuyến nghị cho người dùng trẻ tuổi những cuốn sách thuộc thể loại và nội dung phù hợp với độ tuổi của họ, ví dụ như tiểu thuyết, truyện tranh, sách giáo khoa Trong khi đó, người dùng trung niên có thé duoc khuyến nghị những cuốn sách về kinh đoanh, tài chính, sức khỏe và gia đình
2.6.7 Hybrid Recommender Systems (Khuyến nghị lai)
Nhằm cải thiện độ chính xác và tránh được những hạn chế mà một phương pháp lọc thuần túy thường mắc phải, phương pháp khuyến nghị lai (Hybird) - kết hợp các phương pháp lọc khác nhau - được sử dụng để tối ưu hóa hệ thống khuyến nghị và được cho là hiệu quả hơn các phương pháp khuyến nghị đơn lẻ vì một hạn chế của một thuật toán có thê được khắc phục bằng một thuật toán khác (7s”:kaywe, 2015) Sự kết hợp các phương pháp lại có thê được thực hiện băng nhiều cách chăng hạn như kết hợp kết quả của nhiều phương pháp khuyến nghị; sử dụng một số bộ lọc dựa trên nội dung trong phương pháp cộng tác, sử dụng một số bộ lọc cộng tác theo cách tiếp cận dựa trên nội dung, hay tạo ra một hệ thống khuyến nghị thống nhất tập hợp cả hai cách tiếp cận
^ V User profile and —— contextual parameters \ a — ° AE; i1
Hinh 2 8 Hinh anh khuyén nghi lai ( Case-based )
Một ví dụ về phương pháp khuyến nghị lai là hệ thống khuyến nghị phim của IMDB
Hệ thống này sử dụng các kỹ thuật lọc dựa trên nội dung để xác định các đặc điểm của phim, như thê loại, điễn viên, đạo diễn, và các yếu tô khác Đồng thời, hệ thống cũng sử dụng lọc dựa trên hành vi n Các teười dùng, tức là xem xét những phưn mà người dùng đã xem, đánh giá và yêu thích.hông tin này sau đó được kết hợp bằng một mô hình học máy để đưa ra các gợi ý phù hợp với sở thích của người dùng Ngoài ra, IMDB cũng sử dụng lọc dựa trên đánh giá của cộng đồng người dùng để cải thiện độ chính xác của hệ thống khuyén nghị
Phương pháp Cơ sở Input khuyến nghị Collaborative Dựa trên sở thích của Xếp hạng, bình luận của các
Filtering người dùng người dùng
Content-Based Dựa trên thông tin chị Mô tả sản phẩm, từ khóa, đặc tiết của sản phâm điểm sản phâm
Demographic Recommender Systems (Khuyén nghi theo nhan khẩu học) 29
Hệ thống đưa ra các đề xuất dựa trên hồ sơ nhân khẩu học của người dùng, chang han như tuổi, giới tính, địa chỉ, nghề nghiệp, sở thích, Hệ thống sử dụng những thông tin này đề đề xuất các sản phâm phù hợp với nhóm đối tượng người dùng nhất định Ý tưởng của hệ thống là các phân khúc nhân khẩu học khác nhau sẽ nhận được các đề xuất khác nhau
28 Ứng dụng cho phương pháp khuyến nghị dựa trên nhân khẩu học có thê là một trang web bán sách Trang web này sẽ khuyến nghị cho người dùng trẻ tuổi những cuốn sách thuộc thể loại và nội dung phù hợp với độ tuổi của họ, ví dụ như tiểu thuyết, truyện tranh, sách giáo khoa Trong khi đó, người dùng trung niên có thé duoc khuyến nghị những cuốn sách về kinh đoanh, tài chính, sức khỏe và gia đình
2.6.7 Hybrid Recommender Systems (Khuyến nghị lai)
Nhằm cải thiện độ chính xác và tránh được những hạn chế mà một phương pháp lọc thuần túy thường mắc phải, phương pháp khuyến nghị lai (Hybird) - kết hợp các phương pháp lọc khác nhau - được sử dụng để tối ưu hóa hệ thống khuyến nghị và được cho là hiệu quả hơn các phương pháp khuyến nghị đơn lẻ vì một hạn chế của một thuật toán có thê được khắc phục bằng một thuật toán khác (7s”:kaywe, 2015) Sự kết hợp các phương pháp lại có thê được thực hiện băng nhiều cách chăng hạn như kết hợp kết quả của nhiều phương pháp khuyến nghị; sử dụng một số bộ lọc dựa trên nội dung trong phương pháp cộng tác, sử dụng một số bộ lọc cộng tác theo cách tiếp cận dựa trên nội dung, hay tạo ra một hệ thống khuyến nghị thống nhất tập hợp cả hai cách tiếp cận
^ V User profile and —— contextual parameters \ a — ° AE; i1
Hinh 2 8 Hinh anh khuyén nghi lai ( Case-based )
Một ví dụ về phương pháp khuyến nghị lai là hệ thống khuyến nghị phim của IMDB
Hệ thống này sử dụng các kỹ thuật lọc dựa trên nội dung để xác định các đặc điểm của phim, như thê loại, điễn viên, đạo diễn, và các yếu tô khác Đồng thời, hệ thống cũng sử dụng lọc dựa trên hành vi n Các teười dùng, tức là xem xét những phưn mà người dùng đã xem, đánh giá và yêu thích.hông tin này sau đó được kết hợp bằng một mô hình học máy để đưa ra các gợi ý phù hợp với sở thích của người dùng Ngoài ra, IMDB cũng sử dụng lọc dựa trên đánh giá của cộng đồng người dùng để cải thiện độ chính xác của hệ thống khuyén nghị
Phương pháp Cơ sở Input khuyến nghị Collaborative Dựa trên sở thích của Xếp hạng, bình luận của các
Filtering người dùng người dùng
Content-Based Dựa trên thông tin chị Mô tả sản phẩm, từ khóa, đặc tiết của sản phâm điểm sản phâm
Knowledge-Based Dựa trên kiến thức về Thông tin chỉ tiết về người đùng, người dùng kiến thức về sản phâm Demographic Dựa trên nhóm đối Thông tin nhân khẩu học của tượng người dùng người dùng
Hybrid Kết hợp các phương Các dạng đầu vào khác nhau tùy pháp khuyến nghị theo phương pháp kết hợp
Bảng 2 1 Bảng so sánh các phương pháp khuyên nghị
CHUONG 3: CAC UNG DUNG HE THONG KHUYEN NGHI TRONG
3.1 Giới thiệu hệ thống khuyến nghị trong thương mại điện tử
3.1.1 Vai trò và lợi ích của Hệ thống khuyến nghị sản phẩm trong thương mại điện tử
Trong thời đại kỹ thuật số phát triển mạnh mẽ và nền kinh tế cạnh tranh ngày càng khốc liệt, các công ty cần phát triển nhiều sản phẩm để đáp ứng nhu cầu ngày cảng cao của khách hàng Sự phát triển của Thương mại điện tử đã cho phép các công ty cung cấp cho khách hàng nhiều lựa chọn hơn trong cách thức mua hàng và số lượng sản phâm Tuy nhiên, khi mở rộng mức độ tùy chỉnh mới này, lượng thông tin khách hàng phải xử lý trước khi chọn được sản phẩm đáp ứng nhu cầu của mỉnh tăng lên, khiến người tiêu dùng thường gặp khó khăn trong việc tìm kiếm và lựa chọn sản phẩm
31 phủ hợp với nhu cầu của mình Một giải pháp cho vấn đề quá tải thông tín này là sử dụng hệ thống khuyến nghị sản phẩm
Hệ thống khuyến nghị là một công cụ hỗ trợ đắc lực cho các trang web thương mại điện tử, giúp người dùng tìm kiếm và mua sản phẩm một cách nhanh chóng và dễ dàng hơn Bằng cách sử dụng các thuật toán học máy và phân tích dữ liệu, hệ thống này có thê đề xuất sản phâm cho khách hàng dựa trên hành vi mua sắm trước đó, lịch sử đánh giá và sở thích của từng người đùng Nói chung, các kỹ thuật này là một phần của việc cá nhân hóa trên một trang web, bởi vì chúng giúp trang web thích nghị với ting khach hang Theo Jeff Bezos, CEO cua Amazon, sự thành công của ngành bán lẻ trên thương mại điện tử phụ thuộc vào khả năng phân tích nhu cầu của từng khách hàng và tạo ra trải nghiệm dành riêng cho họ: “Nếu chúng tôi có 4,5 triệu khách hàng, chúng tôi nên có 4,5 triệu cửa hàng” (Walker, 1998)
Ngày nay, hệ thống khuyến nghị đóng vai trò như một nhân viên bán hàng ảo, hơn là một công cụ marketine (Schafer, 1999) Nhận thức được tầm quan trọng và vai trò của hệ thống khuyến nghị, các trang thương mại điện tử lớn trên thế giới như Amazon, Alibaba, eBay cùng với các trang thương mại điện tử thành công ở Việt Nam như Shopee, Tiki, Lazada đều ứng dụng hệ thống khuyến nghị sản phẩm một cách chủ động và hiệu quả để tăng trải nghiệm mua sắm của người dùng và doanh số bán hàng của mình theo nhiều cách khác nhau Tuy nhiên, việc sử dụng hệ thống khuyến nghị sản phẩm cũng đặt ra nhiều thách thức đối với các trang thương mại điện tử Một trong số đó là việc thu thập và xử lý đữ liệu khách hàng, đảm bảo tính bảo mật và riêng tư cho người dùng, và giải quyết vấn đề về độ chính xác và độ tin cậy của hệ thống
Hệ thống đề xuất sản phẩm trong thương mại điện tử thu thập các thông tin về thuộc tính và hành ví người dùng thông qua các phản hồi rõ ràng, chăng hạn như lịch sử mua hàng và đánh giá; hoặc phản hồi gián tiếp, chăng hạn như lịch sử điều hướng và liên kết được theo dõi, từ đó ngầm định suy ra sở thích của người dùng Sau khi thu thập thông tin người dùng, hệ thông đề xuất sản phâm sử dụng các thuật toán học máy để lọc và khai thác các đặc điểm của người dùng và dự đoán hoặc đề xuất các sản phẩm mà người dùng có thể thích mua Tiếp đến, hệ thống sẽ cập nhật lại mô hình người dùng dựa trên các phản hồi mới Quá trình đề xuất có thê được biếu diễn chung như hình
Hinh 3 1 Hình ảnh quy trình hoạt động của HIKN
3.2 Xây dựng hệ thống khuyến nghị
3.2.1 Dữ liệu Ở giai đoạn thu thập thông tin, những dữ liệu về người dùng được hệ thống thu thập để tạo nên hồ sơ người dùng hoặc mô hình cho các tác vụ dự đoán, bao gồm hành vi người dùng, thuộc tính, nội dung của các sản phẩm họ đã truy cập Các loại dữ liệu được thu thập làm đầu vào cho hệ thống khuyến nghị được chia thành 2 loại: Dữ liệu rõ ràng và dữ liệu ngầm (Isinkaye,20 15)
34 O Dữ liệu rõ ràng: Những phản hồi cụ thê mà người đùng tự nguyện đưa ra về sản phẩm, chẳng hạn như đánh giá sao, đánh giá bằng bài viết, bình luận Khi sử dụng dữ liệu rõ ràng, độ chính xác của các khuyến nghị phụ thuộc vào số lượng và chất lượng đánh giá mà người dùng cung cấp Dữ liệu rõ ràng được cho là đáng tin cậy khi cung cấp thông tin cy thé va chính xác về sở thích và đánh giá của người dùng, giúp cải thiện độ chính xác của hệ thống khuyến nghị Đồng thời, nó thê hiện sự minh bạch trong quy trình khuyến nghị Tuy nhiên, để có được loại dữ liệu này, đòi hỏi cần có sự chủ động từ người dùng trong việc đưa ra đánh giá và đôi khi, các đánh giá và phản hồi không phản ánh đúng ý kiến thực sự của họ Mỗi người đùng có sở thích và tiêu chuẩn riêng, và việc thu thập dữ liệu rõ ràng từ mọi người dùng có thể gặp khó khăn trong việc đảm bảo tính đại điện và khả năng áp dụng rộng rãi cho tất cả người dùng
Dữ liệu ngầm: Những thông tin về sở thích của người dùng được suy luận băng cách theo dõi các hoạt động của họ như lịch sử mua hàng, lịch sử duyệt web, thời g1an truy cập vào một nội dung nhất định, các đường liên kết được truy cập, nội đung email hay các cú nhấp chuột Dữ liệu ngầm không đòi hỏi sự tương tác hoặc phản hỗi rõ ràng từ người dùng, quy trình theo đối hành vi và thu thập thông tin người dùng được diễn ra liên tục, do đó hệ thống có thể sử dụng thông tin này để cung cấp gợi ý ngay lập tức Đồng thời, nhờ đữ liệu ngầm, hệ thống có khả năng phát hiện ra những xu hướng và sở thích mới mà người dùng chưa thê hiện rõ ràng, từ đó đưa ra những gợi ý đa dạng và tiềm năng mà người đùng có thể quan tâm Tuy nhiên, do đữ liệu ngầm không được lấy từ phản hỗi trực tiếp của người dùng, sự suy luận ngầm định từ hành vi có thể dẫn đến kết quả không chính xác Phần lớn các dữ liệu ngầm là dữ liệu định tính, thiếu đi khả năng thế hiện mức độ hài lòng cũng như thái độ của người dùng đối với sản phâm, ảnh hướng đến khả năng suy diễn và chất lượng của khuyến nghị Ngoài ra, không thể đảm bảo rằng người dùng có thích một sản phâm nảo đó chỉ dựa vào việc họ đã dành thời gian truy cập nó.
Dữ liệu rõ ràng | Dữ liệu ngầm Độ chính xác Cao Thấp Độ phong phú Thấp Cao
Sự nhạy bén với ngữ Có Có cảnh Tham chiếu đo lường Tuyệt đối Tương đối
Bảng 3 1 Bảng so sánh dữ liệu rõ ràng và dữ liệu ngâm Để xây dựng một hệ thống khuyến nghị hiệu quả, cần tận dụng điểm mạnh của cả hai loại đữ liệu ngầm và đữ liệu rõ ràng Điều này có thể được thực hiện bằng cách: Sử dụng đữ liệu ngầm đề kiểm tra các phản hồi rõ ràng (đánh giá, bình luận) Ví dụ, nếu một người dùng A cung cấp phản hồi rõ ràng rằng anh ta thích thế loại sách kinh tế, nhưng dữ liệu ngầm từ hành vi của A lại cho thấy gần đây A thường xem các sách về khoa học, điều này đặt nghi vẫn vẻ tính chính xác của phản hồi rõ ràng Hệ thống có thể sử dụng đữ liệu ngầm như một cơ sở đề cung cấp khuyến nghị hoặc gợi ý tốt hơn, trong trường hợp này là cung cấp thêm các gợi ý về mục sách khoa học cho người dùng A
3.2.2 Xây dựng hệ thống khuyến nghị trong thương mại điện tử
Bằng cách xây dựng một hệ thống khuyến nghị đáng tin cậy và hiệu quả, doanh nghiệp có thế nâng cao trải nghiệm mua sắm của khách hàng, tạo sự tương tác và củng cô lòng trung thành của khách hàng Quá trình xây dựng hệ thống khuyến nghị trong thương mại điện tử đòi hỏi sự kết hợp giữa khoa học đữ liệu, kỹ thuật máy tính và hiệu biết sâu sắc về thị trường và người dùng Quy trình xây dựng một hệ thống gợi ý sản phâm trên trang thương mại điện tử gồm những giai đoạn như sau:
OC Thu thập đữ liệu
35 ¡ Tiền xử lý đữ liệu: Thực hiện sàng lọc và chuẩn hóa dữ liệu để đễ dàng xây dựng mô hình
] Phân tích đữ liệu: Áp dụng các phương pháp phân tích để tìm ra xu hướng, điểm tương đồng trong dữ liệu và mối quan hệ giữa người dùng - sản phâm ù Xõy dựng mụ hỡnh khuyến nghị: Sử dụng cỏc phương phỏp khuyến nghị lọc cộng tác, khuyến nghị dựa trên nội dung, dựa trên tri thức đề tạo ra mô hình khuyến nghị phù hợp với đặc tính dữ liệu đầu vào cũng như đối tượng khách hàng
CAC UNG DUNG HE THONG KHUYEN NGHI TRONG THUONG
Vai trò và lợi ích của Hệ thống khuyến nghị sản phẩm trong thương mại ủ10 11117 32 3.1.2 Thực trạng hiện nay - L 1 20 2201121112111 1211152111211 1181211115281 1g 33 3.1.3 Quy trình hoạt động - - 2L 2 1020121201121 1121 1112111111 11511 111111181 kk ra 33 3.2 Xây dựng hệ thống khuyến nghị 34 3.2.1 Dit
Trong thời đại kỹ thuật số phát triển mạnh mẽ và nền kinh tế cạnh tranh ngày càng khốc liệt, các công ty cần phát triển nhiều sản phẩm để đáp ứng nhu cầu ngày cảng cao của khách hàng Sự phát triển của Thương mại điện tử đã cho phép các công ty cung cấp cho khách hàng nhiều lựa chọn hơn trong cách thức mua hàng và số lượng sản phâm Tuy nhiên, khi mở rộng mức độ tùy chỉnh mới này, lượng thông tin khách hàng phải xử lý trước khi chọn được sản phẩm đáp ứng nhu cầu của mỉnh tăng lên, khiến người tiêu dùng thường gặp khó khăn trong việc tìm kiếm và lựa chọn sản phẩm
31 phủ hợp với nhu cầu của mình Một giải pháp cho vấn đề quá tải thông tín này là sử dụng hệ thống khuyến nghị sản phẩm
Hệ thống khuyến nghị là một công cụ hỗ trợ đắc lực cho các trang web thương mại điện tử, giúp người dùng tìm kiếm và mua sản phẩm một cách nhanh chóng và dễ dàng hơn Bằng cách sử dụng các thuật toán học máy và phân tích dữ liệu, hệ thống này có thê đề xuất sản phâm cho khách hàng dựa trên hành vi mua sắm trước đó, lịch sử đánh giá và sở thích của từng người đùng Nói chung, các kỹ thuật này là một phần của việc cá nhân hóa trên một trang web, bởi vì chúng giúp trang web thích nghị với ting khach hang Theo Jeff Bezos, CEO cua Amazon, sự thành công của ngành bán lẻ trên thương mại điện tử phụ thuộc vào khả năng phân tích nhu cầu của từng khách hàng và tạo ra trải nghiệm dành riêng cho họ: “Nếu chúng tôi có 4,5 triệu khách hàng, chúng tôi nên có 4,5 triệu cửa hàng” (Walker, 1998)
Ngày nay, hệ thống khuyến nghị đóng vai trò như một nhân viên bán hàng ảo, hơn là một công cụ marketine (Schafer, 1999) Nhận thức được tầm quan trọng và vai trò của hệ thống khuyến nghị, các trang thương mại điện tử lớn trên thế giới như Amazon, Alibaba, eBay cùng với các trang thương mại điện tử thành công ở Việt Nam như Shopee, Tiki, Lazada đều ứng dụng hệ thống khuyến nghị sản phẩm một cách chủ động và hiệu quả để tăng trải nghiệm mua sắm của người dùng và doanh số bán hàng của mình theo nhiều cách khác nhau Tuy nhiên, việc sử dụng hệ thống khuyến nghị sản phẩm cũng đặt ra nhiều thách thức đối với các trang thương mại điện tử Một trong số đó là việc thu thập và xử lý đữ liệu khách hàng, đảm bảo tính bảo mật và riêng tư cho người dùng, và giải quyết vấn đề về độ chính xác và độ tin cậy của hệ thống
Hệ thống đề xuất sản phẩm trong thương mại điện tử thu thập các thông tin về thuộc tính và hành ví người dùng thông qua các phản hồi rõ ràng, chăng hạn như lịch sử mua hàng và đánh giá; hoặc phản hồi gián tiếp, chăng hạn như lịch sử điều hướng và liên kết được theo dõi, từ đó ngầm định suy ra sở thích của người dùng Sau khi thu thập thông tin người dùng, hệ thông đề xuất sản phâm sử dụng các thuật toán học máy để lọc và khai thác các đặc điểm của người dùng và dự đoán hoặc đề xuất các sản phẩm mà người dùng có thể thích mua Tiếp đến, hệ thống sẽ cập nhật lại mô hình người dùng dựa trên các phản hồi mới Quá trình đề xuất có thê được biếu diễn chung như hình
Hinh 3 1 Hình ảnh quy trình hoạt động của HIKN
3.2 Xây dựng hệ thống khuyến nghị
3.2.1 Dữ liệu Ở giai đoạn thu thập thông tin, những dữ liệu về người dùng được hệ thống thu thập để tạo nên hồ sơ người dùng hoặc mô hình cho các tác vụ dự đoán, bao gồm hành vi người dùng, thuộc tính, nội dung của các sản phẩm họ đã truy cập Các loại dữ liệu được thu thập làm đầu vào cho hệ thống khuyến nghị được chia thành 2 loại: Dữ liệu rõ ràng và dữ liệu ngầm (Isinkaye,20 15)
34 O Dữ liệu rõ ràng: Những phản hồi cụ thê mà người đùng tự nguyện đưa ra về sản phẩm, chẳng hạn như đánh giá sao, đánh giá bằng bài viết, bình luận Khi sử dụng dữ liệu rõ ràng, độ chính xác của các khuyến nghị phụ thuộc vào số lượng và chất lượng đánh giá mà người dùng cung cấp Dữ liệu rõ ràng được cho là đáng tin cậy khi cung cấp thông tin cy thé va chính xác về sở thích và đánh giá của người dùng, giúp cải thiện độ chính xác của hệ thống khuyến nghị Đồng thời, nó thê hiện sự minh bạch trong quy trình khuyến nghị Tuy nhiên, để có được loại dữ liệu này, đòi hỏi cần có sự chủ động từ người dùng trong việc đưa ra đánh giá và đôi khi, các đánh giá và phản hồi không phản ánh đúng ý kiến thực sự của họ Mỗi người đùng có sở thích và tiêu chuẩn riêng, và việc thu thập dữ liệu rõ ràng từ mọi người dùng có thể gặp khó khăn trong việc đảm bảo tính đại điện và khả năng áp dụng rộng rãi cho tất cả người dùng
Dữ liệu ngầm: Những thông tin về sở thích của người dùng được suy luận băng cách theo dõi các hoạt động của họ như lịch sử mua hàng, lịch sử duyệt web, thời g1an truy cập vào một nội dung nhất định, các đường liên kết được truy cập, nội đung email hay các cú nhấp chuột Dữ liệu ngầm không đòi hỏi sự tương tác hoặc phản hỗi rõ ràng từ người dùng, quy trình theo đối hành vi và thu thập thông tin người dùng được diễn ra liên tục, do đó hệ thống có thể sử dụng thông tin này để cung cấp gợi ý ngay lập tức Đồng thời, nhờ đữ liệu ngầm, hệ thống có khả năng phát hiện ra những xu hướng và sở thích mới mà người dùng chưa thê hiện rõ ràng, từ đó đưa ra những gợi ý đa dạng và tiềm năng mà người đùng có thể quan tâm Tuy nhiên, do đữ liệu ngầm không được lấy từ phản hỗi trực tiếp của người dùng, sự suy luận ngầm định từ hành vi có thể dẫn đến kết quả không chính xác Phần lớn các dữ liệu ngầm là dữ liệu định tính, thiếu đi khả năng thế hiện mức độ hài lòng cũng như thái độ của người dùng đối với sản phâm, ảnh hướng đến khả năng suy diễn và chất lượng của khuyến nghị Ngoài ra, không thể đảm bảo rằng người dùng có thích một sản phâm nảo đó chỉ dựa vào việc họ đã dành thời gian truy cập nó.
Dữ liệu rõ ràng | Dữ liệu ngầm Độ chính xác Cao Thấp Độ phong phú Thấp Cao
Sự nhạy bén với ngữ Có Có cảnh Tham chiếu đo lường Tuyệt đối Tương đối
Bảng 3 1 Bảng so sánh dữ liệu rõ ràng và dữ liệu ngâm Để xây dựng một hệ thống khuyến nghị hiệu quả, cần tận dụng điểm mạnh của cả hai loại đữ liệu ngầm và đữ liệu rõ ràng Điều này có thể được thực hiện bằng cách: Sử dụng đữ liệu ngầm đề kiểm tra các phản hồi rõ ràng (đánh giá, bình luận) Ví dụ, nếu một người dùng A cung cấp phản hồi rõ ràng rằng anh ta thích thế loại sách kinh tế, nhưng dữ liệu ngầm từ hành vi của A lại cho thấy gần đây A thường xem các sách về khoa học, điều này đặt nghi vẫn vẻ tính chính xác của phản hồi rõ ràng Hệ thống có thể sử dụng đữ liệu ngầm như một cơ sở đề cung cấp khuyến nghị hoặc gợi ý tốt hơn, trong trường hợp này là cung cấp thêm các gợi ý về mục sách khoa học cho người dùng A.
Xây dựng hệ thống khuyến nghị trong thương mại điện tử
Bằng cách xây dựng một hệ thống khuyến nghị đáng tin cậy và hiệu quả, doanh nghiệp có thế nâng cao trải nghiệm mua sắm của khách hàng, tạo sự tương tác và củng cô lòng trung thành của khách hàng Quá trình xây dựng hệ thống khuyến nghị trong thương mại điện tử đòi hỏi sự kết hợp giữa khoa học đữ liệu, kỹ thuật máy tính và hiệu biết sâu sắc về thị trường và người dùng Quy trình xây dựng một hệ thống gợi ý sản phâm trên trang thương mại điện tử gồm những giai đoạn như sau:
OC Thu thập đữ liệu
35 ¡ Tiền xử lý đữ liệu: Thực hiện sàng lọc và chuẩn hóa dữ liệu để đễ dàng xây dựng mô hình
] Phân tích đữ liệu: Áp dụng các phương pháp phân tích để tìm ra xu hướng, điểm tương đồng trong dữ liệu và mối quan hệ giữa người dùng - sản phâm ù Xõy dựng mụ hỡnh khuyến nghị: Sử dụng cỏc phương phỏp khuyến nghị lọc cộng tác, khuyến nghị dựa trên nội dung, dựa trên tri thức đề tạo ra mô hình khuyến nghị phù hợp với đặc tính dữ liệu đầu vào cũng như đối tượng khách hàng
O Kiểm định và tối ưu hóa hệ thống: Thực hiện đánh giá chất lượng và hiệu suất của hệ thống bằng các chỉ số về độ chính xác và độ bao phủ Từ đó có sự điều chỉnh đề hoàn thiện hệ thống Triển khai hệ thống vào môi trường thương mại điện tử Theo dõi hoạt động của hệ thống và phản hồi từ người dùng Đồng thời linh hoạt cải tiến liên tục dé đáp ứng nhu cầu và nâng cao trải nghiệm mua sắm của người dùng.
Chỉ số đánh giá thuật toán khuyến nghị 5-5 c2 1E SE122212111 1x52 cxe 37 3.3 Chiến lược khuyến nghị sản phẩm và các hình thức gợi ý sản phẩm
Chất lượng của thuật toán học máy dùng trong khuyến nghị có thế được đánh giá bằng nhiều tiêu chí khác nhau, có thê là độ chính xác hoặc độ bao phủ Độ chính xác là tỉ lệ giữa các đề xuất chính xác trên tất cả các đề xuất mà hệ thống có thể đề xuất Trong khi đó, độ bao phủ đo lường tỷ lệ các sản phẩm được đề xuất bởi hệ thống trong không gian tìm kiếm so với tổng số sản phẩm có sẵn trong cơ sở đữ liệu (Isinkaye, 2015)
Chỉ số đo lường độ chính xác được chia thành 2 loại: chỉ số về độ chính xác thống kê và chỉ số về độ chính xác trong hỗ trợ quyết định
Chỉ số về độ chính xác thông kê (Stafistical accwracy rmefriecs): đánh giá độ chính xác của phương pháp khuyến nghị bằng cách trực tiếp so sánh xếp hạng được kỳ vọng và xếp hạng thực tế của người dùng Chỉ số này thường được đo bằng sai số tuyệt đối trung bình (Mean Absolute Error - MAE)
Trong d6 Pu,i 1a xép hang dy đoán của người dùng đối với sản phẩm, ruj¡ là xếp hạng thực tế, N là tổng lượt đánh giá, xếp hạng của sản phẩm đó
Chí số về độ chỉnh xác trong hé tro quyét dinh (Decision support accuracy mefries): xem quy trình khuyến nghị là một phép toán nhị phân phân biệt sản phẩm tốt và sản phâm không tốt Precision-Recall là một phép đo hiệu quả thường được sử dụng trong bài toán phân loại khi dữ liệu của các lớp có sự chênh lệch lớn với nhau
Precision = Sản phâm được gợi ý chính xác Tông số sản phẩm được gợi ý Recall = Sản phâm được gợi ý chính xác Tổng số sản phâm gợi ý hữu ích Ngoài ra còn có phép đo F nhằm đơn giản hóa Precision và Recall thành một chỉ số duy nhất Kết quả đưa ra khiến cho việc so sánh giữa các thuật toán và tập đữ liệu dễ dàng hơn
F-measure= 2PRP+R Chí số đo lường độ bao phủ: phần trăm các sản phâm và người dùng mà hệ thống khuyến nghị có thê đưa ra dự đoán Quá trình dự đoán có thế trở nên bất khả thí nêu không có hoặc có quá ít người đùng đánh giá sản phẩm
3.3 Chiến lược khuyến nghị sản phẩm và các hình thức gợi ý sản phẩm
Việc khuyến nghị sản phẩm đến với khách hàng, người dùng trên các sàn TMĐT đóng vai trò quan trọng, là cơ hội đê thâu hiệu họ, mang đên sự hài lòng, xây dựng môi quan hệ giữa khách hàng và hãng hàng Vì vậy các chiến lược khuyến nghị sản phẩm phải được xác định rõ ràng đề vận hành tốt Có ba mức độ chiến lược cơ bản như sau:
37 O Chién lugc khuyén nghi ton cau (Global Recommendation Strategies): day là chiến lược đễ đàng thực thi nhất, có thê áp đụng cho tất cả người dùng mới và cũ trên nền tảng TMĐT, Các chiến lược này thường bao gồm các hình thức gợi ý như:
Giới thiệu sản phẩm mới đến với khách hàng: giới thiệu cho khách hàng những sản pham mới mà họ chưa từng tìm kiếm đề khơi gợi cảm hứng mua hàng 1 Gợi ý các sản phẩm bán chạy nhất trên các danh mục sản phẩm
Gợi ý các sản phâm đang là xu hướng O Goi y san pham theo mùa: gợi nhắc khách hàng về những sự kiện đặc biệt hoặc các kì nghỉ lễ sắp tới nhăm gợi nhu cầu mua sắm cho địp đó
Do khuyến nghị toàn cầu không dựa trên dữ liệu cá nhân hóa nên sẽ hữu dụng khi người dùng hệ thống mới biết hoặc ít biết về trang TMĐT, hoặc khi người dùng lướt dạo để xem các sản phẩm
Chiến lược khuyến nghị theo ngit canh (Contextual Recommendation Sfrafegies): Chiến lược này xem xét các yếu tố hoàn cảnh tác động lên quyết định mua hàng của khách hàng Các sản phẩm được gợi ý cho khách hàng sẽ được dựa trên bối cảnh của sản phâm mà ở đó thê hiện cách mà nó được sử dụng hoặc tiêu thụ; đánh giá các đặc tính của sản phâm (màu sắc, kiểu đáng thiết kế, ), phân loại sản phẩm, các danh mục của nó,
Một số hình thức gợi ý theo chiến lược theo ngữ cảnh có thê kế đến là:
E Gợi ý “Các sản phẩm thường được mua cùng với nhau”: ví dụ khi mua một chiếc đèn pin, hệ thống sẽ gợi ý thêm về việc mua pin cho đèn, hoặc khi mua quan áo sẽ gợi ý các phụ kiện đi kèm
O Gợi ý “Các sản phẩm được xem cùng nhau”
E Gợi ý các sản phẩm tương tự: các sản phâm này sẽ có sự tương tự về mẫu mã, kiểu dáng, màu sắc, nhà cung cấp, mức giá; đưa ra cho khách hàng nhiều sự lựa chọn hơn
ĐẲNH GLÁ TÍNH HIỆU QUÁ CỦA HTKN TRONG GỢI Ý SẢN
Thuận lợi và bất tiện của HTKN trong gợi ý sản phẩm "—
4.5.1 Thuận lợi của HTKN trong gợi ý sản phẩm tÌ Tăng lượng người dùng truy cập Hệ thống đề xuất những gợi ý một cách ngẫu nhiên dựa trên những sở thích của người tiêu dùng, họ sẽ chú ý đến sản phâm và được dẫn dắt đến trang web bán hàng của doanh nghiệp
O Tôi ưu hoá tính cá nhân hoá cho người dùng Hệ thống dựa theo những thị hiếu, tính cách, hành vi của khách hàng đề đề xuất những nội dung liên quan nhất, từ đó cải thiện sự hài lòng và trải nghiệm khách f1 Giữ chân khách hàng hiệu quả
Gợi ý những sản phẩm đáp ứng được nhu cầu thực sự của khách hàng Từ đó, cho họ cảm giác được thấu hiểu từ phía doanh nghiệp, tạo được niềm tin và lòng trung thành của khách hàng dành cho doanh nghiệp
(1 Tăng tĩnh cạnh tranh cho doanh nghiệp Các hệ thống đề xuất có thể mang lại lợi thế cạnh tranh bằng cách đưa ra các đề xuất được cá nhân hóa mà các đoanh nghiệp khác có thê không đáp ứng được
1 Cắt giảm chỉ phí và toi thiểu thời gian công việc Hệ thống đề xuất có thể giúp giảm chỉ phí băng cách tự động hóa quá trình đề xuất sản phẩm cho khách hàng, giảm nhu cầu can thiệp của con người và giảm chỉ phí tiếp thị
O Cải thiện các quyết định của nhà quản trị doanh nghiệp Hệ thống phân tích và giúp các nhà quản trị đánh giá các báo cáo về các số liệu thống kê, từ đó đưa các quyết định sáng suốt hơn
4.5.2 Hạn chế của HTKN trong gợi ý sản phẩm
Hệ thống đề xuất có thê không hiệu quả đối với các sản phâm ngách hoặc thích hợp vì có thế không có đủ đữ liệu để tạo đề xuất chính xác Hệ thống để xuất càng phải làm việc với nhiều mặt hàng và đữ liệu người dùng, thì cơ hội nhận được các đề xuất tốt cảng cao, vì thế trang web bán hàng, trước đó phải có nhiều tiêu dùng đề có thé thu thập những khối dữ liệu đề đưa ra đề xuất f1 Người dùng thay đổi sở thích Hệ thống đôi khi đưa ra những đề xuất không chuân xác khi đối chiếu với thị hiếu người tiêu dùng vì nó không cập nhật kịp thời những thay đối trong dữ liệu người dùng Vì con người có xu hướng thay đổi sở thích theo không gian và thời gian, nên việc có định khối dữ liệu cũ của hệ thống sẽ đưa ra những đề xuất sai lệch
F1 Xâm hại về sự riêng tư Hệ thống đề xuất yêu cầu đữ liệu khách hàng đề tạo đề xuất, điều này có thế dẫn đến mối lo ngại về quyền riêng tư và khả năng lạm dụng đữ liệu khách hàng Đã có nhiều doanh nghiệp, vì tính bảo mật không được đảm bảo mà thông tin khách hàng đã bị tuồng ra bên ngoài, đẫn đến việc nhiều kẻ xấu lợi dụng những thông tin để thực hiện những hành vi không chính đảng
KÉT LUẬN VÀ HUONG PHAT TRIEN
Bài luận cung cấp những kiến thức tông quan về Hệ thống thông tin quản lý (MIS) trong một tô chức, đóng vai trò quan trọng trong việc nắm bắt thông tin và hỗ trợ quá trình quản lý trong tổ chức
Tuy nhiên, MIS cũng đối mặt với một số thách thức, bao gồm tính phức tạp của đữ liệu, bảo mật thông tin và khả năng đáp ứng nhanh chóng với sự thay đôi công nghệ Đề vượt qua những thách thức này, cần có sự đầu tư đúng đắn vào cơ sở hạ tầng công nghệ thông tin, đảm bảo an ninh thông tín và đảo tạo nhân viên về việc sử dụng hiệu quả hệ thống MIS
Bài luận cũng xem xét sự quan trọng và ảnh hướng của hệ thông thông tin khuyến nghị trong các lĩnh vực thương mại điện tử và dịch vụ trực tuyến sử dụng đa dạng các phương pháp khác nhau, cung cấp cho người dùng quy trình xây dựng hệ thông khuyến nghị cùng chiến lược khuyến nghị sản phẩm và các hình thức gợi ý sản phâm
Hệ thống thông tin khuyến nghị đóng vai trò quan trọng trong việc cung cấp gợi ý cá nhân hóa cho người dùng, giúp tăng cường trải nghiệm mua sắm và khám phá sản phâm mới Hệ thống này có khả năng phân tích đữ liệu lớn và xử lý thông tin phức tạp để tạo ra gợi ý chính xác và hiệu quả
Tuy nhiên, có nhiều thách thức mà hệ thống thông tin khuyến nghị phải đối mặt trong thời đại bipg data như hiện nay như xử lý dữ liệu lớn, tính đa dạng của dữ liệu và sự thay đôi của người dùng đòi hỏi sự linh hoạt và khả năng thích nghi cao từ hệ thông
Ngoài ra, bảo mật và quyên riêng tư dữ liệu cũng là những yếu tô quan trọng mà hệ thống khuyến nghị cần chú trọng đề đảm bảo sự tin tưởng của người dùng Đề giải quyết những thách thức này, cần có sự kết hợp giữa công nghệ và phương pháp tiên tiến, bao gồm xứ lý đữ liệu lớn, học máy, và các thuật toán khuyến nghị Đồng thời, việc nắm bắt nhu cầu và sở thích của người dùng cũng rất quan trong dé cung câp gợi ý chính xác và cá nhân hóa
Tóm lại, hệ thống thông tin khuyến nghị đóng vai trò quan trọng trong việc cung cấp gợi ý cá nhân hóa và tăng cường trải nghiệm người dùng Mặc dù đối mặt với nhiều thách thức, nhưng sự phát triển và áp dụng các công nghệ tiên tiến có thể giúp hệ thống khuyến nghị vượt qua những thách thức này và ngày càng hoàn thiện hơn để đáp ứng nhu cầu của người dùng và thúc đây sự phát triển của các ngành công nghiệp liên quan
2 Dw doan trong tuwong lai
Những khó khăn HTKN đối mặt trong thời đại Big Data và hướng phát triển 55
Trong thương mại điện tử hiện đại, đữ liệu không đồng nhất với khối lượng lớn được tạo ra mỗi giây Tập dữ liệu không chỉ bao gồm dữ liệu có cấu trúc như đữ liệu sản phẩm và dữ liệu giao địch mà còn bao gồm cả đữ liệu phi cấu trúc như xếp hạng, nhận xét Dữ liệu lớn mang đến những thách thức mới cho hệ thông khuyến nghị trong quy trình dữ liệu và khung đữ liệu
3.1 Dữ liệu trong thời đại Big Data
Dữ liệu lớn thường đề cập đến đữ liệu phức tạp có 4 tính năng (4V): khối lượng lớn
(Volume), tốc độ sản xuất và cập nhật đữ liệu cao ( Velocity), sự phong phú đa dạng ( Variety) va giá trị dữ liệu cao (veracity) Các công nghệ đề lưu trữ, xứ lý và phân tích dữ liệu đề cập đến Hadoop: khung xử lý phân tán (a distributed processing framework) cho dtr ligu quy mô lớn, cơ sở dữ liệu NoSQL,, học máy ( machine learning) va phan tich thống kê
Trong thương mại điện tử hiện đại, đữ liệu không đồng nhất với khối lượng lớn được tạo ra mỗi giây Tập dữ liệu không chỉ bao gồm dữ liệu có cấu trúc như đữ liệu sản phẩm và dữ liệu giao địch mà còn bao gồm cả đữ liệu phi cấu trúc như xếp hạng, nhận 55 xét Dữ liệu lớn mang đến những thách thức mới cho hệ thông khuyến nghị trong quy trình dữ liệu và khung đữ liệu
Trong thời đại đữ liệu lớn big data, hệ thống khuyến nghị khác với thời đại truyền thống theo nhiều cách, được thể hiện qua bảng sau:
HTKN trong thoi đại dữ liệu lớn
Dữ liệu đầu vào số lượng lớn, đữ liệu đa dạng số lượng nhỏ, dữ liệu có câu trúc
Nhập dữ liệu chủ yếu là dữ liệu phảnhồi | chủ yếu là dữ liệu phản hồi rõ ngầm rang
Cập nhật dữ liệu | Cập nhật nhanh chóng và Cập nhật tính toán định kỳ và tăng cường chính xác
Kết quả khuyến | độ chính xác cao độ chính xác thấp nghị
HTKN thời gian | Yêu cầu thời gian thực cao Yêu cầu thời gian thực trung thực bình
Bang 5 1 Sự khác biệt giữa HTKN thời đại Big Data và tuyên thông
3.2 Những khó khăn HTKN đối mat trong thoi dai big data:
O Hé thong dé xuat voi cau trúc tập trung ( centralized framework ) chỉ có khả năng tính toán hạn chế và các thuật toán độc lập bị hạn chế về khối lượng cũng như hiệu quả xử lý dữ liệu
L1 Giới hạn khả năng tính toán: Hệ thống khuyến nghị truyền thông với cầu trúc tập trung chỉ có khả năng tính toán hạn chế Điều này có nghĩa là quá trình xử lý dữ liệu và tính toán gợi ý bị giới hạn bởi tài nguyên tính 56 toán có sẵn trên một hệ thống duy nhất Khi đữ liệu và khối lượng tính toán tăng lên, hệ thống có thê gặp khó khăn và không đủ khả năng để xử lý một cách hiệu quả
L¡ Thuật toán độc lập bi han chế về xử lý dữ liệu và hiệu quả: Khi hệ thống khuyến nghị dựa trên các thuật toán độc lập, chăng hạn nhự collaborative filtering hodc content-based filtering, ching co gidi han vé khả năng xử lý dữ liệu và tính hiệu quả Điều này có thê xảy ra khi đữ liệu người dùng và sản phẩm trở nên rất lớn và phức tạp Các thuật toán độc lập không thế đáp ứng được nhu cầu xử lý dữ liệu lớn và không thể tạo ra gợi ý chính xác và hiệu quả cho người dùng
— Đề vượt qua nhược điểm này, có thé sir dụng các giải pháp như phân tán hóa tính toán, sử dụng hệ thống phân tán và công nghệ Big Data như Hadoop hoặc Spark để xử lý và phân tích dữ liệu lớn một cách hiệu quả Bên cạnh đó, cần phát triển và áp dụng các thuật toán mạnh mẽ và tiên tiến dé cải thiện khả năng xử lý và hiệu quả của hệ thống khuyến nghị
Khó khăn trong việc xây dựng các mô hình chính xác và hiệu quả cho người dùng và sản phâm co chiéu cao ( high-dimension users and products)
1 Số lượng người dùng và sản phẩm lớn: Các công ty thương mại điện tử lớn sở hữu một lượng người đùng và sản phâm lớn Số lượng người dùng có thể lên đến hàng triệu hoặc thậm chí hàng tỷ người dùng, trong khi số lượng sản phâm có thê lên đến hàng triệu sản phẩm Điều nảy tạo ra một lượng dữ liệu lớn và đa dạng với nhiều thuộc tính (attributes) khác nhau
1 Các mô hình có số chiều cao: Đề xây dựng các mô hình khuyến nghị chính xác và hiệu quả, chúng ta cần xem xét nhiều thuộc tính của người dùng và sản phẩm Điều này dẫn đến sự gia tăng về số chiều trong không gian dữ liệu (hiph- dimensional đata) Khi số chiều tăng lên, các thuật toán và mô hình phải đối mặt với thách thức của việc xử lý dữ liệu lớn và khả năng đánh giá và khai thác thông tin từ các thuộc tính phức tạp này
— Đấi mặt với nhược điểm này, các nhà nghiên cứu và kỹ sư đã tìm cách giải quyết bằng cách sử dụng các phương pháp và công nghệ tiên tiến hơn như 57 machine learning, deep learning và học sâu (deep learning), để xây dựng mô hình khuyến nghị mạnh mẽ hơn có thể xử lý dữ liệu lớn và có số chiều cao Bên cạnh đó, các kỹ thuật giảm chiều dữ liệu (dimensionality reduction) và xử lý dữ liệu thưa (sparse đata) cũng được sử dụng dé giam thiéu tac dong cua số chiều cao và nâng cao hiệu quả của hệ thống khuyến nghị
Hệ thống tư vấn đựa trên các mô hình và tham số cô định hầu như không thích ứng với những thay đối năng động của tiếp thị thương mại điện tử, đặc biệt khi người dùng thay đổi trọng tâm của họ trong các tình huống khác nhau
E Mô hình và tham số cố định: Một số hệ thống khuyến nghị được xây dựng đựa trên các mô hình và tham số cô định, tức là chúng sử dụng các mô hỉnh và tham số đã được định nghĩa trước đó Điều này gây khó khăn trong việc thích nghi với sự thay đổi của môi trường thương mại điện tử, như các chiến lược marketing, sự thay đối của người dùng và sự thay đôi về xu hướng và sở thích ¡ Khả năng thích nghi hạn chế: Khi người dùng thay đổi sự tập trung của minh trong các kịch bản khác nhau, chăng hạn như từ việc tìm kiếm thông tin sang việc mua hàng, hệ thống khuyến nghị cố định có thê gặp khó khăn trong việc cung cấp các gợi ý phù hợp và hiệu quả Điều này là do các mô hình và tham số không thể thích nghi một cách linh hoạt với sự thay đôi của người dùng vả tình huống
— Đề vượt qua nhược điểm này, các hệ thống khuyến nghị cần có khả năng thích nghỉ và linh hoạt Các phương pháp và mô hình động (dynamic) có thể được áp dụng để cập nhật và điều chỉnh các mô hình và tham số dựa trên dữ liệu mới và các yếu to thay doi Sir dung ky thuat hoc may tang cwong (reinforcement learning) va hoc tang cwong (active learning) có thé giúp hệ thống khuyến nghị tự động học và thích nghỉ với sự thay đỗi của người dùng và môi trường thương mại điện tử
Mô hình phân tán và có thê mở rộng dựa trên Hadoop (distributed and scalable recommender system based on Hadoop)
O Mot khung tinh toan phan tán phân cụm điền hình là Hadoop MapReduce
MapRecduece chia quá trình xử lý dữ liệu thành 2 chức năng: Map và Reduee
Map chịu trách nhiệm phân chia nhiệm vụ chính thành nhiều nhiệm vụ nhỏ và Giảm chịu trách nhiệm tích hợp kết quả của nhiều nhiệm vụ phân tán nhỏ
Spark: Spark là một công cụ xử lý đữ liệu lớn mới nỗi, cung cấp một công cụ mạnh mẽ đề xử lý đữ liệu lớn và tính toán phân tán Spark có khả năng lưu trữ kết qua tinh toán trung gian từ luồng click thời gian thực của người dùng vào bộ nhớ và kết hợp với khuyến nghị offline truyền thống Điều này cho phép Spark cung cấp khả năng khuyến nghị thời gian thực trong các tình huỗng đữ liệu lớn, giúp cải thiện độ chính xác và hiệu quả của hệ thống khuyến nghị