Hệ thống khuyến nghị khách hàng

Một phần của tài liệu (LUẬN văn THẠC sĩ) kỹ thuật datamining để khuyến nghị khách hàng trong hệ thống BI (business intelligence) (Trang 25 - 28)

CHƢƠNG 1 : TÌM HIỂU HỆ THỐNG BUSINESS INTELLIGENCE

1. 21 Khai phá dữ liệu(Data Minin g DM)

1.3 Hệ thống khuyến nghị khách hàng

Trong phần này sẽ tìm hiểu về mô hình hệ thống khuyến nghị dựa trên ma trận khả dụng. Giải thích các ưu điểm của người bán hàng trên mạng so với người bán hàng thông thường, (các cửa hàng truyền thống: siêu thị, đại lý….). Cuối cùng khảo sát ngắn gọn các kiểu ứng dụng mà các hệ thống khuyến nghị hỗ trợ hiệu quả. [1]

1.3.1 Ma trận khả dụng

Trong ứng dụng hệ thống khuyến nghị có 2 lớp thực thể, thông thường là ngƣời dùngmặt hàng. Người dùng thường có những ưu tiên cho các mặt hàng nhất định và những ưu tiên này phải lấy được ra từ dữ liệu. Bản thân dữ liệu được thể hiện dưới dạng ma trận khả dụng, theo từng cặp người dùng và mặt hàng, giá trị ma trận thể hiện mức độ ưu tiên người dùng đối với một mặt hàng cụ thể. Các giá trị được lấy từ một tập có thứ tự, ví dụ tập các số tự nhiên từ 1-5 thể hiện số ngôi sao mà người dùng đã đánh giá cho sản phẩm đó trên website, điện thoại di động. Ma trận này được giả thiết là thưa, có nghĩa là phần lớn các phần tử là chưa biết. Một đánh giá chưa biết ngụ ý là thông tin về độ ưu tiên của người dùng về mặt hàng đó là chưa rõ ràng.

Ví dụ: Hình 1.6 chỉ ra 1 ví dụ về ma trận khả dụng, đại diện cho đánh giá của người dùng về các bộ phim theo thang 1 – 5, với cấp độ 5 là cao nhất. Phần tử trống là tình huống người dùng chưa đánh giá cho bộ phim đó. Tên bộ phim là HP1, HP2, and HP3 cho bộ Harry Potter I, II, và III, TW cho bộ phim Twilight, và SW1, SW2, và SW3 cho các tập phim Star Wars 1, 2, and 3. Những người dùng được đại diện bằng các chữ cái từ A đến D

Hình 1.6. Một ma trận khả dụng đại diện cho việc đánh giá các bộ phim theo thang từ 1-5

Chú ý rằng hầu hết các cặp người dùng – bộ phim có giá trị trống, có nghĩa là người dùng không đánh giá bộ phim đó. Thực tế, ma trận thậm chí còn thưa hơn bởi vì những người dùng bình thường chỉ đánh giá phần nhỏ các bộ phim đưa ra.

Mục tiêu của hệ thống khuyến nghị là để dự đoán các giá trị trống trong ma trận khả dụng. Ví dụ: người dùng A có thích SW2 không?. Hệ thống khuyến nghị có thể được thiết kế để đánh giá các thuộc tính của các bộ phim, như là nhà sản xuất, đạo diễn, các ngôi sao, hoặc thậm chí là sự giống nhau về tên của chúng. Nhờ đó, có thể thấy sự tương đồng giữa SW1 và SW2, và kết luận là do A đã không thích SW1 thì khả năng A cũng không thích SW2. Tương tự vậy với nhiều dữ liệu hơn sẽ thấy là những người dùng mà đánh giá cả SW1 và SW2 thì đều có xu hướng đánh giá chúng tương tự nhau. Do đó có thể kết luận rằng A sẽ đánh giá thấp SW2, tương tự như A đánh giá về SW1.

Nhiều ứng dụng có mục tiêu khác nhau, do đó không cần phải dự đoán mọi phần tử trống trong ma trận khả dụng. Thay vì đó chỉ cần tìm ra những phần tử trên một hàng mà có khả năng được đánh giá cao. Trong hầu hết các ứng dụng, hệ thống khuyến nghị không cho người dùng đánh giá tất cả các mặt hàng, mà gợi ý 1 vài mặt hàng mà người dùng đánh giá cao. Thậm chí không cần tìm ra tất cả các mặt hàng với đánh giá được hy vọng là cao nhất, mà chỉ cần tìm 1 tập hợp con của những mặt hàng có đánh giá cao nhất.

Các hệ thống phân phối có giới hạn không gian về kho, và chỉ có thể cho khách hàng xem một phân số nhỏ trong số tất cả các lựa chọn đang có. Mặt khác, các cửa hàng trên mạng có thể cung cấp cho khách hàng tất cả mọi thứ mà cửa hàng có. Do đó, một cửa hàng sách thực thế có thể có vài ngàn quyển sách trên giá, nhưng Amazon có hàng triệu quyển sách. Một tờ báo thực tế có thể in vài tá bài báo mỗi ngày trong khi các dịch vụ tin tức trên mạng cho ra hàng ngàn bài báo mỗi ngày.

Hệ thống khuyến nghị trong thế giới thực tế là khá đơn giản. Đầu tiên, không thể lắp đặt cửa hàng cho từng khách hàng. Do đó, việc lựa chọn nên đưa ra mặt hàng nào sẽ bị chi phối bởi con số có tính chất tổng hợp. Ví dụ, 1 cửa hàng sách sẽ chỉ trưng bày những quyển sách phổ biến nhất, và 1 tờ báo sẽ chỉ in những bài báo mà họ tin rằng hầu hết mọi người sẽ thích. Trong trường hợp đầu tiên, con số bán hàng chi phối sự lựa chọn, trong trường hợp thứ 2, đánh giá của tổng biên tập sẽ chi phối.[2]

1.3.2 Các ứng dụng của hệ thống khuyến nghị

Phần này sẽ đưa ra một số ứng dụng quan trọng của hệ thống khuyến nghị. 1.Ứng dụng của hệ thống khuyến nghị sản phẩm: Có lẽ ứng dụng này được dùng nhiều nhất trong các hệ thống bán lẻ. Amazon hoặc những người bán lẻ qua mạng đưa cho mỗi người dùng một vài gợi ý về sản phẩm mà họ có thể thích mua. Những gợi ý này không phải ngẫu nhiên, mà dựa trên các quyết định mua hàng của các khách hàng khác hoặc dựa vào các kỹ thuật khác mà luận văn này sẽ viết ở chương sau.

2.Các ứng dụng giới thiệu phim: Netflix gợi ý cho khách hàng các bộ phim mà họ có thể thích. Những gợi ý này dựa trên các đánh giá mà người dùng cung cấp, rất giống các đánh giá được gợi ý trong ví dụ ma trận khả dụng ở hình 1.6. Dự đoán đánh giá chính xác là rất quan trọng, do đó Netflix đưa ra 1 giải thưởng 1 triệu đô la cho thuật toán đầu tiên nào mà có thể đánh bại hệ thống gợi ý của Netflix khoảng 10%. Sau 3 năm của cuộc thi giải thưởng được trao cho đội nghiên cứu có tên là “Bellkor’s Pragmatic Chaos,” sau khi cuộc thi xuất hiện trên 3 năm.[4]

3.Ứng dụng bài báo tin tức: Các dịch vụ tin tức đã nỗ lực để nhận dạng các bài báo mà độc giả ưa thích, dựa trên các bài báo mà họ đã đọc trước đây. Sự giống nhau có thể dựa trên sự giống nhau về các từ quan trọng trong các tài liệu, hoặc dựa trên các bài báo mà những người có cùng thị hiếu đọc. Các nguyên tắc

tương tự áp dụng cho việc giới thiệu các blog từ hàng triệu các blog sẵn có, các videos trên YouTube, hoặc các trang khác mà nội dung được cung cấp đều đặn.

1.3.3 Xây dựng ma trận khả dụng

Nếu không có ma trận khả dụng thì hệ thống gần như không thể gợi ý các mặt hàng. Tuy nhiên, để lấy được dữ liệu để xây dựng ma trận khả dụng thường rất khó. Nhìn chung có 2 cách tiếp cận để khám phá giá trị mà người dùng đánh giá các mặt hàng.

1.Hỏi người dùng để đánh giá các mặt hàng. Nhìn chung đánh giá về phim được thực hiện theo cách này. Các trang mạng cung cấp nội dung, như 1 vài trang tin tức hoặc YouTube cũng yêu cầu người dùng đánh giá các mặt hàng. Hướng tiếp cận này hạn chế về hiệu quả vì nhìn chung người dùng không hài lòng khi đưa ra phản ứng của mình và thông tin từ những người như thế này có thể sai lệch so với thông tin từ những người sẵn lòng đưa ra đánh giá.

2.Tham khảo từ hành vi của người dùng. Nu 1 người dùng mua 1 sản phẩm tại Amazon, xem 1 bộ phim trên YouTube, hoặc đọc 1 bài báo tin tức, thì có thể nói là người dùng “thích” sản phẩm đó. Lưu ý rằng loại hệ thống đánh giá này thực sự chỉ có 1 giá trị: 1 có nghĩa là người dùng thích mặt hàng. Thông thường, một ma trận khả dụng với thông tin dữ liệu là 0, tức là người dùng không mua cũng không xem mặt hàng. Tuy nhiên, trong trường hợp này 0 không phải là đánh giá thấp hơn 1, mà là không đánh giá. Khái quát hơn, có thể thấy sự ưa thích của khách hàng từ hành vi chứ không phải việc mua hàng. Ví dụ, nếu 1 khách hàng Amazon xem thông tin về 1 mặt hàng, có thể hiểu là họ thích mặt hàng, thậm chí cả khi họ không mua nó.[5]

Một phần của tài liệu (LUẬN văn THẠC sĩ) kỹ thuật datamining để khuyến nghị khách hàng trong hệ thống BI (business intelligence) (Trang 25 - 28)

Tải bản đầy đủ (PDF)

(74 trang)