Dữ liệu và các nguồn tri thức

Một phần của tài liệu Nghiên cứu và ứng dụng kỹ thuật svd vào hệ thống gợi ý (Trang 28 - 31)

Chương 1 TỔNG QUAN DU LỊCH QUẢNG NGÃI VÀ HỆ THỐNG GỢI Ý

1.3.4 Dữ liệu và các nguồn tri thức

Hệ thống gợi ý là hệ thống xử lý thông tin thu thập từ các loại dữ liệu khác nhau để xây dựng các gợi ý. Dữ liệu chủ yếu là về các sản phẩm cần gợi ý và người dùng sẽ nhận được các gợi ý này. Tuy nhiên, dữ liệu và các nguồn tri thức sẵn có cho các hệ thống gợi ý có thể rất đa dạng. Trong bất kỳ trường hợp nào, dữ liệu được sử dụng bởi hệ thống gợi ý thuộc ba loại: sản phẩm (Item), người dùng (User) và các giao dịch (Transactions), đó chính là quan hệ giữa người dùng và sản phẩm.

1.3.4.1. Sản phẩm

Sản phẩm là các đối tƣợng đƣợc gợi ý. Các sản phẩm này đặc trƣng bởi tiện ích và giá trị của nó. Giá trị của một sản phẩm có thể là tích cực nếu hữu ích cho người dùng, hoặc tiêu cực nếu sản phẩm không phù hợp với người dùng.

Công nghệ cốt lõi của hệ thống gợi ý là sử dụng một loạt các thuộc tính và các tính năng của các item. Ví dụ nhƣ trong một hệ thống gợi ý phim, thể loại (Hài, kinh dị,...) cũng nhƣ tên tuổi các đạo diễn và diễn viên có thể đƣợc sử dụng để mô tả một bộ phim và là đặc điểm nổi bật của nó.

1.3.4.2. Người dùng

Người dùng trong hệ thống gợi ý là đối tượng để gợi ý có những mục tiêu và đặc điểm rất đa dạng. Để cá nhân hoá các gợi ý và tương tác người-máy, hệ thống gợi ý khai thác một loạt các thông tin về người dùng. Những thông tin này có thể đƣợc cấu trúc theo nhiều cách khác nhau và việc chọn thông tin phụ thuộc vào kỹ thuật gợi ý.

Người dùng cũng có thể được mô tả bằng mô hình hành vi của họ, ví dụ trong mô hình trình duyệt, mô hình tìm kiếm du lịch. Ngoài ra, dữ liệu người dùng còn có thể bao gồm mối quan hệ giữa người dùng như mức độ tin cậy của các mối quan hệ giữa các người dùng. Hệ thống gợi ý có thể sử dụng thông tin này để giới thiệu các item từ một người dùng đáng tin cậy khác đã thích item này.

1.3.4.3. Giao dịch

Giao dịch là sự tương tác giữa một người dùng và hệ gợi ý. Nó lưu trữ dữ liệu, thông tin đăng nhập quan trọng được tạo ra trong quá trình tương tác giữa con người - máy tính và có ích cho thuật toán gợi ý mà hệ thống đang sử dụng.

Ví dụ, một bản ghi giao dịch có thể chứa một tham chiếu đến sản phẩm đƣợc lựa chọn bởi người dùng và một mô tả về bối cảnh (mục tiêu người dùng/truy vấn) cho gợi ý cụ thể. Nếu có sẵn, giao dịch cũng có thể bao gồm một thông tin phản hồi rõ ràng của người dùng đã cung cấp, chẳng hạn như đánh giá cho các sản phẩm đƣợc chọn.

Trên thực tế, hình thức phổ biến nhất của dữ liệu giao dịch mà hệ thống gợi ý thu thập là các xếp hạng. Những đánh giá này có thể đƣợc thu thập một cách rõ ràng hoặc dưới dạng các biến ẩn. Trong trường hợp các xếp hạng là rõ ràng, người dùng sẽ được yêu cầu cung cấp ý kiến của mình về một mục trên thang điểm đánh giá.

Các xếp hạng có thể ở các hình thức sau:

- Xếp hạng từ số 1 đến 5 sao.

- Xếp hạng thứ tự chẳng hạn nhƣ: hoàn toàn đồng ý, đồng ý, trung lập, không đồng ý. Ở đây, người dùng được yêu cầu chọn thuật ngữ tốt nhất cho ý kiến của mình.

- Xếp hạng nhị phân lựa chọn mô hình trong đó người dùng chỉ việc chọn mục nào đó tốt hay xấu, thích hay không thích,...

- Hoặc có đánh giá hoặc không đánh giá

Một hình thức khác để đánh giá là gộp tất cả các thẻ liên quan giữa người dùng với các item của hệ thống. Ví dụ, trong hệ thống gợi ý của MovieLens các thẻ biểu diễn việc người dùng cảm thấy thế nào sau khi xem một bộ phim, có thể là "quá dài" hoặc "hành động".

Trong các giao dịch xếp hàng dưới dạng ẩn, mục đích của hệ thống là để đưa ra ý kiến người dùng dựa trên cảc hành động của người dùng đó. Ví dụ, nếu người dùng nhập từ khóa "Yoga" ở Amazon thì anh ta sẽ được cung cấp một danh sách dài các cuốn sách có liên quan. Mặt khác, người dùng có thể click vào một cuốn sách nào đó trong danh sách để nhận đƣợc thêm thông tin.

Ở điểm này, hệ thống có thể suy ra được người dùng có phần quan tâm đến cuốn sách đó.

K T LUẬN CHƯƠNG 1

Trong chương 1, luận văn đã trình bày tổng quan về du lịch Quảng Ngãi, những điểm đạt đƣợc và những hạn chế của du lịch Quảng Ngãi; một số website du lịch Việt Nam, những đặc điểm của chúng; các phương pháp gợi ý. Ngoài ra, trong chương đã giới thiệu về hệ thống gợi ý, nêu chức năng, phát biểu bài toán tổng quát của hệ thống gợi ý, cơ sở dữ liệu và các nguồn tri thức để có thể ứng dụng các kỹ thuật vào hệ thống gợi ý.

Một phần của tài liệu Nghiên cứu và ứng dụng kỹ thuật svd vào hệ thống gợi ý (Trang 28 - 31)

Tải bản đầy đủ (PDF)

(96 trang)