1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc

36 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc tập trung trình bày các vấn đề về tiến trình tìm kiếm và phù hợp phản hồi; mô hình Berry-picking; phương pháp phù hợp phản hồi; các bước tìm kiếm cơ bản với phù hợp phản hồi;...

(IT4853) Tìm kiếm trình diễn thơng tin Tiến trình tìm kiếm phù hợp phản hồi Giảng viên     TS Nguyễn Bá Ngọc Địa chỉ: Viện CNTT & TT/BM HTTT/B1-603 Email: ngocnb@soict.hust.edu.vn Website: http://is.hust.edu.vn/~ngocnb Nội dung    Tiến trình tìm kiếm thơng tin Phương pháp phù hợp phản hồi Giải thuật Rocchio Tiến trình tìm kiếm thơng tin Tiến trình tìm kiếm thông tin  Người dùng tiếp nhận thông tin trình tìm kiếm:     Kéo theo thay đổi nhu cầu thông tin; Kéo theo hiệu chỉnh truy vấn; Nảy sinh nhu cầu thông tin Thông thường nhu cầu thông tin không thỏa mãn văn đơn lẻ:  Trong thực tế nhu cầu thông tin thường thỏa mãn nhiều đoạn thông tin thấy q trình tìm kiếm Mơ hình “Berry-picking” Nội dung    Tiến trình tìm kiếm thơng tin Phương pháp phù hợp phản hồi Giải thuật Rocchio Các bước tìm kiếm với phù hợp phản hồi Người dùng cung cấp truy vấn ban đầu; Cơng cụ tìm kiếm trả tập kết tương ứng Người dùng phản hồi thông tin văn phù hợp văn khơng phù hợp Cơng cụ tìm kiếm sinh câu truy vấn mới:  Hy vọng tốt truy vấn Thực truy vấn cập nhật lại kết quả:  Hy vọng đầy đủ Có thể lặp nhiều vịng phản hồi (Các bước 3, 4, 5) Giả thuyết phù hợp phản hồi    Mục đích: Tăng tính đầy đủ kết tìm kiếm Điều kiện 1: Truy vấn ban đầu thể nhu cầu thông tin người dùng Điều kiện 2: Những văn phù hợp chứa thuật ngữ tương tự    Giải vấn đề từ đồng nghĩa, vd: Ơ tơ / xe máy Nhờ thu văn phù hợp khác sử dụng thông tin phản hồi Tuy nhiên làm giảm tính xác văn phù hợp chứa từ khơng liên quan đến chủ đề Ví dụ tập kết tìm kiếm Truy vấn: “xe máy” 10 Giải thuật Rocchio 1971 (SMART)   qm  q0   Dr   d    j  Dnr d j Dr  d  j  d j Dnr qm: vec-tơ truy vấn thay đổi; q0: vec-tơ truy vấn gốc; Dr Dnr : tập văn phù hợp không phù hợp biết; α, β, γ: trọng số Sự cân giứa α vs β/γ: Có thể sử dụng β/γ cao có nhiều thơng tin phản hồi  Đặt trọng số âm  Được sử dụng hệ thống SMART (1971) 22 Phản hồi phù hợp vs phản hồi không phù hợp   Phản hồi phù hợp đánh giá cao phản hồi không phù hợp Ví dụ, đặt β = 0.75, γ = 0.25 để có trọng số lớn cho phản hồi phù hợp 23 Nhược điểm phù hợp phản hồi  Chi phí cao      Phù hợp phản hồi sinh truy vấn dài Chi phí xử lý truy vấn dài cao Người dùng cần nhiều hời gian để đưa phản hồi Có thể gây khó hiểu tài liệu cụ thể trả sau áp dụng phù hợp phản hồi Cơng cụ tìm kiếm Excite có phù hợp phản hồi đầy đủ thời điểm loại bỏ sau 24 Phù hợp phản hồi giả lập     Giả thiết k văn danh sách xếp hạng kết phù hợp Thực phù hợp phản hồi (v.d., Rocchio) Áp dụng phản hồi giả lập làm xê dịch hoàn toàn truy vấn Trong hệ thống SMART:   Đánh giá tốt nhiều truy vấn Kết thấp cho vài truy vấn 25 Bài tập Các vòng tròn: văn phù hợp, Xs: văn không phù hợp q0 tâm tập văn phù hợp, Hãy xác định qm theo phương pháp Rocchio 26 Minh họa thuật toán Rocchio : Trọng tâm văn phù hợp 27 Minh họa Rocchio không tách biệt văn phù hợp / không phù hợp 28 Minh họa Rocchio trọng tâm văn không phù hợp 29 Minh họa Rocchio 30 Minh họa Rocchio - hiệu vec-tơ 31 Minh họa Rocchio cộng vec-tơ khác biệt vào … 32 Minh họa Rocchio … để lấy 33 Minh họa Rocchio phân biệt văn phù hợp / không phù hợp hiệu 34 Minh họa Rocchio tách biệt văn phù hợp / không phù hợp hiệu 35 Tài liệu tham khảo   Chương IIR Tài nguyên địa http://ifnlp.org/ir   Salton and Buckley 1990 (tài liệu gốc phù hợp phản hồi) Spink, Jansen, Ozmultu 2000: Relevance feedback at Excite 36 ... hồi Giải thuật Rocchio Tiến trình tìm kiếm thơng tin Tiến trình tìm kiếm thơng tin  Người dùng tiếp nhận thơng tin q trình tìm kiếm:     Kéo theo thay đổi nhu cầu thông tin; Kéo theo hiệu chỉnh... nhu cầu thông tin Thông thường nhu cầu thông tin không thỏa mãn văn đơn lẻ:  Trong thực tế nhu cầu thông tin thường thỏa mãn nhiều đoạn thông tin thấy q trình tìm kiếm Mơ hình “Berry-picking”.. .Giảng viên     TS Nguyễn Bá Ngọc Địa chỉ: Viện CNTT & TT/BM HTTT/B 1-6 03 Email: ngocnb@soict.hust.edu.vn Website: http://is.hust.edu.vn/~ngocnb Nội dung    Tiến trình tìm kiếm thông

Ngày đăng: 08/05/2021, 13:18

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w