Bài giảng Tìm kiếm và trình diễn thông tin: Bài 12 sẽ giới thiệu tới các bạn bài học về cài đặt mô hình không gian vec-tơ với các vấn đề chính như: Các bước cơ bản; tính độ tương đồng cosine; lựa chọn top K theo cosine; tăng tốc thực hiện truy vấn; giản lược quá trình tính cosine: Đặt vấn đề;...
(IT4853) Tìm kiếm trình diễn thơng tin Cài đặt mơ hình khơng gian vec-tơ Giảng viên TS Nguyễn Bá Ngọc Địa chỉ: Viện CNTT & TT/BM HTTT/B1-603 Email: ngocnb@soict.hust.edu.vn Website: http://is.hust.edu.vn/~ngocnb Nội dung Các bước Tăng tốc thực truy vấn Lọc theo từ truy vấn Phân cấp mục Sắp xếp theo trọng số Phân cụm ngẫu nhiên Tổng quan hệ thống tìm kiếm Sec 6.3.3 Tính độ tương đồng cosine Sec 7.1 Lựa chọn top K theo cosine Sử dụng cấu trúc Heap nhị phân cực đại: Cây nhị phân, giá trị nút gốc lớn nút Nhanh xếp 3 1 Nội dung Các bước Tăng tốc thực truy vấn Lọc theo từ truy vấn Phân cấp mục Sắp xếp theo trọng số Phân cụm ngẫu nhiên Tổng quan hệ thống tìm kiếm Sec 7.1.1 Giản lược trình tính cosine: Đặt vấn đề Chiếm khối lượng tính tốn lớn xếp hạng Cần phải xác định xác top K? Độ tương đồng cosine thể khả phù hợp Một văn khơng nằm top K có khả văn phù hợp Có thể giảm khối lượng tính tốn chấp nhận tập gần với K văn có cosine cao Sec 7.1.1 Giản lược q trình tính cosine: Giải pháp Xác định tập A thỏa mãn: K < |A|