Kiến trúc của hệ tìm kiếm thông tin

Một phần của tài liệu Luận văn Nghiên cứu phát triển hệ thống đa phương tiện trên cơ sở phân cụm dữ liệu (Trang 29 - 31)

Hình 2.5: Kiến trúc hệ tìm kiếm thông tin cơ bản

Một hệ thống thông tin tiêu biểu như sau:

Giao diện người sử dụng

(1) Văn bản

NSD Các tính toán cho văn bản

yêu cầu

NSD phản Tính toán cho

(2)

Lập Quản trị cơ sở

hồi câu truy vấn chỉ mục dữ liệu

Tệp chỉ

Truy vấn Tìm kiếm Chỉ mục

mục

Truy tìm tài Cơ sở dữ

Tài liệu đã Sắp xếp liệu văn

sắp xếp

(3) liệu bản

Hệ thống tìm kiếm thông tin gồm có 3 bộ phận chính: bộ phận phân tích văn bản, bộ phận lập chỉ mục, bộ phận so khớp và sắp xếp các tài liệu trả về.

(1)Bộ phận phân tích văn bản: bộ phận này có nhiệm vụ phân tích các văn

bản thu thập được thành các từ riêng biệt. Tương tự, khi người dùng nhập câu truy vấn thì câu truy vấn cũng được phân tích thành các từ riêng biệt.

(2)Bộ phận lập chỉ mục: các từ trích được từ các văn bản thu thập được sẽ được bộ phận này lựa chọn để làm các từ chỉ mục. Các từ chỉ mục phải là các từ thể hiện được nội dung của văn bản. Hai bộ phận phân tích văn bản và lập chỉ mục thường đi liền với nhau và thường chỉ gọi là bộ phận lập chỉ mục.

(3) Bộ phận so khớp và sắp xếp các tài liệu trả về: Các từ trích được từ

câu truy vấn và các từ chỉ mục của văn bản sẽ được so khớp với nhau để tìm ra các tài liệu liên quan đến câu truy vấn. Mỗi tài liệu có một độ tương quan với câu hỏi. Các tài liệu này sẽ được sắp xếp theo độ tương quan giảm dần và trả về cho người sử dụng.

Một phần của tài liệu Luận văn Nghiên cứu phát triển hệ thống đa phương tiện trên cơ sở phân cụm dữ liệu (Trang 29 - 31)

Tải bản đầy đủ (DOC)

(92 trang)
w