Máy tìm kiếm thông thường

Một phần của tài liệu TÌM HIỂU WAP VÀ CÔNG CỤ TÌM KIẾM HỖ TRỢ THIẾT BỊ DI ĐỘNG (Trang 47 - 49)

Nguyên lý hoạt động được mô tả như sau:

Hình 4.1.2.2 – Mô hình hoạt động của máy tìm kiếm thông thường

Hệ thống thu thập dữ liệu :

Chịu trách nhiệm tìm thông tin trên Internet từ địa chỉ URL cho trước. Thông thường hệ thống máy tìm kiếm có một server chịu trách nhiệm gửi những URL cho

các robot. Robot tải tài liệu về và lưu trong kho dữ liệu, rồi lại tiếp tục nhận URL khác, tiến trình hoạt động liên tục từ khi khởi động hệ thống. Robot lấy những nội dung dạng văn bản, còn hình ảnh hay âm thanh hay những dữ liệu không thể đánh chỉ mục thì bỏ qua.

Hệ thống phân tích và lập chỉ mục dữ liệu :

Chịu trách nhiệm phân tích tài liệu và lập chỉ mục thông tin cho tài liệu đó. Từ kho dữ liệu hệ thống lập chỉ mục tiến hành lấy từng tài liệu trong kho, lọc bỏ thông tin thừa(loại bỏ tag định dạng, ghi chú, script …), phân tích các siêu liên kết và lưu chúng vào danh sách URL, bỏ các từ stop word (từ không có nghĩa trong tài liệu), đưa tài liệu về dạng thuần văn bản, tiến hành phân tích từ sau đó tính trọng số của từ đó và lập chỉ mục cho chúng và lưu chúng vào cơ sở dữ liệu. Bên cạnh kỹ thuật trên Google áp dụng phương pháp tính độ quan trọng của tài liệu(pagerank) dựa vào số lượng liên kết chỉ đến tài liệu. Ý tưởng đó là nếu một tài liệu có nhiều liên kết (hyperlink), hoặc từ một tài liệu có độ quan trọng cao chỉ đến thì được coi như là tài liệu đó cũng có độ quan trọng cao. Dựa vào kỹ thuật mà Google tự hào rằng mình có thể tìm kiếm được file ảnh, âm thành và những tài liệu phi văn bản khác.

Hệ thống tìm kiếm(truy vấn) dữ liệu :

Tiếp nhận câu truy vấn của người dùng thông qua giao diện web, phân tích câu truy vấn và trả kết quả tìm kiếm. Hệ thống này phân tích câu truy vấn của người dùng cũng giống như phương pháp phân tích từ của hệ thống lập chỉ mục, điều này nhằm nâng cao độ tương tự và tính chính xác của hệ thống. Sau đó tiến hành tìm kiếm trên cơ sở dữ liệu đã được lập chỉ mục và trả kết quả tìm kiếm cho người dùng.

4.2.Tìm hiểu về các dịch vụ tìm kiếm hỗ trợ thiết bị di động hiện có

Một phần của tài liệu TÌM HIỂU WAP VÀ CÔNG CỤ TÌM KIẾM HỖ TRỢ THIẾT BỊ DI ĐỘNG (Trang 47 - 49)

Tải bản đầy đủ (DOC)

(80 trang)
w