Sử dụng từ khoá để lọc các tìm kiếm

Một phần của tài liệu Tìm hiểu và xây dựng Search Engine (Trang 68 - 71)

2. Một số search engine thông dụn gở Việt Nam

2.1.3 Sử dụng từ khoá để lọc các tìm kiếm

Cả giao diện của công cụ tìm kiếm đơn giản và nâng cao đều hỗ trợ việc sử dụng các từ khoá để hạn chế các tìm kiếm tới các trang đáp ứng tiêu chuẩn được định rõ về

nội dung và cấu trúc của một trang web. Sử dụng từ khoá, ta có thể tìm kiếm dựa vào URL hoặc một phần của một URL, hoặc dựa vào các liên kết, hình ảnh, văn bản, mã hoá của một trang web. Các từ khoá sẽ rất có ích trong trường hợp:

 Tìm các trang trên một máy chủ nào đó hoặc trong một tên miền chỉ định  Tìm các trang có chứa các liên kết trỏ tới trang web của ta.

 Tìm các trang có chứa một lớp Java applets.

Tìm kiếm dựa vào từ khoá, gõ một yêu cầu bằng từ khoá:lệnh tìm kiếm Gõ từ khoá bằng chữ thường, sau đó là dấu hai chấm. Quy ước để tìm một cụm từ trong lệnh tìm kiếm sẽ giống với quy ước để tìm một cụm từ trong một yêu cầu bình thường: phương pháp thường được sử dụng nhất là cho cụm từ vào trong ngoặc kép. title:"thời trang"

Từ khoá Chức năng

applet:class Tìm các trang có chứa một ứng dụng nhỏ (applet) Java hoặc Java class

Domain:domainname Tìm các trang có từ hoặc cụm từ trong tên miền của máy chủ web nơi có trang cần tìm. (Phần.... của tên máy chủ internet là tên miền)

host:name Tìm các trang có từ hoặc cụm từ trong tên của máy chủ web, nơi có các trang cần tìm.

image:filename Tìm các trang có chứa ảnh filename

Các từ khoá url, host, domain, đều có một mục đích là tìm kiếm các URL dựa vào một phần URL, hoặc dựa vào tên máy chủ hoặc tên miền nơi có các trang web cần tìm. Các từ khoá link và anchor cũng tương tự như khi chúng tìm kiếm thông tin về liên kết. Từ khóa link tìm các văn bản trong một URL là đích của một liên kết (ví dụ, http://www.abc.org.vn/help.htm), trong khi từ khoá anchor lại tìm các văn bản hiện tại của một siêu liên kết khi người dùng nhìn thấy nó trên một trang web (ví dụ, click here). Thẻ title sẽ tìm kiếm nội dung tiêu đề của một tài liệu. Từ khoá tiêu đề sẽ giới hạnviệc tìm kiếm tới văn bản mà tác giả của tài liệu đã mã hoá như một phần của thẻ <title>. Tiêu đề là cụm từ sẽ xuất hiện trong đầu đề cửa sổ trong trình duyệt web. Từ khoá tiêu đề có thể sẽ là một cách tốt để giới hạn tìm kiếm chỉ tới các trang về một chủ đề, gồm các trang được đặt tiêu đề một cách thông minh. Tuy nhiên với các trang mà người lập nên không quan tâm đến tiêu đề trang web hoặc đặt tên kém thì cách tìm này không dùng được. Hơn nữa, hệ thống tìm kiếm của NetNam có thể cấu hình để nhận biết các thuộc tính phụ khác của tài liệu có các thẻ HTML META do người dùng quy định.

Điều kiện Định nghĩa

url:http://www.un.org.vn/about Tìm tất cả các trang có các từ

http://www.un.org.vn/about trong URL.

host:netnam.vn Thoả mãn tất cả các trang có

host:netnam.vn trong tên máy chủ web. domain:org.vn Thoả mãn tất cả các trang có tên miền

org.vn trong tên máy chủ của máy chủ web. image:about.jpg Thoả mãn tất các trang có một thẻ hình ảnh

anchor:"click here" Thoả mãn tất cả các trang với cụm từ click here trong đoạn văn bản của một liên kết hoặc một thẻ anchor (<A>) khác.

link:http://www.abc.org.vn/mypage.ht ml

Thoả mãn tất cả các trang có ít nhất một liên kết tới một trang có URL

http://www.abc.org.vn/mypage.html link:http://myhost.abc.org/mypage.html Chỉ tìm các trang có các liên kết tới URL

chỉ định.

title:"NetNam Lifestyle" Thoả mãn các trang có cụm từ NetNam Lifestyle trong tiêu đề

applet:flower Thoả mãn các trang chứa Java applet có tên gọi flower.

Bảng 5.10 : Ví dụ tìm kiếm thông tin của Netnam

Một phần của tài liệu Tìm hiểu và xây dựng Search Engine (Trang 68 - 71)

Tải bản đầy đủ (DOC)

(147 trang)
w