Những tiờu chớ quan trọng dựng trong phõn hạng

Một phần của tài liệu Xây dựng máy tìm kiếm ảnh dựa trên công nghệ search engines (Trang 25 - 26)

Dưới đõy là cỏc tiờu chớ chủ yếu mà cỏc thuật toỏn của cỏc mỏy tỡm kiếm Web sử dụng để phõn hạng cỏc trang Web:

Tần số phỏt sinh: được hiểu là tổng số lần xuất hiện của một chữ hay một cụm từ của từ khoỏ trong nội dung một trang Web nào đú. Theo sự đỏnh giỏ của cỏc chuyờn gia, thỡ tần số phỏt sinh của một trang Web càng cao sẽ chứng tỏ nội dung của trang Web đú càng liờn quan hay càng đề cập nhiều đến những gỡ nờu trong từ khoỏ. Do đú, mật độ từ khúa đúng vai trũ quan trọng trong việc phõn hạng một trang Web.

Thẻ meta và cõu lệnh title:

Theo ngụn ngữ HTML, thỡ thẻ meta là cỏc cõu lệnh nằm ở phần đầu (header) của mó của một trang Web. Thẻ meta cú dạng:

<META (cỏc thụng số cho cõu lệnh meta)>

Trong nhiều mỏy truy tỡm, người thiết kế cũn cho rằng sự xuất hiện cỏc chi tiết hay toàn bộ nội dung của từ khoỏ càng sớm trong một trang mó HTML thỡ điều đú chứng tỏ trang đú cú thể cú chủ đề liờn quan càng nhiều đến từ khoỏ. Hậu quả là một trang Web cú thể được phõn hạng cao hơn nếu cỏc phần hay toàn bộ từ khoỏ cú mặt sớm hơn trong phần mó HTML. Như vậy, trong một số thẻ meta, mỏy truy tỡm sẽ đọc nội dung và lấy ra cỏc yếu tố phõn hạng. Cỏc thẻ

meta cú nhiều hiệu lực cho việc phõn hạng là:

<META name="description" content="(miờu tả ngắn nội dung trang Web)">

<META name="keywords" content="(danh sỏch từ khoỏ)">

<title>(tựa đề của trang Web)</title> khụng bị bỏ trống thỡ thứ hạng của nú cú thể được nõng cao hơn.

Ngụn ngữ: Nếu một người dựng đang nối vào Internet bằng một mỏy tớnh sử dụng tiếng Phỏp thỡ việc hiển thị cỏc trang Web cú cựng ngụn ngữ Phỏp với mỏy tớnh đú rừ ràng là hiệu quả hơn cho người đú. Do đú, yếu tố ngụn ngữ của trang Web cũng được chỳ ý trong phõn hạng.

Số lượng liờn liờn kết ngoài: Theo sự đỏnh giỏ của nhiều chuyờn gia phỏt triển mỏy truy tỡm thỡ nếu một trang Web được nhiều nơi khỏc đề cập tới hay mở liờn kết tới địa chỉ của nú thỡ rừ ràng giỏ trị của trang Web này cao hơn là cỏc trang Web cựng kiểu nhưng lại khụng cú hay ớt được liờn kết hay đề cập từ cỏc trang khỏc. Như vậy, cỏc trang Web nào được nhiều trang Web khỏc liờn kết tới (hay đề cập tới) thỡ chất lượng của nú cú thể cao hơn và được phõn hạng cao hơn.

Một phần của tài liệu Xây dựng máy tìm kiếm ảnh dựa trên công nghệ search engines (Trang 25 - 26)