V. TỐI ƯU HÓA TRONG TRANG (ON-PAGE OPTIMIZATION)
5.9 Tính khả dụng và thứ hạng trên máy tìm kiếm
Tính khả dụng (usability) và thứ hạng của trang Web trên máy tìm kiếm. Cách tối ưu, quảng bá trang Web.
Liệu các máy tìm kiếm, công vụ tìm kiếm có để ý đến tính khả dụng (usability) của trang Web ? Có sự khác biệt nào giữa một trang dễ dàng duyệt với các trang khác không ? Bài viết này sẽ đề cập tới tính khả dụng và thứ hạng của trang Web trên máy tìm kiếm.
Một bằng sáng chế của Yahoo đã chỉ ra rằng các máy tìm kiếm có tính đến khía cạnh thiết kế của trang Web.Tài liệu này chứa rất nhiều chỉ số mà máy tìm kiếm sẽ dùng đến để xác định tính khả dụng của trang Web.
Tính khả dụng nào quan trọng với máy tìm kiếm
Bằng sáng chế nói trên có trích một đoạn ngắn giải thích tại sao máy tìm kiếm lại tính đến tính khả dụng của trang Web :
Việc tạo một trang Web dễ dàng và thoải mái khi sử dụng là rất quan trọng, điều này đặc biệt quan trọng hơn đối với những trang Web muốn kiếm tiền.[...]
duyanhphamkiller@gmail.com Page 73 Nếu một trang nào đó không dễ dàng và thoải mái khi duyệt, thì khả năng kiếm tiền từ trang này sẽ bị triệt tiêu rất nhiều. Một trong những chỉ số qui ước trang Web có dễ dàng và thoải mái hay không khi sử dụng được gọi là “tính hỗn loạn” (clutter)
Trang Web với tính khả dụng tốt thường là những trang có tỉ lệ khoán chuyển1 cao hơn các trang “hỗn loạn”. Ngoài ra các trang có tính khả dụng cao thì thường có chất lượng cao hơn các trang khác và các máy tìm kiếm sẽ cố gắng hiển thị các trang có tính khả dụng cao trong trang kết của tìm kiếm.
Các nhân tố máy tìm kiếm xác định tính hỗn loạn
Bằng sáng chế của Yahoo cung cấp danh sách của 51 nhân tố trong trang Web cho phép phân tích để định ra tính “hỗn loạn” của một trang Web :
1. Tổng số liên kết 2. Tổng số từ
3. Tổng số hình ảnh (không phải hình ảnh quảng cáo)
4. Vùng hình ảnh hiện thị trên màn hình (không phải hình ảnh quảng cáo) 5. Kích cỡ trang
6. Diện tích trang (tổng) 7. Chiều dài trang 8. Tổng số bảng
9. Số bảng cột tối đa (của từng bảng) 10.Số bảng dòng tối đa (của từng bảng) 11.Tổng số cột
12.Tổng số dòng 13.Tổng số ô
14.Trung bình khoảng cách ngoài (từng bảng) 15.Trung bình khoảng cách trong (từng bảng) 16.Kích cỡ phần quan sát được trên màn hình 17.Vùng quan sát được trên màn hình
18.Vị trí trung tâm của trọng tâm so với giữa trang 19.Tổng số kích cỡ font dùng cho liên kết
20.Tổng số kích cỡ font dùng cho tiêu đề 21.Tổng số kích cỡ font dùng cho phần văn bản 22.Tổng số kích cỡ font
23.Dàn trang đẹp
24.Tổng số mã màu (trừ quảng cáo) 25.Căn lề các thành phần của trang 26.Đọ sáng của trang
27.Chiều ngang cố định và tương đối của trang 28.Trọng lượng trang (thời gian tải trang) 29.Tổng số quảng cáo
30.Diện tích tổng của các quảng cáo 31.Diện tích của từng quảng cáo đơn
32.Diện tích của quảng cáo kích thước lớn nhất trước tầm quan sát 33.Diện tích quảng cáo lớn nhất
34.Tông diện tích các quảng cáo lớn nhất nằm trên tầm quan sát trang 35.Khoảng cách từ quảng cáo tới nội dung trang
36.Tổng số quảng cáo bên ngoài nằm trên tầm nhìn của trang 37.Tổng số quảng cáo bên ngoài nằm dưới tầm nhìn của trang 38.Tổng số quảng cáo bên ngoài
duyanhphamkiller@gmail.com Page 74 40.Tổng số quảng cáo bên trong nằm dưới tầm nhìn của trang
41.Tổng số quảng cáo bên trong
42.Tổng số liên kết quảng cáo tài trợ nằm trên tầm quan sát 43.Tổng số liên kết quảng cáo tài trợ nằm dưới tầm quan sát 44.Tổng số liên kết quảng cáo tài trợ
45.Tổng số hình ảnh quảng cáo nằm trên tầm quan sát 46.Tổng số hình ảnh quảng cáo nằm dưới tầm quan sát 47.Tổng số hình ảnh quảng cáo
48.Tổng số quảng cáo dạng chữ nằm trên tầm quan sát 49.Tổng số quảng cáo dạng chữ nằm dưới tầm quan sát 50.Tổng số quảng cáo dạng chữ
51.Vị trí quảng cáo trên trang
Theo bằng sáng chế này thì Yahoo sẽ tính đến sự có mặt của các hình động và các ảnh flash quảng cáo cũng như độ sáng trung bình của các quảng cáo này.
Tối ưu trang Web của bạn
Một trang Web với tính khả dụng cao sẽ cải thiện đáng kể tỉ lệ khoán chuyển trên trang. Nếu trang Web của bạn có rất nhiều khách ghé thăm nhưng lại chỉ bán được rất ít hay rất ít tác vụ mong muốn được thực thi thì bạn chắc chắn là trang Web đó rất “hỗn loạn” và bạn phải cải thiện tính khả dụng trang Web đó.
Google cũng đã có một bằng sáng chế tương tự với cái tên “phát hiện và loại bỏ các tài liệu gây phiền hà”. Qua đó, các trang Web được thiết kế tốt sẽ được đánh giá cao hơn và đương nhiên là có thứ hạng cao hơn.
Bởi vậy mã nguồn HTML trang web của bạn phải gây được ấn tượng tốt cho các công cụ tìm kiếm. Nếu chúng không thấy nội dung hợp lý thì những trang này không thể có thứ hạng cao trên các máy tìm kiếm.
5.10 Robots.txt & Googlebot - Allow & Disallow
Khả năng tìm kiếm của các spider là rất lơn, chúng có thể lùng xục khắp nơi trên website của bạn. Với bài viết này chúng ta sẻ cũng tìm hiểm cách thức sử dụng file robots.txt để quy định các spider, đặc biệt là googlebot.
Bạn tạo 1 file robots.txt vào đặt vào thư mục root của trang web
Các User Agent của Google
Google có vài user-agent chính. Bạn có thể ngăn chúng bằng cách thêm tên của bọ tìm kiếm tương ứng và trong dòng User-agent tương ứng trong bảng ghi robots.txt. Nếu bạn chặn Googlebot thì có nghĩa là bạn chặn tất cả các bọ tìm kiếm với từ khóa “Googlebot”.
Googlebot: Đánh chỉ số từ các chỉ mục cũ và mới của Google.
Googlebot-Mobile: Đánh chỉ số cho các thiết bị cầm tay hoặc di động. Googlebot-Image: Đánh chỉ số các tệp tin ảnh.
duyanhphamkiller@gmail.com Page 75
Mediapartners-Google: Xuất hiện trong các trang dăng quảng cáo của Google Adsense.
Adsbot-Google: Đánh chỉ số các trang được nhà quảng cáo sử dụng giới thiệu sản phẩm hay dịch vụ
thông qua Google Adwords. Nó cho phép đánh giá chất lượng của trang dùng dịch vụ Adwords.
Chặn Googlebot
Để chặn toàn bộ Googlebot thì bạn thêm cú pháp sau vào file robots loại trừ :
User-agent: Googlebot Disallow: /
Cho phép Googlebot
Trong trường hợp bạn muốn chặn tất cả các bọ tìm kiếm khác trừ một robot, Googlebot chẳng hạn, thì bạn có thể sử dụng cú pháp sau. Tuy nhiên nếu bạn không muốn trang liên quan biến mất khỏi kết quả tìm kiếm của các máy tìm kiếm như Yahoo, MSN Live hay Ask thì bạn không nên làm như thế.
User-agent: * Disallow: /
User-agent: Googlebot Disallow:
Cho phép mở rộng
Google hỗ trợ cú pháp mở rộng “Allow” trong tệp tin robots.txt. Có nhiều máy tìm kiếm không hỗ trợ phần mở rộng này, vì thế bạn nên tham khảo kỹ. Dòng lệnh “Allow” hoạt động cũng giống như “Disallow” chỉ khác là nó liệt kê các thư mục hay trang bạn cho phép đánh chỉ số.
Bạn có thể sử dụng đồng thời “Allow” và “Disallow” cùng nhau. Chẳng hạn để cấm tất cả các trang trong một thư mục “seotips” chẳng hạn, trừ tệp tin “toi-uu-hoa.html”, bạn hãy làm như sau :
User-agent: Googlebot Disallow: /seotips/
Allow: /seotips/toi-uu-hoa.html
Còn trong trường hợp bạn muốn chặn Googlebot và sau đó lại vẫn muốn cho các bot khác của Google (Googlebot-Mobile) chẳng hạn, bạn có thể sử dụng lệnh Allow như sau :
User-agent: Googlebot Disallow: /
User-agent: Googlebot-Mobile Allow: /
Sử dụng mẫu tổ hợp
Đặc biệt hữu ích trong trường hợp bạn không muốn phải liệt kê tất cả các trang mà bạn muốn chặn. Đây là phần đuôi mở rộng mà GoogleBot hỗ trợ. Chú ý là các máy tìm kiếm khác chưa chắc đã hỗ trợ tính năng này.
duyanhphamkiller@gmail.com Page 76
Mẫu tổ hợp chuỗi các ký tự sử dụng dấu sao (*)
Bạn có thể sử dụng dấu sao (*) để liệt kê tổ hợp chuỗi các lkys tự. Ví dụ bạn có thể chặn một loạt các thư mục con bắt đầu bằng chữ wp (ví dụ wp-admin, wp-content cho blog WordPress) như sau :
User-agent: Googlebot Disallow: /wp*/
Để chặn tất cả đường dẫn URL mà chứa ký tự (?) chứa tham biến (trong ngôn ngữ PHP), bạn hãy làm như sau :
User-agent: * Disallow: /*?
Kiểm tra phần kết của chuỗi ký tự URL bằng $
Bạn cũng có thể sử dụng dấu dollard ($) để liệt kê các URL có phần kết tương ứng. Ví dụ để chặn tất cả các đường dẫn URL kết thúc với pdf (phiên bản pdf trên website để tránh trùng nội dung chẳng hạn) :
User-agent: Googlebot Disallow: /*.pdf$
Bạn cũng có thể sử dụng tổ hợp kết này với lệnh Allow. Ví dụ nếu như có dấu hỏi ? tương ứng với một session ID, bạn có thể loại trừ chúng để tránh cho GoogleBot phải đánh chỉ số một nội dung trùng lặp. Thế nhưng các URLs kết thúc bởi dấu hỏi ? lại là một phiên bản trang mà bạn muốn thêm vào. Trong trường hợp này, hãy đặt tệp tin robots.txt của bạn như sau :
User-agent: * Allow: /*?$ Disallow: /*?
Dòng lệnh Disallow:/ *? sẽ chặn tất cả các URL có chứa ký tự ? (Cụ thể là nó sẽ chặn tất cả các URL
bắt đầu bằng tên miền, tiếp theo các ký tự, tiếp theo là dấu hỏi ?, tiếp theo bởi bất kể ký tự nào khác)
Dòng lệnh Allow: /*?$ sẽ cho phép bất kể đường dẫn nào kết thúc bởi dấu hỏi ? (Cụ thể là với bất kể
URL nào bắt đầu bằng tên miên, theo bởi chuỗi ký tự, theo tiêp bởi dấu hỏi ?, không có ký tự nào nằm sau dấu hỏi này).
5.11 Sử dụng nhiều keyword ở các trang hơn là tập trung keyword ở trang chủ
việc các bạn ra sức làm SEO, cố gắng nhồi nhét càng nhiều keyword càng tốt vào trang chủ của website bạn đang là một thực tế thường thấy ở Việt Nam. Một số webmaster chỉ chú trọng làm SEO cho 1 trang duy nhất mà quên rằng, chính những phần content, những trang nhỏ trong website mới chính là nguồn thu về traffic chủ yếu cho webite của bạn. Nhưng việc làm này chỉ có tác dụng đẩy bạn vào 1 cuộc chiếc không cân sức với những ông lớn trong lĩnh vưc của bạn, một cuộc cạnh tranh mà bạn khó có khả năng chiến thắng.
duyanhphamkiller@gmail.com Page 77 Hãy cố gắng chia đều sức mạng quảng bá của website, để những trang con trong website gánh bớt 1 phần trách nhiệm về traffic cho website của bạn. Sức mạnh phải được kết hợp từ tông thể website chứ không phải tập trung hết cả và home page. Trang chủ là trang đầu tiên của direct traffic nhưng nó không phải là trang đâu tiên của referring traffic và search engine traffic.
tham khảo trên trang làm SEO thì ở 2 bài viết khác nhau thì description và keywords khác nhau và liên quan đến bài viết đó