Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
202,47 KB
Nội dung
Tại trang web không index Google? Thỉng thoảng bạn đọc viết SEO-er vào nghề với thắc mắc như: "tại trang web lại không index Google?” Nếu câu hỏi sảy với bạn, bạn mắc sai lầm ngớ ngẩn nghiệp SEO Điều xảy với vài đồng nghiệp tơi, tơi định đăng viết để bổ sung thêm kiến thức cho bạn, tạo tảng với chưa biết vấn đề Nếu trang web khơng index máy tìm kiếm năm 2013, nguyên nhân điều sau: - Do thị thuộc tính - Do ảnh hưởng từ Google (do thuật toán hình phạt) - Các vấn đề cấu trúc trang web (do orphaned page chưa xử lý cách triệt để) Chú thích: Orphaned page (tạm hiểu trang bị tách rời website, mà liên kết với website ban đầu) Trong viết này, sâu tìm hiểu thuộc tính mà làm trang khơng index Google, thuộc tính với mục đích từ đầu thị không cho trang xuất trang tìm kiếm Trước hết, bạn phải cần biết làm để kiểm tra trang web index hay không index Google: - Copy URL cần kiếm tra - Paste vào tìm kiếm Google - Nếu trang web index, hiển thị kết Google, truy cập vào kết để đảm bảo: trang mà bạn vưa paste URL vào để tìm kiếm - Nếu URL khơng xuất hiện, bạn phải cần kiểm tra cách thủ công để xác định nguyên nhân vấn đề Dưới đây, vài điều bạn cần kiểm tra: 1.Meta robots NOINDEX - Cách dễ để phát hiện: Nhìn vào code nguồn trình duyệt bạn, phần - Dạng thuộc tính: - Mục đích thuộc tính: Thơng báo cho Google rằng: bạn không muốn Google index trang máy tìm kiếm Ví dụ: http://www.mattcutts.com/blog/2013/02/ - Thêm thơng tin: http://www.robotstxt.org/meta.html Rel = canonical phần - Cách dễ để phát hiện: Nhìn vào code nguồn trình duyệt bạn, phần - Dạng thuộc tính: phần head HTML - Mục đích thuộc tính: Bạn muốn thơng báo cho Google: Các giá trị (PageRank, Authority liên kết) trang cần thơng qua trang khác Đó khơng phải thuộc tính thị, Google tin tưởng vào gợi ý “rel = canonical” không index trang này, lại index trang mục tiêu canonical - Thêm thông tin : https://support.google.com/webmaster r/139394?hl=en NOINDEX robots.txt - Cách dễ để phát hiện: Kiểm tra file Robots.txt - Dạng thuộc tính: Noindex: / folder / Đặc biệt lưu ý đây, tất trang mà file robot.txt thiết lập thuộc tính NOINDEX (tất chữ viết hoa) khơng index trang kết Tuy nhiên, de-index trang bạn viết hoa chữ N Noindex (thay NOINDEX) - Mục đích thuộc tính: Tương tự thẻ noindex bình thường, thực cho file robot.txt lạ Thêm thông tin: http://www.bigmouthmedia.com/live/ar ffic.asp/6264/ NOINDEX tiêu đề HTTP (hoặc None tiêu đề HTTP) - Cách dễ để phát hiện: Kiểm tra tiêu đề HTTP với Chrome kiểm tra với công cụ website (http://www.rexswain.com/httpview.html) - Dạng thuộc tính: Headers CF-RAY:66cdb31ea060165 Connection:keep-alive ContentEncoding:gzip Content-Type:text/html Date:Mon, 29 Apr 2013 14:59:27 GMT Server:cloudflare-nginxTransferEncoding:chunked X-Robots-Tag:noindex - Mục tiêu thuộc tính: Nó giống meta = "robots" content = "noindex", khác là: đặt tiêu đề HTTP Bạn thấy ví dụ thực tế (http://www.davidsottimano.com/http-noindexexample.php) Ian Macfarlane "None" có nghĩa NOINDEX thuộc tính thị X-robot - Thêm thông tin: https://developers.google.com/webmas obots_meta_tag Rel canonical tiêu đề HTTP - Cách dễ để phát hiện: Kiểm tra tiêu đề HTTP với Chrome công cụ website sau (http://www.rexswain.com/httpview.html) - Dạng thuộc tính: Link: ; rel = "canonical" bạn xem ví dụ đây:http://www.davidsottimano.com/http-c al-example.php - Mục đích thuộc tính: Tương tự thẻ canonical bình thường (trong ) - Thêm thơng tin: https://support.google.com/webmaster r/139394?hl=en Meta refresh với thời gian delay > (ví dụ: 5) - Cách dễ để phát hiện: truy cập trang web, xem xét chuyển hướng xem xét code nguồn - Dạng thuộc tính: phần HTML - Mục đích thuộc tính: Sau thời gian trì hỗn (delay), trang web bạn chuyển hướng Google lập cho trang (sau chuyển hướng) thời gian delay lớn 0, không chắn lý Đây thử nghiệm thực tế: http://soliddelivery.co.uk/feratsodaman.html (click vào xem điều sảy ra) Thông số canonicalization GWMT (Google webmaster tools - công cụ quản trị trang web Google) - Cách dễ để phát hiện: Bạn cần phải truy cập vào cơng cụ quản trị web có làm hướng dẫn cho bạn - Cách thức xem xét: Vào Configuration > phần URL Paremetres - Mục đích: Khi bạn thay đổi thiết lập WMT, Google thường đồng ý Tùy thuộc vào tham số, bạn u cầu Google khơng index Ví dụ: Nếu bạn yêu cầu Googlebot không thu thập URL nào, Google loại bỏ trang với thông số khỏi mục Tương tự vậy, bạn thơng báo Googlebot khơng có nội dung trang thay đổi, Google khơng index chúng Hãy nhớ để kiểm tra cấu hình thơng số URL bạn khơng thể tìm lý trang không index - Thêm thông tin: https://support.google.com/webmaster /1235687?hl=en Yêu cầu xoá URL WMT - Cách dễ để phát hiện: Bạn cần phải truy cập vào công cụ quản trị trang web nhờ hướng dẫn biết làm vấn đề - Thực hiện: Optimiztion > Phần remove URL WMT - Mục đích: Làm trang khơng index Google vòng 24 Theo kinh nghiệm cá nhân tôi, không cần phải bổ sung thẻ noindex block file Robots.txt, mà yêu cầu xoá URL thực thi hiệu Vấn đề bạn trang bị block bạn kiểm tra báo cáo này: - Thêm hông tin: https://support.google.com/webmaster r/164734?hl=en Những điều cần lưu ý thêm - Tôi xin nhắc lại: block file Robots.txt khơng có tác dụng làm file không index - Ban đầu, nghĩ rằng: thuộc tính: rel = "next" / "prev" nguyên nhân khiến Google de-index, liệt kê ví dụ - Chuyển hướng 301 làm index trang đích chuyển hướng, khơng phải ln mãi Tôi để lại vấn đề thử nghiệm tơi làm ln ln khơng ổn định – vui lịng chờ đợi kết sau - Chuyển hướng 302 meta refresh với thời gian delay (thử nghiệm đây, ví dụ đây) làm hiển thị URL trang tìm kiếm với nội dung trang mục tiêu chuyển hướng - Tương tự chuyển hướng 302, meta refresh với thời gian delay 0, Hreflang + canonical làm trang biến xuất lại trang kết quả, phụ thuộc vào trang Google quốc gia khác ... làm để kiểm tra trang web index hay không index Google: - Copy URL cần kiếm tra - Paste vào tìm kiếm Google - Nếu trang web index, hiển thị kết Google, truy cập vào kết để đảm bảo: trang mà bạn... hiểu trang bị tách rời website, mà liên kết với website ban đầu) Trong viết này, sâu tìm hiểu thuộc tính mà làm trang khơng index Google, thuộc tính với mục đích từ đầu thị không cho trang xuất trang. .. thiết lập thuộc tính NOINDEX (tất chữ viết hoa) khơng index trang kết Tuy nhiên, de -index trang bạn viết hoa chữ N Noindex (thay NOINDEX) - Mục đích thuộc tính: Tương tự thẻ noindex bình thường,