V. TỐI ƯU HÓA TRONG TRANG (ON-PAGE OPTIMIZATION)
5.12 Tập tin “mồ côi” – Lỗi 404 not found
5.12.1. Liên kết không tồn tại
Liên kết hỏng (Broken Links) là các liên kết không còn tồn tại trên website của bạn nhưng vẫn còn lưu trong hệ thống của các công cụ tìm kiếm. Vì vậy, nó có ảnh hưởng đến khách hàng khi họ truy cập địa chỉ này.
Hiện nay, có nhiều công cụ hỗ trợ tìm kiếm các đường liên kết không còn tồn tại trên website của bạn. Khi có danh sách các đường liên kết này, bạn có thể thực hiện cơ chế chuyển hướng địa chỉ để khách hàng không cảm thấy phiền toái khi truy cập vào một địa chỉ không có trên website.
Bạn có thể sử dụng công cụ Xenu Link Sleuth, FireBug plugin để phát hiện các đường liên kết trên website của bạn đã bị loại bỏ. Phần mềm này đưa ra cho bạn báo cáo danh sách các địa chỉ tồn tại và không còn tồn tại trên website của bạn. Từ đó, bạn có quyết định xử lý các liên kết này theo hướng tích cực nhất.
Xenu Link Sleuth : http://home.snafu.de/tilman/xenulink.html
Chuyển hướng 404 - 404 Redirect
Bạn có thể thay đường liên kết không tồn tại bằng một địa chỉ mới. Điều này sẽ chuyển khách hàng đến một trang thông báo thay vì thông báo lỗi đường liên kết không tồn tại và ghi lại đường dẫn không tồn tại này vào hệ thống. Tại trang thông báo này, bạn có thể đưa ra các chỉ dẫn để hướng dẫn khách hàng. Với cách này, bạn có thể:
Biết được đường dẫn nào khách hàng hay truy cập nhất, từ đấy có những quyết định thông minh để chuyến hướng đến một liên kết mới có nội dung tương tự.
Biết được khách hàng đến với website của bạn từ trang web nào. Bạn có thể yêu cầu chủ sở hữu trang web kia thay đổi đường liên kết mới đến website của bạn để tránh trường hợp không cung cấp được thông tin cho khách hàng.
Chuyển hướng trang web không tồn tại đến trang thông báo để tránh phiền toái cho khách hàng, từ trang này, bạn có thể cung cấp các chỉ dẫn khác để hướng dẫn khách hàng tìm kiếm được thông tin họ mong muốn trên website của bạn.
5.12.2. Liên kết tới các file không tồn tại
Nếu bạn là một SEO quan tâm đến những tin tức về các search engine, chắc hẳn bạn cũng biết ít nhiều về thông tin cho rằng Google và các search engine ngày càng quan tâm đến tốc độ load của các website, nói đúng hơn là tốc độ của server nơi đặt website. Gần đây tại hội thảo Pudcon 2009 tổ chức tại Vegas, Matt Cutts trưởng nhóm anti spam của Google cũng đã lên tiếng khẳng định thông tin trên, và nhấn mạnh rằng tốc độ load của website sẽ là một trong những yếu tố giúp Google xếp hạng các website trên trang SRPs của mình.
Qua bảng so sánh trên bạn có thể thấy 1 file không tồn tại chiếm thời gian chờ index lâu hơn rất nhiều (mặc dù kích thước nhỏ hơn file tồn tại). Google bot hoạt động trên 1 quỹ tài nguyên nhất định, nếu nó phải dành nhiều thời gian để crawl hình ảnh và file pdf thì sẻ còn rất ít thời gian dành cho những phần khác.