Việc tạo các danh mục và tên file cho các tài liệu trên trang web không chỉ có thể giúp nhà quản trị giữ cho trang web được sắp xếp tốt hơn mà còn dẫn đền việc thu thập dữ liệu tốt hơn bằng các công cụ tìm kiếm. Nó cũng có thể tạo ra các URL dễ dàng hơn, thân thiện hơn cho những người muốn liên kết tới nội dung website.[4]
Nếu URL trang chứa các liên quan đến từ khóa, điều này cung cấp cho người dùng và các công cụ tìm kiếm nhiều thông tin về trang hơn lượng thông tin mà ID hoặc các ký tự đặc biệt.
Cuối cùng, hãy nhớ rằng URL liên kết đến trang được hiển thị dưới dạng một phần của kết quả tìm kiếm, bên dưới tiêu đề và đoạn trích của tài liệu. Giống như tiêu đề và đoạn trích, các từ trong URL trong kết quả tìm kiếm được in đậm nếu chúng xuất hiện trong truy vấn của người dùng.
Các biện pháp cải tiến cấu trúc URL:
-Sử dụng các từ trong URL: chứa các từ liên quan đến nội dung và cấu trúc trang web sẽ thân thiện với người truy cập hơn khi điều hướng trang web. Người xem sẽ nhớ chúng tốt hơn và có thể sẵn sàng liên kết đến chúng.
-Tránh: sử dụng các URL dài dòng với các tham số và các ID phiên không cần thiết hay chọn tên trang chung chung như “trang1.html” hoặc sử dụng quá nhiều từ khóa.
-Tạo cấu trúc thư mục đơn giản, sử dụng cấu trúc thư mục tổ chức tốt nội dung và giúp người xem dễ dàng biết vị trí của họ trên trang web. Thử sử dụng cấu trúc thư mục của website để chỉ định loại nội dung được tìm thấy tại URL đó.
-Tránh: có cấu trúc lớp thư mục nhiều cấp như
“…/dir1/dir2/dir3/dir4.page.html”, sử dụng tên thư mục không liên quan đến nội dung trong thư mục đó.
-Cung cấp phiên URL để liên kết đến tài liệu: để ngăn người dùng liên kết tới phiên URL và ngăn những người khác liên kết tới phiên khác (điều này có thể chia cắt uy tín của nội dung đó giữa các URL), tập trung vào việc sử dụng và tham chiếu tới URL trong cấu trúc và liên kết bên trong trang. Nếu phát hiện rằng mọi người đang truy cập cùng một nội dung thông qua nhiều URL, việc thiết lập 301 chuyển hướng từ các URL không tối ưu đến URL vượt trội là giải pháp tốt cho vấn đề này.
-Tránh: có các trang từ các tên miền phụ và thư mục gốc (ví dụ: “domain.com/page.html” và sub.domain.com/page.html”) truy cập cùng một nội dung, các URL có và không có www. Trong cấu trúc liên kết bên trong.
Viết lại URL với mode_rewrite trong file .htaccess:
Điều quan trọng để sử dụng mod_rewrite là hosting đặt website phải hỗ trợ chức năng đó. Thông thường các Linux và Apache server hiện nay đều có chứ năng trên. Trong khi windows, không thể tạo ra file chỉ có phần đuôi mở rộng, vậy nên đặt tên là htaccess.txt rồi upload lên server và đổi tên lại thành .htaccess hoặc mở file bằng một trình soạn thảo văn bản rồi lưu lại file bằng save as. file .htaccess thông thường được đặt ở thư mục root của website, có nội dung ban đầu như sau:
RewriteEngine On RewriteBase /seogby/
RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d
Dòng đầu tiên là để mở RewriteEngine, dòng thứ 2 là đường dẫn URL, thông thường là root, nhưng nếu muốn thay đổi trong thư mục seobgy thì /seogby/. Hai dòng tiếp theo là điều kiện để server kiểm tra xem đường dẫn mà user sử dụng có thật hay không, trước khi xử lý như một đường dẫn ảo. Để thay đổi cấu trúc URL ta sử dụng câu lệnh RewriteRule.
RewriteRule Pattern Substitution
Pattern là đường dẫn ảo dùng để thay cho đường dẫn thật là Subtitution. (.*) nhận tất cả các giá trị
([0-9]*) chỉ nhận các giá trị là số, từ 0-9
([a-zA-Z]*) chỉ nhận các giá trị là chữ cái, từ a-z và từ A-Z Ví dụ: RewriteRule ^(.*)$ index.php?route=$1 [L,QSA]