Bản saotrangjoomla:
Nguyên nhânvàgiải
pháp
Bản saotrangjoomla: Nguyên nhânvàgiảipháp
Nếu bạn đang sở hữu một website sử dụng nền tảng CMS joomla sớm hay
muộn cũng phải đối mặt với các vấn đề trùng lặp trang. Vì lý do đó chúng ta
nên có một cái nhìn nhận vấn đề này từ bên trong cốt lõi của vấn đề, chúng
tôi sẽ nêu ra thế nào là trùng lặp trang, làm thế nào trước phản ứng của công
cụ tìm kiếm trong trường hợp trùng lặp, và làm thế nào để thoát khỏi những
cặp trùng lặp nhau đó.
Bản saotrang là văn bản giống hệt nhau trên trang web của bạnvà có sẵn
thông qua các url khác nhau. Trên thực tế bảnsaotrang web là những điểm
yếu của hầu hết các CMS không chỉ của joomla. Tất cả các trang này là vô
hại cho đến khi được index bởi công cụ tìm kiếm thu thập thông tin. Điều
chỉnh để công cụ tìm kiếm index và nhanh chóng hành động để loại bỏ các
trang từ các kết quả, nó rất tốt để suy nghĩ về cấu trúc trước và tránh những
tình huống này.
Lý do của bảnsao xuất hiện là do cấu trúc website bị sai. Trước hết bạn cần
phải suy nghĩ về hệ thống phân cấp các thư mục và các mục menu. Nếu bạn
tạo thư mục hệ thống trước có thể ngăn chặn các trang trùng lặp xuất hiện
trong tương lai.
Chúng ta hãy có một cái nhìn trước hầu hết các sai lầm phổ biến. Giả sử bạn
có thư mục cha là "Đồ họa" và có một số thư mục con " photoshop",
"illustrator ", "Flash " tất cả các tài liệu bạn liên kết trực tiếp đến thư mục
con nếu bạn tạo trình đơn chỉ có thu mục con như "photoshop", các liên kết
có thể là như sau :
http://lmt.com.vn/home/for-designer/adobe-illustrator.html
http://lmt.com.vn/home/for-designer/adobe-flash.html
Khi bạn bắt đầu xây dựng một website bạn cần phải suy nghĩ về cấu trúc của
nó và xác định các thự mục chính và thư mục con cho từ chủ đề và thể loại.
Với sự phát triển của mã nguồn mở bạn không cần phải thay đổi cấu trúc
hiện có, chỉ cần thêm một số bổ sung cần thiết. Cơ cấu lại trang web của bạn
đang trong sự phát triển là một vấn đề lớn, có thể mất nhiều tháng. Trong
thực tế, một số trang( hoặc tất cả) sẽ thay đổi địa chỉ của họ, mà dẫn đến
giảm thứ hạng các vị trí trong kết quả tìm kiếm và tham dự.
Công cụ tìm kiếm tìm những trang trùng lặp như thế nào ?
Nguyên nhân phổ biết nhất là các thành phần mở rộng và dữ liệu mẫu mà
nhà phát triển cài đặt vào trang web joomla. Ví dụ : module tin tức trên trang
chủ
có thể cung cấp địa chỉ khác nhau. Đôi khi những bảnsaotrang có thể được
nhìn thấy ngay cả trong sơ đồ website khi bạn cài đặt Xmap.
Nếu website của bạn đã được index, nhưng không phải là khó để tìm những
nội dung trùng lặp. Chỉ cần sao chép vài dịch vụ duy nhất từ trangvà chèn
các tài liệu này trong dấu ngoặc kép trong tìm kiếm của google. Nếu trang
của bạn không được index, bạn có thể thử XENU ( trong trường hợp trang
web của bạn còn nhỏ), nó sẽ tìm kiếm tất cả các cách tới trang web của bạn.
Tại sao chúng ta cần thoát khỏi trùng lặp trang ?
Công cụ tìm kiếm " không thích" và cố gắng không để index website có số
lượng lớn các trang giống hệt nhau gây ra sự tìm kiếm không cần thiết.
Trong khi tối ưu hóa trang cho các từ khóa nhất định, các trang phù hợp nhất
được lựa chọn và nội dung được tối ưu hóa. Nếu trang có bản sao, trong khi
công cụ tìm kiếm cập nhật có thể thay đổi các trang có liên quan tới trang
của họ (điều này đi kèm với sự tụt giảm mạnh các vị trí thứ hạng của từ
khóa)
Có 6 cách để thoát khỏi trùng lặp trang
Trước nhất bạn nên bật SEF(Search Engine Friendly URLs) và chuyển
hướng URL trong cài đặt chung của joomla thì những bước làm sau mới
hiệu quả và hợp lệ.
1. Plugin styleware content canonical
Plugin này giải quyết vấn đề URL của trang, làm cho url đơn giản hơn. nếu
bạn có 1 url component/content/article/32-something.html và một url
something.html cả hai sẽ được index từ một URL(something.html). Đó là
điều tuyệt vời mà plugin này làm được.
2. Robots.txt cho joomla
Các tập tin được đưa vào gói tiêu chuẩn của joomla, được đưa vào thư mục
gốc và có sẵn thông qua các liên kết domainwebsite.com/robots.txt. Nó
hướng dẫn công cụ tìm kiếm làm thế nào để index được website của bạn.
Ngoài ra bạn có thể sử dụng hướng dẫn sau đây để các dữ liệu mặc định
trong các tập tin:
Disallow: /*? #each links that contains this sign will not be indexed *
chỉ cần 1 dòng giúp bạn tiết kiệm được từ lưu trữ số lượng lớn các đoạn như
:
- page materials for printing;
- link to rss feed;
- the search results page on the site;
- will also close the page pagination;
- there may be other options, depending on the extensions used.
Chú ý: cho dù sử dụng dòng này hay không là tùy thuộc vào bạn, tập tin
robots quá lớn vẫn được cho phép và dòng này không như sơ đồ website, do
đó bạn chỉ có thể thêm dòng Allow: /site_map.
3. Chuyển hướng 301 (Redirect 301)
Chuyển hướng 301 là những chuyển hướng khi bạn đã thay đổi URL, nhưng
tất cả các bài viết vẫn còn tồn tại. Trong trường hợp này, muốn chỉ tới liên
kết thích hợp bạn cần phải sử dụng chuyển hướng 301 trong tập tin
.htaccess. Công cụ tìm kiếm biết rằng các bài viết đã được chuyển tới địa chỉ
mới. Phương pháp này cho phép bạn tiết kiệm cả hiệu suất trang web và PR
trang của bạn.
Chuyển hướng 301 cũng có thể được sử dụng cho những trang tăng gấp đôi.
ví dụ bảnsao được biết đến rộng rãi của một trang web joomla là /index.php
và alias là của menu home.
ví dụ :/home hoặc /homepage, các địa chỉ này có thể được sửa khá dễ dàng
bằng cách mở tập tin .htaccess của bạnvà nhập:
redirect301/index.php
" ?php
if($_SERVER['REQUEST_URI'] == '/index.php') {
header("Location: /",TRUE,301);
exit();
}
?>
"
Đây là một ví dụ quan trọng của một địa chỉ trang web và không có www.
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.example.com$ [NC]
RewriteRule ^(.*)$ http://example.com/$1 [R=301,L]
Thay tên miền website của bạn vào example.com
4. Meta tag robots
Một trong nhiều cách làm để ngăn chặn index bảnsao đó là sử dụng thẻ
meta robots
Hiện nay tùy chọn này tốt hơn là cách sử dụng file robots.txt. Ví dụ để đóng
phiên bảntrang để in bạn cần phải có địa chỉ, bạn có thể mở các tập tin
component.php của thư mục gốc trong template mà bạn nhập vào từ khóa"
?tmpl = component in " đóng cửa các trang kết quả tìm kiếm bạn có thể sử
dụng com_search vào file index.php trong template bạn chỉ cần thêm dòng
code sau đây
5.Xóa các URL từ bảng điều khiển của webmaster's
Một trong nhiều cách để loại bỏ các bảnsao là xóa chúng bằng tay từ bẳng
điều khiển của quản trị trang web.
https://www.google.com/webmasters/tools/home?hl=en
6. X-Robots-Tag Titles
Google khuyến cáo sử dụng X-Robots-Tag Titles thay thế cho phương pháp
4
th
trong roundup
Như bạn thấy có rất nhiều cách làm thế nào để loại bỏ các bản sao, mặc dù
bạn cần phải hiểu hoạt động của từng tiện ích để áp dụng phù hợp nhất cho
website của bạn. chúc bạn thành công.
. Bản sao trang joomla : Nguyên nhân và giải pháp Bản sao trang joomla : Nguyên nhân và giải pháp Nếu bạn đang sở hữu một website sử dụng nền tảng CMS joomla sớm hay muộn. lặp, và làm thế nào để thoát khỏi những cặp trùng lặp nhau đó. Bản sao trang là văn bản giống hệt nhau trên trang web của bạn và có sẵn thông qua các url khác nhau. Trên thực tế bản sao trang. tìm kiếm và tham dự. Công cụ tìm kiếm tìm những trang trùng lặp như thế nào ? Nguyên nhân phổ biết nhất là các thành phần mở rộng và dữ liệu mẫu mà nhà phát triển cài đặt vào trang web joomla.