XML sitemap, tạo file sitemap

Một phần của tài liệu luận văn thạc sỹ xây dựng công cụ hỗ trợ tối ưu hóa website cho các công cụ tìm kiếm (Trang 28 - 100)

Sitemap là cách đơn giản và tốt nhất để người lập trình web báo cho những bộ máy tìm kiếm biết về các trang trong website mà có thể chúng không được tìm thấy bằng những cách thu thập thông tin bình thường. Sitemap là một tập tin XML bao gồm danh sách các trang trong website cùng những đặc điểm mô tả của chúng. Tạo ra Sitemap và gửi nó cho bộ máy tìm kiếm sẽ đảm bảo rằng bộ máy tìm kiếm biết đến toàn bộ các trang đang tồn tại trong website của bạn.

Sitemap sẽ rất hữu dụng trong những trường hợp sau, website của bạn + Có nội dung động và thay đổi liên tục.

+ Mới được xây dựng và có rất ít những liên kết đến từ những website khác. + Có số lượng lớn tài liệu và nội dung mà có thể không hoàn toàn được liên kết đến từ những trang khác ngay chính trong website.

Google cũng như các bộ máy tìm kiếm khác sẽ không đảm bảo rằng quá trình tìm kiếm và thu thập thông tin tự động có thể biết đến hết các trang trong website của bạn. Vì vậy, sitemap sẽ giúp cho các bộ máy tìm kiếm có cái nhìn và nắm bắt tốt hơn về cấu trúc website của bạn. Thông qua sitemap, quá trình thu thập thông tin về website của bạn sẽ được đầy đủ hơn và dễ dàng hơn.

Với bộ máy tìm kiếm khác nhau thì sẽ chấp nhận một số loại định dạng cho giao thức sitemap khác nhau, dựa trên nền tảng giao thức sitemap phổ biến nhất với tên gọi Sitemap Protocol. Vì cùng một sitemap được tạo ra theo chuẩn giao thức này có thể sử dụng được cho nhiều bộ máy tìm kiếm khác nhau như Google, Yahoo!, Bing.

Ví dụ: dưới đây là một phần sitemap.xml của vietnamnet.vn

Hình 5 - File sitemap.xml (Nguồn: tác giả)

Để tạo file sitemap.xml có thể dùng phần mềm, sử dụng một số website cung cấp dịch vụ online hoặc tự viết tay. Có 2 yêu cầu với sitemap.xml đó là định dạng theo chuẩn escaped, tức là thay thế một số ký tự đặc biệt như “&”, “>”.

Bảng 1 - Giá trị đặc biệt trong sitemap.xml (Nguồn: tác giả)

Character Sign Escape Code

Ampersand & &

Single Quote ' '

Double Quote " "

Greater Than > >

Những trường hợp trong sitemap.xml

Bảng 2 - Những trường trong file sitemap.xml (Nguồn: tác giả)

Trường Yêu cầu Nội dung

<urlset> Bắt buộc có Phương thức đóng gói file, chuẩn giao tiếp protocol.

<url> Bắt buộc có Tag cha của địa chỉ URL.

<loc> Bắt buộc có Địa chỉ URL của trang page.

<lastmod> Không bắt buộc Ngày cập nhật, chỉnh sửa sau cùng, được viết theo dạng YYYY-MM-DD. (Tham khảo tại http://www.w3.org/TR/NOTE-datetime)

<changefreq> Không bắt buộc Các giá trị “Always”, “Hourly”, “Daily”, “Weekly”, “Monthly”, “Yearly”, “Never”.

<priority> Không bắt buộc Mối quan hệ giữa URL với site, giá trị từ 0 đến 1, mặc định là 0.5, URL quan trọng nhất thường là trang chủ website.

3.2 Xây dựng kế hoạch SEO

3.2.1 Xây dựng một kế hoạch SEO

Hiện tại thương mại điện tử đang phát triển mạnh tại Việt Nam và nhiều nước trên thế giới, chính vì thế đại đa số các doanh nghiệp điều mở rộng lĩnh vực hoạt động kinh doanh của mình vào thương mại điện tử, thậm chí nhiều doanh nghiệp còn chuyển hẳn sang lĩnh vực này để kinh doanh, doanh thu và lợi nhuận họ có được điều dựa vào thương mại điện tử.

Để triển khai dự án SEO thành công, website của chúng ta cần phải được phân tích và lên kế hoạch ngay từ khi thực hiện, dựa vào kế hoạch để đưa dự án đi đúng hướng, đúng tiến độ là điều cần thiết nhất. Trước tiên bạn hãy trả lời những câu hỏi đơn giản nhưng sẽ giúp bạn định hình được công việc mình phải làm như:

Đây được coi là mục tiêu của kế hoạch, vậy khi bắt đầu thì chúng ta phải xác định SEO phải là một phần trong chiến dịch marketing của doanh nghiệp. Do đó, để tăng hiệu quả về SEO bạn phải biết và thống nhất được chiến dịch marketing, để SEO đi theo đúng mục tiêu mà bạn đặt ra. Và mục tiêu của SEO không gì hơn là tìm kiếm khách hàng để nâng cao doanh số.

Khi đã xác định được mục tiêu của SEO rồi thì bạn cần phải làm để hoàn thành mục tiêu đó. Có nhiều phương thức để SEO website, cũng có nhiều trường phái để SEO nữa. Tuy nhiên, nếu bạn muốn xây dựng thương hiệu cho dịch vụ SEO website của mình thì bạn nên chọn phương pháp an toàn nhất cho khách hàng.

SEO website như thế nào thì hiệu quả?

Để chiến dịch SEO của bạn có hiệu quả, thì việc xác định được mục tiêu của chiến dịch SEO, xác định được công việc phải làm trong chiến dịch SEO đó là điều quan trọng nhất.

- Bạn cần hiểu được thị hiếu và phân tích được tâm lý khác hàng sử dụng dịch vụ trong dự án SEO bạn đang thực hiên.

- SEO gắn liền với website, do đó bạn cần phải đánh giá lại website và xây dựng cho mình một website tốt, có thẩm mỹ cao, tiện ích cho người dùng. Đừng bao giờ “xây nhà trên cát”.

- SEO cần cung cấp cho người dùng nội dung tốt về dịch vụ, sản phẩm dự án bạn thực hiện, do đó việc chuẩn bị cho mình kiến thức tốt về nghiệp vụ của khách hàng trước khi chuẩn bị thực hiện dự án là điều quan trọng để nâng cao chất lượng nội dung.

- Để SEO bền vững và an toàn cho khách hàng, hãy tránh xa các công cụ spam, và là công việc của chú ong chăm chỉ cần mẫn. Đừng quên mục tiêu của Google là gì? “cung cấp cho người dùng nhiều nội dung chất lượng nhất”.

- Thường xuyên kiểm tra tiến độ dự án SEO của mình với chiến dịch marketing tổng thể của doanh nghiệp, hiệu quả doanh số từ việc triển khai dự án SEO để kịp thời điều chỉnh chiến thuật tiếp thị.

Giai đoạn 1: SEO OnPage

 Bước 1: Thiết kế website

Lựa chọn tên miền website: lựa chọn tên miền ngắn gọn, dễ nhớ mang ý nghĩa thương hiệu hoặc các sản phẩm dịch vụ chủ đạo của công ty.

Lên ý tưởng website cần tạo: các chức năng trong web, bố cục trình bày nội dung, màu sắc, hình ảnh của giao diện phù hợp với sản phẩm dịch vụ của công ty.

Kham khảo vài website của các công ty khác để chọn lọc những ý tưởng hay. Tìm hiểu một số công ty thiết kế web để lựa chọn nơi thiết kế phù hợp.

Trong quá trình thiết kế website yêu cầu công ty thiết kế web phải thiết kế căn cứ vào các kỹ thuật SEO.

 Bước 2: SEO bài viết

Cập nhật các bài viết mới thường xuyên, chú ý phải viết bài mới không được copy từ các bài khác từ trên mạng.

Đặt tiêu đề bài viết ngắn gọn có chứa từ khóa cần SEO.

Nội dung thẻ meta description ngắn gọn và chứa thông tin thu hút người xem. Bài viết có ít nhất một hình ảnh và phải có thẻ alt mô tả ảnh kèm theo.

Phân phối từ khóa cần SEO một cách hợp lý, tránh tình trạng nhồi nhét từ khóa vì nó sẽ gây mất điểm.

Bài viết phải chứa tối thiểu hai thẻ H1 và H2 trong các đoạn văn.

Gian đoạn 2: SEO OffPage

Công việc quan trọng trong SEO offpage là phải xây dựng cho website một hệ thống backlink chất lượng.

Việc xây dựng backlink và vô cùng quan trọng trong SEO từ việc làm tăng thứ hạng pagerank của website đến tăng thứ hạng các từ khóa của website đó, có nhiều cách để có được backlink cụ thể như sau:

-Post bài lên các diễn đàn kèm theo chữ ký có chứa link tới website cần SEO. -Tham gia thảo luận tại các blog bằng các comment có chứa link.

-Hoạt động trên các website cộng đồng như Facebook, Google plus, Twitter… -Submit website, các bài viết trên website lên các trang bookmark uy tín.

-Email marketing để lôi kéo khách truy cập đến website.

-Nếu có kinh phí nên kết hợp cùng với chiến dịch Google Adwords nhằm tăng hiệu quả cho SEO.

-Trao đổi các textlink với các website cùng lĩnh vực và uy tín.

Giai đoạn 3: Đánh giá và bổ sung

Phân tích kết quả đạt được sau khi thực hiện quá trình SEO onpage và SEO offpage, vị trí và thứ hạng của website đang ở mức nào? có những thiếu xót nào cần được bổ xung không? các đối thủ cạnh tranh hơn kém ta ở điểm nào? Để từ đó có những củng cố tích cực giúp website có vị trí tốt hơn.

Gian đoạn 4: Theo dõi thưỡng xuyên và duy trì

Theo dõi là một phần quan trọng trong kế hoạch SEO. Nhiều người tin rằng chỉ cần phát triển và hiện thực kế hoạch SEO là xong. Nhưng sự thật là SEO không phải chỉ là công việc tại một thời điểm. Nó là quá trình liên tục yêu cầu kiểm tra, giám sát, và thường xuyên xây dựng lại.

Khi đã đạt được thứ hạng cao, nên tiếp tục duy trì vị trí đó bằng việc thực hiện SEO onpage và SEO offpage như ban đầu một cách đều đặn, tuy nhiên tránh lạm dụng các kỹ thuật SEO quá đà sẽ gây phải ứng ngược lại vì đã phạm vào các điều khoản của các công cụ tìm kiếm.

3.2.2 Organic SEO

Organic SEO là phương pháp tối ưu hóa trang web mà không cần phải mất nhiều tiền để đạt thứ hạng cao trong trang kết quả tìm kiếm. Tuy nhiên đó không phải là định nghĩa chính xác mà nó mang lại, một số chuyên gia SEO nghĩ rằng đó là sự tối ưu hóa nội dung của trang web để thu hút crawler và spider để đánh chỉ mục. Một số khác lại nghĩ rằng đó là số liên kết chất lượng mà website có được. Nhưng sự thật thì Organic SEO chỉ là sự kết hợp của những yếu tố như tag meta, tag title, tag meta description. Organic SEO tối ưu hóa những yêu tố tự nhiên, xây dựng dựa trên nhiều thành phần để tạo ra website. Một trong những điều hấp dẫn là các phương pháp của Organic SEO không hề tốn chi phí.

Vậy điều cần quan tâm sẽ là: lợi ích của Organic SEO như thế nào, và làm sao để thực hiện được nó?

Lợi ích của Organic SEO

Số người nhấp chuột lên trang web nhiều hơn: Bất cứ ai cũng có thể trả tiền để có thể lên top đầu. Điều này không chỉ xảy ra trong thế giới thực mà còn xảy ra trong thế giới ảo. Nó xảy ra trong các cộng cụ tìm kiếm ngày nay, nhà quản trị có thể trả tiền cho các công cụ tìm kiếm như Google, Yahoo!, Bing để có được vị trí tốt nhất trên bảng xếp hạng. Do đó người sử dụng thường không tin tưởng lắm vào các trang web trả tiền mới có thể xuất hiện trong trang đầu tiên của kết quả tìm kiếm (SERP - Search Engine Result Pages) – bởi đôi khi nội dung những trang web đó không hấp dẫn nên cần phải trả tiền để được tìm thấy. Vì vậy họ thường chọn những trang web xuất hiện tự nhiên trên SERPs và nhấp chuột vào đó.

Kết quả tìm kiếm được hiển thị lâu dài: Organic SEO giúp website xuất hiện trên trang kết quả trả về trong một thời gian dài, bởi trang web cung cấp cho công cụ tìm kiếm những thông tin chính xác, phù hợp với nội dung người sử dụng muốn tìm kiếm. Phù hợp ở đây là cái đạt được không phải bằng thủ thuật hoặc phải trả tiền. Điều đó có nghĩa chúng ta phải liên tục tạo ra những nội dung mà người sử dụng muốn tìm và đảm bảo những nội dung liên quan ở các liên kết đến trang web khác.

Xây dựng được niềm tin: Liên tục bổ sung các yếu tố tự nhiên vào trang web mà không dùng thủ thuật nào, nó mạng lại niềm tin cho khách hàng bởi khách hàng biết rằng chúng ta đã và đang làm việc cực kỳ nghiêm túc. Những gì ta quan tâm trình bày trên trang web thể hiện kiến thức chuyên sâu về vấn đề đó.

Không tốn nhiều chi phí: Đôi khi những người chủ của trang web cùng cạnh tranh ở những vị trí đáng mong muốn của SERPs với những từ khóa cụ thể. Bình thường phải trả khá nhiều tiền cho những dịch vụ này của công cụ tìm kiếm. Chẳng hạn như “Google AdWords”, đấu giá từ khóa “web designing” thường vượt quá 35$ mỗi lần nhấp chuột. Vì vậy cứ 10 người nhấp chuột vào các quảng cáo của Google AdWords thì các chủ trang web phải trả hơn 350$. Các dịch vụ trả tiền cho mỗi lần nhấp chuột

thường được gọi là PPC (Pay Per Click) phù hợp với những doanh nghiệp có ngân sách lớn muốn đưa trang web của mình đến khách hàng nhanh hơn.

Vậy làm thế nào để có thể đạt được Organic SEO

Đạt được Organic SEO có thể tốn thời gian, điều cần làm là tập trung vào đúng những phần tử trên trang web. Khi đó ta sẽ thấy được rằng Organic SEO là một phương pháp khá hiệu quả để đạt thứ hạng cao trên trang kết quả tìm kiếm.

Tuy nhiên, chúng ta cần biết rằng Organic SEO thực sự mạng mẽ khi nó được kết hợp với một dịch vụ PPC hay một chương trình quảng cáo từ khóa. Đó là cách tốt nhất để đưa một trang web lên top đầu. Bước đầu tiên để tối ưu trang web là đảm bảo các phần tử trên website được tối ưu. Ở đây ta sẽ xem qua một số phần tử cơ bản.

Hình 6 - Organic SEO (Nguồn: http://novaads.com/)

Nội dung website

Nội dung website là một trong những đề tài được tranh luận nhiều nhất trong SEO. Giả sử nhà quản trị có một trang web bán hàng, khi đó anh ta sẽ cung cấp những thông tin cơ bản về hàng hóa, dịch vụ. Những mô tả, đề tài, blog và cả những mẫu quảng cáo, tất cả đều được quét qua bởi spider và crawler. Crawler và spider có khả

năng so sánh giữa nội dung và các thành phần khác của website. Thứ hạng cao là khi nội dung phải hòa hợp với những thành phần khác.

Một số công cụ tìm kiếm sẽ loại bỏ trang web, hoặc đưa nó vào thứ hạng thấp hơn nếu trang có nội dung không phải là duy nhất. Vậy nên nếu mới xây dựng website thì đừng bao giờ đi copy nội dung của những trang web khác, cách tốt nhất là nên xây dựng một số trang có nội dung càng hấp dẫn càng tốt. Từ khi blog ra đời, các crawler và spider có thêm khả năng kiểm tra tính cập nhập thường xuyên của bài viết và tìm kiếm nội dung đó có duy nhất hay không. Tuy rằng vậy nhưng cũng có một số trang web có nội dung tĩnh, cụ thể là một số trang web chuyên bán các sản phẩm có phần mô tả ít khi thay đổi, những thành phần khác của website, như nhận xét về sản phẩm, hoặc cập nhập về số lượng sản phẩm cũng sẽ thỏa mãn yêu cầu về tính cập nhập của crawler. Và một điều quan trọng trong nội dung là cần phải xem xét là từ khóa, lựa chọn từ khóa như thế nào, mật độ từ khóa ra sao cho phù hợp.

Liên kết ngoài và liên kết trong

Một thành phần không kém quan trọng trong nội dung website là các liên kết. Liên kết bên trong trang web, liên kết đi ra ngoài trang web đều được kiểm tra xem có phù hợp và đảm bảo những liên kết đều phải có liên quan đến nội dung, đừng đưa vào những liên kết không chắc chắn để rồi trang web có thứ hạng thấp.

Nhưng liên kết bên trong trang web cũng rất quan trọng, cách điều hướng người dùng từ trang này sang trang khác đều đảm bảo nội dung có liên quan đến nhau hay cùng thuộc một đề tài thảo luận. Tốt nhất nên xây dựng sitemap cho website để crawler và spider chỉ mục trang. Đồng thời nó sẽ giúp cho người sử dụng dễ dàng tiếp cận trực tiếp các trang web.

Tính tƣơng tác với ngƣời sử dụng

Chúng ta đang ở trong một kỷ nguyên tương tác. Hầu hết mọi người đều muốn giao tiếp với những website mà họ ghé thăm. Đó có thể là một cuộc thăm dò, lời bình

Một phần của tài liệu luận văn thạc sỹ xây dựng công cụ hỗ trợ tối ưu hóa website cho các công cụ tìm kiếm (Trang 28 - 100)