Công cụ SEOOffpage

Một phần của tài liệu luận văn thạc sỹ xây dựng công cụ hỗ trợ tối ưu hóa website cho các công cụ tìm kiếm (Trang 81 - 84)

4.4.1. Đặt bài toán

Các công cụ offpage rất đa dạng nhưng chỉ sẽ thực hiện 5 công cụ hữu dụng có khả năng kiểm tra những thông tin khách quan do Alexa, Google, css-validator.org, who.is, tools.pingdom.com. Các chức năng gồm:

- Thông tin Alexa: Thông tin truy xuất từ trang www.alexa.com [12] bao gồm thứ hạn quốc tế, thứ hạng trong nước, số lượng backlink, ý nghĩa.

- Kiểm tra website có bị lỗi không: Thông tin truy xuất từ trang

https://www.google.com.vn/safebrowsing/diagnostic?site= [16] nhiều lúc website

của mình nằm trong danh sách chứa virut mà các công cụ tìm kiếm phát hiện. - Xác nhận website đúng tiêu chuẩn W3C: Công cụ trả về đánh giá từ trang

http://www.css-validator.org [13]

- Giúp bạn tra cứu thông tin chi tiết về một tên miền, được truy xuất từ trang

http://who.is/whois/ [14]. Thông qua thông tin whois cung cấp, bạn có thể biết

thông tin về chủ sở hữu tên miền, tên miền đang được duy trì tại nhà đăng ký tên miền nào. Tên miền được đăng ký từ khi nào và hết hạn vào khi nào.

- Cho biết tốc độ tải trang web rất quan trọng cho người lướt web, công cụ trả về đánh giá từ trang http://tools.pingdom.com [21] người lướt web chỉ hứng thú với những website load nhanh, còn khi một trang web đáp ứng chậm, thường thì họ sẽ mất kiên nhẫn và khả năng họ quay lại sẽ là rất thấp.Họ trả tiền internet để được hưởng những dịch vụ tốt nhất, nhanh nhất, chứ không phải để vào một trang web trắng xóa và bắt đầu chờ đợi.

4.4.2. Phƣơng pháp giải quyết

Công cụ phân tích SEO Offpage chuyên đi lấy những kết quả từ những trang web uy tín bên ngoài để bổ sung thông tin cho các webmaster. Với hàng tỷ webstie đang tồn tại, đi kèm với nó là một khối lượng thông tin vô cùng to lớn. Chính vì sự khổng lồ của thông tin như vậy dẫn đến việc tìm kiếm và tổng hợp trang web nào là uy tín quả thật là

rất khó khăn, tuy nhiên qua quá trình tìm hiểu và thực nghiệm đã đề xuất ra một số trang web rất tin tưởng vì đó là nguồn thông tin chuẩn quốc tế được cung cấp cho người dùng.

Cách thức hoạt động theo sơ đồ

Hình 22 - Sơ đồ Offpage (Nguồn: tác giả)

Từ sơ đồ cho ta thấy, thông tin sẽ được thu thập từ 5 nguồn khác nhau, cách thức lấy thông tin được đặt trong file seooffpage.php, chúng ta đi vào chi tiết.

Thông tin Alexa

$this->_['_alexa'] = 'http://www.alexa.com/search?q='.$_web; $htmlAlexa = @file_get_html($this->_['_alexa']);

$this->_['alexaGloble']= strip_tags(trim(@$htmlAlexa->find('.sitematch-bar a', 2)- >plaintext));

$this->_['alexaVN']= strip_tags(trim(str_replace('traffic rank in vn: ','',@$htmlAlexa- >find('.sitematch-bar span', 3)->plaintext)));

$this->_['alexaLink']= strip_tags(trim(@$htmlAlexa->find('.sitematch-bar a', 4)- >plaintext));

Đoạn code trên sẽ đọc địa chỉ [http://www.alexa.com/search?q='.$_web] Với $_web là trang web bạn nhập vào.

Sau đó lấy nội dung file HTML của trang Alexa, rồi phân tích các thẻ HTML bên trong để lấy

 Alexa quốc tế

 Alexa Việt Nam

 Liên kết Alexa (là backlink trỏ về website của mình)

Kiểm tra website có bị lỗi không

Khi click vào link kiểm tra thì nhảy qua tab mới trên trình duyệt theo địa chỉ:

https://www.google.com.vn/safebrowsing/diagnostic?site=[domain]

Thông tin được Google tổng hợp, cung cấp cho chúng ta.

Xác nhận website đúng tiêu chuẩn W3C

Khi click vào link xác nhận website thì một popup hiện ra trên trình duyệt theo địa chỉ: http://www.css-

validator.org/validator?uri=[DOMAIN]&profile=css21&usermedium=all&warning=1&lang=en

Tra cứu thông tin chi tiết về một tên miền

$this->_['_whois'] = 'http://who.is/whois/'.$_web; $htmlwhois = @file_get_html($this->_['_whois']);

$whoiscontent = trim(@$htmlwhois->find('#registry_whois', 0)->innertext); $this->_['whoiscontent']= $whoiscontent;

$whoiscontentraw_data = trim(@$htmlwhois->find('.raw_data', 0)->innertext); $this->_['whoiscontentraw_data'] = preg_replace("/<img(.+?)>/is", ""

,$whoiscontentraw_data);

$restr = $this->view->view_assign($block['whois'],$this->_); Đoạn code trên sẽ đọc theo địa chỉ: [http://who.is/whois/'.$_web]

Với $_web là trang web bạn nhập vào

Sau đó lấy thông tin theo 2 tham số $whoiscontent và $whoiscontentraw_data

+ Tốc độ tải trang web:

http://tools.pingdom.com

4.4.3. Kết quả

Với những thông tin thu được từ những trang web uy tín cho một kết quả thực tế và chính xác, do đó kết quả của công cụ phân tích SEO Offpage rất khả quan.

Một phần của tài liệu luận văn thạc sỹ xây dựng công cụ hỗ trợ tối ưu hóa website cho các công cụ tìm kiếm (Trang 81 - 84)