Phương pháp thu thập dữ liệu

Một phần của tài liệu Bài giảng phân tích web (Trang 91 - 93)

PHÂN TÍCH WEB Mã môn h ọc: MAR

5.7 Phương pháp thu thập dữ liệu

Tất cả các công cụ phân tích web có một phương pháp để theo dõi khách truy cập. Điều quan trọng là phải hiểu các loại khác nhau của sưu tập dữ liệu và hiểu những khác biệt chính giữa các phương pháp thu thập.

Beacons

eacons thường vô hình 1 × 1 điểm ảnh được nhúng vào các trang bạn muốn theo dõi.

marketing email thường sử dụng chúng để theo dõi khi một email đã được mở và mạng lưới phân phối quảng cáo sử dụng chúng để theo dõi chiến dịch trên nhiều trang web. Cách công nghệ hoạt động là khi một email hoặc trang web được mở bởi khách truy cập máy chủ web gửi trang trở lại trình duyệt truy cập của bạn cũng sẽ gửi một "nhận được yêu cầu" tới máy

89 | P a g e

chủ của bên thứ ba (nhà cung cấp mạng quảng cáo theo dõi hoạt động ví dụ). Khi trang tải nó

thực thi các yêu cầu cho hình ảnh. Điều này sau đó gửi dữ liệu ẩn danh về xem trang lại nhà cung cấp.

Những bất lợi với việc sử dụng hình thức này theo dõi là nếu khách hàng phần mềm IE trình duyệt web hoặc chương trình email đã tắt hình ảnh. Nếu các yêu cầu hình ảnh được tắt thì bạn không thể thu thập dữ liệu. eacons cũng phải làm việc với các mạng bên thứ 3 quảng cáo (hoặc các nhà cung cấp email) có thể có nghĩa là cookie của bên thứ ba được sử dụng để xác định các thăm vô danh như truy cập mới hoặc trả lại. cookie của bên thứ ba thường bị chặn bởi phần mềm gián điệp và phần mềm mềm quảng cáo trên trình duyệt khách nghĩa là giải pháp có thể không theo dõi tất cả các lần.

Tags / Javascript

Javascript gắn thẻ là một trong những cách phổ biến nhất để đo lượng truy cập website. Các trang web đang được theo dõi có mã Javascript chèn vào mỗi trang. Các Javascript (khi nạp bởi khách truy cập) gán cho mỗi khách truy cập một cookie và gửi thông tin về người truy cập và phiên truy cập vào một máy chủ bộ sưu tập. Kỹ thuật này không ghi lại bất kỳ dữ liệu cá nhân của người truy cập nó chỉ sử dụng cookie như là một định để nếu khách truy cập trở lại chúng có thể được phân loại như là một người truy cập lặp lại chứ không phải là một khách mới. Nếu khách truy cập có cookie sau đó theo dõi sẽ chỉ ghi lại các thông tin truy cập ở hầu hết các trường hợp (một số hệ thống cũng trở lại với người khách địa chỉ IP và phiên bản trình duyệt nếu một cookie là không có sẵn -. Mặc dù điều này có vấn đề chính xác lặp lại lần)

Nhược điểm chính của giải pháp dựa trên tag là một thực tế bạn có gắn thẻ mỗi trang bạn muốn theo dõi. Ở cấp độ doanh nghiệp khi nhiều nhà cung cấp thực hiện có liên quan đến việc kiểm soát chất lượng gắn thẻ có thể trở thành thách thức. Đây là lý do tại sao "Hệ thống quản lý thẻ" đã trở nên nổi tiếng.

Logs

Bản ghi web là phương pháp đầu tiên theo dõi về hành vi trang web và được thiết kế ban đầu vì lý do kỹ thuật. Nhật ký là hồ sơ của tất cả các yêu cầu thực hiện cho các máy chủ web. Khi một người truy cập một trang yêu cầu đăng nhập vào máy chủ. Khách truy cập duy nhất thường được xác định bởi địa chỉ IP và tiêu đề của khách truy cập nhưng một số phiên bản cao cấp hơn như Web xu hướng cũng gán một cookie để người truy cập cho chính xác hơn.

Thật không may là cácfile log cũng ghi lại tất cả các yêu cầu khác đến máy chủ mà có thể bao gồm thu thập công cụ tìm kiếm, email (chương trình crawl web được thiết kế để thu thập địa chỉ email) và có nhiều giải pháp sử dụng địa chỉ IP để xác định người truy cập số lượng

luôn được thổi phồng. địa chỉ IP thường được tự động thay đổi bởi các nhà cung cấp dịch vụ Internet (đôi khi ngay cả trong cùng một phiên) có nghĩa là một người truy cập vào lại trang web của bạn có thể được ghi lại như ba khách (hoặc ba, hoặc mười, tùy thuộc vào mức độ thường xuyên ông thoát ra khỏi từ ISP của mình và là gán một địa chỉ IP mới).

Vì lý do này các tiêu chuẩn đã chuyển từ các file log để Javascript gắn thẻ bất chấp những vấn đề gắn thẻ.

90 | P a g e

Một giải pháp thay thế cho các thẻ và các bản ghi là sniffer mạng. Phần cứng và phần mềm được cài đặt trên các máy chủ web mà nắm bắt tất cả các lưu lượng mạng. Truy cập được xác định bởi các tập tin cookie và rất nhẹ Javascript gắn thẻ cần thiết để nắm bắt thông tin như kết nào được nhấp vào các sự kiện trình duyệt hoặc flash. Tuy nhiên phần chính của việc theo dõi được thực hiện ở cấp độ mạng. Đây là một lựa chọn tốt cho các doanh nghiệp lớn như các vấn đề gắn thẻ là ít thách thức.

Nhược điểm là chi phí trong điều kiện thực hiện và giá cả. Các giải pháp sniffing mạng thường là đắt hơn cả gắn thẻ để mua và thực hiện mặc dù tiết kiệm dài hạn có thể được thực hiện bởi có bảo trì thẻ ít hơn. ạn cũng cần phải cẩn thận về sự riêng tư với gói sniffing. Cấu hình nên có nghĩa là không có thông tin cá nhân (PII) được thông qua hoặc bạn có thể vi phạm luật pháp.

Trình thu thập / bot

Các công cụ truyền thông xã hội sử dụng dữ liệu thu thập thêm dữ liệu để cung cấp trực tiếp từ mạng. Vì vậy, ví dụ Facebook cung cấp cho bạn rất nhiều dữ liệu mà nhiều công cụ kết nối thông qua một API. Tuy nhiên nhiều công cụ cũng thu thập dữ liệu các trang web với một truy vấn (như từ khóa) để tìm ra bao nhiêu lần một thương hiệu đã được đề cập. ạn cũng có chương trình ping mà đo lường những thứ như thời gian hoạt động trang web. Điều này được thực hiện bằng cách ping một trang web với một yêu cầu và gửi các gói thông tin lại cho một hệ thống được thiết kế để hiểu xem các trang web làm việc hay không.

Một phần của tài liệu Bài giảng phân tích web (Trang 91 - 93)

Tải bản đầy đủ (PDF)

(162 trang)