Chồng chéo giữa các công cụ tìm kiếm

Một phần của tài liệu CHUYÊN ĐỀ PHÂN TÍCH, SO SÁNH, ĐÁNH GIÁ CÁC HỆ THỐNG TÌM KIẾM THÔNG TIN (Trang 32)

Bảng so sánh các công cụ tìm kiếm

4.4.1 Chồng chéo giữa các công cụ tìm kiếm

Để xác minh giả định của phần trước, kết quả từ các nghiên cứu của Dogpile có thể được dùng để minh họa.

Dogpile là một siêu công cụ tìm kiếm nó lấy kết quả từ các công cụ tìm kiếm hàng đầu, bao gồm ba công cụ mà chúng ta đã phân tích ở trên (Google, Yahoo, Bing). Dogpile là một trong những siêu công cụ tìm kiếm phổ biến nhất và giành được giải thưởng siêu công cụ tìm kiếm năm 2003. Trong năm 2006 và 2007, nó được xếp hạng cao nhất theo đánh giá sự hài lòng của khách hàng do JD Powers and Associates, công ty tiếp thị thông tin toàn cầu khảo sát về siêu công cụ tìm kiếm.

Một nghiên cứu rất thú vị của Dogpile được xuất bản vào tháng 4 năm 2007 là đo sự chồng chéo và sự khác biệt thứ hạng của bốn công cụ tìm kiếm hàng đầu thế giới: Google, Yahoo!, Windows Live và Ask Jeeves. Chồng chéo xảy ra cho một truy vấn cụ thể khi một kết quả từ một công cụ tìm kiếm trùng với kết quả của một công cụ tìm kiếm khác. Nghiên cứu của Dogpile hợp tác với các nhà nghiên cứu từ Đại học Công nghệ Queensland và Đại học bang Pennsylvania, cho thấy rằng có một sự khác biệt lớn trong kết quả của các công cụ tìm kiếm web hàng đầu thế giới.

Để có được kết quả, hơn 19 nghìn truy vấn ngẫu nhiên đã được nhập vào để thử nghiệm với sự giúp đỡ của một công cụ tự động lấy các công cụ tìm kiếm và lưu trữ các dữ liệu kết quả của tất cả trang đầu tiên. Thông thường người dùng chỉ tìm kết quả phù hợp trong trang đầu tiên của kết quả trả về từ công cụ tìm kiếm. Chỉ lưu trữ và so sánh kết quả của một trang duy nhất (trang đầu tiên) là hạn chế của nghiên cứu này bời vì có quá nhiều các kết quả từ các công cụ tìm kiếm được trả về. Sự khác biệt giữa các kết quả cơ bản (tự nhiên) và kết quả tài trợ cũng được nhóm nghiên cứu xem xét, bởi vì cả hai đều có vị trí xếp hạng trên trang kết quả tìm kiếm.

Kết quả kiểm tra trên 4 công cụ tìm kiếm cho thấy có 88,3% tổng số kết quả không chồng chéo với một công cụ tìm kiếm khác. Với hai công cụ tìm kiếm bất kỳ thì tỷ lệ phần trăm của tổng số kết quả trùng lặp (chia sẽ) là 8,9%, với ba công cụ tìm kiếm bất kỳ thì tỷ lệ này là 2,2% và chỉ có 0,6% khi xét tới cả bốn công cụ tìm kiếm.

Điều này có nghĩa rằng sự chồng chéo trên trang kết quả đầu tiên của các công cụ tìm kiếm chỉ có 0,6% cho một truy vấn bất kỳ.

Nghiên cứu cũng chỉ ra rằng, nếu một người chỉ sử dụng công cụ tìm kiếm Google, người đó sẽ không nhận được khoảng 72,7% kết quả tốt nhất được hiển thị trên trang đầu tiên của các công cụ tìm kiếm khác. Ngược lại nếu một người chỉ sử dụng Yahoo, người đó có thể đã bỏ lỡ 69,2% kết quả tốt, và nếu chỉ sử dụng Live thì có thể bỏ qua 69,9% kết quả tốt ở trang đầu tiên.

So với các nghiên cứu trước đó từ tháng tư và tháng bảy năm 2005, được thực hiện bởi Dogpile, một xu hướng có thể được quan sát thấy là: Các nội dung trên công cụ tìm kiếm theo thời gian là duy nhất và giả định rằng công cụ tìm kiếm sẽ tiếp tục thay đổi công cụ thu thập dữ liệu và thay đổi kỹ thuật xếp hạng.

Bảng 3 cho thấy kết quả so sánh sự chồng chéo kết quả của các công cụ tìm kiếm Google, Yahoo, Live và Ask và siêu công cụ tìm kiếm Dogpile.

Bảng 3. So sánh chồng chéo kết quả ở trang đầu tiên của các công cụ tìm kiếm [Nguồn: Dogpile – 2007]

Greg Notess chủ sở hữu của Công cụ Tìm kiếm Showdown đã hỗ trợ Dogpile kiểm tra lại kết quả nghiên cứu. Ông ta làm thí nghiệm và cũng phát hiện ra rằng có rất ít dữ liệu chồng chéo giữa các công cụ tìm kiếm.

Như đã đề cập trước đây, người dùng thường chỉ xem kết quả ở trang đầu tiên.Vấn đề này có thể được giải quyết bằng cách phân nhóm các kết quả tìm kiếm. Thay vì sử dụng danh sách xếp hạng như trước đây, bây giờ chúng ta phân cấp phân nhóm các kết quả, để người dùng có thể chỉ cần chọn thể loại thích hợp nhất với nhu cầu của họ. Một số công cụ siêu tìm kiếm đã được hỗ trợ phương pháp này.

Tóm lại, do yếu điểm của mỗi công cụ tìm kiếm để đảm bảo kết quả toàn diện, thì cần sử dụng nhiều hơn một công cụ tìm kiếm để có được kết quả mà người dùng mong muốn.

Một phần của tài liệu CHUYÊN ĐỀ PHÂN TÍCH, SO SÁNH, ĐÁNH GIÁ CÁC HỆ THỐNG TÌM KIẾM THÔNG TIN (Trang 32)

Tải bản đầy đủ (DOCX)

(40 trang)
w