Một vấn đề phổ biến trên các trang web và các kho văn bản khác trên mạng đó là:cho một tập các từ, tìm tất cả các tài liệu có chứa một (hoặc tất cả ) những từ đó. Một công cụ tìm kiếm là một ví dụ điển hình của quá trình này. Công cụ tìm kiếm sử dụng một công nghệ đặc biệt gọi là chỉ số ngược, nơi cho mỗi từ xuất hiện trên web ( có 100.000.000 từ khác nhau), một danh sách của tất cả những nơi mà từ đó xuất hiện được lưu trữ. Máy móc với lượng lớn bộ nhớ giữ đa số các danh sách có sẵn, cho phép nhiều người tìm kiếm các tài liệu cùng một lúc.
Chỉ số kỹ thuật đảo ngược không sử dụng các thiết bị tự động hữu hạn, nhưng họ cũng mất một lượng rất lớn thời gian cho trình thu thập để sao chép web và thiết lập các chỉ số. Có một số ứng dụng liên quan không thích hợp cho các chỉ số đảo ngược những ứng dụng tốt cho cơ sở kỹ thuật máy tự động. Các đặc tính làm cho một ứng dụng phù hợp cho các tìm kiếm sử dụng máy tự động là:
1. Việc tìm kiếm trên các kho lưu trữ có thể thay đổi nhanh chóng. Ví dụ: (a) Mỗi ngày các nhà phân tích tin tức muốn tìm kiếm trên mạng các bài báo trong ngày cho các chủ đề liên quan. Ví dụ một nhà phân tích tài chính có thể tìm kiếm một mã chứng khoán hoặc tên công ty.
(b) Một robot mua sắm muốn tìm kiếm các giá hiện hành tính phí cho các mục mà khách hàng yêu cầu. Các robot sẽ truy xuất các trang danh mục hiện tại từ web và sau đó tìm kiếm các trang cho lời đề nghị một mức giá cho một cụ thể.
Ví dụ: amazon.com không dễ dàng tìm kiếm tất cả các trang cho tất cả các sách mà công ty bán. Thay vào đó, các trang này được tạo ra "một cách nhanh chóng" trong phản ứng để truy vấn. Tuy nhiên, chúng ta có thể gửi một truy vấn cho cuốn sách về một chủ đề nhất định.