Hai thay đổi trong cách tiếp cận dữ liệu – tất cả thay vì một vài (mẫu), rộng thay vì tinh – dẫn đến sự thay đổi thứ ba: tương quan thay vì nhân quả. Thay vì cố gắng để tìm hiểu căn nguyên của sự việc, chúng ta cĩ thể chỉ cần tìm hiểu sự tương quan giữa các hiện tượng và dùng nĩ để giải quyết vấn đề. Vào tháng 2/2009, Google đã gây chấn động trong giới y tế khi cơng bố một nghiên cứu trên tạp chí Nature cho thấy khả năng theo dõi sự bùng phát dịch cúm chỉ bằng cách sử dụng dữ liệu tìm kiếm. Mỗi ngày Google xử lý hơn một tỉ tìm kiếm chỉ riêng ở Mỹ và tất cả đều được lưu lại. Google đã lấy 50 triệu cụm từ được tìm nhiều nhất từ năm 2003 đến 2008 và so sánh với dữ liệu dịch cúm của Trung tâm kiểm sốt và phịng ngừa bệnh dịch của Mỹ (CDC) để xác định sự tương quan giữa các cụm từ tìm kiếm ở địa phương nào đĩ với dữ liệu của CDC về việc
bùng phát dịch cúm ở địa phương đĩ. Thực ra CDC cĩ theo dõi lượng bệnh nhân đến khám ở các bệnh viện và phịng khám trên cả nước, nhưng báo cáo của CDC cĩ độ trễ một hoặc hai tuần - thời gian quá dài trong trường hợp xảy ra đại dịch. Trong khi đĩ hệ thống báo cáo của Google làm việc gần như tức thời (theo thời gian thực). Kết quả của Google chỉ đơn giản là sự tương quan. Nĩ khơng cho biết lý do tại sao người ta thực hiện tìm kiếm thơng tin về bệnh cúm. Cĩ thể vì cảm thấy bị bệnh, nghe tiếng hắt hơi ở nhà bên, hoặc do lo lắng sau khi nghe tin dịch? Hệ thống của Google khơng biết điều này, nhưng nĩ cung cấp thơng tin đủ để chính phủ biết điều gì đang diễn ra và cần phải làm gì. Đây là một ví dụ tốt về việc tìm ra sự tương quan cĩ thể đem lại lợi ích to lớn, ngay cả khi nguyên nhân cịn mơ hồ.
Tất nhiên, biết được nguyên nhân đằng sau sự việc là mong muốn chính đáng. Vấn đề là nguyên nhân thường rất khĩ tìm ra, và nhiều lúc khi chúng ta nghĩ rằng mình đã xác định được thì thường đĩ chỉ là “ảo ảnh”.