Gần đây “Big Data” ngày càng nhận được sự quan tâm trong nhiều lĩnh vực, nhiều dữ liệu được các tổ chức thu thập hơn, giúp ích nhiều KTV tìm kiếm thông tin liên quan tới khách hàng. Ngoài dữ liệu được lưu trữ trong các hệ thống kế toán truyền thống, KTV cũng có thể thu thập lượng lớn bằng chứng từ các loại dữ liệu khác, chẳng hạn như dữ liệu phi tài chính được trích xuất từ hệ thống ERP hiện đại hoặc cơ sở dữ liệu trực tuyến, RFID và cảm biến nối mạng, phương tiện truyền thông xã hội và thậm chí cả mạch kín video truyền hình trong các cửa hàng. Để trích xuất và xử lý dữ liệu từ nhiều nguồn khác nhau nhằm xác định rủi ro và thu thập bằng chứng, và cuối cùng là hỗ trợ ra quyết định, KTV bắt đầu sử dụng một công nghệ mới nổi được gọi là Phân tích dữ liệu kiểm toán (ADA). ADA (Audit Data Analytics) được định nghĩa là một khoa học về “Phát hiện và phân tích các mẫu, xác định các điểm bất thường và trích xuất thông tin hữu ích khác trong dữ liệu cơ bản hoặc liên quan đến chủ đề của cuộc đánh giá thông qua phân tích, mô hình hóa và trực quan cho mục đích lập kế hoạch hoặc thực hiện cuộc đánh giá” (AICPA, 2015). Tiền thân của ADA là thủ tục phân tích, từ lâu đã được sử dụng như một kỹ thuật đánh giá bên ngoài trong quá trình lập kế hoạch, kiểm tra cơ bản và đánh giá cuối cùng (AICPA, 2015). Vì các thủ tục phân tích được thực hiện trong giai đoạn lập kế hoạch thường “sử dụng dữ liệu được tổng hợp ở mức cao” (AICPA, 2012) , “Kết quả của các thủ tục phân tích đó chỉ cung cấp một dấu hiệu ban đầu rộng rãi về việc liệu có thể tồn tại sai sót trọng yếu hay không” (AICPA, 2012). Các kỹ thuật ADA có thể được sử dụng trên mức độ giao dịch của dữ liệu vì các kỹ thuật này thường duy trì hiệu suất tốt ngay cả trên các bộ dữ liệu lớn và có kích thước cao. Do đó, ADA có thể nâng cao độ chính xác của việc đánh giá rủi ro và cải thiện hơn nữa chất lượng lập kế hoạch. Bên cạnh dữ liệu được ghi lại bởi hệ thống ERP của một DN, KTV cũng có quyền truy cập vào dữ liệu công khai như các bài đăng trên mạng xã hội (Moon, 2016) , dữ liệu mở của chính phủ (Dai và công sự, 2016) , dữ liệu thời tiết (Yoon, 2016) ,....
Khóa luận tốt nghiệp Vũ Thị Thanh Tú Công nghệ phân tích dữ liệu có khả năng khám phá lượng dữ liệu khổng lồ như vậy ở các cấu trúc và định dạng khác nhau, điều mà các quy trình phân tích truyền thống không thể xử lý được. Phân tích dữ liệu kiểm toán cung cấp một số lợi thế so với các phương pháp tiếp cận truyền thống. Thứ nhất, ADA tiết kiệm chi phí hơn về mặt thu thập bằng chứng. Thứ hai, nhiều kỹ thuật phân tích dữ liệu có thể mở rộng và nói chung có thể duy trì hiệu suất tốt khi xử lý các tập dữ liệu lớn và phức tạp (Alpaydin, 2010). Cuối cùng, một số kỹ thuật ADA có thể xác định các mẫu dữ liệu trong thế giới quan không bị giám sát mà vẫn có thể khám phá ra mô hình bao gồm các tập tin không chứa nhãn thông tin (Thiprungsri và Vasarhelyi, 2011). Các nhà nghiên cứu kiểm toán đã dành những nỗ lực đáng kể để tích hợp các kỹ thuật ADA vào việc phát hiện rủi ro, xác định bất thường, kiểm soát nội bộ và phát hiện gian lận. Byrnes (2015) đã khám phá việc sử dụng các phương pháp phân cụm trong việc xác định các nhóm khách hàng rủi ro cho bộ phận thẻ tín dụng của ngân hàng.