Trong nhiều năm trở lại đây, các kiểm toán viên KTV đã có thể dựa vào những công cụ phân tích dữ liệu tương đối phát triển nhờ công nghệ thông tin để đưa ra kết luận, tuy nhiên với sự bù
Trang 1VÕ THỊ BÍCH HÀ
PHÂN TÍCH ẢNH HƯỞNG CỦA BIG DATA ĐẾN QUÁ TRÌNH PHÂN TÍCH DỮ LIỆU TẠI CÁC DOANH NGHIỆP KIỂM TOÁN CỦA VIỆT NAM
LUẬN VĂN THẠC SĨ KINH TẾ
Tp Hồ Chí Minh – Năm 2018
Trang 2VÕ THỊ BÍCH HÀ
PHÂN TÍCH ẢNH HƯỞNG CỦA BIG DATA ĐẾN QUÁ TRÌNH PHÂN TÍCH DỮ LIỆU TẠI CÁC DOANH NGHIỆP KIỂM TOÁN CỦA VIỆT NAM
Chuyên ngành: Kế toán
Mã số: 8340301
LUẬN VĂN THẠC SĨ KINH TẾ
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS TRẦN KHÁNH LÂM
Tp Hồ Chí Minh – Năm 2018
Trang 3phân tích dữ liệu tại các doanh nghiệp kiểm toán của Việt Nam” là kết quả nghiên
cứu độc lập của tôi, do chính tôi hoàn thành
Nội dung luận văn có tham khảo và sử dụng tài liệu, thông tin được đăng tải trên các tác phẩm, tạp chí và các trang web theo danh mục tài liệu tham khảo của luận văn
Thành phố Hồ Chí Minh, tháng 04 năm 2018
VÕ THỊ BÍCH HÀ
Trang 4LỜI CAM ĐOAN 3
MỤC LỤC 4
DANH MỤC CÁC TỪ VIẾT TẮT 1
DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, SƠ ĐỒ 1
DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, SƠ ĐỒ 2
PHẦN MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục tiêu nghiên cứu 2
3 Câu hỏi nghiên cứu 3
4 Đối tượng nghiên cứu 3
5 Phạm vi nghiên cứu 3
5.1 Về nội dung 3
5.2 Về không gian và thời gian 3
6 Phương pháp nghiên cứu 3
7 Những đóng góp khoa học và thực tiễn của luận văn 4
8 Kết cấu của luận văn 4
CHƯƠNG 1: TỔNG QUAN VỀ BIG DATA VÀ PHÂN TÍCH DỮ LIỆU TRONG KIỂM TOÁN 6
1.1 Big Data 6
1.1.1 Tóm lược một số thay đổi trong dữ liệu 6
1.1.2 Big Data 7
1.1.2.1 Các vấn đề quan trọng 7
1.1.2.2 Những yếu tố tạo nên Big Data 10
1.1.2.3 Các lĩnh vực thuộc Big Data 12
1.1.2.4 Phương pháp thu thập và truy xuất kiến thức từ Big Data 13
1.1.3 Các vấn đề về quản lý và an ninh dữ liệu 14
Trang 51.2.3 Phản ứng của các bên liên quan đến phân tích dữ liệu 20
1.2.3.1 Những người sử dụng nội bộ 20
1.2.3.2 Chính phủ, ủy ban kiểm toán, các tổ chức - cơ quan quản lý bên ngoài 21
1.2.3.3 Bộ phận công nghệ thông tin 22
1.2.3.4 Những khách hàng có sử dụng phân tích dữ liệu 22
1.3 Các nghiên cứu về Big Data và phân tích dữ liệu kiểm toán 23
1.3.1 Các nghiên cứu về Big Data trong kiểm toán 23
1.3.2 Các nghiên cứu về phân tích dữ liệu kiểm toán 26
KẾT LUẬN CHƯƠNG 1 30
CHƯƠNG 2: THỰC TRẠNG ẢNH HƯỞNG CỦA BIG DATA ĐẾN QUÁ TRÌNH PHÂN TÍCH DỮ LIỆU TẠI CÁC DOANH NGHIỆP KIỂM TOÁN CỦA VIỆT NAM 32
2.1 Sơ lược về đặc điểm hoạt động kiểm toán độc lập Việt Nam 32
2.1.1 Lịch sử hình thành và phát triển hoạt động kiểm toán độc lập Việt Nam 32
2.1.2 Tình hình hoạt động của KTĐL hiện nay 34
2.1.2.1 Số lượng, cơ cấu và loại hình công ty kiểm toán 34
2.1.2.2 Đội ngũ KTV và nhân viên chuyên nghiệp 35
2.1.2.3 Về số lượng, cơ cấu khách hàng và doanh thu dịch vụ cung cấp 36 2.2 Khảo sát ảnh hưởng của Big Data đến quá trình phân tích dữ liệu tại các doanh nghiệp kiểm toán của Việt Nam 37
2.2.1 Mục tiêu của khảo sát 37
2.2.2 Đối tượng khảo sát 38
2.2.3 Phương pháp khảo sát 38
2.3 Kết quả khảo sát 38
2.3.1 Khái niệm về Big Data 39
2.3.2 Những nhận định về Big Data 45
Trang 62.3.2.3 Big Data quan trọng ở sự đa dạng (variety) chứ không phải ở dung
lượng (volume) 48
2.3.2.4 Cơ cấu tổ chức trong môi trường Big Data sẽ ảnh hưởng đến thành công của doanh nghiệp 49
2.3.2.5 Thách thức nhất khi sử dụng Big Data không phải đến từ công nghệ mà xuất phát từ con người 51
2.3.3 Phân tích dữ liệu kiểm toán từ Big Data 53
2.3.4 Nguồn nhân lực trong những vấn đề liên quan đến Big Data và phân tích dữ liệu kiểm toán 58
2.3.4.1 Nhà lãnh đạo 58
2.3.4.2 Bộ phận công nghệ thông tin 61
2.4 Đánh giá chung về thực trạng 64
2.4.1 Ưu điểm 64
2.4.2 Hạn chế 65
2.4.3 Nguyên nhân 65
2.4.3.1 Nguyên nhân khách quan 65
2.4.3.2 Nguyên nhân chủ quan 66
KẾT LUẬN CHƯƠNG 2 66
CHƯƠNG 3: GIẢI PHÁP NÂNG CAO TÍNH HỮU ÍCH CỦA BIG DATA VÀ PHÂN TÍCH DỮ LIỆU KIỂM TOÁN TẠI CÁC DOANH NGHIỆP KIỂM TOÁN CỦA VIỆT NAM 68
3.1 Quan điểm chung về giải pháp 68
3.2 Các giải pháp cụ thể 69
3.2.1 Đầu tư vào nguồn nhân lực 69
3.2.2 Đầu tư vào cơ sở vật chất 70
3.2.3 Các giải pháp hỗ trợ khác 71
KẾT LUẬN CHƯƠNG 3 71
KẾT LUẬN 72
Trang 8DANH MỤC CÁC TỪ VIẾT TẮT
AICPA Hiệp hội kế toán viên công chứng Hoa Kỳ
ACCA Hội Kế toán công chứng Anh Quốc
BCTC Báo cáo tài chính
Big4 Nhóm 4 công ty kiểm toán hàng đầu thế giới
CMKT Chuẩn mực kiểm toán
DNNN Doanh nghiệp nhà nước
FRC Hội đồng Báo cáo tài chính (Anh Quốc)
IAASB Ủy ban Quốc tế về Chuẩn mực kiểm toán và Dịch vụ đảm bảo
ISA Chuẩn mực kiểm toán quốc tế
ISA 240 Chuẩn mực kiểm toán quốc tế số 240
KTĐL Kiểm toán độc lập
PCAOB Ủy ban giám sát các công ty đại chúng Hoa Kỳ
VACPA Hội Kiểm toán viên hành nghề Việt Nam
Trang 9DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, SƠ ĐỒ
Hình 1.1 Số lượng tài khoản Facebook trên thế giới vào 06/2017 7
Hình 1.2 Ba thành phần đặc trưng cấu thành Big Data 8
Hình 1.3 Doanh thu dự báo từ Big Data và phân tích kinh doanh toàn thế giới từ năm 2015 đến 2020 10
Hình 2.1 Kích thước dữ liệu được xem là Big data 40
Hình 2.2 Dữ liệu thuộc Big Data 41
Hình 2.3 Những tiêu chuẩn và cấu trúc được quan tâm khi nói về Big Data 42 Hình 2.4 Những chức năng trong doanh nghiệp sử dụng Big Data và phân tích dữ liệu 43
Hình 2.5 Đánh giá tính phù hợp, chính xác và đúng thời điểm của dữ liệu 43
Hình 2.6 Vai trò của Big Data trong doanh nghiệp 44
Hình 2.7 Thang đo đánh giá sự thành công khi ứng dụng Big Data 45
Hình 2.8 Những lợi ích mong muốn Big Data mang lại 46
Hình 2.9 Những miền dữ liệu tập trung nhiều trong Big Data 47
Hình 2.10 Các lĩnh vực được quan tâm trong Big Data 48
Hình 2.11 Những thách thức khi sử dụng Big Data 49
Hình 2.12 Những bộ phận trong doanh nghiệp tham gia nghiên cứu - phát triển - ứng dụng Big Data 50
Hình 2.13 Số lượng nhân viên trong đơn vị có năng lực chuyên môn về phân tích, mô hình hóa, khai thác dữ liệu 52
Hình 2.14 Đánh giá việc tìm kiếm nhân sự có kỹ năng về phân tích dữ liệu và kỹ năng quản lý công nghệ thông tin, Big Data 52
Hình 2.15 Lợi ích Big Data mang lại cho phân tích dữ liệu 54
Hình 2.16 Đánh giá khả năng phân tích dữ liệu của doanh nghiệp 54
Hình 2.17 Các loại phân tích thường sử dụng Big Data 55
Hình 2.18 Những chức năng quan trọng khi phân tích Big Data 55
Hình 2.19 Nguồn gốc các ứng dụng phân tích 56
Hình 2.20 Cách bố trí và quản lý những phát kiến mới về Big Data và phân tích dữ liệu 57
Trang 10DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ, SƠ ĐỒ
Hình 2.21 Tư duy chiến lược - mối quan tâm về Big Data được thể hiện từ
cấp lãnh đạo 58
Hình 2.22 Người chỉ đạo những vấn đề liên quan đến Big Data 58
Hình 2.23 Đánh giá khả năng sử dụng và phân tích dữ liệu để cải thiện hoặc
chuyển đổi doanh nghiệp của nhà điều hành và lãnh đạo 59
Hình 2.24 Đánh giá việc tìm kiếm những nhà quản lý/giám đốc điều hành có
thể nhận dạng và tận dụng các cơ hội kinh doanh từ Big Data 60
Hình 2.25 Nguồn lực cho bộ phận công nghệ thông tin 61
Hình 2.26 Đánh giá khả năng tìm kiếm nhân sự có kỹ năng phân tích dữ liệu 62
Hình 2.27 Nơi tuyển dụng những nhà khoa học dữ liệu 62
Trang 11PHẦN MỞ ĐẦU
1 Lý do chọn đề tài
Ngày nay, hầu như tất cả công ty điều đã nhận ra tầm quan trọng của việc sử dụng dữ liệu trong quá trình ra quyết định thực hiện những chiến lược nhằm đáp ứng sự thay đổi của môi trường kinh doanh mới Bên cạnh đó, cuộc cách mạng công nghiệp lần thứ tư (4.0), còn được gọi là cuộc cách mạng số, hàm chứa sự thay đổi lớn lao, không chỉ ở khía cạnh kinh tế mà còn thay đổi văn hóa, xã hội một cách toàn diện thông qua các chiến lược công nghệ cao, công nghiệp hóa ngành sản xuất
mà không cần sự tham gia của con người, sử dụng trí thông minh nhân tạo, điện toán đám mây, phân tích dữ liệu… để chuyển hóa toàn bộ thế giới thực thành thế giới số, khi đó những ưu thế, vốn là điểm mạnh của Việt Nam và một số nước khác, như lực lượng lao động dồi dào, giá rẻ sẽ không còn là điểm mạnh nữa, thậm chí còn bị đe dọa nghiêm trọng Vì những thay đổi mang tính thời đại trong kinh doanh hiện nay nên mỗi đơn vị, tổ chức không thể không hành động để thích ứng với chúng, nếu doanh nghiệp biết tận dụng những thế mạnh mà công nghệ, cụ thể là dữ liệu mang lại thì chắc chắn sẽ đạt được mục tiêu chiến lược đề ra, ngược lại việc chậm thay đổi sẽ càng khiến doanh nghiệp mất đi khả năng cạnh tranh trên thị trường ngày càng năng động và phát triển với tốc độ chóng mặt này
Khi nhắc đến cuộc cách mạng công nghiệp và phân tích dữ liệu thì không thể không nhắc đến “nguồn tài nguyên” vô cùng lớn và phong phú là Big Data, được xem là nền tảng để tạo ra những giá trị ở tầm cao mới cho doanh nghiệp Với lợi thế dân số trẻ trên 90 triệu người, số người sử dụng internet cao vào khoản 54 triệu người, chiếm 54%, Việt Nam được xem là khu vực tìm năng về Big Data hàng đầu Châu Á Các chuyên gia trong nhiều lĩnh vực đều cho rằng việc phân tích dữ liệu từ Big Data sẽ giúp doanh nghiệp nắm bắt chính xác nhất xu thế vận động của ngành
từ những thông tin thu thập được như hành vi, sở thích, thói quen, xu hướng của từng người tiêu dùng nhằm tìm kiếm những thông tin bổ ích về xu thế phát triển và
Trang 12vận động của lĩnh vực đang kinh doanh và cả nền kinh tế, điều này sẽ giúp doanh nghiệp ra quyết định chính xác và đúng thời điểm
Không đứng ngoài vòng quay của sự phát triển, những doanh nghiệp kiểm toán hiện nay cũng đang tìm cách thích ứng với những thay đổi mang lại từ cuộc cách mạng công nghiệp 4.0, mà khởi đầu là việc nghiên cứu những dữ liệu có liên quan
từ Big Data trong cuộc kiểm toán để xác định những phương pháp kiểm toán cần thiết và hiệu quả Trong nhiều năm trở lại đây, các kiểm toán viên (KTV) đã có thể dựa vào những công cụ phân tích dữ liệu tương đối phát triển nhờ công nghệ thông tin để đưa ra kết luận, tuy nhiên với sự bùng nổ gần đây về dữ liệu thì các công cụ hiện tại có thể không đủ, đòi hỏi phải có sự chuyển đổi trong cách xử lý và phân tích thông tin cũng như những hiểu biết của KTV về nguồn dữ liệu Big Data là rất quan trọng và cần thiết
Để theo kịp xu hướng đổi mới và phát triển, các công ty kiểm toán lớn thuộc Big Four và các hội nghề nghiệp Kế toán – Kiểm toán như ACCA, AICPA… đã có những nghiên cứu liên quan đến vấn đề vận dụng Big Data trong kiểm toán Tuy nhiên tại Việt Nam, những vấn đề này hiện nay vẫn còn khá mới mẻ và ít nhận được
sự quan tâm từ phía các KTV và công ty kiểm toán Nhận thấy tầm quan trọng, tính thời sự của vấn đề cũng như có mong muốn hiểu rõ những khái niệm liên quan và tìm hiểu cụ thể những ảnh hưởng mà Big Data và phân tích dữ liệu mang lại trong
quá trình kiểm toán, tác giả chọn thực hiện đề tài Luận văn: “Phân tích ảnh hưởng của Big Data đến quá trình phân tích dữ liệu tại các doanh nghiệp kiểm toán của Việt Nam” để xây dựng và hoàn thiện
2 Mục tiêu nghiên cứu
Mục tiêu tổng quát của luận văn là tìm hiểu thực trạng Big Data và phân tích dữ liệu từ Big Data tại các công ty kiểm toán của Việt Nam
Để đạt được mục tiêu tổng quát nêu trên, luận văn đưa ra một số mục tiêu nghiên cứu cụ thể sau:
Thứ nhất, hệ thống hóa lý luận cơ bản về ảnh hưởng của Big Data đến quá trình phân tích dữ liệu kiểm toán
Trang 13Thứ hai, đánh giá thực trạng ảnh hưởng của Big Data và phân tích dữ liệu kiểm toán đến các doanh nghiệp kiểm toán của Việt Nam
Thứ ba, đề xuất một số phương hướng và giải pháp góp phần nâng cao khả năng ứng dụng Big Data và phân tích dữ liệu nhằm tăng cường chất lượng kiểm toán
3 Câu hỏi nghiên cứu
Để đạt được những mục tiêu đề ra, nghiên cứu cần trả lời những câu hỏi sau:
- Thế nào là Big Data và phân tích dữ liệu kiểm toán?
- Các doanh nghiệp kiểm toán của Việt Nam hiện nay đang sử dụng Big Data
và phân tích dữ liệu như thế nào?
- Giải pháp nào được đưa ra để vận dụng tốt nhất Big Data và phân tích dữ liệu trong quá trình kiểm toán?
4 Đối tượng nghiên cứu
Đối tượng nghiên cứu là những ảnh hưởng của Big Data và phân tích dữ liệu trong kiểm toán BCTC tại các công ty kiểm toán của Việt Nam
5 Phạm vi nghiên cứu
5.1 Về nội dung
Luận văn chỉ tập trung nghiên cứu ảnh hưởng của Big Data và phân tích dữ liệu đến hoạt động KTĐL của các doanh nghiệp kiểm toán, không nghiên cứu trong các loại hình kiểm toán khác như kiểm toán nhà nước hay kiểm toán hoạt động
5.2 Về không gian và thời gian
- Về không gian: các công ty kiểm toán tại Việt Nam
- Về thời gian: tác giả tiến hành khảo sát, thu thập dữ liệu từ tháng 06/2017 đến tháng 12/2017
6 Phương pháp nghiên cứu
Để đạt mục tiêu nghiên cứu của đề tài, trả lời các câu hỏi đặt ra, nghiên cứu sử dụng chủ yếu phương pháp định tính Bên cạnh đó, nghiên cứu cũng sử dụng phương pháp phân tích và tổng hợp
Trang 14- Phương pháp phân tích tổng hợp: khái quát lý thuyết về các vấn đề nghiên
cứu và các nghiên cứu có liên quan
- Phương pháp định tính: được tiến hành theo hướng tìm hiểu và hệ thống hóa
những thông tin thu thập được từ những nguồn tin uy tín, những nghiên cứu của các hiệp hội nghề nghiệp và những công ty kiểm toán lớn trên thế giới Tác giả sử dụng đồng thời thống kê mô tả: bao gồm việc tìm hiểu bằng bảng câu hỏi, sau đó thống
kê, so sánh, phân tích nhằm đánh giá việc áp dụng Big Data và phân tích dữ liệu kiểm toán trong hoạt động KTĐL tại các doanh nghiệp kiểm toán của Việt Nam
7 Những đóng góp khoa học và thực tiễn của luận văn
- Đóng góp về mặt lý thuyết: tìm hiểu những quan điểm, khái niệm liên quan
đến Big Data và phân tích dữ liệu hiện nay, qua đó đánh giá những lợi ích cũng như thách thức khi ứng dụng Big Data và phân tích dữ liệu trong quá trình kiểm toán của KTV tại những công ty KTĐL
- Đóng góp về mặt thực tiễn: kết quả nghiên cứu của luận văn với một vấn đề
khá thời sự hiện nay sẽ có giá trị tham khảo cho KTV và các công ty KTĐL tại Việt Nam, giúp họ có cái nhìn rõ ràng và cụ thể hơn về Big Data và phân tích dữ liệu cũng như những giải pháp giúp ứng dụng Big Data và phân tích dữ liệu hiệu quả hơn để gia tăng chất lượng kiểm toán
8 Kết cấu của luận văn
Ngoài phần mở đầu, nghiên cứu được thiết kế gồm 3 chương:
Chương 1: Tổng quan về Big Data và phân tích dữ liệu trong kiểm toán
Nội dung chương 1 trình bày tóm tắt những vấn đề liên quan đến Big Data và phân tích dữ liệu cũng như những nghiên cứu gần đây về hai vấn đề này
Chương 2: Thực trạng ảnh hưởng của Big Data và phân tích dữ liệu kiểm toán
tại các doanh nghiệp kiểm toán của Việt Nam
Chương 2 cung cấp những số liệu cụ thể về thực trạng nhận thức và ứng dụng Big Data và phân tích dữ liệu của các doanh nghiệp kiểm toán, từ đó nhận ra những
Trang 15ưu điểm và hạn chế cũng như chỉ ra nguyên nhân về những vấn đề liên quan đến Big Data và phân tích dữ liệu
Chương 3: Giải pháp nâng cao tính hữu ích của Big Data và phân tích dữ liệu
kiểm toán tại các doanh nghiệp kiểm toán của Việt Nam
Chương này trước hết trình bày quan điểm chung khi đưa ra những giải pháp, sau đó đi sâu vào những giải pháp cụ thể và giải pháp hỗ trợ về những vấn đề liên quan đến Big Data và phân tích dữ liệu nhằm mục tiêu chính nâng cao chất lượng kiểm toán
Kết luận
Trang 16CHƯƠNG 1: TỔNG QUAN VỀ BIG DATA VÀ PHÂN TÍCH
DỮ LIỆU TRONG KIỂM TOÁN 1.1 Big Data
1.1.1 Tóm lược một số thay đổi trong dữ liệu
Big Data và phân tích dữ liệu hiện nay được xem là trung tâm của khoa học và kinh doanh hiện đại, các dữ liệu này được tạo ra từ các giao dịch trực tuyến, email, video, âm thanh, hình ảnh, những cú nhấp chuột, blog, truy vấn tìm kiếm, hồ sơ sức khỏe, tương tác trên mạng xã hội, dữ liệu khoa học, cảm biến từ điện thoại di động
và các ứng dụng đi kèm (C.Eaton et al., 2012; RD Schneider, 2012) Tất cả những yếu tố trên được lưu trữ trong những nền tảng cơ sở dữ liệu đang phát triển mạnh
mẽ và càng trở nên khó nắm bắt, lưu trữ, quản lý, chia sẻ, phân tích và hình dung thông qua các phần mềm cơ sở dữ liệu truyền thống
5 exabytes (1018 bytes) đã được con người tạo ra đến năm 2003, nhưng hiện nay lượng thông tin này có thể được tạo thành chỉ trong vòng hai ngày Năm 2012, dữ liệu số của thế giới đã được mở rộng đến 2.72 zettabytes (1021 bytes), và dự báo sẽ tăng gấp đôi sau mỗi hai năm, đạt khoản 8 zettabytes vào khoản năm 2015 IBM, tập đoàn công nghệ máy tính đa quốc gia của Mỹ, chỉ ra rằng mỗi ngày có 2.5 exabytes dữ liệu được tạo ra tương đương với 90% dữ liệu được tạo ra trong vòng hai năm qua (S Singh and N Singh, 2011) Một máy tính cá nhân chứa khoản 500 gigabytes (109 bytes), do đó sẽ cần khoản 20 tỷ máy tính để lưu trữ tất cả dữ liệu của thế giới Trong quá khứ, quá trình giải mã bộ gen của con người mất khoản 10 năm, bây giờ thì việc này mất không quá một tuần Dữ liệu đa phương tiện được dữ kiến tăng 70% vào năm 2013 (J Manyika et al., 2011) Chỉ Google mới có hơn một triệu máy chủ trên toàn thế giới Hiện đã có hơn 6 tỷ thuê bao điện thoại di động trên thế giới và mỗi ngày có hơn một tỷ tin nhắn được gửi đi Đến năm 2020, 50 tỷ thiết bị sẽ được kết nối với mạng và internet (B Gerhardt et al., 2012)
Năm 2012, hình thái dữ liệu của Big Data đã được hoàn thành với quy mô toàn cầu, dự án tập trung thu thập thời gian, hình dung và phân tích một khối lượng lớn
dữ liệu Theo dự án này, có rất nhiều thống kê đã được đưa ra, chẳng hạn Facebook
Trang 17có 955 triệu tài khoản hoạt động hàng tháng bằng 70 ngôn ngữ, 140 tỷ hình ảnh được tải lên, 125 tỷ kết nối bạn bè, mỗi ngày có 30 tỷ nội dung và 2.7 tỷ lượt thích
và bình luận được đăng tải, số lượng tài khoản Facebook vào tháng 06/2017 tại các châu lục được thể hiện ở hình 1.1 (nguồn Internet World Stats) Mỗi phút, có 48 giờ video được tải lên và mỗi ngày có 4 tỷ lượt xem được thực hiện trên Youtube Google hỗ trợ nhiều dịch vụ như giám sát 7.2 tỷ trang mạng mỗi ngày và xử lý 20 petabyte (1015 bytes) dữ liệu dịch sang 66 ngôn ngữ khác nhau Có khoảng 1 tỷ Tweets (những mẫu tin nhỏ dưới dạng blog – theo Wikipedia) sau mỗi 72 giờ từ hơn 140 triệu người dùng đang hoạt động trên Twitter 571 trang web mới được tạo
ra mỗi phút trong ngày Dự báo trong thập kỷ tới, khối lượng thông tin sẽ tăng gấp
50 lần, tuy nhiên số lượng các chuyên gia về công nghệ thông tin theo kịp với tiến
độ phát triển đó chỉ tăng 1.5 lần (C Tankard et al., 2012)
Hình 1.1: Số lượng tài khoản Facebook trên thế giới vào 06/2017 1.1.2 Big Data
1.1.2.1 Các vấn đề quan trọng
Trang 18Big Data là thuật ngữ dùng cho các bộ dữ liệu có cấu trúc đa dạng và phức tạp hơn với những khó khăn trong việc lưu trữ, phân tích và hiển thị cho các quá trình hoặc kết quả tiếp theo Big Data được đặc trưng bởi các thành phần chính: sự đa dạng (variety), tốc độ (velocity) và dung lượng (volume) (Intel IT Center, 2012)
- Sự đa dạng: làm cho Big Data thật sự là nguồn dữ liệu rất lớn Big Data thường đến từ nhiều nguồn và thường có ba loại: có cấu trúc, bán cấu trúc và không
có cấu trúc Dữ liệu có cấu trúc nằm trong kho dữ liệu đã được gắn thẻ và dễ dàng sắp xếp nhưng dữ liệu phi cấu trúc là ngẫu nhiên và khó phân tích Dữ liệu bán cấu trúc không thích hợp cho các lĩnh vực cố định mà chứa những phần tử dữ liệu riêng biệt
- Dung lượng: hay kích thước của dữ liệu bây giờ lớn hơn terabytes và petabytes Quy mô lớn và sự gia tăng của dữ liệu vượt xa các kỹ thuật phân tích và lưu trữ truyền thống
- Tốc độ: nghĩa là vận tốc các dữ liệu được tạo ra và xử lý để đáp ứng các nhu cầu và thách thức trên con đường tăng trưởng và phát triển
Cụ thể từng thành phần được minh họa như sau:
Hình 1.2: Ba thành phần đặt trưng cấu thành Big Data
Dưới áp lực của nền thông tin phát triển, một vấn đề khác cần quan tâm là xác minh nguồn dữ liệu, rất khó để kiểm soát một nguồn dữ liệu lớn nên cần phải quan tâm đến bảo mật dữ liệu, thêm vào đó là sau khi tạo ra và xử lý Big Data thì sẽ tạo
Trang 19ra một giá trị tăng thêm cho tổ chức Có một số vấn đề được rút ra từ nghiên cứu của TDWI – Transforming Data with Intelligence (P Russom, 2011) được yêu cầu cho các chuyên gia quản lý:
- Sau khi tổ chức áp dụng một số hình thức phân tích Big Data, những lợi ích mang lại gồm: markerting tốt hơn, hiểu biết sâu sắc hơn về kinh doanh, mở rộng nhiều phân khúc khách hàng, có nhiều thay đổi trong doanh thu và trên thị trường
- Trong khi thực hiện phân tích Big Data, sẽ phát sinh nhiều rào cản: sự thiếu chuyên môn, chi phí, khó khăn trong thiết kế hệ thống phân tích, thiếu những phần mềm cơ sở để phân tích Big Data không chỉ là cơ hội vì sự phân tích toàn diện trong hiện tại và tương lai mà còn là rào cản vì rất khó tiếp cận và quản lý
- Big Data hiện nay đang được lưu trữ và sử dụng với những kỹ thuật tiên tiến gồm: có cấu trúc, bán cấu trúc, phức hợp, dữ liệu sự kiện và không cấu trúc
- Khi thay đổi nền tảng phân tích, những vấn đề có thể xảy ra: không phù hợp với một dung lượng dữ liệu lớn, không thể hỗ trợ các mô hình phân tích cần thiết,
dữ liệu được tải quả chậm, công nghệ thông tin không thể bắt kịp với nhu cầu
Có thể thấy từ nghiên cứu này rằng phân tích Big Data vẫn cần rất nhiều sự quan tâm, ngoại trừ tính đa dạng, dung lượng lớn và tốc độ vượt trội thì việc phân tích Big Data còn mang lại tiềm năng mở ra những hiểu biết mới giúp tối ưu hóa việc ra quyết định Cần hiểu rằng Big Data không phải là công cụ dành riêng cho các doanh nghiệp lớn, “big” ở đây không chỉ lớn đo bằng số lượng mà còn chỉ độ sâu của việc phân tích, nghĩa là không kể doanh nghiệp thu thập được bao nhiêu số liệu, quan trọng là sẽ làm gì với những số liệu đó, phân tích như thế nào để mang lại lợi ích tốt nhất trong hoạt động của chính doanh nghiệp Hình 1.2 thể hiện thống kê
dự báo doanh thu cho ngành công nghiệp Big Data và phân tích kinh doanh trên toàn cầu từ 2015-2020 (tỷ đô la Mỹ) do trang Statistics Portal thực hiện
Trang 20Hình 1.3: Doanh thu dự báo từ Big Data và phân tích kinh doanh toàn thế
giới từ năm 2015 đến 2020 (tỷ đô la Mỹ)
1.1.2.2 Những yếu tố tạo nên Big Data
Theo ICAEW (2015), xu hướng của Big Data được thúc đẩy bởi các yếu tố: năng lực tính toán, các nguồn dữ liệu mới và cơ sở hạ tầng để tạo ra dữ liệu Ba yếu
tố này tạo ra những tiến bộ đáng kể trong việc hình thành và phát triển Big Data:
- Năng lực tính toán: năng lực cốt lõi của Big Data là sự tăng trưởng mạnh mẽ
về năng lực tính toán và khả năng lưu trữ trong những năm gần đây, giúp thu thập
và xử lý toàn bộ bộ dữ liệu, bất kể kích thước và độ phức tạp của chúng, điều này thường được mô tả như sự tăng trưởng theo cấp số nhân trong năng lực tính toán
Mô hình điện toán đám mây đang tiếp tục hỗ trợ trong việc sử dụng rộng rãi Big Data, cụ thể điện toán đám mây dựa trên mô hình chia sẻ tài nguyên máy tính trong toàn bộ doanh nghiệp (đám mây riêng) hay giữa một số khách hàng với nhau (đám mây công cộng) Bằng việc sử dụng điện toán đám mây, doanh nghiệp không cần phải mua tất cả tài nguyên máy tính để sử dụng mà chỉ đơn giản là truy cập vào đám
Trang 21máy đó khi cần thiết Do đó, mô hình điện toán đám mây có khả năng cung cấp cho doanh nghiệp quyền truy cập vào các tài nguyên máy tính lớn một cách hiệu quả và linh hoạt Những tiến bộ về phần mềm cũng mang lại sự phát triển về khả năng xử
lý và lưu trữ dữ liệu, chẳng hạn các loại phần mềm mới hỗ trợ cho những dữ liệu lớn và không có cấu trúc tốt hơn so với các hệ thống quản lý cơ sở dữ liệu truyền thống (ví dụ: phần mềm Apache Hadoop giúp quản lý bộ dữ liệu rất lớn bằng cách chia tách việc xử lý giữa nhiều máy tính với nhau), bên cạnh đó khả năng xử lý dữ liệu phi cấu trúc (như video hay văn bản) đã được cải thiện rất nhiều, các công cụ phục vụ cho việc trình bày dữ liệu cũng đang có những tiến triển đáng kể
- Nguồn dữ liệu: sự gia tăng sức mạnh tính toán làm tăng tính khả thi trong
việc thu thập và xử lý dữ liệu từ nhiều nguồn mới, chẳng hạn từ internet cung cấp
rất nhiều dữ liệu từ những cú nhấp chuột thông qua các tìm kiếm, các truy cập vào
các trang web để mua hàng hóa, dịch vụ; truyền thông xã hội cũng tạo ra nhiều loại
dữ liệu mới bao gồm các trạng thái, bình luận, lượt thích, hình ảnh, video và mạng
lưới liên lạc; công nghệ di động đang mang lại nhiều cơ hội để tạo ra truyền thông
xã hội và dữ liệu interet cũng như những dữ liệu mới về định vị cá nhân; dữ liệu mở
đề cập đến số lượng lớn dữ liệu chủ yếu từ khu vực công, chẳng hạn như dữ liệu không gian địa lý, dữ liệu vận chuyển, dữ liệu tài chính của chính phủ và dữ liệu
dịch vụ công; “internet of things” là việc nhúng chíp máy tính và cảm biến vào các
thiết bị vật lý như máy móc, tòa nhà, đồ gia dụng, quần áo… tất cả đều tạo ra dữ liệu Khi doanh nghiệp ngày càng sử dụng công nghệ số trong các lĩnh vực như bán hàng, marketing, quản lý khách hàng, chuỗi cung ứng, truyền thông nội bộ… thì lượng dữ liệu bên trong được tạo ra sẽ tăng lên đáng kể, hơn nữa, những cải tiến trong quản lý dữ liệu bán cấu trúc, phi cấu trúc cho phép doanh nghiệp tận dụng tốt hơn nguồn dữ liệu hiện có và mới như email, văn bản, hình ảnh và giọng nói
- Cơ sở hạ tầng kỹ thuật số cho phép tạo ra các hợp tác và sáng tạo kiến thức mới, được minh chứng thông qua các xu hướng crowdsourcing - là hình thức một công ty hay tổ chức giao việc cho mạng lưới cộng tác viên gia công theo hình thức
“mời gọi rộng rãi”, việc này có thể tiến hành theo hình thức đồng thực hiện (khi
Trang 22công việc có tính cộng tác), nhưng cũng có thể thực hiện bởi từng cá nhân riêng lẻ (Jeff Howe, 2006) và phần mềm nguồn mở Việc chia sẻ kiến thức này đã mang lại cho cộng đồng những hiểu biết sâu sắc hơn về những dữ liệu từ những nơi hạn chế tiếp cận, từ những chuyên gia trong các lĩnh vực cụ thể… Hiện nay các nghiên cứu ứng dụng đang được nhấn mạnh, chẳng hạn trong dịch thuật ngôn ngữ, người ta cho rằng sẽ không hiệu quả nếu chỉ dịch từng từ sang từ vì trong nhiều trường hợp một
từ duy nhất có thể chuyển sang một số từ, kết quả là các nghiên cứu ứng dụng đã cho ra đời việc dịch cụm từ sang cụm từ và đây là cách tiếp cận thông minh hơn rất nhiều Do đó, tiến bộ đến từ sự hiểu biết mới về các vấn đề cụ thể chứ không nhất thiết là những đột phá trong lý thuyết chung
1.1.2.3 Các lĩnh vực thuộc Big Data
Học viện McKinsey Global đã xác định tiềm năng của Big Data tồn tại chủ yếu trong năm lĩnh vực chính sau:
- Chăm sóc sức khỏe: hệ thống hỗ trợ các quyết định lâm sàn, phân tích bệnh
án, phân phối thuốc cho từng bệnh nhân, trả lương dựa trên hiệu quả của nhân viên
y tế, phân tích mẫu bệnh, cải thiện sức khỏe cộng đồng
- Khu vực công: tạo sự minh bạch thông qua các dữ liệu có thể tiếp cận được, phát hiện nhu cầu mới, nâng cao hiệu suất công việc, ra quyết định dựa trên các hệ thống tự động để giảm chi phí, đổi mới các sản phẩm và dịch vụ cung cấp
- Bán lẻ: phân tích hành vi dự trữ hàng, đa dạng và tối ưu hóa giá, thiết kế lại việc sắp xếp sản phẩm, cải thiện hiệu suất, tối ưu hóa đầu vào lao động, phân phối sản phẩm và hậu cần, tiếp thị dựa trên công nghệ mới
- Sản xuất: dự báo nhu cầu cải tiến, quy hoạch chuỗi cung ứng, hỗ trợ bán hàng, phát triển hoạt động sản xuất, áp dụng tìm kiếm trên các trang web
- Dữ liệu vị trí cá nhân: hành trình thông minh, quảng cáo nhắm vào vị trí địa
lý hoặc tình huống khẩn cấp, quy hoạch đô thị, mô hình kinh doanh mới
Các Website cung cấp nhiều cơ hội cho Big Data, chẳng hạn phân tích mạng xã hội từ những người tiêu dùng nhằm mục tiêu quảng cáo sản phẩm, thực hiện các chiến dịch marketing, xác định hành vi của khách hàng dựa vào các mô hình mua và
Trang 23phân tích tâm lý, từ những kết luận thu được, các công ty sẽ tối ưu hóa nội dung và các đề nghị được đưa ra (A.Vailaya, 12/2012, p.24-31) Một số công ty như Google hay Amazon xuất bản các bài báo liên quan đến công việc của họ, Facebook, Twitter và Linkedln đang tiến thêm một bước nữa khi xuất bản các dự án mã nguồn
mở cho các dữ liệu lớn như Cassandra, Hive, Pig, Voldemort, Storm, IndexTank Ngoài ra, các phân tích dự đoán về lưu lượng giao thông hoặc xác định các mối đe dọa từ các nguồn cấp video, âm thanh và dữ liệu khác nhau cũng là lợi thế của Big Data (B.Gerhardt et al., 2012)
1.1.2.4 Phương pháp thu thập và truy xuất kiến thức từ Big Data
Hầu hết các doanh nghiệp điều phải đối mặt với nhiều dữ liệu mới, có nhiều hình thức khác nhau và Big Data có tiềm năng cung cấp các thông tin chi tiết để có thể chuyển đổi mọi doanh nghiệp Big Data đã tạo ra một ngành công nghiệp mới
hỗ trợ chẳng hạn như MapReduce - là một khuôn khổ được lập trình bởi Google sử dụng phương pháp chia nhỏ và chiếm giữ để giải quyết các vấn đề dữ liệu phức tạp thành các đơn vị làm việc nhỏ và xử lý chúng song song nhau (S Curry et al., 2013)
Việc truy xuất kiến thức từ Big Data được hiểu là việc thực hiện một số thao tác được thiết kế trước để lấy thông tin từ bộ dữ liệu phức tạp (E Belogi and J Horey, 2012) Quá trình này được miêu tả trải qua những bước cơ bản như:
- Xác định các miền ứng dụng của thông tin và mục đích của quá trình từ quan điểm của khách hàng;
- Tạo điểm dữ liệu con cho việc khám phá tri thức;
- Loại bỏ nhiễu, xử lý dữ liệu thiếu, thu thập thông tin cần thiết đến mô hình
và tính toán thông tin về thời gian và các thay đổi cần thiết;
- Tìm kiếm các thuộc tính hữu ích để trình bày dữ liệu tùy thuộc vào mục đích của công việc;
- Lập bảng đồ mục tiêu cho từng phương pháp khai thác dữ liệu cụ thể;
- Chọn các thuật toán khai thác dữ liệu và phương pháp tìm kiếm các mẫu dữ liệu;
Trang 24- Nghiên cứu các dạng thể hiện của dữ liệu;
- Quay lại bất kỳ các bước kể trên, có thể lặp lại từng bước một, bao gồm việc chọn lại hình thức hiển thị hay chọn lại mẫu;
- Sử dụng thông tin trực tiếp, kết hợp với những thông tin từ những hệ thống khác hoặc chỉ đơn giản là đăng ký vào hệ thống và nhận kết quả
1.1.3 Các vấn đề về quản lý và an ninh dữ liệu
Vào tháng 05 năm 2012, trung tâm công nghệ thông tin Intel đã khảo sát 200 nhà quản lý công nghệ thông tin trong các công ty lớn để tìm ra cách họ tiếp cận với việc phân tích Big Data (Intel IT Center, 2012) Các nhà quản lý công nghệ thông tin khi được hỏi về những tiêu chuẩn mà họ muốn xem xét để phân tích Big Data thì câu trả lời thu được bao gồm những vấn đề như: bảo mật dữ liệu, công nghệ để sở hữu dữ liệu khách hàng, minh bạch dữ liệu, các tiêu chuẩn đo lường hiệu quả, khả năng tương tác giữa dữ liệu và hệ thống
Khi những kẻ tấn công mạng phá vỡ những tuyến phòng thủ truyền thống của
dữ liệu sẽ đòi hỏi các tổ chức cần áp dụng những mô hình an ninh theo hướng thông minh, có nhiều nhận thức về rủi ro hơn, thay đổi nhanh chóng theo ngữ cảnh Hệ thống an ninh thông minh được phát triển từ việc phân tích Big Data, liên quan đến
cả bề rộng của nguồn dữ liệu và chiều sâu của thông tin cần thiết để xác định chính xác rủi ro nhằm chống lại các hoạt động bất hợp pháp và các mối đe dọa trực tuyến phát triển khác Một mô hình bảo mật dữ liệu thường có các đặc điểm sau: (S Curry
et al., 2013)
- Các nguồn dữ liệu bên trong và bên ngoài đều có thể tạo giá trị và mang lại hiệu quả;
- Các công cụ tự động thu thập nguồn dữ liệu đa dạng và chuẩn hóa chúng;
- Các công cụ phân tích xử lý một khối lượng lớn dữ liệu luôn thay đổi nhanh chóng trong thời gian hạn chế;
- Hệ thống giám sát liên tục phân tích các nguồn tài nguyên có giá trị cao và xem xét chúng dựa trên các mô hình về hành vi và rủi ro;
Trang 25- Kiểm soát hoạt động như là xác thực người dùng bổ sung, ngăn chặn truyền tải dữ liệu hoặc rút gọn việc ra quyết định;
- Các nhà phân tích an ninh có thể truy vấn được những dữ liệu liên quan;
- Chuẩn hóa những tiêu chuẩn về an ninh dưới dạng văn bản hoặc được chia sẻ thông qua những nguồn đáng tin cậy;
- Mở rộng cơ sở hạ tầng có khả năng xử lý các tìm kiếm lớn và phức tạp;
- Mức độ tích hợp cao của các công cụ quản lý rủi ro và bảo mật để phát hiện các vấn đề tiềm ẩn
- Để phát triển cách tiếp cận toàn diện và chắc chắn đối với Big Data thì khi bắt đầu quản lý dự án, các công ty cần thiết lập và mô tả chi tiết nguồn gốc dữ liệu, tạo và truy cập các ủy quyền cũng như phân loại các phát hiện theo tầm quan trọng của chúng, bên cạnh đó cần đảm bảo các hồ sơ dữ liệu được lưu trữ và bảo vệ theo đúng quy định, nên phát triển các chính sách liên quan đến quy trình xử lý dữ liệu, chẳng hạn như kiểu dữ liệu được lưu trữ, thời gian lưu trữ, kho lưu trữ và các kiểu truy cập vào dữ liệu (C Tankard, 2012)
Một vấn đề khác cũng đáng quan tâm đó là khi lưu trữ dữ liệu tại một địa chỉ duy nhất sẽ phát sinh nguy cơ dữ liệu bị tấn công, do đó đòi hỏi kho dữ liệu cần có những hoạt động kiểm soát thích hợp Để chắc chắn việc truyền thông an toàn nên
áp dụng mã bảo mật và sử dụng nguyên tắc giảm đặc quyền, đặc biết đối với quyền truy cập, ngoại trừ quản trị viên có quyền truy cập dữ liệu để xử lý các vấn đề phát sinh theo quy định
Để kiểm soát truy cập hiệu quả dữ liệu nên liên tục quan sát và thay đổi vai trò của các tổ chức, nhân viên để hạn chế sự lạm dụng những quyền hạn không chính đáng Các công ty nên đầu tư vào các sản phẩm bảo mật đảm bảo bằng cách sử dụng những công nghệ phân tích nhanh chóng thay vì những thiết bị cố định Ngoài
ra, các tổ chức cần xem xét phân nhánh pháp lý để lưu trữ dữ liệu nhằm tuân thủ quy định của luật bảo vệ dữ liệu (C Tankard, 2012 và M Smith et al., 2012 và S Curry et al., 2013) Tuy nhiên cũng cần nói thêm là Big Data có lợi thế lớn về an ninh vì khi các tổ chức phân loại dữ liệu, họ kiểm soát bằng những quy định đặc
Trang 26biệt như áp đặt thời gian lưu trữ, điều này cho phép tổ chức lựa chọn những dữ liệu không có giá trị hoặc không cần phải lưu trữ tự động không tồn tại (xóa) để tránh bị đánh cắp
1.2 Phân tích dữ liệu kiểm toán
1.2.1 Khái quát về phân tích dữ liệu kiểm toán
Về cơ bản, phân tích là phát hiện và truyền thông những dữ liệu có ý nghĩa, tuy nhiên trong lĩnh vực kinh doanh, phân tích được xem là việc sử dụng những dữ liệu rộng rãi, phân tích thống kê và định lượng, sử dụng các mô hình giải thích và dự đoán để thúc đẩy các quyết định quản lý kinh doanh trong thực tế Phân tích giúp tối
ưu hóa các quy trình hoạt động, từng chức năng trong doanh nghiệp, đồng thời phân tích còn có thể được vận dụng để tổng hợp những nguồn dữ liệu từ nội bộ và bên ngoài, điều này cho phép doanh nghiệp đáp ứng được nhu cầu báo cáo của các bên liên quan, quản lý lượng dữ liệu khổng lồ, tạo ra lợi thế thị trường, quản lý rủi ro, cải thiện kiểm soát và cuối cùng là nâng cao hiệu suất của doanh nghiệp bằng cách biến dữ liệu thành những thông tin thông minh (Ernst & Young, 2014)
Liên quan đến phân tích dữ liệu, có rất nhiều định nghĩa, cụ thể như sau:
(i) Định nghĩa về phân tích dữ liệu không đặt trong bối cảnh cuộc kiểm toán
Dữ liệu: là những sự kiện và số liệu được thu thập cùng nhau để tham khảo trong quá trình phân tích (từ điển Oxford, 2014) Theo Tech-target (2014), định nghĩa chung về phân tích dữ liệu là môn khoa học kiểm tra dữ liệu thô với mục đích rút ra kết luận về thông tin đó Theo từ điển công nghệ (the dictionary techpedia, 2014) có định nghĩa về lợi thế của phân tích dữ liệu, đó là các kỹ thuật và quy trình được sử dụng để tăng năng suất và lợi nhuận kinh doanh Theo từ điển kinh doanh (the business dictionary, 2014), phân tích thường liên quan đến nghiên cứu dữ liệu trong quá khứ để xác định các xu hướng tiềm ẩn, để phân tích tác động của các quyết định hoặc đánh giá hiệu suất công việc Phân tích dữ liệu nghiên cứu các phương pháp tự để tự động trích xuất những thông tin có giá trị từ dữ liệu thô bằng các thuật toán tự động (Keim et al, 2008) Phân tích dữ liệu là một quá trình từ việc thăm dò và phân tích dữ liệu để khám phá những dữ liệu mới và có ý nghĩa (Kohavi
Trang 27et al, 2002) Với những khái niệm này, phân tích dữ liệu được hiểu là việc sử dụng
dữ liệu, rút ra kết luận từ dữ liệu đó cũng như nhận dạng những mô hình/xu hướng (ii) Định nghĩa phân tích dữ liệu từ nhóm công ty thuộc Big4
KPMG áp dụng định nghĩa sau: phân tích dữ liệu là một quá trình phân tích, theo đó thông tin chi tiết được rút ra từ trong hoạt động của đơn vị, từ thông tin tài chính và các dạng dữ liệu điện tử khác ở trong và ngoài tổ chức (de Kroon and Karp, 2013) Ernst and Young (EY) sử dụng định nghĩa sau: phân tích dữ liệu là quá trình phân tích và giải quyết các vấn đề để xác định và giải thích các mối quan hệ giữa các biến (Gupta, 2004) PwC định nghĩa phân tích dữ liệu là khám phá và truyền tải những mẫu dữ liệu có ý nghĩa từ dữ liệu ban đầu (Talesara and Harrington, 2014) Deloitte định nghĩa phân tích dữ liệu là quá trình rút ra những hiểu biết sâu sắc từ dữ liệu để đưa ra những quyết định tốt hơn dựa trên thực tiễn (Bowtell et al, 2014) Có thể nhận thấy mỗi công ty trong nhóm này đều có một định nghĩa khác nhau về phân tích dữ liệu, nhưng điểm chung có thể thấy là KPMG
và Deloitte có cùng quan điểm là dựa trên thực tế dữ liệu, còn EY và PwC sử dụng định nghĩa gần với những định nghĩa học thuật được nêu ở mục (i)
(iii) Định nghĩa phân tích dữ liệu từ những công trình nghiên cứu khác
Theo Kroon và Karp (2013) định nghĩa phân tích dữ liệu trong kiểm toán là quá trình kiểm tra, cân đối, chuyển đổi và mô hình hóa dữ liệu với mục đích làm nổi bật thông tin hữu ích, gợi ý kết luận và hỗ trợ ra quyết định Theo William Titera (2013) cho rằng phân tích dữ liệu trong kiểm toán là việc kiểm tra những thông tin trên BCTC hoặc những vấn đề khác đang được kiểm toán dưới sự hỗ trợ của máy tính AICPA (2015) sử dụng định nghĩa sau: phân tích dữ liệu là việc sử dụng để thu thập bằng chứng kiểm toán trong kiểm toán BCTC, là một môn khoa học và nghệ thuật liên quan đến phát hiện và phân tích mẫu, sai sót và mâu thuẫn, giúp trích xuất các thông tin hữu ích khác trong cơ sở dữ liệu hoặc có liên quan đến chủ đề kiểm
toán thông qua phân tích, mô hình hóa và diễn họa dữ liệu (một cách thể hiện dữ liệu theo phong cách đồ họa hơn, trực quan hơn để thông tin có thể được truyền tải tốt nhất có thể) cho mục đích lập kế hoạch và thực hiện kiểm toán (Brynes et al,
Trang 282014) Đặc điểm chung của những định nghĩa này đều là việc sử dụng dữ liệu và tìm kiếm những mô hình/xu hướng mới
Từ những định nghĩa nêu trên cho thấy có một sự đa dạng trong nhận định và
sử dụng phân tích dữ liệu trong kiểm toán, tuy nhiên mục đích cuối cùng thì tương đồng nhau là dựa vào phân tích dữ liệu để tìm kiếm những thông tin có ý nghĩa, do
đó để thống nhất, bài nghiên cứu này sẽ sử dụng định nghĩa được dùng bởi AICPA theo mô tả như trên
1.2.2 Phân tích dữ liệu gia tăng chất lượng kiểm toán
Phân tích dữ liệu trong kiểm toán là một trong những phương pháp để nâng cao chất lượng kiểm toán (ICAEW, 2016), có thể có nhiều khía cạnh khác nhau trong thực tế nhưng chất lượng kiểm toán là một mục tiêu chung của không chỉ KTV mà các cơ quan quản lý và CMKT đều hướng đến Một cuộc kiểm toán đạt chất lượng, tập trung và hiệu quả nghĩa là có sự phù hợp với cách thức mà doanh nghiệp kiểm toán quản lý dữ liệu và hoạt động của mình Phân tích dữ liệu cung cấp cách thức thực tế cho KTV để quản lý một số khía cạnh quan trọng của hệ thống công nghệ thông tin trong các cuộc kiểm toán lớn Việc tìm kiếm và cung cấp dịch vụ kiểm toán cho các công ty niêm yết lớn làm gia tăng sự tập trung vào phân tích dữ liệu, bên cạnh đó các tổ chức nghề nghiệp cũng như các ủy ban kiểm toán hiện nay đang yêu cầu KTV cần phải có những hiểu biết nhất định về sử dụng phân tích dữ liệu vào thực hiện kiểm toán Có thể nói phân tích dữ liệu là một khái niệm tuy không mới nhưng khá thách thức đối với KTV hiện nay, vì nó đòi hỏi một sự đầu tư đáng
kể về phần cứng, phần mềm, kỹ năng và khả năng kiểm soát chất lượng, đây cũng được xem là một trong những phản ứng của các công ty kiểm toán để đáp ứng nhu cầu kiểm toán tại những khách hàng lớn của họ Phân tích dữ liệu không chỉ được
sử dụng để cung cấp trong dịch vụ kiểm toán mà còn có thể được áp dụng cho hàng loạt các dịch vụ đảm bảo phi kiểm toán khác
Gia tăng chất lượng của cuộc kiểm toán được xem như là động lực giúp các công ty kiểm toán phát triển và thực hiện phân tích dữ liệu, bằng cách sử dụng các
kỹ thuật và phương pháp phân tích dữ liệu mới, KTV có thể tiếp cận khách hàng và
Trang 29cung cấp dịch vụ kiểm toán chất lượng cao hơn bằng các bằng chứng kiểm toán có liên quan hơn (Sirois, B & Savovska, K., 2017) Những phương pháp tiên tiến này cũng hỗ trợ quá trình tìm kiếm để xác định những bất thường, nhận dạng xu hướng, mối tương quan và biến động, giúp KTV tập trung vào những hạng mục có thể xảy
ra rủi ro Hơn nữa, việc thực hiện kiểm tra trên toàn bộ các giao dịch thay vì thử nghiệm lấy mẫu cho phép KTV xem xét các tập hợp dữ liệu kiểm toán rộng hơn và
do đó tạo ra bằng chứng kiểm toán có chất lượng cao hơn Khi sử dụng phân tích dữ liệu một cách thận trọng có thể cung cấp bằng chứng kiểm toán tập trung hơn vào các rủi ro kiểm toán và nhiều hiểu biết hữu ích cho KTV Kiến thức của KTV về việc thiết kế và giải thích những kết quả thông qua phân tích dữ liệu là chìa khóa để gia tăng chất lượng cuộc kiểm toán Với bất kể cách thức phân tích dữ liệu nào được
sử dụng, KTV cũng cần xác định được phạm vi của bộ dữ liệu và các tài khoản có liên quan Trong thực tế, phân tích dữ liệu trong kiểm toán mang lại tiềm năng nâng cao chất lượng của cuộc kiểm toán bằng nhiều cách, bao gồm:
- Tăng cường hiểu biết của KTV về đối tượng được kiểm toán;
- Tạo điều kiện cho việc tập trung kiểm tra vào những khu vực có nguy cơ xảy
ra gian lận cao nhất thông qua việc phân tầng cho tổng thể;
- Tăng tính thống nhất và tập trung giám sát trong nhóm kiểm toán;
- Cho phép KTV thực hiện các thử nghiệm trên tập hợp các dữ liệu lớn hoặc phức tạp mà cách tiếp cận thủ công không khả thi;
- Nâng cao hiệu quả kiểm toán;
- Nhận định được các trường hợp có khả năng xảy ra gian lận;
- Tăng cường giao tiếp và kết nối với các cơ quan chủ quản có liên quan
Để có thể thực hiện tốt kỹ thuật phân tích dữ liệu trong kiểm toán, KTV thường phải quan tâm đến những vấn đề khác nhau, chẳng hạn như những công cụ phân tích vì sẽ giúp KTV rút được kinh nghiệm và sự tự tin khi sử dụng trong thực tế; đồng thời cần định vị rõ ràng vai trò, nhiệm vụ và lợi ích mà phân tích dữ liệu mang lại trong các phương pháp kiểm toán của công ty KTV cũng nên thử nghiệm hoặc chạy thử các công cụ phân tích dữ liệu trước khi cho áp dụng vào thực tế, đặc biệt là
Trang 30trong năm đầu tiên, trong một số trường hợp đặc biệt hay bất thường nên có sự tư vấn từ các chuyên gia thuộc lĩnh vực công nghệ thông tin Bên cạnh đó, những doanh nghiệp kiểm toán cũng nên giải thích rõ về các công cụ phân tích dữ liệu bằng lưu đồ (sơ đồ luồng dữ liệu) để giúp KTV hiểu rõ và thực hiện lại dễ dàng hơn Sự phát triển liên tục của công nghệ có nghĩa rằng sẽ dễ dàng hơn (nhưng không phải là không có thách thức) để KTV nắm bắt, chuyển đổi, lưu trữ và phân tích toàn diện dữ liệu hơn so với trước đây, cho phép kiểm tra đến 100% các giao dịch trong tổng thể, phân tích dữ liệu có thể được sử dụng để đánh giá và dự báo một khối lượng lớn thông tin một cách nhanh chóng, dẫn đến sự hiểu biết tốt hơn về đơn vị được kiểm toán và hệ thống hoạt động của nó Những phương pháp này cho phép KTV thực hiện việc kiểm tra thường xuyên hơn trong khoảng thời gian ngắn hơn, giảm việc tập trung kiểm toán vào cuối năm Việc kiểm tra và giám sát liên tục
dữ liệu giúp KTV nhận dạng rủi ro thông tin tốt hơn, đánh giá kiểm soát chính xác hơn, báo cáo kiểm toán kịp thời và phù hợp hơn Tuy nhiên, nhân tố mang tính quyết định chính là đưa ra các công cụ và kỹ thuật chuẩn của phân tích dữ liệu, được mã hóa và kiểm tra bởi các chuyên gia và được triển khai với sự ủng hộ của những bên liên quan, chính điều này sẽ làm cho việc sử dụng phân tích dữ liệu trong kiểm toán trở nên hiệu quả, nhất quán và đáng tin cậy hơn Có nhiều công cụ phân tích dữ liệu trong kiểm toán sử dụng kỹ thuật diễn họa dữ liệu: cung cấp thông tin chi tiết của
dữ liệu phân tích bằng cách đặt trong một bối cảnh thị giác sử dụng đồ thị, hình ảnh
đồ họa chính các mô hình này cho phép dễ dàng nhận diện các xu hướng, mối tương quan và các điểm sai lệch có thể không được chú ý trong các kiểu dữ liệu dạng văn bản
1.2.3 Phản ứng của các bên liên quan đến phân tích dữ liệu
1.2.3.1 Những người sử dụng nội bộ
Nhóm đầu tiên sử dụng phân tích dữ liệu đó chính là KTV, giám đốc, hội đồng quản trị trong nội bộ công ty kiểm toán Trước hết, các thành viên trong ban giám đốc nên hiểu rõ cách thức doanh nghiệp sử dụng Big Data và phân tích dữ liệu trong nội bộ và làm thế nào các nhân tố này có thể thúc đẩy doanh nghiệp (Ernst &
Trang 31Young, 2015), sử dụng Big Data và phân tích dữ liệu mang lại vô số lợi ích như khám phá cách để tối ưu hóa cấu trúc chi phí, thu thập nhu cầu của khách hàng nhằm cung cấp dịch vụ tốt hơn, tạo doanh thu lớn hơn Khi thực hiện phân tích dữ liệu trong kiểm toán, KTV chịu trách nhiệm sử dụng và đảm bảo việc sử dụng thủ tục này phù hợp với luật pháp và các quy định Có nhiều nghiên cứu đã chỉ ra rằng khi làm chủ phân tích dữ liệu có thể giúp doanh nghiệp tạo ra lợi thế cạnh tranh và đạt được lợi nhuận cao hơn, thậm chí có chuyên gia còn cho rằng nếu doanh nghiệp
bỏ qua phân tích dữ liệu có thể phải ngừng hoạt động trong thời gian dài (Norbert Tschakert et al, 2016), bởi vì phân tích dữ liệu có tốc độ thay đổi nhanh hơn so với
sự đáp ứng của của doanh nghiệp kiểm toán và KTV cho nên việc thay đổi các khái niệm quản lý liên quan đến vấn đề này có thể tận dụng những cơ hội mà phân tích
dữ liệu mang lại
Hiện nay, hầu hết các công ty kiểm toán, đặc biệt là nhóm công ty thuộc Big4 đang tiếp tục nghiên cứu và mở rộng sử dụng phân tích dữ liệu trong kiểm toán, tạo tiền đề cho những công ty vừa và nhỏ học tập và nâng cao hơn nữa những phát kiến
về Big Data và phân tích dữ liệu, các công ty này phát triển các công cụ phân tích
dữ liệu hầu hết tập trung vào các quy trình đánh giá rủi ro thông qua việc phân tích
số liệu để khoanh vùng xác định vấn đề cần kiểm tra
1.2.3.2 Chính phủ, ủy ban kiểm toán, các tổ chức - cơ quan quản lý bên ngoài
Các tổ chức nghề nghiệp và các cơ quan quản lý có liên quan đang xem xét việc
áp dụng rộng rãi phân tích dữ liệu trong kiểm toán, thể hiện qua những bài báo và
ấn phẩm nhằm công nhận những mối quan tâm hiện hữu tại các công ty kiểm toán, bao gồm (nhưng không giới hạn) sự cần thiết phải có sự phù hợp giữa những kỹ thuật phân tích dữ liệu với khuôn khổ CMKT về đánh giá rủi ro, thử nghiệm kiểm soát, thủ tục phân tích và thử nghiệm chi tiết, bên cạnh đó cũng cần quan tâm đến việc ở mức độ nào thì sẽ có những ngoại lệ không cần kiểm tra trong tập hợp toàn
bộ tổng thể Cụ thể vào tháng 09/2016, IAASB đã ban hành Request for Input: Nghiên cứu sự phát triển trong việc sử dụng công nghệ trong kiểm toán, tập trung
vào phân tích dữ liệu (Exploring the Growing Use of Technology in the Audit, with
Trang 32a Focus on Data Analytics) để cung cấp cho các bên liên quan về công việc đang
thực hiện của IAASB trong việc tìm hiểu những hiệu quả mà công nghệ mang lại trong quá trình phân tích dữ liệu khi kiểm toán BCTC
Với cách tiếp cận toàn cầu mà những công ty kiểm toán lớn trên thế giới đang nghiên cứu và triển khai về khả năng thực hiện phân tích dữ liệu, thì bất kỳ sự thay đổi phù hợp nào trong tương lai đối với các CMKT đến từ các cơ quan, tổ chức liên quan cũng được coi là rất quan trọng, bởi vì khi có công nghệ thay thế thì những kỹ thuật kiểm toán được nhắc đến trong các CMKT trước đây như lấy mẫu truyền thống sẽ không cần thiết hoặc thậm chí là lỗi thời; hoặc ngay cả khi KTV có thể sử dụng công nghệ mới để xem xét tất cả các giao dịch thì CMKT vẫn yêu cầu lấy mẫu, như vậy rõ ràng là dư thừa và không hiệu quả (Tammy Whithouse, 2014)
1.2.3.3 Bộ phận công nghệ thông tin
Các nhà thiết kế hệ thống thông tin và các KTV công nghệ thông tin là những
cá nhân thuộc bộ phận công nghệ thông tin (Vasarhely et al, 2012) Với những đột phá về công nghệ, hàng loạt những ứng dụng, phần mềm, công cụ mới ra đời tất nhiên sẽ gây ra những khó khăn nhất định cho KTV, vậy để cập nhật nhanh nhất và
sử dụng được những phát kiến mới này, KTV rất cần sự hỗ trợ từ phía những chuyên gia công nghệ Mặt khác, việc phát triển những công cụ phân tích mới dùng trong kiểm toán, để đảm bảo những tiêu chí do KTV đưa ra thì sự trợ giúp của bộ phận công nghệ thông tin để đưa từ ý tưởng đến hiện thực là không thể thiếu Do
đó, hiện nay, thách thức tuyển dụng những KTV có trình độ về công nghệ của những công ty kiểm toán khá cao, một số công ty chấp nhận tuyển dụng những chuyên gia công nghệ và sau đó sẽ đào tạo lại trong lĩnh vực kiểm toán Nói chung, với sự bùng nổ công nghệ thì vai trò của bộ phận công nghệ thông tin đang dần trở nên quan trọng và cần thiết trong mọi lĩnh vực, đặc biệt là kiểm toán, tuy nhiên cũng cần lưu ý rằng kỹ năng phân tích dữ liệu cần phải được phát triển ở tất cả mọi nhân viên trong doanh nghiệp chứ không phải chỉ một vài nhà phân tích dữ liệu vì như vậy sẽ gia tăng sự phụ thuộc vào chính những chuyên gia này
1.2.3.4 Những khách hàng có sử dụng phân tích dữ liệu
Trang 33Các tổ chức cũng đã và đang xem xét cách thức mà những khách hàng của các công ty kiểm toán sử dụng phân tích dữ liệu trong quá trình hoạt động của họ, ví dụ một công ty bảo hiểm có thể sử dụng phân tích dữ liệu phức hợp, độc quyền để giải thích cho việc cung cấp phí bảo hiểm thấp hơn cho những trường hợp được xem như ít rủi ro chẳng hạn cho tài xế lái xe thông qua những ứng dụng điện thoại di động độc quyền Chính đều này sẽ dẫn đến tình huống khách hàng sẽ hạn chế việc truy cập của KTV vì lo ngại vấn đề bản quyền và an ninh dữ liệu, mặt khác nếu không tiếp cận được với những dữ liệu này thì vấn đề về tính thích hợp và đầy đủ của bằng chứng kiểm toán sẽ không được đáp ứng Khi kiểm toán những đơn vị phức tạp, có thể phải mất thời gian nhiều hơn của KTV để xây dựng những phương pháp tiếp cận dữ liệu cho phù hợp, do đó, nếu vấn đề về việc phân tích dữ liệu độc quyền ngày càng trở nên phổ biến rộng rãi thì KTV có thể đối mặt với những rào cản trong việc có được bằng chứng kiểm toán để đáp ứng các cơ sở dẫn liệu trên BCTC của đơn vị được kiểm toán
1.3 Các nghiên cứu về Big Data và phân tích dữ liệu kiểm toán
1.3.1 Các nghiên cứu về Big Data trong kiểm toán
Hiện nay, mối quan tâm về Big Data đang ngày một gia tăng trong lĩnh vực kiểm toán (Vasarhelyi, Kogan, and Tuttle 2015) cũng như việc sử dụng phân tích dữ liệu ngày một nhiều trong hầu hết các lĩnh vực kinh doanh đã và đang mang lại nhiều mối quan tâm cho KTV, ví dụ: có nên phát triển những phương pháp phân tích mới trong quá trình kiểm toán? Phương pháp nào được xem là hữu hiệu nhất? Trường hợp nào trong cuộc kiểm toán có thể áp dụng những phương pháp này? Có nên thay đổi các CMKT để cho phép/tạo điều kiện thuận lợi trong việc áp dụng những phương pháp này? KTV có cần thiết phải tìm hiểu và báo cáo nhiều thông tin hơn không? KTV cần có năng lực gì để thích nghi với môi trường mới này?
Các mối quan tâm này bắt nguồn từ việc nhiều hệ thống làm việc của khách
hàng hiện nay tích hợp với các đám mây, internet vạn vật (Internet of Thing - là một kịch bản của thế giới, khi mà mỗi đồ vật, con người được cung cấp một định danh của riêng mình, và tất cả có khả năng truyền tải, trao đổi thông tin, dữ liệu qua một
Trang 34mạng duy nhất mà không cần đến sự tương tác trực tiếp giữa người với người, hay người với máy tính) và các nguồn dữ liệu bên ngoài như các phương tiện truyền
thông xã hội… do đó những nguồn dữ liệu khách hàng này có thể rất lớn về dung lượng và tốc độ, đa dạng về kết cấu (Cukier and Mayer – Schoenberger, 2013) Dữ liệu này có thể bắt nguồn từ cảm biến, video, tập âm thanh, văn bản truyền thông xã hội… (Warren et al, 2015) Tuy nhiên nguồn dữ liệu này thường mang lại những cơ hội gần như vô hạn đối với những nghiên cứu về phân tích hiện có (Holsapple, Lee-Post and Pakath, 2014; Lee et al, 2014; Delen and Demirkan, 2012), Big Data thực
sự mang lại nhiều cơ hội cho KTV để tiến hành cuộc kiểm toán hiệu quả và chất lượng hơn Hơn nữa, môi trường của Big Data (Vasarhelyi, Kogan and Tuttle, 2015), các thiết bị cá nhân và internet vạn vật (Atzori, Lena and Morabito, 2010; Domingos, 2011; Dai and Vasarhelyi, 2016) đang dần kết nối với các hệ thống trong nội bộ doanh nghiệp, sự phát triển của các phần cứng và phần mềm với tính kinh tế cao hơn nhiều so với những hệ thống truyền thống, không khó để tưởng tượng khả năng các phương pháp phân tích số liệu như hồi quy có thể được xây dựng dưới dạng một con chip tích hợp các phần mềm có thể giải thích kết quả và đưa ra các đề nghị cho người sử dụng, kể cả KTV Những tiến bộ trong việc giải nghĩa từ ngữ dưới dạng văn bản, nhận dạng giọng nói hay video, tranh ảnh đã gia tăng sự kết nối trong môi trường công nghệ, đồng thời độ trễ của thông tin và hệ thống xử lý giảm dần do các chip được thiết kế nhanh, mạnh hơn, các thiết bị được kết nối và cảm biến tự động, các cuộc kiểm toán truyền thống hàng năm hay thậm chí các báo cáo quý, báo cáo giữa niên độ sẽ không còn mang nhiều ý nghĩa trong
thế giới được đo lường bằng thời gian thực (the world of real-time measurement)
Big Data bao gồm tất cả dữ liệu từ bên trong và ngoài doanh nghiệp, bao gồm
dữ liệu có cấu trúc, bán cấu trúc và không có cấu trúc, dữ liệu máy tính, dữ liệu trực tuyến và di động để bổ sung vào nguồn dữ liệu của tổ chức (Ernst & Young, 2014) Big Data về cơ bản sẽ thay đổi cách doanh nghiệp cạnh tranh và hoạt động, các doanh nghiệp đã đầu tư và thu được thành công từ dữ liệu của họ sẽ có lợi thế rõ rệt hơn đối thủ cạnh tranh Trong môi trường Big Data, sẽ có rất nhiều nguồn thông tin
Trang 35mới lạ đối với các KTV, do đó các tiêu chuẩn liên quan đến bằng chứng kiển toán
có thể cần phải được thảo luận và xem xét từ nhiều chuyên gia trong nhiều lĩnh vực khác nhau, kể cả chuyên gia công nghệ thông tin KTV cần tìm câu trả lời cho câu hỏi làm thế nào để có thể phân tích được Big Data đã và đang tồn tại ở bên trong và bên ngoài doanh nghiệp, liệu rằng một lượng lớn dữ liệu có thể bù đắp lại cho những dữ liệu không chắc chắn hoặc chất lượng thấp hay không (Cukier and Mayer-Schoenberger, 2013) Trong trường hợp nguồn dữ liệu có nguồn gốc không đáng tin cậy hoặc không để lại dấu vết kiểm toán (Appelbaum, 2016), những CMKT hiện tại cho thấy rằng không có giá trị nào có thể bù đắp được những dữ liệu thiếu giá trị và không đáng tin cậy đó
Các vấn đề về gian lận cũng được xem là một vấn đề đầy thách thức trong môi trường Big Data đối với đội ngũ KTV Nhiều thông tin không bằng thông tin có ý nghĩa, và sự phức tạp thêm của Big Data sẽ làm gia tăng sự khó khăn khi đánh giá bằng chứng kiểm toán về gian lận (Srivastava et al, 2009; Srivastava, 2011; Fukukawa et al, 2014) Phát hiện gian lận cần tập trung vào tìm hiểu và đánh giá hệ thống kiểm soát nội bộ bất kể khả năng phân tích hiện nay cho phép lấy mẫu hoặc
xử lý 100% các giao dịch nghiệp vụ phát sinh, tuy nhiên cũng cần lưu ý rằng dù hệ thống kiểm soát nội bộ có hữu hiệu như thế nào thì khả năng gian lận vẫn có thể xảy
ra, chính khối lượng lớn và sự phức tạp của Big Data có thể cản trở việc xác định khả năng xảy ra gian lận
Một vấn đề khác cũng đáng quan tâm trong môi trường Big Data là làm thế nào
để đo lường số lượng bằng chứng kiểm toán, cách kết hợp bằng chứng thu thập trong môi trường Big Data với những bằng chứng khác như thế nào, phương pháp định lượng được sử dụng như thế nào để hỗ trợ KTV đánh giá về sự đầy đủ của bằng chứng kiểm toán… toàn bộ các tiêu chuẩn về bằng chứng kiểm toán có thể cần phải được đánh giá lại và sửa đổi cho phù hợp trong thời đại công nghệ số và Big Data (Appelbaum, 2016; Brown-Liburd and Vasarheklyi, 2015) Mục đích chính của KTĐL là đảm bảo hợp lý rằng BCTC của khách hàng không chứa đựng các sai sót trọng yếu khi đưa ra ý kiến trên báo cáo kiểm toán, để làm được điều này KTV
Trang 36phải thiết kế và thực hiện các thủ tục kiểm toán nhằm thu thập đầy đủ bằng chứng thích hợp, hơn nữa, CMKT đòi hỏi các KTV phải đánh giá và kiểm tra bằng chứng vật chất như một phần của quá trình đánh giá rủi ro (PCAOB 2010, AICPA 2012, ISA 500), về cơ bản, nếu thông tin không đáng tin cậy hoặc nguồn gốc của nó không thể kiểm chứng thì phải thu thập và kiểm chứng thêm nhiều bằng chứng khác Tuy nhiên, trong môi trường công nghệ thông tin và Big Data phức tạp ngày nay, bản chất về bằng chứng đã thay đổi (Brown-Liburd et al, 2015), với Big Data,
số lượng bằng chứng không còn là vấn đề trọng yếu mà thay vào đó là chất lượng
bằng chứng có thể có nhiều thách thức hơn Các bằng chứng điện tử (electronic evidence) thường gây những vấn đề trái ngược hoặc khó khăn trong việc truy lại
nguồn gốc ban đầu so với bằng chứng là giấy tờ Nếu bằng chứng giấy tờ khó thay đổi nội dung thì dữ liệu điện tử có thể dễ dàng thay đổi và những thay đổi này có thể rất khó phát hiện, mặt khác, thông thường những bằng chứng có nguồn gốc bên ngoài độc lập với đơn vị thì độ tin cậy sẽ càng cao nhưng khi với bằng chứng điện
tử sẽ rất khó xác minh nguồn gốc và độ tin cậy Ngoài ra, những thông tin trên bằng chứng giấy sẽ dễ đánh giá và dễ hiểu trong khi bằng chứng điện tử phải yêu cầu trình độ chuyên môn cao hơn từ KTV Cuối cùng, vì những quy trình kinh doanh hiện nay đang từng bước được số hóa nên cần thiết phải sửa đổi những tiêu chuẩn quy định về độ tin cậy của bằng chứng điện tử nhằm đảm bảo được tính đầy đủ và thích hợp trong quá trình thu thập bằng chứng của KTV
1.3.2 Các nghiên cứu về phân tích dữ liệu kiểm toán
Trong kỷ nguyên của Big Data, để có thể sẵn sàng cho những thay đổi mới, các chuyên gia kiểm toán đã bắt đầu xem xét làm thế nào để tận dụng lợi thế của Big Data trong kiểm toán bằng việc dùng những khoản đầu tư lớn vào nghiên cứu phân tích dữ liệu để có thể gia tăng đáng kể phạm vi kiểm toán của KTV độc lập vào sổ sách và các ghi chép của đơn vị được kiểm toán (Tammy Whithouse, 2014) Tương lai không xa, các công ty đại chúng sẽ cung cấp cho KTV quyền truy cập không chỉ một vài mẫu các giao dịch của họ mà là toàn bộ hệ thống sổ sách và cơ sở dữ liệu liên quan, và KTV có thể nhìn vào tất cả dữ liệu giao dịch, ngay cả khi điều này có
Trang 37thể lên đến hàng triệu hoặc hàng chục triệu hồ sơ khác nhau, chứ không chỉ là dữ liệu tóm tắt Việc sử dụng phân tích dữ liệu để tiến hành một cuộc kiểm toán thể hiện một bước nhảy vọt từ các phương pháp tiếp cận kiểm toán truyền thống dựa trên lấy mẫu đến một cuộc kiểm toán có thể nhìn vào mọi thứ theo đúng nghĩa đen: với phân tích dữ liệu, KTV có thể nhìn vào 100% các giao dịch, phát hiện những dấu vết kiểm toán, những giao dịch bất thường hay những điều tưởng chừng không
có ý nghĩa gì Một khi công nghệ phân tích dữ liệu đáp ứng được cho các mục tiêu kiểm toán, các KTV độc lập sẽ bắt đầu dùng Big Data để tìm kiếm câu trả lời cho từng cuộc kiểm toán khác nhau, hiện nay hầu như tất cả những công ty kiểm toán lớn (Big4…) điều có những dự án liên quan đến việc đầu tư phát triển công nghệ trong phân tích dữ liệu nhằm tăng chất lượng cuộc kiểm toán, giảm rủi ro, nâng cao hiệu quả và hiệu suất Đã có một số nghiên cứu từ các công ty kiểm toán khác nhau trong việc tìm tòi và thử nghiệm các phương pháp mới bởi vì trong thực tế, KTV đã
sử dụng các thủ tục phân tích từ lâu trong quá trình kiểm toán từ lúc lên kế hoạch đến khi kết thúc cuộc kiểm toán, nhưng vấn đề đặt ra là với sự phức tạp ngày càng lớn của dữ liệu thì việc sử dụng những kiến thức và công cụ phân tích giống như đã làm từ 50 hay 60 năm trước đây là không hợp lý Chẳng hạn tại công ty kiểm toán Deloitte & Touche, họ thường xem xét vấn đề phân tích dữ liệu từ Big Data trên ba khía cạnh khác nhau: (1) kiểm tra các bộ dữ liệu lớn hơn hoặc đầy đủ chứ không chỉ
là chọn mẫu các dữ liệu; (2) họ thúc đẩy trí thông minh nhân tạo để không chỉ tìm kiếm các dữ liệu mà còn cả các văn bản liên quan, những vùng “red flags” có khả năng gian lận và (3) tìm kiếm những dữ liệu liên quan có sẵn ở những nơi khác Một khi những nghiên cứu này thật sự phát huy tác dụng, lợi ích nó mang về sẽ rất lớn, nhưng điều này không có nghĩa những công nghệ này sẽ thay thế được công việc của KTV, tuy nhiên nó sẽ loại bỏ những công việc chỉ mang tính chất đối phó, hình thức, cũng như tăng cường kiểm tra thêm dữ liệu và cung cấp thêm cho KTV những thông tin có giá trị hơn để xem xét Quá trình thực hiện phân tích dữ liệu có thể được thực hiện tóm tắt như mô tả của FRC (2017) gồm các công việc như:
Trang 38- Phân tích tất cả dữ liệu trong tổng thể, phân tầng cho tổng thể và xác định các ngoại lệ để kiểm tra thêm;
- Thực hiện lại các tính toán liên quan đến BCTC;
- Khớp các giao dịch khi chúng đi qua chu trình xử lý;
- Hỗ trợ phân chia nhiệm vụ kiểm tra;
- So sánh dữ liệu phân tích với dữ liệu bên ngoài thu được;
- Vận dụng dữ liệu để đánh giá tác động của các giả định khác nhau
Cũng theo đánh giá của FRC, nhiều kỹ thuật phân tích dữ liệu trong kiểm toán BCTC chưa được áp dụng như giám sát kiểm soát liên tục, đo điểm chuẩn dữ liệu giữa các khách hàng kiểm toán ở cấp độ giao dịch và phân tích dữ liệu phi cấu trúc (phân tích tự động các dữ liệu phi cấu trúc như nội dung các email điện tử hoặc tài liệu soạn thảo dưới dạng văn bản…)
Một dạng phân tích khác trong chuỗi những hoạt động phân tích dữ liệu mà
KTV cũng cần quan tâm là phân tích doanh nghiệp (BA – Business Analytics) – là
việc sử dụng dữ liệu, công nghệ thông tin, phân tích thống kê, các phương pháp định lượng và các mô hình toán học hoặc dựa vào máy tính để giúp nhà quản lý nắm bắt tất cả hoạt động của doanh nghiệp và đưa ra các quyết định dựa trên thực tế tốt hơn (Davenport and Harris, 2007) BA được chia thành ba loại (Holsapple et al, 2014; Norbert Tschakert et al, 2016) gồm:
(i) Phân tích mô tả: cung cấp cái nhìn cảnh dựa trên những thông tin trong quá khứ, về “những gì đã xảy ra”, tuy nhiên giá trị thực sự của phân tích nằm ở dự đoán, nghĩa là “những gì sẽ xảy ra” và chúng ta “nên làm gì” liên quan đến những dữ liệu
có sẵn và lợi thế về công nghệ;
(ii) Phân tích dự đoán: giúp hiểu và cung cấp những dự đoán trong tương lai bằng cách xác định các mẫu thử từ dữ liệu quá khứ, nhận định điều gì sẽ xảy ra, khi nào và tại sao;
(iii) Phân tích theo quy trình (phân tích nguyên tắc): hỗ trợ xác định lựa chọn phù hợp để giải quyết một kết quả dự đoán thông qua các kỹ thuật tối ưu hóa Và
Trang 39với loại hình phân tích này, công nghệ sẽ giúp xác định phương pháp thực tế hoặc cách tiếp cận để thực hiện (Holsapple et al, 2014; Davenport and Kim, 2013; Evans, 2012)
KTV cần quan tâm đến BA bởi vì BA vừa ảnh hưởng đến nội bộ doanh nghiệp kiểm toán vừa là một kỹ thuật được nhiều khách hàng là những công ty lớn đang sử dụng Việc khách hàng chọn kỹ thuật nào kể trên phụ thuộc vào kỳ vọng của thủ tục phân tích và loại dữ liệu, nếu như mong đợi càng nhiều và nguồn dữ liệu càng đa dạng, khối lượng càng lớn thì khả năng tập trung vào phân tích theo quy trình càng cao hoặc ít nhất cũng là phân tích dự đoán Vì trọng tâm của BA đối với nhà quản lý
sẽ khác với KTV, nếu nhà quản lý khai thác BA để cung cấp các dự báo phục vụ việc ra các quyết định quản lý, nâng cao hiệu quả và hiệu suất trong hoạt động doanh nghiệp, KTV nội bộ sử dụng BA để xác minh tính chính xác của thông tin thì KTV độc lập sử dụng BA vì có liên quan đến những xác nhận trên BCTC Khi khách hàng kiểm toán có sử dụng BA trong quá trình hoạt động, KTV có thể thực hiện các kỹ thuật thường sử dụng như phân tích xu hướng, phân tích tỷ lệ và đọc lướt…miễn KTV thấy hài lòng với kết quả mang lại (Glover et al, 2014)
Sự phát triển ngày càng nhanh của công nghệ kéo theo hàng loạt những vấn đề phát sinh trong quá trình kiểm toán, đặc biệt là dữ liệu, do đó, ngoài những thủ tục phân tích mà KTV thường sử dụng, được quy định cụ thể trong các CMKT ở Việt Nam cũng như quốc tế, các chuyên gia cho rằng bước đầu tiên trong tiến trình phân tích dữ liệu là nhằm đạt được một sự hiểu biết chung về số liệu phân tích, điều này
sẽ dẫn đến việc nhất quán trong thời gian, công việc và kết quả dự báo với thực tế KTV cần quan tâm đến phân tích dữ liệu, phân tích Big Data để có thể đưa ra ý kiến kiểm toán trung thực và hợp lý hơn
Stewart (2015) định nghĩa “phân tích dữ liệu kiểm toán là phân tích những dữ liệu cơ bản trên BCTC, có kết hợp với những thông tin tài chính và phi tài chính liên quan nhằm xác định các rủi ro tiềm tàng hoặc rủi ro có sai sót trọng yếu” Liu (2014) đã đề xuất sử dụng phân tích dữ liệu trong quá trình kiểm toán để tìm câu trả lời cho những rủi ro tiềm tàng, Liu (2014) và Stewart (2015) lập luận rằng phân tích
Trang 40dữ liệu là một phần không thể thiếu trong quá trình kiểm toán và việc sử dụng nó cần được quy định trong các CMKT
Nói tóm lại, các CMKT quy định nhiệm vụ mà thủ tục phân tích cần thực hiện
và hoàn thành trong từng giai đoạn nhưng không ràng buộc những kỹ thuật nào KTV cần thực hiện để đạt được mục tiêu đề ra, do đó dù KTV có sử dụng các kỹ thuật phân tích phức tạp như phân tích hồi quy, phân tích văn hóa công nghệ trong các doanh nghiệp đa quốc gia hay các kỹ thuật phân tích truyền thống như phân tích
tỷ lệ thì đa phần phụ thuộc vào kiến thức của KTV hơn là dựa vào những quy định
từ chuẩn mực Điều này cũng có nghĩa rằng bất kỳ sự áp dụng nào của KTĐL trong phân tích dữ liệu về Big Data đa phần do tác động từ thị trường phát triển hay các bên liên quan bên ngoài doanh nghiệp (Alles, 2015), sự phát triển gần đây của phân tích dữ liệu kiểm toán có thể xuất phát từ chính những lực lượng này chứ không phải từ những quy định trong CMKT Khi nói về phân tích dữ liệu với sự phát triển của công nghệ sẽ làm nên những rô-bốt có khả năng thay thế được cho KTV, tuy nhiên các chuyên gia tin rằng điều này khó có thể xảy ra vì luôn cần có những xét đoán nghề nghiệp trong quá trình phân tích dữ liệu từ chính KTV
KẾT LUẬN CHƯƠNG 1
Phân tích được xem là một trong những công cụ rất hữu ích cho KTV trong quá trình thực hiện kiểm toán, và với sự phát triển nhanh chóng của dữ liệu trong thời đại công nghệ số như hiện nay - tạo nên Big Data - thì phân tích dữ liệu rõ ràng là một thuật ngữ dường như rất “hot” bởi lợi ích đi kèm những thách thức mà nó mang lại, thu hút sự quan tâm của rất nhiều lĩnh vực, trong đó có kiểm toán BCTC Nội dung chương 1 làm rõ những khái niệm liên quan đến Big Data, phân tích dữ liệu từ Big Data trong kiểm toán cũng như những nghiên cứu trong các lĩnh vực này để làm
cơ sở cho những nghiên cứu được trình tiếp ở chương 2
Tại Việt Nam, mặc dù đã có những chương trình truyền hình, những talkshow, hội thảo, bài báo nghiên cứu về Big Data, về tầm quan trọng và cần thiết của Big Data trong sự phát triển của doanh nghiệp, tuy nhiên vẫn còn khá ít những nghiên cứu tập trung riêng biệt trong lĩnh vực kiểm toán, đây chính là khoản trống để tác