Untitled ĐẠI HỌC UEH TRƯỜNG ĐẠI HỌC KINH DOANH KHOA KẾ TOÁN ĐỒ ÁN KHOA HỌC DỮ LIỆU ĐỀ TÀI RỦI RO KIỂM TOÁN ĐỂ PHÂN LOẠI CÔNG TY GIAN LẬN (AUDITRISK DATASET FOR CLASSIFYING FRAUDULENT FIRMS) Giảng viên[.]
lOMoARcPSD|18034504 ĐẠI HỌC UEH TRƯỜNG ĐẠI HỌC KINH DOANH KHOA KẾ TOÁN ĐỒ ÁN KHOA HỌC DỮ LIỆU ĐỀ TÀI RỦI RO KIỂM TỐN ĐỂ PHÂN LOẠI CƠNG TY GIAN LẬN (AUDITRISK DATASET FOR CLASSIFYING FRAUDULENT FIRMS) Giảng viên : ThS Nguyễn Mạnh Tuấn Mã lớp học phần : 22C1INF50905965 Sinh viên thực (Nhóm 2): Lương Thị Hương Giang - 31211022604 Lê Việt Hà - 31211022919 Nguyễn Thị Kim Phượng - 31211025372 Ngô Thị Hồng Thắm - 31211024386 Triệu Yến Vy - 31211023952 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Thành phố Hồ Chí Minh, ngày tháng 10 năm 2022 MỤC LỤC CHƯƠNG I: TỔNG QUAN 1.1 Lý chọn đề tài 1.1.1 Khái niệm 1.1.2 Yêu cầu ngành 1.2 Mục tiêu nghiên cứu: 1.3 Đối tượng nghiên cứu .3 1.4 Mô tả liệu 1.4.1 Nguồn gốc liệu: 1.4.2 Cấu trúc liệu: 1.5 Quy trình thực 1.5.1 Các phương pháp dự đốn quy trình cụ thể 1.5.1.1 Phương pháp SVM 1.5.1.2 Phương pháp Tree 1.6.1 Phân tích liệu: 1.6.2 Tiền xử lý liệu .8 1.6.3 Phân tách liệu CHƯƠNG II: QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ 2.1 Bài toán 1: Dự báo nguy gian lận (Gian lận/Không gian lận) công ty dựa vào khả xảy rủi ro báo cáo kiểm toán (Bài toán phân lớp nhị phân) 2.2 Bài toán 2: Dự đoán khả xảy rủi ro kiểm tra BCTC (gian lận/ không gian lận) 15 2.3 Bài toán 3: Phân cụm rủi ro kiểm toán 17 CHƯƠNG III: KẾT LUẬN 19 3.1 Những hạn chế .19 3.2 Hướng phát triển 19 TÀI LIỆU THAM KHẢO 20 LỜI CẢM ƠN .21 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 DANH MỤC BẢNG Bảng Bảng Bảng Bảng Bảng Bảng 1: Mô tả liệu .5 Kết Test & Score 13 Kết Test & Score 16 Kết Confusion Matrix 16 Kết dự báo (2) .17 6: Kết đánh giá (3) 18 DANH MỤC HÌ Hình Hình Hình Hình Hình Mơ hình tốn 12 Mơ hình đánh giá rủi ro .15 Mơ hình tốn 15 Mơ hình tốn 17 Minh hoạ kết phân cụm .18 DANH MỤC BIỂU ĐỒY Biểu Biểu Biểu Biểu Biểu Biểu Biểu đồ đồ đồ đồ đồ đồ đồ Mật độ rủi ro tiềm tàng liệu 2: Mật độ rủi ro kiểm soát liệu Mật độ rủi ro phát liệu Phân loại rủi ro liệu Dữ liệu Risk0 Risk1 theo Control_Risk 10 Dữ liệu Risk0 Risk1 theo Inherent_Risk .11 Dữ liệu Risk0 Risk1 theo Audit_Risk 11 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 CHƯƠNG I: TỔNG QUAN I.1 Lý chọn đề tài Khi thực kiểm toán, KTV cần xét phương diện tổng thể BCTC có cịn sai sót trọng yếu gian lận nhầm lẫn hay không Do hạn chế vốn có kiểm tốn nên có rủi ro khó tránh khỏi, kể kiểm tốn lập kế hoạch, thực theo quy định chuẩn mực kiểm tốn (CMKiT), KTV khơng phát số sai sót trọng yếu đến BCTC Rủi ro có sai sót trọng yếu gian lận cao rủi ro có sai sót trọng yếu nhầm lẫn, gian lận thực cách tinh vi, tổ chức chặt chẽ, có hành động che dấu, có thơng đồng nhiều người, nhiều cấp Đây lý để nhóm em lựa chọn đề tài: Tập liệu Rủi ro Kiểm tốn để phân loại cơng ty gian lận để kiểm tra gian lận cơng ty cách xác Báo tài để tránh sai sót BCTC cơng ty Việt Nam Tăng cường tính xác, minh bạch, ổn định thơng tin tài việc định kinh tế Mục tiêu tập liệu giúp kiểm tốn viên xây dựng mơ hình phân loại dự đốn cơng ty gian lận sở yếu tố rủi ro lịch sử I.1.1 Khái niệm “Kiểm toán q trình kiểm tốn viên (KTV) độc lập có lực tiến hành thu thập đánh giá chứng thơng tin kiểm tốn nhằm xác nhận báo cáo mức độ phù hợp thông tin với chuẩn mực thiết lập” về I.1.2 Yêu cầu ngành - Khả biểu đạt xác, ngắn có tính thuyết phục cao Lắng nghe tiếp cận nhanh chóng vấn đề kỹ người kiểm toán Để người kiểm toán phải có khả biểu đạt xác, ngắn có tính thuyết phục cao giúp cho đối tượng sử dụng dịch vụ có nhiều tin tưởng - Biết quản lý thời gian chịu áp lực công việc Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Phải biết quản lý thời gian, nghề kiểm tốn địi hỏi phải biết chịu đựng áp lực công việc Phải biết xếp thời gian hợp lý để hoàn thành tốt tiến độ mà đề - Có khả quan sát tư phân tích cao Kiểm tốn ln ln địi hỏi phải có tư phân tích cao tập trung cao độ Giữa kế kiểm tốn có khác rõ nhận diện vấn đề kịp thời, nhanh chóng Kiểm tốn phải đưa hiểu vấn đề thật kịp thời để tìm điểm sai sót hay gian lận BCTC I.2 Mục tiêu nghiên cứu: Mục tiêu tổng quát: “Mục tiêu tập liệu giúp kiểm tốn viên xây dựng mơ hình phân loại dự đốn cơng ty gian lận sở yếu tố rủi ro lịch sử” Thông tin ngành số lượng doanh nghiệp liệt kê Thủy lợi (114), Y tế cơng cộng (77), Tịa nhà đường xá (82), Rừng (70), Doanh nghiệp (47), Chăn nuôi (95), Truyền thông ( 1), Điện (4), Đất đai (5), Khoa học Công nghệ (3), Du lịch (1), Thủy sản (41), Công nghiệp (37), Nơng nghiệp (200) Cơng trình nghiên cứu nghiên cứu điển hình cơng ty kiểm tốn bên ngồi phủ kiểm tốn viên bên ngồi cơng ty phủ Ấn Độ Trong q trình lập kế hoạch kiểm tốn, kiểm toán viên kiểm tra hoạt động kinh doanh văn phịng phủ khác mục tiêu đến thăm văn phòng với khả xảy sai sót cao có ý nghĩa nghiêm trọng Điều tính tốn cách đánh giá rủi ro liên quan đến mục tiêu báo cáo tài (Houston, Peters Pratt 1999) Ba mục tiêu nghiên cứu sau: Các mục tiêu cụ thể: Bài toán 1: Dự báo nguy gian lận (Gian lận / Không gian lận) công ty dựa vào khả xảy rủi ro báo cáo kiểm toán (Bài toán phân lớp nhị phân) Bài toán 2: Dự đoán khả xảy rủi ro kiểm tra BCTC (Gian lận / Không gian lận) Bài toán 3: Phân cụm rủi ro kiểm toán Các toán liên quan đến chuyên ngành: mức Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 - Liên quan - Liên quan gần - Khơng liên quan Bài tốn 1: Thuộc liên quan gẩn với chuyên ngành Lí do: Đây tốn cho thấy quy trình phân tích rủi ro kiểm tốn cơng ty cách vấn sâu với nhân viên kiểm toán đánh giá rủi ro doanh nghiệp q trình lập kiểm tốn Kế tốn kiểm tốn cơng việc liên quan đến vấn đề tài doanh nghiệp , bên cạnh có số thao tác khác Bài tốn 2: Thuộc liên quan gần với chuyên ngành Lí do: Đây toán kiểm tra yếu tố rủi ro đánh giá rủi ro công ty Đánh giá phân loại gian lận/không gian lận công ty Kế, kiểm lĩnh vực địi hỏi tập trung, tỉ mỉ độ xác cao Vì cần sai sót nhỏ, gây thiệt hại lớn cho doanh nghiệp Bài toán : Thuộc liên quan gần với chuyên ngành Lí do: Phân cụm rủi ro kiểm tốn cơng ty I.3 Đối tượng nghiên cứu “Đối tượng chủ yếu tài liệu kế toán, lợi ích trực tiếp người quản lý người khác có liên quan Giới hạn khơng tài liệu kế tốn mà cịn bao gồm tình trạng thực tế hoạt động tài chính, phản ánh hay chưa tài liệu kế toán” Nhưng tất người quan tâm, số tài liệu kế tốn khơng có ý nghĩa khơng gắn liền với sức khỏe tài đơn vị kiểm toán Điều phức tạp mối quan hệ tài hạn chế trình độ phương tiện xử lý thơng tin, khiến cho kế tốn khơng thể thu thập đầy đủ thơng tin tài Ngồi ra, KTV quan tâm đến lĩnh vực quản lý: hiệu sử dụng nguồn lực, kế hoạch, mục tiêu, Đối tượng kiểm toán: cụ thể sau: - Thực trạng hoạt động tài - Đối tượng kiểm tốn chung Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Hoạt động tài việc sử dụng tiền để giải mối quan hệ kinh tế đầu tư, kinh doanh, phân phối tốn nhằm đạt lợi ích kinh tế định Ở đây, quan hệ tài nội dung chất hoạt động tài chính, cịn tiền hình thức biểu hiện, phương tiện giải quan hệ kinh tế - Tài liệu kế toán - Đối tượng kiểm toán cụ thể Hồ sơ kế toán hệ thống tài liệu, sổ sách, biểu mẫu báo cáo tài kế toán Theo Luật kế toán: Tài liệu kế toán chứng từ, sổ kế tốn, báo cáo tài chính, báo cáo kế toán quản trị, báo cáo kiểm toán, báo cáo kiểm tra kế toán tài liệu khác có liên quan đến kế tốn Tình trạng Tài sản Giao dịch Tài - Đối tượng Kiểm toán : Cụ thể Tài sản biểu nhiều hình thái vật chất khác nhau, đơn vị nghiệp doanh nghiệp, Người quản lý người chịu trách nhiệm Mối quan hệ người khai thác người khai thác với chủ sở hữu thực theo xu hướng cách thức khác nhau, khoảng cách chủ sở hữu với chủ sở hữu, người trông coi người sử dụng tài sản ngày lớn Mặt khác, với phát triển sản xuất, quy mô tài sản tăng lên, quy mô hoạt động không ngừng mở rộng, mối liên hệ kinh tế ngày đa dạng phức tạp Biểu thơng tin kế tốn Thực tế thúc đẩy đời kiểm toán cần thiết phải đặt tình trạng thực tế tài sản vào đối tượng kiểm tốn Dựa quy trình chủ trương này, chia thành hoạt động kiểm toán cụ thể phù hợp với đơn vị dựa đặc điểm cụ thể loại tài sản, mối quan hệ kinh tế loại tài sản loại giao dịch Các phần hành kiểm toán bao gồm + Các nghiệp vụ tiền mặt quỹ + Các nghiệp vụ vật tư + Các nghiệp vụ trình kinh doanh + Các nghiệp vụ tạo vốn hoàn trả vốn Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 I.4 Mô tả liệu I.4.1 Nguồn gốc liệu: Nguồn gốc liệu thu thập từ https://www.kaggle.com/datasets Audit Data gồm file liệu excel : audit_data I.4.2 Cấu trúc liệu: Thuộc tính Sector_score PARA_A Score_A Risk_A PARA_B Score_B_1 Risk_B Total numbers Score_B_2 Risk_C Money_Value Score_MV Risk_D District_Loss PROB Ý nghĩa Gí trị điểm rủi ro lịch sử Sự khác biệt chi tiêu kế hoạch tra báo cáo tóm tắt A (tính Rs) Điểm báo cáo tóm tắt A Rủi ro báo cáo tóm tắt A Sự khác biệt chi phí kiểm tra ngồi kế hoạch báo cáo tóm tắt B (tính Rs) Điểm báo cáo tóm tắt B_1 Rủi ro báo cáo tóm tắt B Tổng số tiền chênh lệch báo cáo khác Rs Điểm khác biệt lịch sử Điểm báo cáo tóm tắt B_2 Rủi ro báo cáo tóm tắt C Số tiền liên quan đến sai sót kiểm tốn trước Điểm Mv Rủi ro báo cáo tóm tắt D Chỉ số lỗ theo khu vực Gía trị p trị số thống kê (f-statistic) Mô tả Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số tự nhiên Số thập phân Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Risk_E History Prob Risk_F Inherent_Risk CONTROL_RISK Detection_Risk Audit_Risk Risk LOCATION_ID Rủi ro báo cáo tóm tắt E Chỉ số lịch sử Gía trị p trị số thống kê (f-statistic) Rủi ro báo cáo tóm tắt F Rủi ro tiềm tàng Rủi ro kiểm soát Rủi ro phát Tổng điểm rủi ro thơng qua q trình phân tích Phân loại rủi ro Mã định danh thành phố/tỉnh Số thập phân Số tự nhiên Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số thập phân Số tự nhiên Bảng 1: Mô tả liệu Đây tổng số 777 liệu doanh nghiệp từ 46 thành phố khác tiểu bang kiểm toán viên liệt kê để nhắm mục tiêu cho cơng việc kiểm tốn thực địa Các văn phòng mục tiêu liệt kê từ 14 lĩnh vực khác I.5 Quy trình thực I.5.1 Các phương pháp dự đoán quy trình cụ thể I.5.1.1 Phương pháp SVM “Support Vector Machine (SVM) thuật tốn có giám sát” Phương pháp nhận liệu vào, xem chúng vector không gian phân loại chúng vào lớp khác cách xây dựng siêu phẳng không gian nhiều chiều làm mặt phân cách lớp liệu Phương pháp có nhiều biến thể để phù hợp với toán phân loại khác Các bước quy trình SVM Bước 1: Nhập liệu huấn luyện vào Orange Bước 2: Nối widget liệu huấn luyện SVM với Test and Score, sau nối widget vào Confusion Matrix để thực đánh giá kết đánh giá ma trận nhầm lẫn Bước 3: Nối liệu huấn luyện vào SVM Đồng thời nhập liệu dùng để dự báo vào Orange Bước 4: Liên kết SVM liệu dự báo với Predictions để đánh giá phân loại liệu đầu vào Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Khi làm bài, nhóm nghiên cứu sử dụng file liệu thu thập để tiến hành phân lớp liệu sau: File audit_data làm liệu dự báo cho nghiên cứu CHƯƠNG II: QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ II.1 Bài toán 1: Dự báo nguy gian lận (Gian lận/Không gian lận) công ty dựa vào khả xảy rủi ro báo cáo kiểm toán (Bài toán phân lớp nhị phân) Mô tả phương pháp Phương pháp phân lớp (Classification) “Phân lớp liệu trình phân đối tượng liệu vào hay nhiều lớp (loại) cho trước nhờ mơ hình phân lớp” Mơ hình xây dựng dựa tập liệu gán nhãn trước Q trình gán nhãn cho đối tượng liệu trình phân lớp Quá trình phân lớp liệu gồm bước: - Bước 1: Xây dựng mơ hình (giai đoạn “huấn luyện”) Dữ liệu đầu vào liệu mẫu gán nhãn tiền xử lý Các thuật toán phân lớp: Cây định, SVM, Hồi quy logistic … Kết bước mơ hình phân lớp huấn luyện (trình phân lớp) - Bước 2: Đánh giá mơ hình (kiểm tra tính đắn) Dữ liệu đầu vào: tập liệu mẫu khác gắn nhãn tiền xử lý Tuy nhiên lúc đưa vào mô hình phân lớp, ta “lờ” thuộc tình gắn nhãn Tính đắn mơ hình xác định cách so sánh thuộc tính gắn nhãn liệu đầu vào kết phân lớp mơ hình - Bước 3: Phân lớp liệu Phân loại toán phân lớp: Nhiệm vụ toán phân lớp phân loại đối tượng liệu vào n lớp cho trước nếu: n = 2: Thuộc toán phân lớp nhị phân n > 2: Thuộc toán phân lớp đa lớp Các phương pháp phân lớp sử dụng bài: 10 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 - Cây định (Decision Tree): Trong lý thuyết quản trị, định đồ thị định kết kèm nhằm hỗ trợ trình định Trong lĩnh vực khai thác liệu, định phương pháp mô tả, phân loại tổng quát hóa tập liệu cho trước - SVM (Support Vector Machine) thuật tốn có giám sát, SVM nhận liệu vào, xem chúng vector không gian phân loại chúng vào lớp khác cách xây dựng siêu phẳng không gian nhiều chiều làm mặt phân cách lớp liệu Để tối ưu kết phân lớp phải xác định siêu phẳng (hyperplane) có khoảng cách đến điểm liệu (margin) tất lớp xa SVM có nhiều biến thể để phù hợp với nhiều toán phân loại khác - Hồi quy Logistic (Logistic Regression): Là phương pháp nhằm kiểm tra tính hiệu mơ hình phân lớp liệu có đặc thù cụ thể, từ định có sử dụng mơ hình hay khơng Một mơ hình lý tưởng mơ hình khơng đơn giản, không phức tạp không nhạy cảm với nhiễu PHÂN TÍCH DỮ LIỆU Phân tích liệu đặc trưng có tính phân loại: Mỗi hàng đại diện cho đối tượng doanh nghiệp cột chứa thuộc tính đối tượng Dữ liệu thô chứa 776 hàng (đối tượng) 25 cột (đặc trưng) Trong cột liệu thuộc tính có thuộc tính là: Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Audit_Risk (Rủi ro kiểm toán) ảnh hưởng phần lớn đến nguy doanh nghiệp có gian lận (Risk1) khơng gian lận (Risk0) Nhìn chung, đặc tính Inherent_Risk, Control_Risk, Audit_Risk có điểm chung số nhỏ không đáng kể (xấp xỉ 0) khả xảy kết “Risk 0” cao Mặt khác, số lớn khả xảy kết “Risk1” cao, chứng tỏ doanh nghiệp có nguy gian lận kiểm tốn Về Control_Risk: 11 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Biểu đồ Dữ liệu Risk0 Risk1 theo Control_Risk Về Inherent_Risk: Biểu đồ Dữ liệu Risk0 Risk1 theo Inherent_Risk 12 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Về Audit_Risk: Biểu đồ Dữ liệu Risk0 Risk1 theo Audit_Risk TIỀN XỬ LÝ DỮ LIỆU - Xử lý liệu - Báo cáo sử dụng liệu tổng hợp từ trang: ssssssssssdhfjskdhf https://archive.ics.uci.edu/ml/datasets/Audit+Data Dữ liệu xử lý, liệu bị thiếu, nhóm sử dụng cơng cụ Preprocess để thay liệu bị thiếu giá trị trung bình giá trị thuộc tính - Phân tách liệu: Lọc từ liệu gốc “audit_task”, nhóm sử dụng cơng cụ Data Sampler tách liệu khảo sát ban đầu thành hai file riêng biệt để thực việc phân lớp liệu sau: Sử dụng 70% liệu ban đầu để làm liệu mẫu huấn luyện mơ hình phân lớp liệu (audit_task.tab) Và sử dụng 30% liệu lại để làm liệu dự báo cho nghiên cứu (audit_task_forecast.tab) - Xác định biến độc lập biến phụ thuộc: - Biến phụ thuộc “Risk” - Biến độc lập thuộc tính cịn lại QUY TRÌNH XỬ LÝ 13 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Hình Mơ hình tốn Bước 1: Chọn liệu File audit_task.tab chọn cột “Risk” làm Target Bước 2: Phân tách liệu: Lọc từ liệu gốc “audit_task”, nhóm sử dụng cơng cụ Data Sampler tách liệu khảo sát ban đầu thành hai file riêng biệt để thực việc phân lớp liệu sau: Sử dụng 70% liệu ban đầu để làm liệu mẫu huấn luyện mơ hình phân lớp liệu (audit_task_train.tab) Và sử dụng 30% liệu lại để làm liệu dự báo cho nghiên cứu (audit_task_forecast.tab) Bước 3: Dùng phương pháp: Tree, Logistic Regression SVM tiến hành dự báo rủi ro kiểm toán công ty đánh giá độ hiệu phương pháp Bước 4: Lựa chọn phương pháp đánh giá tốt nhất, dùng phương pháp dự báo cho liệu File “audit_risk_forecast.tab” Đánh giá kết quả: Theo ma trận nhầm lẫn: 14 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Bảng 2: Kết ma trận nhầm lẫn Theo ma trận nhầm lẫn: + Ma trận loại 2: Dự báo “0” thực tế điều dẫn đến sai sót q trình kiểm toán viên kiểm tra gian lận, ảnh hưởng xấu đến mức độ trung thực cơng ty kiểm tốn + SVM=15 > LR=5 > Tree=0 => Dùng Test and Score để đánh giá LR Tree ( kết sai lầm LR Tree thấp SVM) Theo Test and Score: Bảng Kết Test & Score Ta thấy: Tree=0.998 < LR=1000 => Nên dùng Tree để dự báo Từ kết trên, nhóm đề xuất cơng ty kiểm tốn sử dụng mơ hình Tree (Cây định) trình dự báo nguy gian lận doanh nghiệp Các kiến thức chuyên ngành liên quan - Định nghĩa: 15 Downloaded by vu ga (vuchinhhp2@gmail.com) lOMoARcPSD|18034504 Rủi ro kiểm toán (Audit Risk - AR): Là rủi ro kiểm toán viên cơng ty kiểm tốn đưa ý kiến nhận xét khơng thích hợp báo cáo tài kiểm tốn cịn có sai sót trọng yếu - Các thành phần rủi ro kiểm toán: Rủi ro tiềm tàng (Inherent risk – IR): Rủi ro tiềm tàng hay gọi rủi ro cố hữu, tồn sai sót trọng yếu thân đối tượng kiểm toán (tức tồn chức hoạt động môi trường quản lý doanh nghiệp) Rủi ro kiểm soát (Control risk – CR): Là tồn sai sót trọng yếu mà hệ thống kiểm sốt nội khơng phát ngăn chặn kịp thời Rủi ro phát (Detection risk – DR): Là tồn sai sót trọng yếu mà hệ thống kiểm toán hay chuyên gia kiểm tốn khơng phát - Mối quan hệ ba loại rủi ro kiểm tốn thể cơng thức sau: AR=IR.CR.DR Trong đó: IR (Inherent Risk): Rủi ro tiềm tàng CR (Control Risk): Rủi ro kiểm soát DR (Detection Risk): Rủi ro phát AR (Audit Risk): Rủi ro kiểm tốn Dựa vào cơng thức trên, mơ hình để giải tốn sau: Bước 1: Chọn đầu vào: Những nhân tố ảnh hưởng đến rủi ro kiểm tốn Bước 2: Lựa chọn mơ hình dự đoán (Thuật toán thẩm định rủi ro) Bước 3: Dùng Risk Score để thẩm định đánh giá rủi ro Bước 4: Nhận xét Nếu Risk (Rủi Ro) cao: + Đúng: Doanh nghiệp có gian lận báo cáo kiểm tốn + Sai: Doanh nghiệp có Risk (Rủi Ro) thấp Nếu Risk (Rủi Ro) thấp: 16 Downloaded by vu ga (vuchinhhp2@gmail.com) ... tàng liệu 2: Mật độ rủi ro kiểm soát liệu Mật độ rủi ro phát liệu Phân loại rủi ro liệu Dữ liệu Risk0 Risk1 theo Control_Risk 10 Dữ liệu Risk0 Risk1 theo Inherent_Risk .11 Dữ liệu. .. 12 Mơ hình đánh giá rủi ro .15 Mơ hình tốn 15 Mơ hình tốn 17 Minh hoạ kết phân cụm .18 DANH MỤC BIỂU ĐỒY Biểu Biểu Biểu Biểu Biểu Biểu Biểu đồ đồ đồ đồ đồ đồ đồ Mật độ rủi... Biểu đồ Dữ liệu Risk0 Risk1 theo Audit_Risk TIỀN XỬ LÝ DỮ LIỆU - Xử lý liệu - Báo cáo sử dụng liệu tổng hợp từ trang: ssssssssssdhfjskdhf https://archive.ics.uci.edu/ml/datasets/Audit+Data Dữ liệu