Ngoài những đặc điểm trên, còn có th ể xác định sai ph m b ng nhi u cách khác ạ ằ ề nhau, nhưng việc áp dụng thực tiễn kiểm toán vào thực tế yêu cầu một nhà nghiên cứu phải tìm được phươ
Trang 1ĐẠI HỌC UEH TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ
đòi trong gian lận báo cáo tài chính
Giảng viên giảng dạy : ThS Nguy n M nh Tuễ ạ ấn
Nguyễn Văn Quang Phú
Thành ph H ố ồ Chí Minh, ngày 18 tháng 12 năm 2022
Trang 2LỜI CẢM ƠN
Chúng em muốn gửi lời cảm ơn chân thành nhất đến Ths Nguyễn Mạnh Tuấn Thầy là người đã giúp chúng em tiếp cận và hiểu rõ hơn về bộ môn Khoa học dữ liệu
Th y ầ đã giúp chúng em tích lũy thêm nhiều kiến thức, làm cơ sở để hoàn thành d án này Cự ảm ơn thầy đã luôn tận tình hướng d n, ch b o chúng em cách ẫ ỉ ảthức để thực hiện dự án, để chúng em hoàn thành t t d án này ố ự
Đặc bi t, nh s gi ng d y nhi t tình và tâm huy t c a th y trong su t quá ệ ờ ự ả ạ ệ ế ủ ầ ốtrình học, chúng em đã họ ập và được t c ti p c n v i các ph n m m thú vế ậ ớ ầ ề ị như Word, Excel, Orange… Chúng em tin chắ ằng, đây sẽc r là nh ng hành trang vô ữcùng b ích cho ngh nghi p c a chúng em sau này M t l n n a, chúng em xin ổ ề ệ ủ ộ ầ ữgửi l i chân thành nhờ ất đến th y ầ
Và cuối cùng, là những sinh viên năm hai - chưa có nhiều kinh nghiệmtrong làm dự án Do vậy, bài báo cáo cũng không tránh khỏi sai sót Nên nhờ thầy
bổ sung, sửa chữa những sai sót để chúng em có thể hoàn thành tốt hơn ở những bài báo cáo tiếp theo
Trang 3NHẬN XÉT CỦA GIẢNG VIÊN
………
………
………
………
………
………
………
………
………
………
Nguyễn Phước Thiện 31211022161 100%
Nguyễn Vũ Nhật Hạ 31211024580 100%
Nguyễn Văn Quang Phú 31211024708 100%
Ngô Nhung Huyền 31211022916 100%
Dương Công Quyết 31211022149 100%
Trang 4DANH M C B NG BI U, HÌNH NH MINH HO Ụ Ả Ể Ả Ạ
BẢNG BIỂU
Bảng 1 1: B ng mô t c u trúc c a b d li u Account Receivable Prediction 7 ả ả ấ ủ ộ ữ ệ Bảng 1 2: B ng mô t c u trúc c a b d li u Audit risk 9 ả ả ấ ủ ộ ữ ệ
HÌNH NH Ả
Hình 2 1: Minh ho ạ phương pháp hồi quy Losgistic 10
Hình 2 2: Minh ho ạ phương pháp SVM (Support Vector Machine) 11
Hình 2 3: Minh ho ạ phương pháp Neural Network 12
Hình 2 4: Minh ho v thu t toán K-Means 13ạ ề ậ Hình 2 5: Mô t x lí d li u b m t 15ả ử ữ ệ ị ấ Hình 2 6: Mô t phân tách b d li u 16ả ộ ữ ệ Hình 2 7: Mô hình xây d ng Bài toán 1 20ự Hình 2 8: K t qu ế ả đánh giá Bài toán 1 theo Logistic Regression 21
Hình 2 9: K t qu ế ả đánh giá Bài toán 1 theo Neural Network 22
Hình 2 10: K t qu ế ả đánh giá Bài toán 1 theo SVM 22
Hình 2 11: K t qu ế ả đánh giá Bài toán 1 và quyết định chọn phương pháp nghiên cứu 23
Hình 2 12: K t qu d báo c a Bài toán 1 t Prediction 24ế ả ự ủ ừ Hình 2 13: K t qu d báo v kho n ph i thu Bài toán 1 25ế ả ự ề ả ả Hình 2 14: Mô hình xây d ng Bài toán 2 26ự Hình 2 15: K t qu nghiên c u Bài toán 2 26ế ả ứ Hình 2 16 Mô hình xây d ng Bài toán 3 28ự Hình 2 17: Biểu đồ ự: s chênh l ch giệ ữa báo cáo điều tra và báo cáo tóm t t A 29ắ Hình 2 18: S chênh l ch giự ệ ữa báo cáo điều tra và báo cáo tóm t t B 29ắ Hình 2 19: S ự tương quan giữa giá tr r i ro và chênh l ch c a báo cáo A 30ị ủ ệ ủ Hình 2 20: S ự tương quan giữa giá tr r i ro và chênh l ch c a báo cáo B 30ị ủ ệ ủ Hình 2 21: Biểu đồ 5: T ng s ổ ố lượng khác bi t c a các báo cáo khác 31ệ ủ Hình 2 22: Biểu đồ 6: Giá tr khác bi t l ch s 32ị ệ ị ử Hình 2 23: Biểu đồ 7: Ch s tiỉ ố ền liên quan đến sai sót 32 Hình 2 24 B qua các thu c tính khác ngo i tr Audit risk 33ỏ ộ ạ ừ Hình 2 25 Hình nh minh h a tìm k t qu có Audit risk > 1 34ả ọ ế ả
Trang 5Hình 2 26 K t qu Risk khi Audit risk > 1 34ế ảHình 2 27: T ng h p biổ ợ ểu đồInherent_Risk, CONTROL_Risk, Detection_Risk, Audit_risk 35 Hình 2 28 K t qu Mô hình quy trình bài toán 35ế ảHình 2 29: K t qu Test and Score 36ế ảHình 2 30: B ng k t qu c a ả ế ả ủ Confusion Matrix theo phương pháp Logistic Regression 37Hình 2 31: B ng k t qu c a Confusion ả ế ả ủ Matrix theo phương pháp SVM 38Hình 2 32: B ng k t qu cả ế ả ủa Confusion Matrix theo phương pháp Neutral Network 38Hình 2 33: B ng k t qu d báo 39ả ế ả ựHình 2 34: Bảng kết quả dự báo 40
Trang 6MỤC L C Ụ
CHƯƠNG 1: TỔNG QUAN DỰ ÁN 1
1 Tổng quan về Kiểm toán và Doanh nghiệp 1
1.1 Khái niệm Báo cáo tài chính 1
1.2 Nghiệp vụ kiểm toán 1
1.3 Thực trạng gian lận của các công ty hiện nay 3
2 Lý do chọn đề tài 4
3 M c tiêu nghiên cụ ứu 5
4 Đối tượng nghiên cứu 6
5 Mô t d li u và c u trúc d liả ữ ệ ấ ữ ệu 6
CHƯƠNG II: QUY ĐỊNH THỰC HIỆN VÀ K T QUẾ Ả 10
1 Các phương pháp dự đoán và quy trình cụ thể 10
1.1 Phân l p d liớ ữ ệu 10
1.2 Phân c m d liụ ữ ệu 12
2 Tìm hi u v d liể ề ữ ệu 14
2.1 Phân tính d li ữ ệu 14
2.2 Ti n x lý d liề ử ữ ệu 15
2.3 Phân tách d li ữ ệu 16
3 Th c nghiự ệm 16
3.1 Ki n th c chuyên ngànhế ứ 16
3.2 Bài toán 1: D ự đoán khả năng dự phòng n phợ ải thu khó đòi bị chi ph i b i các công ty ố ở trong gian l n Báo cáo tài chính.ậ 18
3.3 Bài toán 2: Phát hi n gian l n kho n ph i thu cệ ậ ả ả ủa các khách hàng có cùng tính ch t ấ trong báo cáo tài chính 25
3.4 Bài toán 3: Phát hiện các đặc điểm đặ c thù dễ lợi dụng để gian lận trong d li ữ ệu 27
3.5 Bài toán 4: Dự báo nguy cơ gian lận của các báo cáo tài chính 35
CHƯƠNG III: KẾT QU VÀ K T LUẢ Ế ẬN 41
1 Đánh giá kết quả 41
1.1 Bài toán 1 41
1.2 Bài toán 2 41
1.3 Bài toán 3 41
1.4 Bài toán 4 41
2 Kết luận 42
3 Nh ng h n chữ ạ ế 42
Trang 74 Gi i pháp h n chả ạ ế gian l n trong báo cáo tài chínhậ
TÀI LI U THAM KHỆ ẢO 45
Trang 8CHƯƠNG 1: TỔNG QUAN DỰ ÁN
1 Tổng quan về Kiểm toán và Doanh nghiệp
1.1 Khái niệm Báo cáo tài chính
Theo điều 3, Lu t k toán - 2015, ậ ế “Báo cáo tài chính là hệ th ng thông tin kinh ố
t ế, tài chính của đơn vị ế k toán được lập theo biểu mẫu ghi trong chuẩn mực kế toán
và ch ế độ ế k toán Báo cáo tài chính là nh ằm thu th p thông tinậ ph n ánh tình hình tài ảchính, tình hình hoạt động và các lu ng ti n c a m t doanh nghi p, ph c v yêu c u ồ ề ủ ộ ệ ụ ụ ầđiều hành của chủ doanh nghiệp, cơ quan Nhà nước và nhu cầu cần thiết của cá nhân người dùng cho việc đề ra những quyết định kinh tế Báo cáo tài chính cần bao gồm những thông tin sau: Tài s n, N ph i tr và V n ch s h u; Doanh thu, thu nh p ròng, ả ợ ả ả ố ủ ở ữ ậchi phí kinh doanh và chi phí hoạt động; Lãi, l và phân ph i k t qu kinh doanh; Các ỗ ố ế ảluồng ti n Ngoài ra, doanh nghiề ệp cũng giải thích rõ hơn các chỉ tiêu đã thể ệ hi n trên báo cáo tài chính h p nh t và m t s chính sách kợ ấ ộ ố ế toán đã áp dụng trên “Bản thuy t ếminh báo cáo tài chính nh m xác nh n nh ng nghi p v kinh t hình thành, l p và trình ” ằ ậ ữ ệ ụ ế ậbày báo cáo tài chính ”1
1.2 Nghiệp vụ kiểm toán
Kiểm toán là c quá trình tìm kiả ếm và xem xét, đánh giá những b ng ch ng có ằ ứliên quan đến thông tin tài chính của doanh nghiệp, tổ chức nhằm xác định và so sánh mức độ phù hợp giữa các thông tin đó đố ới các chu n mi v ẩ ực đã được thi t l p ế ậKiểm toán viên có vai trò xem xét báo cáo tài chính và xác định s minh b ch ự ạcủa báo cáo tài chính căn cứ trên việc đánh giá đó Kết quả của hoạt động này thể hiện bằng nh n xét và ý ki n cậ ế ủa kiểm toán viên đối với Báo cáo kiểm toán
Báo cáo ki m toán s phân tích các vể ẽ ấn đề ụ ể ễ c th di n ra trên báo cáo tài chính, như việc không thực hiện chuẩn mực, thông tin không đầy đủ, hay có sự hạn chế của
Trang 9quá trình soát xét Trong quá trình soát xét, ki m toán viên s phân tích khể ẽ ả năng phát triển b n v ng c a doanh nghi p ề ữ ủ ệ
Nếu phát hi n có hành vi không tuân th pháp luệ ủ ật theo quy định, ki m toán viên ểphải t cáo v hành vi trên vố ề ới b t kấ ỳ cơ quan nhà nước có th m quy n hay trình báo ẩ ềvới đại diện chủ sở hữu của đơn vị được ki m toán cùng mể ột số đối tượng bên ngoài đơn vị được kiểm toán N u nghi ng có hành vi không tuân th pháp luế ờ ủ ật và quy định, kiểm toán viên s hoàn thành mẽ ột s th tố ủ ục điều tra khác để ch ng minh rõ s nghi ứ ựngờ trên Đây là một trong những trách nhiệm của kiểm toán viên đối với gian lận và sai sót
- Gian lận trên báo cáo tài chính:
Ủy ban Kiểm toán viên nội bộ của M (2004) cho rằỹ ng: Gian l n báo cáo tài ậchính (BCTC) liên quan đến việc lãnh đạo các cấp cố tình trình bày sai hoặc trình bày không thích h p hoợ ặc che đậy nh ng sai phữ ạm liên quan đến BCTC
Trong khi đó, theo Hiệp hội các nhà điều tra gian lận, gian lận trên BCTC là trường h p các thông tin trên BCTC b bóp méo, phản ánh không trung thực tình hình ợ ịtài chính c a doanh nghi p (DN) m t cách c ý nhủ ệ ộ ố ằm lường gạt ngườ ử ụi s d ng thông tin Trong s các hình th c gian l n trên, các nhà nghiên c u t p trung nhi u vào gian ố ứ ậ ứ ậ ềlận v l p BCTC ề ậ
Như vậy, gian lận trên BCTC là sự trình bày sai lệch có chủ định các thông tin trên BCTC, do m t hoộ ặc nhiều người trong Ban Giám đốc công ty, các nhân viên ho c ặbên th ba th c hi n ứ ự ệ
Những dấu hiệu gian lận Báo cáo tài chính bao gồm:
- Doanh thu tăng trưởng cao bất thường so với các công ty cùng ngành nghề
- Lượng hàng bán bị trả lại cao hơn so với các công ty cùng ngành nghề và
so với quá khứ: Bình thường, hàng bán sẽ bị trả lại khi chất lượng kém, không đạt yêu cầu trong hợp đồng đã cam kết Tuy nhiên, một số công ty dùng những khoản này để che đậy các khoản doanh thu ảo được ghi nhận trong kỳ kế toán trước
Trang 10- Giá trị doanh thu của 1 quý cao một cách bất thường so với các quý còn lại và so với cùng ký năm trước: thông qua dấu hiệu này, có thể một số doanh nghiệp
đã thực hiện gian lận ghi nhận doanh thu ảo để đạt được những mục đích khác của công
ty như là niêm yết hoặc chuẩn bị hồ sơ đấu thầu, kêu gọi vốn đầu tư,
- Sự tăng lên trong các khoản phải trả và sự giảm đi trong hàng tồn kho và các khoản phải thu: dấu hiệu này cho thấy sự thu hẹp về quy mô doanh nghiệp, giảm sút về hiệu quả kinh doanh trong khi các khoản chi phí, phải trả lại tăng lên, dự đoán một dấu hiệu bất thường về khả năng chi trả, thanh toán các khoản nợ của doanh nghiệp Ngoài những đặc điểm trên, còn có th ể xác định sai ph m b ng nhi u cách khác ạ ằ ềnhau, nhưng việc áp dụng thực tiễn kiểm toán vào thực tế yêu cầu một nhà nghiên cứu phải tìm được phương pháp để dễ dàng sử dụng và tiếp cận đối với các dự đoán của sự gian l n trên báo cáo tài chính ậ
1.3 Thực trạng gian lận của các công ty hiện nay
Ngày nay, sai ph m báo cáo tài chính trên th gi i nói chung và Vi t Nam nói ạ ế ớ ệriêng đã xuất hiện và đang trở thành vấn đề đáng lưu tâm của cả doanh nghiệp, chính phủ và cộng đồng nhà đầu tư Và trong bố ải c nh ngày nay, quá trình l a ch n thông tin ự ọđăng tải trên báo cáo tài chính đã chứng tỏ vai trò cần thiết cho nhà quản lý và doanh nghiệp Vi t Nam, hiỞ ệ ện tượng cách bi t gi a nhệ ữ ững báo cáo tài chính trước và sau kiểm toán đã tạo thành tâm lý quan ngại Đặc biệt v vi c gian l n báo cáo tài chính g n ụ ệ ậ ầđây của công ty Cổ phần tập đoàn FLC cùng công ty Cổ phần NTACO tại một loạt các công ty thành viên n m trên sàn ch ng khằ ứ oán đã bị phanh phui đã tăng thêm tâm lý nghi ngờ đối với nhà đầu tư sẽ ảnh hưởng tiêu cực hơn cho hoạt động c a thủ ị trường v n ốCác doanh nghi p ngày càng s d ng nhi u th thu t gian l n báo cáo tài chính ệ ử ụ ề ủ ậ ậtinh vi, như là tăng vốn ảo thông qua sử dụng các công ty con còn gọi tắt là SPE, điều chỉnh doanh thu, l i nhu n thông qua SPE, th c hi n các giao d ch khợ ậ ự ệ ị ống để rút ti n ềvay ngân hàng thông qua SPE và còn r t nhi u hình th c gian l n khác ấ ề ứ ậ
Đây là một thực trạng đáng quan ngại mà chúng ta cần ngăn chặn ngay từ bây giờ
Trang 111.4 Yêu cầu của ngành
Trong đạo đức nghề nghiệp, người làm kế toán cũng như kiểm toán phải trung thực, khách quan, thận trọng, bảo mật và đảm bảo năng lực chuyên môn Và công việc của những người làm kiểm toán liên quan đến quyết định kinh tế của rất nhiều người sử dụng thông tin, theo đó yêu cầu đặt ra đối với kiểm toán viên là ngoài các thông tin cần phải công bố theo đúng quy định nghề nghiệp và yêu cầu của pháp luật thì thông tin còn cần phải được bảo mật để bảo vệ quyền lợi doanh nghiệp cũng như các bên liên quan Ngoài ra, xét trên phương diện tổng thể, kiểm toán viên có trách nhiệm đảm bảo hợp lý rằng liệu báo cáo tài chính có còn sai sót trọng yếu do gian lận hoặc nhầm lẫn hay không Nếu phát hiện có hành vi không tuân thủ pháp luật và các quy định, kiểm toán viên phải báo cáo những hành vi này với các cơ quan nhà nước có thẩm quyền, thông báo với đại diện chủ sở hữu của đơn vị được kiểm toán và các đối tượng bên ngoài đơn vị được kiểm toán (nếu có) Đồng thời, kiểm toán viên phải thực hiện các thủ tục kiểm toán bổ sung để làm rõ những nghi ngờ này
2 Lý do chọn đề tài
Trong n n kinh t thề ế ị trường, thông tin, đặc bi t là thông tin v tài chính chi m ệ ề ếphần quan tr ng trong viọ ệc đưa ra các quyết định kinh tế của các nhà đầu tư, các doanh nghiệp Vi c nh ng thông tin bệ ữ ị sai l ch s dệ ẽ ẫn đến nhiều nguy cơ, rủi ro đố ới nhi u i v ềđối tượng sử dụng trong nền kinh tế Vì vậy việc xác thực, minh bạch trong các thông tin tài chính là m t trong nh ng vộ ữ ấn đề được quan tâm hàng đầu
Tại Vi t Nam, hiệ ện nay cũng xảy ra không ít v gian l n trong các báo cáo tài ụ ậchính Việc không phát hiện ra được các sai sót, gian l n này là do nhiậ ều lí do trong đó trách nhi m m t ph n thu c v các ki m toán viên và các công ty ki m toán Tuy nhiên, ệ ộ ầ ộ ề ể ể
vì đây là một lĩnh vực khá mới mẻ đối với nước ta nên trình độ chuyên môn, các kiến thức liên quan đến chuyên ngành cũng như là một số các chu n m c trên th gi i ta v n ẩ ự ế ớ ẫchưa theo kịp Hành lang v pháp lý cho vi c th c hi n ki m toán t i Vi t Nam v n còn ề ệ ự ệ ể ạ ệ ẫnhiều b t c p ấ ậ
Trang 12Về hậu quả mà một sai lầm tỏn báo cáo tài chính để lại đối với các yếu tố không thuộc về công ty như các nhà đầu tư, những người cho vay và cơ quan thuế là rất lớn đối với các nhà đầu tư, khi xuất hiện gian lận báo cáo tài chính thì các nhà đầu tư sẽ đánh giá quá cao hoặc quá thấp nguồn lực của công ty và điều này sẽ gây nên sự e dè cho các nhà đầu tư, gây ảnh hưởng đến khả năng sinh lời và vốn đầu tư Đối với người cho vay, khi việc gian lận báo cáo tài chính dẫn đến việc doanh nghiệp mất khả năng thanh toán nợ điều này sẽ gây tồn đọng những khoản nợ xấu đối với người cho vay, ngân hàng và các tổ chức tín dụng Đối với cơ quan thuế, thì việc gian lận báo cáo tài chính sẽ làm giảm số thuế mà doanh nghiệp phải nộp (thuế thu nhập doanh nghiệp, thuế tiêu thụ đặc biệt, ) gây giảm thu ngân sách quốc gia và ảnh hưởng xấu đến sự tăng trưởng đến tăng trưởng và thu nhập của quốc gia đó
Chung quy lại, việc gian lận báo cáo tài chính đều sẽ gây ra những hậu quả nghiêm trọng cho từng cá nhân tổ chức là nạn nhân và rộng hơn nữa là sự tăng trưởng
và thịnh vượng của quốc gia đó Vì vậy, việc nâng cao chất lượng hoạt động kiểm toán độc lập, tăng cường trách nhiệm lẫn khả năng chuyên môn dành cho các kiểm toán viên trong việc phát hiện những sai sót, gian lận trong báo cáo tài chính là một vấn đề hết sức cấp bách và thời sự nhằm nâng cao tính minh bạch, thông tin đáng tin cậy dành cho các đối tượng sử dụng trong nền kinh tế Dự án tập trung ứng dụng khoa học dữ liệu vào việc phát hiện các sai lầm trong dữ liệu từ các báo cáo tài chính từ đó có thể giúp các toán viên dễ dàng phân tích, dự đoán các hướng đi cũng nhưng khả năng phát triển bền vững của doanh nghiệp
3 M c tiêu nghiên c u ụ ứ
Mục tiêu nghiên cứu của đề tài tương ứng với b n bài toán c n gi i quy t ố ầ ả ế
❖ Bài toán 1: D ự đoán kh ả năng khoản dự phòng n phợ ải thu khó đòi bị chi phối bởi các công ty trong gian l n Báo cáo tài chính ậ
❖ Bài toán 2: Phát hi n gian l n kho n ph i thu c a các khách hàng có cùng ệ ậ ả ả ủtính ch t trong Báo cáo tài chính ấ
❖ Bài toán 3: Phát hiện các đặc điểm đặc thù d l i dễ ợ ụng để gian l n trong ậ
dữ li u ệ
Trang 13❖ Bài toán 4: D ự báo nguy cơ gian lận c a các báo cáo tài chính ủ
4 Đối tượng nghiên c u ứ
Dự án c a nhóm chúng tôi nh m nghiên c u v Gian l n trong báo cáo tài chính ủ ằ ứ ề ậcủa các công ty được niêm yết trên th ị trường ch ng khoán Vi t Nam ứ ệ
5 Mô t d li u và c u trúc d li u ả ữ ệ ấ ữ ệ
Nguồn d li u mà nhóm thu th p phữ ệ ậ ục vụ cho nghiên c u: ứ
• Bộ d li u v thanh toán tài chính D báo khữ ệ ề – ự ả năng thanh toán khoản ph i thu: ả https://www.kaggle.com/datasets/hhenry/finance-factoring-ibm-late-payment-histories
• Bộ d li u dữ ệ ự đoán khả năng gian lận trong Báo cáo tài chính c a ủKiểm toán: https://archive.ics.uci.edu/ml/datasets/Audit+Data
Hai b d liộ ữ ệu được lấy t Kaggle và UCI, là nh ng ngu n thu thừ ữ ồ ập đáng tin cậy được dùng trong nghiên c u và h c t p Nhóm s d ng b d li u th nhứ ọ ậ ử ụ ộ ữ ệ ứ ất để gi i quy t ả ếhai bài toán 1 và 2, đối với bộ dữ liệu thứ 2 dùng nó vào giải quyết bài toán 3 và 4 Từ việc ng d ng b d li u vào gi i quyứ ụ ộ ữ ệ ả ết bài toán đặt ra, chúng ta có th thể ấy được mối tương quan giữa Khoản d phòng n ph i thu ự ợ ả khó đòi ới Gian l n trong Báo cáo v ậ
tài chính và đưa ra kết luận cuối cùng cho bài Dự án nghiên cứu của nhóm
1 Country Code Mã s quố ốc gia Số nguyên
2 Customer ID Mã khách hàng Chuỗi ký t ự
Trang 143 Paperless Date Ngày không cần gi y t ấ ờ Ngày tháng
4 Invoice Number Số hiệu hóa đơn Số nguyên
5 Invoice Date Ngày trên hóa đơn Ngày tháng
6 Due Date Ngày đáo hạn thanh toán Ngày tháng
7 Invoice Amount Số tiền hóa đơn – Giá trị thanh toán Số nguyên
8 Disputed Tranh chấp:
Khoản phải thu này có được tr ả đúng thời h n hay không, n u x y ra tranh ạ ế ảchấp ph i l p 1 kho n d phòng cho ả ậ ả ựkhoản ph i thu này ả
Có ho c Không ặ(Yes or No)
9 Settled Date Ngày giải quy t ế Ngày tháng
10 Paperless Bill Hóa đơn không giấy tờ Chuỗi ký t ự
11 Days To Settle Thời gian gi i quy t ả ế Số nguyên
12 Days Late Số ngày tr h n thanh toán ễ ạ Số nguyên
B ảng 1 1: B ng mô t c u trúc c a b d li u Account Receivable Prediction ả ả ấ ủ ộ ữ ệ
Số không nguyên
LOCATION_ID ID duy nhất của công ty Số thực
PARA_A
Sự khác biệt được tìm thấy trong
kế hoạch kiểm tra và báo cáo tóm tắt của A Số không nguyên Score_A Điểm của A Số không nguyên Risk_A Rủi ro của A Số không nguyên
Trang 15PARA_B
Sự khác biệt được tìm thấy trong
kế hoạch kiểm tra và báo cáo tóm tắt của B Số không nguyên Score_B Điểm của B Số không nguyên Risk_B Rủi ro của B Số không nguyên
TOTAL Tổng số lượng chênh lệch được
tìm thấy trong các báo cáo khác Số không nguyên numbers Những khác biệt trong lịch sử Số thực Score_B Điểm của B Số không nguyên Risk_C Rủi ro của C Số không nguyên Money_Value Gía trị tiền Số không nguyên Score_MV Điểm của MV Số không nguyên Risk_D Rủi ro của D Số không nguyên District_Loss Dữ liệu của quận bị mất Số thực PROB Vấn đề Số không nguyên Risk_E Rủi ro của E Số không nguyên History Lịch sử Có hoặc không Prob Vấn đề Số không nguyên Risk_F Rủi ro của F Số không nguyên Score Điểm số Số không nguyên
Trang 16Inherent_Risk Rủi ro tiềm tàng Số không nguyên CONTROL_RISK Rủi ro kiểm soát Số không nguyên Detection_Risk Rủi ro phát hiện Số không nguyên Audit_Risk Rủi ro kiểm toán Số không nguyên Risk Rủi ro Có hoặc không
B ảng 1 2: B ng mô t c u trúc c a b d li u Audit risk ả ả ấ ủ ộ ữ ệ
Audit Risk = Inherent Risk × Control Risk × Detection Risk (%)
Trang 17CHƯƠNG II: QUY ĐỊNH THỰC HIỆN VÀ KẾT
Phương pháp hồi quy logistic (Logistic Regression)
Phương pháp hồi quy logistic là một phương pháp dựa vào xác suất để ểm đị ki nh tính hi u qu c a các mô hình phân lo i d liệ ả ủ ạ ữ ệu mang tính đặc thù Là mô hình d cài ễ
đặt, dễ huấn luyện, phân loại nhanh và dễ diễn giải kết quả ( tuy nhiên ch áp dụng v i ỉ ớcác bi n r i r c) ế ờ ạ
Hình 2 1: Minh ho ạ phương pháp hồi quy Losgistic
Trang 18Phương pháp SVM (Support Vector Machine)
Đây là một thuật toán chuyên sâu được giám sát để phân loại hoặc h i quy các ồnhóm d li u Trong trí tu nhân t o và h c máy, m t h th ng hữ ệ ệ ạ ọ ộ ệ ố ọc có giám sát được cung c p d liấ ữ ệu đầu vào và đầu ra và được gắn nhãn để phân lo i S phân lo i này ạ ự ạcung cấp cơ sở nghiên c u cho vi c x lý d liứ ệ ử ữ ệu trong tương lại Máy vecto h tr ỗ ợđược sử dụng để ếp hạng hai bộ dữ liệu vào các danh m x ục tương tự nhau Thuật toán
vẽ các đường siêu ph ng trong không gian nhi u chiẳ ề ều để tách nhóm theo chế độ
Phương pháp Neural Network
Đây là chuỗi thuật toán nhằm tìm kiếm quan hệ trong tập hợp dữ liệu hệ thống dựa theo cách thức hoạt động não bộ con người
Hình 2 2: Minh ho ạ phương pháp SVM (Support Vector Machine)
Trang 19Hình 2 3: Minh ho ạ phương pháp Neural Network
• Nhiệm vụ chính là tìm và đo lường s khác bi t giự ệ ữa các đối tượng d li u ữ ệ
• Phân c m thuụ ộc nhóm phương pháp học không giám sát, do không bi t ếtrước số ợlư ng nhóm (khác v i bài toán phân l p) ớ ớ
Thuật toán K-means: Thu c nhóm thu t toán phân c m dộ ậ ụ ựa trên phân hoạch
Trang 20Hình 2 4: Minh ho v thu t toán K-Means ạ ề ậ
Các bước quy trình c a K-means ủ
Bước 1: Xử lý dữ liệu: Loại bỏ các hàng có dữ liệu bị khuyết
Bước 2: Chọn k điểm bất kỳ làm các trung tâm ban đầu của k cụm
Bước 3: Phân mỗi điểm dữ liệu vào cụm có trung tâm gần nó nhất Nếu các điểm
dữ liệu ở từng cụm vừa được phân chia không thay đổi so với kết quả của lần phân chia trước nó thì ta dừng thuật toán
Bước 4: Cập nhật lại trung tâm cho từng cụm: Lấy trung bình cộng của tất các các điểm dữ liệu đã được gán vào cụm đó sau khi phân chia ở bước 2
Bước 5: Quay lại bước 2
Các bước quy trình của SVM, NN, LR:
Bước 1: Nhập dữ liệu cần huấn luyện vào orange
Bước 2: Nối widget dữ liệu huấn luyện và SVM, NN, LR với Test and score, sau
đó nối widget vào Confusion Matrix để thực hiện đánh giá kết quả và đánh giá ma trận nhầm lẫn
Trang 21Bước 3: Sau khi chọn được phương pháp dự báo tốt nhất, nối dữ liệu huấn luyện vào SVM, hoặc NN, hoặc LR Đồng thời nhập dữ liệu dùng để dự báo vào orange Bước 4: Liên kết phương pháp dự báo tốt nhất và dữ liệu dự báo với Predictions
để đánh giá và phân loại dữ liệu đầu vào
Bước 5: Xuất kết quả dự báo bằng Data Table
2 Tìm hi u v d li u ể ề ữ ệ
2.1 Phân tính d li u ữ ệ
Đối với bộ dữ liệu Audit risk:
+ Mỗi hàng đại diện cho một doanh nghiệp và mỗi cột chứa các thuộc tính khác nhau của đối tượng
+ Dữ liệu thô chứa 776 hàng (đối tượng) và 25 cột (đặc trưng)
+ Trong bảng dữ liệu về các thuộc tính, nhóm nhận thấy rằng 5 thuộc tính chính,
có ảnh hưởng lớn đến việc phân tích nguy cơ gian lận của một số doanh nghiệp: Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Detection_Risk (Rủi
ro phát hiện), Audit_Risk (Rủi ro kiểm toán), Risk (Nguy cơ gian lận)
Trong đó Audit_Risk = Inherent Risk x Control Risk x Detection Risk vì vậy Audit risk là target (biến phụ thuộc) sẽ ảnh hưởng phần lớn đến nguy cơ doanh nghiệp
có gian lận (Risk1) hoặc không gian lận (Risk0)
Ta có thể thấy từ bộ dữ liệu, nhóm doanh nghiệp có nguy cơ gian lận trong kiểm toán khi nhóm doanh nghiệp đó có chỉ số của những biến Audit risk càng cao (lớn hơn 1) Mặt khác, các chỉ số càng nhỏ (bé hơn 1) thì doanh nghiệp không có nguy cơ gian lận
Đối với bộ dữ liệu Account Receivable Prediction
Trang 22+ Mỗi hàng đại diễn cho 1 đơn vị, khoản lập dự phòng phải thu và mỗi cột chứa
các thuộc tính khác nhau của đối tượng
+ Dữ liệu thô chứa 2466 hàng (đối tượng) và 12 cột (đặc trưng)
+ Mỗi đơn vị bao gồm những thuộc tính Disputed, Invoice Date, Due Date, Settled Date, country Code, customer ID, paperless Date, invoice Number, Invoice Amount, Paperless Bill, DaysToSettle, DaysLate thể hiện thông tin chi tiết về khoản lập
bỏ qua bước tiền x lý d liử ữ ệu đố ớ ộ d li u này i v i b ữ ệ
Đố ới b d li u Account Receivable Prediction do d li u khá l n và m t s i v ộ ữ ệ ữ ệ ớ ộ ố
dữ li u b thi u ho c b m t, chính vì vệ ị ế ặ ị ấ ậy nhóm đã dùng chức năng preprocessing đểxoá b các hàng có chị ứa các dữ ệ li u b m t ị ấ
Hình 2 5: Mô t x lí d li u b m t ả ử ữ ệ ị ấ
Trang 232.3 Phân tách d li u ữ ệ
- Trong bài nghiên cứu, nhóm đã sử dụng công cụ Data Sampler để tách dữ liệu gốc t 2 bừ ộ d liữ ệu “Audit_risk” và “Account Receivable Prediction” thành hai file riêng bi t: 70% c a m i b d liệ ủ ỗ ộ ữ ệu đượ ử ụng đểc s d làm d li u m u cho mô hình phân ữ ệ ẫlớp d li u, 30% c a d li u còn l i cữ ệ ủ ữ ệ ạ ủa mỗ ộ được dùng trong dự báo i b
Trang 24nguyên tắc kế toán trong hệ thống kế toán theo VAS(chuẩn mực kế toán Việt Nam) như thận trọng, trọng yếu
Hai là, sử dụng các công thức sử dụng trong Bảng cân đối kế toán:
Tài sản = Nợ phải trả + Vốn Chủ sở hữu
Khoản phải thu thuần = Khoản phải thu – Dự phòng phải thu khó đòiNgày nay, các thủ thuật gian lận trong Báo cáo tài chính ngày càng nhiều, thủ thuật và tinh vi hơn các công ty thường sử dụng một số cách như ghi nhận sai doanh thu, che dấu các công nợ và chi phí, nhằm một số mục đích như thu hút đầu tư, trốn thuế…., và một trong những yếu tố quan trọng mà nhóm nhắc đến ở đây là khoản Dự phòng các khoản phải thu, thông thường vào cuối năm các công ty sẽ lập các khoản
dự phòng phải thu khó đòi, và một số doanh nghiệp sẽ định giá cao nợ phải thu khó đòi
=> Số thực tế phải thu thấp hơn, tăng chi phí => Tài sản công ty thấp hơn so với thực
tế và làm giảm vốn chủ sở hữu, bên cạnh đó làm thu nhập trước thuế thấp hơn, gây ra khả năng cao các doanh nghiệp trốn thuế Các doanh nghiệp còn dùng cách này để điều khiển thu nhập sau thuế theo nhịp độ tăng dần đều để khiến cho các nhà đầu tư thấy rằng công ty đang phát triển rõ rệt
Như vậy, nhóm sẽ thực hiện phân nhóm giữa các khách hàng có cùng tính chất
và so sánh các chỉ tiêu với nhau thông qua chạy mô hình trên phần mềm Orange để từ
đó cho thấy ảnh hưởng của Khoản phải thu trong Báo cáo tài chính
Ba là, ằng cách vận dụng các kiến thức đã học và kiến thức vế kế toán – bkiểm toán xem xét các hành vi gian lận trong việc làm sai lệch kết quả báo cáo tài chính, nhận biết được Rủi ro kiểm toán và các yếu tố ảnh hưởng đến nó
Audit Risk (Rủi ro kiểm toán): làrủi ro do quá trình kiểm tra và đánh giá, đưa
ra ý kiến của kiểm toán viên không phản ánh đúng hay sai lệch khi Báo cáo tài chính được kiểm toán mà còn chứa đựng những sai sót trọng yếu.”
Audit Risk = Inherent Risk × Control Risk × Detection Risk
Trang 25Trong những cột dữ liệu về những thuộc tính, nhóm cho rằng 5 thuộc tính chính, tổng hợp từ những đặc trưng còn lại, có ảnh hưởng lớn đến việc phân tích nguy cơ gian lận của các doanh nghiệp: Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm
soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk (Rủi ro kiểm toán) (Với Audit
Risk = Inherent Risk × Control Risk × Detection Risk) là yếu tố quan trọng quyết
định đến Risk, Risk (Nguy cơ gian lận) cho kết quả Risk (1) nguy cơ doanh nghiệp có gian lận và Risk (0) nguy cơ doanh nghiệp không gian lận
Nhìn chung từ bộ dữ liệu, hầu hết nhóm doanh nghiệp có chỉ số của những biến, InherentRisk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Detection_Risk (Rủi
ro phát hiện), Audit_Risk càng nhỏ (bé hơn 1) thì đa số kết quả của biến Risk là 0 (doanh nghiệp không có nguy cơ gian lận) Ngược lại, chỉ số biến Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk của nhóm doanh nghiệp thể hiện trên bộ dữ liệu càng cao (lớn hơn 1) thì kết quả xảy ra
ở biến Risk là 1 (doanh nghiệp có nguy cơ gian lận)
Ngoài các thu c tính chính trên còn có các thuộ ộc tính sau cũng không kém phần quan tr ng trong kiọ ểm tra và đánh giá việc gian l n trong ki m toán: ậ ể Numbers (Giá tr ị khác bi t l ch s ), District Lossệ ị ử (Tổn thất mà doanh nghiệp trong quận phải chịu trong
10 năm qua), Money value (Số tiền của những sai phạm của kiểm toán trong quá khứ…
Và thông qua các đặc thù tác động yếu tố rủi ro sẽ giúp cho doanh nghiệp có cách nhìn khách quan hơn và đưa ra các giải pháp nhằm hạn chế rủi ro gian lận trong kiểm toán V r i ro gian l n trong ki m toán, không chể ủ ậ ể ỉ ph thu c vào m t thu c tính ụ ộ ộ ộduy nhất như Audit_Risk mà bởi tất cả những thuộc tính được đưa ra, ngoài ra còn có những yếu tố ngoại cảnh mà dữ liệu không thể cho thấy
3.2 Bài toán 1: D ự đoán khả năng dự phòng n phợ ải thu khó đòi bị chi ph i ố
bởi các công ty trong gian l n Báo cáo tài chính ậ
a) Mô t bài toánả
Gian lận trên Báo cáo tài chính là trường hợp các thông tin được đưa ra trên bản báo cáo tài chính b bóp méo, ph n ánh không trung th c tình hình tài chính m t cách ị ả ự ộ
Trang 26cố ý nh m l a gằ ừ ạt ngườ ử ụi s d ng thông tin Nh m mằ ục đích trụ ợ ủc l i c a mình, m t s ộ ốcông ty đã sử dụng một số thủ thuật như: che dấu công nợ, chi phí; ghi nhận doanh thu không có th t hay khai kh ng doanh thu (l p ch ng t gi mậ ố ậ ứ ừ ả ạo); định giá sai tài sản… Tại đây, nhóm đề cập t i ớ khoản d phòng ph i thu n ự ả ợ khó đòi – khoản dự phòng này được ghi nh n b i tài kho n 2293 (D phòng phậ ở ả ự ải thu khó đòi) đồng thời tài kho n 642 ả(Chi phí qu n lý doanh nghi p) Có th nh n th y, vi c l p d phòng m t kho n n ph i ả ệ ể ậ ấ ệ ậ ự ộ ả ợ ảthu sẽ tác động t i ớ hai y u tế ố Tài sản và Chi phí trong Báo cáo tài chính Vi c c ý ệ ốlàm trái quy định v vi c ghi nh n Kho n d phòng phề ệ ậ ả ự ải thu khó đòi tạo nên tình trạng phóng đại doanh thu và lờ đi khoản chi phí hoặc ngược lại, khiến Lợi nhuận trước và sau thuế c a công ty b thao túng Tủ ị ừ đó, những ngườ ử ụi s d ng b n báo cáo tài chính ảcủa nh ng doanh nghiữ ệp này để có cái nhìn t ng quát cho mổ ục đích đầu tư, quản tr s ị ẽ
có đánh giá lệch chu n và bất l i ẩ ợ
Vậy nên, ở đây nhóm sử ụ d ng b d li u: ộ ữ ệ Khoản thanh toán tài chính L ch s – ị ử
thanh toán tr c a IBM D li u tài kho n ph i thu D báo khách hàng thanh toán ễ ủ ữ ệ ả ả – ự
nhanh nh t ấ để xem xét khả năng sai sót trong dự báo kho n phả ải thu khó đòi của các công ty
b) Ch y mô hình và k t qu ạ ế ả
- Xây d ng mô hình ự
Sau bước xử lý tiền dữ liệu (Chọn thuộc tính Disputed làm biến phụ thuộc ử , x
lý d li u khuy t thi u, phân tách d li u t o hai bữ ệ ế ế ữ ệ ạ ộ để làm d li u hu n luy n và d ữ ệ ấ ệ ữliệu d báo), chúng ta ti n hành phân lự ế ớp d liữ ệu để ự d báo nh ng khách hàng nào s ữ ẽ
có khoản phải thu khó đòi
Tại đây chúng ta sử ụng 3 phương pháp Hồ d i quy logistic (Logistic Regression), Support Vector Machine (SVM), Neural Network để đánh giá xem phương pháp nào hiệu qu nh t và ng dả ấ ứ ụng nó d báo ự