Dự án kết thúc học phần bộ môn khoa học dữ liệu đề tài vận dụng thực tiễn vấn đề lập dự phòng nợ khó đòi trong gian lận báo cáo tài chính

52 1 0
Dự án kết thúc học phần  bộ môn khoa học dữ liệu đề tài vận dụng thực tiễn vấn đề lập dự phòng nợ khó đòi trong gian lận báo cáo tài chính

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Ngoài những đặc điểm trên, còn có th ể xác định sai ph m b ng nhi u cách khác ạ ằ ề nhau, nhưng việc áp dụng thực tiễn kiểm toán vào thực tế yêu cầu một nhà nghiên cứu phải tìm được phươ

Trang 1

ĐẠI HỌC UEH

TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ

đòi trong gian lận báo cáo tài chính

Giảng viên giảng dạy : ThS Nguy n M nh Tuễ ạ ấn Ngô Nhung Huy n ề Dương Công Quyết

Nguyễn Văn Quang Phú

Thành ph H ố ồ Chí Minh, ngày 18 tháng 12 năm 2022

Trang 2

LỜI CẢM ƠN

Chúng em muốn gửi lời cảm ơn chân thành nhất đến Ths Nguyễn Mạnh Tuấn Thầy là người đã giúp chúng em tiếp cận và hiểu rõ hơn về bộ môn Khoa học dữ liệu

Th y ầ đã giúp chúng em tích lũy thêm nhiều kiến thức, làm cơ sở để hoàn thành d án này Cự ảm ơn thầy đã luôn tận tình hướng d n, ch b o chúng em cách ẫ ỉ ả thức để thực hiện dự án, để chúng em hoàn thành t t d án này ố ự

Đặc bi t, nh s gi ng d y nhi t tình và tâm huy t c a th y trong su t quá ệ ờ ự ả ạ ệ ế ủ ầ ố trình học, chúng em đã họ ập và được t c ti p c n v i các ph n m m thú vế ậ ớ ầ ề ị như Word, Excel, Orange… Chúng em tin chắ ằng, đây sẽc r là nh ng hành trang vô ữ cùng b ích cho ngh nghi p c a chúng em sau này M t l n n a, chúng em xin ổ ề ệ ủ ộ ầ ữ gửi l i chân thành nhờ ất đến th y ầ

Và cuối cùng, là những sinh viên năm hai - chưa có nhiều kinh nghiệm trong làm dự án Do vậy, bài báo cáo cũng không tránh khỏi sai sót Nên nhờ thầy bổ sung, sửa chữa những sai sót để chúng em có thể hoàn thành tốt hơn ở những bài báo cáo tiếp theo

Trang 3

NHẬN XÉT CỦA GIẢNG VIÊN

Nguyễn Phước Thiện 31211022161 100%

Nguyễn Vũ Nhật Hạ 31211024580 100%

Nguyễn Văn Quang Phú 31211024708 100%

Ngô Nhung Huyền 31211022916 100%

Dương Công Quyết 31211022149 100%

Trang 4

DANH M C B NG BI U, HÌNH NH MINH HO ỤẢỂẢẠ

BẢNG BIỂU

Bảng 1 1: B ng mô t c u trúc c a b d li u Account Receivable Prediction 7 ả ả ấ ủ ộ ữ ệ Bảng 1 2: B ng mô t c u trúc c a b d li u Audit risk 9 ả ả ấ ủ ộ ữ ệ

HÌNH NH

Hình 2 1: Minh ho ạ phương pháp hồi quy Losgistic 10

Hình 2 2: Minh ho ạ phương pháp SVM (Support Vector Machine) 11

Hình 2 3: Minh ho ạ phương pháp Neural Network 12

Hình 2 4: Minh ho v thu t toán K-Means 13ạ ề ậ Hình 2 5: Mô t x lí d li u b m t 15ả ử ữ ệ ị ấ Hình 2 6: Mô t phân tách b d li u 16ả ộ ữ ệ Hình 2 7: Mô hình xây d ng Bài toán 1 20ự Hình 2 8: K t qu ế ả đánh giá Bài toán 1 theo Logistic Regression 21

Hình 2 9: K t qu ế ả đánh giá Bài toán 1 theo Neural Network 22

Hình 2 10: K t qu ế ả đánh giá Bài toán 1 theo SVM 22

Hình 2 11: K t qu ế ả đánh giá Bài toán 1 và quyết định chọn phương pháp nghiên cứu 23

Hình 2 12: K t qu d báo c a Bài toán 1 t Prediction 24ế ả ự ủ ừ Hình 2 13: K t qu d báo v kho n ph i thu Bài toán 1 25ế ả ự ề ả ả Hình 2 14: Mô hình xây d ng Bài toán 2 26ự Hình 2 15: K t qu nghiên c u Bài toán 2 26ế ả ứ Hình 2 16 Mô hình xây d ng Bài toán 3 28ự Hình 2 17: Biểu đồ ự: s chênh l ch giệ ữa báo cáo điều tra và báo cáo tóm t t A 29ắ Hình 2 18: S chênh l ch giự ệ ữa báo cáo điều tra và báo cáo tóm t t B 29ắ Hình 2 19: S ự tương quan giữa giá tr r i ro và chênh l ch c a báo cáo A 30ị ủ ệ ủ Hình 2 20: S ự tương quan giữa giá tr r i ro và chênh l ch c a báo cáo B 30ị ủ ệ ủ Hình 2 21: Biểu đồ 5: T ng s ổ ố lượng khác bi t c a các báo cáo khác 31ệ ủ Hình 2 22: Biểu đồ 6: Giá tr khác bi t l ch s 32ị ệ ị ử Hình 2 23: Biểu đồ 7: Ch s tiỉ ố ền liên quan đến sai sót 32 Hình 2 24 B qua các thu c tính khác ngo i tr Audit risk 33ỏ ộ ạ ừ Hình 2 25 Hình nh minh h a tìm k t qu có Audit risk > 1 34ả ọ ế ả

Trang 5

Hình 2 26 K t qu Risk khi Audit risk > 1 34ế ả Hình 2 27: T ng h p biổ ợ ểu đồInherent_Risk, CONTROL_Risk, Detection_Risk, Audit_risk 35 Hình 2 28 K t qu Mô hình quy trình bài toán 35ế ả Hình 2 29: K t qu Test and Score 36ế ả Hình 2 30: B ng k t qu c a ả ế ả ủ Confusion Matrix theo phương pháp Logistic Regression 37 Hình 2 31: B ng k t qu c a Confusion ả ế ả ủ Matrix theo phương pháp SVM 38 Hình 2 32: B ng k t qu cả ế ả ủa Confusion Matrix theo phương pháp Neutral Network 38 Hình 2 33: B ng k t qu d báo 39ả ế ả ự Hình 2 34: Bảng kết quả dự báo 40

Trang 6

MỤC L C

CHƯƠNG 1: TỔNG QUAN DỰ ÁN 1

1 Tổng quan về Kiểm toán và Doanh nghiệp 1

1.1 Khái niệm Báo cáo tài chính 1

1.2 Nghiệp vụ kiểm toán 1

1.3 Thực trạng gian lận của các công ty hiện nay 3

2 Lý do chọn đề tài 4

3 M c tiêu nghiên cứu 5

4 Đối tượng nghiên cứu 6

5 Mô t d li u và c u trúc d liả ữ ệ ấ ữ ệu 6

CHƯƠNG II: QUY ĐỊNH THỰC HIỆN VÀ K T QUẾ Ả 10

1 Các phương pháp dự đoán và quy trình cụ thể 10

3.2 Bài toán 1: D ự đoán khả năng dự phòng n phải thu khó đòi bị chi ph i b i các công ty ố ở trong gian l n Báo cáo tài chính.ậ 18

3.3 Bài toán 2: Phát hi n gian l n kho n ph i thu cệ ậ ả ả ủa các khách hàng có cùng tính ch t trong báo cáo tài chính 25

3.4 Bài toán 3: Phát hiện các đặc điểm đặc thù dễ lợi dụng để gian lận trong d liữ ệu 27

3.5 Bài toán 4: Dự báo nguy cơ gian lận của các báo cáo tài chính 35

Trang 7

4 Gi i pháp h n chả ạ ế gian l n trong báo cáo tài chính

TÀI LI U THAM KHẢO 45

Trang 8

CHƯƠNG 1: TỔNG QUAN DỰ ÁN 1 Tổng quan về Kiểm toán và Doanh nghiệp

1.1 Khái niệm Báo cáo tài chính

Theo điều 3, Lu t k toán - 2015, ậ ế “Báo cáo tài chính là hệ th ng thông tin kinh

tế, tài chính của đơn vị ế k toán được lập theo biểu mẫu ghi trong chuẩn mực kế toán và ch ế độ ế k toán Báo cáo tài chính là nhằm thu th p thông tinậ ph n ánh tình hình tài ả chính, tình hình hoạt động và các lu ng ti n c a m t doanh nghi p, ph c v yêu c u ồ ề ủ ộ ệ ụ ụ ầ điều hành của chủ doanh nghiệp, cơ quan Nhà nước và nhu cầu cần thiết của cá nhân người dùng cho việc đề ra những quyết định kinh tế Báo cáo tài chính cần bao gồm những thông tin sau: Tài s n, N ph i tr và V n ch s h u; Doanh thu, thu nh p ròng, ả ợ ả ả ố ủ ở ữ ậ chi phí kinh doanh và chi phí hoạt động; Lãi, l và phân ph i k t qu kinh doanh; Các ỗ ố ế ả luồng ti n Ngoài ra, doanh nghiề ệp cũng giải thích rõ hơn các chỉ tiêu đã thể ệ hi n trên báo cáo tài chính h p nh t và m t s chính sách kợ ấ ộ ố ế toán đã áp dụng trên “Bản thuy t ế minh báo cáo tài chính nh m xác nh n nh ng nghi p v kinh t hình thành, l p và trình ” ằ ậ ữ ệ ụ ế ậ bày báo cáo tài chính ”1

1.2 Nghiệp vụ kiểm toán

Kiểm toán là c quá trình tìm kiả ếm và xem xét, đánh giá những b ng ch ng có ằ ứ liên quan đến thông tin tài chính của doanh nghiệp, tổ chức nhằm xác định và so sánh mức độ phù hợp giữa các thông tin đó đố ới các chu n mi v ẩ ực đã được thi t l p ế ậ

Kiểm toán viên có vai trò xem xét báo cáo tài chính và xác định s minh b ch ự ạ của báo cáo tài chính căn cứ trên việc đánh giá đó Kết quả của hoạt động này thể hiện bằng nh n xét và ý ki n cậ ế ủa kiểm toán viên đối với Báo cáo kiểm toán

Báo cáo ki m toán s phân tích các vể ẽ ấn đề ụ ể ễ c th di n ra trên báo cáo tài chính, như việc không thực hiện chuẩn mực, thông tin không đầy đủ, hay có sự hạn chế của

Trang 9

quá trình soát xét Trong quá trình soát xét, ki m toán viên s phân tích khể ẽ ả năng phát triển b n v ng c a doanh nghi p ề ữ ủ ệ

Nếu phát hi n có hành vi không tuân th pháp luệ ủ ật theo quy định, ki m toán viên ể phải t cáo v hành vi trên vố ề ới b t kấ ỳ cơ quan nhà nước có th m quy n hay trình báo ẩ ề với đại diện chủ sở hữu của đơn vị được ki m toán cùng mể ột số đối tượng bên ngoài đơn vị được kiểm toán N u nghi ng có hành vi không tuân th pháp luế ờ ủ ật và quy định, kiểm toán viên s hoàn thành mẽ ột s th tố ủ ục điều tra khác để ch ng minh rõ s nghi ứ ự ngờ trên Đây là một trong những trách nhiệm của kiểm toán viên đối với gian lận và sai sót

- Gian lận trên báo cáo tài chính:

Ủy ban Kiểm toán viên nội bộ của M (2004) cho rằỹ ng: Gian l n báo cáo tài ậ chính (BCTC) liên quan đến việc lãnh đạo các cấp cố tình trình bày sai hoặc trình bày không thích h p hoợ ặc che đậy nh ng sai phữ ạm liên quan đến BCTC

Trong khi đó, theo Hiệp hội các nhà điều tra gian lận, gian lận trên BCTC là trường h p các thông tin trên BCTC b bóp méo, phản ánh không trung thực tình hình ợ ị tài chính c a doanh nghi p (DN) m t cách c ý nhủ ệ ộ ố ằm lường gạt ngườ ử ụi s d ng thông tin Trong s các hình th c gian l n trên, các nhà nghiên c u t p trung nhi u vào gian ố ứ ậ ứ ậ ề lận v l p BCTC ề ậ

Như vậy, gian lận trên BCTC là sự trình bày sai lệch có chủ định các thông tin trên BCTC, do m t hoộ ặc nhiều người trong Ban Giám đốc công ty, các nhân viên ho c ặ bên th ba th c hi n ứ ự ệ

Những dấu hiệu gian lận Báo cáo tài chính bao gồm:

- Doanh thu tăng trưởng cao bất thường so với các công ty cùng ngành nghề - Lượng hàng bán bị trả lại cao hơn so với các công ty cùng ngành nghề và so với quá khứ: Bình thường, hàng bán sẽ bị trả lại khi chất lượng kém, không đạt yêu cầu trong hợp đồng đã cam kết Tuy nhiên, một số công ty dùng những khoản này để che đậy các khoản doanh thu ảo được ghi nhận trong kỳ kế toán trước

Trang 10

- Giá trị doanh thu của 1 quý cao một cách bất thường so với các quý còn lại và so với cùng ký năm trước: thông qua dấu hiệu này, có thể một số doanh nghiệp đã thực hiện gian lận ghi nhận doanh thu ảo để đạt được những mục đích khác của công ty như là niêm yết hoặc chuẩn bị hồ sơ đấu thầu, kêu gọi vốn đầu tư,

- Sự tăng lên trong các khoản phải trả và sự giảm đi trong hàng tồn kho và các khoản phải thu: dấu hiệu này cho thấy sự thu hẹp về quy mô doanh nghiệp, giảm sút về hiệu quả kinh doanh trong khi các khoản chi phí, phải trả lại tăng lên, dự đoán một dấu hiệu bất thường về khả năng chi trả, thanh toán các khoản nợ của doanh nghiệp Ngoài những đặc điểm trên, còn có th ể xác định sai ph m b ng nhi u cách khác ạ ằ ề nhau, nhưng việc áp dụng thực tiễn kiểm toán vào thực tế yêu cầu một nhà nghiên cứu phải tìm được phương pháp để dễ dàng sử dụng và tiếp cận đối với các dự đoán của sự gian l n trên báo cáo tài chính ậ

1.3 Thực trạng gian lận của các công ty hiện nay

Ngày nay, sai ph m báo cáo tài chính trên th gi i nói chung và Vi t Nam nói ạ ế ớ ệ riêng đã xuất hiện và đang trở thành vấn đề đáng lưu tâm của cả doanh nghiệp, chính phủ và cộng đồng nhà đầu tư Và trong bố ải c nh ngày nay, quá trình l a ch n thông tin ự ọ đăng tải trên báo cáo tài chính đã chứng tỏ vai trò cần thiết cho nhà quản lý và doanh nghiệp Vi t Nam, hiỞ ệ ện tượng cách bi t gi a nhệ ữ ững báo cáo tài chính trước và sau kiểm toán đã tạo thành tâm lý quan ngại Đặc biệt v vi c gian l n báo cáo tài chính g n ụ ệ ậ ầ đây của công ty Cổ phần tập đoàn FLC cùng công ty Cổ phần NTACO tại một loạt các công ty thành viên n m trên sàn ch ng khằ ứ oán đã bị phanh phui đã tăng thêm tâm lý nghi ngờ đối với nhà đầu tư sẽ ảnh hưởng tiêu cực hơn cho hoạt động c a thủ ị trường v n ố

Các doanh nghi p ngày càng s d ng nhi u th thu t gian l n báo cáo tài chính ệ ử ụ ề ủ ậ ậ tinh vi, như là tăng vốn ảo thông qua sử dụng các công ty con còn gọi tắt là SPE, điều chỉnh doanh thu, l i nhu n thông qua SPE, th c hi n các giao d ch khợ ậ ự ệ ị ống để rút ti n ề vay ngân hàng thông qua SPE và còn r t nhi u hình th c gian l n khác ấ ề ứ ậ

Đây là một thực trạng đáng quan ngại mà chúng ta cần ngăn chặn ngay từ bây giờ

Trang 11

1.4 Yêu cầu của ngành

Trong đạo đức nghề nghiệp, người làm kế toán cũng như kiểm toán phải trung thực, khách quan, thận trọng, bảo mật và đảm bảo năng lực chuyên môn Và công việc của những người làm kiểm toán liên quan đến quyết định kinh tế của rất nhiều người sử dụng thông tin, theo đó yêu cầu đặt ra đối với kiểm toán viên là ngoài các thông tin cần phải công bố theo đúng quy định nghề nghiệp và yêu cầu của pháp luật thì thông tin còn cần phải được bảo mật để bảo vệ quyền lợi doanh nghiệp cũng như các bên liên quan

Ngoài ra, xét trên phương diện tổng thể, kiểm toán viên có trách nhiệm đảm bảo hợp lý rằng liệu báo cáo tài chính có còn sai sót trọng yếu do gian lận hoặc nhầm lẫn hay không Nếu phát hiện có hành vi không tuân thủ pháp luật và các quy định, kiểm toán viên phải báo cáo những hành vi này với các cơ quan nhà nước có thẩm quyền, thông báo với đại diện chủ sở hữu của đơn vị được kiểm toán và các đối tượng bên ngoài đơn vị được kiểm toán (nếu có) Đồng thời, kiểm toán viên phải thực hiện các thủ tục kiểm toán bổ sung để làm rõ những nghi ngờ này

2 Lý do chọn đề tài

Trong n n kinh t thề ế ị trường, thông tin, đặc bi t là thông tin v tài chính chi m ệ ề ế phần quan tr ng trong viọ ệc đưa ra các quyết định kinh tế của các nhà đầu tư, các doanh nghiệp Vi c nh ng thông tin bệ ữ ị sai l ch s dệ ẽ ẫn đến nhiều nguy cơ, rủi ro đố ới nhi u i v ề đối tượng sử dụng trong nền kinh tế Vì vậy việc xác thực, minh bạch trong các thông tin tài chính là m t trong nh ng vộ ữ ấn đề được quan tâm hàng đầu

Tại Vi t Nam, hiệ ện nay cũng xảy ra không ít v gian l n trong các báo cáo tài ụ ậ chính Việc không phát hiện ra được các sai sót, gian l n này là do nhiậ ều lí do trong đó trách nhi m m t ph n thu c v các ki m toán viên và các công ty ki m toán Tuy nhiên, ệ ộ ầ ộ ề ể ể vì đây là một lĩnh vực khá mới mẻ đối với nước ta nên trình độ chuyên môn, các kiến thức liên quan đến chuyên ngành cũng như là một số các chu n m c trên th gi i ta v n ẩ ự ế ớ ẫ chưa theo kịp Hành lang v pháp lý cho vi c th c hi n ki m toán t i Vi t Nam v n còn ề ệ ự ệ ể ạ ệ ẫ nhiều b t c p ấ ậ

Trang 12

Về hậu quả mà một sai lầm tỏn báo cáo tài chính để lại đối với các yếu tố không thuộc về công ty như các nhà đầu tư, những người cho vay và cơ quan thuế là rất lớn đối với các nhà đầu tư, khi xuất hiện gian lận báo cáo tài chính thì các nhà đầu tư sẽ đánh giá quá cao hoặc quá thấp nguồn lực của công ty và điều này sẽ gây nên sự e dè cho các nhà đầu tư, gây ảnh hưởng đến khả năng sinh lời và vốn đầu tư Đối với người cho vay, khi việc gian lận báo cáo tài chính dẫn đến việc doanh nghiệp mất khả năng thanh toán nợ điều này sẽ gây tồn đọng những khoản nợ xấu đối với người cho vay, ngân hàng và các tổ chức tín dụng Đối với cơ quan thuế, thì việc gian lận báo cáo tài chính sẽ làm giảm số thuế mà doanh nghiệp phải nộp (thuế thu nhập doanh nghiệp, thuế tiêu thụ đặc biệt, ) gây giảm thu ngân sách quốc gia và ảnh hưởng xấu đến sự tăng trưởng đến tăng trưởng và thu nhập của quốc gia đó

Chung quy lại, việc gian lận báo cáo tài chính đều sẽ gây ra những hậu quả nghiêm trọng cho từng cá nhân tổ chức là nạn nhân và rộng hơn nữa là sự tăng trưởng và thịnh vượng của quốc gia đó Vì vậy, việc nâng cao chất lượng hoạt động kiểm toán độc lập, tăng cường trách nhiệm lẫn khả năng chuyên môn dành cho các kiểm toán viên trong việc phát hiện những sai sót, gian lận trong báo cáo tài chính là một vấn đề hết sức cấp bách và thời sự nhằm nâng cao tính minh bạch, thông tin đáng tin cậy dành cho các đối tượng sử dụng trong nền kinh tế Dự án tập trung ứng dụng khoa học dữ liệu vào việc phát hiện các sai lầm trong dữ liệu từ các báo cáo tài chính từ đó có thể giúp các toán viên dễ dàng phân tích, dự đoán các hướng đi cũng nhưng khả năng phát triển bền vững của doanh nghiệp

3 M c tiêu nghiên c u ụ ứ

Mục tiêu nghiên cứu của đề tài tương ứng với b n bài toán c n gi i quy t ố ầ ả ế

❖ Bài toán 1: D ự đoán kh ả năng khoản dự phòng n phợ ải thu khó đòi bị chi phối bởi các công ty trong gian l n Báo cáo tài chính ậ

❖ Bài toán 2: Phát hi n gian l n kho n ph i thu c a các khách hàng có cùng ệ ậ ả ả ủ tính ch t trong Báo cáo tài chính ấ

❖ Bài toán 3: Phát hiện các đặc điểm đặc thù d l i dễ ợ ụng để gian l n trong ậ dữ li u ệ

Trang 13

❖ Bài toán 4: D ự báo nguy cơ gian lận c a các báo cáo tài chính ủ

4 Đối tượng nghiên c u

Dự án c a nhóm chúng tôi nh m nghiên c u v Gian l n trong báo cáo tài chính ủ ằ ứ ề ậ của các công ty được niêm yết trên th ị trường ch ng khoán Vi t Nam ứ ệ

5 Mô t d li u và c u trúc d li u ả ữ ệ ấ ữ ệ

Nguồn d li u mà nhóm thu th p phữ ệ ậ ục vụ cho nghiên c u: ứ

• Bộ d li u v thanh toán tài chính D báo khữ ệ ề – ự ả năng thanh toán khoản ph i thu: ả https://www.kaggle.com/datasets/hhenry/finance-factoring-ibm-late-payment-histories

• Bộ d li u dữ ệ ự đoán khả năng gian lận trong Báo cáo tài chính c a ủ Kiểm toán: https://archive.ics.uci.edu/ml/datasets/Audit+Data

Hai b d liộ ữ ệu được lấy t Kaggle và UCI, là nh ng ngu n thu thừ ữ ồ ập đáng tin cậy được dùng trong nghiên c u và h c t p Nhóm s d ng b d li u th nhứ ọ ậ ử ụ ộ ữ ệ ứ ất để gi i quy t ả ế hai bài toán 1 và 2, đối với bộ dữ liệu thứ 2 dùng nó vào giải quyết bài toán 3 và 4 Từ việc ng d ng b d li u vào gi i quyứ ụ ộ ữ ệ ả ết bài toán đặt ra, chúng ta có th thể ấy được mối tương quan giữa Khoản d phòng n ph i thu ự ợ ả khó đòi ới Gian l n trong Báo cáo v ậ

tài chính và đưa ra kết luận cuối cùng cho bài Dự án nghiên cứu của nhóm Cấu trúc c a hai b d li u: ủ ộ ữ ệ

▪ Finance Factoring IBM Late Payment Histories Accounts Receivable – Data Predict which customers will pay fastest –

(Khoản thanh toán tài chính L ch s thanh toán tr c a IBM D li u tài kho n – ị ử ễ ủ ữ ệ ả phải thu D báo khách hàng thanh toán nhanh nh t) – ự ấ

1 Country Code Mã s quố ốc gia Số nguyên 2 Customer ID Mã khách hàng Chuỗi ký t ự

Trang 14

3 Paperless Date Ngày không cần gi y t ấ ờ Ngày tháng 4 Invoice Number Số hiệu hóa đơn Số nguyên 5 Invoice Date Ngày trên hóa đơn Ngày tháng 6 Due Date Ngày đáo hạn thanh toán Ngày tháng 7 Invoice Amount Số tiền hóa đơn – Giá trị thanh toán Số nguyên 8 Disputed Tranh chấp:

Khoản phải thu này có được tr ả đúng thời h n hay không, n u x y ra tranh ạ ế ả chấp ph i l p 1 kho n d phòng cho ả ậ ả ự khoản ph i thu này ả

Có ho c Không ặ (Yes or No)

9 Settled Date Ngày giải quy t ế Ngày tháng 10 Paperless Bill Hóa đơn không giấy tờ Chuỗi ký t ự 11 Days To Settle Thời gian gi i quy t ả ế Số nguyên 12 Days Late Số ngày tr h n thanh toán ễ ạ Số nguyên

Bảng 1 1: B ng mô t c u trúc c a b d li u Account Receivable Prediction ả ả ấ ủ ộ ữ ệ

Sự khác biệt được tìm thấy trong kế hoạch kiểm tra và báo cáo

tóm tắt của A Số không nguyên Score_A Điểm của A Số không nguyên Risk_A Rủi ro của A Số không nguyên

Trang 15

PARA_B

Sự khác biệt được tìm thấy trong kế hoạch kiểm tra và báo cáo

tóm tắt của B Số không nguyên Score_B Điểm của B Số không nguyên Risk_B Rủi ro của B Số không nguyên

TOTAL Tổng số lượng chênh lệch được

tìm thấy trong các báo cáo khác Số không nguyên numbers Những khác biệt trong lịch sử Số thực Score_B Điểm của B Số không nguyên Risk_C Rủi ro của C Số không nguyên Money_Value Gía trị tiền Số không nguyên Score_MV Điểm của MV Số không nguyên Risk_D Rủi ro của D Số không nguyên District_Loss Dữ liệu của quận bị mất Số thực PROB Vấn đề Số không nguyên Risk_E Rủi ro của E Số không nguyên History Lịch sử Có hoặc không Prob Vấn đề Số không nguyên Risk_F Rủi ro của F Số không nguyên Score Điểm số Số không nguyên

Trang 16

Inherent_Risk Rủi ro tiềm tàng Số không nguyên CONTROL_RISK Rủi ro kiểm soát Số không nguyên Detection_Risk Rủi ro phát hiện Số không nguyên Audit_Risk Rủi ro kiểm toán Số không nguyên Risk Rủi ro Có hoặc không

Bảng 1 2: B ng mô t c u trúc c a b d li u Audit risk ả ả ấ ủ ộ ữ ệ

Audit Risk = Inherent Risk × Control Risk × Detection Risk (%)

Trang 17

CHƯƠNG II: QUY ĐỊNH THỰC HIỆN VÀ KẾT QUẢ

1 Các phương pháp dự đoán và quy trình cụ thể 1.1 Phân l p d li u ớ ữ ệ

Phân l p d li u là m t chớ ữ ệ ộ ức năng khai thác dữ ệ li u chỉ định các m c trong ụ một t p hậ ợp cho các danh m c ho c l p mụ ặ ớ ục tiêu Mục tiêu c a phân lủ ớp d li u là ữ ệ dự đoán chính xác lớp mục tiêu cho từng trường hợp trong dữ liệu Ví dụ, một mô hình phân lo i có th ạ ể được sử ụng để xác đị d nh những người xin vay là r i ro tín ủ

Phương pháp hồi quy logistic (Logistic Regression)

Phương pháp hồi quy logistic là một phương pháp dựa vào xác suất để ểm đị ki nh tính hi u qu c a các mô hình phân lo i d liệ ả ủ ạ ữ ệu mang tính đặc thù Là mô hình d cài ễ đặt, dễ huấn luyện, phân loại nhanh và dễ diễn giải kết quả ( tuy nhiên ch áp dụng v i ỉ ớ các bi n r i r c) ế ờ ạ

Hình 2 1: Minh ho ạ phương pháp hồi quy Losgistic

Trang 18

Phương pháp SVM (Support Vector Machine)

Đây là một thuật toán chuyên sâu được giám sát để phân loại hoặc h i quy các ồ nhóm d li u Trong trí tu nhân t o và h c máy, m t h th ng hữ ệ ệ ạ ọ ộ ệ ố ọc có giám sát được cung c p d liấ ữ ệu đầu vào và đầu ra và được gắn nhãn để phân lo i S phân lo i này ạ ự ạ cung cấp cơ sở nghiên c u cho vi c x lý d liứ ệ ử ữ ệu trong tương lại Máy vecto h tr ỗ ợ được sử dụng để ếp hạng hai bộ dữ liệu vào các danh m x ục tương tự nhau Thuật toán vẽ các đường siêu ph ng trong không gian nhi u chiẳ ề ều để tách nhóm theo chế độ

Phương pháp Neural Network

Đây là chuỗi thuật toán nhằm tìm kiếm quan hệ trong tập hợp dữ liệu hệ thống dựa theo cách thức hoạt động não bộ con người

Hình 2 2: Minh ho ạ phương pháp SVM (Support Vector Machine)

Trang 19

Hình 2 3: Minh ho ạ phương pháp Neural Network

1.2 Phân c m d li u ụ ữ ệ

Phân c m d li u là quá trình phân cụ ữ ệ ụm/nhóm các đối tượng/dữ liệu có đặc điểm tương tự thành các cụm/nhóm tương tự Trong đó: Các đối tượng trong cùng một cụm sẽ có các thu c tính giộ ống nhau, trong khi các đối tượng thu c các c m/nhóm khác nhau ộ ụ sẽ có các thuộc tính khác nhau

Đặc điểm:

• Nhiệm vụ chính là tìm và đo lường s khác bi t giự ệ ữa các đối tượng d li u ữ ệ • Phân c m thuụ ộc nhóm phương pháp học không giám sát, do không bi t ế

trước số ợlư ng nhóm (khác v i bài toán phân l p) ớ ớ

Thuật toán K-means: Thu c nhóm thu t toán phân c m dộ ậ ụ ựa trên phân hoạch

Trang 20

Hình 2 4: Minh ho v thu t toán K-Means ạ ề ậ

Các bước quy trình c a K-means

Bước 1: Xử lý dữ liệu: Loại bỏ các hàng có dữ liệu bị khuyết Bước 2: Chọn k điểm bất kỳ làm các trung tâm ban đầu của k cụm

Bước 3: Phân mỗi điểm dữ liệu vào cụm có trung tâm gần nó nhất Nếu các điểm dữ liệu ở từng cụm vừa được phân chia không thay đổi so với kết quả của lần phân chia trước nó thì ta dừng thuật toán

Bước 4: Cập nhật lại trung tâm cho từng cụm: Lấy trung bình cộng của tất các các điểm dữ liệu đã được gán vào cụm đó sau khi phân chia ở bước 2

Bước 5: Quay lại bước 2

Các bước quy trình của SVM, NN, LR:

Bước 1: Nhập dữ liệu cần huấn luyện vào orange

Bước 2: Nối widget dữ liệu huấn luyện và SVM, NN, LR với Test and score, sau đó nối widget vào Confusion Matrix để thực hiện đánh giá kết quả và đánh giá ma trận nhầm lẫn

Trang 21

Bước 3: Sau khi chọn được phương pháp dự báo tốt nhất, nối dữ liệu huấn luyện vào SVM, hoặc NN, hoặc LR Đồng thời nhập dữ liệu dùng để dự báo vào orange

Bước 4: Liên kết phương pháp dự báo tốt nhất và dữ liệu dự báo với Predictions để đánh giá và phân loại dữ liệu đầu vào

Bước 5: Xuất kết quả dự báo bằng Data Table

2 Tìm hi u v d li u ể ề ữ ệ

2.1 Phân tính d li u ữ ệ

Đối với bộ dữ liệu Audit risk:

+ Mỗi hàng đại diện cho một doanh nghiệp và mỗi cột chứa các thuộc tính khác nhau của đối tượng

+ Dữ liệu thô chứa 776 hàng (đối tượng) và 25 cột (đặc trưng)

+ Trong bảng dữ liệu về các thuộc tính, nhóm nhận thấy rằng 5 thuộc tính chính, có ảnh hưởng lớn đến việc phân tích nguy cơ gian lận của một số doanh nghiệp: Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk (Rủi ro kiểm toán), Risk (Nguy cơ gian lận)

Trong đó Audit_Risk = Inherent Risk x Control Risk x Detection Risk vì vậy Audit risk là target (biến phụ thuộc) sẽ ảnh hưởng phần lớn đến nguy cơ doanh nghiệp có gian lận (Risk1) hoặc không gian lận (Risk0)

Ta có thể thấy từ bộ dữ liệu, nhóm doanh nghiệp có nguy cơ gian lận trong kiểm toán khi nhóm doanh nghiệp đó có chỉ số của những biến Audit risk càng cao (lớn hơn 1) Mặt khác, các chỉ số càng nhỏ (bé hơn 1) thì doanh nghiệp không có nguy cơ gian lận

Đối với bộ dữ liệu Account Receivable Prediction

Trang 22

+ Mỗi hàng đại diễn cho 1 đơn vị, khoản lập dự phòng phải thu và mỗi cột chứa

các thuộc tính khác nhau của đối tượng

+ Dữ liệu thô chứa 2466 hàng (đối tượng) và 12 cột (đặc trưng)

+ Mỗi đơn vị bao gồm những thuộc tính Disputed, Invoice Date, Due Date, Settled Date, country Code, customer ID, paperless Date, invoice Number, Invoice Amount, Paperless Bill, DaysToSettle, DaysLate thể hiện thông tin chi tiết về khoản lập dự phòng của nợ khó đòi

2.2 Ti n x lý d li u ề ử ữ ệ

Hai trang web archive.ics.uci.edukaggle.com được nhóm s d ng trong ử ụ việc ch n d li u cho 4 bài toán ọ ự ệ

B d li u Audit risk mà nhóm tộ ữ ệ ừ trang archive.ics.uci.edu để nghiên c u phát ứ hiện gian l n các c t d li u hay thông tin c n thi t không b thi u, b mậ ộ ữ ệ ầ ế ị ế ị ất nên nhóm đã bỏ qua bước tiền x lý d liử ữ ệu đố ớ ộ d li u này i v i b ữ ệ

Đố ới b d li u Account Receivable Prediction do d li u khá l n và m t s i v ộ ữ ệ ữ ệ ớ ộ ố dữ li u b thi u ho c b m t, chính vì vệ ị ế ặ ị ấ ậy nhóm đã dùng chức năng preprocessing để xoá b các hàng có chị ứa các dữ ệ li u b m t ị ấ

Hình 2 5: Mô t x lí d li u b m t ả ử ữ ệ ị ấ

Trang 23

2.3 Phân tách d li u ữ ệ

- Trong bài nghiên cứu, nhóm đã sử dụng công cụ Data Sampler để tách dữ liệu gốc t 2 bừ ộ d liữ ệu “Audit_risk” và “Account Receivable Prediction” thành hai file riêng bi t: 70% c a m i b d liệ ủ ỗ ộ ữ ệu đượ ử ụng đểc s d làm d li u m u cho mô hình phân ữ ệ ẫ lớp d li u, 30% c a d li u còn l i cữ ệ ủ ữ ệ ạ ủa mỗ ộ được dùng trong dự báo i b

Hình 2 6: Mô t phân tách b d li u ả ộ ữ ệ

3 Th c nghi m ự ệ

3.1 Ki n th c chuyên ngành ế ứ

Một là, bằng cách vận dụng các kiến thức đã học và kiến thức vế kế toán – kiểm toán về các khoản phải thu và dự phòng nợ phải thu khó đòi, tiêu biểu là các

Trang 24

nguyên tắc kế toán trong hệ thống kế toán theo VAS(chuẩn mực kế toán Việt Nam) như thận trọng, trọng yếu

Hai là, sử dụng các công thức sử dụng trong Bảng cân đối kế toán:

Tài sản = Nợ phải trả + Vốn Chủ sở hữu

Khoản phải thu thuần = Khoản phải thu – Dự phòng phải thu khó đòi Ngày nay, các thủ thuật gian lận trong Báo cáo tài chính ngày càng nhiều, thủ thuật và tinh vi hơn các công ty thường sử dụng một số cách như ghi nhận sai doanh thu, che dấu các công nợ và chi phí, nhằm một số mục đích như thu hút đầu tư, trốn thuế…., và một trong những yếu tố quan trọng mà nhóm nhắc đến ở đây là khoản Dự phòng các khoản phải thu, thông thường vào cuối năm các công ty sẽ lập các khoản dự phòng phải thu khó đòi, và một số doanh nghiệp sẽ định giá cao nợ phải thu khó đòi => Số thực tế phải thu thấp hơn, tăng chi phí => Tài sản công ty thấp hơn so với thực tế và làm giảm vốn chủ sở hữu, bên cạnh đó làm thu nhập trước thuế thấp hơn, gây ra khả năng cao các doanh nghiệp trốn thuế Các doanh nghiệp còn dùng cách này để điều khiển thu nhập sau thuế theo nhịp độ tăng dần đều để khiến cho các nhà đầu tư thấy rằng công ty đang phát triển rõ rệt

Như vậy, nhóm sẽ thực hiện phân nhóm giữa các khách hàng có cùng tính chất và so sánh các chỉ tiêu với nhau thông qua chạy mô hình trên phần mềm Orange để từ đó cho thấy ảnh hưởng của Khoản phải thu trong Báo cáo tài chính

Ba là, ằng cách vận dụng các kiến thức đã học và kiến thức vế kế toán – b kiểm toán xem xét các hành vi gian lận trong việc làm sai lệch kết quả báo cáo tài chính, nhận biết được Rủi ro kiểm toán và các yếu tố ảnh hưởng đến nó

Audit Risk (Rủi ro kiểm toán): làrủi ro do quá trình kiểm tra và đánh giá, đưa ra ý kiến của kiểm toán viên không phản ánh đúng hay sai lệch khi Báo cáo tài chính được kiểm toán mà còn chứa đựng những sai sót trọng yếu.”

Audit Risk = Inherent Risk × Control Risk × Detection Risk

Trang 25

Trong những cột dữ liệu về những thuộc tính, nhóm cho rằng 5 thuộc tính chính, tổng hợp từ những đặc trưng còn lại, có ảnh hưởng lớn đến việc phân tích nguy cơ gian lận của các doanh nghiệp: Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm

soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk (Rủi ro kiểm toán) (Với Audit

Risk = Inherent Risk × Control Risk × Detection Risk) là yếu tố quan trọng quyết

định đến Risk, Risk (Nguy cơ gian lận) cho kết quả Risk (1) nguy cơ doanh nghiệp có gian lận và Risk (0) nguy cơ doanh nghiệp không gian lận

Nhìn chung từ bộ dữ liệu, hầu hết nhóm doanh nghiệp có chỉ số của những biến, InherentRisk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk càng nhỏ (bé hơn 1) thì đa số kết quả của biến Risk là 0 (doanh nghiệp không có nguy cơ gian lận) Ngược lại, chỉ số biến Inherent_Risk (Rủi ro tiềm tàng), Control_Risk (Rủi ro kiểm soát), Detection_Risk (Rủi ro phát hiện), Audit_Risk của nhóm doanh nghiệp thể hiện trên bộ dữ liệu càng cao (lớn hơn 1) thì kết quả xảy ra ở biến Risk là 1 (doanh nghiệp có nguy cơ gian lận)

Ngoài các thu c tính chính trên còn có các thuộ ộc tính sau cũng không kém phần quan tr ng trong kiọ ểm tra và đánh giá việc gian l n trong ki m toán: ậ ể Numbers (Giá tr ịkhác bi t l ch s ), District Lossệ ị ử (Tổn thất mà doanh nghiệp trong quận phải chịu trong

10 năm qua), Money value (Số tiền của những sai phạm của kiểm toán trong quá khứ…

Và thông qua các đặc thù tác động yếu tố rủi ro sẽ giúp cho doanh nghiệp có cách nhìn khách quan hơn và đưa ra các giải pháp nhằm hạn chế rủi ro gian lận trong kiểm toán V r i ro gian l n trong ki m toán, không chể ủ ậ ể ỉ ph thu c vào m t thu c tính ụ ộ ộ ộ duy nhất như Audit_Risk mà bởi tất cả những thuộc tính được đưa ra, ngoài ra còn có những yếu tố ngoại cảnh mà dữ liệu không thể cho thấy

3.2 Bài toán 1: D ự đoán khả năng dự phòng n phợ ải thu khó đòi bị chi ph i

bởi các công ty trong gian l n Báo cáo tài chính

a) Mô t bài toán

Gian lận trên Báo cáo tài chính là trường hợp các thông tin được đưa ra trên bản báo cáo tài chính b bóp méo, ph n ánh không trung th c tình hình tài chính m t cách ị ả ự ộ

Trang 26

cố ý nh m l a gằ ừ ạt ngườ ử ụi s d ng thông tin Nh m mằ ục đích trụ ợ ủc l i c a mình, m t s ộ ố công ty đã sử dụng một số thủ thuật như: che dấu công nợ, chi phí; ghi nhận doanh thu không có th t hay khai kh ng doanh thu (l p ch ng t gi mậ ố ậ ứ ừ ả ạo); định giá sai tài sản… Tại đây, nhóm đề cập t i ớ khoản d phòng ph i thu n ự ả ợ khó đòi – khoản dự phòng này được ghi nh n b i tài kho n 2293 (D phòng phậ ở ả ự ải thu khó đòi) đồng thời tài kho n 642 ả (Chi phí qu n lý doanh nghi p) Có th nh n th y, vi c l p d phòng m t kho n n ph i ả ệ ể ậ ấ ệ ậ ự ộ ả ợ ả thu sẽ tác động t i ớ hai y u tế ố Tài sảnChi phí trong Báo cáo tài chính Vi c c ý ệ ố làm trái quy định v vi c ghi nh n Kho n d phòng phề ệ ậ ả ự ải thu khó đòi tạo nên tình trạng phóng đại doanh thu và lờ đi khoản chi phí hoặc ngược lại, khiến Lợi nhuận trước và sau thuế c a công ty b thao túng Tủ ị ừ đó, những ngườ ử ụi s d ng b n báo cáo tài chính ả của nh ng doanh nghiữ ệp này để có cái nhìn t ng quát cho mổ ục đích đầu tư, quản tr s ị ẽ có đánh giá lệch chu n và bất l i ẩ ợ

Vậy nên, ở đây nhóm sử ụ d ng b d li u: ộ ữ ệ Khoản thanh toán tài chính L ch s – ị ử

thanh toán tr c a IBM D li u tài kho n ph i thu D báo khách hàng thanh toán ễ ủ ữ ệ ả ả – ự

nhanh nh t ấ để xem xét khả năng sai sót trong dự báo kho n phả ải thu khó đòi của các công ty

b) Ch y mô hình và k t qu ạ ế ả

- Xây d ng mô hình

Sau bước xử lý tiền dữ liệu (Chọn thuộc tính Disputed làm biến phụ thuộc ử , x lý d li u khuy t thi u, phân tách d li u t o hai bữ ệ ế ế ữ ệ ạ ộ để làm d li u hu n luy n và d ữ ệ ấ ệ ữ liệu d báo), chúng ta ti n hành phân lự ế ớp d liữ ệu để ự d báo nh ng khách hàng nào s ữ ẽ có khoản phải thu khó đòi

Tại đây chúng ta sử ụng 3 phương pháp Hồ d i quy logistic (Logistic Regression), Support Vector Machine (SVM), Neural Network để đánh giá xem phương pháp nào hiệu qu nh t và ng dả ấ ứ ụng nó d báo ự

Ngày đăng: 08/04/2024, 08:02

Tài liệu cùng người dùng

Tài liệu liên quan