Trong luận văn nay, chúng tôi đã tiến hành trích xuất đặc trưng từ các giá trị dit liệuthô trong các BCTC va áp dụng phương pháp máy học tong hợp với thuật toán RUSBoost,AdaBoost, Baggin
Trang 1ĐẠI HỌC QUÓC GIA TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
s›*@8
HUỲNH THI TO NGỌC
MSHV: CH2002011
PHÁT HIỆN CÁC GIAN LAN KE TOÁN BẰNG
PHƯƠNG PHAP MAY HỌC TONG HOP
LUẬN VAN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
Mã số: 8480201
GIẢNG VIÊN HƯỚNG DẪN:
TS NGUYEN TAN CAM
TP HO CHÍ MINH - 08/2024
Trang 2LỜI CAM ĐOAN CỦA HỌC VIÊN
Tôi xin cam đoan luận văn tốt nghiệp với đề tài “PHÁT HIỆN CÁC GIAN LẬN
KE TOÁN BẰNG PHƯƠNG PHAP MAY HỌC TONG HỢP” được thực hiện một cách
độc lập dưới sự hướng dẫn tận tâm của Thay TS.Nguyén Tan Cầm Báo cáo trung thựckhông gian lận các kết quả và số liệu Tôi xin cam đoan rằng tôi đã thực hiện nghiên cứu,
tìm hiểu và tự thân viết báo cáo luận văn, không sao chép từ mà không được ghi chú từ bất
kỳ nguôồn nào Nếu có phát hiện bat kỳ sự gian lận nào, tôi xin hoàn toàn chịu trách nhiệm
về các công trình nghiên cứu viét trong bài báo cáo luận văn nay.
Tp Hồ Chí Minh, tháng 08 năm 2024
Trân trọng
Huỳnh Thị Tố Ngọc
Trang 3LỜI CẢM ƠN CỦA HỌC VIÊN
Đầu tiên em xin gởi lời biết ơn chân thành và sâu sắc nhất đến thầy TS NguyễnTan Cầm đã tạo điều kiện thuận lợi cho em được nghiên cứu và thực hiện luận văn thạc sĩcủa mình Mặc dù bản thân em còn nhiều thiếu sót nhưng nhưng thay rất quan tâm và tận
tình giúp đỡ em trong quá trình thực hiện khóa luận, giúp cho em có những định hướng
đúng đắn đề hoàn thành luận văn của mình một cách tốt nhất
Em xin chân thành cảm ơn các thầy cô trong khoa Công Nghệ Thông Tin, trườngDai học Công nghệ Thông tin, những người đã truyền dạy kiến thức nền tảng vô cùng bổ
ích cho học viên chúng em.
Bên cạnh đó, em xin cam ơn anh Pham Ri Nép, bạn Lê Văn Toàn, anh Ngô Hữu
Phúc đã truyền cho em những kinh nghiệm học tập, nghiên cứu và giúp đỡ em trong việctìm kiếm nguồn thông tin thực tế cho dé tài khóa luận
Do kiên thức còn hạn hẹp và giới han thời gian nên phan tìm hiệu và thực hiện luận văn thạc sĩ của em còn nhiêu sai sót và hạn chê Em rât mong nhận được sự sự góp ý chân
thành của quý thầy cô cùng các bạn
Em xin chân thành cám ơn!
Tp Hô Chí Minh, tháng 08 năm 2024
Trân trọng
Huỳnh Thị Tố Ngọc
Trang 4“o0 -Ö11A 11
Chương 1 GIỚI THIỆU - 2 S2 EEE£+E£+EE#EE£2EE+EEEEEE2EEEEEEEEEEEEEEEEEEEEEEEEErrrrrkerg 12
1.1 Báo cáo tài chính - Gian lận kế toán - ¿+ tk t+E+EEEE+E+EEEESEeEEzEeEeEkrkererxererx 12
1.1.1 Báo cáo tài chính - - - - + 11111325111 111112211 118119231 1111110111 11g 1 ng vn 12
1.1.2 Gian lận kế toán 5 ©5£©2++2E£+EE2ExEEESEEE21271121121E21111111 11111 crxcrree 141.2 Dấu hiệu của gian lận kế toán trong BCTC ¿ -¿¿2++22++2z+++z++zx+erseees 14
1.2.1 Động cơ thực hiện gian lận BC TC - 5c S222 + £+sEEeeseerreeseereere 14
1.2.2 Dấu hiệu gian lận trên BCTC 2 2 £+S£E£+EE+EE+EE+EE+EE£EE+EE+ErErrerreee l61.2.3 Một số hình thức gian lận thường gặp trên BCTC -2¿©¿<¿ 5+2 19.2.4 Ảnh hưởng của gian lận trên BCTC đến các đối tượng sử dụng 20
1.3 Trách nhiệm ngăn ngừa và phát hiện gian lận trong BCTC .- - 21
1.3.1 Trách nhiệm của những nhà quan TỊ - 6 + + £+x£+vEeEeeeeeeeereereers 21
1.3.2 Trách nhiệm của những kiểm toán viên - 2-2 2 2+£+E++£++£zzEzzzeez 21
1.3.3 Trách nhiệm của những cơ quan Nha nƯỚC - + 5xx +*vEseeseesersers 22
No An 4433433 221.5 Phát biểu bài toán cần giải quyết -: ¿- + +++++E++EEt+EEEEEeEEvrxrrkrrreerkrree 231.6 Kết luận chương 2: ¿5E SE2E2EE£EE2EEEE1E21122171121127171121111711 11111 cre 24Chương 2 CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN - 2-2252 25
2.1 Các công trình nghiên cứu liên Qu41 - G5 c1 131112311 911 E93 k9 key 25
2.2 Các vấn đề tỒn tại -:-2¿- 5+ t2 221221 2112212712112111112112111112111111111 111cc 27
2.2.1 Nhiều thông tin có giá trị trong dữ liệu tài chính thô chưa được khai thác 27
2.2.2 Hiện tượng quá khớp (OVerfẨif{ẨIT) - - ch Hư 28
Trang 52.2.3 Mô hình riêng biệt thì chỉ số đánh giá không cao -¿-2- 5552 292.3 Kết luận chương ¿+ StSE9EE9EEEEEEEEEE1EE17127111111111111111 1.111.111 xe 30
Chương 3 MÔ HÌNH ĐỀ XUAT - 2-22 2+SE+2E£2EE£EEEEEE2EEE7E211271711211271 11.1 xe, 31
3.1 Mô hình hệ thống để Xuất - ¿2 2 E9SE+EE+EEEEEEEE2EE2E12E121121121121121111 1.1 c0, 313.2 Diễn giải chi tiết mô Hib essessessessessessessessessessessessessesuessessessessesseavessees 32
k8 4135 32 3.2.2 Rút trích đặc frưng - - - +11 1 ng TH HH HH ng 33 3.2.3 Tap tin 952 ii 42
3.2.4 Huan luyện mô hình ¿ E+E£EE£EE£EE#EE£EEEEEEEEEEEEEEEEEEEEEEEEEEEEkrrrrrreg 42
ân " 79
4A.2 THOL Gia oo ee /.ỐẨÂẨÂA12HẦHL , 80
4.5 Kết luận chương wo cesceccescescssescessessesscscssesscssessessessessessessessessessessessessessesssssesseasesseaees 80Chương 5 KET LUẬN VA HƯỚNG PHAT TRIEN csscsscssesssssesessesessesesessesesessens 82
SL Kt LUA 7a 4 82
5.1.1 Kết quả sau khi thực nghiệm o c.cceccececessessessessessessessessessessessessessessssseseseaseaees 825.1.2 Thách thức, hạn chế gặp phải 2- 22 5¿©++2++2E++£E++£E+erxeerxesrxesree 835.2 Hướng phát triỀn -:- 2 6 E+SE+SE£EE£EEEEEEE12E1221112112112112112112111111 1.1 c0, 83TÀI LIEU THAM KHẢO -2- 2£ 2 SESE£+EE£EE£EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEErrrrrrkrrei 84
Trang 6DANH MỤC CÁC HÌNH
Hình 1.1: Sơ đồ mối quan hệ giữa các BCTC -2- 2+ ++2+++Ex++Ex++zxzrxrzrxrrrxee 13
Hình 1.2: Mô hình tam giác gian lận (Fraud Triangle) [Š ] - - «5< «<++se+se+ses 15
Hình 1.3: Đối tượng sử dụng BCTC ¿- 2-2: ©5£22++2E+2E+£EEE2E+2EEEEECEEESEEerkrrrrerrres 20
Hình 2.1: Các loại dữ liệu thường gặp trong BC TC 5 55 + *++seexeereeereeree 28
Hình 2.2: Hiện tượng quá khớp trong phân loại dữ liệu - 5 555 ++<++s<+s+ 29
Hình 3.1: Mô hình hệ thống đề xuất dự đoán GLKTT -¿- 2 ¿++c++zx++z+zzxz+2 31Hình 3.2: Hình chụp tìm kiếm giá trị aC( 2-2-2 2+2E£+EE£EE+EEE2EESEE+ZEESEEerkrrrerxeee 34Hình 3.3: Hình chụp tìm kiếm giá trị apD - 2-2-2 +2E£+E££EE£EE2EEvEEtzEEvrxerxrrreerreee 35
Hình 3.4: Hình chụp tìm kiếm GIA ULL Ab Ă 35
Hình 3.5: Hình chụp tìm kiếm gid trị Cop ccccscecscsssesssesssesssecsseessecssecsuecssecsuesssssecssecesecsses 35Hình 3.6: Hình chụp tìm kiếm 2:80 ¬-.-:Ở::-1ÖÖ-Ò 35Hình 3.7: Hình chụp tìm kiếm gid trị COGS -¿ 2¿©22¿©5++©+++£+++Ex++Exe+rxesrxerrrxrrreee 36Hình 3.8: Hình chụp tìm kiếm giá trị €sh0O -. -2¿- ¿+2 ©+£2E++£EE2EE++EE++Exezrxzrxrrrxee 36Hình 3.9: Hình chụp tìm kiếm giá trị đÏc -. ¿2 ©++++++++£x++£x++zx++zx+zzxzrxrrreee 36Hình 3.10: Hình chụp tìm kiếm giá trị đÏtis 2-2 ©£+2+++£E£+Ex+£zx++zxezzxzrxezreee 37Hình 3.1 1: Hình chụp tìm kiếm giá trị dÌt( -¿- 2 ©5¿©5++2++£E++E+ezxzx++rxerxzresrxrres 37 Hình 3.12: Hình chụp tìm kiếm giá trị dp : ¿-©2¿©2+22+2E++E++£xzE++rxerxezresrxeres 37 Hình 3.13: Hình chụp tìm kiếm giá trị ïb - 2-2 2 2+££+E++EE+EE+EEEEErEEzkerrerrerrerree 37Hình 3.14: Hình chụp tìm kiếm giá trị iIIV - 2-2 + £+S++E++EE+E++EE£EEtEzEerrrrerrerree 38Hình 3.15: Hình chụp tìm kiếm giá trị 1VaO - 2 2£ ©S£+S++EE+EE2EEEEEEEEEEEerkrrerrkeres 38Hình 3.16: Hình chụp tìm kiếm giá trị ïVSf :- +55 SESE‡EE‡EEEE2EEEEEEEEEEErrrrrrrerreee 38Hình 3.17: Hình chụp tìm kiếm giá trị ÌC(L :- 2 2 ©5£ £+EE+EE2EE£EEzEEeExerkerreerxeee 38Hình 3.18: Hình chụp tìm kiếm giá trị Ìt -¿- s¿©+©+£+++EE++EE+2EE++Ex++rxezrxerrrxrrrxee 38Hình 3.19: Hình chụp tìm kiếm giá trị ni -¿- 5¿©+¿2+2E++EEE+EE+trx+erxeerxezrxrrrxee 39Hình 3.20: Hình chụp tìm kiếm giá trị ppegI -¿2¿ + ++2+++£x++zx++zxzrxrzrxrrrxee 39Hình 3.21: Hình chụp tìm kiếm giá trị ps(k -2¿©2¿©5+2+++£+++£x++zxe+rxezrxrrrxerrree 39Hình 3.22: Hình chụp tìm kiếm giá trị re -:- + + x+SE+EE+EE+EE+EEEEEEEEEEErrerrerrerreee 39Hình 3.23: Hình chụp tìm kiếm giá trị reC(L ¿22¿©2+2©+++2E++EE+2EE+SEEerxsrxrrrxrrrxee 40Hình 3.24: Hình chụp tìm kiếm giá tri reC( - - +: 2© ++SE+EE+EE+EE£EEEEE+EEzErrerrerreee 40Hình 3.25: Hình chụp tìm kiếm giá trị stk ¿2 ©5¿5+22+2E+2E+tExEEterxerxrrrrerrrres 40
Trang 7Hình 3.26: Hình chụp tìm kiếm giá trị tXC :- 2-2 + E+SE+EE£EE+EE2EEEEEEEEEEEEErrrrrerreee 40Hình 3.27: Hình chụp tìm kiếm giá trị tXp - :- + 2£ + SE+EE+EE+EE2EEEEEEEEEEEEErrkrrerreee 41Hình 3.28: Hình chụp tim kiếm giá tri xint oo ces ess ees essessessessessessessessessesseseseseeaees 41Hình 3.29: Hình chụp tìm kiếm giá trị proC_f c.cceccecccsscsssessesseessessesssessessesssecsessteesessessseeses 41Hình 3.30: Giao diện trang tìm kiếm tập tin báo cáo tài chính - 2-2 2 +: 42Hình 3.31: Cấu trúc tập tin csv chứa dữ liệu thực nghiệm . 5555 s<++<>+ss2 42
Hình 3.32: Mô tả thuật toán Ủnder-SamplIng - 5+ + **+*‡++eexeeereeeereeereeese 46
Hình 3.33: Phân loại bằng mô hình hồi quy Logistic -2- 2 ¿222 s+zs£+zz+zszzsz 55Hình 3.34: Các thành phan sử dụng trong SVM [1§] - 2-2-2 25++++s++s+zxzxzseee 59Hình 3.35: Siêu phăng tốt nhất [18] -:- 2 2£ £+SE+SE+EE+EE£EEEEESEEEEEEEEEEEEEErErrrrrerree 59Hình 3.36: Minh họa (a): Dữ liệu không tuyến tính, (b): Dữ liệu gần tuyến tính [15] 60Hình 3.37: SVM sử dụng nhân đa thức bậc 2 dé tách biệt dit liệu [18] - 61
Hình 3.38: SVM sử dụng nhân sigmoid [18] ¿5 55s *2*‡£++++seeeexeeereeeeeess 61 Hình 3.39: SVM sử dụng nhân RBF [I8 ] c2 1231131113311 1 11111 krsrkerree 62
Hình 3.40: Mô phỏng đại lượng độ chuẩn xác - 2-2 2 2 +2 £+£++EE+E++E++EzEzzzzcez 67Hình 4.1: Tap tin csv chứa dữ liệu huấn lun: AM mẽ 69Hình 4.2: Tập tin csv chứa dữ liệu se na W Tn"ố ố 70Hình 4.3: Sơ đồ so sánh kết quả chạy thực nghiệm l 2-2 2 22 22 £2£zz£zz££2 71Hình 4.4: Sơ đồ so sánh kết qua chạy thực nghiệm 2 o ccccecccccssessessesessessessesesseseseesees 74Hình 4.5: Sơ đồ so sánh kết quả chạy thực nghiệm 3 - 5 +5 «+ £++k£sssseeses 76Hình 4.6: Sơ đồ so sánh kết quả chạy thực nghiệm 4 - 2-2 2 2 +2 +2 ++£+£zzs+2 79
Trang 8Chỉ số đánh giá kết quả dự đoán 2- ¿2 +++x++Ex++Ex2ExtzExtrrxerrerrrrees 63
Kết quả chạy thực nghiệm L -2- 2 ©22SE+2E£2EE£EE£EEE2EEEEEEEEEEEEErkrrrrrrrree 70
Kết quả thời gian xử lý của thực nghiệm Ì 25 «+55 *£++kk+seeEsseesseeees 72Kết quả chạy thực nghiệm 2 ¿- 2-2 2 E+SE+EE+EE£EEEEE2EEEEEEEEEEEErrrrrrerreee 73Kết quả thời gian xử lý của thực nghiệm 2 2 2 + ++c++x++xzxzxzreee 74Kết quả chạy thực nghiệm 3 +- 2 2 E+SE+EE+EE£EEEEE2EEEEEEEEEEEErrrrrrerreee 76 Kết quả thời gian xử lý của thực nghiệm 3 2 2 2 ++£+E++zzxzxzreee 77Kết quả chạy thực nghiệm 4 2-2 + ©S£+SE£EE2EEEEEEEEEEEEE2EEEEEEEEEECrrrrrkree 79Kết quả thời gian xử lý của thực nghiệm 4 2-2-2 +©x++z++£x+zxzzeerxeee 80
Trang 9DANH MỤC CÁC TỪ VIET TAT
CNTT Công Nghệ Thông Tin
DBA Database Administrative
CLI Command Line Interface
CSDL Co Sở Dữ Liệu
DB Database
BCTC Báo Cáo Tài Chính
OCR Optical Character Recognition
SXKD San Xuat Kinh Doanh
NDCG Normalized Discounted Cumulative Gain
SEC U.S Securities and Exchange Commission
KTTC Kế Toán Tài Chính
AAER Accounting and Auditing Enforcement Releases
AUC Area Under the Curve
TP True Positive
TN True Negative
FP False Positive
FN False Negative
SVM Support Vector Machine
TTNDN Thuế Thu Nhập Doanh Nghiệp
TGGL Tam Giác Gian Lan
TTDL Thông Tin Dữ Liệu
KTV Kiểm Toán Viên
Trang 10CQQLNN Cơ Quan Quan Ly Nhà Nước
VBQPPL Van Ban Quy Pham Phap Luat
HTTC Hệ Thống Tài Chính
GLTC Gian Lận Tài Chính
KHTS Khấu Hao Tài Sản
BCĐKT Bảng Cân Đối Kế Toán
BCKQKD Báo Cáo Kết Qủa Kinh DoanhTCKT Tài Chính Kế Toán
TITC Thông Tin Tài Chính
HNKD Hợp Nhất Kinh Doanh
VHCP Vốn Hóa Chi Phí
KTHGN Không Thực Hiện Ghi Nhận
GLKT Gian Lan Kế Toán
Trang 11TOM TAT LUẬN VAN
Báo cáo tài chính [1] (viết tắt là BCTC) là công cu giúp các nha đầu tư và nhữngđơn vị liên quan hiểu rõ tài chính của các tổ chức Trong thời đại ngày nay, tốc độ pháttriển của khoa học công nghệ nhanh như vũ bão thì quy mô kinh doanh ngày càng tăng,nguy cơ về gian lận kế toán (GLKT) đã trở thành một thách thức cực kỳ lớn đối với doanhnghiệp và hệ thống tài chính toàn cầu GLKT không còn đơn thuần là một van dé riêng củacác doanh nghiệp, mà còn mang theo những hậu quả lớn đối với tính công bằng và minh
bạch trong quản lý tài chính Việc GLKT ngày càng trở nên tinh vi làm cho việc phát hiện
và ngăn chặn gian lận trở nên cực kỳ khó khăn.
Trong luận văn nay, chúng tôi đã tiến hành trích xuất đặc trưng từ các giá trị dit liệuthô trong các BCTC va áp dụng phương pháp máy học tong hợp với thuật toán RUSBoost,AdaBoost, Bagging, phương pháp máy học hồi quy Logistic và SVM dé xây dựng mô hình
Với những kết quả đạt được, đề tài đã phát hiện GLKT trong BCTC và nâng cao độ
tin cậy của những BCTC dành cho người sử dụng Sau khi xây dựng thành công mô hình
phát hiện GLKT bằng thuật toán máy học tông hợp, chúng tôi đề xuất giải pháp tự độnghóa quy trình phát hiện GLKT, giảm thiểu sự phụ thuộc vào sự can thiệp của con người.Mục tiêu là tối ưu hóa hiệu suất thời gian, nâng cao độ chính xác, giảm thiêu sai sót do yêu
tố con người trong quá trình giám sát, đảm bảo được tính công bằng, minh bạch trong quản
lý tài chính và góp phần xây dựng sự 6n định của thị trường kinh doanh và xã hội
10
Trang 12Financial statements [1] are a tool that help investors and relevant entities
understand a company's financial status In today's rapidly advancing technological era, with the ever-expanding scale of business, the risk of accounting fraud has become an exceedingly significant challenge for businesses and the global financial system.
Accounting fraud is no longer merely a private issue for companies but also carries
substantial repercussions for fairness and transparency in financial management The increasing sophistication of accounting fraud makes detecting and preventing it extremely difficult.
In this thesis, we extract features from raw data values in financial statements and apply an ensemble machine learning approach using RUSBoost, AdaBoost, Bagging,
Logistic regression and SVM algorithms to build a classification model of accounting fraud.
We have focused on addressing two main problems Firstly, we contribute to the dataset by supplementing it for scientific research on accounting fraud from financial statements Secondly, the experimental results and data analysis demonstrated that the
ensemble machine learning model surpassed existing classification models.
With the achieved results, has successfully detected accounting fraud in financial statements and enhanced the reliability of financial statements for users After successfully developing the accounting fraud detection model using ensemble machine learning algorithms, we propose automating the fraud detection process to minimize reliance on
human intervention The goal is to optimize time efficiency, improve accuracy, reduce human errors during monitoring, ensure fairness and transparency in financial management,
and contribute to the stability of the business market and society.
11
Trang 13Chương 1 GIỚI THIEU
Trong những năm gần đây, cùng với tốc độ phát triển của khoa học công nghệ nhanhnhư vũ bão thì quy mô kinh doanh ngày càng mở rộng, nguy cơ về GLKT đã trở thành mộtthách thức cực kỳ lớn đối với các doanh nghiệp và hệ thống tài chính (HTTC) toàn cầu.GLKT không chỉ anh hưởng đến sự công bằng và sự minh bạch trong việc quan lý tài chính,
mà còn gây thiệt hại nghiêm trọng đối với doanh nghiệp và thị trường tài chính xã hội nóichung Đề giải quyết hiệu quả vấn đề này, những nghiên cứu về việc phát hiện các GLKTdựa trên BCTC bằng phương pháp máy học đã trở thành một trong lĩnh vực nghiên cứuđược quan tâm rất nhiều Đối với những doanh nghiệp, khả năng ứng dụng mô hình máyhọc (MHMH) khác nhau dé phục vụ việc phân tích các dữ liệu tài chính và phát hiện nhữngbiểu hiện của gian lận sẽ mang lại sự linh hoạt và hiểu quả hơn các phương pháp truyềnthống trước đây.
1.1 Báo cáo tài chính - Gian lận kế toán
1.1.1 Báo cáo tài chính
Báo cáo tài chính (BCTC) [1] là một tập hợp các báo cáo chứa hệ thống thông tinkinh tế, tài chính được trình bày một cách chặt chẽ dưới dạng bảng biểu, giúp cung cấpnhững thông tin về tình hình tài chính, cũng như kết quả hoạt động kinh doanh và dòngtiền của một doanh nghiệp trong một khoảng thời gian cụ thể BCTC là công cụ giúp cácnhà đầu tư tài chính, các don vị tin dụng và những bên liên quan hiểu rõ tình hình tài chínhcủa các doanh nghiệp Hệ thông các thông tin tài chính, kinh tế được trình bày minh bạch,trung thực trên các BCTC đóng góp quan trọng vào sự 6n định của thị trường kinh doanh
và xã hội Với sự phát triển mạnh mẽ và không ngừng của nền kinh tế, cùng với sự mởrộng quy mô kinh doanh của các công ty và các hoạt động thương mại toàn cầu là nhữngnguyên nhân chính dẫn đến công tác kế toán và kiểm toán trở nên phức tạp hơn trước Tuynhiên, nghiên cứu của Ferdy, Geert và Suzanne (2009) [2], việc cố tình “bóp méo” các sốliệu làm ảnh hưởng nghiêm trọng đến chất lượng BCTC, đồng thời tính phù hợp và tính
chính xác trên BCTC cũng bị ảnh hưởng.
Hệ thống BCTC của doanh nghiệp và các tập đoàn hiện nay được chia thành bốnloại báo cáo chính: báo cáo lưu chuyền tiền tệ, bảng cân đối kế toán (BCDKT), báo cáo kếtquả kinh doanh (BCKQKD) và thuyết minh BCTC [3] Các BCTC cung cấp đa dạng cácthông tin chi tiết khác nhau về tình hình kinh tế, tài chính của các doanh nghiệp Thông
12
Trang 14qua những thông tin này giúp người sử dụng thông tin có cái nhìn cụ thé hơn và có những
quyết định kinh doanh hợp lý Cụ thê các loại BCTC:
- Bao cáo lưu chuyền tiền tệ: là BCTC phan ánh dòng tiền ra và vào của doanh
nghiệp trong khoảng thời gian cụ thé, chia thành ba hoạt động chính là dòng tiền
từ các hoạt động tài chính, các hoạt động đầu tư và các hoạt động kinh doanh
- Bảng cân đối kế toán: là một trong những thành phần quan trọng trong bộ BCTC
của các tổ chức trong lĩnh vực tài chính - kế toán Bảng cân đối kế toán cung cấp
cái nhìn tổng quan về tình hình tài sản, vốn hóa chủ sở hữu và số nợ phải trả của
doanh nghiệp tại một thời điểm cụ thé Nó cho thấy tình hình tài chính của doanh
nghiệp bằng cách phân loại nguồn vốn và tài sản
- Báo cáo kết quả kinh doanh: là một tài liệu quan trọng trong lĩnh vực kế toán,
thé hiện các khoảng doanh thu, khoảng lợi nhuận và chi phí doanh nghiệp trong
khoảng thời gian cụ thê (thường là quý hoặc năm)
- _ Thuyết minh BCTC: là tài liệu cung cấp thông tin bổ sung và giải thích chỉ tiết
về các số liệu, chính sách kế toán áp dụng và thông tin các sự kiện lớn ảnh hưởngđến tình hình tài chính của doanh nghiệp Thuyết minh BCTC giúp người đọc
Hình 1.1: Sơ đồ mối quan hệ giữa các BCTC
13
Trang 151.1.2 Gian lận kế toán
Hình vi gian lận là việc có ý (hoặc cố tình) do một hay nhiều thành viên trong ban
lãnh đạo, cũng có thể do các nhân viên trong doanh nghiệp hoặc bên đối tác của doanh
nghiệp thực hiện những hành vi xấu dé thực hiện trục lợi bất chính những tài sản của doanhnghiệp Những hành vi gian lận này được thực hiện tinh vi và che dau rất kỹ càng vậy nênkhó bị phát hiện Các hành vi gian lận gồm ba loại: tham ô, GLKT và biển thủ tài sản [4]
Gian lận kế toán hoặc gian lận tài chính (GLTC) là hành vi không trung thực và viphạm quy tắc, quy định kế toán hoặc tiêu chuẩn tài chính nhằm cung cấp thông tin tài chính
(TTTC) sai lệch trên báo cáo tai chính (BCTC), đánh lừa và không trung thực với mục dich
lợi ích cá nhân hoặc tổ chức Gian lận BCTC thường là việc cố ý làm sai số liệu báo cáoliên quan đến các nội dung được công bố trong BCTC của một doanh nghiệp Hành vi gianlận BCTC bao gồm những sai sót, nhằm lẫn số liệu hoặc giải thích thông tin không rõ ràngnhằm lừa dối người dùng BCTC Có nhiều nguyên nhân dẫn đến những sai sót này, có thé
do lãnh đạo doanh nghiệp có ý điều chỉnh kết quả hoạt động kinh doanh, làm cho người sửdụng thông tin hiểu sai về tình hình hoạt động và khả năng sinh lời của doanh nghiệp đượckiểm toán
Các mục đích của việc gian lận BCTC bao gồm:
- Giam thiéu số thuế thu nhập doanh nghiệp (TTNDN) của công ty
- Làm tăng giá trị vốn ảo của công ty trên thị trường chứng khoán
- _ Làm cho BCTC khóp với dự báo mà những nha phân tích tài chính đã đưa ra.
- Đạt được những hợp đồng vay vốn hoặc giúp những nhà điều hành doanh nghiệp
nhận được những đãi ngộ tốt trong ngăn han.
Những sai lệch thông tin trong BCTC đã làm ảnh hưởng tiêu cực đến thị trường,ảnh hưởng đến quyết định tài chính của những nhà đầu tư và những đơn vị hỗ trợ tín dụng,đồng thời làm giảm đáng kê chất lượng của những BCTC Qua khảo sát, hành vi gian lận
biển thủ tài sản chiếm khoảng 90% [1] nhưng gây ra mức thiệt hại cho nền kinh tế là thấp
nhất Mặc dù hành vi gian lận trên BCTC có tỷ lệ thấp, nhưng gây ra những hậu quả nghiêm
trong cho nên kinh tế
1.2 Dấu hiệu của gian lận kế toán trong BCTC
1.2.1 Động cơ thực hiện gian lận BCTC
14
Trang 16Tam giác gian lận (TGGL) là mô hình nghiên cứu của nhà khoa học Donald
R.Cressey được giới thiệu vào năm 1953 [5] Công trình nghiên cứu này được coi là nềntang cơ bản dé giải thích các hành vi gian lận trong BCTC dựa trên góc nhìn hành vi Tác
giả đã tập trung phân tích, đánh giá những hành vi gian lận dưới góc độ biên thủ và tham
6 Dé tìm ra đâu là nguyên nhân của việc vi phạm pháp luật, tác giả dựa trên khảo sát với
200 tội phạm kinh tế khác nhau Mô hình TGGL mô tả các thành phần và yếu tố dẫn đến
hành vi gian lận Ngày nay, mô hình nghiên cứu TGGL này đã trở thành một trong những
mô hình chuân được sử dụng trong nhiêu lĩnh vực nghiên cứu vê gian lận.
Hình 1.2: Mô hình tam giác gian lận (Fraud Triangle) [5]
Hình 1.2 trình bày mô hình “Tam giác gian lận” [12], mô hình này gồm ba thành
phần cấu thành bao gồm: sự hợp lý hóa, áp lực và cơ hội
Sự hợp lý hóa là sự biện minh hoặc lý do mà cá nhân sử dụng dé hợp lý hóa hành
vi gian lận Đây là cách mà cá nhân thuyết phục bản thân rằng hành vi gian lận là hợp lý,
ho tìm cách dé hợp thức hóa hành vi sai trái đó và tự “thôi miên” bản thân thực hiện các
hành động gian lận.
Ap lực là những yếu tổ (bên ngoài hoặc nội bộ công ty) có thé khiến các nhà quản
lý doanh nghiệp có tình làm sai lệch BCTC [6] Ba yếu tố chính dẫn đến việc các nhà quản
lý bóp méo số liệu trên BCTC là: những rủi ro mà doanh nghiệp gặp phải liên quan đếnmôi trường kinh doanh, cân bằng kính doanh và lợi nhuận; những cạnh tranh không lành
15
Trang 17mạnh hoặc các vấn đề nội bộ của công ty; áp lực từ các bên thứ ba đối với các nhà quản lýdoanh nghiệp, chang hạn như các đối tác, cơ quan giám sát hoặc nhà dau tư.
Cơ hội là những điều kiện thuận lợi cho các nhà quản lý doanh nghiệp thực hiện cáchành vi làm sai sót nghiêm trọng trong BCTC Các BCTC có thể gian lận do ngành nghềhoạt động của công ty, cau trúc tổ chức phức tạp hoặc không én định, kiểm toán nội bộkhông hoạt động tốt và không giám sát công tác quản trị
1.2.2 Dấu hiệu gian lận trên BCTC
Dé phát hiện các gian lận trên các BCTC, các chuyên gia phân tích và kiểm toánviên (KTV) thường thực hiện phân tích, quan sát và đánh giá dựa trên nhiều dấu hiệu khácnhau Khi doanh thu của một doanh nghiệp tăng cao một cách bat thường so với các doanhnghiệp kinh doanh cùng ngành nghề là một dấu hiệu nhận thấy rõ đầu tiên
Số lượng hàng bán của doanh nghiệp bị trả về lớn hơn những doanh nghiệp kinh
doanh cùng ngành nghề và so với số lượng bán hàng trong quá khứ cũng có thê là một dấuhiệu gian lận trong BCTC Đa số trong những trường hợp này, hàng hóa bị trả về do chấtlượng không tốt hoặc không đáp ứng được yêu cầu Tuy nhiên, một số công ty có thé sửdụng hàng hóa bị hoàn tra dé che giấu các khoản doanh thu sai trong kỳ kế toán trước đó.Đây là một trong những dấu hiệu mà các chuyên gia phân tích và kiểm toán viên thường
xuyên quan sát dé phát hiện và điều tra sự gian lận trong BCTC
Doanh thu của một quý trong năm tăng bất ngờ khi so sánh với những quý kháctrong cùng một năm hoặc so với cùng thời điểm những năm trước đó Đây là một dấu hiệuthường gặp trong gian lận trên các BCTC Nếu doanh nghiệp này không hoạt động trongngành sản xuất theo mùa nhưng lại ghi nhận doanh thu tăng đột biến, cần xem xét các mụcđích và chiến lược khác nhau của doanh nghiệp trong tương lai (ví dụ niêm yết trên sànchứng khoán hoặc chuẩn bị đấu thầu dự án) Dé đạt được những mục đích nào đó, nhữnghành vi gian lận được các doanh nghiệp này đã thực hiện nhằm hợp pháp hóa những khoảnthu không tồn tại Đây là một trong những điểm quan trọng mà các chuyên gia kiểm toánthường quan tâm và phân tích để xác định tính chính xác và minh bạch của BCTC
Lợi nhuận luôn đương nhưng kết quả kinh doanh âm là một dấu hiệu cho thấy doanhnghiệp đang gian lận, điều này đặc biệt đáng quan ngại khi áp dụng cho các doanh nghiệp
đã niêm yết và hoạt động trong nhiều năm
16
Trang 18Một trong những dấu hiệu gian lận không thể bỏ qua trong BCTC là việc ghi nhận
các giao dịch và tình huống cố định không tuân theo các giả định kế toán thông thường
Trong trường hợp này, các doanh nghiệp có thé thực hiện các hành vi gian lận, chang hạnnhư không ghi nhận đúng hàng tồn kho hoặc hàng hóa bị hao tổn; cố tình kéo đài thời giankhấu hao tài sản (KHTS) hư hỏng hoặc ghi nhận không chính xác các khoản dư nợ của
khách hàng.
Một trong những "cơ hội" dé ban quan lý doanh nghiệp thực hiện hành vi gian lận
trong BCTC là quy định chung về các khoản thưởng cho ban quản lý doanh nghiệp liênquan đến các kết quả đạt được trong quá trình SXKD của công ty Các kiểm toán viên nênxem xét khả năng ban quản lý đang thực hiện hành vi gian lận BCTC nếu quy chế hoặcquy định của doanh nghiệp quy định rằng ban quản lý sẽ nhận được khoản thưởng khi đạt
được những mục tiêu đã đề ra trong hoạt động kinh doanh: ghi nhận doanh thu kinh doanh
sai lệch trong kỳ kết số nhằm mục đích chuyên số liệu doanh thu của doanh nghiệp trongcác kỳ sau về kỳ hiện tại, thực hiện các hành động gian lận để báo cáo hoàn thành các mụctiêu kinh doanh đã được đề ra trước đó
Một trong những hình thức gian lận phố biến thường gặp trong các BCTC, đó làthực hiện "làm đẹp" BCTC bằng cách nâng cao lợi nhuận thông qua việc ghi nhận chỉ phícho những khoản không được vốn hóa Thủ thuật gian lận này được gọi là vốn hóa các chỉphí Điều này thường xảy ra khi các khoản chỉ phí được dành cho hoạt động SXKD phátsinh trong ky lại được ghi nhận vào BCDKT thay vì được trừ trực tiếp vào lợi nhuận, làmgiảm báo cáo lỗ lãi Các loại chi phí dé bị gian lận, làm giả số liệu khi thực hiện vốn hóacho các khoản chi phí thường gặp gồm:
- Khởi nghiệp: là khoản chi có liên quan đến việc khởi động một dự án mới
- Chi phí nghiên cứu: là khoản chi phí liên quan đến các hoạt động nghiên cứu và
phát triển
- Bảo trì: là khoản chi dùng dé duy trì và sửa chữa các tài sản hiện có
- _ Các khoản chi phí dùng dé xây dựng hệ thống: hệ thống phần mềm, phát triển
website hoặc chương trình quản lý.
- Chi phí phát triển tài sản vô hình: là khoản chi liên quan đến phát triển các tài
sản vô hình như sở hữu trí tuệ.
- Chi phí quảng cáo: là các khoản chi dùng cho hoạt động quảng cáo và tiếp thị
17
Trang 19- Chi phí lãi vay: là khoản chi phí lãi phát sinh từ các khoản vay.
- _ Các khoản chi phí khác: bao gồm chi phí được trả trước hoặc chi phí phát sinh
từ việc hoãn lại các chi phi
Hành vi không nhất quán trong việc định giá tài sản và nghĩa vụ nợ của một công ty
có ý nghĩa quan trọng trong lĩnh vực TCKT Đây là một van đề nghiêm trong vì quyết địnhđịnh giá không chính xác có thé dẫn đến TTTC không đáng tin cậy và sai lệch trong BCTC
Các tài sản ngắn hạn của công ty (bao gồm hàng hóa tồn kho, các khoản chỉ phí phải thu)
lại được ghi nhận sai lệch thành tài sản dài hạn của công ty dé gian lận
Các khoản tạm ứng và chi phí dự phòng của doanh nghiệp có sự chênh lệch đáng kể
so với những doanh nghiệp cùng ngành, đồng thời có thay đổi mạnh qua thời gian có thể
là dấu hiệu đáng chú ý trong phân tích BCTC Trong một số trường hợp, như trong lĩnhvực ngân hàng, việc trích lập dự phòng chi phí cho các khoản rủi ro tín dụng có thé biếnđộng theo từng thời điểm khác nhau là hoàn toàn hợp lý do việc tồn đọng nợ xấu Tuynhiên, trong một số ngành nghề khác, các công ty có thê sử dụng các đối sách, chiến lượctrích lập dự phòng dé anh hưởng đến kết quả tài chính một cách không minh bach:
- Trích lập dự phòng cao để giảm lỗ và giảm thuế: Doanh nghiệp có thé đánh giá
quá cao rủi ro và trích lập dự phòng lớn dé làm giảm ghi nhận số liệu lợi nhuận
và do đó giảm chi phí phải nộp của doanh nghiệp.
- _ Trích lập dự phòng thấp dé che giấu lỗ: Ngược lại, nếu các khoản trích lập chi
phí dự phòng của doanh nghiệp thấp hơn những doanh nghiệp cùng ngành, điềunày có thé là dau hiệu của việc thay đổi số liệu tài chính tốt hơn khi niêm yết vàche giấu những khoản thua lỗ.
Nhiều công ty có lợi thế thương mại thường có tỷ trọng cao trong tong tài sản trongquá trình hợp nhất kinh doanh (HNKD), nhưng điều này không được bao gồm trong chiphí sản xuất Chính vì vậy, doanh nghiệp cần thường xuyên đánh giá lại những lợi thếthương mại, đặc biệt khi giá trị hợp lý giảm sút Khi điều này xảy ra, các giá tri giảm sút
sẽ được ghi nhận vào những khoản chi phí SXKD của công ty Quá trình hạch toán, xử lý,
và đánh giá lợi thé thương mại đã trải qua nhiều điều chỉnh và thay đổi trong quá trình tiếnhành kế toán, đảm bảo rằng các TTTC liên quan đến lợi thế thương mại được báo cáo một
cách chính xác và minh bạch, phản ánh chính xác quá trình SXKD và những hoạt động tài chính của doanh nghiệp.
18
Trang 20Sự gia tăng các khoản chỉ phí liên quan đến việc giảm hàng tồn kho và những khoản
phí cần thu hồi có thể cho thấy doanh nghiệp này đang gặp khó khăn trong hoạt động quản
lý tài chính và quản lý chuỗi cung ứng Điều này thường chỉ ra sự thu hẹp quy mô hoạtđộng kinh doanh và có thé là dấu hiệu của các vấn đề như chậm thu tiền từ khách hanghoặc áp lực tài chính do tăng các khoản phải trả, doanh nghiệp đang đồng thời thực hiện
việc mua bán và cho thuê những tài sản của mình.
1.2.3 Một số hình thức gian lận thường gặp trên BCTC
Các hành vi gian lận trên BCTC được thực hiện thông qua nhiều thủ thuật khác nhau.Hành động gian lận thường thay trên các BCTC là che giấu những khoản công nợ và không
kê khai những khoản chỉ phí phát sinh, mục đích gia tăng lợi nhuận khai khống trước thuếbang cách giảm bớt chi phí và công nợ được ghi nhận Trong trường hợp này, những khoảnlợi nhuận trước thuế sẽ được tăng lên dé phù hợp với những chi phí và công nợ bị che dau.Các phương pháp thực hiện gồm:
- Khong thực hiện ghi nhận (KTHGN) công nợ và các khoản chi phí, đặc biệt là
Ngoài ra một trong những thủ thuật thường gặp tại các công xây dựng đó là ghi nhận doanh
thu hoặc những khoản chỉ phí phát sinh không đúng kỳ kết toán Hành vi này được gọi làghi nhận sai niên độ Dé điều chỉnh thu nhập theo ý muốn, một số công ty thực hiện chuyênđổi những doanh thu hoặc các khoản chi phí phát sinh từ kỳ này sang kỳ phát sinh khác
Các hình thức thường gặp đề định giá sai tài sản trên BCTC bao gồm:
19
Trang 21- Một số mặt hàng tồn kho đã bị hư hỏng hoặc hết hạn nhưng không thực hiện ghi
nhận khuyến mãi
- KTHGN những khoản dự phòng hư hao, giảm giá dành cho những mặt hang ton
kho, những khoản công nợ và những khoản đầu tư
- Dinh sai giá trị các tài sản như tài sản hợp nhất qua quá trình kinh doanh từ các
doanh nghiệp khác nhau, không phân loại đúng các loại tài sản (tài sản cố định,
tài sản linh động) và các khoản chi phí (hữu hình và vô hình).
.2.4 Ảnh hưởng của gian lận trên BCTC đến các đối tượng sử dụng
BCTC là kết quả cuối cùng việc thống kê kế toán tài chính (KTTC) BCTC cung
cấp thông tin chỉ tiết về tình hình kinh doanh, tài chính và kết quả của những hoạt động sảnxuất, kinh doanh và việc dòng tiền lưu chuyền của doanh nghiệp sau mỗi kỳ kế toán Đây
là nguồn thông tin quan trọng và hữu ích cho những đối tượng sử dụng BCTC, bao gồm cả
các nhà quản lý, những cô đông, nhà đầu tư và đồng thời các cơ quan quản lý nhà nước
Những đối tượng sử dụng BCTC này để đánh giá hiệu quả hoạt động SXKD của doanh
nghiệp, từ đó đưa ra những dự đoán về tình hình SXKD trong thời gian tới và đưa ra nhữngquyết định đầu tư vào doanh nghiệp Hình 1.3 mô tả sơ đồ các đối tượng sử dụng BCTC
nghiệp trong quá khứ, từ đó hỗ trợ các bên sử dụng đưa ra những quyết định quan trọng
20
Trang 22trong tương lai Ban giám đốc và nhà quản trị dựa vào thông tin này để đề ra các mục tiêukinh doanh; nhà đầu tư sử dụng dé lựa chọn chiến lược đầu tư; chủ nợ và các tô chức tíndụng quyết định về vay nợ và thu hồi nợ; cơ quan quan lý nhà nước giám sát và dam bảotuân thủ pháp luật trong sản xuất kinh doanh Việc gian lận trong BCTC có thé dẫn đếnnhững thông tin không chính xác, ảnh hưởng đến các quyết định của các bên sử dụng Điềunày có thể dẫn đến các quyết định sai lầm trong đầu tư, quản lý vốn không hiệu quả và làmgiảm đáng ké sự tin cậy và sự hấp dẫn của doanh nghiệp trước các bên liên quan.
1.3 Trách nhiệm ngăn ngừa và phát hiện gian lận trong BCTC
1.3.1 Trách nhiệm của những nhà quản trị
Lãnh đạo của doanh nghiệp có trách nhiệm hàng đầu trong việc ngăn ngừa và pháthiện các hành vi gian lận trong BCTC Đề thực hiện trách nhiệm này, họ cần cam kết xâydựng một văn hóa tô chức trung thực và đạo đức, cũng như tăng cường hoạt động giám sáttrong các hoạt động sản xuất và kinh doanh Trong quá trình giám sát, ban giám đốc và banquản lý cần đánh giá khả năng xảy ra các hành vi kiểm soát nội bộ bị thiếu sót hoặc cáchành động có thé ảnh hưởng không thuận lợi đến quá trình lập và trình bày BCTC
1.3.2 Trách nhiệm của những kiểm toán viên
Kiểm toán viên (KTV) chịu trách nhiệm bảo đảm tính đúng đắn của BCTC tổng thé,bao gom việc xác định có tồn tại sai sót số liệu do gian lận hay nhằm lẫn trong quá trìnhlập BCTC Tác động của sai sót trọng yếu do gian lận đặc biệt nghiêm trọng Rủi ro củasai sót trọng yêu đo gian lận cao hơn so với sai sót trọng yéu do nhằm lẫn, điều này xảy rabởi vì những hành vi gian lận có thê được thực hiện rất tinh vi và được che giấu kỹ lưỡngnhằm qua mặt KTV, như làm giả hồ sơ, cố ý không ghi chép hoặc thiếu các giao dịch, cungcấp thông tin sai lệch dé lừa dối kiểm toán viên
Đề đảm bảo BCTC là hợp lý, trong suốt quá trình kiểm toán, các KTV luôn phải giữ
thái độ hoài nghi về tính tính đúng đắn của BCTC Kiểm toán viên phải xem xét khả nănglãnh đạo doanh nghiệp có thé kiểm soát, thực hiện chi phối kết quả của BCTC; cũng nhưcác phương pháp kiểm toán trước đây sẽ không mang lại hiệu quả cao, trong khi nhữnggian lận kế toán ngày một tinh vi hơn Những quy định này nhằm mục đích hỗ trợ công táckiểm toán thực hiện chính xác hơn và đánh giá những rủi ro có thể bị sai sót do gian lận tốthơn, cũng như cải tiến trình tự kiểm toán, những quy trình dé phát hiện những gian lận
trong BCTC một cách hiệu quả.
21
Trang 231.3.3 Trách nhiệm của những cơ quan Nhà nước
Bên cạnh Ban Giám đốc, nhà quản trị doanh nghiệp, lãnh đạo công ty và KTV, cơ
quan quan ly nhà nước (CQQLNN) đóng vai trò cực ky quan trọng trong việc phát hiện
các gian lận trên BCTC (Ủy ban Chứng khoán, cơ quan quản lý thuế) Các CQQLNN cóthâm quyền có trách nhiệm ban hành các văn bản quy phạm pháp luật (VBQPPL), trong
đó cần quy định rõ những hình thức xử phạt (hành chính, hình sự) đối với những hành vigian lận trên BCTC Đề hạn chế việc các doanh nghiệp và tô chức lợi dụng những kẽ hởcủa pháp luật nhằm thực hiện những hành vi vi phạm pháp luật, các VBQPPL được banhành cần đảm bảo tính chặt chẽ
1.4 Đặt vấn đề
Trong thời đại ngày nay, cùng với sự phát triên nhanh như vũ bão của công nghệ thì
quy mô kinh doanh ngày càng mở rộng, nguy cơ về gian lận kế toán đã trở thành một tháchthức đáng kể đối với doanh nghiệp và HTTC toàn cầu GLKT không chi đơn thuần là mộtvan đề riêng của các doanh nghiệp mà còn mang theo những hậu quả rất lớn đối với tínhminh bạch và công bằng trong quản lý tài chính Một trong những hậu quả chính của gianlận kế toán là ảnh hưởng đến uy tín của doanh nghiệp Theo báo cáo về GLTC toàn cầu và
khảo sát thanh toán cua Cybersource, Merchant Risk Council (MRC) và Verifi vào năm
2022 [8], cho thay mức độ ảnh hưởng của GLTC tăng so với năm trước đó nhưng các công
ty, doanh nghiệp và hộ kinh doanh chưa dau tư kỹ lưỡng đề giảm rủi ro về nó, van tin tưởng
vào các phương pháp quản lý thủ công Báo cáo được thực hiện trên 1060 doanh nghiệp,
công ty và hộ kinh doanh; trên 4 khu vực là: Châu A — Thái Bình Dương (APAC), Bắc Mỹ,Châu Âu và các quốc gia thuộc Châu Mỹ Latinh (LATAM) [8] Nội dung báo cáo chỉ ragian lận tài chính làm thất thoát doanh thu của các doanh nghiệp, công ty và các hộ kinh
doanh trong năm 2022 ở mức trung bình 3.71%, so với mức trung bình năm 2021 là 3.28%.
Khi TTTC không chính xác hoặc bị gian lận không chỉ ảnh hưởng đến doanh thucủa doanh nghiệp, điều này có thé dẫn đến sự mat lòng tin từ phía cô đông, nhà đầu tư vàđối tác kinh doanh Gian lận kế toán cũng tác động đáng ké đến thị trường tài chính nóichung Khi một số doanh nghiệp lam dụng sự không minh bach và tạo ra TTTC khôngđáng tin cậy, điều này có thể tạo ra những rủi ro và biến động không cần thiết trong hệthống tài chính toàn cầu Những tranh cãi về tính minh bạch có thé làm mất lòng tin vàothị trường, ảnh hưởng đến sự 6n định và sự tin cậy của hệ thống tài chính toàn cầu Đề đối
22
Trang 24phó các thách thức này, doanh nghiệp ngày nay cần thiết lập và thực hiện các biện phápkiểm soát hoạt động kinh doanh nội bộ mạnh mẽ, sử dụng công nghệ đề theo dõi và báo
cáo TTTC một cách minh bạch và chính xác Ngoài ra, việc tăng cường giáo duc và nhận
thức về đạo đức kinh doanh trong tô chức cũng là yếu tố cực kỳ quan trọng dé ngăn chặn
và giảm thiểu nguy cơ gian lận kế toán
Thay vi sử dụng các phương pháp thủ công dé xử lý, quản lý số liệu, phân tích vàđánh giá các gian lận tài chính như trước đây, các thuật toán máy học được ứng dụng dé
xây dựng các mô hình dự đoán (MHDĐ) gian lận tài chính.
Qua tìm hiểu một vài nghiên cứu khoa học trước đây được mô tả chỉ tiết hơn ởChương 2, chúng tôi đã có cái nhìn tổng quan về GLKT trong BCTC, các nghiên cứu vàMHDĐ, phân loại GLKT Nhìn chung các nghiên cứu phần nhiều dang dựa trên các tỷ số
tài chính (TSTC) cụ thể và sử dụng các mô hình riêng biệt nên hiệu suất chưa thực sự tốt
Các thuật toán được đa số các nhà nghiên cứu lựa chọn là Cây quyết định (Decision Tree),
Rung Ngẫu Nhiên (RNN), Naive Bayes, May véc to hỗ trợ (SVM) va Mang no-ron Từ
day, chúng tôi đã định hướng nghiên cứu xây dung một mô hình phát hiện va phân loại
gian lận trong gian lận kế toán băng cách tiến hành trích xuất từ các BCTC giá trị của 28
dữ liệu thô ra thành dữ liệu lưu vào tập tin csv và phương pháp máy học tong hợp được sử
dụng đề dự đoán BCTC gian lận hay không gian lận
Dữ liệu tài chính thô là khối xây dựng cơ bản nhất của một HTKT Chính vì vậy đềtài này của chúng tôi hướng đến sử dụng phương pháp máy học tổng hợp dé trích xuất rađược nhiều thông tin hữu ích từ dit liệu tài chính thô Phương pháp máy học tổng hợp sẽ
có độ chính xác cao hơn và khắc phục các hạn chế về hiện tượng quá khớp (HTQK) của
các mô hình máy học riêng biệt trước đây.
1.5 Phát biểu bài toán cần giải quyết
Qua tìm hiêu về đặc trưng của các BCTC, dâu hiệu của gian lận kê toán và trách
nhiệm ngăn ngừa, phát hiện gian lận của cả cộng đồng, chúng tôi đã suy nghĩ nghiên cứu
và xây dựng mô hình dé phát hiện GLKT trong BCTC bằng phương pháp máy học tổnghợp Đầu vào của nghiên cứu là các BCTC và đầu ra là kết quả dự đoán (KQDĐ) BCTC
đó có gian lận hay không nhằm khuyến nghị đến người sử dụng BCTC và giúp họ han chếcác ảnh hưởng nghiêm trọng của nó Ngoài ra, xây dựng mô hình phát hiện GLKT bằng
23
Trang 25thuật toán máy hoc tông hợp nhằm đề xuất giải pháp tự động hóa quy trình phát hiện GLKT,giảm thiểu sự phụ thuộc vào sự can thiệp của con người.
1.6 Kết luận chương
Các gian lận kế toán hay gian lận trên BCTC thường được tiến hành một cách bímật và khi nó được phát hiện thì hậu quả nghiêm trọng thường đã xảy ra, ảnh hưởng đếncác bên sử dụng BCTC Do đó, việc xây dựng mô hình phát hiện GLKT là cực kỳ cần thiết,mang lại giá trị đáng kế cho các doanh nghiệp và HTTC, giảm thiểu những rủi ro khi đưa
ra những quyết định sai lầm đối với nhà đầu tư, cũng như ban quản lý doanh nghiệp
24
Trang 26Chương 2 CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN
Trong chương này chúng tôi mô tả các công trình nghiên cứu liên quan đã tìm hiểunhằm đánh giá và lựa chọn ứng dụng các MHMH phù hợp đề xây dựng các MHDĐ gianlận kế toán
2.1 Các công trình nghiên cứu liên quan
Trên thê giới đã có rat nhiêu các công trình nghiên cứu vê GLTC kê toán và việc ứng dụng các thuật toán máy học trong việc phát hiện các GLKT này.
Imane Sadgali va các cộng sự (2019) [9] đã nghiên cứu về hiệu suất của các kỹ thuật
học máy trong việc phát hiện GLTC Các tác gia đã tập trung vào việc đánh giá và so sánh các phương pháp học máy khác nhau trong việc phát hiện gian lận tài chính Các tác giả đã
thực hiện thí nghiệm và đánh giá hiệu suất của các thuật toán học máy, bao gồm Cây quyết
định, RNN, Naive Bayes, Máy véc tơ hỗ trợ và Mạng Nơ-ron Các thuật toán này đã được
áp dụng dé xây dung các mô hình phát hiện gian lận từ các tập dữ liệu tài chính Kết quả
của nghiên cứu cho thay rang các phương pháp học máy có khả năng phát hiện GLTC với
độ chính xác khá cao Các MHDĐ dựa trên SVM và mạng Nơ-ron đạt được hiệu suất tốtnhất trong việc phát hiện gian lận
Yang Bao và cộng sự (2020) [10] đã nghiên cứu về việc sử dụng phương pháp họcmáy dé phát hiện GLKT trong các công ty niêm yết tại Hoa Kỳ Bài báo tập trung vào việcphát triển một mô hình học máy tổng hợp đề xác định các dấu hiệu GLKT trong dữ liệu tàichính của các công ty Các tác giả đã sử dụng mô hình RUSBoost, SVM và hồi quy Logistic
dé xây dựng mô hình phát hiện gian lận Tác gia đã trích xuất các đặc trưng từ các dữ liệutài chính thô và thông tin công ty, sau đó sử dụng chúng dé phân loại các công ty có khảnăng GLKT Kết quả của nghiên cứu cho thấy rằng các phương pháp máy học tổng hợp cókhả năng phát hiện GLKT tốt hơn hai mô hình chuẩn
Matin N.Ashtiani và cộng sự (2022) [11] đã nghiên cứu về cách áp dụng phươngpháp máy học và kỹ thuật khai phá dữ liệu để phát hiện gian lận trong BCTC, giúp cải thiệnquá trình kiểm tra và xác minh tính chính xác của TTTC Các tác giả đã tổng hợp cácnghiên cứu đã được thực hiện về việc sử dụng máy học và khai phá dữ liệu dé phat hién
những gian lận trên BCTC, thực hiện đánh giá các phương pháp và kỹ thuật được sử dụng
trong các nghiên cứu trước đây, xác định các ưu - nhược điểm của các phương pháp hiện
có và dé xuât hướng phát triên và nghiên cứu tương lai trong lĩnh vực này.
25
Trang 27Byungdae An và cộng sự (2020) [12] đã đề xuất phương pháp RNN sửa đổi
(Modified Random Forest — MRF) dé phát hiện các gian lận tồn tại trên BCTC MRF làmột biến thé của thuật toán RNN được tinh chỉnh dé tăng khả năng nhận diện gian lận Xây
dựng quy tắc quyết định từ MRF dé xác định các đặc điểm và mẫu gian lận trong BCTC.Quy tắc quyết định này có thé được sử dụng để phân loại các BCTC là "gian lận" hoặc
"không gian lận" Các tác giả đã tiến hành đánh giá hiệu suất của phương pháp MRF bằngcách so sánh phương pháp này với các phương pháp khác và đưa ra kết quả, phân tích về
độ chính xác và hiệu suất của phương pháp Cụ thể phương pháp MRF có độ chính xác
80,58% và lớn hơn một số mô hình chuẩn khác
Yang Liu và cộng sự (2021) [13] đã nghiên cứu giải quyết vấn đề mất cân băng dữliệu trong phát hiện gian lận bằng cách sử dụng một phương pháp học không cân bằng dựatrên mạng nơ-ron đồ thị (Graph Neural Network - GNN) GNN là một mô hình học sâuđược thiết kế đặc biệt để làm việc trên các đồ thị hoặc đữ liệu có cấu trúc tương tự Phươngpháp "lựa chọn kỹ lưỡng (Pick and Choose)" được sử dụng để chọn lọc và lựa chọn mộttập dữ liệu con từ tập dữ liệu ban đầu dé tạo ra một tập dữ liệu cân bằng hơn cho huấnluyện mô hình Quá trình này giúp tăng cường khả năng phát hiện gian lận bằng cách tậptrung vào các mẫu quan trọng và quan tâm Hiệu suất của phương pháp học không cân
bằng được đánh giá dựa trên GNN và lựa chọn kỹ lưỡng trong việc phát hiện gian lận và
đã cho thấy phương pháp mới sử dụng GNN cải thiện hiệu suất phát hiện gian lận trongcác hệ thống tài chính và quản lý rủi ro
Ở Việt Nam, có nhiều sự quan tâm về việc gian lận trong BCTC nhưng đa sé dừnglại ở việc nghiên cứu về biểu hiện, gian lận trong các báo cáo chứ chưa có nhiều nghiêncứu về mô hình đánh giá và phân loại gian lận trong BCTC kế toán
Trong tạp chí nghiên cứu khoa học năm 2022 tác giả Đặng Ngọc Hùng và cộng sự
[14] đã nghiên cứu dé xuất việc sử dụng thuật toán RNN trong việc phát hiện gian lận trongbáo cáo tài chính RNN là một thuật toán học máy dựa trên việc kết hợp nhiều cây quyết
định để tạo ra một dự đoán chính xác và ổn định Khi sử dụng thuật toán RNN, mô hình
này có khả năng dự báo chính xác 91% Nghiên cứu đã cung cấp câu trả lời cho câu hỏi vềcác yếu tố quan trọng có ảnh hưởng đến gian lận BCTC va khả năng dự đoán chính xác
cao.
26
Trang 28Năm 2022, Tác giả Bùi Thu Hiền và cộng sự [15] đã sử dụng dữ liệu BCTC thu
thập từ 97 công ty xây dựng dé nghiên cứu ảnh hưởng của GLKT trên BCTC đến giá trị cổ
phiêu, những công ty này đã được niêm yét trên thị trường chứng khoán và BCTC đã đượckiểm toán Thông qua phương pháp định lượng phù hợp với dữ liệu bảng, nghiên cứu đãchỉ ra mối tương quan chặt chẽ giữa các TSTC sinh lời GP/TA, NP/TA và SALES/TA,đồng thời phát hiện ra giá cô phiếu của các doanh nghiệp xây dựng bị ảnh hưởng nghiêm
trọng bởi nhóm các tỷ số sinh lời này
2.2 Các vấn đề tồn tại
2.2.1 Nhiều thông tin có giá trị trong dữ liệu tài chính thô chưa được khai thác
Dữ liệu tài chính thô là dir liệu ban đầu và chưa được xử lý hoặc phân tích trongngành tài chính Được trích xuất trực tiếp từ các tài liệu tài chính của một doanh nghiệp,
như BCTC, BCDKT, lợi nhuận và lỗ lãi, hoặc các báo cáo khác Dữ liệu này được thu thập
từ hồ sơ của các công ty hoặc các cơ quan tài chính quản lý, cơ quan kiểm toán Dữ liệu tàichính thô cung cấp cơ sở ban đầu cho việc phân tích và xử lý tiếp theo dé đưa ra các thôngtin và dự đoán về hiệu suất tài chính của một doanh nghiệp
Như được trình bày ở trên, dữ liệu tài chính thô là dữ liệu sốc ban đầu và chưa được
xử lý, dit liệu được cung cấp bởi nhiều nguồn khác nhau như cơ quản quan lý, cơ quankiểm toán nên những dữ liệu thô này thường gặp phải các vấn đề:
- Chat lượng dit liệu: Dữ liệu tài chính thô có thé chứa các lỗi, thiếu sót hoặc thông
tin thiếu chính xác do nhiều nguyên nhân như nhập liệu sai, quy trình thu thập
dữ liệu không chính xác, hoặc gian lận dữ liệu.
- _ Dữ liệu không đồng nhất: Thu thập từ các nguồn khác nhau có thé không đồng
nhất về định dang, cau trúc hoặc don vị đo lường, gây khó khăn trong việc phân
tích và so sánh.
- Pham vi đữ liệu: Dữ liệu tài chính thô ngày càng trở nên phức tap, đòi hỏi công
nghệ và phương pháp xử lý dữ liệu phức tạp hơn để có thể hiểu và phân tích
- Bảo mật đữ liệu: Dữ liệu tài chính thô thường chứa thông tin nhạy cảm về doanh
nghiệp và cá nhân, do đó cần có biện pháp bảo mật và tuân thủ quy định vềquyên riêng tư.
27
Trang 29- Kha năng tích hop dit liệu: Do các hệ thống tài chính thường phân tán và không
liên kết tốt, việc tích hợp dữ liệu từ nhiều nguồn khác nhau có thể trở thành một
thách thúc.
Dé giải quyết những van đề này, các tổ chức thường áp dụng các phương pháp như
kiểm định dữ liệu, chuẩn hóa định dang và quy trình, sử dụng công nghệ thông tin tiên tiếnnhư trí tuệ nhân tạo và học máy đề tự động hóa quy trình xử lý dữ liệu và tăng cường cácbiện pháp bảo mật và tuân thủ quy định về quyền riêng tư
a“
BAO CAO
Hình 2.1: Các loại dữ liệu thường gặp trong BCTC
2.2.2 Hiện tượng quá khớp (overfitting)
HTQK là hiện tượng không mong muốn trong các MHMH hoặc thống kê dit liệu.Khi xảy ra hiện tượng quá khớp, mô hình thường hoạt động tốt trên dữ liệu huấn luyện
nhưng kém hiệu quả khi áp dụng cho dữ liệu mới (cụ thể là dữ liệu kiểm thử) Điều này
thường xảy ra khi mô hình quá phức tạp hoặc khi dữ liệu huấn luyện quá ít
28
Trang 30Độ chính xác tập huấn luyện
Hiện tượng quá khớp
Hình 2.2: Hiện tượng quá khớp trong phân loại dữ liệu
Trong báo cáo tài chính, HTQK có thé ám chỉ đến việc tạo ra một MHDD hoặc phantích dựa trên dữ liệu lịch sử mà quá phụ thuộc vào các yếu tố đặc biệt của thời điểm đó màkhông thể áp dụng được cho các điều kiện tương lai hoặc các tình huống khác Khi mộtcông ty có thé sử dụng mô hình dự đoán dựa trên dữ liệu tài chính trong lịch sử dé đưa racác dự báo về lợi nhuận trong tương lai Nếu mô hình quá phụ thuộc vào các biến số cụ thểcủa quá khứ mà không cân nhắc đến các yếu tô mới có thé phat sinh trong tương lai, nhưbiến động thị trường, thay đồi chính sách, hoặc công nghệ mới Hiện tượng quá khớp xảy
ra và dẫn đến các dự đoán không chính xác hoặc không ồn định khi áp dụng mô hình vàocác điều kiện mới, từ đó ảnh hưởng đến quá trình ra quyết định kinh doanh và đầu tư của
công ty.
2.2.3 Mô hình riêng biệt thì chỉ số đánh giá không cao
Các mô hình phân loại riêng biệt thường tập trung vào một biến phụ thuộc (BPT)
va một hoặc nhiều biến độc lập (BDL) dé dự đoán hoặc đánh giá biến phụ thuộc, chính vìvậy các mô hình riêng biệt thường có chỉ số đánh giá không cao Các mô hình phân loạiriêng biệt phổ biến:
s* Hồi quy tuyến tính (HOTT): Giả định mối quan hệ tuyến tính giữa BPT và các
BDL Mô hình HQTT tìm ra một đường thang tốt nhất dé dự đoán giá trị củabiến phụ thuộc dựa trên giá tri của các BDL
“+ Hồi quy logistic: Mô hình này được sử dụng khi BPT là một biến nhị phân hoặc
được giới hạn trong khoảng cô định Mô hình hồi quy logistic dự đoán xác suất
của sự kiện xảy ra dựa trên giá tri của các BDL.
29
Trang 31* +* Mô hình cây quyết định: Mô hình phân chia dit liệu thành các nhóm con dựa
trên các quy tắc quyết định dựa trên các BDL Mô hình cây quyết định tạo ra
một cây quyết định có nhiều nhánh, mỗi nhánh đại diện cho một quy tắc quyếtđịnh để dự đoán BPT
“Mang no-ron nhân tạo: Mô hình được xây dựng dựa trên cau trúc của não người,
mô hình sử dụng dé học các mối quan hệ phức tạp giữa các BDL và BPT thông
qua việc sử dụng nhiêu lớp neuron.
>
trong dữ liệu dựa trên các BDL và tối ưu hóa khoảng cách giữa các điểm dữ liệu
và siêu mặt phăng.
Việc kết hợp các mô hình riêng biệt giúp cải thiện tính chính xác và én định của dựđoán, đồng thời giảm thiêu tác động của hiện tượng quá khớp (overfitting), trong đó môhình máy học tổng hợp được sử dung dé tăng cường kết qua phân loại
2.3 Kết luận chương
Qua nghiên cứu của những tác giả trên đây, chúng tôi đã có cái nhìn tông quan về
gian lận kế toán trong báo cáo tài chính, các nghiên cứu và mô hình dự đoán, phân loạigian lận kế toán Nhìn chung các nghiên cứu phần nhiều đang dựa trên các tỷ số tài chính
cụ thể và sử dụng các mô hình riêng biệt nên hiệu suất chưa thực sự tốt Các thuật toánđược đa số các nhà nghiên cứu lựa chọn là Cây quyết định, RNN, Naive Bayes, Máy véc
tơ hỗ trợ (SVM) và Mạng nơ-ron Từ đây, chúng tôi đã định hướng nghiên cứu xây dựng
một mô hình phát hiện và phân loại gian lận trong GLKT bằng cách tiến hành trích xuất từ
các BCTC giá trị của 28 dữ liệu thô ra thành dữ liệu lưu vào tập tin csv và phương pháp
máy học tông hợp được sử dụng dé dự đoán BCTC gian lận hay không gian lận
Dữ liệu tài chính thô là khối xây dựng cơ bản nhất của một HTKT Chính vì vậy đềtài này của chúng tôi hướng đến sử dụng phương pháp máy học tong hợp dé trích xuất rađược nhiều thông tin hữu ích từ đữ liệu tài chính thô Phương pháp máy học tổng hợp sẽ
có độ chính xác cao hơn và khắc phục các hạn chế về HTQK của các mô hình máy học
riêng biệt trước đây.
30
Trang 32Chương 3 MÔ HÌNH ĐÈ XUẤT
Chương này trình bày phần kiến trúc hệ thống của phương pháp đề nghị dé xây dựngMHMH mô hình máy học phát hiện các GLKT Nội dung bao gồm so đồ hoạt động, công
nghệ thực hiện, phương pháp sử dụng trong bài toán phát hiện các GLKT trong các BCTC.
Hình 3.1: Mô hình hệ thống đề xuất dự đoán GLKT
Chúng tôi đề xuất MHDĐ gian lận kế toán được thé hiện trong hình 3.1 Đầu vàocủa mô hình là bộ dữ liệu COMPUSTAT bao gồm thông tin về BCTC của các công tyniêm yết trên thị trường chứng khoán và bộ dữ liệu AAER của SEC chứa thông tin về cáccuộc điều tra và các biện pháp trừng phạt liên quan đến vi phạm kế toán và kiểm toán củacác công ty niêm yết trên thị trường chứng khoán Hoa Kỳ Chúng tôi tiến hành chia bộ dữliệu BCTC làm thành 2 phan, trong đó 80% bộ dữ liệu dé làm tập dữ liệu huấn luyện, 20%
bộ dữ liệu dé làm tập dữ liệu kiểm thử Tại mỗi tập dữ liệu huấn luyện và dữ liệu kiểm thử
chúng tôi tiền hành trích xuất đặc trưng; trích xuất giá trị của các đặc trưng đó trong BCTC
và tiễn hành lưu trữ số liệu vào tập tin csv Với tập tin csv được tạo ra từ tập dữ liệu huấnluyện chúng tôi sử dụng các MHMH để huấn luyện Sau khi huấn luyện mô hình thànhcông, với mô hình nhận được, chúng tôi tiến hành sử dụng tập tin csv được tạo ra từ tập dữliệu kiêm thử dé phân loại dữ liệu BCTC gian lận hoặc không gian lận Sau cùng, chúngtôi tiến hành phân tích kết quả ghi nhận được và đánh giá mô hình
31
Trang 333.2 Diễn giải chỉ tiết mô hình
3.2.1 Dữ liệu
Dữ liệu dùng đề tiến hành thực nghiệm được kế thừa từ bộ dữ liệu của nghiên cứutrước đây [10] Qua tìm hiểu từ nghiên cứu trước đây [10], chúng tôi biết được tập dữ liệu
này bao gồm dữ liệu từ bộ đữ liệu COMPUSTAT bao gồm thông tin về BCTC của các
công ty niêm yết trên thị trường chứng khoán từ năm 1990 đến năm 2014 và bộ dữ liệuAAER của SEC chứa thông tin về các cuộc điều tra và các biện pháp trừng phạt liên quanđến vi phạm kế toán và kiểm toán của các công ty niêm yết trên thị trường chứng khoán
Hoa Kỳ [16] từ ngày 17 tháng 05 năm 1982 đến ngày 31 tháng 12 năm 2018
Bộ dữ liệu thực nghiệm là dữ liệu BCTC của hơn 700 công ty ở Hoa Kỳ, thời gian
thu thập từ năm 1990 đến năm 2014 Mỗi một dòng trong tập tin dữ liệu thực nghiệm là sỐliệu BCTC của một công ty trong một năm Bộ dữ liệu bao gồm 146,045 dữ liệu BCTC,trong đó 964 dữ liệu BCTC gian lận; 145,081 dữ liệu BCTC không gian lận Da số, cácBCTC gian lận thuộc nhóm gian lận về dòng tiền, có nghĩa là các công ty thực hiện cáchành vi để che giấu hoặc làm giả đòng tiền của công ty
Với bộ dữ liệu này chúng tôi tiễn hành phân chia làm thành 2 tập dữ liệu là tập dữliệu huấn luyện và tập dữ liệu kiêm thử Tập dữ liệu huấn luyện chiếm 80% của bộ dit liệu
là những dữ liệu BCTC từ năm 1990 đến năm 2009 Tập dữ liệu huấn luyện có 118,349 dữliệu, trong đó có 117,465 BCTC không gian lận, 883 BCTC gian lận Tập dữ liệu kiểm thửchiếm 20% của bộ đữ liệu là những dữ liệu BCTC từ năm 2010 đến năm 2014 Tập dữ liệu
kiểm thử có 27,698 dit liệu, trong đó có 27,616 BCTC không gian lận, 81 BCTC gian lận
Ở phần này đóng góp của chúng tôi là chúng tôi đã tìm hiểu và mô tả rõ cách thức
để thực hiện tìm kiếm các BCTC và kết nối với thông tin về các cuộc điều tra và các biệnpháp trừng phạt liên quan đến vi phạm kế toán và kiểm toán của BCTC đó từ 2 bộ dữ liệu
COMPUSTAT và AAER Mục đích của công việc này nhằm hỗ trợ các công trình nghiên
cứu khác có thé nắm rõ về cách thức thực hiện thu thập dé tạo ra nguồn liệu thực nghiệmdéi dao hơn Nội dung chi tiết của phần tìm hiểu này sẽ được mô tả cụ thé hon ở mục
3.2.2.2.
32
Trang 343.2.2 Rút trích đặc trưng
3.2.2.1 Các đặc trưng ảnh hưởng đến gian lận kế toán
Qua tìm hiểu từ các nghiên cứu trước đây [10], chúng tôi lựa chọn 28 đặc trưng (haycòn gọi là 28 danh mục dữ liệu thô) dé nghiên cứu Ly do chúng tôi lựa chọn 28 đặc trưng
này bởi vì theo báo cáo sô liệu thông kê mô tả vê tâm quan trọng trung bình của các danh
mục dữ liệu thô đối với MHMH tổng hợp thì 28 danh mục này có tam quan trong cao Bên
cạnh đó, chúng tôi lựa chọn 28 danh mục nay để có sự tương đồng về các đặc trưng nghiên
cứu, với tập dữ liệu đâu vào giông nhau thì khi so sánh các kêt quả thực nghiệm giữa nghiên
cứu này và các nghiên cứu trước đây cũng rõ ràng và khách quan hơn Dé biết mô tả chitiết hơn về chức năng “tầm quan trọng dự đoán” vui lòng tham khảo thêm tài liệu số [21].Bên dưới đây là các đặc trưng ảnh hưởng đến gian lận kế toán Danh sách chi tiết về 28
đặc trưng như sau:
act: Tổng tài sản lưu động (tiền mặt, khoản phải thu, hàng tồn kho, v.v.)ap: Phải trả cho nhà cung cấp, khoản vay mua hàng hoặc dịch vụ chưa thanh toán.at: Tổng tài sản của công ty (lưu động + dài hạn)
ceq: Tổng vốn cô phan phổ thông, đại điện cho quyền sở hữu của cô đông
che: Tiền mặt và các khoản đầu tư ngắn hạn có sẵn
cogs: Chi phí phải chi trả trực tiếp dé sản xuất ra hàng hóa
csho: Số cổ phiêu mà công ty phát hành cho các cô đông của mình đang lưu thông.dlc: Phần nợ trong các khoản phải trả ngăn hạn
ditis: Số tiền phát hành nợ dai hạn trong ky
ditt: Tổng nợ dài hạn của công ty
dp: Khấu hao và KHTS vô hình, khoản chi phí không bằng tiền mặt cho việc hao
mon tài sản.
ib: Lợi nhuận trước của các khoản chỉ xảy ra bất thường, không bao gồm các sựkiện bat thường chỉ xảy ra một lần.
invt: Tông hàng tồn kho (vật liệu thô, hàng đang hoàn thành, thành phẩm)
ivao: Các khoản đầu tư và tạm ứng khác mà không phải là đầu tư ngắn hạnivst: Tổng đầu tư ngắn han do công ty nắm giữ (chứng khoán có thé giao dịch)
Ict: Tổng các khoản phải trả ngắn hạn (phải trả cho nhà cung cấp, chi phí phải tra,
V.V.).
33
Trang 35- It: Tổng nợ của công ty (ngắn han + dai hạn).
- ni: Lợi nhuận (16) ròng trong kỳ.
- _ ppegt: Tổng tài san, nhà máy và thiết bị của công ty
- _ pstk: Tổng cô phiếu ưu đãi được phát hành, đại diện cho một loại hình sở hữu với
các quyền cụ thé
- re: Lợi nhuận giữ lại, lợi nhuận tích lãy của công ty không được chia dưới dạng cỗ
tức.
- rect: Tổng các khoản phải thu của khách hàng cho các sản phâm được bán tín dụng
- sale: Tổng doanh thu bán hàng tao ra bởi công ty
- _ sstk: Số tiền bán cô phiếu phé thông và ưu đãi trong kỳ
-_ txp: Thuế thu nhập mà một doanh nghiệp phải đóng cho chính phủ
- txt: Tổng chi phí thuế thu nhập doanh nghiệp đã chi
-_ xint: Lãi vay và các chi phí liên quan, chi phi vay mượn tiền
- prcc_ f: Giá đóng cửa cô phiêu hang năm cho năm tai chính.
3.2.2.2 Tiên xử lý dữ liệu
Thu thập các BCTC từ bộ dữ liệu COMPUSTAT bao gồm thông tin về BCTC củacác công ty niêm yết trên thị trường chứng khoán Chúng tôi tìm đến các tập tin BCTChang năm (Annual report) của các công ty và tiến hành trích xuất giá trị của 28 danh mục
dữ liệu thô trong BCTC Các hình ảnh và thông tin trích xuất giá trị của 28 danh mục dữliệu thô có thé tham khảo ở tập tin BCTC theo liên kết tài liệu tham khảo (TLTK) số [17]
Dé trích xuất được số liệu, chúng tôi mở một BCTC và tìm kiếm các giá tri tuong ứng tai
các nội dung trong tập tin BCTC như các thông tin trong hình ảnh bên dưới.
e act: Tổng tài sản lưu động (tiền mặt, khoản phải thu, hàng tồn kho, v.v.)
Tu khóa tìm kiêm trong BCTC: Total current assets; Beginning inventory
476000
Property, plant and equipment, net 4,218,000
Income tax receivable 1,854,000
Capitalized software cost and other assets, net 164,000
Hinh 3.2: Hinh chup tim kiém gia tri act
e ap: Số tiền phải trả cho nhà cung cấp, đó là các khoản vay mua hang hoặc dich
vụ chưa thanh toán.
34
Trang 36Từ khóa tìm kiếm trong BCTC: Accounts payable, trade
total assets > 10,209,000.
LIABILITIES AND SHAREHOLDERS’ EQUITY
payable due within one year $ 1,121,000
Accrued expenses and other liabilities 2,100,000
‘Total cusrent liabilities = -3962.000
Hình 3.3: Hình chụp tìm kiếm giá trị ap
e at: Tổng tài sản của công ty (lưu động + dài hạn)
Từ khóa tìm kiếm trong BCTC: Total assets; Previously Reported
AEROSONIC CORPORATION AND SUBSIDIARY CONSOLIDATED BALANCE SHEETS
January 31, 2003 and 2002 ASSETS.
$ 16,093,000
LIABILITIES AND SHAREHOLDERS’ EQUITY
‹ + tt nan ‹ "
Hình 3.4: Hình chụp tìm kiếm giá trị at
e ceq: Tổng vón cô phần phô thông, đại diện cho quyền sở hữu của cô đông
Từ khóa tìm kiếm trong BCTC: Shareholders’ Equity in Balance Sheet
Balance Sheet:
Cash and Cash Equivalents $ 1,705,000 Accounts Receivable, net 4,263,000 Inventories 10,948,000
Prepaid Expenses 131,000
Deferred income taxes 422,000
Total Current Assets 17,469,000
Property, plant and equipment, net
Income tax receivable
Capitalized software cost and other assets, net
Total Liabilities 8,048,000.
14,171,000
Total Liabilities and Equity $ 22.219.000
Hình 3.5: Hình chụp tìm kiếm giá trị cep
e che: Tiền mặt và các khoản đầu tư ngắn hạn có sẵn
Từ khóa tìm kiếm trong BCTC: Cash and Cash Equivalents in Balance Sheet
Hinh 3.6: Hinh chup tim kiém gia tri che
e cogs: Chi phi phải chi trả trực tiếp dé sản xuất ra hàng hóa
35
Trang 37Từ khóa tìm kiếm trong BCTC: Cost of goods sold - Depreciation hoặc Total
Cost of Sales - Depreciation
(in thousands, except per-share amounts) 2015
Net sales $ 2,140,830
Selling, general, and administrative expenses 164,082
Research, development, and testing expenses 158,254
Operating profit 356,720
Interest and financing expenses, net 14652
Other income (expense), net (3,097)
Income from continuing operations before income tax expense 338.971
Hinh 3.7: Hinh chup tim kiém gia tri cogs
e csho: Số cô phiếu mà công ty phát hành cho các cô đông của minh đang lưu
thông.
Từ khóa tìm kiếm trong BCTC: Common Stock outstanding
Indicate by check mark whether the registrant (1) has filed all reports required to be filed by Section 13 or 15(d) of the Securities Exchange Act of 1934 during the pr
has been subject to such filing requirements for the past 90 days Yes [1 No BI
Indicate by check mark if disclosure of delinquent filers pursuant to Item 405 of Regulation S-K is not contained herein and will not be contained, to the best of regist
this Form 10-K or any amendment to this Form 10-K O.
Indicate by check mark whether the registrant is an accelerated filer (as defined in Rule 12b-2 of the Act) Yes D1 No
As of July 31, 2003, the aggregate market value of the voting stock held by non-affiliates of the registrant was $24,845,179 The aggregate market value of the voting s
As of October T, 2003, the issuer bad MORLOI9 shares of MRE a ag! oF treasury shares |
Documents Incorporated by Reference: None.
Hình 3.8: Hình chụp tìm kiếm giá tri csho
e dic: Phần nợ trong các khoản phải trả ngắn hạn (phần ngắn hạn của nợ dài hạn,
V.V.)
Từ khóa tìm kiếm trong BCTC: Nợ dài hạn và các khoản phải trả trong vòng
một năm và các khoản tín dụng luân chuyền
Total assets $ 17,269,000 $s
Total current liabilities 5,962,000
Hình 3.9: Hình chụp tìm kiếm giá tri dlc
e_ dltis: Số tiền phát hành nợ dai hạn trong kỳ
Từ khóa tìm kiếm trong BCTC: Net long-term borrowings; Net borrowings
(repayments) under revolving credit facility
36
Trang 38Cash flows from financing activities
Payments to preferred interest holders - (700)
Issuances of common stock c cece eee ee eee eee eee 1,053
Proceeds from issuance of minority interests 33
Hình 3.10: Hình chụp tìm kiếm giá trị dltis
e ditt: Tổng nợ dài hạn của công ty
Từ khóa tìm kiếm trong BCTC: Nợ dài hạn và các khoản phải trả, trừ đi kỳ hạn
e dp: Khấu hao và khấu hao tài sản vô hình, khoản chi phí không bằng tiền mặt
cho việc hao mòn tài sản.
Từ khóa tìm kiêm trong BCTC: Depreciation and Amortization
Allowance for Doubtful Accounts $ 372,000
Warranty Reserve 30,000
Hình 3.12: Hình chụp tim kiếm giá tri dp
e ib: Lợi nhuận trước của các khoản chi xảy ra bất thường, không bao gồm các
sự kiện bât thường chỉ xảy ra một lân.
Từ khóa tìm kiêm trong BCTC: Net income (loss)
Income tax benefit (expense) 22,000
Basic and diluted earnings per share $ 0.26
Total assets $ 17,269,000
Long term debt(3) $ 3,411,000
Hình 3.13: Hình chụp tìm kiếm giá trị ib
e invt: Tổng hàng tồn kho (vật liệu thô, hàng đang hoàn thành, thành phẩm)
Từ khóa tìm kiếm trong BCTC: Inventories
37
Trang 39Marketable securities, at market
Accounts and notes receivable, net of allowance for doubtful accounts of $1,308 in 2002, and $1,268 in 2001
Accounts receivable from affiliates, net
iventories
‘osts related to deferred revenue
Refundable and deferred income taxes 11567
Other current assets 7.969
Total current assets 329.743
xee-etcelzeessd seesercee mnt <30 “12
Hình 3.14: Hình chụp tìm kiếm giá trị invt
e ivao: Các khoản dau tư và tạm ứng khác (không được phân loại là đầu tư ngắn
hạn).
Từ khóa tìm kiêm trong BCTC: Income tax receivable, Asbestos insurance
receivables
Deferred income taxes 476,000
Total current assets 11,033,000
Hinh 3.15: Hinh chup tim kiém gia tri ivao
e ivst: Tổng dau tư ngắn han do công ty nắm giữ (chứng khoán có thé giao dịch)
Từ khóa tìm kiếm trong BCTC: Marketable securities, at market
$ 46013
6899
65.937
2,350 60,696
84
10,369
7410
Hình 3.16: Hình chụp tìm kiếm giá trị ivst
e _ lct: Tổng các khoản phải trả ngăn hạn (phải trả cho nhà cung cấp, chi phí phải
trả, V.V.).
Từ khóa tìm kiếm trong BCTC: Total current liabilities
Deferred income taxes 44,000
Hình 3.17: Hình chụp tìm kiếm giá trị Ict
e It: Tong nợ của công ty (ngắn hạn + dài hạn)
Từ khóa tìm kiếm trong BCTC: Total liabilities
Accrued expenses and other liabilities
Total current liabilities
Long-term debt and notes payable due after one year
Deferred income taxes
Total liabilities
Commitm contingencies
Shareholders’ equity
‘Common stock $.40 nar value: authorized 8.000.000 shares: issued 3.986.262 shares: outstanding 3.921.019 shares in 2003 and 3.919.845 shares in 2002 1.595.000
Hình 3.18: Hình chụp tìm kiếm giá tri It
38
Trang 40e nỉ: Lợi nhuận (16) ròng trong kỳ.
Từ khóa tìm kiếm trong BCTC: Net income (loss)
Casxa
Bad debt expense 7 291,000
Stock-based compensation 177,000
Hình 3.19: Hình chụp tìm kiếm giá trị ni
© ppegt: Tổng tài sản, nhà máy và thiết bị của công ty
Từ khóa tìm kiêm trong BCTC: Property, plant, and equipment, at cost
5 Property, Plant and Equipment
Property, Plant and Equipment at January 31, 2003 and 2002 consisted of the following:
Land and improvements $
Building and improvements
Machinery and equipment
Patterns, dies and tools
Fumiture and fixtures
e ps(k: Tổng cổ phiếu ưu đãi được phát hành, đại diện cho một loại hình sở hữu
Issued and outstanding — 60,000 shares in 2002 (Liquidation preference of $60,860) — 50,753
Issued — 31,576,924 shares in 2001 and 37.73 shares in 2002 Outstanding — 31,346,494 shares in 2001 and 37, 753 shares in 2002 3,157 3,773 Additional paid-in capital 228,976 310,039
Accumulated deficit (24,127) (107,593)
Hình 3.21: Hình chụp tim kiếm giá trị pstk
e re: Lợi nhuận giữ lại, lợi nhuận tích lũy của công ty không được chia dưới
dạng cổ tức
Từ khóa tìm kiếm trong BCTC: Total shareholders' equity = Retained earnings
- Accumulated other comprehensive loss hoặc Retained earnings + Additional
paid-in capital
ralue: authorized 8,000,000 shares; issued 3,986,262 shares; outstanding 3,921,019 shares in 2003 and 3,919,$45 shares in 2002
e_ rect: Tổng các khoản phải thu của khách hàng cho các sản phẩm được bán tín
dụng (mua trước trả sau).
39