CHƢƠNG 4 : KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN
4.1 Phân tích thống kê mô tả
Trước khi tiến hành các phân tích , tác giả xem xét các đặc điểm của mẫu khảo sát và phân tích sơ bộ các biến thơng qua thống kê mơ tả.
4.1.1 Đặc điểm của mẫu nghiên cứ u
Bảng 4.1 thể hiê ̣n quy mô của các công ty trong mẫu nghiên cứu được đo lường bằng tổng giá tri ̣ tài sản trung bình của hai năm 2014 và 2015. Có thể thấy tỷ lê ̣ các công ty theo quy mô trong mẫu nghiên cứu là khá đồng đều.
Bảng 4. 1 Quy mô công ty
Giá trị tài sản trung bình/năm Số lượng công ty Phần trăm (%)
Trên 1.000 tỷ đồng 46 33%
Từ trên 500 tỷ đồng đến 1.000 tỷ đồng 18 13%
Từ 100 tỷ đồng đến 500 tỷ đồng 61 43%
Dướ i 100 tỷ đồng 15 11%
Tổng cộng 140 100%
Bảng 4. 2 Thống kê mẫu theo ngành công nghiê ̣p
Ngành Số lƣơ ̣ng mẫu gian lận/mẫu đối ứng Tỷ lệ
Bất động sản & xây dựng 21 31%
Công nghệ 3 4% Công nghiệp 8 11% Dịch vụ 10 14% Hàng tiêu dùng 6 9% Năng lượng 6 9% Nông nghiệp 8 11% Nguyên vật liệu 7 10% Y tế 1 1% Tổng cô ̣ng 70 100%
Nguồn: Tác giả tổng hợp
Hầu như các công ty trong mẫu nghiên cứu đã bao phủ hết các ngành theo phân ngành của CafeF, ngoại trừ nhóm ngành Viễn thơng khơng có công ty nào đươ ̣c cho ̣n vì không đáp ứng đủ các điều kiê ̣n lấy mẫu.
Nhìn chung , ngành Bất động sản & xây dựng, Dịch vụ, Công nghiệp, Nông nghiệp chiếm tỷ tro ̣ng cao trong mẫu đươ ̣c khảo sát , các ngành còn lại chiếm tỷ trọng thấp hơn trong đó thấp nhất là ngành Y tế.
4.1.2 Thống kê mô tả biến phụ thuộc
Dựa theo nghiên cứu của Trần Thị Giang Tân & cộng sự (2015), tác giả t iến hành thu thập các số liệu kế toán cần thiết để tính tốn chênh lệch lợi nhuận trước và sau kiểm toán BCTC nhằm xem xét tình trạng gian lận BCTC của các công ty niêm yết trên TTCK Viê ̣t Nam . Với giá tri ̣ ngưỡng là 10% chênh lê ̣ch, cơng ty nào có chênh lệch lợi nhuận lớn hơn 10% đươ ̣c phân loa ̣i vào nhóm có khả năng gian
công ty không có chênh lê ̣ch lợi nhuâ ̣n hoă ̣c chênh lê ̣ch nh ỏ hơn 5% nếu có, và có cùng quy mơ, cùng ngành với các cơng ty trong nhóm có khả năng gian lận . Sớ liê ̣u thống kê mô tả cho hai nhóm công ty được thể hiê ̣n trong Bảng 4.3.
Bảng 4. 3 Thống kê mô tả khả năng gian lâ ̣n BCTC của các công ty niêm yết
Khả năng gian lận
Chênh lệch lợi nhuận trƣớc và sau kiểm toán (%)
Min Max Mean Std.
Deviation
95% Confidence Interval for Mean Lower Bound Upper Bound Gian lận 10,96 690,67 85,87 110,38 59,55 112,19 Không gian lận 0,00 4,88 1,07 1,49 0,72 1,43
Nguồn: Truy xuất từ kết quả phân tích SPSS
Nhìn vào bảng thống kê có thể thấy giá trị trung bình của chênh lệch lợi nhuận đối với mẫu gian lâ ̣n là 85,87% và biến động trong khoảng 10,96% đến 690,67%. Mẫu không gian lâ ̣n có giá tri ̣ trung bình của chênh lê ̣ch lợi nhuâ ̣n là 1,07% và dao đô ̣ng trong khoảng 0,00% đến 4,88%. Với đô ̣ tin câ ̣y 95%, khoảng ước lượng về chênh lê ̣ch lợi nhuâ ̣n trung bình của mẫu các công ty gian lâ ̣n và không gian lâ ̣n lần lươ ̣t là (59,55%; 112,19%) và (0,72%; 1,43%). Qua đó ta thấy có sự khác biê ̣t rõ ràng về giá trị chênh lệch lợi nhuận trung bình cho hai nhóm mẫu nghiên cứu .
4.1.3 Thống kê mô tả biến độc lập
Bảng tiếp theo thể hiện các giá trị thống kê cho mỗi biến tỷ số tài chính .
Bảng 4. 4 Thớng kê mơ tả các biến độc lập
Biến Minium Maximum Mean Std. Deviation
GL KGL GL KGL GL KGL GL KGL
Tỷ số sinh lợi
GP/SAL -,1473 ,0320 ,5753 ,6412 ,1640 ,1840 ,1241 ,1302
Biến Minium Maximum Mean Std. Deviation GL KGL GL KGL GL KGL GL KGL GP/TA -,0414 ,0017 ,3892 ,7994 ,1139 ,2205 ,1061 ,1647 NP/TA -,2000 -,0041 ,3778 ,3087 ,0397 ,0764 ,0726 ,0646 Tỷ số hoạt động INV/SAL ,0001 ,0001 17,2134 1,7131 ,8350 ,1827 2,3926 ,2406 REC/SAL ,0109 ,0005 ,8043 ,9596 ,2950 ,2357 ,2196 ,2269 SAL/TA ,0317 ,0405 2,8653 5,3201 ,7068 1,4467 ,5710 1,0825
Tỷ số thanh khoản
CA/CL ,3355 ,3826 67,1117 145,1129 3,8933 4,1419 9,2478 17,1507
WC/TA -,2527 -,1754 ,9661 ,9921 ,2132 ,2540 ,2395 ,2451
Tỷ số đòn bẩy tài chính
TL/TA ,0110 ,0069 ,9481 ,8321 ,4925 ,4720 ,2383 ,2113
TL/Eq ,0111 ,0069 18,2548 4,9576 1,7516 1,3022 2,4737 1,1530
Tỷ số cấu trúc tài sản
CA/TA ,0657 ,0751 ,9807 ,9990 ,5958 ,6321 ,2463 ,2315
INV/TA ,0001 ,0015 ,7039 ,7177 ,1643 ,2517 ,1574 ,1822
REC/TA ,0149 ,0003 ,6451 ,9823 ,2644 ,2471 ,1647 ,1822
CASH/CA ,0011 ,0021 ,8221 ,7805 ,1296 ,2010 ,1670 ,1647
RE/Eq -5,8362 -,3868 ,5510 ,6567 -,0341 ,1534 ,7401 ,1509
Ghi chú: GL: Gian lâ ̣n; KGL: Không gian lâ ̣n
Nguồn: Truy xuất từ kết quả phân tích SPSS
Bảng 4.4 cho thấy tất cả các biến được kiểm tra đều có sự khác biê ̣t tương đối rõ ràng về giá trị nhỏ nhất , giá trị lớn nhất , giá trị trung bình và độ lệch chuẩn giữa mẫu công ty gian lâ ̣n và mẫu công ty không gian lâ ̣n . Trong đó, mô ̣t số biến có khác biê ̣t đáng kể về giá tri ̣ nhỏ nhất như RE/Eq, giá trị lớn nhất như INV/SAL, SAL/TA, CA/CL, TL/Eq, giá trị trung bình như INV/SAL, SAL/TA, CA/CL và độ lệch chuẩn như INV/SAL, CA/CL, TL/Eq…Câu hỏi đă ̣t ra là liê ̣u có tồn ta ̣i biến tỷ số tài chính
nào có mối quan hệ có ý nghĩa thống kê với khả năng gian lâ ̣n BCTC hay không . Câu hỏi này sẽ được xem xét và kiểm tra trong các bước tiếp theo .
4.2 Phân tích tƣơng quan
Để đảm bảo dữ liệu được sử dụng trong bài nghiên cứu là phù hợp để thực hiện phân tích hồi quy, tác giả tiến hành thực hiện phân tích tương quan nhằm phát hiện những khiếm khuyết của mô hình trước khi thực hiện phân tích hồi quy. Hệ số tương quan ha ̣ng Spearman được lựa chọn để đo lường sự tương quan giữa các biến mà khơng có u cầu về phân phới ch̉n . Mă ̣c dù đô ̣ ma ̣nh của hê ̣ số tương quan hạng Spearman không bằng với hệ số tương quan Pearson , nhưng nó là phù hợp với dữ liê ̣u và mu ̣c tiêu của nghiên cứu này.
Ngồi ra, phân tích tương quan cũng giúp sớm nhận diện được các biến độc lập có hiện tượng đa cộng tuyến hay không. Hiện tượng đa cộng tuyến xảy ra khi biến độc lập trong mô hình tương quan với một biến độc lập khác. Để đánh giá mức độ đa cộng tuyến có thể sử dụng hệ số tương quan giữa các biến độc lập hoặc hệ số phóng đại phương sai VIF. Theo Gujarati & Porter (2009) nếu hệ số tương quan của một cặp biến độc lập bất kì mà cao hơn 0.8 thì mơ hình có thể gặp lỗi đa cộng tuyến nghiêm trọng. Mặt khác, nếu VIF > 10 thì có thể nhận xét đã xảy ra hiện tượng đa cộng tuyến trong mơ hình (Hồng Trọng & Chu Nguyễn Mộng Ngọc, 2005). Luận văn này lựa chọn hệ số phóng đại phương sai VIF để xem xét hiện tượng đa cộng tuyến.
Kết quả phân tích cho thấy FRAUD có mối tương quan có ý nghĩa thống kê với NP/SAL, GP/TA, NP/TA, INV/SAL, REC/SAL, SAL/TA, INV/TA, CASH/CA, RE/Eq ở mức ý nghĩa 1% (chi tiết ở Phụ lục 3).
Kết quả này là tương đối phù hợp với các nghiên cứu trước , các tỷ số tài chính đã được phát hiê ̣n là có khả năng dự báo gian lâ ̣n BCTC như SAL/TA (Spathis, 2002), NP/TA (Alade & cộng sự, 2014; Dalnial & cô ̣ng sự, 2014), GP/TA (Kirkos & cộng sự (2007), REC/SAL (Dalnial & cô ̣ng sự, 2014; Rasa & cô ̣ng sự, 2015), CASH/CA (Rasa & cộng sự, 2015). Tuy nhiên, điều đáng chú ý là các tỷ số đòn bẩy
tài chính và tỷ số thanh khoản lại khơng có mă ̣t trong danh sách này trong khi rất nhiều nghiên cứu trước đã khẳng đi ̣nh sự hữu ích của các tỷ số này trong viê ̣c phát hiê ̣n gian lâ ̣n (Persons, 1995; Spathis, 2002).
Ngoài ra, khi kiểm tra đa cộng tuyến bằng hệ số phóng đại phương sai VIF, cả 9 biến có mối tương quan với FRAUD đều có VIF < 10, từ đó có thể khẳng định không xảy ra hiện tượng đa cộng tuyến giữa các biến này (xem Phụ lục 4).
Vì một trong những điều kiện cần để phân tích hồi quy là biến độc lập phải có tương quan với biến phụ thuộc, nên nếu ở bước phân tích tương quan này biến độc lập khơng có tương quan với biến phụ thuộc thì ta loại biến độc lập này ra khỏi phân tích hồi quy.
4.3 Kiểm định Paired t-test và Kiểm định Wilcoxon matched-pairs signed-ranks test ranks test
Để biết liê ̣u rằng các biến tỷ số tài chính được lựa chọn trong Mơ hình 1 có khả năng phân biệt được hai mẫu gian lận và không gian lận hay không , tác giả tiến hành kiểm định Paired t-test để kiểm tra sự giống nhau về giá trị trung bình giữa hai nhóm và kiểm định Wilcoxon matched-pairs signed-ranks test để kiểm tra sự giống nhau về phân phối của hai nhóm.
Kết quả phân tích cho thấy, các biến độc lập ln có sự khác biệt có ý nghĩa thống kê giữa hai nhóm gian lận và không gian lận trong cả hai kiểm định bao gồm: GP/TA, NP/TA, INV/SAL, SAL/TA, INV/TA, CASH/CA, RE/Eq. Trong khi đó, REC/SAL chỉ có ý nghĩa thống kê đối với kiểm định Wilcoxon matched-pairs signed-ranks test (xem Bảng 4.5).
Bảng 4. 5 Kết quả kiểm định Paired t-test và Wilcoxon matched-pairs signed-ranks
test
Biến t sig. z sig.
Tỷ số sinh lợi
GP/SAL -,727 ,470 -,435 ,663 NP/SAL ,265 ,792 -,945 ,344 GP/TA -4,498 ,000 -4,297 ,000 NP/TA -2,798 ,007 -3,000 ,003 Tỷ số hoạt động INV/SAL 2,270 ,026 -3,260 ,001 REC/SAL 1,694 ,095 -2,149 ,032 SAL/TA -4,977 ,000 -4,406 ,000
Tỷ số thanh khoản
CA/CL -,087 ,931 -,178 ,859
WC/TA -,879 ,383 -,602 ,547
Tỷ số đòn bẩy tài chính
TL/TA ,343 ,733 -,258 ,797
TL/Eq 1,316 ,192 -,834 ,404
Tỷ số cấu trúc tài sản
CA/TA -,894 ,375 -1,071 ,284
INV/TA -3,209 ,002 -3,149 ,002
REC/TA ,470 ,640 -,281 ,779
CASH/CA -2,539 ,013 -2,914 ,004
RE/Eq -2,049 ,044 -2,971 ,003
4.4 Phân tích hồi quy Binary logistic
Mô hình nghiên cứu tổng quát tác giả xây dựng gồm 1 biến phục thuộc và 16 biến đô ̣c lâ ̣p , sau khi thực hiê ̣n các kiểm đi ̣ nh ban đầu , mô hình hời quy Binary logistic cịn lại 1 biến phụ thuộc và 9 biến độc lâ ̣p như sau:
FRAUD = b0 + b1NP/SAL + b2GP/TA + b3NP/TA + b4INV/SAL + b5REC/SAL + b6SAL/TA + b7INV/TA+ b8CASH/CA + b9RE/Eq+ e (Mơ hình 2)
Kiểm đi ̣nh Wald về ý nghĩa của các hê ̣ số hồi quy
Mô hình Binary Logistic đòi hỏi kiểm đi ̣nh giả thiết các hê ̣ số hồi quy khác 0, nếu các hê ̣ số hồi quy từ b0 đến b9đều bằng 0 thì xác suất xảy ra gian lận hay không gian lâ ̣n từ mô hình là như nhau . Đối với hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuyết H0: k=0. Còn đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể.
Bảng 4.6 Kết quả kiểm đi ̣nh Wald (Mơ hình 2)
Biến B S.E. Wald df Sig. Exp(B)
Step 1a Tỷ số sinh lợi
NPSAL -1,148 1,005 1,304 1 ,253 ,317
Tỷ số sinh lợi
GPTA -5,953 2,167 7,549 1 ,006 ,003 NPTA -7,106 4,269 2,770 1 ,096 ,001 Tỷ số hoạt động INVSAL ,779 ,764 1,039 1 ,308 2,180 RECSAL -2,085 1,164 3,210 1 ,073 ,124 SALTA -,986 ,433 5,171 1 ,023 ,373
Tỷ số cấu trúc tài sản
INVTA -4,041 1,408 8,236 1 ,004 ,018
CASHCA -1,747 1,420 1,514 1 ,219 ,174
REEq -1,412 1,284 1,209 1 ,272 ,244
Constant 3,940 ,988 15,919 1 ,000 51,434
Kết quả Bảng 4.6 cho thấy các biến NP/SAL, NP/TA, INVSAL, RECSAL, CASH/CA, RE/Eq có giá trị Sig. lớ n hơn mức 0.05 nên 9 biến này không có ý nghĩa thống kê trong viê ̣c đánh giá khả năng gian lận BCTC . Các biến GP/TA, SAL/TA, INV/TAcó ý nghĩa thống kê với Sig.<0,05 nên các biến này có mối quan hệ nhân quả với biến FRAUD.
Theo (Trọng & Ngọc, 2008) các biến được kiểm tra tương quan có thể có hệ số tương quan có ý nghĩa thống kê nhưng chưa chắc đã có mối quan hệ nhân quả. Điều này thể hiện rất rõ qua phân tích tương quan các biến độc lập với biến phụ thuộc trong Mô hình 1, kết quả từ 16 biến độc lập chỉ có 9 biến có quan hệ tương quan có ý nghĩa thống kê với biến phụ thuộc. Tuy nhiên, sau khi kiểm định Wald cho Mơ hình 2 với 9 biến này, chỉ còn 3 biến GP/TA, SAL/TA, INV/TAcó mối quan hệ nhân quả với biến phụ thuộc. Nói cách khác, chỉ 3 biến này có thể phân loại các cơng ty niêm yết trên TTCK Việt Nam thành 2 nhóm: nhóm có khả năng gian lận và nhóm khơng có khả năng gian lận BCTC với độ tin cậy trên 95%.
Phân tích hồi quy Binary logistic với các biến có ý nghĩa thống kê
Sau khi loại đi 6 biến khơng có ý nghĩa thống kê trong Mơ hình 2, mơ hình hồi quy với các biến còn lại như sau:
FRAUD = b0 + b1GP/TA + b2SAL/TA + b3INV/TA + e (Mơ hình 3) Thực hiện phân tích hồi quy Binary logistic với 3 biến này, được kết quả như Bảng 4.7.
Bảng 4.7 Kết quả kiểm đi ̣nh Wald (Mơ hình 3)
Biến B S.E. Wald df Sig. Exp(B)
Step 1a
GP/TA -5,423 1,797 9,104 1 ,003 ,004
SAL/TA -1,002 ,308 10,619 1 ,001 ,367
INV/TA -3,483 1,244 7,840 1 ,005 ,031
Constant 2,538 ,520 23,812 1 ,000 12,659
Kết quả phân tích cho thấy giá trị mức ý nghĩa sig. của các biến đều có giá trị < 0,05 nên các biến độc lập trong Mơ hình 3 có mối quan hệ có ý nghĩa thống kê với biến phụ thuộc (FRAUD) với độ tin cậy trên 99%. Dấu của các hệ số hồi quy phù hợp với mong đợi.
Kiểm định mức độ giải thích của mơ hình
Đối với hồi quy Binary logistic, tổ hợp liên hệ tuyến tính của tồn bộ các hệ số trong mơ hình (ngoại trừ hằng số) được xem xét xem có ý nghĩa trong việc giải thích biến phụ thuộc hay khơng. Kết quả kiểm định ở Bảng 4.8 cho thấy khả năng giải thích biến phụ thuộc của các biến độc lập ở Mơ hình 3 có ý nghĩa thống kê với độ tin cậy trên 99%.
Bảng 4.8 Kết quả kiểm định mức độ giải thích của mơ hình (Omnibus)
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1
Step 43,818 3 ,000
Block 43,818 3 ,000
Model 43,818 3 ,000
Nguồn: Truy xuất từ kết quả phân tích SPSS
Kiểm định mức độ phù hợp của mơ hình
Bảng 4.9 thể hiện kết quả độ phù hợp của Mơ hình 3. Trong phân tích hồi quy Binary logistic, chỉ tiêu -2 Log likehood (-2LL) càng nhỏ thể hiện mức độ phù hợp của mơ hình càng cao. Ngồi ra, hệ số mức độ giải thích của mơ hình Nagelkerke R Square = 0,358 cho biết 35,8% sự thay đổi của biến FRAUD được giải thích bởi các biến GP/TA, SAL/TA, INV/TA, còn lại là do sai số thống kê và tác động của các yếu tố khác.
Bảng 4.9 Kết quả kiểm định mức độ phù hợp của mơ hình (-2LL)
Model Summary
Step -2 Log
likelihood
Cox & Snell R Square
Nagelkerke R Square
1 150,263a ,269 ,358
Nguồn: Truy xuất từ kết quả phân tích SPSS
Kiểm định mức độ dự báo của mơ hình
Bảng 4.10 thể hiện tỷ lệ dự báo đúng của mơ hình. Trong 70 trường hợp mẫu khơng gian lận mơ hình dự báo đúng được 46 trường hợp với tỷ lệ dự báo chính xác là 65,7%, cịn trong 70 trường hợp mẫu gian lận mơ hình dự báo chính xác được 50