CHƢƠNG 4 : KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN
4.4 Phân tích hồi quy Binary logistic
Mô hình nghiên cứu tổng quát tác giả xây dựng gồm 1 biến phục thuộc và 16 biến đô ̣c lâ ̣p , sau khi thực hiê ̣n các kiểm đi ̣ nh ban đầu , mô hình hời quy Binary logistic cịn lại 1 biến phụ thuộc và 9 biến độc lâ ̣p như sau:
FRAUD = b0 + b1NP/SAL + b2GP/TA + b3NP/TA + b4INV/SAL + b5REC/SAL + b6SAL/TA + b7INV/TA+ b8CASH/CA + b9RE/Eq+ e (Mơ hình 2)
Kiểm đi ̣nh Wald về ý nghĩa của các hê ̣ số hồi quy
Mô hình Binary Logistic đòi hỏi kiểm đi ̣nh giả thiết các hê ̣ số hồi quy khác 0, nếu các hê ̣ số hồi quy từ b0 đến b9đều bằng 0 thì xác suất xảy ra gian lận hay không gian lâ ̣n từ mô hình là như nhau . Đối với hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuyết H0: k=0. Còn đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể.
Bảng 4.6 Kết quả kiểm đi ̣nh Wald (Mơ hình 2)
Biến B S.E. Wald df Sig. Exp(B)
Step 1a Tỷ số sinh lợi
NPSAL -1,148 1,005 1,304 1 ,253 ,317
Tỷ số sinh lợi
GPTA -5,953 2,167 7,549 1 ,006 ,003 NPTA -7,106 4,269 2,770 1 ,096 ,001 Tỷ số hoạt động INVSAL ,779 ,764 1,039 1 ,308 2,180 RECSAL -2,085 1,164 3,210 1 ,073 ,124 SALTA -,986 ,433 5,171 1 ,023 ,373
Tỷ số cấu trúc tài sản
INVTA -4,041 1,408 8,236 1 ,004 ,018
CASHCA -1,747 1,420 1,514 1 ,219 ,174
REEq -1,412 1,284 1,209 1 ,272 ,244
Constant 3,940 ,988 15,919 1 ,000 51,434
Kết quả Bảng 4.6 cho thấy các biến NP/SAL, NP/TA, INVSAL, RECSAL, CASH/CA, RE/Eq có giá trị Sig. lớ n hơn mức 0.05 nên 9 biến này không có ý nghĩa thống kê trong viê ̣c đánh giá khả năng gian lận BCTC . Các biến GP/TA, SAL/TA, INV/TAcó ý nghĩa thống kê với Sig.<0,05 nên các biến này có mối quan hệ nhân quả với biến FRAUD.
Theo (Trọng & Ngọc, 2008) các biến được kiểm tra tương quan có thể có hệ số tương quan có ý nghĩa thống kê nhưng chưa chắc đã có mối quan hệ nhân quả. Điều này thể hiện rất rõ qua phân tích tương quan các biến độc lập với biến phụ thuộc trong Mô hình 1, kết quả từ 16 biến độc lập chỉ có 9 biến có quan hệ tương quan có ý nghĩa thống kê với biến phụ thuộc. Tuy nhiên, sau khi kiểm định Wald cho Mơ hình 2 với 9 biến này, chỉ còn 3 biến GP/TA, SAL/TA, INV/TAcó mối quan hệ nhân quả với biến phụ thuộc. Nói cách khác, chỉ 3 biến này có thể phân loại các cơng ty niêm yết trên TTCK Việt Nam thành 2 nhóm: nhóm có khả năng gian lận và nhóm khơng có khả năng gian lận BCTC với độ tin cậy trên 95%.
Phân tích hồi quy Binary logistic với các biến có ý nghĩa thống kê
Sau khi loại đi 6 biến khơng có ý nghĩa thống kê trong Mơ hình 2, mơ hình hồi quy với các biến còn lại như sau:
FRAUD = b0 + b1GP/TA + b2SAL/TA + b3INV/TA + e (Mơ hình 3) Thực hiện phân tích hồi quy Binary logistic với 3 biến này, được kết quả như Bảng 4.7.
Bảng 4.7 Kết quả kiểm đi ̣nh Wald (Mơ hình 3)
Biến B S.E. Wald df Sig. Exp(B)
Step 1a
GP/TA -5,423 1,797 9,104 1 ,003 ,004
SAL/TA -1,002 ,308 10,619 1 ,001 ,367
INV/TA -3,483 1,244 7,840 1 ,005 ,031
Constant 2,538 ,520 23,812 1 ,000 12,659
Kết quả phân tích cho thấy giá trị mức ý nghĩa sig. của các biến đều có giá trị < 0,05 nên các biến độc lập trong Mơ hình 3 có mối quan hệ có ý nghĩa thống kê với biến phụ thuộc (FRAUD) với độ tin cậy trên 99%. Dấu của các hệ số hồi quy phù hợp với mong đợi.
Kiểm định mức độ giải thích của mơ hình
Đối với hồi quy Binary logistic, tổ hợp liên hệ tuyến tính của tồn bộ các hệ số trong mơ hình (ngoại trừ hằng số) được xem xét xem có ý nghĩa trong việc giải thích biến phụ thuộc hay khơng. Kết quả kiểm định ở Bảng 4.8 cho thấy khả năng giải thích biến phụ thuộc của các biến độc lập ở Mơ hình 3 có ý nghĩa thống kê với độ tin cậy trên 99%.
Bảng 4.8 Kết quả kiểm định mức độ giải thích của mơ hình (Omnibus)
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1
Step 43,818 3 ,000
Block 43,818 3 ,000
Model 43,818 3 ,000
Nguồn: Truy xuất từ kết quả phân tích SPSS
Kiểm định mức độ phù hợp của mơ hình
Bảng 4.9 thể hiện kết quả độ phù hợp của Mơ hình 3. Trong phân tích hồi quy Binary logistic, chỉ tiêu -2 Log likehood (-2LL) càng nhỏ thể hiện mức độ phù hợp của mơ hình càng cao. Ngồi ra, hệ số mức độ giải thích của mơ hình Nagelkerke R Square = 0,358 cho biết 35,8% sự thay đổi của biến FRAUD được giải thích bởi các biến GP/TA, SAL/TA, INV/TA, còn lại là do sai số thống kê và tác động của các yếu tố khác.
Bảng 4.9 Kết quả kiểm định mức độ phù hợp của mơ hình (-2LL)
Model Summary
Step -2 Log
likelihood
Cox & Snell R Square
Nagelkerke R Square
1 150,263a ,269 ,358
Nguồn: Truy xuất từ kết quả phân tích SPSS
Kiểm định mức độ dự báo của mơ hình
Bảng 4.10 thể hiện tỷ lệ dự báo đúng của mơ hình. Trong 70 trường hợp mẫu khơng gian lận mơ hình dự báo đúng được 46 trường hợp với tỷ lệ dự báo chính xác là 65,7%, cịn trong 70 trường hợp mẫu gian lận mơ hình dự báo chính xác được 50 trường hợp chiếm tỷ lệ 71,4%. Tỷ lệ dự báo đúng của tồn bộ mơ hình là 68,6%.
Bảng 4.10 Kết quả dự báo của mơ hình
Observed
Predicted
Khả năng gian lận Tỷ lệ dự báo đúng (%) Không gian lận Gian lận Step 1 Khả năng gian lận Không gian lận 46 24 65,7 Gian lận 20 50 71,4
Tỷ lệ dự báo đúng bình quân (%) 68,6
Nguồn: Truy xuất từ kết quả phân tích SPSS
Ngoài ra, để so sánh mức độ khớp giữa giá trị tiên đoán và giá trị quan sát, tác giả thực hiện kiểm định Hosmer and Lemeshow Test. Giả thuyết không trong kiểm định này là giá trị quan sát bằng giá trị tiên đoán. Quy tắc quyết định là với một giá trị nhỏ của chi-square (<15) và một giá trị lớn của sig. (>0,05) (Tinoco & Wilson, 2013) thì chấp nhận giả thuyết khơng, hay giá trị tiên đốn và giá trị quan sát không khác nhau tại mức ý nghĩa 5%. Điều này gợi ý rằng mơ hình nghiên cứu là phù hợp với dữ liệu mẫu.
Bảng 4.11 Kết quả kiểm định Hosmer and Lemeshow Test
Step Chi-square df Sig.
1 7,806 8 ,453
Kết quả ở Bảng 4.11 cho thấy, chi-square = 7,806 < 15 và sig. = 0,453 > 0,05, như vậy chúng ta có cơ sở thể chấp nhận giả thuyết khơng, tức là giá trị tiên đốn và giá trị quan sát không khác nhau tại mức ý nghĩa 5%.
Thảo luận kết quả hồi quy
Vai trò ảnh hưởng của các biến
Từ các kết quả trên, phương trình hồi quy Binary logistic được viết lại như sau:
FRAUD = 2,538 - 5,423GP/TA – 1,002SAL/TA– 3,483INV/TA + e (*) Từ phương trình (*) ta thấy 3 biến GP/TA, SAL/TA, INV/TA đều làm giảm khả năng xảy ra gian lận BCTC với dấu của các hệ số hồi quy âm.
Hệ số góc của GP/TA bằng -5,423 có ý nghĩa thống kê ở mức ý ngĩa 1% thể hiện tác động riêng của biến GP/TA – tỷ lệ lợi nhuận gộp trên tổng tài sản lên xác suất gian lận BCTC.Điều này phù hợp với kỳ vọng về dấu của hệ số trong mơ hình đã trình bày ở chương trước. Tỷ lệ lợi nhuận gộp trên tổng tài sản càng cao thì khả năng gian lận BCTC càng thấp.
Hệ số góc của SAL/TA bằng -1,002 có ý nghĩa thống kê ở mức ý ngĩa 1%. Tức là hiệu quả hoạt động của cơng ty tăng thì khả năng gian lận BCTC giảm. Điều này phù hợp với kỳ vọng về dấu của hệ số trong mô hình đã trình bày ở chương trước.
Hệ số góc của INV/TA bằng -3,483 có ý nghĩa thống kê ở mức ý ngĩa 1% cho biết mối quan hệ nghịch giữa tỷ số hàng tồn kho trên tổng tài sản và khả năng gian
Xét tác động biên của các biến độc lập lên biến phụ thuộc bằng cách sử dụng hệ số Exp(B) (hay eB) trong Bảng 4.7 với xác suất gian lận BCTC ban đầu là 50%:
Biến GP/TA – tỷ số lợi nhuận gộp trên tổng tài sản
Với eB= 0,004, P0 = 50% P1 = P0 × e B1 1- P0 (1- eB1)= 0,5 ×0,004 1-0,5 (1 -0,004) =0,004
Như vậy, khi các yếu tố khác không đổi, nếu GP/TA tăng thêm 1 đơn vị thì xác suất gian lận BCTC sẽ là 0,4%, giảm 49,6% so với xác suất ban đầu là 50%.
Biến SAL/TA – tỷ số doanh thu trên tổng tài sản
Với eB= 0,367, P0 = 50% P1 = P0 × e B1 1- P0 (1- eB1)= 0,5 ×0,367 1-0,5 (1 -0,367) =0,268
Như vậy, khi các yếu tố khác không đổi, nếu SAL/TA tăng thêm 1 đơn vị thì xác suất gian lận BCTC sẽ là 26,8%, giảm 23,2% so với xác suất ban đầu là 50%.
Biến INV/TA – tỷ số hàng tồn kho trên tổng tài sản
Với eB= 0,031, P0 = 50% P1 = P0 × e B1 1- P0 (1- eB1)= 0,5 ×0,031 1-0,5 (1 -0,031) =0,03
Như vậy, khi các yếu tố khác không đổi, nếu INV/TA tăng thêm 1 đơn vị thì xác suất gian lận BCTC sẽ là 3%, giảm 47% so với xác suất ban đầu là 50%.
Như vậy, trong điều kiện các yếu tố khác không đổi, nếu xác suất gian lận ban đầu của công ty niêm yết là 50%, khi GP/TA, SAL/TA, INV/TA tăng 1% sẽ làm cho xác suất xảy ra gian lận BCTC giảm tương ứng là 49,6%, 23,2% và 47%. Từ đó ta xác định được vai trò ảnh hưởng của các biến như Bảng 4.12.
Bảng 4.12 Tổng hợp vai trò ảnh hưởng của các biến
STT Biến Tốc độ tăng (giảm) từ xác
suất ban đầu 50% Vị trí ảnh hƣởng
1 GP/TA - 49,6% 1
2 SAL/TA - 23,2% 3
3 INV/TA - 47% 2
Ng̀n: Tác giả tính tốn
Ứng dụng khả năng dự báo của mơ hình
Theo Mơ hình 3, xác suất xảy ra gian lận BCTC được tính như sau: P = 1/ (1+ e -2,538 + 5,423GP/TA + 1,002SAL/TA + 3,483INV/TA ) (**)
Trong đó, P là xác suất BCTC có gian lận (từ 0 – 1). Khi P ≥ 0,5 có thể kết luận BCTC có gian lận, ngược lại khi P < 0,5 tức là BCTC khơng có gian lận.
Để đánh giá khả năng dự báo của Mơ hình 3, tác giả tiến hành thu thập dữ liệu năm 2015 của 52 công ty niêm yết trên sàn HNX và HSX (nằm ngoài mẫu nghiên cứu). Sau đó, giá trị thực tế của các biến được thay vào phương trình (**), nếu xác suất tính ra lớn hơn hoặc bằng 0,5 thì công ty này được phân loại là gian lận, ngược lại nếu xác suất nhỏ hơn 0,5 thì công ty này được phân loại là không gian lận. Kết quả dự báo này sẽ được so sánh với thực tế (dựa theo chênh lệch lợi nhuận) để tính tỷ lệ phân loại đúng và tỷ lệ phân loại sai (xem Bảng 4.13). Điều này giúp củng cố thêm bằng chứng rằng Mơ hình 3 có thể đánh giá khả năng gian lận BCTC với độ tin cậy khá tốt.
Bảng 4.13 Kết quả dự báo của các cơng ty ngồi mẫu nghiên cứu
Không gian lận Gian lận Tỷ lệ dự báo
đúng
Không gian lận 17 9 65,38%
Gian lận 8 18 69,23%
Tỷ lệ dự báo đúng bình quân 67,31%
Ng̀n: Tác giả tính tốn
Tóm lại, từ các kết quả nhận được từ việc phân tích Mơ hình 3, chúng ta có cơ sở để chấp nhận các giả thuyết nghiên cứu H3, H11, H13 và bác bỏ 13 giả thuyết nghiên cứu còn lại. Xét một cách tổng qt, các tỷ số tài chính có khả năng đánh giá rủi ro gian lận BCTC của các công ty niêm yết trên thị trường chứng khoán Việt Nam. Trong đó, GP/TA có mức ảnh hưởng cao nhất, còn lại mức độ ảnh hưởng theo thứ tự là INV/TA và SAL/TA.
Kết luận chƣơng 4:
Từ các kết quả nghiên cứu trong chương 4 giúp tác giả trả lời được 2 câu hỏi nghiên cứu. Trả lời cho câu hỏi nghiên cứu 1, 9 biến tỷ số tài chính được tìm thấy là có mối quan hệ có ý nghĩa thống kê với khả năng gian lận BCTC bao gồm: NP/SAL, GP/TA, NP/TA, INV/SAL, REC/SAL, SAL/TA, INV/TA, CASH/CA và RE/Eq. Trong đó, chỉ có 3 biến GP/TA, SAL/TA và INV/TA có mối quan hệ nhân quả với khả năng gian lận BCTC của các công ty niêm yết trên TTCK Việt Nam. Mơ hình hồi quy Binary logistic cuối cùng bao gồm 3 biến trên sau khi vượt qua tất cả các kiểm định có kết quả dự báo đúng khả năng gian lận BCTC cho mẫu gian lận là 71,4% và 68,6% cho tồn bộ mơ hình.