Phân tích hồi quy Binary logistic

Một phần của tài liệu (LUẬN văn THẠC sĩ) chế định sở hữu nhà ở tại việt nam đối với người việt nam định cư ở nước ngoài 002 (Trang 73 - 82)

CHƢƠNG 4 : KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN

4.4 Phân tích hồi quy Binary logistic

Mô hình nghiên cứu tổng quát tác giả xây dựng gồm 1 biến phục thuộc và 16 biến đô ̣c lâ ̣p , sau khi thực hiê ̣n các kiểm đi ̣ nh ban đầu , mô hình hời quy Binary logistic cịn lại 1 biến phụ thuộc và 9 biến độc lâ ̣p như sau:

FRAUD = b0 + b1NP/SAL + b2GP/TA + b3NP/TA + b4INV/SAL + b5REC/SAL + b6SAL/TA + b7INV/TA+ b8CASH/CA + b9RE/Eq+ e (Mơ hình 2)

Kiểm đi ̣nh Wald về ý nghĩa của các hê ̣ số hồi quy

Mô hình Binary Logistic đòi hỏi kiểm đi ̣nh giả thiết các hê ̣ số hồi quy khác 0, nếu các hê ̣ số hồi quy từ b0 đến b9đều bằng 0 thì xác suất xảy ra gian lận hay không gian lâ ̣n từ mô hình là như nhau . Đối với hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuyết H0: k=0. Còn đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể.

Bảng 4.6 Kết quả kiểm đi ̣nh Wald (Mơ hình 2)

Biến B S.E. Wald df Sig. Exp(B)

Step 1a Tỷ số sinh lợi

NPSAL -1,148 1,005 1,304 1 ,253 ,317

Tỷ số sinh lợi

GPTA -5,953 2,167 7,549 1 ,006 ,003 NPTA -7,106 4,269 2,770 1 ,096 ,001 Tỷ số hoạt động INVSAL ,779 ,764 1,039 1 ,308 2,180 RECSAL -2,085 1,164 3,210 1 ,073 ,124 SALTA -,986 ,433 5,171 1 ,023 ,373

Tỷ số cấu trúc tài sản

INVTA -4,041 1,408 8,236 1 ,004 ,018

CASHCA -1,747 1,420 1,514 1 ,219 ,174

REEq -1,412 1,284 1,209 1 ,272 ,244

Constant 3,940 ,988 15,919 1 ,000 51,434

Kết quả Bảng 4.6 cho thấy các biến NP/SAL, NP/TA, INVSAL, RECSAL, CASH/CA, RE/Eq có giá trị Sig. lớ n hơn mức 0.05 nên 9 biến này không có ý nghĩa thống kê trong viê ̣c đánh giá khả năng gian lận BCTC . Các biến GP/TA, SAL/TA, INV/TAcó ý nghĩa thống kê với Sig.<0,05 nên các biến này có mối quan hệ nhân quả với biến FRAUD.

Theo (Trọng & Ngọc, 2008) các biến được kiểm tra tương quan có thể có hệ số tương quan có ý nghĩa thống kê nhưng chưa chắc đã có mối quan hệ nhân quả. Điều này thể hiện rất rõ qua phân tích tương quan các biến độc lập với biến phụ thuộc trong Mô hình 1, kết quả từ 16 biến độc lập chỉ có 9 biến có quan hệ tương quan có ý nghĩa thống kê với biến phụ thuộc. Tuy nhiên, sau khi kiểm định Wald cho Mơ hình 2 với 9 biến này, chỉ còn 3 biến GP/TA, SAL/TA, INV/TAcó mối quan hệ nhân quả với biến phụ thuộc. Nói cách khác, chỉ 3 biến này có thể phân loại các cơng ty niêm yết trên TTCK Việt Nam thành 2 nhóm: nhóm có khả năng gian lận và nhóm khơng có khả năng gian lận BCTC với độ tin cậy trên 95%.

Phân tích hồi quy Binary logistic với các biến có ý nghĩa thống kê

Sau khi loại đi 6 biến khơng có ý nghĩa thống kê trong Mơ hình 2, mơ hình hồi quy với các biến còn lại như sau:

FRAUD = b0 + b1GP/TA + b2SAL/TA + b3INV/TA + e (Mơ hình 3) Thực hiện phân tích hồi quy Binary logistic với 3 biến này, được kết quả như Bảng 4.7.

Bảng 4.7 Kết quả kiểm đi ̣nh Wald (Mơ hình 3)

Biến B S.E. Wald df Sig. Exp(B)

Step 1a

GP/TA -5,423 1,797 9,104 1 ,003 ,004

SAL/TA -1,002 ,308 10,619 1 ,001 ,367

INV/TA -3,483 1,244 7,840 1 ,005 ,031

Constant 2,538 ,520 23,812 1 ,000 12,659

Kết quả phân tích cho thấy giá trị mức ý nghĩa sig. của các biến đều có giá trị < 0,05 nên các biến độc lập trong Mơ hình 3 có mối quan hệ có ý nghĩa thống kê với biến phụ thuộc (FRAUD) với độ tin cậy trên 99%. Dấu của các hệ số hồi quy phù hợp với mong đợi.

Kiểm định mức độ giải thích của mơ hình

Đối với hồi quy Binary logistic, tổ hợp liên hệ tuyến tính của tồn bộ các hệ số trong mơ hình (ngoại trừ hằng số) được xem xét xem có ý nghĩa trong việc giải thích biến phụ thuộc hay khơng. Kết quả kiểm định ở Bảng 4.8 cho thấy khả năng giải thích biến phụ thuộc của các biến độc lập ở Mơ hình 3 có ý nghĩa thống kê với độ tin cậy trên 99%.

Bảng 4.8 Kết quả kiểm định mức độ giải thích của mơ hình (Omnibus)

Omnibus Tests of Model Coefficients

Chi-square df Sig.

Step 1

Step 43,818 3 ,000

Block 43,818 3 ,000

Model 43,818 3 ,000

Nguồn: Truy xuất từ kết quả phân tích SPSS

Kiểm định mức độ phù hợp của mơ hình

Bảng 4.9 thể hiện kết quả độ phù hợp của Mơ hình 3. Trong phân tích hồi quy Binary logistic, chỉ tiêu -2 Log likehood (-2LL) càng nhỏ thể hiện mức độ phù hợp của mơ hình càng cao. Ngồi ra, hệ số mức độ giải thích của mơ hình Nagelkerke R Square = 0,358 cho biết 35,8% sự thay đổi của biến FRAUD được giải thích bởi các biến GP/TA, SAL/TA, INV/TA, còn lại là do sai số thống kê và tác động của các yếu tố khác.

Bảng 4.9 Kết quả kiểm định mức độ phù hợp của mơ hình (-2LL)

Model Summary

Step -2 Log

likelihood

Cox & Snell R Square

Nagelkerke R Square

1 150,263a ,269 ,358

Nguồn: Truy xuất từ kết quả phân tích SPSS

Kiểm định mức độ dự báo của mơ hình

Bảng 4.10 thể hiện tỷ lệ dự báo đúng của mơ hình. Trong 70 trường hợp mẫu khơng gian lận mơ hình dự báo đúng được 46 trường hợp với tỷ lệ dự báo chính xác là 65,7%, cịn trong 70 trường hợp mẫu gian lận mơ hình dự báo chính xác được 50 trường hợp chiếm tỷ lệ 71,4%. Tỷ lệ dự báo đúng của tồn bộ mơ hình là 68,6%.

Bảng 4.10 Kết quả dự báo của mơ hình

Observed

Predicted

Khả năng gian lận Tỷ lệ dự báo đúng (%) Không gian lận Gian lận Step 1 Khả năng gian lận Không gian lận 46 24 65,7 Gian lận 20 50 71,4

Tỷ lệ dự báo đúng bình quân (%) 68,6

Nguồn: Truy xuất từ kết quả phân tích SPSS

Ngoài ra, để so sánh mức độ khớp giữa giá trị tiên đoán và giá trị quan sát, tác giả thực hiện kiểm định Hosmer and Lemeshow Test. Giả thuyết không trong kiểm định này là giá trị quan sát bằng giá trị tiên đoán. Quy tắc quyết định là với một giá trị nhỏ của chi-square (<15) và một giá trị lớn của sig. (>0,05) (Tinoco & Wilson, 2013) thì chấp nhận giả thuyết khơng, hay giá trị tiên đốn và giá trị quan sát không khác nhau tại mức ý nghĩa 5%. Điều này gợi ý rằng mơ hình nghiên cứu là phù hợp với dữ liệu mẫu.

Bảng 4.11 Kết quả kiểm định Hosmer and Lemeshow Test

Step Chi-square df Sig.

1 7,806 8 ,453

Kết quả ở Bảng 4.11 cho thấy, chi-square = 7,806 < 15 và sig. = 0,453 > 0,05, như vậy chúng ta có cơ sở thể chấp nhận giả thuyết khơng, tức là giá trị tiên đốn và giá trị quan sát không khác nhau tại mức ý nghĩa 5%.

Thảo luận kết quả hồi quy

 Vai trò ảnh hưởng của các biến

Từ các kết quả trên, phương trình hồi quy Binary logistic được viết lại như sau:

FRAUD = 2,538 - 5,423GP/TA – 1,002SAL/TA– 3,483INV/TA + e (*) Từ phương trình (*) ta thấy 3 biến GP/TA, SAL/TA, INV/TA đều làm giảm khả năng xảy ra gian lận BCTC với dấu của các hệ số hồi quy âm.

Hệ số góc của GP/TA bằng -5,423 có ý nghĩa thống kê ở mức ý ngĩa 1% thể hiện tác động riêng của biến GP/TA – tỷ lệ lợi nhuận gộp trên tổng tài sản lên xác suất gian lận BCTC.Điều này phù hợp với kỳ vọng về dấu của hệ số trong mơ hình đã trình bày ở chương trước. Tỷ lệ lợi nhuận gộp trên tổng tài sản càng cao thì khả năng gian lận BCTC càng thấp.

Hệ số góc của SAL/TA bằng -1,002 có ý nghĩa thống kê ở mức ý ngĩa 1%. Tức là hiệu quả hoạt động của cơng ty tăng thì khả năng gian lận BCTC giảm. Điều này phù hợp với kỳ vọng về dấu của hệ số trong mô hình đã trình bày ở chương trước.

Hệ số góc của INV/TA bằng -3,483 có ý nghĩa thống kê ở mức ý ngĩa 1% cho biết mối quan hệ nghịch giữa tỷ số hàng tồn kho trên tổng tài sản và khả năng gian

Xét tác động biên của các biến độc lập lên biến phụ thuộc bằng cách sử dụng hệ số Exp(B) (hay eB) trong Bảng 4.7 với xác suất gian lận BCTC ban đầu là 50%:

Biến GP/TA – tỷ số lợi nhuận gộp trên tổng tài sản

Với eB= 0,004, P0 = 50% P1 = P0 × e B1 1- P0 (1- eB1)= 0,5 ×0,004 1-0,5 (1 -0,004) =0,004

Như vậy, khi các yếu tố khác không đổi, nếu GP/TA tăng thêm 1 đơn vị thì xác suất gian lận BCTC sẽ là 0,4%, giảm 49,6% so với xác suất ban đầu là 50%.

Biến SAL/TA – tỷ số doanh thu trên tổng tài sản

Với eB= 0,367, P0 = 50% P1 = P0 × e B1 1- P0 (1- eB1)= 0,5 ×0,367 1-0,5 (1 -0,367) =0,268

Như vậy, khi các yếu tố khác không đổi, nếu SAL/TA tăng thêm 1 đơn vị thì xác suất gian lận BCTC sẽ là 26,8%, giảm 23,2% so với xác suất ban đầu là 50%.

Biến INV/TA – tỷ số hàng tồn kho trên tổng tài sản

Với eB= 0,031, P0 = 50% P1 = P0 × e B1 1- P0 (1- eB1)= 0,5 ×0,031 1-0,5 (1 -0,031) =0,03

Như vậy, khi các yếu tố khác không đổi, nếu INV/TA tăng thêm 1 đơn vị thì xác suất gian lận BCTC sẽ là 3%, giảm 47% so với xác suất ban đầu là 50%.

Như vậy, trong điều kiện các yếu tố khác không đổi, nếu xác suất gian lận ban đầu của công ty niêm yết là 50%, khi GP/TA, SAL/TA, INV/TA tăng 1% sẽ làm cho xác suất xảy ra gian lận BCTC giảm tương ứng là 49,6%, 23,2% và 47%. Từ đó ta xác định được vai trò ảnh hưởng của các biến như Bảng 4.12.

Bảng 4.12 Tổng hợp vai trò ảnh hưởng của các biến

STT Biến Tốc độ tăng (giảm) từ xác

suất ban đầu 50% Vị trí ảnh hƣởng

1 GP/TA - 49,6% 1

2 SAL/TA - 23,2% 3

3 INV/TA - 47% 2

Ng̀n: Tác giả tính tốn

 Ứng dụng khả năng dự báo của mơ hình

Theo Mơ hình 3, xác suất xảy ra gian lận BCTC được tính như sau: P = 1/ (1+ e -2,538 + 5,423GP/TA + 1,002SAL/TA + 3,483INV/TA ) (**)

Trong đó, P là xác suất BCTC có gian lận (từ 0 – 1). Khi P ≥ 0,5 có thể kết luận BCTC có gian lận, ngược lại khi P < 0,5 tức là BCTC khơng có gian lận.

Để đánh giá khả năng dự báo của Mơ hình 3, tác giả tiến hành thu thập dữ liệu năm 2015 của 52 công ty niêm yết trên sàn HNX và HSX (nằm ngoài mẫu nghiên cứu). Sau đó, giá trị thực tế của các biến được thay vào phương trình (**), nếu xác suất tính ra lớn hơn hoặc bằng 0,5 thì công ty này được phân loại là gian lận, ngược lại nếu xác suất nhỏ hơn 0,5 thì công ty này được phân loại là không gian lận. Kết quả dự báo này sẽ được so sánh với thực tế (dựa theo chênh lệch lợi nhuận) để tính tỷ lệ phân loại đúng và tỷ lệ phân loại sai (xem Bảng 4.13). Điều này giúp củng cố thêm bằng chứng rằng Mơ hình 3 có thể đánh giá khả năng gian lận BCTC với độ tin cậy khá tốt.

Bảng 4.13 Kết quả dự báo của các cơng ty ngồi mẫu nghiên cứu

Không gian lận Gian lận Tỷ lệ dự báo

đúng

Không gian lận 17 9 65,38%

Gian lận 8 18 69,23%

Tỷ lệ dự báo đúng bình quân 67,31%

Ng̀n: Tác giả tính tốn

Tóm lại, từ các kết quả nhận được từ việc phân tích Mơ hình 3, chúng ta có cơ sở để chấp nhận các giả thuyết nghiên cứu H3, H11, H13 và bác bỏ 13 giả thuyết nghiên cứu còn lại. Xét một cách tổng qt, các tỷ số tài chính có khả năng đánh giá rủi ro gian lận BCTC của các công ty niêm yết trên thị trường chứng khoán Việt Nam. Trong đó, GP/TA có mức ảnh hưởng cao nhất, còn lại mức độ ảnh hưởng theo thứ tự là INV/TA và SAL/TA.

Kết luận chƣơng 4:

Từ các kết quả nghiên cứu trong chương 4 giúp tác giả trả lời được 2 câu hỏi nghiên cứu. Trả lời cho câu hỏi nghiên cứu 1, 9 biến tỷ số tài chính được tìm thấy là có mối quan hệ có ý nghĩa thống kê với khả năng gian lận BCTC bao gồm: NP/SAL, GP/TA, NP/TA, INV/SAL, REC/SAL, SAL/TA, INV/TA, CASH/CA và RE/Eq. Trong đó, chỉ có 3 biến GP/TA, SAL/TA và INV/TA có mối quan hệ nhân quả với khả năng gian lận BCTC của các công ty niêm yết trên TTCK Việt Nam. Mơ hình hồi quy Binary logistic cuối cùng bao gồm 3 biến trên sau khi vượt qua tất cả các kiểm định có kết quả dự báo đúng khả năng gian lận BCTC cho mẫu gian lận là 71,4% và 68,6% cho tồn bộ mơ hình.

Một phần của tài liệu (LUẬN văn THẠC sĩ) chế định sở hữu nhà ở tại việt nam đối với người việt nam định cư ở nước ngoài 002 (Trang 73 - 82)

Tải bản đầy đủ (PDF)

(115 trang)