8. Kết cấu của đề tài
4.1.6 Phân tích dự báo
Bước cuối cùng đề tài sẽ thực hiện kiểm định khả năng dự báo sai sót của các nhân tố được chọn trong mô hình, nhằm mục đích trả lời cho câu hỏi cuối cùng của nghiên cứu là: Có thể dựa vào các biến trong mô hình của tác giả Dechow và các cộng sự (2012) để xây dựng mô hình dự báo sai sót thông tin trên BCTC hiệu quả hơn ở Việt Nam không?
Theo Tabachnick và Fidell (1996) để tiến hành phân tích hồi quy đa biến một cách tốt nhất, thì kích thước cỡ mẫu tối thiểu cần phải đảm bảo theo công thức:
N >= 8*m + 50 Trong đó: - n: Cỡ mẫu
- m: Số biến độc lập của mô hình
Dựa theo kết quả này để đảm bảo cỡ mẫu tối thiểu, bài luận văn chọn mốc thời gian là 2011 để xây dựng mô hình dự báo hồi quy logit nhằm mục đích dự báo cho 2 năm 2012 và 2013, từ đó so sánh với kết quả sai sót trong thực tế. Việc lựa chọn năm 2011 làm mốc thời gian để xây dựng mô hình dự báo nhằm đạt được cỡ mẫu nghiên cứu hiệu quả, đồng thời cân đối với mẫu nghiên cứu dùng để kiểm định lại kết quả mô hình dự báo. Kết quả phân tích hồi quy logit từ dữ liệu mẫu trong hai năm 2010 và 2011 được trình bày ở bảng 4.7 (xem phụ lục số 13).
Bảng 4.7: Kết quả xây dựng mô hình dự báo
Miss Coef. Std.Err. z P>/z/ [95% Conf. Interval]
Rsst_acc 3.925 2.803 1.40 0.161 -1.569 9.419 Chinv 5.746 4.477 1.28 0.199 -3.029 14.523 Softasset 1.449 1.264 1.15 0.252 -1.030 3.928 Chcs 0.121 0.049 2.52 0.012 0.027 0.214
Chroa -14.424 6.223 -2.32 0.020 -26.621 -2.227
Cons -4.035 1.226 -3.29 0.001 -4.439 -1.632 *, **, *** Có ý nghĩa thống kê tương ứng với .10, .05, .01
(Nguồn: Tác giả tổng hợp kết quả phân tích từ phần mềm Stata12)
Kết quả phân tích hồi quy logit có thể được viết thành mô hình như sau:
MISSTATEMENT = -4.035 + 3.925Rsst-acc + 5.746Chinv + 1.449Softassets + 0.121Chcs – 14.424Chroa + Wit (***)
Để tính được chỉ số F-score, đầu tiên bài luận văn sẽ sử dụng những giá trị thực tế của 92 mẫu quan sát đã được thu thập trong hai năm 2013 và 2014 thay vào mô hình dự báo (***) đã được xây dựng để tính ra giá trị dự đoán (predicted value).
Sau đó thay vào công thức tính xác suất xảy ra sai sót (Probability)
Tiếp theo sẽ tính chỉ số F-score bằng cách lấy xác suất xảy ra sai sót (Probability) chia cho xác suất không điều kiện (Uncondition expectation).
Giá trị của chỉ số F-score lớn hơn 1 nghĩa là mẫu nghiên cứu có sai sót thông tin trên BCTC. Hay nói cách khác xác suất mẫu nghiên cứu xảy ra sai sót khi có sự tác động bởi những biến nghiên cứu lớn hơn xác suất mẫu nghiên cứu xảy ra sai sót khi không sự can thiệp bởi những biến nghiên cứu này.
Sau đó, đối chiếu kết quả tính chỉ số F-score với kết quả phân loại mẫu nghiên cứu có sai sót và không có sai sót theo tiêu chí chênh lệch lợi nhuận trước và sau kiểm toán là 10% như đã trình bày ở phần quy trình chọn mẫu.
Kết quả áp dụng chỉ số F-score trong việc dự báo sai sót trên BCTC từ mô hình dự báo (***) được trình bày ở bảng 4.8 (xem phụ lục số 15).
Mẫu sai sót Mẫu không sai sót Tỷ lệ dự báo đúng bình quân Số lượng mẫu Dự báo theo mô hình (***) Tỷ lệ dự báo đúng Số lượng mẫu Dự báo theo mô hình (***) Tỷ lệ dự báo đúng 36 21 60% 148 125 83.89% 71.9%
(Nguồn: Tác giả tự thu thập)
Bài luận văn đã tiến hành tính chỉ số F-score thông qua việc sử dụng mô hình dự báo được xây dựng ở trên, nhằm kiểm định lại cho 184 mẫu quan sát là các doanh nghiệp được niêm yết tại HOSE trong hai năm 2012 và 2013. Kết quả kiểm định cho thấy mô hình đã phân loại đúng 21 doanh nghiệp có sai sót và 125 doanh nghiệp không có sai sót. Tỷ lệ phân loại đúng bình quân của mô hình là 71.9%. Tỷ lệ phân loại sai của bình quân của mô hình là 28.1%.
Tóm tắt chương 4
Trong chương này, bài luận văn đã tiến hành phân tích và tìm ra các biến độc lập có mối quan hệ có ý nghĩa thống kê với biến phụ thuộc là nguy cơ xảy ra hành vi sai sót trên BCTC.
Trước hết, luận văn đã tiến hành kiểm định sự khác biệt về giá trị trung bình, về phân phối và về trung vị giữa hai nhóm có sai sót và không có sai sót thông qua các kiểm định Paired t-test,Wilcoxon matched-pairs signed-ranks test và Arbuthnott (1970) - signtest. Kết quả cho thấy, hầu hết các biến đều có sự khác biệt giữa hai nhóm.
Sau đó, luận văn tiến hành thực hiện kiểm định hệ số hồi quy logit thông qua 4 mô hình là mô hình hồi quy FEM, mô hình REM, mô hình PA theo bài nghiên cứu Hardin and Hilbe (2003). Và sử dụng phương pháp White (1980) trong mô hình Logit PA Robust nhằm kiểm tra chéo và so sánh, tăng độ tin cậy của kết luận định lượng. Kết quả nghiên cứu cho thấy 5 biến có mối quan hệ có ý nghĩa thống kê với hành vi sai sót trên BCTC là biến RSST-acc, Chinv, Chroa, Chcs, và Softasset.
Tiếp theo, luận văn xây dựng mô hình hồi quy từ dữ liệu nghiên cứu trong 4 năm từ 2010 đến 2013 dựa trên các biến có mối quan hệ có ý nghĩa thống kê ở trên. Cuối cùng, luận văn tiến hành xây dựng mô hình dự báo từ mẫu nghiên cứu trong 2 năm là 2010 và 2011. Sau đó, tính chỉ số F-score cho 184 mẫu quan sát trong hai năm 2012 và 2013 nhằm mục đích kiểm tra lại khả năng dự báo của mô hình này. Kết quả cho thấy tỷ lệ phân loại đúng bình quân của mô hình là 71.9%. Tỷ lệ phân loại sai của bình quân của mô hình là 28.1%.
CHƯƠNG 5. KẾT LUẬN, GIẢI PHÁP NÂNG CAO KHẢ NĂNG PHÁT HIỆN SAI SÓT TRÊN BÁO CÁO TÀI CHÍNH CÁC CÔNG TY NIÊM YẾT, VÀ GỢI Ý HƯỚNG
NGHIÊN CỨU TIẾP THEO