CHƢƠNG 3 PHƢƠNG PHÁP NGHIÊN CỨU
3.7. Phân tích dữ liệu và kiểm định giả thuyết
Tác giả sử dụng phần mềm Stata 13 và Microsoft Excel 2010 để xử lý dữ liệu nhằm mục tiêu xây dựng mơ hình định lượng M-score phát hiện sai sót thơng tin trên BCTC.
Sau khi thu thập dữ liệu, tác giả tiến hành phân tích dữ liệu theo các bước sau:
Bƣớc 1: Thực hiện các phân tích ban đầu
Với bước phân tích này, tác giả sẽ tiến hành sàn lọc mẫu nghiên cứu, loại bỏ các quan sát có giá trị quá lớn, quá nhỏ, quá khác biệt so với cỡ mẫu. Mục đích của bước này nhằm đảm bảo độ tin cậy cho kết quả định lượng.
Bƣớc 2: Xây dựng mơ hình M-score với dữ liệu BCTC đã thu thập trong giai đoạn 2011 - 2015
Tác giả dùng hồi quy binary logistics để tìm ra các biến độc lập tác động lên biến phụ thuộc M.
Dạng tổng qt mơ hình hồi quy binary logistics như sau: Yi = β0 + βiXi + u
Trong đó: Xi là biến độc lập, Yi là biến phụ thuộc. Phương trình hồi quy binary logistics có dạng:
Ln = [P(Y=1)/P(Y=0)] = Bo + B1X1 + B2X2 +...+ BjXi
Trong đó:
P(Y=1) = P0: xác suất xảy ra sự kiện. P(Y=0) = 1- P0: xác suất không xảy ra sự kiện.
Xi: các biến độc lập; Ln: log của cơ số e (e = 2,714).
Hệ số Odds: là tỷ lệ giữa xác suất xảy ra sự kiện so với xác suất không xảy ra sự kiện đó. Nếu P0 là xác suất xảy ra sự kiện, thì 1-P0 là xác suất khơng xảy ra sự kiện.
Đây là một dạng hàm Logit. Hàm Ln của Odds là một hàm hồi quy tuyến tính với các biến độc lập Xi. Hàm xác suất trên gọi là hàm phân phối logistics. Trong hàm này khi nhận giá trị từ - ∞ đến + ∞ thì xác suất Pi nhận giá trị từ 0 đến 1. Do là phi tuyến đối với X và các tham số, Y chỉ nhận một trong hai giá trị 0 hoặc 1, do đó khơng thể áp dụng phương pháp bình phương nhỏ nhất (OLS) để ước lượng các tham số, thay vào đó dùng ước lượng hợp lý cực đại (Maximum Likelihood) để ước lượng các tham số.
Mơ hình logit xem xét mức ảnh hưởng của biến độc lập Xi đến xác suất để biến Y nhận giá trị 1. Ta có dạng hàm dự báo hồi quy binary logistics:
E(Y/Xi) = P0/1-P0 = eBo + B1X1 + B2X2 +...+ BjXi
E(Y/Xi): xác suất để Y = 1 xuất hiện khi giá trị biến độc lập Xi có giá trị: P = eBo + B1X1 + B2X2 +...+ BjXi/(1+ eBo + B1X1 + B2X2 +...+ BjXi)
Mơ hình logistics để phát hiện sai sót thơng tin trên BCTC với các biến độc lập đã phân tích có dạng sau:
M = β0 + β1(DSRI) + β2(GMI) + β3(AQI) + β4(SGI) + β5(DEPI) + β6(SGAI) + β7(LVGI) + β8(TATA)
Sau khi xây dựng mơ hình, tác giả tiến hành ước lượng mơ hình bằng phần mềm Stata 13 để tìm ra các biến độc lập có ý nghĩa thống kê.
Bƣớc 3: Đo lƣờng tác động biên của các biến hồi quy lên biến phụ thuộc
Tác động biên là một thước đo sự tác động của các biến hồi quy lên biến phụ thuộc. Trong luận văn này, tác giả sẽ dùng phần mềm Stata 13 để tính chỉ số Odds ratio đo lường sự tác động của các biến độc lập lên biến phụ thuộc, ngồi ra có thể tính giá trị chỉ số Odds ratio bằng cách lấy lũy thừa cơ số e của hệ số coefficients (dùng hàm EXP(coefficients) trong Microsoft Excel.
Bƣớc 4: Ƣớc lƣợng ngƣỡng giá trị để phân loại các doanh nghiệp có sai sót thơng tin trên BCTC và đo lƣờng khả năng dự báo của mơ hình với dữ liệu năm 2016
Với bước này tác giả xác định ngưỡng giá trị để phân loại loại các doanh nghiệp có sai sót thơng tin trên BCTC chưa kiểm tốn độc lập hay khơng và kiểm định lại khả năng phát hiện sai sót thơng tin trên BCTC với dữ liệu năm 2016.
Theo kết quả nghiên cứu của Beneish (1999) thì xác suất xảy ra hành vi thao túng lợi nhuận được xác định với tỷ lệ từ 1 đến 2,5% miền phân phối của giá trị Mt, điều này có ý nghĩa là 1 đến 2,5% doanh nghiệp có dấu hiện đã thực hiện hành vi thao túng lợi nhuận. Kế thừa kết quả nghiên cứu của Beneish, tác giả tiến hành thực hiện các bước phân tích để xác định ngưỡng giá trị phân loại dành cho các doanh nghiệp niêm yết trên HOSE và HNX.
Tác giả sử dụng hàm Normsinv trong phần mềm Microsoft Excel 2010 để tính giá trị phân loại M-score tại các xác suất dự báo 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%.
Ngưỡng giá trị phân loại M-score tại các xác suất dự báo được trình bày tại bảng 3.5.
Bảng 3.5. Ngƣỡng giá trị phân loại M-score tƣơng ứng với các xác suất dự báo Xác suất dự báo Ngƣỡng giá trị
phân loại M-Score
1% -2,32635 5% -1,64485 10% -1,28155 15% -1,03643 20% -0,84162 25% -0,67449 30% -0,5244 35% -0,38532
40% -0,25335
45% -0,12566
(Nguồn: tác giả tính tốn)
Nếu Mi (giá trị M của doanh nghiệp i) > ngưỡng giá trị phân loại M-Score đã được xác định, thì doanh nghiệp i thuộc diện có khả năng xảy ra sai sót thơng tin trên BCTC.
Khi so sánh kết quả mơ hình dự báo và kết quả kiểm tốn BCTC sẽ có các trường hợp sau xảy ra:
- Mơ hình phát hiện doanh nghiệp có sai sót thơng tin trên BCTC, kiểm tốn xác định có sai sót thơng tin trên BCTC -> đúng loại -
- Mơ hình phát hiện doanh nghiệp khơng có sai sót thơng tin trên BCTC, kiểm tốn xác định khơng có sai sót thơng tin trên BCTC -> đúng loại +
- Mơ hình phát hiện doanh nghiệp không có sai sót thơng tin trên BCTC, kiểm tốn xác định có sai sót thơng tin trên BCTC -> sai loại -
- Mơ hình phát hiện doanh nghiệp có sai sót thơng tin trên BCTC, kiểm tốn xác định khơng có sai sót thơng tin trên BCTC -> sai loại +
Mức độ đo lường khả năng dự báo của mơ hình được tính bằng tổng số đúng loại (khơng phân biệt đúng loại – hay +) trên tổng số quan sát.
Dựa vào lý thuyết xác suất thống kê về sai lầm loại 1 và loại 2 để tính mức độ dự báo của mơ hình với dữ liệu năm 2016 (xem bảng 3.6).
Bảng 3.6. Phân loại sai lầm loại 1 và loại 2
Có sai sót thơng tin trên BCTC
Khơng có sai sót thơng tin trên
BCTC
Có sai sót thơng tin trên BCTC
đúng loại – sai loại + Kết quả
kiểm tốn Kết quả
Khơng có sai sót thơng tin trên BCTC
Kết luận chƣơng 3
Dựa vào nghiên cứu của Beneish (1999), tác giả đã tiến hành xác định đối tượng nghiên cứu là BCTC của các doanh nghiệp phi tài chính niêm yết trên HOSE và HNX, thời gian lấy số liệu từ 2011 – 2016, sau khi xác định được đối tượng cũng như phạm vi nghiên cứu, tác giả xây dựng mơ hình nghiên cứu, tiếp theo tác giả đưa ra các tiêu thức để chọn mẫu nghiên cứu và tiêu thức để phân loại mẫu nghiên cứu thuộc nhóm mẫu có sai sót hay khơng có sai sót, dựa vào các tiêu thức đưa ra, tác giả thu thập được 360 mẫu quan sát dùng để xây dựng mơ hình nghiên cứu ngồi ra tác giả cịn thu thập thêm 90 mẫu ngoài mẫu nghiên cứu để đo lường khả năng phát hiện sai sót thơng tin trên BCTC và xác định ngưỡng giá trị phân loại M-score. Với 360 mẫu quan sát dùng để xây dựng mơ hình nghiên cứu có 232 quan sát thuộc nhóm mẫu có sai sót, 128 quan sát thuộc nhóm mẫu khơng có sai sót. Tiếp theo, tác giả đã xây dựng tám giả thiết nghiên cứu và các cơng thức tính liên quan đến các biến độc lập. Dữ liệu nghiên cứu được thiết kế theo dạng bảng (panel data). Quy trình phân tích dữ liệu nghiên cứu gồm bốn bước. Bước 1: thực hiện các phân tích ban đầu, bước 2: Xây dựng mơ hình M-score, bước 3: Đo lường tác động biên của các biến hồi quy lên biến phụ thuộc và bước cuối cùng là: Ước lượng ngưỡng giá trị để phân loại các doanh nghiệp có sai sót thơng tin trên BCTC và đo lường khả năng dự báo của mơ hình.