Dựa trên phƣơng trình (1) đƣợc xây dựng ở chƣơng 3
Biến phụ thuộc (AUD) là biến nhị phân, hồi quy Logistic gộp (pooled logistic regressions) đƣợc sử dụng để kiểm định các giả thuyết. Ngoài ra, các biến giả theo năm và nhóm ngành (year and industry dummy) cũng đƣợc xây dựng nhằm kiểm soát sự khác nhau giữa các giai đoạn thời gian và các đặc tính của từng ngành nghề. Các biến giả theo năm (year dummy) bao gồm Y11 (nhận giá trị là 1 tại quan sát năm t = 2011), tƣơng tự cho Y12, Y13, Y14, Y15. Các biến giả ngành (industry dummy) bao gồm I1, I2, I3, I4, I5, I7, I8, I9 đƣợc phân chia dựa theo cách phân chia theo cấu trúc phân ngành 4 cấp theo chuẩn ICB (Industry Classification Benchmark). Khi hồi quy, phần mềm Stata sẽ tự động loại bỏ một biến giả ngẫu nhiên nhằm tránh hiện tƣợng cộng tuyết hoàn hảo (omitted because of collinearity). Kết quả hồi quy các biến giả đƣợc thể hiện đầy đủ trong phụ lục (không đƣợc thể hiện trong bảng kết quả hồi quy). Đồng thời, để kiểm tra khả năng giải thích/ dự báo của các biến độc lập tới biến phụ thuộc, thay vì sử dụng R2 nhƣ trong mô hình hồi quy tuyến tính cổ điển, hồi quy Logistic sử dụng hệ số Pseudo- R2 (hay McFadden’s R2
) để trình bày kết quả này. Cuối cùng, thống kê z (z-statistics) với sai số chuẩn mạnh (robust standard errors) cũng đƣợc sử dụng và đƣợc trình bày trong ngoặc đơn, bên cạnh các hệ số hồi quy.
Với: * có ý nghĩa thống kê ở mức 10%. ** có ý nghĩa thống kê ở mức 5%. *** có ý nghĩa thống kê ở mức 1%.
Nghiên cứu này lần lƣợt thực hiện các phép hồi quy sau đây: (i) hồi quy trên toàn mẫu, (ii) hồi quy với biến tƣơng tác và (iii) các phép hồi quy kiểm định tính vững
(robustness check).