a) Chương trình sử dụng
Chúng tôi chọn phần mềm R để làm công cụ hồi quy trong bài nghiên cứu này vì các tiện ích của nó trong việc thực hiện mô hình lựa chọn nhân tố. Bằng cách thực hiện các
cú pháp lập trình, các bƣớc hồi quy và các bƣớc chọn lọc nhân tố sẽ đƣợc thể hiện một cách rõ ràng.
b) Sắp xếp dữ liệu và cách hồi quy
Chúng tôi sắp xếp dữ liệu trong một bảng tổng hợp. Các công ty sẽ đƣợc đánh mã số từ 1 đến 182 và sắp xếp theo hàng, mỗi mã số sẽ đƣợc thể hiện trên ba hàng ứng với ba năm 2008/0710
, 2009/08 và 2010/09. Các cột thể hiện các biến phụ thuộc (các tỉ lệ đòn bẩy: y1, y2, y3, y4) và các biến độc lập (các nhân tố: x1, x2, …, x22). Giữa biến phụ thuộc và biến độc lập có một độ chệch về thời gian, biến độc lập (trừ biến Age) có độ trễ một năm so với biến phụ thuộc.
Với những hồi quy đơn biến để xem tác động riêng của từng nhân tố đến tỉ lệ đòn bẩy, chúng tôi sẽ hồi quy đồng thời theo năm và theo công ty đối với từng biến. Trong các trƣờng hợp cụ thể, chúng tôi sẽ quan sát theo công ty đối với từng năm hoặc quan sát theo năm đối với một công ty hay một nhóm ngành.
c) Các tiêu chuẩn kiểm định
AIC (Akaike Information Criterion) và BIC (Bayesian Information Criterion) là hai tiêu chuẩn lựa chọn mô hình phổ biến nhất. AIC và BIC đƣợc tính nhƣ sau:
AIC = -2.log(L) + 2.P BIC = -2.log(L) + P.log(N)
10 Cách viết 2008/07 thể hiện biến phụ thuộc theo năm 2008 còn biến độc lập (trừ biến Age) theo năm 2007 đƣợc thể hiện trên một hàng dữ liệu. Các ký hiệu khác tƣơng tự.
Trong đó là L là giá trị likelihood đƣợc tối đa hóa của mô hình ƣớc lƣợng, P là một tham số (parameter) của mô hình thống kê và N là cỡ mẫu.
Cả hai tiêu chuẩn AIC và BIC có hình thức tƣơng tự nhau, chỉ khác nhau ở “trọng số” của P (2 ở AIC và log(N) ở BIC). Trong mỗi trƣờng hợp, AIC hay BIC càng nhỏ thì mô hình càng tốt, ứng với trƣờng hợp log(L) càng tăng và P giảm. Ngoài ra số quan sát (N) tăng lên sẽ làm cho BIC có giá trị lớn hơn. Nếu mẫu nhỏ, sẽ khó biết AIC hay BIC tốt hơn. Nếu log(N) > 2 thì BIC sẽ có xu hƣớng chọn đƣợc mô hình chặt chẽ hơn.
d) Các phương pháp lựa chọn nhân tố (factor selections)
Bài nghiên cứu này sẽ thực hiện mô hình lựa chọn nhân tố dựa trên hai phƣơng pháp: phƣơng pháp lựa chọn bằng tiêu chuẩn AIC và phƣơng pháp lựa chọn bằng phép tính BMA (Bayesian Model Averaging). Phƣơng pháp AIC là một cách để tìm mô hình tối ƣu trong bối cảnh có nhiều tƣơng quan giữa các biến. Quy trình tìm mô hình tối ƣu sẽ dừng lại ở mô hình có giá trị AIC thấp nhất. Khi có một mô hình đƣợc cho là mô hình cuối cùng, cũng có thể còn những mô hình khả dĩ khác nếu tiếp tục nghiên cứu hay bổ sung dữ liệu mới. Để đánh giá sự bất định này trong mô hình thống kê, phép tính BMA sẽ cho triển vọng tốt hơn. Phép tính BMA sẽ tìm ra tất cả các mô hình khả dĩ và lựa chọn những mô hình tối ƣu nhất về lâu về dài. Tiêu chuẩn lựa chọn ở đây cũng dựa trên tiêu chuẩn AIC.