Dữ liệu sử dụng trong nghiên cứu này là dữ liệu bảng, là loại dữ liệu kết hợp giữa dữ liệu chuỗi thời gian và dữ liệu chéo. Dữ liệu bảng ngày càng đƣợc sử dụng nhiều trong các nghiên cứu kinh tế vì nó có các ƣu điểm sau:
+ Dữ liệu bảng sẽ tốt hơn cho việc theo dõi và đo lƣờng những tác động mà dữ liệu theo không gian hoặc dữ liệu thời gian thuần túy không thể quan sát hết đƣợc. Dữ liệu bảng cho phép chúng ta nghiên cứu các mô hình phức tạp hơn;
+ Việc kết hợp nhiều dữ liệu của nhiều đối tƣợng nghiên cứu khác nhau sẽ làm cho số quan sát tăng lên đáng kể. Vì vậy nó sẽ làm giảm các sai số ngẫu nhiên có thể xảy ra trong việc phân tích các mô hình; (3) Việc kết hợp các giá trị quan sát theo thời gian khác nhau cho nhiều đối tƣợng khác nhau làm cho loại dữ liệu này chứa đựng nhiều thông tin có giá trị hơn, biến đổi hơn, giảm hiện tƣợng tƣơng quan trong các biến của mô hình, bậc tự do cao hơn và hiệu quả hơn cho việc xử lý các mô hình (Baltagi, 2008).
Việc sử dụng dữ liệu bảng trong bài nghiên cứu này giúp ta có thể phân tích cho nhiều ngân hàng theo thời gian bằng cách kết hợp thông tin chuỗi thời gian và thông tin chéo giữa các ngân hàng. Phƣơng pháp hồi quy với dữ liệu bảng phổ biến nhất là mô hình Pooled OLS (OLS), mô hình hồi quy tác động cố định (FEM) và mô hình hồi quy tác động ngẫu nhiên (REM).
Để chọn ra mô hình phù hợp giữa OLS, FEM và REM luận văn sẽ tiến hành các kiểm định cần thiết để so sánh từng mô hình với nhau.
- So sánh FEM và OLS: Uớc lƣợng tác động cố định đƣợc kiểm chứng bằng kiểm định F với giả thuyết H0 cho rằng tất cả các hệ số vi đều bằng 0 (nghĩa là không có sự khác biệt giữa các đối tƣợng hoặc các thời điểm khác nhau). Bác bỏ giả thuyết H0 với mức ý nghĩa cho trƣớc (Prob < 0.05) sẽ cho thấy ƣớc lƣợng tác động cố định là phù hợp và ngƣợc lại ƣớc lƣợng ƣớc lƣợng OLS là phù hợp (Prob > 0.05).
- So sánh REM và OLS: Ƣớc lƣợng tác động ngẫu nhiên đƣợc kiểm chứng bằng phƣơng pháp nhân tử Lagrange (LM) với kiểm định Breusch-Pagan (Baltagi, 2008). Theo đó giả thuyết H0 cho rằng sai số của ƣớc lƣợng thô (OLS) không bao gồm các sai lệch giữa các đối tƣợng var(vi) = 0, phƣơng sai của các sai số qua các thực thể (các đối tƣợng hoặc các thời điểm) là không đổi. Bác bỏ giả thuyết H0 (Prob < 0.05) cho thấy sai số trong ƣớc lƣợng có bao gồm cả sự sai lệch giữa các nhóm và phù hợp với ƣớc lƣợng tác động ngẫu nhiên (REM), ngƣợc lại ƣớc lƣợng OLS là phù hợp (Prob > 0.05).
- So sánh FEM và REM: Kiểm định Hausman sẽ đƣợc sử dụng để lựa chọn phƣơng pháp ƣớc lƣợng phù hợp giữa hai phƣơng pháp ƣớc lƣợng tác động cố định và tác động ngẫu nhiên (Baltagi, 2008). Theo nhƣ kiểm định Hausman nếu giá trị Prob < 0.05, bác bỏ H0, có nghĩa Ui và biến độc lập tƣơng quan, khi đó lựa chọn mô hình tác động cố định (FEM) và ngƣợc lại Prob >0.05, chấp nhận H0, nghĩa là Ui và biến độc lập không tƣơng quan,, lựa chọn mô hình tác động ngẫu nhiên (REM).
Thực hiện kiểm định các khuyết tật của mô hình hồi quy đã lựa chọn (OLS, FEM hay REM) sẽ thấy những hạn chế của mô hình nhƣ có hiện tƣợng phƣơng sai
thay đổi, nhiễu tự tƣơng quan. Từ đó, luận văn sẽ sử dụng ƣớc lƣợng bình phƣơng tối thiểu tổng quát (GLS) để khắc phục các khuyết tật của mô hình đã chọn vì theo Greene (2003), Wooldridge (2010) để kết quả ƣớc lƣợng không chệch và hiệu quả, có thể sử dụng ƣớc lƣợng bình phƣơng tối thiểu tổng quát (GLS) để khắc phục hiện tƣợng phƣơng sai thay đổi, nhiễu tự tƣơng quan.
Do đó, mô hình sau cùng đƣợc khắc phục khuyết tật bằng GLS sẽ là mô hình đƣợc lựa chọn để phân tích và thảo luận kết quả hồi quy.
Trong nghiên cứu này tác giả sẽ dùng một số kiểm định để kiểm tra các khuyết tật của mô hình hồi quy nhƣ sau:
- Kiểm tra đa cộng tuyến nghiên cứu dựa vào hệ số VIF, kết hợp kiểm tra hệ số tƣơng quan của mô hình hồi quy.
- Để kiểm tra sự có mặt không cần thiết của các biến độc lập trong mô hình, nghiên cứu dùng kiểm định Wald để kiểm tra các hệ số hồi quy của các biến trong mô hình khác 0 là thực sự có ý nghĩa hay không?
- Để kiểm định hiện tƣợng phƣơng sai sai số thay đổi trong các ƣớc lƣợng, nghiên cứu tiến hành các kiểm định về hiện tƣợng phƣơng sai sai số thay đổi bằng các câu lệnh:
+ hettest để thực hiện kiểm định Breush – Pagan/ Cook Weisberg cho hiện tƣợng phƣơng sai thay đổi sau khi hồi quy OLS bằng lệnh reg.
+ xttest3 để thực hiện kiểm định Modified Wald trong mô hình FEM.
+ xttest0 để thực hiện kiểm định Breusch and Pagan Lagrangian multiplier trong mô hình REM.
- Để kiểm định hiện tƣợng tự tƣơng quan trong mô hình, nghiên cứu sẽ sử dụng kiểm định Wooldridge.