Cơ sở dữ liệu được tác giả thu thập từ 13 NHTMCP trong giai đoạn từ năm 2006 đến năm 2015. Nguồn dữ liệu các biến :
S Các biến kinh tế vĩ mô ( tốc độ tăng trưởng GDP, tỷ lệ thất nghiệp, tỷ lệ lạm
phát, lãi suất cho vay bình quân ) lấy từ số liệu của WB, IMF và IFS.
S Các biến nội tại ngân hàng: lấy từ số liệu trong các BCTC và BCTN của 13
ngân hàng thương mại cổ phần tại Việt Nam qua các năm từ 2006-2015.
3.3.2.2. Phương pháp ước lượng
Dữ liệu trong nghiên cứu được thu thập từ báo cáo tài chính của 13 NHTM trong giai đoạn 2006-2013. Luận văn Bên cạnh các biến phụ thuộc quan sát được nêu trên thì chắc chắn mỗi ngân hàng sẽ có những đặc điểm riêng (không quan sát được) tác động đến tỷ lệ nợ xấu. Như vậy, nếu dùng kỹ thuật hồi quy theo phương pháp ước lượng bình phương nhỏ nhất OLS (Ordinary Least Square) sẽ vô tình bỏ qua các yếu tố đặc trưng không quan sát được của từng ngân hàng, như cách thức hoạt động, mô hình quản trị rủi ro tín dụng, chính sách điều hanh... Do đó, để phù hợp với việc sử dụng dữ liệu bảng, tác giả sử dụng thêm hai mô hình kinh tế lượng khác có tính đến ảnh hưởng của đặc điểm riêng ở mỗi ngân hàng khi ước lượng, đó là mô hình tác động cố định (FEM - Fixed Effects Model) và mô hình tác động ngẫu nhiên (REM - Random Effects Model). Tuy nhiên, để thận trọng thì tác giả vẫn tiến hành đầy đủ các kiểm định phù hợp để so sánh giữa ba mô hình để chọn mô hình thích hợp.
Tác giả thực hiện các ước lượng này bằng phần mềm Eview.
Bước 1: Kiểm định Likelihood Ratio Test cho phép lựa chọn giữa mô hình FEM và Pooled OLS với giả thuyết H0: mô hình Pooled OLS là phù hợp hơn.
Bước 2: Kiểm định Hausman: kỹ thuật lựa chọn giữa mô hình FEM và REM. Giả thuyết H0 làm nền tảng cho kiểm định Hausman là tác động cá biệt của mỗi đơn vị chéo không gian có tương quan với các biến hồi quy khác trong mô hình. Nếu có tương quan (giả thuyết H0 bị từ chối), mô hình hồi quy theo REM sẽ cho kết quả bị thiên lệch và khi đó mô hình FEM được chọn.