Đầu tiên, về đặc điểm mẫu nghiên cứu, hiện nay, có nhiều kỹ thuật để xác định kích thƣớc mẫu đại diện cho mẫu tổng thể. Một trong những kỹ thuật xác định
kích thƣớc mẫu dựa trên kinh nghiệm của Green (1991), tác giả khuyến nghị công
thức xác định cỡ mẫu nghiên cứu nhƣ sau:
n 50 + 8m (2)
Trong đó, n là kích thƣớc mẫu tối thiểu cần thiết và m là sốlƣợng biến độc lập
trong mô hình.
Với công thức (2) và số biến độc lập trong mô hình (1) đã xây dựng ởchƣơng
3, ta có kích thƣớc mẫu tối thiểu là 106 sốquan sát.
Ngoài ra, Tabachnick và Fidell (2007) cho rằng công thức xác định kích thƣớc mẫu đủ lớn để kết quả hồi quy đƣợc thuyết phục hơn là:
n 104 + m (3)
Nhƣ vậy, theo công thức (3), kích thƣớc mẫu tối thiểu là 111 sốquan sát. Trong nghiên cứu này, mẫu nghiên cứu đƣợc hình thành từ việc thu thập dữ
liệu của 25 ngân hàng TMCP hoạt động trên lãnh thổ Việt Nam có báo cáo tài chính, báo cáo thƣờng niên đƣợc công bố công khai trong giai đoạn từ năm 2006 đến 2016. Do có một sốngân hàng mới công bốcông khai trong vài năm gần đây và
một số ngân hàng đã tiền hành hợp nhất, sáp nhập số liệu nên mẫu nghiên cứu sau
cùng là 275 sốquan sát. Sốquan sát này mẫu nghiên cứu thỏa điều kiện ở công thức
(2) và (3).
Sau đó, để có một bức tranh cụ thể về các biến quan sát, khóa luận sử dụng
34 số trung bình, độ lệch chuẩn, giá trị lớn nhất và giá trị nhỏ nhất để làm rõ hơn về
những đặc trƣng của các biến quan sát trong mẫu nghiên cứu. Lƣu ý là giá trị các
biến đã đƣợc lấy giá trị logarit tự nhiên nhằm đảm bảo điều kiện giá trị nằm trong khoảng [- và đƣợc phân phối đối xứng.
Bảng 4.1. Thống kê mô tảcác biến trong mô hình
Biến Số quan
sát Trung bình Độ lệch chuẩn Giá trịnhấ nht ỏ
Giá trị lớn nhất NPLit 269 -3,980146 0,764859 -7,130899 0,5988365 GDPit 275 0,0612455 0,0061772 0,0525 0,0713 INFit 275 0,0915382 0,0709486 0,019079 0,2267332 UNTit 275 0,0220909 0,0026143 0,018 0,026 ROEit 271 0,8216086 2,23173 -5,360193 7,214504 CREDITit 247 -1,26966 1,198215 -9,21034 2,2428583 SIZEit 271 2,371843 1,1332445 1,904761 2,626271 Nguồn: Kết xuất từ phần mềm Stata 13
Nhƣ vậy, bảng 4.1. mô tả giá trịtrung trình, độ lệch chuẩn, giá trị nhỏ nhất và giá trị lớn nhất. Cỡ mẫu nghiên cứu gồm 275 - 269 quan sát cho mỗi biến. Đây là cỡ
35