3.3. Phương pháp nghiên cứu 49
3.3.1. Dữ liệu nghiên cứu 49
Nghiên cứu sử dụng dữ liệu thứ cấp, dữ liệu này được thu thập từ các báo cáo tài chính, báo cáo thường niên và các tài liệu liên quan của 39 NHTMVN trong khoảng thời
50
gian từ năm 2005 đến năm 2011 (07 năm). Tính đến 31/12/2012 hệ thống ngân hàng Việt Nam gồm có tổng cộng 51 ngân hàng; trong đó: 05 NHTM nhà nước (đã cổ phần hóa 04 ngân hàng), 04 ngân hàng liên doanh, 05 ngân hàng 100% vốn nước ngoài và 37 NHTM cổ phần (trước khi sáp nhập, sau sáp nhập cịn 34 ngân hàng). Vì vậy việc lấy mẫu từ 39 NHTM (chiếm tỷ lệ 76,5% trên tổng thể hệ thống; hoặc 92,9% nếu không kể các ngân hàng liên doanh và 100% vốn nước ngồi; hoặc 100% nếu chỉ tính các NHTM) có thể được xem là mang tính đại diện cho tổng thể toàn khối NHTM Việt Nam.
Dữ liệu nghiên cứu trong luận văn này là dữ liệu bảng với 196 quan sát. Trong nghiên cứu kinh tế với kỹ thuật phân tích hồi quy đa biến, có một số nghiên cứu đưa ra kinh nghiệm chọn kích thước mẫu để mang tính đại diện cho tổng thể như: Green (1991), Tabachnick và Fidell (2007), ...
Theo Green (1991) cho rằng cỡ mẫu nghiên cứu tối thiểu như sau: n ≥ 50 + 8m, cịn Tabachnick và Fidell (2007) thì đề xuất: n ≥ 104 + m; trong đó m là số lượng biến độc lập trong mơ hình nghiên cứu. Luận văn này xây dựng mơ hình nghiên cứu với 9 biến độc lập, như vậy theo tiêu chuẩn theo Green (1991) thì số quan sát tối thiểu sẽ là: n ≥ 122 quan sát, cịn theo Tabachnick và Fidell (2007) thì: n ≥ 113 quan sát. Do đó dựa theo kinh nghiệm chọn mẫu nghiên cứu của các tác giả trên thì luận văn này xây dựng mơ hình nghiên cứu với 9 biến độc lập và dữ liệu nghiên cứu với 196 quan sát đã đáp ứng được yêu cầu nghiên cứu, đồng thời mẫu nghiên cứu cũng mang tính đại diện cho tổng thể.