2.4. Ứng dụng mơ hình Logistic hồn thiện mơ hình xếp hạng tín dụng cá nhân vay
2.4.3.1. Xác định kích thước mẫu
Mơ hình hồi quy Binary Logistic được sử dụng trong nghiên cứu này là mơ hình hồi quy đa biến; kích thước mẫu cho mơ hình hồi quy đa biến được xác định theo công thức: n 50 + 8p (Nguyễn Đình Thọ, 2012). Trong đó, n là kích thước mẫu tối thiểu cần thiết cho nghiên cứu và p là số lượng biến độc lập trong mơ hình.
Tuy nhiên, chúng ta thường dùng phương pháp phân tích nhân tố khám phá EFA cùng với mơ hình hồi quy đa biến trong một nghiên cứu, nên sau khi xác định
kích thước mẫu cho mơ hình hồi quy đa biến, chúng ta phải so sánh với kích thước mẫu địi hỏi cho EFA (Nguyễn Đình Thọ, 2012).
Trong nghiên cứu này, tác giả sử dụng 16 biến (p = 16);
Điều kiện 1: thay p = 16 vào cơng thức trên ta có n 178 quan sát.
Điều kiện 2: Trong phân tích nhân tố khám phá EFA, kích thước mẫu tối thiểu là 50 quan sát, tốt hơn là 100 quan sát và tỷ lệ quan sát/biến đo lường là 5:1, tốt nhất là 10:1. Như vậy, kích thước mẫu cho 16 biến là 160 quan sát (= 10*16).
Kết hợp điều kiện 1 và điều kiện 2 thì kích thước mẫu tối thiểu cho toàn bộ nghiên cứu là 178 quan sát.
Ngoài việc xem xét kích thước mẫu cho toàn bộ nghiên cứu, trong hồi quy Logistic cũng cần phải xem xét đến kích thước mẫu cho mỗi phạm trù. Kích thước mẫu phải đảm bảo lớn hơn số biến độc lập và đảm bảo 20 mẫu/biến độc lập (Nguyễn Trương Nam). Do đó, trong số mẫu nghiên cứu tác giả chọn lựa phi xác suất số lượng ít nhất 20 quan sát là khách hàng không trả được nợ vay (Y = 0).
Như vậy, bằng phương pháp chọn mẫu phi xác suất, tác giả phải chọn kích thước mẫu sao cho trong đó có ít nhất 20 quan sát là khách hàng khơng trả được nợ vay (Y = 0) và tỷ lệ khách hàng không trả được nợ vay/kích thước mẫu phải bằng tỷ lệ khách hàng không trả được nợ vay/đám đông thống kê, và kích thước mẫu tối thiểu cho toàn bộ nghiên cứu là 178 quan sát.