Theo như các nghiên cứu trước đây cũng như một số tài liệu về thống kê, phương pháp nghiên cứu khoa học, việc thiết kế mẫu và phương pháp chọn lựa mẫu thường bắt đầu từ đặc trưng của tổng thể mà người nghiên cứu đang hướng đến. Theo đó, tổng thể của đề tài này là các hồ sơ tín dụng tại BIDV - Chi nhánh Sài Gịn.
Để giải quyết được mục tiêu nghiên cứu như đã trình bày ở phần 1.2 của đề tài, đề tài sử dụng cách chọn mẫu phi xác suất (Suader, 2000) với phương pháp chọn mẫu thuận tiện được chấp nhận khi phương pháp này có thể giúp người nghiên cứu tiết kiệm thời gian và chi phí thực hiện (Kreger, 1998). Theo Kumar (2005), kích thước mẫu sẽ phụ thuộc vào việc người nghiên cứu muốn có thơng tin gì từ dữ liệu thu thập được. Có nhiều quan điểm khác nhau về kích thước mẫu, nếu vấn đề nghiên cứu càng đa dạng phức tạp thì mẫu nghiên cứu càng lớn, và một nguyên tắc nữa là mẫu càng lớn thì độ chính xác của nghiên cứu càng cao.
Đề tài chọn hồ sơ khách hàng vay phải thỏa điều kiện dư nợ phát sinh từ 01/01/2015 đến trước 31/12/2018 và còn dư nợ đến 31/12/2018 để đảm bảo tất cả các khách hàng đề phát sinh kỳ hạn nợ phải thanh toán, lúc này các biến quan sát mới có đủ giá trị và mới có thể đánh giá chất lượng khoản vay một cách tương đối chính xác. Qua đó đề tài thu về được gần hơn 5000 hồ sơ vay thỏa điều kiện.
Hơn thế nữa, theo sự đề nghị của Yamane (1967), khi số lượng tổng thể của vấn đề nghiên cứu lớn hơn 200 thì có thể sử dụng cách tính tốn mẫu nghiên cứu dựa vào tổng thể như sau:
𝑛 = 1
(𝛼2+𝑁)1 Trong đó, n là mẫu nghiên cứu
𝛼 là mức độ ý nghĩa thống kê (1%, 5% và 10%), đề tài này sẽ sử dụng mức ý nghĩa 10% như đây là mức các nghiên cứu tại Việt Nam sử dụng nhiều nhất.
N là số lượng tổng thể, trong đề tài này N = 5000.
Qua đó, đề tài tính tốn được số mẫu nghiên cứu ít nhất mà đề tài phải thu về là 98 hồ sơ vay. Do đó, đề tài quyết định kiểm tra 349 hồ sơ vay với mục đích số lượng càng cao thì càng tăng độ chính xác. Các số liệu trong đề tài này được thu thập trực tiếp từ hệ thống dữ liệu của Ngân hàng TMCP Đầu tư và Phát triển Việt Nam – chi nhánh Sài Gòn.
3.5 Phương pháp nghiên cứu
Luận văn sử dụng phần mềm Stata 13 chạy mơ hình hồi quy Probit nhị phân, các bước thực hiện có trình tự như sau:
- Thống kê mô tả các biến.
- Kiểm tra hiện tượng đa cộng tuyến.
- Dùng stepwise vào mơ hình Probit tìm mơ hình tối ưu.
- Kiểm tra mơ hình liệu có bỏ sót biến ra khỏi mơ hình hay khơng. - Kiểm định độ phù hợp của mơ hình.
- Kiểm định mức độ giải thích của mơ hình