Dữ liệu nghiên cứu được thu thập trực tiếp từ Hệ thống quản lý thẻ tín dụng Sacombank Sema của Ngân hàng Sacombank bao gồm:
Dữ liệu về nhân thân của chủ thẻ được thu thập và nhập liệu vào hệ thống chấm
điểm xếp hạng tín dụng cá nhân Sacombank Pool Data thông qua hợp đồng phát hành
nhau nhằm đảm bảo được tính khách quan và hạn chế được các chủ thẻ có đặc điểm giống nhau do đặc tính vùng, miền, khu vực.
Dữ liệu về lịch sử giao dịch của chủ thẻ được hệ thống Sacombank Sema ghi nhận trực tiếp ngay khi chủ thẻ tín dụng bắt đầu thực hiện giao dịch thanh toán hóa đơn hàng hóa dịch vụ hoặc ứng tiền mặt.
Đề tài sử dụng dữ liệu thẻ tín dụng được phát hành và sử dụng từ ngày 01/01/2016 đến 31/12/2018, không tính những giao dịch thẻ bị đóng, bị khóa vĩnh viễn hoặc không phát sinh giao dịch trong thời gian nói trên.
❖ Kích cỡ mẫu phụ thuộc vào phương pháp phân tích:
Theo Green (1991) trích trong Nguyễn Đình Thọ (2011) khuyến nghị công thức
xác định cỡ mẫu nghiên cứu như sau: n ≥ 50 + 8m. Trong đó, n là kích thước mẫu tối thiểu cần thiết, và m là số biến độc lập trong mô hình.
Theo nghiên cứu của Bollen (1989) và Hatcher (1994) về kích thước mẫu, tính đại diện của số lượng mẫu được lựa chọn nghiên cứu sẽ thích hợp nếu kích thước mẫu tối thiểu là gấp 5 lần tổng số biến quan sát.
Đối với phân tích hồi quy đa biến: cỡ mẫu tối thiểu cần đạt được tính theo công
thức là: n >= 8k+50
Trong đó: n là kích cỡ mẫu, k là số biến độc lập của mô hình (theo Tabachnick và Fidell, 1996).
Mô hình nghiên cứu của đề tài bao gồm 14 biến độc lập vậy kích thước mẫu n>= 8*14+50 =162.
Do vậy nghiên cứu được thực hiện với kích thước mẫu là 271 được xem là phù hợp.