Đối với dữ liệu liên quan đến NHTM, có 2 nhóm dữ liệu chính mà nghiên cứu cần tiến hành thu thập dữ liệu: (1) Dữ liệu về hoạt động cho vay DNSN của NHTM và (2) Dữ liệu về các chỉ số tài chính cơ bản của NHTM.
Đối với dữ liệu về các chỉ số tài chính cơ bản của NHTM, nghiên cứu chủ yếu lấy từ báo cáo tài chính đã được kiểm toán của các NHTM ở Việt Nam qua các năm. Việc sử dụng số liệu từ báo cáo tài chính của các NHTM tương đối phổ biến trong các nghiên cứu về NHTM ở Việt Nam. Đây là nguồn dữ liệu công khai, được kiểm soát chặt chẽ về mức độ tin cậy và minh bạch. Báo cáo tài chính của các NHTM được ưu tiên sử dụng là báo cáo tài chính riêng lẻ của NHTM hơn là báo cáo tài chính hợp nhất để đảm bảo rằng các số liệu phản ánh chính xác nhất hoạt động của hệ thống NHTM. Tuy nhiên một số NHTM không cung cấp báo cáo tài chính riêng lẻ của NHTM mà chỉ cung cấp báo cáo tài chính hợp nhất của tập đoàn. Trong trường hợp này bắt buộc nghiên cứu phải lấy dữ liệu từ báo cáo hợp nhất. Ở Việt Nam, hoạt động của NHTM còn tương đối đơn giản và hoạt động của các công ty con chỉ chiếm một tỷ lệ rất nhỏ trong tổng kết quả hoạt động của cả tập đoàn. Vì vậy so sánh dữ liệu từ báo cáo tài
chính hợp nhất và báo cáo tài chính riêng lẻ không có sự khác biệt nhiều, do đó không thể ảnh hưởng nghiêm trọng đến kết quả của nghiên cứu. Do đó nghiên cứu cho rằng dữ liệu từ báo cáo tài chính hợp nhất vẫn hoàn toàn có thể sử dụng và cho ra kết quả nghiên cứu chính xác và độ tin cậy cao.
Đối với dữ liệu về hoạt động cho vay DNSN của NHTM, nghiên cứu không thể lấy được dữ liệu này từ các nguồn công khai từ NHTM do các báo cáo tài chính, báo cáo thường niên,.. của NHTM đều không đề cập cụ thể về hoạt động này. Để có thể thu thập được các dữ liệu này, trước hết tác giả liên hệ trực tiếp với Khối Khách hàng doanh nghiệp (hoặc Khối Khách hàng doanh nghiệp Nhỏ và vừa, tùy theo từng ngân hàng) để xin cung cấp số liệu. Tuy nhiên cách làm này không thực hiện được do một số lý do sau:
(1) Một số ngân hàng từ chối cung cấp dữ liệu nghiên cứu
(2) Một số ngân hàng đồng ý cung cấp dữ liệu tuy nhiên các NHTM này chỉ có thể cung cấp dữ liệu về hoạt động cho vay DNSN dựa trên tiêu chí của riêng NHTM. Quy định mới nhất về tiêu chí phân loại doanh nghiệp theo quy mô được ban hành năm 2018. Trước đó, việc phân loại doanh nghiệp theo quy mô dựa vào Nghị định số 56/2009/NĐ-CP do Chính phủ ban hành vào ngày 30/06/2009. Theo nghị định này thì căn cứ để phân loại các DNSN chỉ dựa vào một tiêu chí duy nhất là số lao động (10 lao động trở xuống cho tất cả các khu vực, ngành nghề sản xuất) mà không kèm theo tiêu chí về tổng nguồn vốn hoặc tổng doanh thu như quy định trong Quyết định 27/2018/QĐ-TTg năm 2018. Như vậy dẫn đến việc tiêu chí phân loại DNSN khác nhau trong 2 giai đoạn nghiên cứu (từ 2011 đến 2018 và từ 2018 đến 2020). Vì vậy số liệu từ các NHTM cung cấp có thể không đồng nhất trong 2 giai đoạn do sử dụng tiêu chí phân loại doanh nghiệp khác nhau.
Hơn thế nữa, rất nhiều NHTM không sử dụng tiêu chí phân loại doanh nghiệp theo quy mô như Nghị định số 56/2009/NĐ-CP hay Quyết định 27/2018/QĐ-TTg mà tự phân loại nhóm doanh nghiệp theo tiêu chí tự NHTM đặt ra. Thêm vào đó hầu hết các NHTM không quan tâm đến tiêu chí về số lao động khi phân loại mà chủ yếu dựa vào chỉ tiêu về tài chính (doanh thu, nguồn vốn). Có NHTM coi các doanh nghiệp có doanh thu dưới 100 tỷ đã là DNSN, có NHTM lại coi doanh nghiệp doanh thu dưới 20 tỷ là DNSN. Chính vì quan điểm và định nghĩa về DNSN rất khác nhau giữa các NHTM như vậy nên việc thu thập dữ liệu về hoạt động cho vay DNSN trực tiếp từ các NHTM sẽ có sai lệch rất lớn, thiếu sự đồng nhất và do đó kết quả nghiên cứu thiếu chính xác và độ tin cậy thấp.
(3) Một số ngân hàng đồng ý cung cấp dữ liệu nhưng không đủ dữ liệu theo chuỗi thời gian như nghiên cứu mong muốn. Bên cạnh tính không đồng nhất của chỉ tiêu phân loại DNSN giữa các NHTM, một vấn đề nữa tác giả gặp phải khi lấy dữ liệu trực tiếp từ các NHTM đó là sự không đầy đủ của dữ liệu qua thời gian. Phần lớn các NHTM đồng ý cung cấp dữ liệu chỉ cho phép tác giả truy cập số liệu năm gần nhất (2020).
Với những lý do kể trên tác giả nhận thấy việc lấy dữ liệu về hoạt động cho vay DNSN trực tiếp từ các NHTM không khả thi và dữ liệu (nếu có) cũng không đảm bảo tính chính xác và đầy đủ.
Như đã phân tích ở trên, một cách thu thập dữ liệu khác được sử dụng phần lớn trong các nghiên cứu về doanh nghiệp nhỏ và vừa ở Việt Nam đó là sử dụng dữ liệu từ các cuộc điều tra khảo sát về doanh nghiệp có quy mô lớn được thực hiện bởi các tổ chức uy tín. Tuy nhiên, tính đại diện của các dữ liệu này thường không cao và không phản ánh được đặc điểm của hoạt động cho vay DNSN theo thời gian.
Để khắc phục nhược điểm về bộ dữ liệu của các nghiên cứu trước đây cùng với việc cân nhắc các nguồn lực của nghiên cứu (về nhân lực, thời gian, tài chính), tác giả đã quyết định không sử dụng dữ liệu sơ cấp thu thập bằng phương pháp điều tra khảo sát các NHTM tại Việt Nam. Thay vào đó tác giả sử dụng dữ liệu thứ cấp được cung cấp bởi Trung tâm thông tin tín dụng quốc gia Việt Nam (CIC). Đây là Trung tâm dữ liệu trực thuộc Ngân hàng Nhà nước Việt Nam, được thành lập từ năm 1992 với tiền thân là Phòng thông tin phòng ngừa rủi ro trực thuộc Vụ Tín dụng của NHNN Việt Nam. Theo thông tin được công bố trên Website chính thức của CIC, CIC đang quản lý và lưu trữ thông tin của hơn 30 triệu khách hàng vay. Đồng thời, CIC cũng nhận được báo cáo thông tin từ tất cả các NHTM và các tổ chức tín dụng khác đang hoạt động tại Việt Nam. Như vậy CIC có cơ sở dữ liệu rất phong phú, dữ liệu đầy đủ, độc lập, khách quan, minh bạch, có độ tin cậy cao và lưu trữ lịch sử dữ liệu trong nhiều năm.
Tuy nhiên, một vấn đề tác giả gặp phải khi liên hệ với CIC để xin dữ liệu đó là CIC không cung cấp thông tin tín dụng cho khách hàng cá nhân mà chỉ cung cấp thông tin cho các tổ chức tín dụng mà thôi. Để giải quyết vấn đề này, tác giả đã thông qua các mối quan hệ cá nhân để liên hệ và đặt vấn đề về khai thác dữ liệu thông qua một chi nhánh NHTM. Chi nhánh đã cho phép tác giả sử dụng các dữ liệu mà chi nhánh mua từ CIC cho mục đích nghiên cứu và thực hiện một số báo cáo nghiên cứu thị trường cho chi nhánh. Để lấy dữ liệu từ CIC, tác giả đã kết hợp với bộ dữ liệu về DNSN qua các năm mà tác giả đã tiến hành xử lý, phân loại từ Điều tra doanh nghiệp
của Tổng Cục thống kê (đã trình bày ở trên) để tra cứu dư nợ tín dụng theo từng tổ chức tín dụng của từng DN. Kết quả được CIC trả về sẽ cho biết chi tiết dư nợ tín dụng tại từng tổ chức tín dụng của từng DNSN qua các năm. Do tính đến thời điểm thu thập dữ liệu, Tổng cục thống kê chưa công bố dữ liệu doanh nghiệp năm 2020, nghiên cứu sử dụng dữ liệu DNSN năm 2019 để tra cứu thông tin tín dụng cho cả 2 năm 2019 và 2020. Điều này không gây ảnh hưởng tới kết quả nghiên cứu vì rất ít NHTM đồng ý cho vay DNSN có thời gian thành lập dưới 1 năm (DNSN thành lập mới trong năm 2020). Như vậy việc tra cứu thông tin tín dụng năm 2020 với bộ dữ liệu doanh nghiệp 2019 sẽ không có khác biệt đáng kể so với bộ dữ liệu doanh nghiệp 2020. Dựa trên danh sách doanh nghiệp được công bố bởi Tổng cục thống kê, trước hết tác giả tiến hành phân loại DNSN dựa trên tiêu chí phân loại doanh nghiệp theo Quyết định 27/2018/QĐ-TTg. Trên cơ sở danh sách DNSN đó, tác giả lọc các DNSN theo tiêu chí có doanh thu thuần và lợi nhuận dương, tức là đáp ứng những điều kiện cơ bản để có thể vay vốn NHTM. Danh sách này sau đó được gửi lên CIC để tra cứu thông tin dưới dạng mua dữ liệu theo lô lớn. Từ kết quả này, tác giả tiến hành phân loại lại dữ liệu theo thời gian, và theo các tổ chức tín dụng, từ đó ra được dữ liệu tổng thể về hoạt động cho vay DNSN của từng NHTM qua thời gian.
Với việc kết hợp dữ liệu về DNSN được thu thập bởi Tổng cục Thống kê và dữ liệu tín dụng được cung cấp bởi Trung tâm thông tin tín dụng quốc gia Việt Nam (CIC), tác giả kỳ vọng rằng đây là bộ dữ liệu cung cấp thông tin đầy đủ, chính xác về tổng thể hoạt động cho vay DNSN của các NHTM ở Việt Nam. Bộ dữ liệu cũng khắc phục được nhược điểm về các bộ dữ liệu đã được sử dụng trong các nghiên cứu trước đây, do đó kết quả nghiên cứu được kỳ vọng là sẽ chính xác và mang tính bao quát hơn các kết quả nghiên cứu trước.
Để tạo được bảng dữ liệu cân xứng, một số NHTM không đủ quan sát qua chuỗi thời gian cũng bị loại bỏ như các NHTM được mua lại với giá 0 đồng hoặc các NHTM nhỏ không công bố đầy đủ số liệu tài chính qua các năm. Cụ thể danh sách các NHTM thu thập dữ liệu trong giai đoạn 2011 – 2020 được trình bày trong phụ lục 3.