Dữ liệu về DNSN qua các năm (từ 2011 đến năm 2019) được lấy từ kết quả Điều tra doanh nghiệp của Tổng cục thống kê. Đây là bộ số liệu đầy đủ nhất về toàn bộ các doanh nghiệp Việt Nam với mức độ tin cậy cao. Các thông tin trong bộ dữ liệu này bao gồm:
- Tên doanh nghiệp - Mã số thuế
- Cách thức liên hệ: Điện thoại, email - Loại hình doanh nghiệp
- Số lao động
- Thời gian đăng ký kinh doanh
- Địa điểm doanh nghiệp: Phường (xã), quận (huyện), tỉnh (thành phố) - Doanh thu bình quân năm
Với những dữ liệu rất đầy đủ và chi tiết này, nghiên cứu đã tiến hành phân loại và lọc ra dữ liệu về các DNSN qua các năm dựa trên quy định về quy mô doanh nghiệp được quy định trong Nghị định 39/2018/NĐ-CP do Chính phủ ban hành. Trước hết, dựa trên thông tin về lĩnh vực hoạt động, nghiên cứu phân loại tất cả các doanh nghiệp thành 3 nhóm lĩnh vực kinh doanh (1) lĩnh vực nông nghiệp, lâm nghiệp, thuỷ sản; (2) lĩnh vực công nghiệp, xây dựng và (3) lĩnh vực thương mại, dịch vụ.
Đối với 2 lĩnh vực đầu tiên, nghiên cứu lọc ra các doanh nghiệp đáp ứng đồng thời cả hai tiêu chí: số lao động tham gia bảo hiểm xã hội bình quân năm không quá 10 người và tổng doanh thu của năm không quá 3 tỷ. Đối với lĩnh vực thứ ba, nghiên cứu lọc ra các doanh nghiệp đáp ứng đồng thời cả hai tiêu chí: số lao động tham gia bảo hiểm xã hội bình quân năm không quá 10 người và tổng doanh thu của năm không quá 10 tỷ. Do bộ dữ liệu Điều tra doanh nghiệp của tổng cục thống kê không có chỉ tiêu về nguồn vốn do đó nghiên cứu không dựa vào chỉ tiêu này để phân loại doanh nghiệp theo quy mô.
Như vậy, kết thúc quá trình thu thập và xử lý dữ liệu, nghiên cứu đã tập hợp được danh sách toàn bộ các DNSN ở Việt Nam cùng thông tin cơ bản của các doanh nghiệp đó qua các năm. Dữ liệu này là các dữ liệu thứ cấp, lấy từ nguồn chính thống (Điều tra Doanh nghiệp của Tổng cục thống kê Việt Nam) và có độ tin cậy rất cao.