“Để có những phân tích thực nghiệm trong Chương 3 và Chương 4, Luận án sử dụng số liệu từ 2 nguồn số liệu quy mô lớn và đáng tin cậy. Nguồn thứ nhất là bộ dữ liệu điều tra doanh nghiệp hàng năm của Tổng cục thống kê Việt Nam (General Statistics
Office of Vietnam - GSO) dựa trên phạm vi khảo sát là toàn bộ các doanh nghiệp đang
hoạt động trên cả nước. Những thông tin do Tổng cục thống kê công bố, cung cấp là những thông tin chính thống, có tính pháp lý được các cấp, các ngành, các tổ chức và cá nhân trong nước cũng như quốc tế tin cậy sử dụng nhằm phục vụ công tác đánh giá, dự báo tình hình, hoạch định chính sách, kế hoạch phát triển kinh tế - xã hội của Việt Nam. Nguồn thứ hai là bộ dữ liệu về chỉ số năng lực cạnh tranh cấp tỉnh
(Provincial Competitiveness Index – PCI) của Phòng thương mại và công nghiệp Việt Nam (VCCI) với sự hỗ trợ của Cơ quan Phát triển Quốc tế Hoa Kỳ (USAID) tại Việt Nam .”PCI “đư ợc xây dựng từ dữ liệu điều tra doanh nghiệp thư ờng niên có quy mô lớn nhất, thực hiện một cách công phu nhất tại Việt Nam hiện nay. Chỉ số PCI chính là “tập hợp tiếng nói” của cộng đồng doanh nghiệp dân doanh về môi trường kinh doanh tại các tỉnh, thành phố ở Việt Nam” (trích www.pcivietnam.vn). Đây là
nguồn dữ liệu hữu ích và đáng tin cậy cho lãnh đạo các tỉnh, thành phố, các nhà hoạch định chính sách tham khảo nhằm đưa ra các biện pháp cải cách hành chính của chính quyền địa phư ơng một cách hiệu quả nhất.
“Để có bộ dữ liệu phục vụ cho nghiên cứu, nghiên cứu sinh đã xử lý, ghép nối dữ liệu và thực hiện theo các bư ớc sau:
- -
-
- -
Bước 1: Đọc và nghiên cứu bảng hỏi cuộc đi ều tra doanh nghiệp hàng năm
của GSO từ năm 2000 đ ến năm 2018;
Bước 2: Từ bộ dữ liệu điều tra doanh nghiệp, nghiên cứu sinh làm sạch dữ
liệu, loại bỏ các quan sát nhiễu, các quan sát ngoại lai với số lao đ ộng âm, doanh thu âm, …. giữ lại các biến quan trọng như mã ngành công nghi ệp (lấy theo tiêu chuẩn VSIC 2 chữ số), loại hình sở hữu, số lao đ ộng, lư ợng vốn, doanh thu, lợi nhuận, khấu hao, chi phí lao đ ộng, tài sản ngắn hạn, tài sản dài hạn, …; luận án nghiên cứu 139.255 doanh nghiệp ngành chế biến chế tạo trong giai đoạn từ năm 2000 đến năm 2018. Dữ liệu về giá trị gia tăng (VA) không sẵn có và đư ợc đo lường dựa trên cách tiếp cận thu nhập. Các đ ầu vào và đầu ra đã đư ợc giảm phát theo năm g ốc 2010;
Bước 3: Ghép nối các năm v ới nhau theo mã số thuế của doanh nghiệp và
năm nghiên c ứu để có bộ số liệu mảng cho các doanh nghiệp Việt Nam từ năm 2000 đến năm 2018;
Bước 4: Ghép nối chỉ số PCI và 9 chỉ tiêu trong bộ dữ liệu PCI giữa các năm
trong giai đo ạn 2006 – 2018 theo 60 tỉnh nghiên cứu trong luận án;
Bước 5: Tính toán giá trị các biến trong mô hình phân tích tác động của các nhân
tố đến hiệu quả phân bổ của các tỉnh và ghép nối với các biến liên quan đến chỉ số PCI để có bộ dữ liệu mảng theo 60 tỉnh trong giai đoạn 2000 – 2018 và giai đoạn 2006 – 2018.”