PHƯƠNG PHÁP NGHIÊN CỨU
2.3. Dữ liệu và phương pháp ước lượng
Dữ liệu sử dụng cho nghiên cứu là dữ liệu thứ cấp được thu thập từ Niên giám thống kê của các địa phương và website của Tổng cục Thống kê. Việc phân tích thực trạng chủ yếu sử dụng dữ liệu chuỗi thời gian cho tổng thể nền kinh tế Việt Nam nên
chúng tôi có được chuỗi dữ liệu đủ dài trong khoảng thời gian 1986-2020. Tuy nhiên, trong các mô hình ước lượng, chúng tôi sử dụng dữ liệu bảng của 60 đơn vị là các tỉnh, thành phố do đó bị hạn chế hơn về khoảng thời gian và chúng tôi chỉ có thể có được dữ liệu từ năm 1999-2018. Như vậy, mô hình (2.3) được ước lượng với dữ liệu bảng với số quan sát theo thời gian là 20 và theo không gian là 60, tức là chúng ta có một bảng gồm 1200 quan sát cho mỗi biến.
Việc sử dụng dữ liệu bảng sẽ mang lại nhiều ưu điểm so với việc sử dụng dữ liệu chéo và dữ liệu chuỗi thời gian như một số nghiên cứu đã thực hiện ở Việt Nam. Cụ thể, dữ liệu bảng có 2 ưu điểm nổi trội như sau:
Một là, dữ liệu bảng cung cấp các kết quả ước lượng các tham số trong mô hình tin cậy hơn. Lý do cho điều này bởi dữ liệu bảng cho phép chúng ta kiểm soát các yếu tố không quan sát được. Các yếu tố này có thể khác nhau giữa đối tượng nhưng không thay đổi theo thời gian (chẳng hạn, vị trí địa lý, nét văn hóa của các địa phương) hoặc thay đổi theo thời gian nhưng lại không khác nhau giữa các đối tượng. Điều này có thể rất cần thiết để giảm sự thiên chệch trong ước lượng. Dữ liệu bảng thường có sự biến động mạnh hơn hai loại dữ liệu còn lại, đây là lợi thế mang lại độ chính xác cho các ước lượng cao hơn khi các biến giải thích trong mô hình có sự biến động mạnh hơn. Ngoài ra, vấn đề đa cộng tuyến sẽ được giảm thiểu khi sử dụng dữ liệu bảng dẫn đến các suy diễn thống kê từ mô hình ước lượng được tin cậy hơn.
Hai là, dữ liệu bảng cho phép chúng ta xác định và đo lường tác động mà những tác động này không thể được xác định và đo lường khi sử dụng sử dụng chéo hoặc dữ liệu thời gian. Chẳng hạn, giả sử mục đích của chúng ta là ước lượng một hàm sản xuất để đánh giá lợi thế kinh tế theo quy mô và cải tiến công nghệ ở một ngành công nghiệp cụ thể. Với dữ liệu chéo, chúng ta có thể dự báo được sự thay đổi công nghệ. Với dữ liệu thời gian, chúng ta không thể tách riêng được lợi thế kinh tế theo quy mô từ sự thay đổi công nghệ. Để tách riêng lợi thế kinh tế theo quy mô từ sự thay đổi công nghệ, các nghiên cứu dữ liệu thời gian trong quá khứ đã giả định rằng lợi thế không đổi theo quy mô; Tuy nhiên, đây sẽ là một phương pháp rất không đáng tin cậy. Với dữ liệu bảng, chúng ta có thể xác định và đo lường cả hai yếu tố lợi thế kinh tế theo quy mô và sự thay đổi công nghệ.
Để lựa chọn phương pháp ước lượng phù hợp và khắc phục được các khuyết tật xảy ra đối với mô hình, nghiên cứu thực hiện quy trình ước lượng và kiểm định như được thể hiện trong hình 2.1. Đầu tiên là ước lượng mô hình OLS gộp (Pooled OLS) và kiểm định giả thuyết , tức là không có sự khác biệt giữa các cá nhân trong dữ liệu bảng. Nếu bác bỏ giả thuyết này thì sẽ lựa chọn phương pháp ước lượng tác động cố định (FE). Ước lượng FE sẽ được so sánh với ước lượng tác động ngẫu nhiên (RE) và
Hausman RE phù hợp hơn : Tất cả Sử dụng POLS FE POLS Bác bỏ Chấp nhận FE RE Chấp nhận Bác bỏ FGLS
- Phương sai thay đổi - Tự tương quan
việc lựa chọn phương pháp nào sẽ dựa trên kiểm định Hausman. Giả thuyết cho kiểm định này là “Phương pháp ước lượng tác động ngẫu nhiên là phù hợp”. Nếu giá trị xác suất p-value nhỏ hơn mức ý nghĩa lựa chọn thì ta bác bỏ giả thuyết , điều này đồng nghĩa với việc ta sẽ lựa chọn phương pháp ước lượng FE.
Với mô hình được lựa chọn sẽ tiếp tục được kiểm định về phương sai thay đổi và tự tương quan. Nếu xảy ra ít nhất một trong hai vấn đề này thì phương pháp ước lượng bình phương tổng quát khả thi FGLS được sử dụng để khắc phục vấn đề đó. Ngoài ra, một số kiểm định khác để kiểm tra giả thiết đối với mô hình hồi quy cũng được thực hiện để đảm bảo tính tin cậy của các kết quả thu được. Tóm tắt quy trình ước lượng được thể hiện trong hình 2.1.
Hình 2.1. Quy trình ước lượng
Nguồn: Thực hiện bởi nhóm tác giả
2.4. Kết luận chương 2
Trong chương này chúng tôi đã trình bày hai chỉ số để đo lường mức độ CDCCLĐ thường được sử dụng trong các nghiên cứu là NAV và MLI. Cùng với việc phân tích xu hướng chuyển dịch thì mức độ chuyển dịch cũng là vấn đề cần quan tâm, các chỉ số này sẽ đóng vai trò giúp chúng ta nhìn nhận vấn đề này. Một mô hình kinh tế lượng để đánh giá tác động của các yếu tố đến CDCCLĐ cũng đã được chỉ định. Mô hình được lựa chọn dựa trên các cơ sở lý thuyết, các nghiên cứu thực nghiệm và kế thừa các kết quả nghiên cứu trước. Quy trình các bước để tìm ra phương pháp ước
lượng phù hợp cho mô hình kinh tế lượng được chỉ định với dữ liệu bảng thể hiện chi tiết qua một sơ đồ đi kèm với các giả thuyết qua mỗi bước.
Chương 3