CHƯƠNG 1 : GIỚI THIỆU
3.5. XỬ LÝ SỐ LIỆU
3.5.2. Mơ hình hồi quy dữ liệu bảng
3.5.2.1. Ưu điểm của dữ liệu bảng
Dữ liệu bảng là sự kết hợp của dữ liệu chéo và dữ liệu chuỗi thời gian. Nhiều nhà kinh tế học và kinh tế lượng đã công nhận các nghiên cứu sử dụng phần tích dữ liệu bảng có ưu điểm vượt trội so với các nghiên cứu dữ liệu chuỗi thời gian hay các nghiên cứu sử dụng dữ liệu chéo, nhất là các nghiên cứu liên quan đến hồi quy tăng trưởng.
Hồi quy dữ liệu chéo đòi hỏi một giả thiết rất hạn chế liên quan đến mối quan hệ giữa những thay đổi riêng của từng quốc gia (từng tỉnh, thành phố) với các biến giải thích trong mơ hình. Cụ thể, đặt giả thiết các biến độc lập không tương quan với sai số ngẫu nhiên 𝑢 nhưng 𝑢 lại mang những hiệu ứng của các biến bỏ qua (những biến không được đưa vào mơ hình), do đó nó có thể tương quan với tốc độ tăng trưởng kinh tế. Nếu những biến bị bỏ qua này cũng tương quan với các biến ngoại sinh trong mơ hình thì các hệ số ước lượng sẽ bị chệch và khơng đồng nhất. Vì thế, trong trường hợp khơng thể kiểm sốt được tồn bộ các biến bị bỏ qua thì giải phát tốt nhất là sử dụng các kỹ thuật kinh tế lượng dành cho mơ hình hồi quy dữ liệu bảng. Dữ liệu bảng có thể phát hiện và đo lường tốt hơn các tác động mà chúng ta không thể quan sát được trong dữ liệu chuỗi thời gian hay dữ liệu chéo thuần túy. Đồng thời dữ liệu bảng cũng cho chúng ta một bộ dữ liệu chứa nhiều thơng tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậc tự do hơn và hiệu quả cao hơn.
3.5.2.2. Mơ hình các hiệu ứng ngẫu nhiên (REM)
Mơ hình các hiệu ứng ngẫu nhiên (REM) là mơ hình có hệ số độ dốc khơng đổi nhưng tung độ gốc thay đổi giữa các cá nhân và điều kiện ràng buộc trong phần dư là khơng có sự tương quan giữa phần dư và các biến giải thích trong mơ hình.
REM xem phần dư (không tương quan với biến giải thích) là một biến giải thích mới.
𝑌𝑖𝑡 = 𝛽1𝑖 + 𝛽2𝑋1𝑖𝑡 + 𝛽3𝑋2𝑖𝑡 + 𝑢𝑖𝑡 với 𝛽1𝑖 = 𝛽1+ 𝜀𝑖
𝑌𝑖𝑡 = 𝛽1+ 𝛽2𝑋1𝑖𝑡 + 𝛽3𝑋2𝑖𝑡 + 𝜀𝑖+ 𝑢𝑖𝑡 = 𝛽1+ 𝛽2𝑋1𝑖𝑡 + 𝛽3𝑋2𝑖𝑡 + 𝑤𝑖𝑡 Trong đó 𝑤𝑖𝑡 = 𝜀𝑖+ 𝑢𝑖𝑡
Các giả định của REM có thể được khái quát như sau: 𝜀𝑖 ~ 𝑁(0, 𝜎𝜀2)
𝑢𝑖𝑡 ~ 𝑁(0, 𝜎𝑢2)
3.5.3. Vấn đề nội sinh khi nghiên cứu về dân số và tăng trưởng kinh tế 3.5.3.1. Biến nội sinh và biến công cụ
Rất nhiều mơ hình kinh tế liên quan đến vấn đề biến nội sinh (endogeneity). Biến nội sinh là biến có tương quan với phần dư. Ở góc độ kinh tế lượng, biến nội sinh thường xuất hiện ở các trường hợp: bỏ sót biến, và sai dạng mơ hình, hoặc được xác định đồng thời qua các biến giải thích khác.
Để khắc phục hiện tượng nội sinh có thể dùng biến cơng cụ thay thế cho biến nội sinh. Biến công cụ (Instrument Variables) là biến do nhà nghiên cứu dựa trên cơ sở lý thuyết đưa vào mơ hình hồi quy chính để đại diện cho biến nội sinh nhằm khắc phục hiện tượng nội sinh do biến nội sinh gây ra. Để trở thành biến công cụ, biến xem xét phải thỏa mãn hai điều kiện: tương quan với biến nội sinh và không tương quan với phần sai số.
3.5.3.2. Các mối quan hệ nhân quả ngược
Các cơng trình nghiên cứu về mối quan hệ giữa dân số và tăng trưởng kinh tế của Bloom, Canning và Malaney (2000), Bloom và Canning (2001), Koegel (2007),
Hahn và Park (2010) đều lập luận rằng các yếu tố nhân khẩu học có khả năng gặp
phải vấn đề nội sinh trong quá trình phân tích. Tăng trưởng kinh tế dẫn đến giảm khả năng sinh sản (kinh tế phát triển, ý thức của người dân về vấn đề sinh sản và kế
hoạch hóa gia đình được cải thiện làm giảm tỷ lệ sinh), kết quả là làm giảm tỷ lệ phụ thuộc trẻ và tiếp tục thúc đẩy tăng trưởng kinh tế. Đối với các khung thời gian phân tích khác nhau, biểu hiện của mối quan hệ nhân quả ngược cũng có thể khác nhau. Phân tích trong giai đoạn từ 3 đến 9 năm (trung bình 5 – 6 năm), thời gian tương đối ngắn và có khả năng có thể loại trừ hiệu ứng nhân quả ngược giữa tăng trưởng kinh tế và các yếu tố nhân khẩu học. Điển hình như trong nghiên cứu của
Bloom, Canning và Malaney (2000), khơng tìm thấy bằng chứng rõ ràng về cơ chế
nhân quả giữa tăng trưởng kinh tế và cơ cấu tuổi khi phân tích trong từng giai đoạn 5 năm một lần. Nhưng khi phân tích trong một khoảng thời gian tương đối dài 25 năm, kết quả nghiên cứu đã chỉ ra một sự tồn tại trong mối quan hệ nhân quả ngược giữa tăng trưởng và nhân khẩu học. Sử dụng giá trị đầu kỳ (giá trị vào năm cơ sở) của các biến tỷ lệ phụ thuộc (tỷ lệ phụ thuộc già và tỷ lệ phụ thuộc trẻ) để khắc phục vấn đề nội sinh trong mơ hình. Một cách giải quyết khác đối với vấn đề nội sinh là sử dụng giá trị độ trễ của tăng trưởng dân số trong tuổi lao động.
Nghiên cứu của Bloom và Canning (2001) cũng đã đưa ra những lập luận
tương tự về mối quan hệ nhân quả ngược giữa tăng trưởng kinh tế và các yếu tố nhân khẩu học. Theo Bloom và Canning (2001), các yếu tố nhân khẩu học giai đoạn đầu là các yếu tố ngoại sinh, trong khi đó tỷ lệ tăng trưởng dân số được giả định là yếu tố nội sinh và được lượng hóa bằng logarit tự nhiên của tỷ suất sinh năm 1965, tỷ lệ phụ thuộc trẻ năm 1965 và tốc độ tăng trưởng dân số trong độ tuổi lao động so với tổng dân số trong giai đoạn 1960 – 1965. Trong nghiên cứu của Koegel (2007) khi phân tích mối quan hệ giữa tỷ lệ phụ thuộc trẻ, tăng trưởng sản lượng bình quân trên dân số trong tuổi lao động và vấn đề thể chế đến tăng trưởng kinh tế của 55 quốc gia từ năm 1960 đến năm 2000. Biến tỷ lệ phụ thuộc trẻ có khả năng gặp phải vấn đề nội sinh, Koegel đã sử dụng các biến công cụ dựa trên đặc điểm khu vực địa lý của mẫu nghiên cứu: biến phần trăm dân số của một nước sống trong vùng ôn đới và biến phần trăm dân số sống ở vùng nhiệt đới.
và các chính sách kinh tế có thể là ngun nhân của tăng trưởng, nhưng đồng thời, chúng cũng có thể là kết quả do quá trình tăng trưởng mang lại. Điều này dẫn tới sự khó khăn trong q trình phân tích mối quan hệ nhân quả ngược giữa các yếu tố tác động đến tăng trưởng kinh tế. Vấn đề có thể được khắc phục bằng cách sử dụng giá trị đầu kỳ (giá trị vào năm cơ sở) của các biến này hoặc giá trị trước giai đoạn nghiên cứu đưa vào mơ hình hồi quy.
Hai phương pháp phổ biến thường được sử dụng để khắc phục vấn đề nội sinh khi nghiên cứu định lượng mối quan hệ giữa các biến nhân khẩu và tăng trưởng kinh tế là phương pháp bình phương tối thiểu hai giai đoạn (2SLS – 2 Stage Least Square) và phương pháp moment tổng quát (GMM – Generalized Method of Moments). Trong khi Bloom và Canning (2001) và Koegel (2007) sử dụng mơ hình hồi quy bình phương tối thiểu hai giai đoạn (2SLS) để ước lượng, Hahn và Park (2010) sử dụng đồng thời hai phương pháp bình phương nhỏ nhất (OLS) và phương
pháp momen mở rộng (GMM) để giải quyết các vấn đề nội sinh tồn tại khi đo lường tác động của biến nhân khẩu học.
Trong trường hợp này, luận văn sử dụng kết quả ước lượng kết hợp giữa hai phương pháp hồi quy hai giai đoạn (2SLS) và hồi quy dữ liệu bảng theo hiệu ứng ngẫu nhiên (REM) để phân tích tác động của các biến nhân khẩu học và các biến kiểm soát khác đến tăng trưởng kinh tế.
3.5.3.3. Kiểm tra vấn đề nội sinh
Biến công cụ là biến sẽ đại diện cho biến nội sinh tham gia vào mơ hình hồi quy chính. Trong thực tế nghiên cứu, khơng dễ dàng để tìm ra biến cơng cụ phù hợp nhưng có thể dựa vào một số nguồn sau đây để tìm kiếm biến cơng cụ.
- Thứ nhất, dựa vào các bài nghiên cứu trước đây.
- Thứ hai, dựa vào cơ sở lý thuyết có liên quan.
- Thứ ba, sử dụng biến độ trễ của biến nội sinh làm biến công cụ.
Trong các nghiên cứu trước khi nghiên cứu vấn đề nội sinh của dân số và tăng trưởng kinh tế, các tác giả thường sử dụng giá trị đầu kỳ (giá trị vào năm cơ sở) của các biến nhân khẩu học như giá trị đầu kỳ của tỷ lệ phụ thuộc già, giá trị đầu kỳ của tỷ lệ phụ thuộc trẻ và giá trị đầu kỳ của dân số trong độ tuổi lao động để khắc phục vấn đề nội sinh trong mơ hình.
Một cách giải quyết khác đối với vấn đề nội sinh là sử dụng giá trị độ trễ của tăng trưởng dân số trong tuổi lao động (Bloom, Canning và Malaney, 2000 và Bloom và Canning, 2001) hoặc sử dụng biến phần trăm dân số của một nước sống trong vùng ôn đới và biến phần trăm dân số sống ở vùng nhiệt đới (Koegel, 2007). Tương tự, các yếu tố tác động đến tăng trưởng kinh tế cũng thường gặp phải vấn đề nội sinh trong q trình phân tích như vốn con người, tích lũy vốn, y tế, độ mở của nền kinh tế, vấn đề có thể được khắc phục bằng cách sử dụng các biến công cụ là giá trị đầu kỳ (giá trị vào năm cơ sở) của các biến này (Bloom, Canning và Malaney, 2000) đưa vào mơ hình hồi quy.
Luận văn sử dụng các biến công cụ dựa theo các nghiên cứu của Bloom, Canning và Malaney (2000) và Bloom và Canning (2001) kết hợp với sử dụng biến độ trễ của biến nội sinh làm biến công cụ.
Dùng kiểm định Durbin – Wu – Hausman để kiểm tra biến độc lập của mơ hình có phải là biến nội sinh khơng bằng cách hồi quy biến phụ thuộc và các biến độc lập (bao gồm các biến độc lập nghi ngờ bị nội sinh và biến công cụ dự định để thay thế cho biến nội sinh).
Kiểm định Durbin – Wu – Hausman:
Giả thiết H0: Biến không bị nội sinh (ngoại sinh). Giả thiết H1: Biến bị nội sinh
Bảng 3.4 Kiểm định Durbin – Wu – Hausman và kiểm định tính phù hợp của biến cơng cụ ở trường hợp 1
Biến nội
sinh Biến công cụ
Chi bình phương (kiểm định Durbin – Wu – Hausman) Chi bình phương (kiểm định tính phù hợp của BCC) Mơ hình 1 GWAS L1.GPOP POP2005 WAS2005 diffPOPWAS 8,56528*** (0,07293) 41,97* (0,00) HUMAN L1.HUMAN HUMAN2005 6002,81* (0,00) FDI L1.FDI FDI2005 1310,01* (0,00) DOCTOR L1.DOCTOR 1695,01* (0,00) Mơ hình 2 GWAS L1.GYOUTH YOUTH2005 L1.GOLD OLD2005 L1.GWAS WAS2005 11,64803** (0,02017) 117,22* (0,00) HUMAN L1.HUMAN HUMAN2005 5982,94* (0,00) FDI L1.FDI FDI2005 1310,01* (0,00) DOCTOR DOCTOR2005 105,42* (0,00)
Kết quả kiểm định Durbin – Wu – Hausman ở trường hợp 1 (trường hợp độ mở nền kinh tế được tính dựa trên nguồn vốn đầu tư trực tiếp nước ngoài (FDI)) cho thấy giá trị p – value của kiểm định là 0,07293 ở mơ hình 1 và 0,02017 ở mơ hình 2, các giá trị này đều nhỏ hơn mức ý nghĩa 10% (mức ý nghĩa được lấy làm chuẩn khi thực hiện kiểm định Durbin – Wu – Hausman), nên có thể kết luận rằng các biến tăng trưởng dân số trong tuổi lao động (GWAS), biến vốn con người (HUMAN), biến độ mở của nền kinh tế (FDI) và biến Y tế (DOCTOR) là các biến bị nội sinh và các biến công cụ sử dụng trong bài là các biến công cụ phù hợp.
- POP2005: Dân số năm 2005
- diffPOPWAS: chênh lệch giữa tăng trưởng dân số và tăng trưởng dân số trong tuổi lao động
- YOUTH2005: Tỷ lệ phụ thuộc trẻ năm 2005 - L1.GYOUTH: Độ trễ bậc 1 của biến GYOUTH - OLD2005: Tỷ lệ phụ thuộc già năm 2005
- WAS2005: Dân số trong tuổi lao động năm 2005 - L1.GWAS: Độ trễ bậc 1 của biến GWAS
- HUMAN2005: Số năm đi học bình quân của lực lượng lao động năm 2005 - L1.HUMAN: Độ trễ bậc 1 của biến HUMAN
- FDI2005: Tỷ lệ FDI/ Tổng vốn đầu tư năm năm 2005 - L1.FDI: Độ trễ bậc 1 của biến FDI-Invest
- L1.OPEN: Độ trễ bậc 1 của biến OPEN
- EX_IM_2005: Tổng kim ngạch Xuất nhập khẩu năm 2005 - DOCTOR2005: Số bác sỹ/10.000 dân năm 2005
- L1.DOCTOR: Độ trễ bậc 1 của biến DOCTOR L1.Invest: Độ trễ bậc 1 của tổng vốn đầu tư
Bảng 3.5 Kiểm định Durbin – Wu – Hausman và kiểm định tính phù hợp của biến công cụ ở trường hợp 2
Biến nội
sinh Biến cơng cụ
Chi bình phương (kiểm định Durbin – Wu – Hausman) Chi bình phương (kiểm định tính phù hợp của BCC) Mơ hình 1 GWAS POP2005 WAS2005 diffPOPWAS 11,10855** (0,04927) 41,97* (0,00) HUMAN L1.HUMAN HUMAN2005 6002,81* (0,00) OPEN EX_IM_2005 1310,01* (0,00) CAP L1.INEST 1231,11* (0,00) DOCTOR L1.DOCTOR DOCTOR2005 1695,01* (0,00) Mơ hình 2 GWAS L1.GYOUTH YOUTH2005 OLD2005 L1.GWAS WAS2005 13,61292** (0,01826) 117,22* (0,00) HUMAN L1.HUMAN HUMAN2005 5982,94* (0,00) OPEN L1.OPEN EX_IM_2005 1310,01* (0,00) CAP L1.INVEST 1231,11* (0,00) DOCTOR DOCTOR2005 105,42*
Đối với trường hợp 2 (trường hợp độ mở nền kinh tế dựa trên tổng kim ngạch xuất nhập khẩu của nền kinh tế), cho thấy giá trị p – value của kiểm định là 0,04927 ở mơ hình 1 và 0,01826 ở mơ hình 2, các giá trị này đều nhỏ hơn mức ý nghĩa 10% (mức ý nghĩa được lấy làm chuẩn khi thực hiện kiểm định Durbin – Wu – Hausman), nên có thể kết luận rằng các biến tăng trưởng dân số trong độ tuổi lao động (GWAS), biến tích lũy vốn của nền kinh tế (CAP), biến vốn con người (HUMAN), biến độ mở của nền kinh tế (OPEN) và biến Y tế (DOCTOR) là các biến gặp phải vấn đề nội sinh trong mơ hình.
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU
4.1. BIẾN ĐỘNG CƠ CẤU DÂN SỐ VIỆT NAM 4.1.1. Khái quát tình hình dân số Việt Nam
Quy mô dân số
Theo số liệu từ cuộc Điều tra Biến động Dân số và Kế hoạch hóa gia đình ngày 1 tháng 4 năm 2013, tổng dân số Việt Nam là 89,5 triệu người, xếp hạng dân số Việt Nam đứng thứ 13 trên thế giới, đứng thứ 8 trong khu vực Châu Á và thứ 3 ở Đông Nam Á (sau Indonesia và Philippines). Trong đó, dân số thành thị là 28,9 triệu người, chiếm 32,3%; dân số nông thôn là 60,6 triệu người, chiếm 67,7%. Với 20,4 triệu người, Đồng bằng sông Hồng là vùng có quy mơ dân số lớn nhất, chiếm 22,8%, tiếp đến là Bắc Trung Bộ và Duyên hải miền Trung (19,3 triệu người) chiếm 21,5%, Tây Nguyên là vùng có số dân ít nhất (5,5 triệu người) chỉ chiếm 6,1% dân số cả nước.
Bảng 4.1 Quy mô dân số và tỷ lệ tăng dân số bình quân hàng năm, 1979 - 2013 Năm Dân số (triệu người) Tỷ lệ tăng dân số bình quân
năm (%) 1979 52,742 - 1989 64,376 2,21 1999 76,323 1,85 2009 85,79 1,24 2013 89,5 1,08 Nguồn: Tổng Cục Thống kê, 2013
Số liệu từ bảng 4.1 cho thấy, từ năm 1999 đến năm 2013, dân số nước ta tăng thêm 13,177 triệu người, bình quân mỗi năm tăng 941 nghìn người. Tỷ lệ tăng dân số bình quân hằng năm trong giai đoạn giữa hai cuộc Tổng điều tra dân số năm 1979 và 1989 là 2,21%/năm, giai đoạn 1989 – 1999 là 1,85%/năm và giai đoạn 1999 – 2009 là 1,24%/năm. Trong khi đó, mức tăng dân số bình quân hàng năm kể
từ năm 2009 đến nay giảm xuống ở mức xấp xỉ 1%/năm, đây là thời kỳ có tỷ lệ tăng dân số thấp nhất trong vòng hơn 30 năm trở lại đây.
Phân bố dân số
Với mật độ dân số 270 người/km2 vào năm 2013, Việt Nam là một trong những nước có mật độ dân số cao trong khu vực cũng như trên thế giới. Mật độ dân số Việt Nam đứng thứ 40 trên thế giới, đứng thứ 16 ở Châu Á và đứng thứ 3 khu vực Đông Nam Á, chỉ sau Singapore (7.971 người/km2) và Philippines (321 người/km2). Theo tính tốn của Liên hợp quốc, để cuộc sống thuận lợi, bình quân trên 1 km2 chỉ nên có từ 35 đến 40 người sinh sống. Như vậy, ở Việt Nam mật độ dân số gấp hơn 6 lần so với mật độ chuẩn.
Bảng 4.2 Phân bố diện tích, dân số và mật độ dân số chia theo vùng kinh tế - xã hội năm 2013
Vùng kinh tế - xã hội Diện tích (%)
Dân số (%) Mật độ dân số