Biến Số quan sát Trung bình Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất lnpc 150 0.41 0.87 -1.31 2.08 lngovshare 150 2.77 0.22 2.15 3.30 lngdpc 150 7.71 0.79 5.96 9.22 lni 150 3.11 0.40 1.96 3.92 lnto 150 4.47 0.53 2.94 5.40 lnpop 150 0.42 0.53 -1.95 1.08
Nguồn: Kết quả tổng hợp từ Phần mềm Stata (Phụ lục 1)
Biến lnpc dao động từ khoảng giá trị -1.31 tới giá trị 2.08 với giá trị trung bình của cỡ mẫu 0.41, ứng với độ lệch chuẩn của mẫu là 0.87. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn lớn hơn so với giá trị trung bình.
Biến lngovshare dao động từ khoảng giá trị 2.15 tới giá trị 3.3 với giá trị trung bình của cỡ mẫu 2.77, ứng với độ lệch chuẩn của mẫu là 0.22. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn khơng lớn hơn so với giá trị trung bình.
Biến lngdpc dao động từ khoảng giá trị 5.96 tới giá trị 9.22 với giá trị trung bình của cỡ mẫu 7.71, ứng với độ lệch chuẩn của mẫu là 0.79. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn không lớn hơn so với giá trị trung bình.
Biến lni dao động từ khoảng giá trị 1.96 tới giá trị 3.92 với giá trị trung bình của cỡ mẫu 3.11, ứng với độ lệch chuẩn của mẫu là 0.4. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn khơng lớn hơn so với giá trị trung bình.
Biến lnto dao động từ khoảng giá trị 2.94 tới giá trị 5.4 với giá trị trung bình của cỡ mẫu 4.47, ứng với độ lệch chuẩn của mẫu là 0.53. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn khơng lớn hơn so với giá trị trung bình.
Biến lnpop dao động từ khoảng giá trị -1.95 tới giá trị 1.08 với giá trị trung bình của cỡ mẫu 0.42, ứng với độ lệch chuẩn của mẫu là 0.53. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn không lớn hơn quá nhiều so với giá trị trung bình.
Qua phần thống kê mơ tả chung cho các biến trong mơ hình theo bảng 3.2, đa phần các giá trị độ lệch chuẩn của mẫu nghiên cứu đều nhỏ hơn so với giá trị trung bình hoặc có lớn hơn nhưng chênh lệch khơng đáng kể. Chỉ có hai biến lnpc và lnpop biểu hiện lần lượt cho lượng khí thải CO2 và tốc độ tăng dân số của mỗi quốc gia là có sự chênh lệch. Tuy nhiên nhìn chung trong tổng thể thì dữ liệu tương đối đồng đều giữa các biến với nhau. Với cỡ mẫu nghiên cứu gồm 150 quan sát, là cỡ mẫu chấp nhận được để thực hiện hồi quy trong thống kêtheo Greene (1991). Dữ liệu thu thập nghiên cứu hồn tồn phù hợp để có thể thực hiện các ước lượng của mơ hình.
3.3. Phương pháp nghiên cứu 3.3.1. Phương pháp hồi quy 3.3.1. Phương pháp hồi quy
Các nghiên cứu thực nghiệm trước đây thường sử dụng phương pháp hồi quy bình phương nhỏ nhất (OLS) với dữ liệu gộp của các quốc gia.Phương pháp OLS sử dụng dữ liệu chéo gộp các quốc gia có thể giải quyết tất cả các dữ liệu như thể chỉ có một điểm thời gian duy nhất. Mơ hình được đưa ra:
Yi,t= α+ βXi,t + i,t (3.4)
Mơ hình theo phương trình (3.4) khơng quan tâm đến bất kỳ sự khác biệt tồn tại giữa các quốc gia hay những tác động theo thời gian. Bởi vì, các yếu tố ảnh hưởng có thể còn là do yếu tố nội tại của quốc gia, doanh nghiệp đang xét như văn hóa, nhân viên,… việc xử lý dữ liệu của các quốc gia, doanh nghiệp như nhau, khơng có sự khác biệt sẽ gây ra sự sai lệch, do giả định bỏ qua sự không đồng nhất giữa các quốc gia.
Hầu hết, các nghiên cứu thực nghiệm gần đây khi nghiên cứu về các quốc gia thường sử dụng phương pháp dữ liệu bảng để kiểm soát và loại bỏ những đặc điểm tác động khác biệt của các quốc gia, không quan sát được.
Theo Baltagi (2008), thực hiện nghiên cứu dữ liệu bảng đạt được 6 ưu điểm sau: dữ liệu bảng liên hệ đến các quốc gia theo thời gian nên chắc chắn có tính khơng đồng nhất trong các quốc gia này, các kỹ thuật ước lượng dựa trên dữ liệu bảng có thể tính đến tính khơng đồng nhất đó một cách rõ ràng bằng cách bao gồm
biến chuyên biệt theo quốc gia; kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng cho chúng ta dữ liệu chứa nhiều thơng tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậc tự do hơn và hiệu quả cao hơn; nghiên cứu quan sát lặp đi lặp lại của các đơn vị chéo, dữ liệu bảng phù hợp hơn cho việc nghiên cứu động thái thay đổi theo thời gian của các đơn vị chéo này; có thể phát hiện và đo lường tốt hơn các tác động mà người ta không thể quan sát được trong dữ liệu chuỗi thời gian hay dữ liệu chéo thuần túy; có thể nghiên cứu các mơ hình hành vi phức tạp hơn; cung cấp dữ liệu đối với vài nghìn đơn vị, dữ liệu bảng có thể giảm đến mức thấp nhất hiện tượng chệch có thể xảy ra nếu chúng ta gộp các quốc gia.
Thay thế cho mơ hình theo phương trình (3.4) là mơ hình có hệ số chặn α khác nhau giữa các quốc gia:
Yi,t= αi + βXi,t + i,t (3.5)
Các đặc điểm khác biệt không quan sát được được biểu hiện bởi các hằng số αi khác nhau giữa các quốc gia.
Mơ hình dữ liệu bảng trong phương trình (3.5) xem xét đặc điểm riêng của các quốc gia và kỹ thuật ước lượng tập trung sử dụng các thông tin có sẵn về sự khác biệt trong biến thiên có thể quan sát được thông qua phương pháp biến giả. Cần nghiên cứu xác định sự khác biệt tự nhiên và chỉ rõ mơ hình dựa trên các kiểm định thống kê lựa chọn giữa mơ hình OLS (pooled regression) và mơ hình đặc trưng dữ liệu bảng (mơ hình yếu tố cố định - fixed effect regression), mơ hình yếu tố ngẫu nhiên - random effect regression).Sau đó, lựa chọn mơ hình thực sự phù hợp với đặc điểm dữ liệu mẫu nghiên cứu.
Giả sử rằng có một dữ liệu bảng chứa thông tin liên quan đến khoảng thời gian t (t=1,2,…,T) và một số lượng i như là các quốc gia…(i=1,2,…,n), mơ hình có K biến. Hãy xem xét một mơ hình có hệ số chặn thay đổi theo các quốc gia nhưng nó khơng đổi theo thời gian và độ dốc là không đổi đối với các quốc gia và theo thời gian:
Để ước lượng mơ hình này, có thể đặt giả định về hệ số chặn : αi = τ + vi (3.7)
Điều này có nghĩa rằng có một phần hệ số chặn theo thời gian không đổi cho tất cả các quốc gia (τ) và một phần hệ số chặn sẽ thay đổi cho mỗi quốc gia (vi). Dựa vào phương trình (3.7), có hai loại mơ hình được thảo luận: mơ hình tác động cố định và mơ hình tác động ngẫu nhiên. Trong mơ hình tác động cố định, vi là một tham số cố định,Xkit và vi tương quan. Trong khi đó, trong một mơ hình tác động ngẫu nhiên, vi là một biến ngẫu nhiên,Xkit và vi là không tương quan. Mơ hình tác động cố định có thể được ước tính bởi mơ hình hồi quy bình phương nhỏ nhất biến giả (LSDV), trong đó các tác động trong mơ hình và giữa các mơ hình có hiệu lực.Mơ hình tác động ngẫu nhiên được ước tính bằng phương pháp bình phương nhỏ nhất tổng quát (GLS) và phương pháp bình phương nhỏ nhất tổng quát khả thi (FGLS).Khi cấu trúc dữ liệu tồn tại phương sai thay đổi, phương pháp GLS được sử dụng Greence (2000).Nếu chưa biết, FGLS được sử dụng.
Trong ước lượng phương trình (3.1) và (3.2) cần phải xem xét các đặc điểm khác biệt không quan sát được giữa các nước. Phương pháp chuẩn là sử dụng mơ hình tác động cố định FEM và tác động ngẫu nhiên REM, lựa chọn tùy thuộc vào giả thuyết mối tương quan có thể có giữa các thành phần sai số đặc trưng và các biến giải thích.Khi tồn tại mối tương quan này, ước lượng tác động ngẫu nhiên không phù hợp và hiệu quả mà tác động cố định sẽ thích hợp hơn (Halkos và Paizanos, 2012).
Ví dụ, trong phương trình (3.1), các đặc tính quốc gia riêng biệt có thể bao gồm sự khác biệt về khí hậu, địa lý và nguồn nhiên liệu hóa thạch, tất cả yếu tố này có khả năng tương quan với lượng khí thải CO2 (Leitao, 2010). Ngoài ra, cịn có khả năng các đặc tính quốc gia khơng quan sát được có tương quan với thu nhập bình quân đầu người và các biến giải thích khác, do đó tác động cố định sẽ phù hợp hơn.
Để kiểm soát vấn đề nội sinh giữa các nhân tố biến độc lập và biến phụ thuộc-tác động ngược-thường tồn tại trong các học thuyết kinh tế, tác giả sử dụng
phương pháp GMM, đề xuất trên dữ liệu bảng Arellano và Bond (1991) với kiểm soát hồi quy hai bước.Ngồi ra, trong trường hợp mơ hình có tính chất động (biến trễ phụ thuộc đóng vai trị là biến giải thích trong phương trình hồi quy) cũng như tồn tại biến nội sinh trong mơ hình thi GMM vẫn là phương pháp ước lượng phù hợp. Tuy nhiên, hạn chế lớn nhất cũa GMM là không đề cập đến tác động dài hạn được thể hiện trong các mối quan hệ đồng liên kết. Để khắc phục vấn đề tồn tại trên, Pesaran và Smith (1995), Pesaran (1997), Pesaran và cộng sự (1999) đã đề xuất phương pháp PMG ( Pooled Mean Group).
Các ước lượng dữ liệu bảng như FE, RE, GMM đòi hỏi tham số đồng nhất giữa các đơn vị bảng. Ngồi ra, do khơng xét đến tính đồng liên kết nên kết quả ước lượng của các hệ số hồi quy ở những phương pháp trên có thể bị chệch và không nhất quán trong dài hạn.Vấn đề này sẽ trở nên trầm trọng khi T lớn.Theo Pesaran và Smith (1995), phương pháp ước lượng PMG cho kết quả ước lượng các tham số có giá trị trung bình nhất qn.Pirotte (1999) cịn cho rằng phương pháp PMG sẽ cho kết quả ước lượng trong dài hạn hiệu quả với cở mẫu lớn.Nó cho phép các tham số độc lập trong tồn bộ nhóm và khơng xét đến tính đồng nhất có thể có giữa các nhóm.
Vì vậy PMG sẽ thích hợp để ước lượng hệ số hồi qui dài hạn, đồng thời kiểm soát sự tồn tại tương quan chéo (cross-section dependence) trong dữ liệu bảng. Martinez-Zarzoso và Bengochea-Morancho (2004) đã áp dụng ước lượng PMG để kiểm tra sự tồn tại của đường cong EKC cho biến khí thải CO2 với nhóm các nước OECD và chỉ ra sự tồn tại của một EKC bậc 3 dạng chữ N cho đa số các nước trong mẫu.
3.3.2. Các kiểm định mơ hình
3.3.2.1. Hiện tượng đa cộng tuyến
Hiện tượng đa cộng tuyến là hiện tượng tương quan giữa các biến độc lập (các biến giải thích) với nhau. Hiện tượng đa cộng tuyến có thể phân ra hai loại: đa cộng tuyến hoàn hảo và đa cộng tuyến khơng hồn hảo.
Trong q trình hồi quy, kết quả hồi quy có hệ số xác định R2 cao nhưng tỷ số t thấp, tương quan cặp giữa các biến giải thích cao, xét tương quan riêng, hồi quy phụ thấy có tồn tại hiện tượng tương quan giữa các biến độc lập thì mơ hình đã vi phạm giả thiết hồi quy - hiện tượng đa cộng tuyến.
Hiện tượng đa cộng tuyến sẽ dẫn đến một số hậu quả như: phương sai và hiệp phương sai của các ước lượng OLS lớn, khoảng tin cậy rộng lớn, tỷ số t mất ý nghĩa, hệ số xác định cao nhưng tỷ số t mất ý nghĩa, các ước lượng OLS và sai số chuẩn trở nên rất nhạy với những thay đổi trong số liệu, dấu của các ước lượng của các hệ số hồi quy có thể sai lệch, thêm vào hay bớt đi các biến cộng tuyến với các biến khác thì hệ số của các biến cịn lại có thể thay đổi rất lớn và thay đổi cả dấu của chúng.
Tác giả sử dụng hệ số tương quan giữa các biến độc lập và nhân tử phóng đại phương sai để kiểm định đa cộng tuyến. Theo Baltagi (2008), hệ số tương quan lớn hơn 0.8, nhân tử phóng đại phương sai lớn hơn 10 thì tồn tại đa cộng tuyến nghiêm trọng.
3.3.2.2. Hiện tượng phương sai thay đổi
Hiện tượng phương sai thay đổi là hiện tượng các yếu tố nhiễu ui xuất hiện trong hàm hồi quy có phương sai thay đổi (homoscedasticity, cịn gọi là phương sai có điều kiện thay đổi), tức là các yếu tố nhiễu ui không đồng nhất phương sai.
Trong quá trình hồi quy, tác giả sẽ tập trung xem xét lại bản chất của vấn đề nghiên cứu, đồ thị phần dư và dùng một số kiểm định Goldfeld-Quandt, Breusch- Pagan, White, Park trên OLS và phương pháp Greene (2000) trên dữ liệu bảng để kiểm tra xem mơ hình có vi phạm giả thiết hồi quy - hiện tượng phương sai thay đổi hay không.
Hiện tượng phương sai thay đổi sẽ dẫn đến một số hậu quả như: các ước lượng OLS vẫn là không chệch nhưng khơng cịn hiệu quả nữa, ước lượng của các phương sai sẽ bị chệch, như vậy sẽ làm mất hiệu lực của kiểm định hệ số hồi quy.
3.3.2.3. Hiện tượng tự tương quan
Tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi quan sát được sắp xếp theo thứ tự thời gian hoặc không gian.
Để kiểm tra xem mơ hình đã vi phạm giả thiết hồi quy - hiện tượng tự tương quan. Trong quá trình hồi quy, tác giả sẽ dùng phương pháp đồ thị và kiểm định d (Durbin-Watson) để phát hiện tượng tự tương quan trong mơ hình hồi quy OLS (pooled regression).Ở khía cạnh kiểm tra phương sai thay đổi dữ liệu bảng, tác giả sử dụng kiểm định được đề xuất bởi Wooldrige (2002) và Drukker (2003).
Hiện tượng tự tương quan sẽ dẫn đến một số hậu quả như: uớc lượng OLS vẫn là ước lượng tuyến tính khơng chệch nhưng khơng là ước lượng hiệu quả nữa; phương sai các ước lượng OLS là bị chệch, đôi khi quá thấp so với phương sai thực và sai số tiêu chuẩn, dẫn đến phóng đại tỷ số t; các kiểm định t và F khơng đáng tin cậy; cơng thức thơng thường để tính phương sai của sai số là ước lượng chệch của phương sai thực và trong một số trường hợp dường như ước lượng thấp của phương sai thực; có thể hệ số xác định không đáng tin cậy và dường như là nhận giá trị ước lượng cao; các phương sai và số tiêu chuẩn của dự đốn khơng có hiệu quả.
3.3.2.4. Hiện tượng nội sinh
Hiện tượng nội sinh xảy ra khi giả thiết về sự không tương quan giữa biến độc lập và sai số bị vi phạm. Biến độc lập trong mơ hình vừa đóng vai trị là biến ngoại sinh (do tác động đến Y) vừa là biến nội sinh (do bị sai số tác động).
Mơ hình có biến độc lập là biến nội sinh gọi là mơ hình bị hiện tượng nội sinh. Hiện tượng nội sinh làm cho các ước lượng thu được bằng phương pháp hồi quy tuyến tính cổ điển (OLS) khơng cịn là ước lượng vững.
Để giải quyết hiện tượng nội sinh, chúng ta có thể dùng biến cơng cụ để khắc phục thông qua 2 phương pháp được sử dụng phổ biến hiện nay là phương pháp hồi quy hai giai đoạn 2-SLS và phương pháp moment tổng quát GMM. Trong thực tế nghiên cứu, có thể dựa vào một số nguồn sau đây để tìm kiếm biến cơng cụ: -Dựa vào các bài nghiên cứu trước đây
-Sử dụng biến độ trễ của biến nội sinh làm biến cơng cụ -Sử dụng chính biến nội sinh làm biến công cụ
Để phát hiện vi phạm giả thiết - hiện tượng nội sinh hồi quy trong mơ hình GMM, tác giả sẽ sử dùng phương pháp kiểm định Hansen, Sargan để kiểm tra sự phù hợp của việc thay thế biến nội sinh bởi biến công cụ. Với giả thuyết H0: Số biến công cụ phù hợp. Giá trị kiểm định P-value càng lớn càng tốt.
CHƯƠNG 4. KẾT QUẢ NGHIÊN CỨU
Chương 3 đã trình bày phương pháp nghiên cứu được sử dung để xây dựng, đánh giá các khái niệm nghiên cứu và kiểm nghiệm mơ hình lý thuyết. Chương 3 cũng đưa ra cách đo lường các biến trong mơ hình. Chương 4 sẽ trình bày kết quả nghiên cứu thu được từ quá trình phân tích số liệu của 5 quốc gia ASEAN, trong thời gian từ năm 1984-2013.
4.1. Kiểm định sự tương quan và đa cộng tuyến
4.1.1. Ma trận tương quan đơn tuyến tính giữa các cặp biến
Hệ số tương quan dùng để chỉ mối quan hệ giữa các biến trong mơ hình. Dựa vào kết quả ma trận tương quan, tác giả sẽ phân tích mối tương quan giữa các biến