Phương pháp hồi quy

Một phần của tài liệu Mối quan hệ nhân quả giữa sản lượng điện tiêu thụ và tăng trưởng kinh tế ở các nước asean (Trang 36)

CHƯƠNG 3 : DỮ LIỆU VÀ PHƯƠNG PHÁP NGH IÊN CỨ U

3.2. Khung phân tích kinh tế lượng

3.2.2. Phương pháp hồi quy

Phương pháp ước lượng bình phương bé nhất (OLS) là phương pháp được dùng rất phổ biến trong lĩnh vực kinh tế lượng. Ưu điểm của phương pháp này không quá phức tạp nhưng hiệu quả. Với một số giả thiết ban đầu, phương pháp này sẽ dễ dàng xác định các giá trị ước lượng hiệu quả, không chệch và vững.

Tuy nhiên, khi nghiên cứu về chuỗi dữ liệu thời gian, có nhiều chuỗi vi phạm một hoặc một số giả định của OLS. Khi đó, các ước lượng thu được sẽ bị bóp méo, mất tính vững và sẽ là sai lầm nếu sử dụng chúng để phân tích. Một trong những dạng vi phạm giả định phổ biến là hiện tượng nội sinh, một trường hợp khi hệ số ước lượng (hoặc biến) tương quan với phần dư.

Mơ hình hồi quy phổ biến trên dữ liệu bảng là hiệu ứng tác động cố định (Fixed effect – FEM), hồi quy dữ liệu bảng hiệu ứng tác động ngẫu nhiên (Random effect – REM). Tuy nhiên FEM và REM khơng kiểm sốt được hiện tượng phương sai thay đổi, tự tương quan, cũng như các vấn đề liên quan đến tính chất động của mơ hình dữ liệu bảng, dẫn tới việc sử dụng mơ hình FGLS (Feasible Generalized Least Squares). Phương pháp FGLS theo Beck and Katz (1995) là ước lượng không chệch phù hợp trên cỡ mẫu với T > N, trường hợp cỡ mẫu bài nghiên cứu. Theo Damodar N. Gujarati, phép biến đổi các biến gốc để các biến đã biến đổi thỏa mãn các giả thiết của mơ hình cổ điển và sau đó áp dụng phương pháp OLS đối với chúng được gọi là phương pháp bình phương tối thiểu tổng quát. Nói ngắn gọn, GLS là OLS đối với các biến đã biến đổi để thỏa mãn các giả thiết bình phương tối thiểu tiêu chuẩn. Các ước lượng tính được như vậy được gọi là các ước lượng GLS. Sử dụng GLS có thể kiểm sốt được các hiện tượng phương sai thay đổi và tự tương quan ( Damodar N. Gujarati- Basic Econometrics).

Việc nghi ngờ các biến có tác động ngược đến kết quả nghiên cứu gây ra hiện tượng nội sinh. Theo kết quả nghiên cứu của Arellano và Bond, phương pháp hồi quy tuyến tính dữ liệu bảng động là một giải pháp hữu hiệu để ước lượng hồi quy trong mơ hình trong trường hợp mơ hình vừa có hiện tượng phương sai thay đổi, tự tương quan và nội sinh. Phù hợp với điểm mạnh của phương pháp GMM như:

Dữ liệu bảng có T nhỏ, N lớn (rất nhiều quan sát với ít mốc thời gian)

Tồn tại mối quan hệ tuyến tính giữa biến phụ thuộc với các biến giải

thích Mơ hình động với một hoặc hai vế của phương trình có chứa biến

trễ

Các biến độc lập không phải là một biến ngoại sinh ngặt (strictly exogenous), nghĩa là chúng có thể tương quan với các phần dư (hiện tại hoặc trước đó) hoặc tồn tại biến nội sinh (endogenous variables) trong mơ hình.

Tồn tại vấn đề phương sai thay đổi hoặc tự tương quan ở các sai số đo lường (idiosyncratic disturbances)

Tồn tại các tác động cố định riêng rẽ (fixed individual effects)

Tồn tại phương sai thay đổi và tự tương quan trong mỗi đối tượng (nhưng khơng tồn tại giữa các đối tượng)

Chính vì vậy, GMM là phương pháp hiệu quả hơn cả nhưng cũng khá phức tạp.

GMM được Lars Peter Hansen - giáo sư kinh tế ĐH Chicago – người vừa đoạt giải Nobel kinh tế năm 2013, trình bày lần đầu tiên vào năm 1982 trong bài viết “Large Sample Properties of Generalized Methods of Moments Estimators” (Econometrica, Vol. 50, page 1029-1054)

Phương pháp GMM là 1 phương pháp thống kê cho phép kết hợp các dữ liệu kinh tế quan sát được trong các điều kiện moment tổng thể (population moment conditions) để ước lượng các tham số chưa biết của các mơ hình kinh tế.

Tính chất của phương pháp ước lượng GMM.

Khi số lượng mẫu phù hợp giá trị của các hệ số ước lượng được sẽ vững, khi đó giá trị ước lượng được sẽ càng gần với giá trị thực của nó. Ước lượng GMM sẽ cho ra các giá trị ước lượng tuân theo phân phối chuẩn, đây là thuộc tính rất quan trọng vì đó là cơ sở để chúng ta xây dựng giá trị dự đoán ở các độ tin cậy (confidence bands) và thực hiện các kiểm định khác. Phương pháp GMM cũng cho ra kết quả là các giá trị ước lượng hiệu quả, nghĩa là giá trị phương sai trong mơ hình ước lượng là nhỏ nhất.

3.2.3.Kiểm tra mối quan hệ nhân quả giữa các biến.

Bảng dữ liệu trên mơ hình vector hiệu chỉnh sai số (VECM) theo hai bước của Engle và Granger (1987) được sử dụng để nghiên cứu mối quan hệ động trong ngắn hạn và dài hạn.

30

i. Bước đầu sử dụng mơ hình DOLS (panel dynamic ordinary least square) ước tính các tham số trong phương trình để có được các phần dư (ECT) tương ứng với độ trễ của từng biến ứng với trạng thái cân bằng trong dài hạn.

ii. Bước hai sử dụng mơ hình GMM trên dữ liệu bảng với cách tiếp cận của Arellano và Bond để ước lượng hệ số và sử dụng kiểm định Wald nhằm xác định mức ý nghĩa của các quan hệ Granger.

31

CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU.

4.1.Phân tích thống kê mơ tả.

Sau khi thu thập và tính tốn dữ liệu, kết quả trình bày theo bảng thống kê mơ tả trong bảng 4.1 dưới đây. Kết quả chỉ ra phạm vi, giá trị trung bình và độ lệch chuẩn của các biến sử dụng trong nghiên cứu này.

Bảng 4.1: Thống kê mô tả giữa các biến trong mơ hình.

Variable Obs Mean Std. Dev. Min Max gdp_percap~a 120 6768.519 10396.4 409.8265 38087.89 electric_c~n 120 2403.839 2647.909 159.3016 8520.017 internet_u~s 120 22.03259 23.09255 0.000135 73 labor_force 120 3.91E+07 3.35E+07 1761987 1.20E+08 Cpi 120 5.048973 6.262138 -1.71034 58.38709

(Nguồn: kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập với cỡ mẫu gồm 120 quan sát của 6 quốc gia trong giai đoạn 1995 – 2014)(Phụ lục 1.I).

Kết quả phân tích thống kê mơ tả giữa các biến trong mơ hình theo bảng 4.1 cho thấy, các biến có độ lệch chuẩn không quá lớn so với trung bình. Dữ liệu biến động tương đối khơng quá lớn ở các biến.

Cỡ mẫu nghiên cứu gồm 120 quan sát là cỡ mẫu lớn trong thống kê. Dữ liệu bài nghiên cứu phù hợp thực hiện hồi quy.

4.2. Kiểm định tương quan chéo (Cross-section independence) và kiểm định tính dừng dữ liệu bảng.

4.2.1.Kiểm định tương quan không gian (Cross-section dependence).

Kiểm định tương quan chéo cho phép kiểm tra tương quan không gian trong dữ liệu bảng. Kết quả kiểm định cho thấy dữ liệu chịu tác động của tương quan chéo, nên bài nghiên cứu sử dụng phương pháp hiệu chỉnh trung bình của Levin–Lin–Chu (2002) nhằm loại bỏ tác động tương quan chéo trong kiểm định tính dừng.

Bảng 4.2: Kiểm định tương quan chéo (cross-section independence).

Kiểm định LM - Breusch and Pagan (1980) Giá trị thông kê

p-value

*two-sided test 39.701 0.0005

Nguồn:Kết quả tổng hợp từ Phần mềm Stata trên số liệu thu thập với cỡ mẫu gồm 120 quan sát của 6 quốc gia trong giai đoạn 1995 – 2014 (Phụ lục 1.II)

4.2.2.Kiểm định tính dừng dữ liệu bảng Levin–Lin–Chu (2002).

Dữ liệu mẫu với số năm quan sát không quá lớn, không vượt quá 25 năm để trở thành bảng dữ liệu lớn (theo Baltagi, 2008) vấn đề tính dừng trên chuỗi dữ liệu bảng không quá nghiêm trọng. Để chắc chắn các biến có cùng bậc 1 để lựa chọn các biến trong kiểm định đồng liên kết trong dữ liệu bảng, bài nghiên cứu sử dụng kiểm định tính dừng Levin–Lin–Chu (2002).Với cỡ mẫu T lớn hơn N phù hợp với kiểm định Levin–Lin–Chu (2002).

Bảng 4.3: Kiểm định tính dừng Levin–Lin–Chu (2002).

Biến Bậc 0 Sai phân bậc 1

GDP 1.7e+14 -7.4661***

EC 1.3e+15 -6.7217***

NET 2.7e+15 -26.6236***

L 2.7e+14 -5.7788***

CPI 2.6e+15 -12.5644***

Ghi chú: ***, **, * tương ứng với mức ý nghĩa 1%, 5%, 10%

Nguồn: Kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập với cỡ mẫu gồm 120 quan sát của 6 quốc gia trong giai đoạn 1995 – 2014 (Phụ lục 1.III)

Kiểm định Levin, Lin và Chu (2002) với giả định H0 là chuỗi không dừng ở chuỗi gốc. Kết quả từ bảng 4.3 cho thấy các giá trị p-value của các biến ở chuỗi gốc > 0.05% nên chấp nhận giả thuyết H0 tức các biến đều không dừng ở chuỗi gốc.

Nghiên cứu tiếp tục tiến hành kiểm định tính dừng của các biến ở sai phân bậc I. Kết quả từ bảng cho thấy tất cả các biến đều có giá trị p-value <0.05 nên bác bỏ giả thuyết H0 ( được ký hiệu là *** trên bảng 4.3)

Kết luận: Kiểm định tính dừng Levin–Lin–Chu (2002) cho thấy tất cả các biến không dừng tại không nhưng cùng dừng ở bậc 1 với mức ý nghĩa 1%. Bậc dữ liệu được định nghĩa tại sai phân bậc 1. Do đó, nghiên cứu hồn tồn có cơ sở để tiến hành bước tiếp theo là kiểm định đồng liên kết giữa các biến với dữ liệu bảng.

4.3.Kiểm định sự tương quan và đa cộng tuyến.

4.3.1.Ma trận tương quan đơn tuyến tính giữa các cặp biến.

Dựa vào kết quả ma trận tương quan để phân tích mối tương quan giữa các biến phụ thuộc với các biến độc lập trong mơ hình và mối tương quan giữa các biến độc lập với nhau. Hệ số tương quan dùng để chỉ mối quan hệ giữa các biến trong mơ hình. Hệ số tương quan biến động từ -1 đến 1, tương ứng mức biến động ngược chiều và cùng chiều.

Bảng 4.4: Kết quả ma trận tương quan.

gdp_pe~a electr~n intern~s labor_~e cpi gdp_percap~a 1

electric_c~n 0.952 1

internet_u~s 0.5634 0.6706 1

labor_force -0.8871 -0.855 -0.3744 1

Cpi -0.3495 -0.385 -0.2353 0.3962 1

Nguồn: kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập với cỡ mẫu gồm 120 quan sát của 6 quốc gia trong giai đoạn 1995 – 2014 (Phụ lục 1.IV)

Kết quả phân tích ma trận tương quan giữa các biến trong mơ hình theo bảng 4.4 cho thấy, tất cả các hệ số tự tương quan cặp giữa các biến độc lập nhỏ hơn 0.8, không tồn tại hiện tượng đa cộng tuyến nghiêm trọng giữa các cặp biến độc lập trong mơ hình, theo Baltagi (2008).

Kết luận: Khơng tồn tại hiện tượng đa cộng tuyến nghiêm trọng với tiêu chuẩn

4.3.2.Kiểm định đa cộng tuyến.

Bảng 4.5: Kết quả kiểm tra đa cộng tuyến với nhân tử phóng đại phương sai

Variable VIF 1/VIF

electric_c~n 7.93 0.12606 labor_force 5.18 0.19309 internet_u~s 2.48 0.40249 cpi 1.20 0.83327 9 Mean VIF 4.20

Nguồn: kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập với cỡ mẫu gồm 120 quan sát của 6 quốc gia trong giai đoạn 1995 – 2014 (Phụ lục 1.V)

Dựa vào bảng 4.5 kết quả kiểm tra đa cộng tuyến với nhân tử phóng đại phương sai, trung bình VIF của các biến trong mơ hình là 4.2 nhỏ hơn 10. Khơng có VIF của biến độc lập nào vượt quá 10.

Kết luận: Với tiêu chuẩn nhân tử phóng đại phương sai VIF, mơ hình khơng tồn

tại hiện tượng đa cộng tuyến nghiêm trọng trong mơ hình.

4.4. Kiểm định hiện tượng phương sai sai số thay đổi - Greene (2000).

Bài nghiên cứu kiểm định phương sai sai số thay đổi bằng phương pháp kiểm định Greene (2000) với giả thuyết như sau:

Giả thuyết Ho: Mơ hình khơng có hiện tượng phương sai thay đổi Giả thuyết H1: Mơ hình có hiện tượng phương sai thay đổi

Bảng 4.6: Kết quả kiểm tra phương sai thay đổi mơ hình.

Khi bình Phương (χ2) p-value

29.58 0.000

Nguồn: kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập với cỡ mẫu gồm 120 quan sát của 6 quốc gia trong giai đoạn 1995 – 2014 (Phụ lục 1.VI)

Từ bảng 4.6, kiểm định Greene (2000) bằng phần mềm Stata cho thấy kết quả với p-value đều bằng 0.0000 < α = 0.05. Suy ra, bác bỏ giả thuyết Ho ở mức ý nghĩa 5% cho thấy tồn tại hiện tượng phương sai thay đổi trong mơ hình.

Kết luận: Dữ liệu tồn tại hiện tượng phương sai thay đổi trong mơ hình ở mức ý

nghĩa 5%.

4.5. Kiểm định hiện tượng tự tương quan phần dư – Wooldridge (2002) và Drukker (2003).

Để kiểm tra hiện tượng tự tương quan, bài nghiên cứu sử dụng phương pháp Wooldridge (2002) và Drukker (2003) và đặt giả thuyết kiểm định như sau:

Giả thuyết Ho: Mơ hình khơng có hiện tượng tự tương quan Giả thuyết H1: Mơ hình có hiện tượng tự tương quan

Bảng 4.7: Kết quả kiểm tra tự tương quan mơ hình.

Khi bình phương

(χ2) p-value

28.759 0.0030

Nguồn: kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập với cỡ mẫu gồm 120 quan sát của 6 quốc gia trong giai đoạn 1995 – 2014 (Phụ lục 1.VII).

Sau khi kiểm định, kết quả ở bảng 4.7 cho thấy p-value đều bằng 0.0000 < α = 0.05. Suy ra, bác bỏ giả thuyết Ho ở mức ý nghĩa 5% cho thấy tồn tại hiện tượng tự tương quan bậc 1 trong mơ hình.

Kết luận: Dữ liệu tồn tại hiện tượng tự tương quan bậc 1 trong mơ hình với

mức ý nghĩa 5%.

4.6. Kiểm định đồng liên kết trên dữ liệu bảng.

Bài nghiên cứu, kiểm định đồng liên kết trên dữ liệu bảng được đề xuất bởi Kao (1999) và kiểm tra chéo lại với kiểm định Fisher (1988, 1999). Các kiểm định đồng liên kết dạng bảng với tăng trưởng kinh tế (Y) là biến phụ thuộc, được thực hiện thông qua phương trình sau:

GDPi,t= αi + βi ECi,t + γ NETi,t + η Li,t + ω CPIi,t + εi, t

Với i=1,…,N và t=1, …,T

Giả thuyết kiểm định Kao (1999):

H0: Các chuỗi dữ liệu khơng có đồng liên kết

H1: Các chuỗi dữ liệu có đồng liên kết

Bảng 4.8: Kết quả kiểm định đồng liên kết dữ liệu bảng Kao (1999).

ADF

Giá trị thống kê t P-value

-3.196714 0.0007

Nguồn: kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập với cỡ mẫu gồm 120 quan sát của 6 quốc gia trong giai đoạn 1995 – 2014 (Phụ lục 1.VIII).

Dựa vào bảng 4.8 ta thấy P-value kiểm định bằng 0.0007 cho giá trị nhỏ hơn 0.01, dẫn tới bác bỏ giả thuyết H0 ở mức ý nghĩa 1% tồn tại đồng liên kết giữa các biến.

Bảng 4.9: Kết quả kiểm định đồng liên kết dữ liệu bảng Fisher.

No of CE(s) FisherStat.* (from trace test) Prob. FisherStat.* (from max- eigen test) Prob. At most 4 22.32 0.0341 22.32 0.0341

Nguồn: kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập với cỡ mẫu gồm 120 quan sát của 6 quốc gia trong giai đoạn 1995 – 2014 (Phụ lục 1.VIII).

Kết quả p-value các kiểm định trường hợp kiểm định Fisher trace và Fisher maxeigen, với cả giả thuyết khơng tồn tại ít nhất 4 đồng liên kết cho giá trị nhỏ hơn 1%. Cho thấy bằng chứng bác bỏ giả thuyết Ho ở mức ý nghĩa 1%, tồn tại đồng liên kết trên dữ liệu mẫu.

Kết quả kiểm định đồng liên kết dữ liệu bảng cho kết quả tồn tại mối quan hệ dài han giữa các biến.

4.7.Phân tích kết quả hồi quy.

Mơ hình hồi quy phổ biến trên dữ liệu bảng là hiệu ứng tác động cố định (Fixed effect – FEM), hồi quy dữ liệu bảng hiệu ứng tác động ngẫu nhiên (Random effect – REM). Tuy nhiên FEM và REM khơng kiểm sốt được hiện tượng phương sai thay đổi và tự tương quan, dẫn tới việc sử dụ mơ hình FGLS (Feasible Generalized Least Squares). Phương pháp FGLS theo Beck and Katz (1995) là ước lượng không chệch phù hợp trên cỡ mẫu với T > N, trường hợp cỡ mẫu bài nghiên cứu. Phương pháp kiểm soát hiện tượng phương sai thay đổi và tự tương quan trên FGLS được sử dụng nhằm

khắc phục các khiếm khuyết dữ liệu mẫu đã được phát hiện bởi kiểm định Greene (2000), Wooldridge (2002) và Drukker (2003).

Với nghi ngờ các biến có tác động ngược đến kết quả nghiên cứu gây ra hiện tượng nội sinh, mối tương quan hai chiều giữa GDP và EC dựa trên các nghiên cứu thực nghiệm đã tổng hợp ở chương 2. Theo kết quả nghiên cứu của Arellano và Bond, phương pháp hồi quy tuyến tính dữ liệu bảng động (Arellano-Bond linear dynamic panel-data estimation) là một giải pháp hữu hiệu để ước lượng hồi quy trong mơ hình trong trường hợp mơ hình vừa có hiện tượng phương sai thay đổi, tự tương quan và nội sinh. Ưu điểm của phương pháp GMM cho ước lượng vững và hiệu quả được trình bày ở chương 3. Kết quả hồi quy mơ hình như sau:

GDPi,t= αi + βi ECi,t + γ NETi,t + η Li,t + ω CPIi,t + εi, t

40

Bảng 4.10: Kết quả hồi quy.

Một phần của tài liệu Mối quan hệ nhân quả giữa sản lượng điện tiêu thụ và tăng trưởng kinh tế ở các nước asean (Trang 36)

Tải bản đầy đủ (DOCX)

(101 trang)
w