CHƢƠNG 1 : GIỚI THIỆU
3.2 MƠ HÌNH NGHIÊN CỨU
3.2.1 Mơ hình sử dụng dữ liệu bảng
3.2.1.1 Dữ liệu bảng (Panel data): là dạng kết hợp của dữ liệu chuỗi thời gian
và dữ liệu chéo, cũng có thể xem là dữ liệu chuỗi thời gian cho từng đơn vị chéo khác nhau. Dữ liệu bảng đƣuợc đặc trƣng bởi hai chiều: (i) N các đơn vị chéo và (ii)T những khoảng thời gian để quan sát chúng. Do đó, tổng quan sát trong một dữ liệu chéo là NxT.
Theo Baltagi (2005) dữ liệu bảng có những đặc điểm ƣu việt nhƣ:
-Dữ liệu bảng cung cấp ―những dữ liệu có nhiều thơng tin hơn, đa dạng hơn, ít cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và do đó hiệu quả hơn. Nếu sử dụng dữ liệu chuỗi thời gian, cần phải có một bộ dữ liệu rất dài để có đủ quan sát đƣa ra một kết quả có ý nghĩa. Nếu sử dụng dữ liệu bảng, việc kết hợp dữ liệu thời
gian và không gian khiến số lƣợng quan sát tăng, gia tăng bậc tự do, theo đó gia tăng sức mạnh của kiểm định.
- Sử dụng dữ liệu bảng giúp giảm bớt hiện tƣợng đa cộng tuyến.
-Thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tính động của thay đổi.
-Ngồi ra dữ liệu bảng có thể nhận diện và đo lƣờng các tác động mà ta không thể dễ dàng kiểm tra đƣợc trong dữ liệu trông gian và thời gian thuần túy. Dữ liệu bảng giúp ta nghiên cứu những mơ hình hành vi phức tạp hơn.
-Những thiên lệch do tổng hợp số liệu về các không gian khác nhau sẽ giảm đi hoặc triệt tiêu trong dữ liệu bảng. Bằng cách cung cấp dữ liệu đối với vài nghìn đơn vị, dữ liệu bảng có thể giảm đến mức thấp nhất hiện tƣợng chệch có thể xảy ra nếu chúng ta gộp các cá nhân hay các doanh nghiệp theo những biến số có mức tổng hợp cao.
3.2.1.2 Mơ hình phân tích dữ liệu bảng GMM
Trong nghiên cứu thực nghiệm với dữ liệu bảng, phƣơng pháp ƣớc lƣợng đƣợc sử dụng nhiều nhất là Pool OLS, mơ hình các ảnh hƣởng cố định FEM và mơ hình các ảnh hƣởng ngẫu nhiên REM. Tuy nhiên, nếu tồn tại vấn đề về biến nội sinh trong mơ hình, tức là một trƣờng hợp khi hệ số ƣớc lƣợng (hoặc biến) tƣơng quan với phần dƣ, khi đó các ƣớc lƣợng Pool OLS, FEM và REM khơng cịn hiệu quả. Ta cũng có thể sử dụng ƣớc lƣợng biến cơng cụ (ƣớc lƣợng IV) để giải quyết vấn đề nội sinh. Tuy nhiên, một trong những vấn đề nan giải khi sử dụng ƣớc lƣợng IV là nếu chọn những biến công cụ yếu, ƣớc lƣợng IV có thể bị chệch.
Để khắc phục việc vi phạm các giả định của mơ hình hồi qui OLS, REM, FEM và khó khăn trong vấn đề tìm biến cơng cụ đối với ƣớc lƣợng IV, tác giả sử dụng phƣơng pháp GMM hệ thống của Arellano(1995) và Bond (1998) để đo lƣờng tác động của bất ổn vĩ mô lên tăng trƣởng kinh tế. Việc sử dụng mơ hình GMM sẽ cho phép khắc phục cả vi phạm tự tƣơng quan, phƣơng sai thay đổi và biến nội sinh nên kết quả ƣớc lƣợng lúc này sẽ không chệch, vững và hiệu quả nhất. Một trong những ƣu điểm quan trọng nữa của mơ hình GMM so với mơ hình ƣớc lƣợng biến cơng cụ
IV là mơ hình GMM dễ dàng chọn các biến cơng cụ hơn. Mơ hình GMM sử dụng biến trễ hoặc sai phân theo các bậc khác nhau của biến nội sinh thay cho biến nội sinh hiện tại làm biến cơng cụ. Do đó, GMM đƣa ra nhiều biến cơng cụ để có thể dễ dàng đạt đƣợc điều kiện của một biến công cụ chuẩn (Overidentification of Estimators). Thêm vào đó, phƣơng pháp Arellano - Bond cũng đƣợc thiết kế để khắc phục hiệu ứng tác động cố định hàm chứa trong sai số của mơ hình (do đặc điểm của các biến quốc gia nghiên cứu không thay đổi theo thời gian nhƣ vị trí địa lý và nhân khẩu học có thể tƣơng quan với các biến giải thích trong mơ hình), đƣợc phản ánh vào trong phần sai số, sẽ giảm dần theo thời gian (Roodman, 2006).
Phƣơng pháp cơ bản trong trƣờng hợp các biến độc lập tƣơng quan với phần dƣ là ƣớc lƣợng một phƣơng trình có dùng các biến cơng cụ. Ý tƣởng của phƣơng pháp hồi quy này là tìm một bộ biến, đƣợc gọi là biến công cụ, thỏa mãn cả hai điều kiện: (1) tƣơng quan với các biến giải thích trong phƣơng trình và (2) khơng tƣơng quan với phần dƣ. Những biến công cụ nhƣ vậy đƣợc dùng để loại bỏ sự tƣơng quan giữa các biến giải thích và phần dƣ. Đối với GMM các biến công cụ thƣờng đƣợc sử dụng là biến trễ hoặc sai phân theo các bậc khác nhau của biến nội sinh.
3.2.1.3 Các bước tiến hành ước lượng mơ hình GMM
Bước 1: Kiểm định tính dừng đối với chuỗi dữ liệu, chọn biến dừng thích hợp
Chuỗi dữ liệu thời gian đƣợc xem là dừng khi trung bình và phƣơng sai của nó khơng đổi theo thời gian. Theo Gujarati (2013) tính dừng là thuộc tính quan trọng nhất của chuỗi dữ liệu thời gian. Đối với chuỗi dữ liệu thời gian dừng, tác động của cú sốc bất kỳ sẽ giảm dần theo thời gian, nếu chuỗi dữ liệu thời gian không dừng ta chỉ có thể nghiên cứu hành vi của nó trong một khoản thời gian đang đƣợc xem xét mà không thể khái qt hóa cho cả giai đoạn, cũng khơng thể tiến hành dự báo.
Ngồi ra, phân tích hồi quy với các chuỗi khơng dừng có thể dẫn đến hiện tƣợng hồi quy giả mạo hoặc hồi quy vô nghĩa khi cho kết quả R2 cao và các hệ số hồi quy có thể có ý nghĩa thống kê mặc dù về bản chất hai chuỗi thời gian này khơng có liên hệ gì với nhau.
Để khảo sát tính dừng của một chuỗi thời gian ta sử dụng các cách sau: (i) Phân tích đồ thị (graphical analysis); (ii) Hàm tự tƣơng quan và đồ thị tự tƣơng quan (Autocorrelation Function (ACF), correlogram); (iii) Kiểm định Q-statistic và Ljung-Box; (iv) Kiểm định nghiệm đơn vị (Unit Root test).
Nếu một chuỗi dữ liệu thời gian có xu thế, nó có thể đƣợc chuyển sang chuỗi dừng bằng cách hồi quy chuỗi đó theo thời gian hoặc biến xu thế. Phần dƣ thu đƣợc từ hồi quy này sẽ thể hiện cho chuỗi thời gian khơng cịn yếu tố xu thế. Tuy nhiên, nếu một chuỗi thời gian có xu thế ngẫu nhiên, nó có thể đƣợc chuyển sang chuỗi dừng bằng cách lấy sai phân một hoặc nhiều lần.
Luận văn sử dụng phƣơng pháp Unit Root test để kiểm định tính dừng của các chuỗi dữ liệu.
Bước 2 Kiểm định hiện tượng đa cộng tuyến:
Trong mơ hình hồi quy, nếu các biến độc lập có quan hệ chặt với nhau, có mối quan hệ tuyến tính thể hiện đƣợc dƣới dạng hàm số thì sẽ xảy ra hiện tƣợng đa cộng tuyến.
Khi xảy ra hiện tƣợng đa cộng tuyến thì thống kê t và các hệ số ƣớc lƣợng sẽ khơng có ý nghĩa, các ƣớc lƣợng OLS vẫn không chệch nhƣng không hiệu quả do phƣơng sai lớn và khoảng tin cậy trở nên rộng hơn. Ƣớc lƣợng OLS và sai số chuẩn trở nên rất nhạy với những thay đổi trong số liệu, dấu của các ƣớc lƣợng của các hệ số hồi quy có thể sai lệch, ngòai ra việc thêm vào hay bớt đi các biến cộng tuyến với các biến khác khiến hệ số của các biến cịn lại có thể thay đổi rất lớn và có thể thay đổi cả dấu của các hệ số.
Do khuyết tật chỉ xảy ra nếu mức độ đa cộng tuyến đủ lớn để gây ra sự thiên chệch các kết quả ƣớc lƣợng, các nhà nghiên cứu thƣờng quan tâm đến mức độ đa cộng tuyến của các biến độc lập hơn là việc có xảy ra hiện tƣợng đa cộng tuyến hay khơng
Có nhiều cách kiểm tra hiện tƣợng đa cộng tuyến nhƣ xem xét R2
lớn hơn 0.8 nhƣng | t | thấp, hệ số tƣơng quan giữa các cặp biến độc lập cao, hệ số khuếch đại phƣơng sai (VIF>10), ma trận tự tƣơng quan. Trong luận văn, tác giả sử dụng ma
trận tự tƣơng quan để xem xét dấu hiệu đa cộng tuyến; sau đó sử dụng hệ số khuếch đại phƣơng sai (VIF) để xem xét mức độ đa cộng tuyến của các biến.
Bước 3 Xem xét vấn đề nội sinh từ mối quan hệ giữa các biến kinh tế trong mơ hình, kiểm tra xác định biến nội sinh
Trong mơ hình kinh tế, một biến đƣợc gọi là biến nội sinh nếu nó chịu tác động của các biến khác trong mơ hình, và biến đƣợc gọi là ngoại sinh (exogenous variable) nếu nó khơng chịu tác động của các biến khác trong mơ hình (Hồng Đình Tuấn và cộng sự, 2014). Trong mơ hình kinh tế lƣợng, một biến đƣợc gọi là biến nội sinh nếu nó tƣơng quan với sai số ngẫu nhiên trong mơ hình, và là biến ngoại sinh nếu nó khơng tƣơng quan với sai số ngẫu nhiên trong mơ hình.
Ví dụ: xét mơ hình hồi quy Y = α + β1X1 + β2X2 + β3X3+u (3.1)
Trong đó Y là biến phụ thuộc (biến đƣợc giải thích), X1 là biến giải thích và u là sai số ngẫu nhiên. Biến (phụ thuộc) Y ở vế trái hiển nhiên là biến nội sinh vì nó có tƣơng quan với sai số ngẫu nhiên u. Mối quan tâm của ngƣời làm mơ hình là liệu các biến giải thích có phải là biến nội sinh hay khơng, chẳng hạn nếu cov(X1, u) ≠ 0 thì X1 là biến nội sinh. Nếu mơ hình có ít nhất một biến giải thích là biến nội sinh thì mơ hình đƣợc gọi là có vấn đề biến nội sinh. Khái niệm biến nội sinh trong kinh tế học quan tâm đến bản chất kinh tế của mối quan hệ giữa các biến số còn khái niệm biến nội sinh trong kinh tế lƣợng quan tâm đến quan hệ thống kê giữa các biến số. Quan hệ kinh tế thƣờng dẫn tới quan hệ thống kê, nhƣng chƣa chắc đã có chiều ngƣợc lại, vì vậy biến nội sinh trong kinh tế học thƣờng cũng là biến nội sinh trong kinh tế lƣợng, nhƣng biến nội sinh trong kinh tế lƣợng có thể là biến nội sinh hoặc là biến ngoại sinh trong kinh tế học.
Khi xây dựng và ƣớc lƣợng mơ hình hồi quy, dựa trên bản chất kinh tế của mối quan hệ giữa các biến số, tác giả lựa chọn một số biến nghi ngờ là biến nội sinh, sau đó tiến hành kiểm định về tính nội sinh của các biến này. Kiểm định Hausman đƣợc đề xuất bởi Hausman (1978) có thể giúp kiểm định đƣợc liệu một biến có phải là biến nội sinh hay không.
Xét mơ hình (3.1) giả sử ta nghi ngờ biến X1 là biến nội sinh dựa vào mối quan hệ hai chiều về mặt bản chất kinh tế giữ X1 và các biến còn lại. Kiểm định biến nội sinh X1 theo kiểm định Hausman thực hiện nhƣ sau:
Bƣớc 1: Hồi quy biến X1 theo biến X2, X3 : X1 = α1 + α2X2 + α3X3 +v (3.2)
thu đƣợc các phần dƣ, kí hiệu bởi v^.
Bƣớc 2: Hồi quy mơ hình gốc, trong đó thay biến X1 bởi v^: Y = γo+ γ1 v^+ γ2 X2 + γ3 X3 + u (3.3)
Nếu hệ số của phần dƣ v^ này có ý nghĩa thống kê (giá trị xác suất tƣơng ứng của biến này là bé, chẳng hạn bé hơn 0.10) thì có thể cho rằng biến X1 là biến nội sinh.
Mục đích của bƣớc này là tìm và kiểm định đƣợc các biến nội sinh của mơ hình.
Bước 4: Thực hiện hồi qui theo phương pháp GMM
Ta sử dụng mơ hình GMM với các biến công cụ để ƣớc lƣợng. Phƣơng pháp cơ bản trong trƣờng hợp xuất hiện biến nội sinh trong mơ hình là dùng các biến công cụ (Instrumental Variables). Ý tƣởng của phƣơng pháp hồi quy này là tìm một bộ biến, đƣợc gọi là biến công cụ, thỏa mãn cả hai điều kiện: (i)Tƣơng quan với các biến giải thích (mỗi biến nội sinh cần có một biến cơng cụ) trong phƣơng trình; (ii)Khơng tƣơng quan với phần dƣ.
Những biến công cụ nhƣ vậy đƣợc dùng để loại bỏ sự tƣơng quan giữa các biến giải thích và phần dƣ. Do mơ hình GMM thƣờng sử dụng biến cơng cụ là biến sai phân hoặc biến trễ của biến nội sinh, dựa vào biến nội sinh tìm đƣợc ở bƣớc 4, ta tìm các biến cơng cụ phù hợp để tiến hành hồi qui theo GMM.
Bước 5: Thực hiện các kiểm định của mơ hình GMM
- Kiểm định sự tự tƣơng quan của phần dƣ
Ƣớc lƣợng GMM giả định rằng khơng có sự tự tƣơng quan bậc 2 của phần dƣ. Vì vậy, mơ hình cần đƣợc kiểm tra sự tự tƣơng quan trong thành phần sai số. Theo Arrelano và Bond (1991), ƣớc lƣợng GMM yêu cầu có sự tự tƣơng quan bậc 1 (kiểm định m1) và khơng có sự tự tƣơng quan bậc 2 của phần dƣ (kiểm định m2).
Vì vậy, giả thuyết H0 là khơng có sự tự tƣơng quan bậc 1 (m1) hoặc bậc 2 (m2) của phần dƣ. Mơ hình GMM thỏa u cầu về sự tự tƣơng quan của phần dƣ khi: H0 bị bác bỏ ở kiểm định m1 nhƣng đƣợc chấp nhận ở m2.
- Kiểm tra tính phù hợp của mơ hình và biến đại diện
Tƣơng tự các mơ hình khác, sự phù hợp của mơ hình GMM có thể đƣợc thực hiện thơng qua kiểm định F. Kiểm định F sẽ kiểm tra ý nghĩa thống kê cho các hệ số ƣớc lƣợng của biến giải thích với giả thuyết H0 là tất cả các hệ số ƣớc lƣợng này trong phƣơng trình level đều bằng 0.
Ngoài ra, kiểm định thống kê J của Hansen (Hansen J-statistic tests) đƣợc sử dụng để kiểm tra giả thuyết H0 về việc mơ hình đƣợc xác định đúng (correct model specification) và kiểm tra các ràng buộc quá mức (valid overidentifying restrictions). Việc bác bỏ giả thuyết H0 có nghĩa rằng một trong 2 giả định về tính phù hợp của mơ hình hoặc biến đại diện là có vấn đề. Buam (2006, trang 201) cho rằng rằng kiểm định thống kê J của Hansen là kiểm định phổ biến nhất trong ƣớc lƣợng GMM để kiểm tra tính phù hợp của mơ hình.
- Kiểm định tính vững của hệ số ƣớc lƣợng
Giả định về tính vững của kết quả trong ƣớc lƣợng GMM đƣợc đề xuất bởi Roodman (2006) có thể đƣợc sử dụng để đánh giá tính phù hợp của các biến đại diện trong GMM. Giả định này yêu cầu hệ số ƣớc lƣợng của biến trễ phụ thuộc trong mơ hình phải cho thấy sự hội tụ với giá trị (trị tuyệt đối) nhỏ hơn 1 (Roodman, 2006, trang 43), ngƣợc lại GMM không phải là 1 ƣớc lƣợng hợp lý.
Ngồi ra, Bond (2002) cịn đề xuất một kiểm định phụ dễ dàng hơn để kiểm tra tính hợp lý của mơ hình bảng động bằng cách kiểm tra xem hệ số ƣớc lƣợng của biến trễ phụ thuộc có nằm trong khoảng giá trị hệ số ƣớc lƣợng tƣơng ứng trong mơ hình OLS và tác động cố định hay khơng. Ví dụ: nếu giá trị ƣớc lƣợng của biến trễ phụ thuộc theo GMM là 0.91 và giá trị ƣớc lƣợng trong OLS và FE lần lƣợt là 0.98 và 0.60 OLS=0.98 > GMM=0.91 > FE=0.60) thì ƣớc lƣợng GMM là phù hợp.