CHƯƠNG 3 TÁC ĐỘNG CỦA HẠ TẦNG GIAO THÔNG VẬN TẢI TỚI TĂNG TRƯỞNG KINH TẾ
3.1. Phương pháp phân tích
Giả sử có dữ liệu cho N phần tử trong thời gian T năm. Dữ liệu đầu ra là Y, mô hình xét đơn giản với 2 yếu tố đầu vào X1 và X2.
Mô hình tổng quát như sau:
Yit = a + bX1 it + c X2 it + vi + uit với i = 1; 2; … N và t = 1; 2; … T.
vi là hiệu ứng gây ra do các đặc trưng riêng của cá nhân phần tử i (hệ số vi có thể bất biến hoặc thay đổi theo thời gian).
uit là sai số thay đổi theo thời gian và không gian, phân phối N(0; σ2), không tự tương quan theo thời gian và không gian (E(u ; u ) = 0 với mọi hằng số năm t1 ≠ t2
∈{ 1; 2; …T} và E(u ; u ) = 0 với mọi hằng số phần tử chéo i1 ≠ i2 ∈{ 1; 2; …N}).
3.1.1. Mô hình hồi quy dữ liệu mảng cơ bản
Nếu có các vi = 0 và uit là sai số truyền thống, thỏa mãn các điều kiện cơ bản của mô hình OLS thông thường thì kết quả được chọn là mô hình POLS.
Nếu các giá trị vi là các hằng số tương ứng với cá nhân phần tử i, bất biến theo thời gian, có ít nhất một hằng số vi ≠ 0 có ý nghĩa. Mô hình được chọn là FE (Fixed effect).
Trong hồi quy dữ liệu mảng sử dụng Stata, nếu mô hình được chọn là FE, để ước lượng các hệ số a + vi tương ứng của phần tử thứ i, ta có thể kết hợp sử dụng N-1 biến giả cho N phần tử chéo và ước lượng mô hình gộp, khi đó mô hình tác động cố
định kiểm soát tất cả các bất biến theo thời gian nhưng khác biệt theo các phần tử bởi hằng số. Hệ số của biến nhằm nắm bắt tác động do phần thay đổi theo thời gian của tất cả các phần tử. Nói cách khác, mô hình tác động cố định tách riêng phần cố định khác biệt của từng phần tử và tác động của phần thay đổi từ mọi phần tử. Hệ số hằng từ mô hình FE khi sử dụng Stata thực chất ngắn gọn là hằng số từ ước lượng trung bình các phần tử theo thời gian (a = mean(Y) - b*mean(X1) - c*mean(X2)).
Nếu không có tác động cố định của các đặc điểm cố định, riêng (khác biệt) của các phần tử hoặc dữ liệu không nắm bắt các tác động này, khi đó vi là các sai số thay đổi theo thời gian vit, song nếu:
vit = v0 + eit
Trong đó v0 là giá trị trung bình của tất cả các vit; phần còn lại eit là sai số của phần tử i thay đổi theo thời gian và có:
{eit} phân phối N(0; σ21) và không tương quan với nhau (E(eiej) = 0 ∀ i ≠ j) ei không tương quan với ui.
Khi đó, mô hình được chọn là mô hình RE. Hệ số chặn trong mô hình RE trở thành:
Yit = (a+v0) + bX1 it + c X2 it + (eit + uit) với i = 1; 2; … N và t = 1; 2; … T Như vậy, một trong các sự khác biệt của mô hình RE và FE là mô hình RE xét tác động của các biến hằng số theo thời gian nhưng khác biệt (đặc trưng riêng) theo từng phần tử, tác động là ngẫu nhiên đến biến phụ thuộc nên đóng vai trò như 1 biến giải thích, song mô hình FE các biến này coi như tác động cố định đến biến phụ thuộc nên được hấp thụ vào hệ số chặn của mô hình kết quả (omitted).
Ngoài ra, sự khác biệt của mô hình POLS và RE là phần dư của mô hình RE bao gồm 2 phần wit = eit + uit, với các ràng buộc của e và u, đồng thời có tự tương quan của phần dư từ các phần tử chéo theo thời gian, tức là xét tại 2 mốc thời gian cố định t1; t2 bất kỳ:
Corr (w ; w ) = σ21 / (σ21 + σ2)
Phương pháp lựa chọn giữa mô hình FE và RE là dùng kiểm định Hausman, để lựa chọn giữa mô hình POLS và RE sử dụng phương pháp nhân tử Lagrange.
3.1.2. Mô hình hồi quy kinh tế lượng không gian
Trong kinh tế, người ta thường thấy có vấn đề về tương tác không gian, chẳng hạn sự phát triển tại một địa phương cũng có thể tạo ra những tác động đến các địa phương lân cận. Một phương pháp để tính đến tác động này là sử dụng mô hình kinh tế lượng không gian
3.1.2.1. Ma trận trọng số không gian
Ma trận trọng số không gian W = {wij} là ma trận vuông bậc n dùng để mô tả sắp xếp không gian của n khu vực địa lý chứa biến độc lập, wij là trọng số không gian giữa vùng i và vùng j. Có nhiều cách xác định ma trận trọng số không gian. Báo cáo tại hội thảo, Silva (2018) đã tổng hợp các cách xác định trọng số không gian.
Dựa vào sự tiếp giáp dạng tiêu chuẩn:
Dựa trên trọng số về khoảng cách:
1
ij 1
ij
w = d
+ với dij là khoảng cách giữa 2 vùng i, j.
Hoặc có thể chọn wii = 0; ij 1 ij
w = d nếu i ≠ j
Ngoài ra ma trận trọng số Cliff-Ord tổng quát có dạng: ( ) ( )
ij ij
ij
w b d
α
= β trong đó bij là tổng chiều dài đường biên chung của vùng i và j. Công thức trên là trường hợp riêng khi α = 0 và β = 1.
Dựa trên trọng số về thời gian đi lại:
1
ij 1
ij
w = t
+ với tij là thời gian đi lại trung bình giữa 2 vùng i, j.
Hoặc có thể chọn wii = 0; ij 1
ij
w =t nếu i ≠ j
Wilson (1970) đề xuất
dij
ij d
w e
−
= trong đó d là trung bình khoảng cách của 2 vùng bất kì trong các vùng đang xét.
Tùy theo mục đích nghiên cứu, ma trận trọng số có thể được chuẩn hóa theo hàng.
Đối với ma trận tiếp giáp (liền kề), giữa 2 tỉnh không tiếp xúc, hệ số ma trận không gian bằng 0, tức triệt tiêu tác động lan tỏa giữa chúng. Do đặc thù của hạ tầng giao thông vận tải là phục vụ giao thương giữa các tỉnh, kể cả khi chúng không liền kề nên nghiên cứu trong luận án sử dụng ma trận nghịch đảo khoảng cách với đường chéo chính là 0 và được chuẩn hóa theo hàng. Ưu thế của dạng ma trận trên là không triệt
1 nếu vùng i và vùng j liền nhau 0 trong các trường hợp còn lại
1 nếu 0 ≤ dij ≤ R với dij là khoảng cách giữa 2vùng i và j, i ≠ j 0 trong các trường hợp còn lại
Dựa vào bán kính lân cận R:
tiêu tác động không gian giữa các tỉnh không tiếp xúc trực tiếp, tác động không gian tỉ lệ nghịch với khoảng cách giữa các tỉnh.
3.1.2.2. Các mô hình hồi quy kinh tế lượng không gian
Nhiều nghiên cứu của các nhà địa lý và thống kê cuối thập niên 1950 đã chỉ ra rằng các dữ liệu thống kê có sự tự tương quan không gian. Moran (1950) đã sử dụng thuật ngữ "spatial correlation" và xây dựng chỉ số Moran's I để đo lường sự tương quan không gian. Sự tự tương quan không gian được phát triển hơn nữa về mặt thực nghiệm và lý thuyết bởi nghiên cứu của Cliff và cộng sự (1981). Mô hình kinh tế lượng không gian được giới thiệu bởi Anselin (1988b) và được phát triển cùng nhiều nghiên cứu khác như Anselin và cộng sự (2008), Baltagi và cộng sự (2007), Kapoor và cộng sự (2007), Fingleton (2008).
Cho t là tham số chỉ thời gian, t = 1; 2; …; T.
Chỉ số i biểu thị cho khu vực quan sát, i = 1; 2; …; N.
yt là 1 véc tơ cột gồm n dòng là giá trị của biến phụ thuộc tại N khu vực trong năm thứ t.
Xt là ma trận N x K, gồm N dòng và K cột tương ứng cho K biến độc lập tại thời điểm t
W là ma trận trọng số không gian bậc N x N.
Mô hình SAR (Spatial Autoregressive Model, còn được gọi là SLM - Spatial Lag Model)
yt = α.Wyt + Xt.β + εt
Trong đó α là hệ số hồi quy của Wy ; β là vec tơ cột gồm K dòng là hệ số tác động của các biến độc lập; εt là sai số ngẫu nhiên, εit ∼ N(0; σε2).
Mô hình Dubin không gian SDM (Spatial Dupin Model):
yt = α.Wyt + Xt.β + WZt.θ + εt
Trong đó α là hệ số hồi quy của Wy, β là vec tơ cột gồm K dòng; εt là sai số ngẫu nhiên, εit ∼ N(0; σε2). θ là véc tơ cột gồm M dòng là hệ số hồi quy của M biến độc lập Z, thể hiện sự tác động của biến Z đối với các địa phương lân cận. Các biến độc lập Z có thể trùng với các biến X.
Mô hình SDEM (Spatial Dupin Error Model):
yt = WXt.θ + εt
Tương quan không gian xuất hiện trong cả phần sai số: εt = λHεt + vt
H là ma trận trọng số không gian, H có thể bằng W.
λ là hệ số tự tương quan không gian của sai số, cho biết sai số ở quan sát này phụ thuộc không gian vào sai số của các quan sát lân cận.
Mô hình SLX (Spatial Lag of X Model) yt = Xt.β + WXt.θ + εt
Mô hình SAC (Spatial Autocorrelation Model):
yt = α.Wyt + Xt.β + εt εt = λHεt + vt
H là ma trận trọng số không gian, H có thể bằng W.
Mô hình SEM (Spatial Error Model):
yt = Xt.β + εt εt = λHεt + vt
Mô hình tổng quát GNS (Genneral Nesting Spatial Model):
yt = α.Wyt + Xt.β + WZt.θ + εt ; εt = λHεt + vt
Các biến độc lập Z có thể trùng với các biến X.
Hình 3.1 mô tả mối quan hệ giữa các dạng mô hình:
Hình 3.1: Mối liên hệ giữa các dạng mô hình Mô hình
GNS
Mô hình SAC
Mô hình SAR
Mô hình Mô hình OLS
SDM
Mô hình SLX
Mô hình SDEM
Mô hình SEM λ = 0
λ = 0
θ ≡ 0 α = 0
θ ≡ 0
Ngoài ra mô hình kinh tế lượng không gian còn được mở rộng xét tác động không gian của các trễ về thời gian:
yt = α1.Wyt + α1.Wyt-1 + Xt.β + WZt.θ1 + WZt-1.θ2 + εt εt = λ1.Hεt + λ2.Hεt-1 + vt
Mô hình còn được lựa chọn dưới dạng các tác động ngẫu nhiên (Random - effect) và tác động cố định (Fixed - effect).
Gần đây, Vega và Elhorst (2015) đã chỉ ra rằng các mô hình SAR, SEM và SAC được sử dụng hạn chế trong nghiên cứu thực nghiệm do những hạn chế ban đầu đối với các hiệu ứng lan tỏa mà chúng có thể tạo ra. Trong các mô hình SAR và SAC, tỷ lệ giữa hiệu ứng lan tỏa và hiệu ứng trực tiếp là như nhau cho mọi biến giải thích, trong khi trong mô hình SEM, hiệu ứng lan tỏa được đặt thành 0 khi xây dựng. Chỉ trong các mô hình SLX, SDEM, SDM và GNS, các hiệu ứng lan tỏa không gian mới có thể nhận được bất kỳ giá trị nào. Vì mô hình SLX là mô hình đơn giản nhất trong họ mô hình kinh tế lượng không gian này nên lời khuyên đưa ra là lấy mô hình SLX làm điểm xuất phát khi một nghiên cứu thực nghiệm tập trung vào các hiệu ứng lan tỏa không gian.