Tác động cố định Kiểm định F (F test)
Tác động ngẫu nhiên Kiểm định B-P; LM
Chọn mơ hình Khơng bác bỏ giả thuyết H0
(khơng có tác động cố định)
Khơng bác bỏ giả thuyết H0 (khơng có tác động ngẫu nhiên)
POLS Bác bỏ giả thuyết H0
(có tác động cố định)
Không bác bỏ giả thuyết H0 (khơng có tác động ngẫu nhiên)
FE Khơng bác bỏ giả thuyết H0
(khơng có tác động cố định) Bác bỏ giả thuyết H0 (có tác động ngẫu nhiên) RE Bác bỏ giả thuyết H0 (có tác động cố định) Bác bỏ giả thuyết H0 (có tác động ngẫu nhiên) Kiểm định Hausman. Chọn FE nếu bác bỏ H0 Ngược lại: chọn RE
2.4.2 Mơ hình số liệu mảng đa bậc
2.4.2.1 Số liệu mảng đa bậc
Số liệu mảng đa bậc là số liệu mảng, trong đó các quan sát theo chiều chéo cịn được phân tách theo các nhóm khác nhau hoặc các tầng khác nhaụ
Ví dụ, từ số liệu điều tra doanh nghiệp giai đoạn 2000-2014, tác giả đã tổng hợp các biến số phục vụ nghiên cứu như: lao động, vốn, doanh thu, lợi nhuận,... theo các ngành cấp 2, chứa trong các ngành cấp 1 và chứa trong các tỉnh, theo giai đoạn 2000- 2014. Đây là một dữ liệu mảng 3 cấp. Trong đó, các quan sát mức thấp nhất (cấp 1) là các ngành cấp 2 chứa trong các quan sát ở mức cấp 2 là các ngành cấp 1 và chúng lại chứa trong các tỉnh (là các quan sát ở mức cấp 3).
Số liệu đa bậc được biết đến lần đầu trong nghiên cứu của Stephen Raudenbush, Anthony S. Bryk (1986) với dữ liệu liên quan đến trường học. Trong đó các quan sát được phân tầng theo nhiều cấp độ khác nhaụ Một học sinh thuộc một lớp học, trong một trường, thuộc một quận nào đó.
Theo Andrew Gelman and Jennifer Hill (2006), với số liệu có đặc điểm phân tầng theo các nhóm khác nhau như trên, thông thường các quan sát trong cùng nhóm sẽ có những đặc điểm giống nhau và các quan sát thuộc các nhóm khác nhau sẽ có sự khác nhau, do vậy, thường gặp vấn đề phương sai sai số thay đổị Điều đó dẫn đến các phương pháp ước lượng thông thường sẽ không hiệu quả. Mơ hình số liệu mảng đa bậc có tính đến sự giống nhau trong cùng một nhóm và sự khác biệt giữa các nhóm, do đó sẽ khắc phục được các khuyết tật trong các mơ hình hồi quy theo phương pháp OLS và mang lại hiệu quả cao hơn.
2.4.2.2 Mơ hình số liệu mảng đa bậc
Mơ hình số liệu mảng đa bậc được tổng quát hóa từ mơ hình hồi quy tuyến tính, trong đó có chứa cả các tác động cố định và tác động ngẫu nhiên, phần tác động ngẫu nhiên không bao gồm trong sai số ngẫu nhiên.
Theo Andrew Gelman and Jennifer Hill (2006), Dạng ma trận của mơ hình số liệu mảng đa bậc như sau:
a = L+ + yx + z (2.7)
trong đó y là véc tơ biến phụ thuộc & × 1 chiều;
X là ma trận cấp & × | các quan sát của các biến độc lập, ma trận X gắn với các tác động cố định +;
Z là ma trận cấp & × } gắn với các tác động ngẫu nhiên u;
z là véc tơ sai số ngẫu nhiên & × 1 chiều, được giả thiết là có trung bình bằng 0, phân phối chuẩn (đa biến) và có ma trận phương sai là ~.
L+ là phần cố định trong (2.7), với + là hệ số hồi quy được ước lượng từ mơ hình hồi quy tuyến tính thơng thường.
yx + z là phần ngẫu nhiên trong (2.7), u được giả thiết có ma trận phương sai là G và u trực giao với z.
.c6 hxzi = l'0 ~0o
Tác động ngẫu nhiên u không được ước lượng trực tiếp, thay vào đó là các thành phần phương sai (là các phần tử của ma trận G) được ước lượng cùng với ma trận phương sai của sai số ngẫu nhiên.
Mơ hình số liệu mảng hai bậc:
Kí hiệu: chỉ số i chỉ các cá thể bậc 1 (ví dụ: ngành); chỉ số j chỉ các cá thể bậc 2 (ví dụ: tỉnh), các cá thể bậc 1 nằm trong các cá thể bậc 2; chỉ số t chỉ thời gian (ví dụ: năm).
Trong mơ hình số liệu mảng đa bậc, biến phụ thuộc luôn ở mức quan sát thấp nhất, kí hiệu là: WM
Các biến độc lập gồm: véc tơ biến LM quan sát ở cấp một; véc tơ các biến yM quan sát ở nhóm j cấp 2 có kích thước nhóm là &M.
Khi đó mơ hình hồi qui tuyến tính theo phương pháp OLS của Y theo X bỏ qua các nhóm có dạng: WM = + + +LM+ zM (2.8) trong đó zM là sai số ngẫu nhiên có trung bình bằng 0, phương sai khơng đổị Các hệ số chặn và hệ số góc khơng khác nhau giữa các nhóm.
Mơ hình hồi qui phụ thuộc theo nhóm có dạng như sau:
WM = +M+ +MLM+ zM (2.9)
Trong đó, các hệ số chặn và hệ số góc khác nhau theo mỗi nhóm.
Trường hợp 1: Mơ hình có hệ số chặn ngẫu nhiên có +M là các biến ngẫu nhiên, khác nhau giữa các nhóm: WM = +M+ +LM+ zM
Trong đó: + là hệ số hồi qui chung cho tất cả các nhóm; Hệ số chặn gồm hai thành phần: +M = + M
trong đó là phần hệ số chặn chung cho tất cả các nhóm, M là phần chênh lệch trong các nhóm.
Ta có mơ hình có hệ số chặn ngẫu nhiên:
WM = + +LM+ M + zM (2.10) Trong đó, M là phần ngẫu nhiên thể hiện mức khác biệt trong hệ số chặn giữa các nhóm.
Trường hợp 2: Mơ hình có cả hệ số chặn và hệ số góc ngẫu nhiên
WM = +M+ +MLM+ zM +M = + M +M = + M khi đó: WM = + M + (+ M)LM+ zM = (+ LM) + (M + MLM) + zM (2.11) Trong mơ hình (2.11), kết quả ước lượng với phần mềm STATA được xử lý như sau: phần cố định: + LM được ước lượng từ mơ hình hồi quy tuyến tính thơng thường; phần ngẫu nhiên M+ MLM không được báo cáo trực tiếp trong phần hệ số hồi quy mà được tính gián tiếp thơng qua báo cáo của hồi quy phụ. Trong đó,
M là phần ngẫu nhiên thể hiện mức khác biệt trong hệ số chặn giữa các nhóm, M là phần ngẫu nhiên thể hiện mức ảnh hưởng khác nhau của biến độc lập đến biến phụ thuộc theo nhóm;
zM là sai số ngẫu nhiên thơng thường.
- Trường hợp 3: Mở rộng mơ hình có hệ số chặn và hệ số góc phụ thuộc ngẫu nhiên vào biến ở mức quan sát cấp 2.
WM = +M+ +MLM+ zM
+M = + yM+ M
+M = + yM+ M
Khi đó ta có:
= + yM+ LM+ yMLM+ M + MLM + zM (2.12)
là hệ số của biến yMLM đo lường mức độ tương tác chéo giữa các biến thuộc hai cấp.
Tóm lại: Mơ hình số liệu mảng chứa hai bậc theo chiều chéo có thể chứa các biến độc lập có quan sát ở cấp thấp nhất hoặc có thể chứa biến độc lập ở mức quan sát cấp 2 (theo nhóm), cũng có thể chứa các biến tương tác chéo giữa các biến thuộc hai cấp. Ngồi ra cịn có phần đặc trưng khơng quan sát được theo nhóm. Các giả thiết của mơ hình hồi quy với số liệu đa bậc tương tự như các giả thiết của mơ hình hồi quy theo phương pháp OLS.
2.4.2.3 Phương pháp ước lượng
Phương pháp ước lượng phổ biến là phương pháp hợp lý cực đại (ML - Maximum likelihood), phương pháp hợp lý cực đại có ràng buộc (REML- restricted maximun likelihood).
Xem xét phần ngẫu nhiên trong mơ hình số liệu mảng đa bậc (2.7):
yx + z = a − L+
Giả sử y là ngẫu nhiên, phân phối chuẩn đa biến với trung bình bằng L+ và ma trận phương sai cấp & × & như sau: . = ýy+ ~!
Xác định là véc tơ các phần tử của ma trận G sao cho hàm logarit của hàm hợp lý: (+, , ~) = − &$(2) + log|.| + (a − L+).(a − L+)
đạt cực đại theo +, , ~
Đối với phương pháp REML, hàm hợp lý như sau: (+, , ~) = (+, , ~) −log |L .L|.
2.4.2.4 Các kiểm định và quy trình lựa chọn mơ hình
- Kiểm định tác động cố định, dùng T kiểm định, hoặc dùng kiểm định Wald cho nhiều tham số cùng lúc.
- Kiểm định sai khác giữa các tham số phần cố định hay ngẫu nhiên, thường dùng kiểm định tỷ số hợp lý.
- Kiểm định sự phù hợp của hai mơ hình, thường dùng kiểm định Chi - bình phương. - Kiểm định lựa chọn hai mơ hình dùng kiểm định nhân tử Lagrange hoặc kiểm định tỷ số hợp lý.
- Các kiểm định tham số phần ngẫu nhiên, tương tự như kiểm định F trong ANOVẠ
Quy trình lựa chọn mơ hình:
- Ước lượng mơ hình hồi quy tuyến tính theo quy trình lựa chọn biến phù hợp, mơ hình phù hợp.
- Ước lượng mơ hình số liệu mảng đa bậc (lựa chọn mơ hình có hệ số chặn ngẫu nhiên, hệ số góc ngẫu nhiên hoặc cả hệ số chặn và hệ số góc ngẫu nhiên).
- Kiểm định tỷ số hợp lý để lựa chọn mơ hình.
Các phân tích sâu hơn về tương tác bên trong các nhóm và giữa các nhóm - Tính hệ số tương quan bên trong nhóm
- Tính ma trận hiệp phương sai bên trong nhóm
- Tính hệ số chặn và hệ số góc ứng với nhóm chỉ định trong phân tích cá biệt.
Hệ số tương quan bên trong các nhóm (intraclass correlation coefficient):
Ví dụ: Xét mơ hình số liệu mảng đa bậc có hệ số chặn ngẫu nhiên theo 3 cấp.
WMN = + + xMN()+ xN(1)+ zMN()
Trong đó + là hệ số chặn cố định; zMN()là sai số ngẫu nhiên cấp 1; xMN() là hệ số chặn ngẫu nhiên theo nhóm j (ở cấp 2); xN(1) là hệ số chặn ngẫu nhiên theo nhóm k (cấp 3). Giả thiết sai số ngẫu nhiên và các hệ số chặn ngẫu nhiên có phân phối chuẩn, với trung bình bằng 0, và phương sai lần lượt là: ~ ; ~ ; ~1
Khi đó, tương quan trong nhóm cấp 3, là tương quan giữa hai quan sát cấp 1 khác nhau nhưng trong cùng nhóm cấp 3 và khác nhóm cấp 2, được tính như sau:
(1)= 66ZaMN ; aMN[ =
Duu (2.13) Tương quan trong nhóm cấp 2, là tương quan giữa hai quan sát cấp 1 khác nhau trong cùng nhóm cấp 2 và cấp 3, được tính như sau:
()= 66(aMN ; aMN) = u
Duu (2.14) Tổng qt: Mơ hình đa bậc có hệ số chặn ngẫu nhiên theo G cấp sẽ có hệ số tương quan trong nhóm g được tính như sau:
()=∑ ~
∑ ~
Ma trận hiệp phương sai bên trong mỗi nhóm
Xét mơ hình số liệu mảng hai bậc:
aM = LM+ + yMx + 4M (2.15) Mơ hình biên:
aM = LM+ + 4M∗ (2.16) Trong đó: sai số ngẫu nhiên 4M∗ có phân phối chuẩn với trung bình bằng 0, và ma trận hiệp phương sai .M = yM'yM+
Phần ngẫu nhiên trong (2.15) được mô tả trong phần sai số ngẫu nhiên 4M∗ của mơ hình biên (2.16)
Theo Steele F. (2008), mơ hình hồi quy đa bậc có một số ưu điểm như:
- Xem xét được cả tác động cố định và tác động ngẫu nhiên (mơ hình hỗn hợp); - Xem xét được các khác biệt theo nhóm; giảm thiểu được hiện tượng phương sai không đồng đều;
- Xem xét được các ảnh hưởng bên trong các nhóm và ảnh hưởng giữa các nhóm. - Khơng u cầu dữ liệu mảng cân bằng cả về không gian và thời gian;
- Chấp nhận trường hợp bị thiếu các quan sát. Do vậy, chúng ta có thể linh hoạt trong sự lựa chọn các biến giải thích ...
2.4.3 Mơ hình số liệu mảng khơng gian
2.4.3.1 Số liệu mảng không gian
Số liệu mảng không gian (Spatial Panel) chứa các quan sát theo chuỗi thời gian của một số đơn vị không gian như: tỉnh/thành phố, khu vực, các quốc gia, vùng lãnh thổ, vv. Như vậy số liệu mảng không gian đặc biệt hơn số liệu mảng nói chung ở chỗ các quan sát theo chiều chéo gắn liền với các đơn vị hành chính hoặc theo vị trí địa lý.
Kinh tế lượng không gian (Spatial Econometrics) là một nhánh của kinh tế lượng nhằm giải quyết những vấn đề có liên quan đến những tác động theo không gian như: sự tương tác theo không gian (tự tương quan theo không gian) hoặc tính cấu trúc theo khơng gian (tính khơng đồng nhất theo khơng gian) trong các mơ hình hồi qui
theo số liệu chéo hoặc số liệu mảng (Anselin, 1988, 2001, 2008, 2010; Coro Chasco, 2013). Ở đó các tác động khơng gian (như tự tương quan hoặc khơng đồng nhất) có ảnh hưởng đến mơ hình hồi quỵ
Các mơ hình hồi qui theo số liệu mảng không gian thường được sử dụng trong một số lĩnh vực nghiên cứu về: khoa học vùng, đô thị, kinh tế bất động sản, địa lý kinh tế,... Gần đây, các nhà nghiên cứu có xu hướng ứng dụng kinh tế lượng không gian trong một số nghiên cứu về thị trường lao động, chuyển dịch cơ cấu, các mô hình tăng trưởng kinh tế, chi tiêu cơng, thuế, ...
2.4.3.2 Mơ hình số liệu mảng khơng gian
Các mơ hình số liệu mảng khơng gian được xây dựng để khắc phục hiện tượng phổ biến thường gặp đối với số liệu mảng không gian là: tự tương quan theo không gian và không đồng nhất theo không gian. Các mối tương tác không gian được đưa vào mơ hình số liệu mảng khơng gian thơng qua một ma trận trọng số không gian.
Ma trận trọng số khơng gian
Ký hiệu: = ZgM[× là ma trận vuông cấp n, gọi là ma trận trọng số theo không gian; các phần tử của ma trận là không ngẫu nhiên và ngoại sinh trong mơ hình hồi quị
Ma trận trọng số khơng gian thường được chuẩn hóa theo hàng hoặc theo cột và được xây dựng với sự hỗ trợ của hệ thống thông tin địa lý của các địa phương /vùng /quốc giạ
Một số phương pháp xác định ma trận trọng số theo không gian thường được sử dụng:
(1) Ma trận dựa trên sự tiếp giáp (liền kề): gM = 1 nếu hai cá thể theo khơng gian i và j có chung đường biên, ngược lại thì gM = 0.
(2) Ma trận dựa vào khoảng cách:
a) Trọng số của k địa phương gần nhất: gM = 1 nếu địa phương j là một trong số k địa phương gần nhất với địa phương i; gM = 0 trong trường hợp còn lạị
b) Trọng số theo nghịch đảo của khoảng cách: gM =
EQ
với 9M là khoảng cách giữa hai địa điểm được chọn là trung tâm của hai địa phương i và j.
(3) Ma trận trọng số Kernel mang tính cố định và thích nghi giữa hai địa phương. (4) Ma trận dựa vào khoảng cách về công nghệ hoặc kinh tế....
Mơ hình số liệu mảng khơng gian
Với mỗi thời kì t = 1, ..., T, kí hiệu a là ma trận cột cấp & × 1 của các biến phụ thuộc; L là ma trận cấp & × 8 các giá trị của các biến độc lập;
(i) Mơ hình sai số khơng gian - SEM (Spatial Error Model)
Mơ hình SEM có sai số tự hồi qui theo không gian tức là sai số tại mỗi địa phương tương quan với sai số tại các địa phương khác.
a = L+ + + :
: = :+ z
Trong đó: a là véc tơ các quan sát của biến phụ thuộc theo thời gian t; L là ma trận quan sát của các biến độc lập theo thời gian t; + là véc tơ hệ số hồi quy của các biến độc lập;
M là ma trận trọng số khơng gian có thể bằng hoặc khác với W.
Lambda () là hệ số tự hồi quy không gian của sai số. Nếu dương (âm) và có ý nghĩa thống kê, hàm ý rằng một cú sốc xảy ra tại một địa phương có thể ảnh hưởng tích cực (tiêu cực) đến các địa phương lân cận.
z là sai số ngẫu nhiên, có trung bình bằng 0, phương sai khơng đổi và có phân phối chuẩn.
Trường hợp mơ hình có tác động ngẫu nhiên nếu có trung bình bằng 0, phương sai không đổi và phân phối chuẩn;
Trường hợp mơ hình có tác động cố định nếu là là véc tơ tham số được ước lượng.
(ii) Mơ hình trễ khơng gian - SAR (Spatial lag model)
Mơ hình trễ khơng gian hay cịn gọi là mơ hình tự hồi qui theo khơng gian, trong đó biến phụ thuộc tại mỗi địa phương có tương quan với biến phụ thuộc trong các địa phương khác. Mơ hình SAR có dạng tổng quát như sau:
a = a+ L+ + + z
Trong đó, là tham số tự hồi qui khơng gian; có giá trị dương (âm) và có ý nghĩa thống kê, hàm ý rằng tồn tại sự tự tương quan không gian dương (âm).
a là biến trễ theo không gian; nếu ma trận trọng số W được chuẩn hóa theo hàng thì ∈ −1,1.
z là sai số ngẫu nhiên có trung bình bằng 0, phương sai không đổi và phân