Mơ hình số liệu mảng đa bậc

Một phần của tài liệu (Luận án tiến sĩ) Chuyển dịch cơ cấu lao động tại Việt Nam Các yếu tố tác động và vai trò đối với tăng trưởng kinh tế (Trang 46 - 51)

2.4 Một số mơ hình kinh tế lượng

2.4.2 Mơ hình số liệu mảng đa bậc

2.4.2.1 Số liệu mảng đa bậc

Số liệu mảng đa bậc là số liệu mảng, trong đó các quan sát theo chiều chéo còn được phân tách theo các nhóm khác nhau hoặc các tầng khác nhaụ

Ví dụ, từ số liệu điều tra doanh nghiệp giai đoạn 2000-2014, tác giả đã tổng hợp các biến số phục vụ nghiên cứu như: lao động, vốn, doanh thu, lợi nhuận,... theo các ngành cấp 2, chứa trong các ngành cấp 1 và chứa trong các tỉnh, theo giai đoạn 2000- 2014. Đây là một dữ liệu mảng 3 cấp. Trong đó, các quan sát mức thấp nhất (cấp 1) là các ngành cấp 2 chứa trong các quan sát ở mức cấp 2 là các ngành cấp 1 và chúng lại chứa trong các tỉnh (là các quan sát ở mức cấp 3).

Số liệu đa bậc được biết đến lần đầu trong nghiên cứu của Stephen Raudenbush, Anthony S. Bryk (1986) với dữ liệu liên quan đến trường học. Trong đó các quan sát được phân tầng theo nhiều cấp độ khác nhaụ Một học sinh thuộc một lớp học, trong một trường, thuộc một quận nào đó.

Theo Andrew Gelman and Jennifer Hill (2006), với số liệu có đặc điểm phân tầng theo các nhóm khác nhau như trên, thơng thường các quan sát trong cùng nhóm sẽ có những đặc điểm giống nhau và các quan sát thuộc các nhóm khác nhau sẽ có sự khác nhau, do vậy, thường gặp vấn đề phương sai sai số thay đổị Điều đó dẫn đến các phương pháp ước lượng thông thường sẽ không hiệu quả. Mơ hình số liệu mảng đa bậc có tính đến sự giống nhau trong cùng một nhóm và sự khác biệt giữa các nhóm, do đó sẽ khắc phục được các khuyết tật trong các mơ hình hồi quy theo phương pháp OLS và mang lại hiệu quả cao hơn.

2.4.2.2 Mơ hình số liệu mảng đa bậc

Mơ hình số liệu mảng đa bậc được tổng quát hóa từ mơ hình hồi quy tuyến tính, trong đó có chứa cả các tác động cố định và tác động ngẫu nhiên, phần tác động ngẫu nhiên không bao gồm trong sai số ngẫu nhiên.

Theo Andrew Gelman and Jennifer Hill (2006), Dạng ma trận của mơ hình số liệu mảng đa bậc như sau:

a = L+ + yx + z (2.7)

trong đó y là véc tơ biến phụ thuộc & × 1 chiều;

X là ma trận cấp & × | các quan sát của các biến độc lập, ma trận X gắn với các tác động cố định +;

Z là ma trận cấp & × } gắn với các tác động ngẫu nhiên u;

z là véc tơ sai số ngẫu nhiên & × 1 chiều, được giả thiết là có trung bình bằng 0, phân phối chuẩn (đa biến) và có ma trận phương sai là ~€.

L+ là phần cố định trong (2.7), với + là hệ số hồi quy được ước lượng từ mơ hình hồi quy tuyến tính thơng thường.

yx + z là phần ngẫu nhiên trong (2.7), u được giả thiết có ma trận phương sai là G và u trực giao với z.

.c6 hxzi = l'0 ~0€o

Tác động ngẫu nhiên u không được ước lượng trực tiếp, thay vào đó là các thành phần phương sai (là các phần tử của ma trận G) được ước lượng cùng với ma trận phương sai của sai số ngẫu nhiên.

Mơ hình số liệu mảng hai bậc:

Kí hiệu: chỉ số i chỉ các cá thể bậc 1 (ví dụ: ngành); chỉ số j chỉ các cá thể bậc 2 (ví dụ: tỉnh), các cá thể bậc 1 nằm trong các cá thể bậc 2; chỉ số t chỉ thời gian (ví dụ: năm).

Trong mơ hình số liệu mảng đa bậc, biến phụ thuộc luôn ở mức quan sát thấp nhất, kí hiệu là: WM

Các biến độc lập gồm: véc tơ biến LM quan sát ở cấp một; véc tơ các biến yM quan sát ở nhóm j cấp 2 có kích thước nhóm là &M.

Khi đó mơ hình hồi qui tuyến tính theo phương pháp OLS của Y theo X bỏ qua các nhóm có dạng: WM = + + +LM+ zM (2.8) trong đó zM là sai số ngẫu nhiên có trung bình bằng 0, phương sai khơng đổị Các hệ số chặn và hệ số góc khơng khác nhau giữa các nhóm.

Mơ hình hồi qui phụ thuộc theo nhóm có dạng như sau:

WM = +M+ +MLM+ zM (2.9)

Trong đó, các hệ số chặn và hệ số góc khác nhau theo mỗi nhóm.

Trường hợp 1: Mơ hình có hệ số chặn ngẫu nhiên có +M là các biến ngẫu nhiên, khác nhau giữa các nhóm: WM = +M+ +LM+ zM

Trong đó: + là hệ số hồi qui chung cho tất cả các nhóm; Hệ số chặn gồm hai thành phần: +M = + ‚M

trong đó  là phần hệ số chặn chung cho tất cả các nhóm, ‚M là phần chênh lệch trong các nhóm.

Ta có mơ hình có hệ số chặn ngẫu nhiên:

WM = + +LM+ ‚M + zM (2.10) Trong đó, ‚M là phần ngẫu nhiên thể hiện mức khác biệt trong hệ số chặn giữa các nhóm.

Trường hợp 2: Mơ hình có cả hệ số chặn và hệ số góc ngẫu nhiên

WM = +M+ +MLM+ zM +M = + ‚M +M = + ‚M khi đó: WM = + ‚M + (+ ‚M)LM+ zM = (+ LM) + (‚M + ‚MLM) + zM (2.11) Trong mơ hình (2.11), kết quả ước lượng với phần mềm STATA được xử lý như sau: phần cố định: + LM được ước lượng từ mơ hình hồi quy tuyến tính thơng thường; phần ngẫu nhiên ‚M+ ‚MLM khơng được báo cáo trực tiếp trong phần hệ số hồi quy mà được tính gián tiếp thơng qua báo cáo của hồi quy phụ. Trong đó,

‚M là phần ngẫu nhiên thể hiện mức khác biệt trong hệ số chặn giữa các nhóm, ‚M là phần ngẫu nhiên thể hiện mức ảnh hưởng khác nhau của biến độc lập đến biến phụ thuộc theo nhóm;

zM là sai số ngẫu nhiên thơng thường.

- Trường hợp 3: Mở rộng mơ hình có hệ số chặn và hệ số góc phụ thuộc ngẫu nhiên vào biến ở mức quan sát cấp 2.

WM = +M+ +MLM+ zM

+M = + yM+ ‚M

+M = + yM+ ‚M

Khi đó ta có:

= + yM+ LM+ yMLM+ ‚M + ‚MLM + zM (2.12)

 là hệ số của biến yMLM đo lường mức độ tương tác chéo giữa các biến thuộc hai cấp.

Tóm lại: Mơ hình số liệu mảng chứa hai bậc theo chiều chéo có thể chứa các biến độc lập có quan sát ở cấp thấp nhất hoặc có thể chứa biến độc lập ở mức quan sát cấp 2 (theo nhóm), cũng có thể chứa các biến tương tác chéo giữa các biến thuộc hai cấp. Ngồi ra cịn có phần đặc trưng khơng quan sát được theo nhóm. Các giả thiết của mơ hình hồi quy với số liệu đa bậc tương tự như các giả thiết của mơ hình hồi quy theo phương pháp OLS.

2.4.2.3 Phương pháp ước lượng

Phương pháp ước lượng phổ biến là phương pháp hợp lý cực đại (ML - Maximum likelihood), phương pháp hợp lý cực đại có ràng buộc (REML- restricted maximun likelihood).

Xem xét phần ngẫu nhiên trong mơ hình số liệu mảng đa bậc (2.7):

yx + z = a − L+

Giả sử y là ngẫu nhiên, phân phối chuẩn đa biến với trung bình bằng L+ và ma trận phương sai cấp & × & như sau: . = ýyƒ+ ~!

Xác định „ là véc tơ các phần tử của ma trận G sao cho hàm logarit của hàm hợp lý: (+, „, ~) = −…&$(2†) + log|.| + (a − L+)ƒ.(a − L+)‰

đạt cực đại theo +, „, ~

Đối với phương pháp REML, hàm hợp lý như sau: Š(+, „, ~) = (+, „, ~) −log |Lƒ .L|.

2.4.2.4 Các kiểm định và quy trình lựa chọn mơ hình

- Kiểm định tác động cố định, dùng T kiểm định, hoặc dùng kiểm định Wald cho nhiều tham số cùng lúc.

- Kiểm định sai khác giữa các tham số phần cố định hay ngẫu nhiên, thường dùng kiểm định tỷ số hợp lý.

- Kiểm định sự phù hợp của hai mơ hình, thường dùng kiểm định Chi - bình phương. - Kiểm định lựa chọn hai mơ hình dùng kiểm định nhân tử Lagrange hoặc kiểm định tỷ số hợp lý.

- Các kiểm định tham số phần ngẫu nhiên, tương tự như kiểm định F trong ANOVẠ

Quy trình lựa chọn mơ hình:

- Ước lượng mơ hình hồi quy tuyến tính theo quy trình lựa chọn biến phù hợp, mơ hình phù hợp.

- Ước lượng mơ hình số liệu mảng đa bậc (lựa chọn mơ hình có hệ số chặn ngẫu nhiên, hệ số góc ngẫu nhiên hoặc cả hệ số chặn và hệ số góc ngẫu nhiên).

- Kiểm định tỷ số hợp lý để lựa chọn mơ hình.

Các phân tích sâu hơn về tương tác bên trong các nhóm và giữa các nhóm - Tính hệ số tương quan bên trong nhóm

- Tính ma trận hiệp phương sai bên trong nhóm

- Tính hệ số chặn và hệ số góc ứng với nhóm chỉ định trong phân tích cá biệt.

Hệ số tương quan bên trong các nhóm (intraclass correlation coefficient):

Ví dụ: Xét mơ hình số liệu mảng đa bậc có hệ số chặn ngẫu nhiên theo 3 cấp.

WMN = + + xMN()+ xN(1)+ zMN()

Trong đó + là hệ số chặn cố định; zMN()là sai số ngẫu nhiên cấp 1; xMN() là hệ số chặn ngẫu nhiên theo nhóm j (ở cấp 2); xN(1) là hệ số chặn ngẫu nhiên theo nhóm k (cấp 3). Giả thiết sai số ngẫu nhiên và các hệ số chặn ngẫu nhiên có phân phối chuẩn, với trung bình bằng 0, và phương sai lần lượt là: ~ ; ~ ; ~1

Khi đó, tương quan trong nhóm cấp 3, là tương quan giữa hai quan sát cấp 1 khác nhau nhưng trong cùng nhóm cấp 3 và khác nhóm cấp 2, được tính như sau:

Œ(1)= 66ZaMN ; aƒMƒN[ = Ž

DuuŽ (2.13) Tương quan trong nhóm cấp 2, là tương quan giữa hai quan sát cấp 1 khác nhau trong cùng nhóm cấp 2 và cấp 3, được tính như sau:

Œ()= 66(aMN ; aƒMN) = uŽ

DuuŽ (2.14) Tổng qt: Mơ hình đa bậc có hệ số chặn ngẫu nhiên theo G cấp sẽ có hệ số tương quan trong nhóm g được tính như sau:

Œ()=∑ ~’ ‘ ‘

∑ ~’ ‘ ‘

Ma trận hiệp phương sai bên trong mỗi nhóm

Xét mơ hình số liệu mảng hai bậc:

aM = LM+ + yMx + 4M (2.15) Mơ hình biên:

aM = LM+ + 4M∗ (2.16) Trong đó: sai số ngẫu nhiên 4M∗ có phân phối chuẩn với trung bình bằng 0, và ma trận hiệp phương sai .M = yM'yMƒ+ €

Phần ngẫu nhiên trong (2.15) được mô tả trong phần sai số ngẫu nhiên 4M∗ của mơ hình biên (2.16)

Theo Steele F. (2008), mơ hình hồi quy đa bậc có một số ưu điểm như:

- Xem xét được cả tác động cố định và tác động ngẫu nhiên (mơ hình hỗn hợp); - Xem xét được các khác biệt theo nhóm; giảm thiểu được hiện tượng phương sai không đồng đều;

- Xem xét được các ảnh hưởng bên trong các nhóm và ảnh hưởng giữa các nhóm. - Khơng u cầu dữ liệu mảng cân bằng cả về không gian và thời gian;

- Chấp nhận trường hợp bị thiếu các quan sát. Do vậy, chúng ta có thể linh hoạt trong sự lựa chọn các biến giải thích ...

Một phần của tài liệu (Luận án tiến sĩ) Chuyển dịch cơ cấu lao động tại Việt Nam Các yếu tố tác động và vai trò đối với tăng trưởng kinh tế (Trang 46 - 51)