Phương pháp kinh tế lượng

CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU

3.3. Phương pháp kinh tế lượng

Trong nghiên cứu này, tác giá sử dụng hai dạng mơ hình kinh tế lượng là mơ hình hồi quy tuyến tính đa biến (hay mơ hình hồi quy bội) và mơ hình Logit (hay mơ hình Logistic). Thơng tin cơ bản về hai dạng mơ hình này sẽ được trình bày ở các phần sau:

3.3.1. Mơ hình hồi quy tuyến tính đa biến

Mơ hình hồi quy tuyến tính đa biến là mơ hình gồm nhiều biến độc lập cùng giải thích cho một biến phụ thuộc, nghĩa là mơ hình này cho phép kiểm sốt nhiều yếu tố khác nhau có tác động đồng thời lên biến phụ thuộc (Wooldridge, 2015). Và được viết dưới dạng tổng quát như sau:

𝑌𝑖 = 𝛽0+ 𝛽1𝑋1𝑖 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + … + 𝛽𝑘𝑋𝑘𝑖+ 𝑢𝑖 (3.4) Trong đó:

Y là biến phụ thuộc.

X1, X2,.., Xk là các biến độc lập.

β0 là hệ số chặn.

β1, β2,..., β𝑘 là hệ số hồi quy riêng phần của X1, X2,.., Xk. u là sai số của mơ hình.

i là quan sát thứ i

Damodar (1995) đưa ra một số giả định dành cho mơ hình hồi quy tuyến tính đa biến như sau:

Giả định 1: Giá trị trung bình của ui bằng 0, hay 𝐸(𝑢𝑖|𝑋1𝑖, 𝑋2𝑖… 𝑋𝑘𝑖) = 0.

Giả định 2: Khơng có tương quan chuỗi, hay cov (ui, uj) = 0 với 𝑖 ≠ 𝑗. Giả định 3: Phương sai không đổi, hay var(ui) = 𝜎2.

Giả định 4: Tích sai giữa ui và mỗi biến độc lập bằng 0, hay cov (ui, X1i) = cov (ui, X2i) = ... = cov (ui, Xki) = 0

Giả định 5: Mơ hình được xác định đúng.

Theo Wooldridge (2015), phương pháp được sử dụng để ước lượng mơ hình hồi quy tuyến tính đa biến là phương pháp bình phương tối thiểu thông thường (Ordinary least squares - OLS). Để tìm các hàm ước lượng OLS, đầu tiên phải viết lại hàm hồi quy mẫu (SRF) từ hàm hồi tổng thể (PRF) của (3.4) như sau:

𝑌̂ = 𝛽𝑖 ̂ + 𝛽0 ̂𝑋1 1𝑖 + 𝛽̂𝑋2 2𝑖 + 𝛽̂𝑋3 3𝑖 + … + 𝛽̂𝑋𝑘 𝑘𝑖 (3.5) Trong đó: β̂0 là ước lượng của hệ số chặn 𝛃

𝟎.

β̂1, β̂2, ..., β̂k là ước lượng của hệ số hồi quy riêng phần β1, β2,..., βk. Xác định hàm SRF sao cho giá trị ước lượng của Y phải gần với giá trị quan sát của Y nhất. Để thõa mãn tiêu chí này, phương pháp bình phương tối thiểu thông thường sẽ lựa chọn các giá trị của các thông số chưa biết sao cho tổng các bình phương của phần dư (RSS) là nhỏ nhất, được viết dưới dạng toán học như sau:

min ∑𝑛𝑖=1𝑢𝑖2 = ∑𝑛𝑖=1(𝑌𝑖 − 𝛽̂ − 𝛽0 ̂𝑋1 1𝑖 − 𝛽̂𝑋2 2𝑖 − 𝛽̂𝑋3 3𝑖 − … − 𝛽̂𝑋𝑘 𝑘𝑖)2 (3.6) Phương pháp để tối thiểu hóa biểu thức (3.6) là giải hệ phương trình gồm k+1 phương trình tuyến tính với k+1 ước lượng β̂0, β̂1, β̂2, ..., β̂k chưa biết, bằng cách lấy đạo hàm biểu thức (3.6) theo các đại lượng chưa biết. Được mơ tả dưới dạng tốn học như sau:

∑ (𝑌𝑖 𝑛 𝑖=1 − 𝛽̂ − 𝛽0 ̂𝑋1 1𝑖− 𝛽̂𝑋2 2𝑖− 𝛽̂𝑋3 3𝑖− … − 𝛽̂𝑋𝑘 𝑘𝑖) = 0 ∑ 𝑋1𝑖(𝑌𝑖 𝑛 𝑖=1 − 𝛽̂ − 𝛽0 ̂𝑋1 1𝑖− 𝛽̂𝑋2 2𝑖− 𝛽̂𝑋3 3𝑖− … − 𝛽̂𝑋𝑘 𝑘𝑖) = 0 ∑ 𝑋2𝑖(𝑌𝑖 𝑛 𝑖=1 − 𝛽̂ − 𝛽0 ̂𝑋1 1𝑖− 𝛽̂𝑋2 2𝑖− 𝛽̂𝑋3 3𝑖− … − 𝛽̂𝑋𝑘 𝑘𝑖) = 0 .... ∑ 𝑋𝑘𝑖(𝑌𝑖 𝑛 𝑖=1 − 𝛽̂ − 𝛽0 ̂𝑋1 1𝑖− 𝛽̂𝑋2 2𝑖− 𝛽̂𝑋3 3𝑖− … − 𝛽̂𝑋𝑘 𝑘𝑖) = 0

Giải hệ phương trình trên sẽ tìm ra được các ước lượng β̂0, β̂1, β̂2, ..., β̂k cụ thể thỏa mãn tiêu chí tổng các bình phương của phần dư (RSS) là nhỏ nhất.

3.3.2. Mơ hình Logit

Mơ hình logit được sử dụng trong trường hợp biến phụ thuộc là biến nhị phân, mơ hình này tránh được những nhược điểm của mơ hình xác suất tuyến tính (Wooldridge, 2015). Giả sử xác suất của biến Y phụ thuộc vào một chỉ số 𝐼𝑖∗ không quan sát được. Và chỉ số này là một hàm của các biến độc lập:

𝐼𝑖∗ = 𝛽𝑋𝑖 + 𝑢𝑖 (3.7) Trong đó: 𝛽𝑋 = 𝛽1𝑋1+ 𝛽2𝑋2+ ⋯ + 𝛽𝑘𝑋𝑘 𝑢 là sai số 𝑖 là quan sát thứ i Giả định rằng: Yi = 1 if Ii∗ ≥0 Yi = 0 if Ii∗ ≤0

Xác suất của Y=1 được xác định như sau:

𝑃(𝑌𝑖 = 1) = 𝑃(𝐼𝑖∗≥ 0) = 𝑃(𝛽𝑋𝑖 + 𝑢𝑖 ≥ 0) = 𝑃(𝑢𝑖 ≥ −𝛽𝑋𝑖) (3.8)

Xác suất này phụ thuộc vào phân phối xác suất của 𝑌𝑖, mà 𝑌𝑖 lại phụ thuộc vào phân phối xác suất của ui. Nếu phân phối xác suất này là đối xứng quanh giá trị trung bình của nó thì phương trình (3.8) được viết lại như sau:

𝑃𝑖 = 𝑃(𝑌𝑖 = 1) = 𝑃(𝑢𝑖 ≤ 𝛽𝑋𝑖) (3.9)

Mơ hình logit giả định rằng phân phối xác suất của ui là phân phối xác suất logistic, vì vậy phương trình (3.9) có thể được viết lại như sau:

𝑃(𝑢𝑖 ≤ 𝛽𝑋𝑖) = 𝑃𝑖 = 1

1+𝑒−𝑍𝑖 (3.10) => P(Y=0) = 1- Pi = 1

1+𝑒−𝑍𝑖 (3.11) Với Zi= 𝛽𝑋𝑖 và −∞ < 𝑍𝑖 < +∞ nên 0 < 𝑃𝑖 < 1

Tỷ số Odd là tỷ số giữa P(Y=1) và P(Y=0): 𝑃𝑖

1−𝑃𝑖 = 1+𝑒𝑍𝑖

1+𝑒−𝑍𝑖 = 𝑒𝑍𝑖 (3.12) Lấy logarit hai vế phương trình (3.12) ta được dạng hàm của mơ hình logit:

Li = ln( 𝑃𝑖

1−𝑃𝑖) = 𝛽𝑋𝑖 (3.13)

Hoặc cũng có thể viết mơ hình logit dướng dạng: P (Y=1|X) = 1

Phương pháp được sử dụng để ước lượng mơ hình logit là phương pháp ước lượng hợp lý cực đại (Maximum likelihood estimation-MLE). Đây là phương pháp xác định các hệ số β sao cho giá trị dự báo của Y phải gần nhất so với giá trị quan sát của Y, hay nói cách khác là xác định các hệ số β sao cho hàm log L đạt cực đại:

𝑙𝑜𝑔𝐿 = ∑𝑛𝑖=1[𝑌𝑖log 𝑃𝑖 + (1 − 𝑌𝑖) log( 1 − 𝑃𝑖 )]→ 𝑚𝑎𝑥 (3.15)

Lưu ý là hệ số hồi quy của mơ hình logit chỉ cho biết chiều tác động của các biến độc lập X lên biến phụ thuộc Y, nếu muốn biết chính xác khi X tăng lên 1 đơn vị thì xác suất Pi thay đổi như thế nào thì cần phải tính tác động biên theo cơng thức sau:

𝜕𝑃𝑖

𝜕𝑋𝑖 = 𝜕

𝜕𝑋𝑖 ( 1

1+𝑒−(𝛽𝑋𝑖+𝑢𝑖) (3.16)

3.3.3. Các khuyết tật của mơ hình Đa cộng tuyến Đa cộng tuyến

Khái niệm “Đa cộng tuyến” được đề xuất bởi (Frisch, 1934), và được hiểu là sự tồn tại mối quan hệ tuyến tính hồn hảo giữa một số hoặc tồn bộ biến độc lập trong một mơ hình hồi quy. Mơ hình hồi quy gồm k biến X1, X2, ..., Xk có tồn tại hiện tượng đa cộng tuyến hoàn hảo khi thõa mãn điều kiện sau:

𝛾1𝑋1+ 𝛾2𝑋2+ ⋯ + 𝛾𝑘𝑋𝑘 = 0 (3.17)

Trong đó, γ1, γ2,.., γk là các hằng số và khơng đồng thời bằng 0.

Tuy nhiên, Damodar (1995) cho rằng khái niệm đa cộng tuyến có thể được dùng với nghĩa rộng hơn, khơng những là trường hợp đa cộng tuyến hồn hảo mà còn cả trường hợp các biến độc lập X có tương quan với nhau nhưng khơng hồn hảo:

𝛾1𝑋1+ 𝛾2𝑋2+ ⋯ + 𝛾𝑘𝑋𝑘 + 𝑉𝑖 = 0 (3.18)

Với Vi là số hạng sai số ngẫu nhiên.

Hậu quả của đa động tuyến là sai số chuẩn Se(β) bị phóng đại dẫn đến thống kê t thấp, p-value cao và có khuynh hướng khơng bác bỏ giả thuyết H0 (β = 0). Do đó, nhiều biến trong mơ hình khơng có ý nghĩa thống kê một cách sai lệch.

Có nhiều cách để kiểm tra mơ hình có bị hiện tượng đa cộng tuyến hay khơng, trong phần này tác giá chỉ trình bày một phương pháp thơng dụng là sử dụng hệ số phóng đại phương sai (Variance Inflation Factor -VIF). VIF được tính như sau:

𝑉𝐼𝐹 = 1

1−𝑟232 (3.19)

VIF cho thấy khi tồn tại đa cộng tuyến thì phương sai của một hàm ước lượng sẽ tăng như thế nào. Khi 𝑟232 =1 thì VIF → ∞, nếu khơng có đa cộng tuyến 𝑟232 =0 thì VIF=1.

Var(𝛽̂) = 2 𝜎2

∑ 𝑋2𝑖2(1−𝑟232 ) = 𝜎2

∑ 𝑋2𝑖2 . VIF (3.20)

Công thức (3.20) cho thấy phương sai của 𝛽̂2 tỷ lệ với hệ số VIF. Nghĩa là VIF càng tăng thì phương sai 𝛽̂2 càng tăng và ngược lại. Thường hệ số VIF vượt q 10

thì có thể kết luận tồn tại hiện tượng đa cộng tuyến trong mơ hình.

Phương sai sai số thay đổi

Phương sai sai số thay đổi được hiểu là phương sai có điều kiện của Yi (bằng với phương sai của ui) thay đổi khi các biến độc lập X thay đổi, ký hiệu là E(ui)=𝜎𝑖2 và được tính theo cơng thức sau:

Var(𝛽̂) =2 ∑ 𝑋𝑖2𝜎𝑖2

(∑ 𝑋𝑖2)2 (3.21)

Hiện tượng phương sai sai số thay đổi được minh họa bằng đồ thị như sau:

Hình 3.2. Đồ thị minh họa cho phương sai sai số thay đổi

Phương sai sai số thay đổi vi phạm giả thuyết của mơ hình hồi quy tuyến tính cổ điển, mặc dù nó khơng làm mất đi tính chất khơng thiên lệch và nhất quán của các ước lượng OLS nhưng các ước lượng này khơng cịn là các ước lượng tuyến tính khơng thiên lệch tốt nhất (BLUE), khơng được tính từ các cơng thức OLS thông thường. Do vậy, các kiểm định t và F dựa vào chúng có thể dẫn đến những kết luận sai lầm. Để phát hiện hiện tượng phương sai sai số thay đổi trong mơ hình hồi quy, có thể sử dụng các kiểm định khác nhau, tuy nhiên trong phạm vi nghiên cứu tác giả chỉ sử dụng kiểm định Breusch - Pagan (BP test).

Nội sinh

Xét mơ hình hồi quy sau: 𝑌𝑖 = 𝛽0+ 𝛽1𝑋1𝑖 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + … + 𝛽𝑘𝑋𝑘𝑖+ 𝑢𝑖

(3.21), vấn đề nội sinh xảy ra trong mơ hình (3.21) khi phần dư 𝑢𝑖 của mơ hình có tương quan với một hoặc một số biến độc lập X. Nguyên nhân có thể là do bỏ sót biến quan trọng hoặc sai số trong đo lường hoặc do tác động đồng thời, tức là Y và X giải thích cho nhau. Khi tồn tại vấn đề nội sinh trong mơ hình thì đồng nghĩa với việc đã vi phạm giả thuyết của mơ hình tuyến tính cổ điển đưa đến hậu quả là kết quả của các ước lượng bị thiên lệch. Nội sinh là khuyết tật nghiêm trọng nhất mà mơ hình hồi quy gặp phải, vì vậy cần phải kiểm tra vấn đề này để đảm bảo kết quả ước lượng là không bị thiên lệch, bằng cách sử dụng Hansen test, Sargan test hoặc F test (cho mơ hình hồi quy phần dư ui theo các biến độc lập X). Nếu tồn tại vấn đề nội sinh thì cần phải giải quyết bằng những phương pháp như hồi quy biến công cụ (IV regresstion) hoặc hồi quy hai giai đoạn (Two Stage Least of Square-2SLS) hoặc phương pháp ước lượng GMM (Generalized Method of Moments).

Kết quả kiểm định khuyết tật

Thảo luận kết quả nghiên cứu