Phương pháp mô hình số liệu mảng

Một phần của tài liệu (Luận án tiến sĩ) sử dụng phương pháp mô hình hóa đánh giá tác động của chính sách giảm nghèo đến hộ gia đình người dân tộc thiểu số (Trang 86 - 88)

liệu sử dụng; 3.3. Mô hình đánh giá và cuối cùng là tóm tắt Chương.

3.1. Phương pháp mô hình số liệu mảng

- Dữ liệu mảng (panel Data)

Dữ liệu mảng còn có cách gọi khác là giữ liệu bảng, hay giữ liệu kết hợp các quan sát theo chuỗi thời gian và không gian (Jeffrey M.Wooldridge, 2012). Như vậy dữ liệu mảng có thông tin về một tập hợp các đối tượng nghiên cứu khá đa dạng và phong phú. Vì vậy cho phép thực hiện các phân tích mang tính động về các mối quan hệ kinh tế (Baltagi,2008).

Về tính ưu việt của số liệu mảng, do chứa đựng thông tin hai chiều về các đối tượng nghiên cứu nên số liệu mảng ưu việt hơn so với các dạng số liệu khác. Một là, các mô hình kinh tế lượng với số liệu mảng có thể giải quyết một cách hiệu quả vấn đề biến nội sinh trong trường hợp thiếu những thông tin về đặc điểm của cá thể nếu những đặc điểm này không thay đổi theo thời gian, do đó đảm bảo được độ tin cậy của kết quả ước lượng thu được (Wooldridge, 2015). Hai là, các mô hình với số liệu mảng giúp đảm bảo kích thước mẫu, làm tăng số bậc tự do, do đó chất lượng ước lượng sẽ đảm bảo hơn về mặt bản chất thống kê. Cuối cùng, việc sử dụng số liệu mảng cũng giúp làm giảm nhẹ vấn đề đa cộng tuyến trong các bài toán có trễ phân phối và làm tăng độ chính xác của các suy diễn thống kê”

Việc sử dụng dữ liệu mảng để xem xét sự khác biệt mang tính đặc thù của từng cá thể và phân tích, nghiên cứu động thái thay đổi của các cá thể theo chuỗi thời gian là khá phù hợp. Dữ liệu mảng có thể phát hiện và đo lường tốt hơn những ảnh hưởng mà không thể quan sát trong dữ liệu chuỗi thời gian hay dữ liệu chéo theo

không gian thuần túy (Thu Hương, 2017).

Mô hình số liệu mảng với các yếu tố không quan sát được có dạng như sau: it = 0 +

1 1it + 2 2it + ⋯+

k kit + i + it

Trong đó, , lần lượt là các chỉ số theo đơn vị chéo và thời gian; it là biến phụ thuộc, 1it, 2it,…, kit là các biến độc lập; i

đại diện cho sự khác biệt giữa các cá thể không thay đổi theo thời gian; cuối cùng, it là sai số ngẫu nhiên.

Về lý thuyết, có ba mô hình cơ bản với các phương pháp ước lượng khác nhau được đề xuất tùy thuộc vào bản chất của i trong mô hình:

(1) Mô hình gộp (POLS) được sử dụng khi có căn cứ để cho rằng không có sự khác biệt về đặc điểm riêng i giữa các cá thể trên bộ số liệu. Khi đó, phương pháp OLS là phương pháp thích hợp nhất để ước lượng.

(2) Mô hình tác động ngẫu nhiên (RE) được sử dụng trong trường hợp là tồn tại nhưng không tương quan với các biến giải thích, do đó mô hình không có hiện tượng nội sinh. Tuy nhiên, trường hợp này sẽ dẫn đến hiện tượng tự tương quan do i được gộp vào sai số ngẫu nhiên. Tư tưởng chính của phương pháp ước lượng mô hình RE là giải quyết vấn đề tự tương quan trong phần dư tổng hợp it = i + it (Baltagi, 2008).

(3) Mô hình tác động cố định (FE) thích hợp khi tồn tại và có tương quan với ít nhất một biến giải thích trong mô hình. Tư tưởng chính của phương pháp ước lượng với mô hình FE là tìm cách xử lý vấn đề nội sinh bị gây ra bởi sự tương quan giữa i và

k để đạt được ước lượng không chệch và tốt nhất (Baltagi, 2008).

- Lựa chọn mô hình và các kiểm định

Thủ tục lựa chọn mô hình phù hợp với số liệu mảng được thực hiện bằng việc sử dụng kiểm định nhân tử Lagrange để kiểm định có hay không sự tồn tại của i. Nếu giả thuyết 0 về không tồn tại của i bị bác bỏ thì sẽ có chứng cứ để khẳng định mô hình FE hoặc RE là phù hợp.

Tiếp theo, kiểm định Hausman sẽ được sử dụng để làm căn cứ lựa chọn mô hình FE hay RE. Ý tưởng của kiểm định Hausman là dựa trên sự khác biệt giữa các hệ số ước lượng bởi hai phương pháp: nếu i có tương quan với biến giải thích thì kết quả ước lượng từ mô hình FE và RE sẽ khác nhau, khi đó mô hình FE là phù hợp. Cuối cùng cũng giống như các mô hình khác, trước khi được đưa vào phân tích cũng cần được kiểm định và khắc phục những khuyết tật của mô hình…

- Mô hình số liệu mảng với biến phụ thuộc là biến nhị phân (mô hình logit mảng):

Mô hình logit với số liệu mảng có dạng tổng quát như sau:

Trong đó, là biến giả nhị phân,

, … , là hệ số của các biến độc lập tương ứng. Tuyến tính hóa mô hình (1) ta được:

ln

Trong mô hình (2), đổi theo thời gian và không quan sát được có thể có ảnh hưởng lên biến phụ thuộc. Hệ

số của thể hiện tác động của biến lên giá trị của ln , trong đó giá trị của

ln càng lớn ngụ ý rằng tỷ số cũng càng lớn. Trong mô hình (2), tỷ số

cho biết khả năng xảy ra sự kiện = 1 (hộ có trẻ trong độ tuổi không được đi học) bằng bao nhiêu lần so với trường hợp ngược lại. Giá trị của odds nhỏ hơn 1 ngụ ý rằng xác suất để = 1 xảy ra nhỏ hơn so với xác xuất = 0 xảy ra.

Mô hình logit mảng được sử dụng trong các trường hợp biến phụ thuộc là biến giả nhị phân. Khi ước lượng mô hình logit (2) với số liệu mảng, kiểm định Hausman sẽ được sử dụng để lựa chọn giữa mô hình tác động cố định (FE) với mô hình tác động ngẫu nhiên (RE) tương tự như các mô hình số liệu mảng thông thường.

Một phần của tài liệu (Luận án tiến sĩ) sử dụng phương pháp mô hình hóa đánh giá tác động của chính sách giảm nghèo đến hộ gia đình người dân tộc thiểu số (Trang 86 - 88)

Tải bản đầy đủ (DOCX)

(153 trang)
w