Nguồn: Nguyễn Xuân Thành (2006): “Phân tích tác động của chính sách cơng: Phương
pháp ước lượng khác biệt trong khác biệt ”
Một giả định tối quan trọng của phương pháp này là nếu như khơng có chính sách cơng thì theo thời gian thay đổi thu nhập của hai nhóm xử lý và kiểm sốt sẽ là
Kết quả (Y) Y1[D=1]
Ước lượng DID
Y0[D=1] Y1[D=0] Y0[D=0] Thời gian (T) T=0 T=1
như nhau. Như vậy theo thời gian kết quả của nhóm kiểm sốt thay đổi từ Y0[D = 0]
thành Y1[D = 0]. Phương trình Y1[D = 0] –Y0[D = 0] có thể coi là thay đổi theo thời gian (do nhóm kiểm sốt khơng hề chịu chi phối của chính sách cơng). Cũng với giả định trên, thay đổi thu nhập theo thời gian của nhóm xử lý là: Y1[D = 0] –Y0[D = 0]
Nói một cách khác, nếu khơng có chính sách cơng thì thu nhập của nhóm xử lý vào thời điểm T = 1 sẽ là: Y0[D = 1] + (Y1[D = 0] –Y0[D = 0])
Vì có chính sách cơng nên thu nhập của nhóm xử lý vào thời điểm T = 1 trên thực tế là: Y1[D = 1]
Tác động của chính sách cơng là:
Y1[D = 1] – {Y0[D = 1] + (Y1[D = 0] –Y0[D = 0])} ={Y1[D –Y0[D = 1]} – {Y1[D = 0] –Y0[D = 0]}
Bảng 2.1 Tóm tắt ước lượng DID
T = 0 T = 1 Khác biệt
Nhóm kiểm sốt Y0[D = 0] Y1[D = 0] Y1[D = 0] –Y0[D = 0]
Nhóm xử lý Y0[D = 1] Y1[D = 1] Y1[D = 1] –Y0[D = 1]
Khác biệt trong khác biệt {Y1[D –Y0[D = 1]} – {Y1[D = 0] –Y0[D = 0]}
Kết hợp phương pháp khác biệt trong khác biệt với hồi quy OLS
Ta có thể có được ước lượng DID bằng cách chạy hồi quy OLS sau đây:
Y = β0 + β1D + β2T + β3(D*T) + ε
trong đó:
D là biến giả về nhóm xử lý/kiểm sốt với D = 1 là nhóm xử lý và D = 0 là nhóm kiểm sốt.
T là biến giả về thời gian với T = 1 là thời điểm sau khi thi hành chính sách và T = 0 là thời điểm trước khi thi hành chính sách.
D*T là biến tương tác của hai biến giả D và T.
Đối với nhóm kiểm sốt trước khi thi hành chính sách: ta có D = 0 và T = 0 E[Y0[D = 0]] = β0 Đối với nhóm xử lý trước khi thi hành chính sách:
ta có D = 1 và T = 0 E[Y0[D = 1]] = β0 + β1 Đối với nhóm kiểm sốt sau khi thi hành chính sách:
ta có D = 0 và T = 1. E[Y1[D = 0]] = β0 + β2 Đối với nhóm xử lý sau khi thi hành chính sách:
ta có D = 1 và T = 1E[Y1[D = 1]] = β0 + β1 + β2 + β3 Khác biệt trong khác biệt (DID):
= {E[Y1[D = 1]] – E[Y0[D = 1]]} – {E[Y1[D = 0]] – E[Y0[D = 0]]} = [( β0 + β1 + β2 + β3) – ( β0 + β1)] – [( β0 + β2) – ( β0)]= β3
Sau khi chạy hồi quy, ta sẽ có ước lượng tác động của chính sách công theo phương pháp khác biệt trong khác biệt là: β^3
Ta biết rằng, biến kết quả Y cịn có thể chịu tác động của nhiều yếu tố khác, ngoài tác động của yếu tố chính sách và thời gian. Vì vậy, có thể hữu ích nếu các biến giải thích Xi (ví như đặc điểm cá nhân và địa lý) được đưa vào mơ hình hồi quy.
Y = β0 + β1D + β2T + β3(D*T) + X’γ + ε
β^
3 vẫn là ước lượng khác biệt trong khác biệt.
3. Các phương pháp áp dụng trong nghiên cứu
3.1 Phương pháp thống kê mô tả
Trước khi tiến hành bất cứ một phương pháp tính tốn nào phức tạp hơn để tìm ra nguyên nhân sâu xa của vấn đề thì phương pháp thống kê mơ tả – dù đơn giản
– nhưng lại rất cần thiết đối với bất kỳ một nghiên cứu nào. Và ở nghiên cứu này, đó cũng khơng phải là ngoại lệ.
Việc áp dụng các kỹ thuật phân tích thống kê mơ tả, dựa trên các số liệu của cuộc điều tra sẽ giúp người đọc hình dung sự khác biệt về trạng thái kinh tế - xã hội giữa các hộ gia đình theo các tiêu chí mà nghiên cứu này hướng tới. Bên cạnh đó, để biết các con số có ý nghĩa về mặt thống kê hay khơng, tác giả áp dụng các kiểu kiểm định so sánh t-test, Anova, v.v.
Phần mềm hỗ trợ được sử dụng là phầm mềm SPSS 16 và phần mềm Eview 4. Phần mềm SPSS16 được sử dụng khi tính tốn và chạy một vài kiểm định thống kê và phần mềm Eview được dùng khi chạy mơ hình hồi quy.
3.2Phương pháp ước lượng khác biệt trong khác biệt
Để so sánh tốc độ tăng thu nhập trong các hộ có và khơng sử dụng điện đối với mức thu nhập bình quân đầu người, tác giả sử dụng các biến số độc lập để ước lượng mức độ ảnh hưởng của các biến số đó đối với biến phụ thuộc là biến Logarit
(thu nhập bình quân đầu người).
Để ước lượng sự khác biệt về mặt thu nhập giữa các hộ có và khơng sử dụng điện cũng như xét sự thay đổi về thu nhập giữa 02 nhóm hộ gia đình tác giả sử dụng phương pháp ước lượng khác biệt trong khác biệt (DID).
Giả định của phép hồi quy
Một giả định không thể thiếu được khi sử dụng mơ hình sẽ là : Nếu khơng có điện thì tốc độ tăng thu nhập của nhóm xử lý và nhóm kiểm sốt sẽ cùng có xu thế vận động theo thời gian. Điều này là có thể đúng hay khơng đúng trong thực tế nhưng chỉ khi nào giả định này đúng thì phương pháp này mới áp dụng được. Tuy nhiên có thể thấy, giả định này phù hợp với tình hình thực tế của địa bàn nghiên cứu bởi các hộ gia đình được chọn một cách ngẫu nhiên.
Quá trình ước lượng được thực hiện lần lượt theo 05 bước chính sau đây:
- Nhóm kiểm sốt: Những hộ gia đình khơng có điện năm 2002 và khơng có điện
năm 2005.
- Nhóm xử lý: Những hộ gia đình khơng có điện năm 2002 và có điện năm 2005.
Bước 2
- Tạo biến giả theo nhóm hộ cần phân tích
Như đã miêu tả ở trên, khơng thể coi tác động của chính sách cơng là khác biệt về kết quả sau khi thi hành chính sách giữa nhóm kiểm sốt và nhóm xử lý. Lý do là vì hai nhóm có thể khác nhau về một số đặc điểm cơ sở (ví dụ trình độ học vấn hay
giới tính của chủ hộ v.v.). Thực tế có những chính sách có tác động nâng cao thu
nhập nhưng vì trước khi thi hành chính sách, bản thân nhóm khơng chịu tác động đã có thu nhập cao hơn nhóm chịu tác động hoặc ngược lại. Do đó trong bước này, tơi sẽ lập nhóm biến giả để xác định sự khác nhau giữa hai nhóm hộ theo theo tiêu chí đã nêu trên.
Ở đây tơi quan tâm đến có 02 nhóm đối tượng như đã kể trên, do đó sẽ có 01 biến giả để tránh hiện tượng bẫy biến giả, gây ra hiện tượng đa cộng tuyến hoàn hảo.
D = 0 nếu thuộc nhóm 1 hay cịn gọi là nhóm kiểm sốt; D = 1 nếu là nhóm 2 hay cịn gọi là nhóm xử lý.
- Tạo biến giả theo thời gian
Ta cũng không thể coi tác động của việc sử dụng điện là khác biệt trước/sau khi có điện của nhóm xử lý vì sự so sánh như vậy sẽ bị thiên lệch bởi sự biến động theo thời gian. Trên thực tế, có nhiều chính sách khơng hề có tác động gì tới thu nhập nhưng theo xu thế của thời gian thì thu nhập vẫn tăng lên. Do đó cần xây dựng thêm biến giả xác định sự thay đổi theo thời gian.
T = 0 nếu thời gian khảo sát là năm 2002; T = 1 nếu thời gian khảo sát là năm 2005.
Bước 3: Chạy hàm hồi quy với biến giả T và D
Trong nghiên cứu này, tơi sử dụng thu nhập bình quân đầu người của hộ trong hai năm 2002 và 2005 như là chỉ tiêu cần đánh giá. Các biến giải thích sẽ được mơ tả kỹ hơn ở phần tiếp theo. Dạng hàm bán logarit (semi-log) dùng để đánh giá sự thay
đổi của biến phụ thuộc Y (tính bằng %) khi các biến độc lập thay đổi (tính theo đơn vị thực) : LN(Y) = β0+ β1*T + β2*D + β3(T*D) + ε Nhóm phân tích 2002 2005 Nhóm kiểm soát T =0; D = 0 T =1; D = 0 Nhóm xử lý T =0; D =1 T =1; D = 1 Thay số ta có:
E[Y00 ] = β0 (thu nhập kỳ vọng của nhóm kiểm soát tại T=0) E[Y01 ] = β0+ β1 (thu nhập kỳ vọng của nhóm kiểm sốt tại T=1) E[Y10 ] = β0+ β2 (thu nhập kỳ vọng của nhóm xử lý tại T=0) E[Y11 ] = β0+ β1 +β2 +β3 (thu nhập kỳ vọng của nhóm xử lý tại T=1)
2002 2005 Tác động theo thời gian Kết quả
Y00 Y01 Y01-Y00 = E1 E1= β1
Y10 Y11 Y11- Y10 = E2 E2= β1+ β3
Tác động khác biệt trong khác biệt(Hệ số độ dốc không đổi nhưng tung độ gốc thay đổi giữa nhóm xử lý và nhóm kiểm sốt) - Khác biệt do tình trạng có hay khơng sử dụng điện giữa các nhóm sau khi đã loại trừ sự thay đổi trong thu nhập do yếu tố thời gian.
Khác biệt của nhóm 1 và nhóm 2: E2 - E1 = β3
Bước 4: Thêm biến vào trong mơ hình
Do biến phụ thuộc (thu nhập bình qn đầu người) cịn có thể bị ảnh hưởng của hàng loạt các nhân tố thuộc về đặc điểm của hộ như quy mô hộ, thành phần dân tộc, trình độ học vấn chủ hộ (hay vợ chồng chủ hộ), nghề nghiệp chủ hộ, loại nhà, sở hữu một số đồ dùng v.v hay các nhân tố khách quan như vị trí địa lý, các vấn đề thuộc lĩnh vực hạ tầng xã hội, cơ cấu nghề nghiệp trong vùng v.v. Do đó trong bước này, tơi sẽ đưa vào mơ hình hồi quy các biến số như đã kể trên. Tiếp theo, bằng các phép hồi quy và kiểm định trong thống kê, tôi sẽ chọn ra một mơ hình ước lượng tốt nhất gồm các biến giải thích có ý nghĩa nhất cho mơ hình .
Mơ hình hồi quy cuối cùng sẽ có dạng
LN(Y) =β0+ β1*t + β2*D + β3*t*D + β4*X1+ β5*X2+v.v...+ βn*Xi+ ε trong đó:
- LN(Y):logarit thu nhập bình qn đầu người/năm; - 0 … n là các hệ số hồi quy của mơ hình;
- Xi là các biến độc lập (các nhân tố ảnh hưởng đến thu nhập bình quân); - D và T là các biến giả của mơ hình như đã nêu trên;
- Sự khác biệt trong khác biệt (về mặt thu nhập) của nhóm kiểm sốt và nhóm xử lý sau khi đã tách tác động của các yếu tố khác vẫn là β3;
- ε: sai số của mơ hình.
Ý nghĩa của các hệ số hồi quy
Các hệ số hồi quyi cho biết sự thay đổi tương đối của Y đối với sự thay đổi tuyệt đối của biến Xi. Trong điều kiện các nhân tố khác không đổi, khi biến Xi tăng/giảm một đơn vị thì biến Y tăng/giảm tương ứng ix100 (%) (Áp dụng cho trường hợp X là các biến thực).
Đối với các biến Dummy, tính tác động của các biến này đến biến phụ thuộc bằng cách: Tính anti-log của các hệ số (β) tương ứng sau đó trừ đi 1.{EXP (β) -1}6
Các biến số được lựa chọn để đưa vào mơ hình hồi quy mở rộng
Sau khi tìm hiểu bộ dữ liệu cũng như quá trình lược khảo các tài liệu tham khảo như trên, tôi đã lựa chọn một số biến độc lập thể hiện các đặc điểm của hộ gia đình vào mơ hình phân tích. Mơ hìnhđược xây dựng với các biến sau:
Ký hiệu Mô tả biến số Đơn vị Dấu kỳ
vọng
Log (Y) Logarit của biến thu nhập bình quân Biến phụ thuộc
Ký hiệu Mô tả biến số Đơn vị Dấu kỳ
vọng
C Hằng số tung độ gốc. (+)
T Biến dummy, nhận giá trị 1 nếu là năm 2005 và 0 nếu là năm 2002.
(+)
D
Biến dummy, nhận giá trị bằng 1 nếu thuộc nhóm xử lý, bằng 0 nếu thuộc nhóm kiểm sốt.
(+)
T*D
Biến tương tác của biến T và D. Hệ số
ước lượng của biến tương tác này chính
là khác biệt trong khác biệt về thu nhập bình quân đầu người giữa hai nhóm xử lý và kiểm soát.
(+)
MIENBAC
Biến dummy, nhận giá trị 1 nếu thuộc các tỉnh phía bắc, nhận giá trị 0 nếu thuộc các tỉnh khác.
(+)
MIENNAM
Biến dummy, nhận giá trị 1 nếu thuộc các tỉnh phía nam, nhận giá trị 0 nếu thuộc các tỉnh khác.
(+)
PHI_NONGNGHIEP
Biến dummy, nhận giá trị 1 nếu hộ gia
đình có tham gia sản xuất phi nông
nghiệp, nhận giá trị 0 nếu chỉ làm nông nghiệp.
(+)
GIOITINH CHU HO Biến dummy, nhận giá trị 1 nếu chủ hộ là nữ và nhận giá trị 0 nếu chủ hộ là nam.
(-)
DANTOC
Biến dummy, nhận giá trị 1 nếu hộ gia
đình thuộc dân tộc Kinh hoặc dân tộc
Hoa, nhận giá trị 0 cho các dân tộc khác.
Ký hiệu Mô tả biến số Đơn vị Dấu kỳ
vọng
DAT_SANXUAT Tổng diện tích đất dùng cho sản xuất hoặc canh tác.
1000m2 (+)
HOC VAN CHU HO
Trình độ học vấn của chủ hộ, tính bằng
số lớp học phổ thơng đã hồn tất. Nếu chủ hộ nào tốt nghiệp trung cấp, cao
đẳng và đại học thì số năm đi học sẽ
bằng số năm phổ thông cộng với số năm học trung cấp hay cao đẳng đại học.
Năm (+)
LOAI NHA
Biến dummy, nhận giá trị 1 nếu hộ có nhà kiên cố hay bán kiên cố và nhận giá trị 0 nếu hộ gia đình có nhà tạm.
(+)
DTICH_NHA Tổng diện tích nhà ở hiện tại. m2 (+)
NGUOIPHUTHUOC
Số người không tạo ra thu nhập trong gia
đình (trẻ dưới 15 tuổi và số người hết
tuổi lao động nhưng không nhận được tiền lương, người tàn tật v.v.)
Người (-)
QUYMOHO Tổng số người trong hộ. Người (-)
THUOCXA_DU AN
Biến dummy, nhận giá trị bằng 1 nếu thuộc xã có điện, bằng 0 nếu hộ gia đình thuộc xã khơng có điện.
(+)
OM_DAU Tổng số ngày nghỉ ốm của các thành
viên trong gia đình trong tháng qua.
Ngày (+)
XEMAY
Biến dummy, nhận giá trị bằng 1 nếu hộ có ít nhất 01 xe máy và bằng 0 nếu hộ
gia đình khơng có chiếc xe máy nào.
(+)
Ký hiệu Mô tả biến số Đơn vị Dấu kỳ
vọng
có ít nhất 01 TV và bằng 0 nếu hộ gia
đình khơng có chiếc TV nào.
Trên đây là các biến số dự định sẽ được đưa vào mơ hình hồi quy. Tuy nhiên tuỳ vào kết quả chạy mơ hình hồi quy mà các biến có thể được thêm vào hay bỏ bớt ra cho phù hợp.
Bước 5: Giải thích các số liệu và lý giải ngun nhân
Sau khi có kết quả mơ hình, để kiểm tra xem mơ hình có phù hợp khơng, một số phương pháp kiểm định mơ hình kinh tế lượng sẽ áp dụng (kiểm định F-test, T- test, R, R2, Durbin-Watson, v.v).
CHƯƠNG 3
KẾT QUẢ NGHIÊN CỨU
1. Mẫu nghiên cứu
1.1 Cách thức chọn mẫu và cơ cấu mẫu
Nghiên cứu này dựa trên số liệu điều tra thu thập tại 07 tỉnh thực hiện dự án Điện khí hóa nơng thơn là Hà Giang, Lai Châu, Hịa Bình, Quảng Bình, Quảng Nam, Đắc Lắk và Sóc Trăng. Mỗi tỉnh có 6 xã được chọn. Tổng cộng có 42 xã thuộc 07 tỉnh với 1.260 hộ được chọn vào nghiên cứu theo phương pháp chọn mẫu ngẫu nhiên với tỷ lệ 61% là dân tộc thiểu số thuộc 28 dân tộc.
Tuy nhiên với mục đích riêng như đã được trình bày ở chương 2, trong nghiên cứu của mình, tơi chỉ chọn 676 hộ gia đình và số hộ này được chia làm hai nhóm: Nhóm xử lý – nhóm hộ khơng có điện năm 2002 và có điện năm 2005 (gồm 517 hộ gia đình) và nhóm kiểm sốt – nhóm hộ khơng có điện năm 2002 và khơng có điện năm 2005 (gồm 159 hộ gia đình). Như vậy, nếu thông tin của mỗi hộ được thu thập trong ở hai năm 2002 và 2005 thì mẫu sẽ được nhân đôi lên thành 676*2 =1352 mẫu.
1.2 Đơn vị nghiên cứu
Các hộ gia đình được lựa chọn trong mẫu nghiên cứu kể trên.
1.3 Đơn vị thu thập thông tin
Đơn vị thu thập thông tin sẽ là các chủ hộ. Trong trường hợp chủ hộ khơng có mặt, vợ hoặc chồng của chủ hộ sẽ là người được lựa chọn để trả lời các câu hỏi trong phiếu điều tra.
Với cơ cấu chọn mẫu như trên sẽ đảm bảo sự đa dạng, có tính đại diện cao của mẫu nghiên cứu. Phần tiếp theo tôi sẽ đi sâu hơn về bảng câu hỏi và mơ tả những đặc tính chung nhất của mẫu số liệu.
2. Bảng câu hỏi
Bảng hỏi phục vụ cho cuộc nghiên cứu Đánh giá tác động của chương trình
nhiên với nghiên cứu này, tơi quan tâm nhiều nhất đến phần thứ nhất của bảng hỏi. Trong phần này, các câu hỏi nhằm thu thập thơng tin liên quan đến tình trạng học vấn, tuổi, giới tính, nghề nghiệp, lĩnh vực việc làm, tình trạng việc làm, thu nhập từ tiền lương, tiền công, tổng thu nhập của từng thành viên trong gia đìnhv.v. Bảng hỏi được thiết kế dễ hiểu, theo mẫu chung đối với các bảng hỏi mà WB thường sử dụng