CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP NGHIÊN CỨU
3. Các phương pháp áp dụng trong nghiên cứu
3.1. Phương pháp thống kê mô tả
Trước khi tiến hành bất cứ một phương pháp tính tốn nào phức tạp hơn để tìm ra nguyên nhân sâu xa của vấn đề thì phương pháp thống kê mô tả – dù đơn giản
– nhưng lại rất cần thiết đối với bất kỳ một nghiên cứu nào. Và ở nghiên cứu này, đó cũng khơng phải là ngoại lệ.
Việc áp dụng các kỹ thuật phân tích thống kê mô tả, dựa trên các số liệu của cuộc điều tra sẽ giúp người đọc hình dung sự khác biệt về trạng thái kinh tế - xã hội giữa các hộ gia đình theo các tiêu chí mà nghiên cứu này hướng tới. Bên cạnh đó, để biết các con số có ý nghĩa về mặt thống kê hay không, tác giả áp dụng các kiểu kiểm định so sánh t-test, Anova, v.v.
Phần mềm hỗ trợ được sử dụng là phầm mềm SPSS 16 và phần mềm Eview 4. Phần mềm SPSS16 được sử dụng khi tính tốn và chạy một vài kiểm định thống kê và phần mềm Eview được dùng khi chạy mơ hình hồi quy.
3.2Phương pháp ước lượng khác biệt trong khác biệt
Để so sánh tốc độ tăng thu nhập trong các hộ có và khơng sử dụng điện đối với mức thu nhập bình quân đầu người, tác giả sử dụng các biến số độc lập để ước lượng mức độ ảnh hưởng của các biến số đó đối với biến phụ thuộc là biến Logarit
(thu nhập bình quân đầu người).
Để ước lượng sự khác biệt về mặt thu nhập giữa các hộ có và khơng sử dụng điện cũng như xét sự thay đổi về thu nhập giữa 02 nhóm hộ gia đình tác giả sử dụng phương pháp ước lượng khác biệt trong khác biệt (DID).
Giả định của phép hồi quy
Một giả định không thể thiếu được khi sử dụng mô hình sẽ là : Nếu khơng có điện thì tốc độ tăng thu nhập của nhóm xử lý và nhóm kiểm sốt sẽ cùng có xu thế vận động theo thời gian. Điều này là có thể đúng hay không đúng trong thực tế nhưng chỉ khi nào giả định này đúng thì phương pháp này mới áp dụng được. Tuy nhiên có thể thấy, giả định này phù hợp với tình hình thực tế của địa bàn nghiên cứu bởi các hộ gia đình được chọn một cách ngẫu nhiên.
Quá trình ước lượng được thực hiện lần lượt theo 05 bước chính sau đây:
- Nhóm kiểm sốt: Những hộ gia đình khơng có điện năm 2002 và khơng có điện
năm 2005.
- Nhóm xử lý: Những hộ gia đình khơng có điện năm 2002 và có điện năm 2005.
Bước 2
- Tạo biến giả theo nhóm hộ cần phân tích
Như đã miêu tả ở trên, khơng thể coi tác động của chính sách cơng là khác biệt về kết quả sau khi thi hành chính sách giữa nhóm kiểm sốt và nhóm xử lý. Lý do là vì hai nhóm có thể khác nhau về một số đặc điểm cơ sở (ví dụ trình độ học vấn hay
giới tính của chủ hộ v.v.). Thực tế có những chính sách có tác động nâng cao thu
nhập nhưng vì trước khi thi hành chính sách, bản thân nhóm khơng chịu tác động đã có thu nhập cao hơn nhóm chịu tác động hoặc ngược lại. Do đó trong bước này, tơi sẽ lập nhóm biến giả để xác định sự khác nhau giữa hai nhóm hộ theo theo tiêu chí đã nêu trên.
Ở đây tơi quan tâm đến có 02 nhóm đối tượng như đã kể trên, do đó sẽ có 01 biến giả để tránh hiện tượng bẫy biến giả, gây ra hiện tượng đa cộng tuyến hoàn hảo.
D = 0 nếu thuộc nhóm 1 hay cịn gọi là nhóm kiểm sốt; D = 1 nếu là nhóm 2 hay cịn gọi là nhóm xử lý.
- Tạo biến giả theo thời gian
Ta cũng không thể coi tác động của việc sử dụng điện là khác biệt trước/sau khi có điện của nhóm xử lý vì sự so sánh như vậy sẽ bị thiên lệch bởi sự biến động theo thời gian. Trên thực tế, có nhiều chính sách khơng hề có tác động gì tới thu nhập nhưng theo xu thế của thời gian thì thu nhập vẫn tăng lên. Do đó cần xây dựng thêm biến giả xác định sự thay đổi theo thời gian.
T = 0 nếu thời gian khảo sát là năm 2002; T = 1 nếu thời gian khảo sát là năm 2005.
Bước 3: Chạy hàm hồi quy với biến giả T và D
Trong nghiên cứu này, tôi sử dụng thu nhập bình quân đầu người của hộ trong hai năm 2002 và 2005 như là chỉ tiêu cần đánh giá. Các biến giải thích sẽ được mơ tả kỹ hơn ở phần tiếp theo. Dạng hàm bán logarit (semi-log) dùng để đánh giá sự thay
đổi của biến phụ thuộc Y (tính bằng %) khi các biến độc lập thay đổi (tính theo đơn vị thực) : LN(Y) = β0+ β1*T + β2*D + β3(T*D) + ε Nhóm phân tích 2002 2005 Nhóm kiểm sốt T =0; D = 0 T =1; D = 0 Nhóm xử lý T =0; D =1 T =1; D = 1 Thay số ta có:
E[Y00 ] = β0 (thu nhập kỳ vọng của nhóm kiểm sốt tại T=0) E[Y01 ] = β0+ β1 (thu nhập kỳ vọng của nhóm kiểm sốt tại T=1) E[Y10 ] = β0+ β2 (thu nhập kỳ vọng của nhóm xử lý tại T=0) E[Y11 ] = β0+ β1 +β2 +β3 (thu nhập kỳ vọng của nhóm xử lý tại T=1)
2002 2005 Tác động theo thời gian Kết quả
Y00 Y01 Y01-Y00 = E1 E1= β1
Y10 Y11 Y11- Y10 = E2 E2= β1+ β3
Tác động khác biệt trong khác biệt(Hệ số độ dốc không đổi nhưng tung độ gốc thay đổi giữa nhóm xử lý và nhóm kiểm sốt) - Khác biệt do tình trạng có hay khơng sử dụng điện giữa các nhóm sau khi đã loại trừ sự thay đổi trong thu nhập do yếu tố thời gian.
Khác biệt của nhóm 1 và nhóm 2: E2 - E1 = β3
Bước 4: Thêm biến vào trong mơ hình
Do biến phụ thuộc (thu nhập bình qn đầu người) cịn có thể bị ảnh hưởng của hàng loạt các nhân tố thuộc về đặc điểm của hộ như quy mô hộ, thành phần dân tộc, trình độ học vấn chủ hộ (hay vợ chồng chủ hộ), nghề nghiệp chủ hộ, loại nhà, sở hữu một số đồ dùng v.v hay các nhân tố khách quan như vị trí địa lý, các vấn đề thuộc lĩnh vực hạ tầng xã hội, cơ cấu nghề nghiệp trong vùng v.v. Do đó trong bước này, tơi sẽ đưa vào mơ hình hồi quy các biến số như đã kể trên. Tiếp theo, bằng các phép hồi quy và kiểm định trong thống kê, tơi sẽ chọn ra một mơ hình ước lượng tốt nhất gồm các biến giải thích có ý nghĩa nhất cho mơ hình .
Mơ hình hồi quy cuối cùng sẽ có dạng
LN(Y) =β0+ β1*t + β2*D + β3*t*D + β4*X1+ β5*X2+v.v...+ βn*Xi+ ε trong đó:
- LN(Y):logarit thu nhập bình quân đầu người/năm; - 0 … n là các hệ số hồi quy của mơ hình;
- Xi là các biến độc lập (các nhân tố ảnh hưởng đến thu nhập bình quân); - D và T là các biến giả của mơ hình như đã nêu trên;
- Sự khác biệt trong khác biệt (về mặt thu nhập) của nhóm kiểm sốt và nhóm xử lý sau khi đã tách tác động của các yếu tố khác vẫn là β3;
- ε: sai số của mơ hình.
Ý nghĩa của các hệ số hồi quy
Các hệ số hồi quyi cho biết sự thay đổi tương đối của Y đối với sự thay đổi tuyệt đối của biến Xi. Trong điều kiện các nhân tố khác không đổi, khi biến Xi tăng/giảm một đơn vị thì biến Y tăng/giảm tương ứng ix100 (%) (Áp dụng cho trường hợp X là các biến thực).
Đối với các biến Dummy, tính tác động của các biến này đến biến phụ thuộc bằng cách: Tính anti-log của các hệ số (β) tương ứng sau đó trừ đi 1.{EXP (β) -1}6
Các biến số được lựa chọn để đưa vào mơ hình hồi quy mở rộng
Sau khi tìm hiểu bộ dữ liệu cũng như quá trình lược khảo các tài liệu tham khảo như trên, tôi đã lựa chọn một số biến độc lập thể hiện các đặc điểm của hộ gia đình vào mơ hình phân tích. Mơ hìnhđược xây dựng với các biến sau:
Ký hiệu Mô tả biến số Đơn vị Dấu kỳ
vọng
Log (Y) Logarit của biến thu nhập bình quân Biến phụ thuộc
Ký hiệu Mô tả biến số Đơn vị Dấu kỳ
vọng
C Hằng số tung độ gốc. (+)
T Biến dummy, nhận giá trị 1 nếu là năm 2005 và 0 nếu là năm 2002.
(+)
D
Biến dummy, nhận giá trị bằng 1 nếu thuộc nhóm xử lý, bằng 0 nếu thuộc nhóm kiểm sốt.
(+)
T*D
Biến tương tác của biến T và D. Hệ số
ước lượng của biến tương tác này chính
là khác biệt trong khác biệt về thu nhập bình qn đầu người giữa hai nhóm xử lý và kiểm soát.
(+)
MIENBAC
Biến dummy, nhận giá trị 1 nếu thuộc các tỉnh phía bắc, nhận giá trị 0 nếu thuộc các tỉnh khác.
(+)
MIENNAM
Biến dummy, nhận giá trị 1 nếu thuộc các tỉnh phía nam, nhận giá trị 0 nếu thuộc các tỉnh khác.
(+)
PHI_NONGNGHIEP
Biến dummy, nhận giá trị 1 nếu hộ gia
đình có tham gia sản xuất phi nông
nghiệp, nhận giá trị 0 nếu chỉ làm nông nghiệp.
(+)
GIOITINH CHU HO Biến dummy, nhận giá trị 1 nếu chủ hộ là nữ và nhận giá trị 0 nếu chủ hộ là nam.
(-)
DANTOC
Biến dummy, nhận giá trị 1 nếu hộ gia
đình thuộc dân tộc Kinh hoặc dân tộc
Hoa, nhận giá trị 0 cho các dân tộc khác.
Ký hiệu Mô tả biến số Đơn vị Dấu kỳ
vọng
DAT_SANXUAT Tổng diện tích đất dùng cho sản xuất hoặc canh tác.
1000m2 (+)
HOC VAN CHU HO
Trình độ học vấn của chủ hộ, tính bằng
số lớp học phổ thơng đã hồn tất. Nếu chủ hộ nào tốt nghiệp trung cấp, cao
đẳng và đại học thì số năm đi học sẽ
bằng số năm phổ thông cộng với số năm học trung cấp hay cao đẳng đại học.
Năm (+)
LOAI NHA
Biến dummy, nhận giá trị 1 nếu hộ có nhà kiên cố hay bán kiên cố và nhận giá trị 0 nếu hộ gia đình có nhà tạm.
(+)
DTICH_NHA Tổng diện tích nhà ở hiện tại. m2 (+)
NGUOIPHUTHUOC
Số người không tạo ra thu nhập trong gia
đình (trẻ dưới 15 tuổi và số người hết
tuổi lao động nhưng không nhận được tiền lương, người tàn tật v.v.)
Người (-)
QUYMOHO Tổng số người trong hộ. Người (-)
THUOCXA_DU AN
Biến dummy, nhận giá trị bằng 1 nếu thuộc xã có điện, bằng 0 nếu hộ gia đình thuộc xã khơng có điện.
(+)
OM_DAU Tổng số ngày nghỉ ốm của các thành
viên trong gia đình trong tháng qua.
Ngày (+)
XEMAY
Biến dummy, nhận giá trị bằng 1 nếu hộ có ít nhất 01 xe máy và bằng 0 nếu hộ
gia đình khơng có chiếc xe máy nào.
(+)
Ký hiệu Mơ tả biến số Đơn vị Dấu kỳ
vọng
có ít nhất 01 TV và bằng 0 nếu hộ gia
đình khơng có chiếc TV nào.
Trên đây là các biến số dự định sẽ được đưa vào mơ hình hồi quy. Tuy nhiên tuỳ vào kết quả chạy mơ hình hồi quy mà các biến có thể được thêm vào hay bỏ bớt ra cho phù hợp.
Bước 5: Giải thích các số liệu và lý giải nguyên nhân
Sau khi có kết quả mơ hình, để kiểm tra xem mơ hình có phù hợp khơng, một số phương pháp kiểm định mơ hình kinh tế lượng sẽ áp dụng (kiểm định F-test, T- test, R, R2, Durbin-Watson, v.v).
CHƯƠNG 3
KẾT QUẢ NGHIÊN CỨU
1. Mẫu nghiên cứu
1.1 Cách thức chọn mẫu và cơ cấu mẫu
Nghiên cứu này dựa trên số liệu điều tra thu thập tại 07 tỉnh thực hiện dự án Điện khí hóa nơng thơn là Hà Giang, Lai Châu, Hịa Bình, Quảng Bình, Quảng Nam, Đắc Lắk và Sóc Trăng. Mỗi tỉnh có 6 xã được chọn. Tổng cộng có 42 xã thuộc 07 tỉnh với 1.260 hộ được chọn vào nghiên cứu theo phương pháp chọn mẫu ngẫu nhiên với tỷ lệ 61% là dân tộc thiểu số thuộc 28 dân tộc.
Tuy nhiên với mục đích riêng như đã được trình bày ở chương 2, trong nghiên cứu của mình, tơi chỉ chọn 676 hộ gia đình và số hộ này được chia làm hai nhóm: Nhóm xử lý – nhóm hộ khơng có điện năm 2002 và có điện năm 2005 (gồm 517 hộ gia đình) và nhóm kiểm sốt – nhóm hộ khơng có điện năm 2002 và khơng có điện năm 2005 (gồm 159 hộ gia đình). Như vậy, nếu thơng tin của mỗi hộ được thu thập trong ở hai năm 2002 và 2005 thì mẫu sẽ được nhân đơi lên thành 676*2 =1352 mẫu.
1.2 Đơn vị nghiên cứu
Các hộ gia đình được lựa chọn trong mẫu nghiên cứu kể trên.
1.3 Đơn vị thu thập thông tin
Đơn vị thu thập thông tin sẽ là các chủ hộ. Trong trường hợp chủ hộ khơng có mặt, vợ hoặc chồng của chủ hộ sẽ là người được lựa chọn để trả lời các câu hỏi trong phiếu điều tra.
Với cơ cấu chọn mẫu như trên sẽ đảm bảo sự đa dạng, có tính đại diện cao của mẫu nghiên cứu. Phần tiếp theo tôi sẽ đi sâu hơn về bảng câu hỏi và mô tả những đặc tính chung nhất của mẫu số liệu.
2. Bảng câu hỏi
Bảng hỏi phục vụ cho cuộc nghiên cứu Đánh giá tác động của chương trình
nhiên với nghiên cứu này, tôi quan tâm nhiều nhất đến phần thứ nhất của bảng hỏi. Trong phần này, các câu hỏi nhằm thu thập thông tin liên quan đến tình trạng học vấn, tuổi, giới tính, nghề nghiệp, lĩnh vực việc làm, tình trạng việc làm, thu nhập từ tiền lương, tiền công, tổng thu nhập của từng thành viên trong gia đìnhv.v. Bảng hỏi được thiết kế dễ hiểu, theo mẫu chung đối với các bảng hỏi mà WB thường sử dụng nhưng có sự điều chỉnh để phù hợp với tình hình thực tế của Việt Nam. (chi tiết bảng
hỏi xem thêm ở phần phụ lục 1).
3. Mô tả dữ liệu
Mẫu nghiên cứu gồm 676 hộ gia đình thuộc 07 tỉnh theo tiêu chí sau đây
Hình 3.1 Mơ tả mẫu nghiên cứu
Trong đó: Có 258 hộ gia đình thuộc khu vực miền Nam, chiếm tỷ lệ 38,2%; 182 hộ gia đình khu vực miền Trung, chiếm tỷ lệ 27% và 236 hộ gia đình miền Bắc, chiếm tỷ lệ 34,8%. (chi tiết xem phần phụ lục 2).
3.1 Thu nhập hộ gia đình giữa hai nhóm phân tích
Kết quả thống kê mơ tả cho thấy, thu nhập bình quân đầu người của một hộ gia đình thuộc nhóm xử lý cao hơn so với nhóm kiểm sốt trong cả hai năm 2002 và 2005. Năm 2002, nhóm xử lý có thu nhập bình qn đầu người là 3,812 triệu đồng thì con số này ở nhóm kiểm sốt chỉ là 2,451triệu đồng. Năm 2005, kết quả cũng tương tự (6,155 triệu đồng ở nhóm xử lý và 4,149 triệu đồng ở nhóm kiểm sốt).
Bảng 3.1 Thu nhập bình qn đầu người theo nhóm hộ
(ĐVT: triệu đồng)
Nhóm hộ gia đình Trung bình Độ lệch chuẩn Sai số chuẩn
Nhóm xử lý 3,812 6799.07 540.90 T h u n h ập b ìn h q u ân đ ầu n gư ờI 20 02 Nhóm kiểm sốt 2,452 4210.49 185.53 Nhóm xử lý 6,155 9008.31 721.24 T h u n h ập b ìn h q u ân đ ầu n gư ờ I 20 05 Nhóm kiểm sốt 4,149 5031.38 222.14
(Nguồn: tính tốn của tác giả dựa vào số liệu điều tra)
Để biết sự khác biệt trên liệu có ý nghĩa thống kê hay không, đề tài áp dụng kiểm định Independent Sample Test đối với hai nhóm đối tượng trên ở biến thu nhập bình quân đầu người. Kết quả cho thấy, sự khác biệt về mặt thu nhập bình quân giữa hai nhóm hộ xử lý và kiểm sốt là có ý nghĩa về mặt thống kê (sig = 0.0000 với t =3,029 (năm 2002) và sig = 0.0000 với t = 3,546 (năm 2005) ( chi tiết xem thêm phụ
lục 3.1). Tuy nhiên để biết liệu sự khác biệt này là do nguyên nhân nào và việc có điện ảnh hưởng tới mức thu nhập là bao nhiêu, trước tiên tác giả đi vào tìm hiểu các yếu tố thuộc về đặc điểm nhân khẩu của hộ gia đình trong diện được nghiên cứu.
3.2 Quy mơ hộ gia đình
Kết quả cho thấy, quy mơ hộ gia đình có sự thay đổi theo thời gian. Nếu như năm 2002, cũng gia đình đó, số nhân khẩu trung bình là 5,47 người/hộ thì vào năm 2005, con số đó giảm xuống chỉ cịn 5,37 người/hộ. Điều này có thể lý giải là theo thời gian, số người trưởng thành tách ra lập hộ mới hoặc số người già chết nhiều hơn số trẻ mới sinh ra.
Bảng 3.2 Quy mơ hộ gia đình
(Đơn vị tính: người)
Trung bình Sai số chuẩn