DỮ LIỆU VÀ MƠ TẢ THAY ĐỔI TÌNH TRẠNG KINH TẾ-XÃ HỘI, TRƯỜNG HỢP CT135
3.1.2. Xử lý dữ liệu
Trên cơ sở dữ liệu đầu kỳ, và cuối kỳ tiếp nhận từ UBDT, luận án đã tiến hành xử lý dữ liệu thiếu, ghép dữ liệu và tính tốn tạo ra các biến mới.
- Sử lý dữ liệu bị thiếu và ghép dữ liệu
Về làm sạch dữ liệu, một số quan sát bị thiếu luận án xem xét có thể loại bỏ nếu thấy không cần thiết, hoặc bổ sung theo đa số (bảng 3.1). Số quan sát còn lại sau khi làm sạch là 5249 quan sát.
Bảng 3.1. Xử lý dữ liệu bị thiếu
TT Dữ liệu bị thiếu, missing Xử lý
1 Thiếu tôn giáo chủ hộ cuối kỳ Không tơn giáo
2 Thiếu giới tính chủ hộ cuối kỳ Theo giới tính chủ hộ đâu kỳ 3 Thiếu tuổi chủ hộ cuối kỳ Chênh 5 tuổi so với đâu kỳ 4 Thiếu số năm đến trường của chủ hộ
cuối kỳ
Theo đa số, hoặc lấy theo đầu kỳ nếu có
5 Thiếu thu từ việc làm có tiền cơng Thay bằng 0
6 Loại nhà ở Thay bằng 5 (nhà tạm và nhà khác) 7 Thiếu loại hố xí Thay bằng 6 (khơng có)
8 Thiếu nguồn thắp sáng chính Thay bằng 4 (nguồn khác) 9 Thiếu nguồn nước dùng Thay bằng 14 (nguồn khác) 10 Thiếu có xếp vào hộ nghèo khơng Thay bằng không nghèo
Sau khi làm sạch dữ liệu, để tính tốn được, luận án đã ghép dữ liệu cộng đồng cho các hộ (các biến đặc trưng xã được ghép cho hộ). Khi có dữ liệu đầu kỳ và cuối kỳ, luận án đã ghép hai bộ dữ liệu thành một bộ dữ liêu để có thể sử dụng (các thủ tục trên được thực hiện trên SPSS).
Bộ dữ liệu cuối cùng có bao nhiêu quan sát (hộ). Trong đó có bao nhiêu hộ thuộc CT135 và bao nhiêu hộ không thuộc (xem phần mơ tả thống kê)
Ngồi ra để đáp ứng dữ liệu sử dụng cho các mơ hình, một số biến đã được tạo ra từ các biến của bộ dữ liệu trên (Tăng TN/khẩu trong kỳ; tăng số lao động; tăng diện tích đất sản xuất; tình trạng nghèo... )
- Dữ liệu bổ sung
Các dữ liệu về đầu tư của hợp phần CT135_II gồm: Dtht: Đầu tư về hạ tầng tính bình qn trên khẩu DTSX: Đầu tư hỗ trợ sản xuất bình quân trên khẩu
Dtnl: Đầu tư, hỗ trợ nâng cao năng lực tính bình qn trên khẩu
Được xử lý từ nguồn dữ liệu báo cáo tình hình đầu tư CT135 của UBDT.