3.3.2. Phân tích số liệu
Với sự hỗ trợ công cụ của phần mềm thống kê Stata 12, tác giả tiến hành các bước xử lý dữ liệu sau đây để giải quyết mục tiêu quan trọng của nghiên cứu là xác định và ước lượng tác động của các yếu tố ảnh hưởng đến sinh trẻ nhẹ cân.
Bước 1: Mã hóa dữ liệu thu thập được, tiến hành sàn lọc, loại bỏ các quan sát bị
khiếm khuyết hoặc giá trị dị biệt để có được một mẫu nghiên cứu bao gồm các quan sát ít sai biệt với nhau.
Bước 2: Thực hiện thống kê mô tả để biết được khuynh hướng trung tâm, độ
phân tán, hình dạng… của dữ liệu thu thập được; Các biến định tính như frequency (tần suất suất hiện), percentage (phần trăm), cum.percentage (phần trăm tích lũy) của từng biến số trong mơ hình nghiên cứu. Phần thống kê mô tả cũng giúp có được cái nhìn sơ bộ về tình trạng sinh trẻ nhẹ cân trong mẫu nghiên cứu tỷ lệ trẻ nhẹ cân với độ tuổi, cân nặng, học vấn, nghề nghiệp, dân tộc sinh sống ở địa bàn khác nhau.
Bước 3: Thực hiện phân tích hồi quy Logistic và Probit đa biến. Tuy nhiên, nếu
hồi quy Logistic đối với dữ liệu chéo, muốn cho các hệ số hồi quy của ước lượng này là khơng chệch và hiệu quả thì mơ hình cần thỏa mãn một số giả định quan trọng như phần dư có phân phối logit. Dựa trên kết quả kiểm định, đưa ra kết luận cho các giả thuyết nghiên cứu cũng như mức độ ảnh hưởng của các yếu tố ảnh hưởng đến sinh trẻ nhẹ cân của người mẹ.
Thứ nhất, sử dụng ma trận hệ số tương quan và nhân tử phóng đại phương sai VIF để dự đốn khả năng mơ hình bị đa cộng tuyến (Muticollinearity). Nếu nhân tử phóng đại phương sai (Variance Inflation Fator) VIF>10 hoặc hệ số tương quan của một cặp biến nào đó > 0.8 thì ta nghi ngờ có hiện tượng đa cộng tuyến sẽ gây ảnh hưởng nghiêm trọng đến kết quả ước lượng. Để khắc phục hiện tượng đa cộng tuyến nghiêm trọng bằng biến khác hoặc bỏ biến này đi.
Thứ hai, do nghiên cứu sử dụng dữ liệu chéo, khả năng bị phương sai của phần dư thay đổi (Heteroskedasticity) có thể xảy ra. Phát hiện bằng cách kiểm định spearman hoặc kiệm định white. Khi số quan sát lớn hơn (>100) thì phải dùng
kiểm định White trong mơ hình nghiên cứu này. Để khắc phục hiện tượng phương sai của phần dư thay đổi nên ta sử dụng Robust Standard Errors để khắc phục hiện tượng này.
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU 4.1. TỔNG QUAN VỀ TÌNH TRẠNG SINH TRẺ NHẸ CÂN
Theo (Nguồn: theo MICS năm 2014), tồn quốc có 94,3% trẻ sơ sinh được cân khi sinh và có khoảng 5,7% trong số trẻ sinh ra được cân này có cân nặng dưới 2500 gram. Có sự chênh lệch rõ rệt giữa các vùng, tỷ lệ thấp nhất là 3,7% ở vùng Đồng bằng sông Cửu Long và cao nhất là 7,2% ở vùng Tây Nguyên. Nhìn chung, tỷ lệ trẻ nhẹ cân khi sinh không biến động nhiều theo độ tuổi của bà mẹ, tỷ lệ này có xu hướng giảm khi mức sống tăng lên. Tuy nhiên, tỷ lệ trẻ nhẹ cân khi sinh của nhóm bà mẹ khơng có bằng cấp hoặc có trình độ tiểu học cao hơn nhóm bà mẹ trình độ trung học cơ sở trở lên. Tỷ lệ trẻ sơ sinh theo nhóm mức sống ở nhóm nghèo nhất là 6.7% và giàu nhất là 5.1%. Tỷ lệ trẻ sơ sinh theo nhóm dân tộc Kinh/Hoa là 5.2% và dân tộc thiểu số là 8.1%. Tỷ lệ trẻ sơ sinh theo vùng, trình độ học vấn, nhóm mức sống và dân tộc trình bày trong hình 4.1, 4.2, 4.3 và 4.4.