Xử lý số liệu

Một phần của tài liệu 9789290619727-vie (Trang 28 - 30)

CHƯƠNG 2 PHƯƠNG PHÁP NGHIÊN CỨU

2.5. Xử lý số liệu

Quá trình nhập dữ liệu được thực hiện bằng thiết bị quét, sau đó chuyển thành khung dữ liệu thông qua phần mềm Stata. Các dữ liệu bị thiếu (missing) không được đưa vào phân tích. Dữ liệu thu thập từ 81 trường được làm sạch và chỉnh sửa nhằm đảm bảo thống nhất dựa theo tài liệu hướng dẫn dành cho người dùng dữ liệu, được công bố trên trang web của CDC.

Yếu tố trọng số được áp dụng cho mỗi bản ghi của học sinh để phản ánh khả năng được chọn vào mẫu nghiên cứu của từng học sinh và giảm thiểu tính sai lệch, thông qua hiệu chỉnh cho yếu tố không trả lời. Trọng số dùng trong ước lượng được tính bằng công thức: W = W1 * W2 * W3 * f1 * f2 * f3 trong đó:

• W1 là nghịch đảo xác suất lựa chọn tỉnh • W2 là nghịch đảo xác suất lựa chọn trường

• W3 là nghịch đảo xác suất lựa chọn lớp trong từng trường

• F1 là hệ số không đáp ứng hiệu chỉnh cấp trường, được tính theo trường.

• F2 là hệ số không đáp ứng hiệu chỉnh cấp học sinh, được tính theo bảng phân loại kích thước lớp học. Hệ số này được tính dựa theo số lượng lớp tham gia thay vì tổng số lượng lớp.

• F3 là hệ số sau phân tầng hiệu chỉnh được tính toán theo khu vực nông thôn/thành thị và khối lớp. Số liệu và phương thức tính trọng số đã được gửi đến các chuyên gia WHO và CDC để xin ý kiến tư vấn. Do không có học sinh nào trong lớp từ chối trả lời, nên thống nhất bỏ qua hệ số mức độ không đáp ứng hiệu chỉnh cấp học sinh.

Phần mềm Stata đã được sử dụng để tính toán ước tính tỷ lệ hiện hành và khoảng tin cậy 95%, và khi phân tích đã tính tới các yếu tố thiết kế mẫu phức hợp (tầng, cụm và quyền số). Dữ liệu GSHS 2019 có tính đại diện cho tất cả học sinh trong độ tuổi 13-17 thuộc khối 8 đến khối 12 thuộc 4 phân tầng nói riêng và ở Việt Nam nói chung.

Một phần của tài liệu 9789290619727-vie (Trang 28 - 30)

Tải bản đầy đủ (PDF)

(123 trang)