PHƯƠNG PHÁP NGHIÊN CỨU Tháng 5/2018 Lý thuyết & thực tiễn Trương Sĩ Ánh CRO, Kantar Media Vietnam Bài 4 ● Nhập liệu Data entry/data punching ● Làm sạch dữ liệu & xử lý dữ liệu Data cleaning & data pro[.]
PHƯƠNG PHÁP NGHIÊN CỨU Lý thuyết & thực tiễn Trương Sĩ Ánh CRO, Kantar Media Vietnam Tháng 5/2018 Bài ● Nhập liệu Data entry/data punching ● Làm liệu & xử lý liệu Data cleaning & data processing ● Lập bảng phân tích kết Tabulation ● Sử dụng phần mềm phân tích liệu ● Báo cáo kết nghiên cứu NHẬP LIỆU & PHÂN TÍCH KẾT QUẢ KHẢO SÁT Xử lý sơ bảng câu hỏi (BCH) hồn tất Nhập thơng tin BCH vào máy tính Áp dụng trọng số (weight) cho kết khảo sát Các đại lượng thống kê thường dùng phân tích Sử dụng số (index) để so sánh Diễn giải kết (interpretation of results) XỬ LÝ SƠ BỘ CÁC BCH ĐÃ HOÀN TẤT (1) Tập kết, lưu giữ & bảo quản bảng câu hỏi (BCH) hoàn tất Tổng kết đúc rút kinh nghiệm ● Từ vấn viên ● Từ nhân viên kiểm soát chất lượng/giám sát viên Kiểm tra & hiệu đính BCH trước trình nhập liệu ● Các thơng tin chi tiết cần phải có BCH ● Các câu hỏi cho phép phương án trả lời ● Các câu hỏi bị bỏ trống (không ghi câu trả lời) ● Các câu hỏi phải bỏ trống lại ghi câu trả lời ● Các câu hỏi điền vào mục "Khác (ghi rõ)" XỬ LÝ SƠ BỘ CÁC BCH ĐÃ HỒN TẤT (2) Kiểm tra & hiệu đính BCH trước trình nhập liệu (tiếp theo) Bổ sung mã số cho câu trả lời mục "Khác (ghi rõ)" tần suất xảy có ý nghĩa mặt thống kê Ví dụ: Anh/chị sử dụng ĐTDĐ nhãn hiệu nào? Nokia Samsung … LG Iphone Sky Khác (ghi rõ) Nếu số người trả lời sử dụng ĐTDĐ nhãn hiệu Sky chiếm tỷ lệ đáng kể tổng số câu trả lời (ví dụ 1,5%), cần cung cấp riêng mã số cho nhãn hiệu ĐTDĐ này, ví dụ mã số XỬ LÝ SƠ BỘ CÁC BCH ĐÃ HỒN TẤT (3) Kiểm tra & hiệu đính BCH trước trình nhập liệu (tiếp theo) Gán mã số (nhất quán) cho câu trả lời câu hỏi mở Ví dụ: Anh/chị vui lịng kể tên website Anh/chị truy cập thường xuyên nhất? Website vnexpress.net youtube.com Website 15 tuoitre.vn Website 12 mp3.zing.vn Website 37 không nhớ tên Website 999 Mỗi website khác cần thống gán mã số khác Những website có tần suất trả lời thấp (ví dụ 5%), khơng thể nhận dạng được, gán mã số chung 99 hay 999 (đại diện cho “Các website khác”) Cơng việc thực với hỗ trợ máy tính (sau nhập liệu hồn tất) NHẬP THƠNG TIN VÀO MÁY TÍNH Sử dụng ứng dụng Spreadsheet MS Excel Sử dụng phần mềm thống kê SPSS, STATA, SAS v.v Sử dụng phần mềm chuyên dụng CSPro, Epidata, SPSS Dataentry, SurveyCraft, v.v Phát triển chương trình nhập liệu riêng cho dự án nghiên cứu Phần mềm nhập liệu có ý nghĩa quan trọng việc kiểm tra hiệu đính liệu đáp ứng tốt điều kiện: ● Kiểm soát logic liệu kháo sát ● Kiểm soát logic q trình nhập liệu ● Ước lượng thơng tin cho trường hợp có câu trả lời bị bỏ sót, câu trả lời bị bỏ trống đáp viên từ chối trả lời (data imputation) ● Kiểm tra & đánh giá chất lượng nhập liệu Tải phần mềm miễn phí CSPro đây: https://www.census.gov/data/software/cspro.html LÀM SẠCH DỮ LIỆU & XỬ LÝ DỮ LIỆU (1) Chỉnh sửa lỗi logic (lỗi từ khâu vấn nhập liệu) ● Tuổi & trình độ học vấn: 15 tuổi tốt nghiệp đại học ● Nơi mua hàng hóa: Mua đồ điện cửa hàng dược phẩm ● Tính chất quán: Trả lời có đọc báo hàng ngày trả lời không đọc báo tháng qua Lập bảng tần suất (frequency table) cho tất biến số để kiểm tra phân bố giá trị Chạy bảng Cross-tab quan trọng Chạy tiêu chí thống kê đơn giản biến số Numeric ● Min, Max, Range, Average (Mean), Median, Standard deviation etc Phát & xử lý giá trị bị thiếu (missing value): ● Sai sót khâu vấn ● Sai sót khâu nhập liệu ● Đáp viên từ chối trả lời LÀM SẠCH DỮ LIỆU & XỬ LÝ DỮ LIỆU (2) Kiểm tra tính quán liệu với câu hỏi sàng lọc (filter question) Q1 Có đọc báo 30 ngày qua khơng? 500 Có Khơng 800 + Sample size 1,300 Q2 Có đọc trang quảng cáo khơng? 300 Có + Q3 Hành động nhìn thấy QC? Khơng 200 • • • • 500 Hành động (X): 50 Hành động (Y): 70 Hành động (Z): 100 Hàng động (W): 80 X + Y + Z + W = 300 300 ÁP DỤNG TRỌNG SỐ CHO KẾT QUẢ KHẢO SÁT (1) Weighting survey data Trọng số gì? Giá trị gán cho đối tượng khảo sát (đáp viên) Sử dụng để cân chỉnh tỷ lệ đại diện nhóm đối tượng khác mẫu khảo sát (ví dụ tỷ lệ nam & nữ) cho phù hợp với tỷ lệ dân số thực tế Sử dụng hệ số phóng đại số mẫu (projection factor) áp dụng cho nhóm đối tượng khảo sát khác Ví dụ tỷ lệ chọn mẫu nhóm dân số 15-19 tuổi 1/10.000, tức mẫu khảo sát đại diện cho 10.000 người thực tế Như vậy, kết khảo sát người nhóm 15-19 tuổi nhân với 10.000 để đại diện cho 10.000 người .. .Bài ● Nhập liệu Data entry/data punching ● Làm liệu & xử lý liệu Data cleaning & data processing ● Lập bảng phân tích kết Tabulation ● Sử dụng phần mềm phân tích liệu ● Báo cáo kết nghiên cứu. .. Xử lý sơ bảng câu hỏi (BCH) hoàn tất Nhập thơng tin BCH vào máy tính Áp dụng trọng số (weight) cho kết khảo sát Các đại lượng thống kê thường dùng phân tích Sử dụng số (index) để so sánh... câu hỏi cho phép phương án trả lời ● Các câu hỏi bị bỏ trống (không ghi câu trả lời) ● Các câu hỏi phải bỏ trống lại ghi câu trả lời ● Các câu hỏi điền vào mục "Khác (ghi rõ)" XỬ LÝ SƠ BỘ CÁC BCH