Mục tiêu bài họcSau khi hoàn thành bài học này sinh viên có thể: dạng số để nhập vào máy tính thao tác làm sạch số liệu Sau khi hoàn thành bài học này sinh viên có thể: dạng số để nhập v
Trang 1Quản lý số liệu
Nguyễn Thị Trang Nhung
Trang 2Mục tiêu bài học
Sau khi hoàn thành bài học này sinh viên có thể:
dạng số để nhập vào máy tính
thao tác làm sạch số liệu
Sau khi hoàn thành bài học này sinh viên có thể:
dạng số để nhập vào máy tính
thao tác làm sạch số liệu
Trang 3Quản lý số liệu
Trang 4Mã hóa
Mã hoá số liệu là quá trình chuyển đổi các số
liệu thu
liệu thu thậpthập được(vd: từcácđược(vd: từcác bộbộ câu hỏicâu hỏi) thành) thành các dạng dữ kiện phù hợp với các phần mềm phân
phân tíchtích thống kêthống kê
Mã hoá số liệu là quá trình chuyển đổi các số
liệu thu
liệu thu thậpthập được(vd: từcácđược(vd: từcác bộbộ câu hỏicâu hỏi) thành) thành các dạng dữ kiện phù hợp với các phần mềm phân
phân tíchtích thống kêthống kê
Trang 5Mã hóa
Mã hóa – – bảng hỏi bảng hỏi
Điều tra chấn thương giao thông quốc gia năm 2003
Mã hộ: _ _ _ _ _ _ _ _ Vùng :
Ngày phỏng vấn:
Thông tin về người trả lời
1 Anh/chị bao nhiêu tuổi (tính tròn năm)?
2 Anh/chị là nam hay nữ (khoanh vào lựa chọn phù hợp)?
3 Anh/chị sống ở đâu? (Khoanh vào lựa chọn phù hợp) :
Thành phố Nông thôn
4 Anh/chị đã học đến lớp mấy (Khoanh vào lựa chọn phù hợp)?
Không đi học Tiểu học Dưới THCS Trên THCS Học nghề Đại học Trên đại học Trẻ nhỏ
5 Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?
Làm ruộng CBCNVC Buôn bán nhỏ Làm chủ
Học sinh Nghề thủ công Nghỉ hưu Mất sức Thất nghiệp Trẻ nhỏ Other
Điều tra chấn thương giao thông quốc gia năm 2003
Mã hộ: _ _ _ _ _ _ _ _ Vùng :
Ngày phỏng vấn:
Thông tin về người trả lời
1 Anh/chị bao nhiêu tuổi (tính tròn năm)?
2 Anh/chị là nam hay nữ (khoanh vào lựa chọn phù hợp)?
3 Anh/chị sống ở đâu? (Khoanh vào lựa chọn phù hợp) :
Thành phố Nông thôn
4 Anh/chị đã học đến lớp mấy (Khoanh vào lựa chọn phù hợp)?
Không đi học Tiểu học Dưới THCS Trên THCS Học nghề Đại học Trên đại học Trẻ nhỏ
5 Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?
Làm ruộng CBCNVC Buôn bán nhỏ Làm chủ
Học sinh Nghề thủ công Nghỉ hưu Mất sức Thất nghiệp Trẻ nhỏ Other
Trang 6Lưu trữ trong số liệu
1: nam 2 : nữ
Trang 7Các chiến lược mã hóa số liệu
Ví dụ: Giới tính của người được phỏng vấn
Nam Nữ
Nam Nữ √√
Mã hóa:
1: Nam
2: Nữ
Sử dụng codebook để ghi nhớ mãSử dụng codebook để ghi nhớ mã
Ví dụ: Giới tính của người được phỏng vấn
Nam Nữ
Nam Nữ √√
Mã hóa:
1: Nam
2: Nữ
Sử dụng codebook để ghi nhớ mãSử dụng codebook để ghi nhớ mã
Trang 8Chiến lược mã hóa số liệu
2 Các mã số liệu không được trùng nhau
Ví dụ 1: Giới tính của người phỏng vấn:
1 : nam
2 : Nữ
Ví dụ 2: Nguồn thông tin về cách phòng chống HIV/AIDSTừ
phương tiện thông tin đại chúng (tivi, đài)
1 Từ sách báo tạp chí
2 Từ hệ thống phát thanh của phường
3 Từ cán bộ y tế/ cán bộ phụ nữ
4 Bạn bè/người thân
2 Các mã số liệu không được trùng nhau
Ví dụ 1: Giới tính của người phỏng vấn:
1 : nam
2 : Nữ
Ví dụ 2: Nguồn thông tin về cách phòng chống HIV/AIDSTừ
phương tiện thông tin đại chúng (tivi, đài)
1 Từ sách báo tạp chí
2 Từ hệ thống phát thanh của phường
3 Từ cán bộ y tế/ cán bộ phụ nữ
4 Bạn bè/người thân
Trang 9Chiến lược mã hóa số liệu
3 Mỗi biến của các trường hợp phải nằm trên cùng một cột của SPSS
4 Mỗi biến của mỗi quan sát phải có giá trị của biến
5 Áp dụng một quy tắc thống nhất cho cả bộ số liệu khi mã hóa
6 Nên sử dụng giá trị cao thì nhận giá trị tích cực trong câu hỏi ( không đồng ý
cực trong câu hỏi ( không đồng ý rất đồng ý)rất đồng ý)
3 Mỗi biến của các trường hợp phải nằm trên cùng một cột của SPSS
4 Mỗi biến của mỗi quan sát phải có giá trị của biến
5 Áp dụng một quy tắc thống nhất cho cả bộ số liệu khi mã hóa
6 Nên sử dụng giá trị cao thì nhận giá trị tích cực trong câu hỏi ( không đồng ý
cực trong câu hỏi ( không đồng ý rất đồng ý)rất đồng ý)
Trang 10Nhập số liệu
nghiệp
nhỏ (miễn phí, dễ cài đặt và dễ sử dụng)
nghiệp
nhỏ (miễn phí, dễ cài đặt và dễ sử dụng)
Trang 11Các cách nhập số liệu
Nếu lượng thông tin sai khác của hai người quá lớn thì tiến hành nhập lại
khoảng 20% phiếu để kiểm tra Nếu thấy sai khác quá nhiều cũng phải nhập lại
Nếu lượng thông tin sai khác của hai người quá lớn thì tiến hành nhập lại
khoảng 20% phiếu để kiểm tra Nếu thấy sai khác quá nhiều cũng phải nhập lại
Trang 12Kiểm tra và làm sạch
1 Kiểm tra loại biến
Trang 132 Kiểm tra dạng đo lường của biến
Dựa vào mã của các giá trị bên cột mã biến:
hãy chuyển kiểu đo lường cho tất cả các biến trong
bộ số liệu Chilumba Sav thành dạng thích hợp
Trang 143 Kiểm tra và dán nhãn cho biến
Dựa vào mã của các giá trị bên cột mã biến: hãy dán nhãn cho tất cả các biến trong bộ số liệu Chilumba.
Sav
Trang 154 Xử lý đối với biến bị missing
Trang 16Hiện thị codebook
Trang 17Lệnh Descriptives để kiểm tra biến liên tục
Trang 18Lệnh Frequency để kiểm tra biến phân loại
Trang 19Làm sạch số liệu
loại
loại
Trang 20Tài liệu đọc