PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU VỚI SPSS TIN HỌC ỨNG DỤNG BÀI 4: CÁC PHÉP BIẾN ĐỔI DỮ LIỆU... • Hiểu và áp dụng được các phương pháp biến đổi dữ liệu phù hợp với yêu cầu nghiên cứu.. • Hi
Trang 1PHÂN TÍCH DỮ LIỆU NGHIÊN
CỨU VỚI SPSS
TIN HỌC ỨNG DỤNG
BÀI 4: CÁC PHÉP BIẾN ĐỔI DỮ LIỆU
Trang 2• Hiểu và áp dụng được các phương pháp biến đổi
dữ liệu phù hợp với yêu cầu nghiên cứu
• Hiểu và áp dụng được các phương pháp xử lý lỗi
phát sinh trong quá trình nhập liệu
• Tổ chức và làm việc nhóm xây dựng bảng câu hỏi
khảo sát, tiến hành khảo sát, nhập và xử lý dữ liệu
Trang 3– Mã hóa biến với công cụ Recode
– Chuyển định dạng của biến
– Tính toán giá trị của biến với công cụ Compute
– Xử lý câu hỏi có nhiều lựa chọn trả lời
– Dữ liệu lỗi và các biện pháp khắc phục
– Các phương pháp làm sạch dữ liệu
Trang 4– Xử lý sai sót trong quá trình mã hóa, nhập liệu
– Biến đổi dữ liệu để phát hiện mối quan hệ giữa các biến
– Xử lý dữ liệu trên biến
– Làm sạch dữ liệu
Trang 5XỬ LÝ DỮ LIỆU TRÊN BIẾN
Trang 7– Đặt tên và nhãn cho biến mới, nhấn nút Change để xác nhận
– Nhấn nút Old and New Values để xác định sự chuyển đổi giá trị giữa biến cũ và biến mới
– Gán các nhãn giá trị cho biến vừa tạo
Trang 10– Gọi thực hiện chức năng Transform -> Count
– Khai báo tên và nhãn của biến Dichotomy
– Cung cấp (các) biến Category có liên quan tới biến Dichotomy
– Cung cấp trị số mã hóa của (các) biến Category có liên quan tới biến Dichotomy
– Gán nhãn các giá trị của biến Dichotomy
Trang 17KHẮC PHỤC LỖI MÃ HÓA VÀ NHẬP LIỆU
số liệu (chọn ngẫu nhiên) bởi hai người độc lập
Trang 18– Đảm bảo tính nhất quán của dữ liệu
– Thiết kế bảng câu hỏi rõ ràng, dễ trả lời
– Chọn lọc và huấn luyện điều tra viên
– Các bảng câu hỏi cần kiểm tra, xử lý lỗi trước khi nhập
Trang 19– Sử dụng Excel (Max, Min, Auto Filter, Scatter)
– Sử dụng SPSS (Scatter, Frequency, Charts, Box Plots)
– Dùng công cụ để phát hiện giá trị “lạ” của mỗi biến
– Tìm bản ghi chứa giá trị “lạ”
– Chỉnh sửa/loại bỏ bản ghi chứa giá trị lạ
Trang 20– Sử dụng hàm MIN, MAX đối với biến Age
– Sử dụng công cụ AutoFilter đối với biến Gender
– Sử dụng đồ thị Scatter đối với biến Childrens
Trang 21LÀM SẠCH DỮ LIỆU VỚI MS EXCEL
– Đối với dữ liệu người tiêu dùng, độ tuổi khảo sát từ 18 đến 60
– Giá trị nằm ngoài vùng 18 – 60 là dữ liệu lỗi
Trang 22LÀM SẠCH DỮ LIỆU VỚI MS EXCEL
– Biến Gender chỉ có hai giá trị Male và Female, những giá trị khác (hoặc để trống) là lỗi nhập liệu
Trang 23LÀM SẠCH DỮ LIỆU VỚI MS EXCEL
Trang 24LÀM SẠCH DỮ LIỆU VỚI MS EXCEL
Trang 25– Sử dụng công cụ Frequencies đối với biến Gender
– Sử dụng công cụ Charts đối với biến Literacy
– Sử dụng công cụ Histogram đối với biến Age