CHƯƠNG II: LÀM SẠCH DỮ LIỆU TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU 2.1 LÝ DO
Trang 1CHƯƠNG II:
LÀM SẠCH DỮ LIỆU
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.1 LÝ DO
2.2 CÁC BIỆN PHÁP NGĂN NGỪA
2.3 CÁC PHƯƠNG PHÁP LÀM SẠCH DỮ LIỆU
2.3.1 DÙNG BẢNG TẦN SỐ
2.3.2 DÙNG BẢNG PHỐI HỢP HAI BIẾN HAY BA BIẾN
(BASIC OR GERERAL)
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
Trang 2CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.1 CÁC BIỆN PHÁP NGĂN NGỪA
Thiết kế bảng câu hỏi rõ ràng
Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng
Điều tra thử trước khi tiến hành chính thức
Bảng câu hỏi sau khi phỏng vấn phải được đọc
kiểm soát lỗi trước khi tiến hành nhập liệu
Việc mã hóa phải tiến hành tập trung và nhất quán
với chuyên gia nhập liệu
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.1 Dùng bảng tần số
Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần
số để tìm dữ liệu sai sót để sửa
Thực hiện: từ cửa sổ Data view Analyze
Descriptive Statistics chọn Frequencies Hộp
thoại
Thí dụ: Minh họa bằng data lamsachdulieu.sav
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.1 Dùng bảng tần số
Trang 3CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến
Thực hiện: từ cửa sổ Data view Analyze Descriptive
Statistics chọn Frequencies Hộp thoại.
- Bước 1: Vào Data Select Cases , khi màn hình hiện ra hộp thoại
thì ta chọn If Condition is satisfied để nút If hiện ra và ấn vào
- Bước 2: Chọn biến Tuoi và biến NgheNghiep bên trái để đưa vào
khung bên phải với điều kiện logic bao=8 & NgheNghiep="2“tiếp đó
ấn Continue và ấn tiếp OK.
- Bước 3: Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là
filter_$, biến này nhận giá trị 0 tại tất cả các tình huống không thỏa
mãn và 1 tại tình huống thỏa mãn điều kiện của lệnh If Những giá trị
là 1 trong biến filter_$ chính là những trường hợp sai mà ta cần tìm để
sửa.
- Thí dụ: Minh họa bằng data lamsachdulieu.sav
IS
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến
Chuyển 1 biến dạng phân loại (Category) thành dạng
biến lưỡng phân (Dichotomy)
Chuyển 1 biến dạng phân loại (Category) thành dạng
biến lưỡng phân (Dichotomy) Được dùng khi gặp câu
hỏi có nhiều trả lới (MA) để tập hợp một thông tin
chứa trong các câu trả lời, muốn vậy cần tạo một biến
với 2 biểu hiện: 1 có thông tin và 0 không có thông tin,
đếm 1 sẽ có được thông tin cần quan tâm; cách tiến
hành:
Vào Transform \ count Thí dụ minh họa “baosggp”