Để trỏnh cỏc lỗi khụng mong muốn trong quỏ trỡnh thu thập và nhập dữ liệu ta nờn thực hiện cỏc biện phỏp giỳp ngăn ngừa lỗi như sau:
- Thiết kế bảng cõu hỏi phải rừ ràng, dễ hỏi, dễ trả lời. - Chọn lọc hoặc huấn luyện phỏng vấn viờn kỹ lưỡng, điều tra phỏng vấn thử trước khi phỏng vấn để tạo sự dễ hiểu, thống nhất trỏnh sai sút.
- Cỏc bản cõu hỏi sau khi phỏng vấn xong phải được đọc soỏt để kiểm tra phỏt hiện lỗi và điều chỉnh lỗi trước khi nhập vào. 50 18/09/2013 2- Dữ liệu trong SPSS Chương 3 - SPSS c) Cỏc phương phỏp làm sạch dữ liệu Dựng bảng tần số
Bảng tần số cho biết với tập dữ liệu đang cú thỡ số đối tượng cú cỏc giỏ trị nào đú ở một thuộc tớnh cụ thể sẽ là bao nhiờu, nhiều hay ớt… Bảng tần số dựng được cho tất cả cỏc biến định tớnh cũng như định lượng.
Để phỏt hiện và chỉnh sửa cỏc lỗi khi nhập liệu, ta thực hiện theo 2 bước sau:
- Lập bảng tần số cho tất cả cỏc biến, đọc soỏt để tỡm cỏc giỏ trị lạ.
- Tại cỏc biến cú lỗi, dựng lệnh Find để tỡm ra lỗi ở từng biến rồi chỉnh sửa.
Vớ dụ: ta đĩ quy ước mĩ húa 1 đại diện cho nam và 2 đại diện cho nữ trong tệp dữ liệu DataSPSS_Dichvunganhang.sav, giả sử ở dũng dữ liệu đầu tiờn ta nhập giới tớnh là 11.
51 18/09/2013 18/09/2013
2- Dữ liệu trong SPSS
Chương 3 - SPSS
Bước 1: Lập bảng tần số Giới tớnh
- Kớch chọn mục menu Analyze-Descriptive Statistics- Frequencies… xuất hiện hộp hội thoại Frequencies: ./ Chọn biến Gioitinh
là biến muốn lập bảng tần số rồi kớch chọn biểu tượng mũi tờn để đưa biến Gioitinh vào khung Variable(s) rồi bấm OK. Kết quả ta cú 2 bảng sau: Bảng 1
52 18/09/2013 18/09/2013
2- Dữ liệu trong SPSS
Dũng Valid: cho biết số quan sỏt hợp lệ (số người cú trả lời) là 20 Dũng Missing: cho biết số quan sỏt bị thiếu dữ liệu (khụng trả lời) là 0.
Chương 3 - SPSS
Bảng 2: - Cột đầu tiờn thể hiện cỏc giỏ trị của biến giới tớnh, ở đõy ta thấy biến Gioitinh cú 4 giỏ trị là: Nam, Nu,11, 12
⟹ nhập sai giỏ trị 11, 12.
- Cột Frequency: là tần số của từng giỏ trị, được tớnh bằng cỏch đếm số lần xuất hiện.
- Cột Percent: tần suất tớnh theo tỉ lệ %, được tớnh bằng cỏch lấy tần số của mỗi giỏ trị chia cho tổng số quan sỏt.
- Cột Valid Percent: là % hợp lệ, tớnh trờn số quan sỏt cú thụng tin trả lời. - Cột Cumulative Percent: là % tớch lũy do cộng dồn cỏc % từ trờn xuống.
Vớ dụ trờn ta cú: giới tớnh Nam cú 10 trường hợp (chiếm 50%), giới tớnh Nữ cú 8 trường hợp (chiếm 40%), giới tớnh 11 cú 1 trường hợp (chiếm 5%), giới tớnh 12 cú 1 trường hợp (chiếm 5%).
53 18/09/2013 18/09/2013
2- Dữ liệu trong SPSS
Chương 3 - SPSS
Bước 2: Chỉnh sửa lỗi
Theo kết quả của bảng tần số, ta thấy cú giỏ trị giới tớnh nhập sai là 11. Để sửa giỏ trị này ta thực hiện như sau:
- Tại cửa sổ Data View, kớch chọn cột gioitinh, trong menu
Edit, chọn mục Find, xuất hiện hộp hội thoại Find and Repalce, nhập giỏ trị 11 vào ụ Find, nhấn Find Next để tỡm vị trớ ụ cú giỏ trị 11, sửa trực tiếp lờn ụ cú giỏ trị sai.
• Ưu điểm của phương phỏp: đơn giản, dễ thực hiện. • Nhược điểm của phương phỏp: thủ cụng, phỏt hiện ớt lỗi, chỉ phự hợp với cỏc bảng cõu hỏi đơn giản.
54 18/09/2013 18/09/2013
2- Dữ liệu trong SPSS
18/09/2013
Dựng bảng phối hợp 2 hay 3 biến
Dựng lệnh Select Cases để kết hợp một nhúm cỏc biến với nhau, và dựa vào mối quan hệ logic giữa cỏc biến để phỏt hiện ra lỗi. Vớ dụ: lập bảng kết hợp biến tuổi và biến nghề nghiệp, với mối quan hệ logic nghề nghiệp là Giỏo viờn (mĩ nghề giỏo viờn =2) thỡ phải cú tuổi >=21. Cỏc bước thực hiện như sau:
- Kớch chọn menu Data –
Select Cases…xuất hiện
hộp hội thoại Select Cases, kớch chọn mục If condition is satisfied.
- Kớch chọn nỳt If… nằm kế dưới, xuất hiện hộp thoại Select Case: If cho phộp xõy dựng biểu thức logic giữa cỏc biến.
55 18/09/2013 18/09/2013
2- Dữ liệu trong SPSS
Chương 3 - SPSS
- Xõy dựng biểu thức logic giữa 2 biến tuổi và nghề nghiệp: kớch chọn biến Tuoi, Nghenghiep để đưa chỳng sang khung nhập hàm bờn phải và gừ cụng thức như hỡnh sau.
Bấm Continue để trở lại hộp thoại Select Case, và bấm OK, kết quả ta cú như sau:
Chỳ ý: khi lệnh này được thực hiện SPSS sẽ tự động tạo một biến mới đặt tờn là filter_$, biến này nhận giỏ trị 0 tại cỏc trường hợp khụng thỏa mĩn điều kiện và nhận giỏ trị 1
Tại cỏc trường hợp thỏa mĩn điều kiện (trường hợp lỗi). Bờn cạnh đú cỏc ụ ghi tờn hàng sẽ được gạch chộo tại cỏc hàng khụng thỏa mĩn điều kiện. 56 18/09/2013 2- Dữ liệu trong SPSS Chương 3 - SPSS 18/09/2013 57
Trong trường hợp số hàng của dữ liệu quỏ nhiều thỡ việc tỡm cỏc hàng cú giỏ trị 1 ở biến filter_$ để chỉnh sửa dữ liệu cũng mất nhiều thời gian. Ta cú thể dựng lệnh Sort Case trong menu Data để sắp xếp dữ liệu theo hướng tăng dần hoặc giảm dần của biến filter_$, khi đú cỏc hàng cú filter_$=1 sẽ nằm cựng một chỗ, tạo điều kiện thuận lợi cho việc chỉnh sửa dữ liệu.
Chỳ ý: Sau khi thực hiện thành cụng lệnh Select Case, ta cần trở về lại hộp thoại Select Case, kớch chọn mục All cases để hủy bỏ việc lọc dữ liệu, nếu khụng cỏc lệnh thống kờ sau đú chỉ thực hiện với những trường hợp được lọc.
Ưu điểm của phương phỏp: phỏt hiện được cỏc lỗi logic và phự hợp với cỏc bảng cõu hỏi phức tạp.
Nhược điểm của phương phỏp: phức tạp, việc xỏc định điều kiện logic giữa cỏc biến phụ thuộc vào kinh nghiệm của người thực hiện. Chương 3 - SPSS 1/ Một số xử lý trờn biến 2/ Lập bảng tổng hợp nhiều biến 3/ Trỡnh bày kết quả bằng đồ thị 58 18/09/2013