• Trong nhiều trường hợp chúng ta cần chọn ra một mẫu con trong tập mẫu được khảo sát. VD: dữ liệu BenTre, khảo sát về giới tính của người dân, chúng ta muốn khảo sát riêng các thơng tin về người dân ở xã Thạnh Phước thơi. Khi đĩ chúng ta cần thực hiện phép chọn để lọc ra những trường hợp này.
• Việc chọn lọc cĩ thể được tiến hành theo nhiều cách: chọn các trường hợp thỏa 1 điều kiện nào đĩ; hoặc chọn ngẫu nhiên 1 số trường hợp; họăc chọn theo khỏang cách đều; hoặc sử dụng 1 biến lưu giữ số thứ tự các trường hợp, hoặc 1 điều kiện lọc v.v…
• Chỉ những trường hợp được chọn mới tham gia vào các phân tích tiếp theo. Những trường hợp khơng được chọn sẽ bị đánh
• Thao tác:
Data ⟶ Select Cases⟶ xác định cách lọc
⟶ OK
Các cách chọn lựa như sau:
• All Cases: Chọn tất cả mẫu được khảo sát. Đây là cách chọn mặc định của SPSS.
• If condition is satisfied: Chọn ra những trường hợp thỏa 1 điều kiện nào đĩ. Điều kiện được xác định khi nhắp nút If. Đĩ là một biểu thức lơgic, sẽ cĩ giá trị hoặc đúng hoặc sai khi kiểm tra, đánh giá trên từng trường hợp. Những dịng nào thỏa điều kiện này (thì) sẽ được chọn. Những dịng dữ liệu nào khơng thỏa điều kiện này sẽ bị đánh dấu “/” khơng xử lý.
• Random sample of cases: Chọn ra một cách ngẫu nhiên khỏang x% trong số tất cả các trường hợp được khảo sát. Với những cuộc điều tra thống kê, ví dụ điều tra thương nghiệp.
Với số hộ khảo sát Bến Tre là 131, người ta chỉ tiến hành điều tra khỏang 10% số hộ đĩ.
• Based on time or case range: Chọn ra các hợp nằm trong khỏang từ số thứ tự nào đĩ đến số nào đĩ. Ví dụ, chọn các trường hợp từ 30 đến 100.
• Use filter variable: Chọn ra các trường hợp thỏa điều kiện được cho trong biến lọc. Nếu giá trị của biến lọc là xác định và khác 0 thì dịng tương ứng được chọn, ngược lại thì bị đánh dấu khơng xử lý.
Kết quả chọn:
• Filter out unselected cases: đánh dấu lọai bỏ các dịng khơng được chọn (mặc định)
• Copy selected cases to new dataset: Chép các dịng được chọn sang bảng mới.
• Delete unselected cases: Xĩa bỏ các dịng khơng được chọn.
Các đối tượng bị lọc (bị loại trừ)
•Kết quả chọn các dịng cĩ dạng như hình dưới đây:
• Trừ trường hợp chọn theo biến lọc (Use filter variable), trong các trường hợp cịn lại, SPSS đều tự phát sinh thêm 1 biến mới cĩ tên là filter_$, với miến giá trị là 0 hoặc 1, và nhãn biến là {0, Not Selected}, {1, Selected}.
• Người ta cũng thường sử dụng phương pháp lọc để phát hiện những giá trị nằm ngịai miền xác định của biến (Outlier) phục vụ cơng việc hiệu chỉnh dữ liệu.