2. Mã hoá lại dữ liệu
2.1. Thực hành mã hoá lại dữ liệu trên SPSS
Trước khi thực hiện việc mã hóa lại dữ liệu trên SPSS, việc phân nhóm, tổ cần được tính toán từ trước, và chỉ khi có được những thông tin này chúng ta mới thực hiện được trên SPSS.
Ví dụ; Chúng ta mã hóa lại biến tuổi từ dạng định lượng sang biến nhóm tuổi với 4 nhóm như đã phân tích ở phần trên.
Lưu ý, trong việc mã hóa lại biến, chúng ta có 2 lệnh mã hóa, một là mã hóa đè lên biến cũ (Transform/Recode/Into Same Variables…) và mã hóa bằng cách tạo thêm 1 biến mới Transform/Recode into Different Variables) . Tùy thuộc mục đích sử dụng, chúng ta sử dụng 1 trong 2 lệnh này. Nhưng thông thường chúng ta chỉ dùng lệnh recode in to same khi biến dùng để biến đổi là là biến thứ cấp (biến có được do được tính toán thông qua lệnh compute). Chúng ta không sử dụng lệnh này cho những biến gốc, vì khi thay đổi chúng ta không thể khôi phục được. Do vậy, trong phần thực hành này, chúng tôi chỉ hướng dẫn cách sử dụng lệnh Recodeinto Different Variables.
Từ thanh menu chọn
Transform/Recode/Into different Variables…
Hình 4.8. Màn hình mã hóa lại biến recode
Từ biến nguồn, chúng ta chọn biến “tuoi” chuyển qua biến đích (hình 4.9)
Nhắp chuột vào ô Name (Output Variable) để đặt lại tên mới cho biến
Nhắp chuột vào ô Label để gán nhãn mới cho biến
Nhắp vào Old and New Values và định rõ cách mã hoá lại giá trị của biến (như đã tính toán từ trước).
Nhấn nút Change để kết thúc việc xác định tên mới cho biến
Hộp thoại Recode into Same Values: Old and NewValues
Bạn có thể xác định các trị số để mã hoá trong hộp thoại này. Mọi chỉ định về trị số phải cùng loại dữ liệu (dạng số hay dạng chuỗi) giống như của các biến đã được chọn trong hộp thoại chính.
Trong hộp thoại này, lần lượt khai báo các giá trị cũ (Old value) bên tay trái, tương ứng với từng giá trị mới (New Value bên tay phải), có các loại giá trị cũ có thể được recode như sau:
Value: từng giá trị cũ rời rạc ứng với 1 giá trị mới
Sytem –missing: Giá trị khuyết thiếu hệ thống
System or user missing: Giá trị khuyết thiếu của hệ thống hoặc do người sử dụng định nghĩa
Range: Một khoảng giá trị cũ ứng với một giá trị mới, tình huống này cũng có ba trường hợp nhỏ là khoảng giữa hai giá trị (Range … through); khoảng từ giá trị nhỏ nhất đến giá trị xác định được nhập vào (Lowesr through … Range); khoảng từ một giá trị xác định nhập vào đến giá trị lớn nhất (Range … through Highest)
Trong trường hợp cụ thể của chúng ta là chuyển các độ tuổi theo từng nhóm, do đó chúng ta sử dụng mục Range để chuyển đổi.
Ở mục này này chúng ta đưa vào giá trị nhỏ nhất của khoảng vào ô bên trái “through” và giá trị lớn nhất của khoảng vào bên phải (Xem hình 4.10)
Sau khi đã thực hiện xong dùng chuột nhắp vào ô Value (New value), gõ vào giá trị mới đã đặt trước. Sau đó nhắp nút Add để chuyển giá trị mới vào mục Old->New.
Sau đó tiếp tục làm đến hết các giá trị muốn biến đổi. Trước khi kết thúc cần nhấn vào ô All other values -> Value = 99 -> Add để kết thúc.
Xác định xong bạn nhất nút Continue để trở về hộp thoại trước đó và chọn OK để kết thúc. Lúc này trên màn hình Variable view xuất hiện biến mới và bạn cần vào mục Values để gán các giá trị cho biến số vừa tạo, nếu không khai báo các nhãn giá trị thi khi bạn lập bảng tần số cho “khoangtuoi”, SPSS sẽ truy xuất ra tần số các con số 1,2,3,4 mà bạn đã gán chứ không truy xuất ra khoảng tuổi (19 – 27); (28 – 37); (38 – 47); (48 – 55).