Mục tiêu 1 Xác định được ý nghĩa của việc kiểm tra số liệu, lọc số liệu và mã hóa lại các số liệu thường gặp trong nghiên cứu y tế. 2 Thực hiện được các lệnh lọc, mã hóa số liệu cơ bản 3 Nhập và kiểm tra một bộ số liệu hoàn chỉnh. Lỗi bỏ trống dữ liệu. Lỗi logic. Lỗi nhập sai giá trị đã mã hóa, outlier ( ví dụ : code 1: nam , 2: nữ nhưng số liệu lại có 3,4,5…). Một số lỗi thông thường Phương pháp kiểm tra số liệu Dùng các lệnh sắp xếp dữ liệu ( sort case: ascending descending) → hiển thị các giá trị missing hay outline. Chạy các bảng tần suất hoặc trung bình → xác định giá trị missing lớn nhất , nhỏ nhất. Chạy bảng chéo → các lỗi logic đơn giản. Biến cần sắp
TIN HỌC ỨNG DỤNG NHẬP, LỌC VÀ MÃ HÓA SỐ LIỆU TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN Mục tiêu 1/ Xác định ý nghĩa việc kiểm tra số liệu, lọc số liệu mã hóa lại số liệu thường gặp nghiên cứu y tế 2/ Thực lệnh lọc, mã hóa số liệu 3/ Nhập kiểm tra số liệu hồn chỉnh Một số lỗi thơng thường 1) 2) 3) Lỗi bỏ trống liệu Lỗi logic Lỗi nhập sai giá trị mã hóa, outlier ( ví dụ : code 1: nam , 2: nữ số liệu lại có 3,4,5…) Phương pháp kiểm tra số liệu • Dùng lệnh xếp liệu ( sort case: ascending/ descending) hiển thị giá trị missing hay outline • Chạy bảng tần suất trung bình xác định giá trị missing/ lớn , nhỏ • Chạy bảng chéo lỗi logic đơn giản Biến cần xếp Tăng dần Giảm dần Giá trị bổ trống thường xuất số liệu ( ascending) Giá trị bỏ trống thường xuát cuối số liệu (Descending) Lệnh lọc số liệu Select case (Lựa chọn trường hợp theo điều kiện ) Split file (chia tách liệu) lệnh hiển thị kết chạy phân tích số liệu số hiên thị kết ( out put) Mã hóa số liệu ( Recode) Thơng thường có dạng • Mã hóa mớithực biến ban đầu ( lưu ý số liệu gốc thay đổi theo) Recode into same variable • Mã hóa tạo thành biến Recode into different variable) Recode into same variables TransVí dụ: Chia tuổi bệnh nhân thành nhóm : (60 – 70); (71- 80); >80 form / Recode into same variables Đưa biến cần mã hõa vào Giá trị mỡi cần mã hóa Giá trị cũ Khoảng Thấp từ … Cao từ Giá trị khác ngồi khỗng đa mã hóa Lưu ý: Sau code cần nhấn add để việc mã hóa thực Và continue để hồn tất 10 Ví dụ chia nhóm tuổi 11 Lệnh thực biến tuổi ban đầu Lưu ý sử dụng lệnh 12 Recode into different variables • • Về nguyên tắc thực giống với recode into same variables Tuy nhiên lệnh tạo biến nằm cuối số liệu (không thay đổi số liệu gốc ban đầu) • Chú ý thay đổi tên biến thực 13 Transform/ recode into different variables Gõ tên biến Thực tương tự mã hóa same into variables 14 Kết tạo biến nằm sau số liệu 15 Kiểm tra kết sau mã hóa số liệu • Để xem kết sau mã hóa liệu sử dụng lệnh Analyze/ Descriptive statistics / Frequencies xem tần số, tỷ lệ ( cửa số output) • Ví dụ trường hợp biến tuổi 16 BÀI TẬP 1 Dùng lệnh Sort cases phát số liệu sai biến số cân nặng Dùng lệnh Find phát số liệu sai biến số tuổi mẹ (tuổi mẹ có giá trị tuổi sai) Frequency để tìm số liệu sai biến số Gan to 17 Frequency tìm số liệu sai biến số lách to Crosstabs: Tìm mối liên quan tuổi cân nặng , phát số liệu bất hợp lý Select cases: Phân tich số liệu cho nữ giới: Tìm tỷ lệ % lách to theo độ cho nữ giới 18 BÀI TẬP Chia tuổi thành nhóm tuổi: • • • • nhóm 1: 15-19 nhóm : 20-24 nhóm 3: 25-29 nhóm 4: 30-34 nhóm 5: 35-39 nhóm : 40-44 nhóm 7: 45-49 nhóm : > 49 tuổi 1.Hãy cho biết số lượng tỷ lệ nhóm? 2.Hãy cho biết số lượng tỷ lệ nhóm theo giới tính (nam/nữ)? 19 BÀI TẬP Chia nhóm thể lực theo cân nặng (cannang) • • • nhóm 1: < 40 kg nhóm : 40-50 kg nhóm 3: 51-60 nhóm 4: 61-70 nhóm 5: > 70 Hãy cho biết số lượng tỷ lệ nhóm? Tỷ lệ cao thuộc nhóm nào? Tỷ lệ người nặng 60kg bao nhiêu? Hãy cho biết số lượng tỷ lệ nhóm theo giới tính (nam/nữ)? 20 BÀI TẬP • • • • Chia trình độ học vấn (tdhv) thành nhóm: HV thấp : mù chữ + cấp HV trung bình : cấp + cấp HV cao : > cấp 1.Hãy cho biết số lượng tỷ lệ nhóm? 2.Hãy cho biết số lượng tỷ lệ nhóm theo giới tính (nam/nữ)? 21 ... tuổi: • • • • nhóm 1: 15-19 nhóm : 20 -24 nhóm 3: 25 -29 nhóm 4: 30-34 nhóm 5: 35-39 nhóm : 40-44 nhóm 7: 45-49 nhóm : > 49 tuổi 1.Hãy cho biết số lượng tỷ lệ nhóm? 2. Hãy cho biết số lượng tỷ lệ nhóm... variable • Mã hóa tạo thành biến Recode into different variable) Recode into same variables TransVí dụ: Chia tuổi bệnh nhân thành nhóm : (60 – 70); (71- 80); >80 form / Recode into same variables... 11 Lệnh thực biến tuổi ban đầu Lưu ý sử dụng lệnh 12 Recode into different variables • • Về nguyên tắc thực giống với recode into same variables Tuy nhiên lệnh tạo biến nằm cuối số liệu (không