QUẢN LÝ SỐ LIỆU, Lê Thị Kim Ánh, BM Thống kê - Tin h

60 589 0
QUẢN LÝ SỐ LIỆU, Lê Thị Kim Ánh, BM Thống kê - Tin h

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu Một số nhà khoa học muốn đánh giá tác động phòng ngừa bệnh lây truyền qua đường tình dục lên tỉ lệ mắc HIV Mwanza, Tanzania Một điều tra tiến hành 12 xã tỉ lệ nhiễm HIV Bộ môn Thống kê - Tin họ Nghiên cứu Tất phụ nữ có HIV dương (từ 15 tuổi trở lên) người điều tra vấn câu hỏi chuẩn yếu tố nguy HIV Ngoài việc hỏi người phụ nữ có HIV dương, người ta chọn ngẫu nhiên số người phụ nữ HIV âm từ danh sách dân số chuẩn bị tiến hành điều tra Những phụ nhân viên điều tra thăm viếng vấn Bộ môn Thống kê - Tin họ Quản lý số liệu Lê Thị Kim Ánh BM Thống kê - Tin học Bộ môn Thống kê - Tin học Trường ĐH Y tế Công Cộng Mục tiêu Trình bày mục đích, nguyên tắc cách mã hoá số liệu Thực trình nhập liệu đơn giản Xác định kế hoạch làm số liệu cho số liệu Thực trình tạo biến để quản lý số liệu Bộ môn Thống kê - Tin họ Quản lý số liệu Chuẩn bị số liệu Mã hoá số liệu Nhập liệu Làm số liệu  Quản lý số liệu  Bộ môn Thống kê - Tin họ Nghiên cứu chấn thương  Mẫu nghiên cứu đại diện cho toàn quốc  Nghiên cứu nhiều loại chấn thương  Sử dụng câu hỏi tự điền  Chọn chấn thương liên quan đến giao thông Bộ môn Thống kê - Tin họ Các biến số  Biến dân số - xã hội: tuổi, giới, vùng, học vấn, nghề nghiệp  Biến CTGT: loại phương tiện  Biến hậu CTGT: vị trí chấn thương, số ngày nằm viện, chất lượng sống Bộ môn Thống kê - Tin họ Điều tra chấn thương giao thông quốc gia năm 2003 Mã hộ: _ _ _ _ _ _ _ _ Vùng : Ngày vấn: _ Thông tin người trả lời Anh/chị tuổi (tính tròn năm)? Anh/chị nam hay nữ (khoanh vào lựa chọn phù hợp)? Nam Nữ Anh/chị sống đâu? (Khoanh vào lựa chọn phù hợp) Thành phố Nông thôn Anh/chị học đến lớp (Khoanh vào lựa chọn phù hợp)? Không học Tiểu học Dưới THCS Trên THCS Học nghề Đại học Trên đại học Trẻ nhỏ Anh/chị làm nghề (Khoanh vào lựa chọn phù hợp)? Làm ruộng CBCNVC Buôn bán nhỏ Làm chủ Học sinh Nghề thủ công Nghỉ hưu Mất sức Thất nghiệp Trẻ nhỏ Other Bộ môn Thống kê - Tin họ Bước MÃ HOÁ SỐ LIỆU Bộ môn Thống kê - Tin họ Mã hoá số liệu Là trình chuyển đổi số liệu thu thập (vd từ câu hỏi) thành dạng kiện phù hợp với phần mềm phân tích thống kê (v.d SPSS) Bộ môn Thống kê - Tin họ 10 Mã xác định: 009 Địa _4007 _ Tuổi 51 years Giới tính Nam Nữ Bạn có sẵn lòng trả lời hết câu hỏi không? Có Không Nếu có, bắt đầu câu 1, không cảm ơn người trả lời kết thúc Câu 10: Bạn có mang chưa? Rồi Chưa Bộ môn Thống kê - Tin họ 46 Số xác định : 020 Ngày sinh : 4/11/1991 Ngày : 4/11/1981 Số xác định: 009 Trình độ học vấn Cấp Cấp Cấp Tuổi 51 years Bạn học đại học chưa? Rồi Chưa Nếu rồi, bạn đạt văn nào? Bộ môn Thống kê - Tin họ Kỹ sư 47 Tại phát hiện? So sánh tính quán tần số Vd: tỷ lệ có mang cao dự tính tỷ lệ học đại học cao cấp  Hoặc có giá trị bất thường Vd: tuổi đối tượng có giá trị âm  Bộ môn Thống kê - Tin họ 48 Sửa chữa  Dùng select cases data để liệt kê trường hợp không quán  Kiểm tra mã hoá  Kiểm tra số liệu gốc Bộ môn Thống kê - Tin họ 49 Ví dụ Phân tích trẻ nhỏ tuổi, có trường hợp học vấn “cấp 2” Tại sao?  Xem lại bảng mã hoá, “cấp 2” =  Dùng select cases Frequency Percen Valid percent Cum percent t Valid Household 100.0 100.0 id 100.0  10212047 Bộ môn Thống kê - Tin họ 50 Chúng ta nên làm nào…?? Ghi chép lại toàn mã dùng Bộ môn Thống kê - Tin họ 51 Vấn đề ghi chép mã Cung cấp cho bạn:  Các mã dùng  Giúp bạn tra cứu đảm bảo mã dùng thống  Đây công cụ giúp cho việc giảm thiểu lỗi không thống Bộ môn Thống kê - Tin họ 52 Thực hành Thực bảng phân phối tần suất để kiểm tra kết  Nhận diện kết bất thường (nếu có)  Sửa chữa kết  Bộ môn Thống kê - Tin họ 53 Bước TẠO BIẾN MỚI Bộ môn Thống kê - Tin họ 54 Khi cần tạo biến mới?    Khi câu hỏi nghiên cứu (phân tích) không dựa số liệu có sẵn Ví dụ: So sánh tỷ lệ chấn thương nhóm 18 tuổi từ 18 tuổi trở lên Xem xét tình hình chấn thương nữ Số liệu có? Số liệu cần? Bộ môn Thống kê - Tin họ 55 Cần tạo biến Biến có: tuổi (biến định lượng)  Biến cần: nhóm tuổi (biến định tính)    Dưới 18 Từ 18 trở lên Lựa chọn trường hợp nữ để phân tích  Sử dụng lệnh “compute” “recode”  Bộ môn Thống kê - Tin họ 56 Thực hành  Tạo biến số số liệu chấn thương   Nhóm tuổi Nhóm học vấn Mã hoá biến số  Mã hoá lại biến có  Bộ môn Thống kê - Tin họ 57 Tóm tắt Mục tiêu nghiên cứu thu thập số liệu xác để trả lời cho câu hỏi nghiên cứu Bộ môn Thống kê - Tin họ 58 Tóm tắt (tt) Quá trình nghiên cứu bao gồm  Thiết kế nghiên cứu   Thu thập số liệu Chuẩn bị quản lý số liệu  Phân tích phiên giải Bộ môn Thống kê - Tin họ 59 Tóm tắt (tt) Trước phân tích số liệu, cần thực trình chuẩn bị quản lý số liệu  Quản lý số liệu để kiểm tra tính xác đầy đủ số liệu  Bao gồm:     Mã hoá số liệu Nhập liệu Làm số liệu Bộ môn Thống kê - Tin họ 60 [...]... missing cho các biến số (nếu có) Bộ môn Thống kê - Tin h 26 Quá trình nhập liệu 1 2 3 4 5 n Phần mềm thống kê Bộ số liệu (data) Bộ môn Thống kê - Tin h 27 Bước 3 LÀM SẠCH SỐ LIỆU Bộ môn Thống kê - Tin h 28 Bộ số liệu Sản phẩm sau khi nhập liệu là bộ số liệu  Bộ số liệu có thể bị lỗi do:    Mã hoá (nhà nghiên cứu)  Nhập số liệu (nhà nghiên cứu)  Tính thống nhất (người trả lời) Trước khi phân tích,... chữ 4 = Cấp III 2 = Tiểu h c 5 = H c nghề 3 = Cấp II Bộ môn Thống kê - Tin h 14 Thực h nh  Mã hoá các số liệu từ câu h i 5 đến 12, trang 13  So sánh với kết quả trang 15 Bộ môn Thống kê - Tin h 15 Quá trình mã hoá Nội dung từ bộ câu h i Bộ môn Thống kê - Tin h Dữ kiện số/ chữ để nhập liệu 16 Bước 2 NHẬP SỐ LIỆU  Nhập số liệu  Gán nhãn và gắn giá trị cho bộ số liệu đã được nhập Bộ môn Thống kê. .. tích, phải làm sạch số liệu Bộ môn Thống kê - Tin h 29 Kế hoạch làm sạch số liệu  Kiểm tra:  Sai số do mã hoá  Giá trị bất thường  Kiểm tra nhập số liệu  Kiểm tra tính đồng nhất Bộ môn Thống kê - Tin h 30 Kiểm tra lỗi mã hoá  1 2  1 2 3 Biến định tính: Xem toàn bộ số liệu bằng bảng grid Dùng bảng phân phối tần số Biến định lượng Xem toàn bộ số liệu bằng bảng grid Dùng mô tả số tối đa, tối thiểu... định chặt chẽ về độ dài và kiểu của tên cột Bộ môn Thống kê - Tin h 19 Tên cột  Tên cột = tên biến (tương ứng với câu h i)  Không dài quá 8 ký tự (đã lỗi thời)  Hiện tại có thể đến 64 ký tự  Không có dấu cách  Không bắt đầu bằng chữ số Bộ môn Thống kê - Tin h 20 Mã xác định: 001 Địa chỉ h m thư của bạn là bao nhiêu? _4350 _ Bạn bao nhiêu tuổi? 36 years Bạn là (khoanh tròn) Nam Nữ (ghi chú:... số liệu đã được nhập Bộ môn Thống kê - Tin h 17 Nhập số liệu  Nhập số liệu sử dụng các phần mềm phân tích thống kê ví dụ: SPSS  Câu trả lời của đối tượng được nhập vào từng ô của tệp số liệu  1 ô = 1 trả lời Bộ môn Thống kê - Tin h 18 Phần mềm thống kê Thông thường:  Là các dạng bảng tính  Một dòng là một đơn vị quan sát/cá thể  Một cột là một câu h i (each column corresponds to one question... … … … •Tất cả các số liệu đều là dạng số • tất cả các mã được ghi trong bảng mã Bộ môn Thống kê - Tin h 22 Thực h nh  Làm quen với phần mềm SPSS  Mã hoá và nhập liệu đơn giản với ví dụ trong slide 21  Xem bộ số liệu Chấn thương Bộ môn Thống kê - Tin h 23 Gán nhãn và gắn giá trị cho bộ số liệu    1 2 Chú ý: Type, Width, Label, Missing và Values Gán nhãn: Label (tên của biến số) Gắn giá trị: Values... Missing -1 1 25.0 Total 4 100.0 Total Xác định giá trị bất thường bằng bảng phân phối tần số Bộ môn Thống kê - Tin h 34 Giá trị bất thường N Mininmum Maximum Mean SD Systolic 1721 80 320 190 49.36 Age 1721 3 50 32 12.3 So sánh với bộ câu h i gốc Nếu đúng, giá trị này vẫn phải đựơc dùng Bộ môn Thống kê - Tin h 35 Dùng histogram 200  Xem phân phối của biến số  Có thể vẽ đường cong phân phối bình thường... bằng bảng grid Dùng mô tả số tối đa, tối thiểu Dùng histogram Bộ môn Thống kê - Tin h 31 idnumber postcode age gender refused bp_sys 001 4350 36 1 1 120 002 4127 28 2 0 -1 003 4005 47 1 1 140 004 4106 52 5 1 200 Bộ môn Thống kê - Tin h 32 Sai số do mã hoá Sai số mã hoá thể hiện trong bảng phân phối tần số Bộ môn Thống kê - Tin h 33 Giá trị bất thường BLOOD PRESSURE (SYSTOLIC) Frequency Valid Percent... biến số) Các giá trị này đã được mã hoá trước khi nhập Gắn vào các số đã nhập để có được output rõ ràng Bộ môn Thống kê - Tin h 24 Ví dụ output Sex Frequency Percent 1 625 54.63 Male 625 54.63 2 519 45.37 Female 519 45.37 Mã hoá từ bộ câu h i để nhập liệu Sex Frequency Percent Gán nhãn cho biến số trong số liệu Bộ môn Thống kê - Tin h 25 Bài tập  Gán nhãn và gắn giá trị cho bộ số liệu chấn thương...Mã hoá số liệu (tt)  Các số liệu dạng ký tự được đổi thành các dữ liệu kiểu số   Ví dụ: Nam  1 , Nữ  2 Bảng mã số liệu cần được chuẩn bị trước cho các mã khác nhau Bộ môn Thống kê - Tin h 11 Số liệu ký tự h_ id region age gender education qol_bef 10111001 NE 36 M 3 34 10121003 NW 28 F 8 71 72012051 RR 47 M 1 63 … … … … … Bộ môn Thống kê - Tin h 12 Số liệu dạng số Đối tượng Vùng Tuổi Giới H c ...  So sánh số liệu tệp  Nếu phát có khác biệt, so sánh với số liệu gốc  Sửa chữa số liệu tệp  Phù hợp với số liệu lớn Bộ môn Thống kê - Tin họ 42 Kiểm tra việc nhập liệu  Một công đoạn quan. .. Phương pháp 2:  Nhập tất vào tệp số liệu thứ  Nhập toàn lại lần vào tệp  So sánh số liệu tệp  Nếu phát có khác biệt, so sánh với số liệu gốc  Sửa chữa số liệu tệp  Phù hợp với số liệu nhỏ/vừa... môn Thống kê - Tin họ 18 Phần mềm thống kê Thông thường:  Là dạng bảng tính  Một dòng đơn vị quan sát/cá thể  Một cột câu hỏi (each column corresponds to one question on data collection instrument/questionnaire)

Ngày đăng: 20/03/2016, 08:10

Mục lục

    Quản lý số liệu

    Nghiên cứu chấn thương

    Điều tra chấn thương giao thông quốc gia năm 2003

    Mã hoá số liệu

    Mã hoá số liệu (tt)

    Số liệu dạng số

    Bảng mã số liệu

    Quá trình mã hoá

    Phần mềm thống kê

    Gán nhãn và gắn giá trị cho bộ số liệu