1. Trang chủ
  2. » Giáo án - Bài giảng

BÀI GIẢNG THU THẬP, XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU

30 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

01/01/2023 THU THẬP, XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU Ths.Bs Huỳnh Nguyễn Phương Quang NHẮC LẠI VỀ BIẾN SỐ Tính chất Định lượng Liên tục Rời rạc Nhị giá Định tính Danh định Thứ tự NHẮC LẠI VỀ BIẾN SỐ Giả thuyết: Biến số phụ thuộc Biến số độc lập Biến số nhiễu 01/01/2023 NHẮC LẠI VỀ BIẾN SỐ Biến phụ thuộc (biến kết cục): Là mục tiêu quan tâm nhà nghiên cứu Là mục tiêu luận cần phải hiểu rõ, dự đoán, giải thích biến thiên Biến độc lập (nguyên nhân): Ảnh hưởng đến biến phụ thuộc, có tác động dương tác động âm Sự thay đổi biến phụ thuộc giải thích thay đổi biến độc lập NHẮC LẠI VỀ BIẾN SỐ - - - / / - - - THU THẬP & XỬ LÝ SỐ LIỆU 01/01/2023 Công tác chuẩn bị thu thập số liệu Công tác chuẩn bị thu thập số liệu 01/01/2023 Vấn đề trình thu thập số liệu Khắc phục vấn đề q trình thu thập số liệu Vai trị giám sát viên thực địa 01/01/2023 Vai trò người thu thập số liệu LÀM SẠCH VÀ MÃ HÓA SỐ LIỆU - Việc làm số liệu bao gồm việc xem xét loại bỏ phiếu mà thơng tin thu thập bị nghi ngờ thiếu tính xác thiếu logic - Các phiếu phát mã hóa số liệu sau vào số liệu Với phiếu mà giá trị vài biến nhỏ lớn so với phiếu khác phiếu bị loại bỏ - Nếu triển khai tốt trình giám sát thu thập số liệu hạn chế đáng kể việc loại bỏ phiếu giai đoạn làm số liệu - Rõ ràng loại bỏ số phiếu điều tra cỡ mẫu nghiên cứu nhỏ mẫu bị giảm tính ngẫu nhiên tính đại diện cho quần thể nghiên cứu  Hạn chế tối đa MÃ HÓA SỐ LIỆU 01/01/2023 MÃ HĨA Các bước mã hóa Đặt tên biến cho câu hỏi - Câu hỏi lựa chọn - Câu hỏi nhiều lựa chọn • Chuyển tập chọn lựa trả lời câu hỏi thành tập số/nhãn phù hợp, có ý nghĩa - Câu hỏi đóng/mở - Câu hỏi có lựa chọn khác - Trường hợp “Khơng biết” • LÀM SẠCH VÀ MÃ HĨA SỐ LIỆU LÀM SẠCH VÀ MÃ HÓA SỐ LIỆU 01/01/2023 Kiểm tra chất lượng số liệu Bộ số liệu cần kiểm tra tính đầy đủ thống số liệu  Một số biến khơng có thơng tin  Sự không thống số liệu câu hỏi • Do người vấn • Do người trả lời Nếu hiệu chỉnh, cần phải cân nhắc đến việc loại bỏ phần số liệu 21 01/01/2023 Quyết định loại bỏ phần số liệu:  Ảnh hưởng đến chất lượng nghiên cứu  Chứng tỏ tính trung thực mặt khoa học người nghiên cứu  Nên đưa vào bàn luận điều báo cáo cuối 22 Phân loại số liệu Đối với biến phân loại: định nghĩa từ thiết kế câu hỏi Câu hỏi có dạng trả lời khác “loại khác, xin rõ.” phân loại sau điều tra, cần liệt kê vào bảng dạng trả lời khác “khác”, ( Làm Số liệu  CÁC VIỆC CẦN LÀM: - Nếu BCH thu có tỷ lệ “missing” cao → bỏ - Sự không thống số liệu trao đổi lại  chỉnh sửa  VD: ĐT Không hút thuốc  câu LQ HTL cá nhân bỏ qua, không thống người PV tiếp tục ghi nhận câu trả lời LQ HTL cá nhân CÁC VIỆC CẦN LÀM: - Nếu không thống nhất: không người PV mà ghi chép (Bộ câu hỏi tự điền)  hỏi lại người trả lời - Nếu hiệu chỉnh sai sót  cân nhắc loại bỏ phần số liệu  không gộp liệu để phân tích - Đối với câu TL mơ hồ  loại bỏ LÀM SẠCH VÀ MÃ HÓA SỐ LIỆU - Việc làm số liệu bao gồm việc xem xét loại bỏ phiếu mà thông tin thu thập bị nghi ngờ thiếu tính xác thiếu logic - Các phiếu phát mã hóa số liệu sau vào số liệu Với phiếu mà giá trị vài biến nhỏ lớn so với phiếu khác phiếu bị loại bỏ - Nếu triển khai tốt trình giám sát thu thập số liệu hạn chế đáng kể việc loại bỏ phiếu giai đoạn làm số liệu - Rõ ràng loại bỏ số phiếu điều tra cỡ mẫu nghiên cứu nhỏ mẫu bị giảm tính ngẫu nhiên tính đại diện cho quần thể nghiên cứu  Hạn chế tối đa 01/01/2023 PHÂN TÍCH SỐ LIỆU  Số liệu điều tra thực trở nên có ích tập hợp lại phân tích hồn chỉnh  Việc xử lý phân tích số liệu thiết phải tiến hành chuẩn bị cách cẩn thận Khi phân tích số liệu:  Loại thiết kết nghiên cứu  Các phương pháp thu thập số liệu Số liệu định lượng: mô tả số liệu biến toàn đơn vị nghiên cứu Số liệu định tính: thường mơ tả, tổng hợp, phiên giải số liệu thu thập 30 10 01/01/2023 Phân phối chuẩn Ý nghĩa phân phối chuẩn Phân phối chuẩn 16 01/01/2023 Chuyển dạng Phân phối không chuẩn Nguyên tắc chọn test thống kê Mục tiêu nghiên cứu: Đo lường khác biệt hay đo lường tương quan biến Số nhóm nghiên cứu: nhóm, nhóm, hai nhóm Bản chất số liệu, loại biến số: Biến định tính, biến định lượng Phân bố mẫu: Chuẩn hay không chuẩn Loại quan sát: Mẫu độc lập hay ghép cặp 51 17 01/01/2023 Nguyên tắc chọn test thống kê • Biến định tính: Sự khác biệt so với tỷ lệ giả thuyết Sự khác biệt tỷ lệ Nhiều hai tỷ lệ Sự khác biệt tỷ lệ lặp lại • Biến định lượng: Sự khác biệt trung bình Sự khác biệt trung bình Sự khác biệt nhiều trung bình Sự khác biệt trung bình lặp lại Test phi tham số 18 01/01/2023 19 01/01/2023 20 01/01/2023 21 01/01/2023 Ví dụ phân tích số liệu định tính Bệnh Phơi nhiễm Tổng Có Khơng Có a b e Khơng c d f Tổng g h n 66 22 01/01/2023 df: (hang - 1) x (cột -1) O: Giá trị qua sát (O  E)   E E: Giá trị kỳ vọng E = (tổng hàng x tổng cột)/tổng chung Điều kiện: 0,5: tương quan mạnh 26 01/01/2023 Ý NGHĨA CỦA HỆ SỐ TƯƠNG QUAN Theo Guilford (1956) |R| Mức tương quan Theo Roundtree (1981) |R| Mức tương quan < 0.2 Không đáng kể < 0.2 Rất lỏng lẻo 0.2 – 0.4 Liên quan thấp 0.2 – 0.4 Lỏng lẻo 0.4 – 0.7 Liên quan 0.4 – 0.7 Trung bình 0.7 – 0.9 Liên quan cao 0.7 – 0.9 Chặt chẽ > 0.9 Liên quan cao > 0.9 Rất chặt chẽ Ý NGHĨA CỦA HỆ SỐ TƯƠNG QUAN HỆ SỐ TƯƠNG QUAN SPEARMAN  Sử dụng để đo lường tương quan biến đinh lượng phân phối khơng bình thường biến thứ tự tương quan monotonic (luôn tăng giảm với tần suất không đều) 27 01/01/2023 Phân tích nhị biến - Hồi quy tuyến tính đơn HỒI QUY  Hồi quy mơ hình tốn học mô tả biến đổi biến số theo biến số khác y = a + bx • y: biến số phụ thuộc • x: biến số độc lập • a: hệ số số, hay cịn gọi điểm chặn (intercept) • b: hệ số biến số HỒI QUY TUYẾN TÍNH ĐƠN BIẾN  Mơ hình: Y = α + βX + ε  α: Điểm chặn (intercept)  β: Hệ số góc (slope)  ε: Sai số ngẫu nhiên (random error)  Ước tính tham số α, β, ε cho tổng d2 nhỏ Phương pháp bình phương tối thiểu (least square method) 28 01/01/2023 Ý NGHĨA CỦA HỆ SỐ CỦA BIẾN SỐ:  Trong phương trình hồi quy tuyến tính đơn biến, hệ số b biến số x cho kết luận giá trị biến độc lập tăng đơn vị giá trị biến phụ thuộc thay đổi b đơn vị  Trong trường hợp hồi quy đa biến, hệ số bi biến số độc lập xi nói lên biến số độc lập xi tăng đơn vị biến số phụ thuộc y thay đổi biến độc lập cịn lại khơng thay đổi  Cụ thể biến số x2 thay đổi đơn vị biến số y tăng giá trị b2 (biến số y giảm giá trị b2 âm) biến x1 x3,…,xk không thay đổi KẾT LUẬN  Tương quan số đo mức độ hai biến số định lượng thay đổi với Có nhiều loại hệ số tương quan, chúng có giá trị từ -1 đến  Nếu chúng có giá trị zero có nghĩa hai biến số độc lập khơng quan hệ với  Nếu chúng có giá trị dương có nghĩa hai biến số đồng biến với nhau, chúng có giá trị âm nghĩa hai biến số nghịch biến KẾT LUẬN  Giá trị tuyệt đối hệ số tương quan gần nghĩa hai biến số có liên hệ chặt với vai trò sai số ngẫu nhiên  Khi trị tuyệt đối hệ số tương quan có nghĩa hồn tồn khơng có sai số ngẫu nhiên  Hồi quy mơ hình tốn học mơ tả biến đổi biến số theo biến số khác 29 01/01/2023 KẾT LUẬN  Thiết kế nghiên cứu định lượng (mẫu rút từ dân số có phân phối bình thường phương sai hai nhóm đồng nhất) tìm mối liên hệ hai biến số: Sử dụng hồi quy tuyến tính tương quan pearson  Biến phụ thuộc định lượng phân phối bình thường, biến độc lập định lượng, đa biến (hoặc thứ tự): Sử dụng tương quan Pearson, Hồi quy tuyến tính 30 ... lại phân tích hồn chỉnh  Việc xử lý phân tích số liệu thiết phải tiến hành chuẩn bị cách cẩn thận Khi phân tích số liệu:  Loại thiết kết nghiên cứu  Các phương pháp thu thập số liệu Số liệu. .. LÀM SẠCH VÀ MÃ HÓA SỐ LIỆU LÀM SẠCH VÀ MÃ HÓA SỐ LIỆU 01/01/2023 Kiểm tra chất lượng số liệu Bộ số liệu cần kiểm tra tính đầy đủ thống số liệu  Một số biến thơng tin  Sự khơng thống số liệu câu... Vấn đề trình thu thập số liệu Khắc phục vấn đề trình thu thập số liệu Vai trò giám sát viên thực địa 01/01/2023 Vai trò người thu thập số liệu LÀM SẠCH VÀ MÃ HÓA SỐ LIỆU - Việc làm số liệu bao gồm

Ngày đăng: 01/01/2023, 22:22

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w