Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 176 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
176
Dung lượng
2,33 MB
Nội dung
ĐẠI HỌC Y TẾ CÔNG CỘNG BỘ MÔN THỐNG KÊ – TIN HỌC THỐNG KÊ II PHÂN TÍCH SỐ LIỆU ĐỊNH LƯỢNG HÀ NỘI, 2004 MỤC LỤC MỤC TIÊU CỦA KHOÁ HỌC CHƯƠNG GIỚI THIỆU CÁC PHƯƠNG PHÁP NGHIÊN CỨU ĐỊNH LƯỢNG 1.1 Mục tiêu 1.2 Các bước tiến hành nghiên cứu 1.3 Câu hỏi nghiên cứu 1.4 Các thiết kế nghiên cứu định lượng 1.5 Các thành phần thiết kế có ảnh hưởng tới việc phân tích kết 10 1.5.1 Đơn vị quan sát 11 1.5.2 Phương pháp chọn mẫu 11 1.5.3 Các biến đầu 12 1.5.4 Bảng kiểm thông tin để giúp bạn chuẩn bị cho phân tích thống kê 12 CHƯƠNG 2: QUẢN LÝ SỐ LIỆU 14 2.1 Mục tiêu 14 2.2 Bộ số liệu mẫu 14 2.3 Xử lý thông tin nghiên cứu cho phân tích định lượng 15 2.3.1 Xử lý nhập số liệu 15 2.3.2 Nhập số liệu 20 2.3.3 Làm số liệu 25 2.4 Các ví dụ làm số liệu 26 2.4.1 Sử dụng SPSS để làm số liệu 27 2.4.2 Sử dụng SPSS để quản lý số liệu 42 2.5 Tóm tắt 46 CHƯƠNG 3: PHÂN TÍCH THỐNG KÊ MÔ TẢ 47 3.1 Giới thiệu 47 3.2 Tiến trình kế hoạch phân tích 47 3.3 Các câu hỏi nghiên cứu từ số liệu mẫu 49 3.4 Kế hoạch phân tích số liệu mẫu - thống kê mô tả 50 3.5 Phân tích mô tả cho biến 53 3.5.1 Một biến danh mục 53 3.5.2 Một biến liên tục 57 3.6 Tóm tắt mối liên quan 64 3.6.1 Liên quan biến danh mục với biến danh mục 64 3.6.2 Mối liên quan biến liên tục biến danh mục 66 3.6.3 Mối liên quan biến liên tục với biến liên tục 70 3.7 Viết kết phân tích mô tả 74 CHƯƠNG KẾ HOẠCH PHÂN TÍCH SỐ LIỆU- THỐNG KÊ SUY LUẬN 80 4.1 Mục tiêu 80 4.2 Giới thiệu 80 4.3 Quá trình lập kế hoạch phân tích số liệu 80 4.4 Giả thuyết thống kê 81 4.5 Sử dụng kiểm định nào? 81 4.6 Sử dụng SPSS để kiểm định giả thuyết 82 4.6.1 So sánh giá trị trung bình với giá trị lý thuyết giá trị quần thể 83 4.6.2 So sánh trung bình hai nhóm 85 4.6.3 So sánh giá trị trung bình nhiều hai nhóm 89 4.6.4 So sánh đo lường lặp lại đơn vị - so sánh trung bình 95 4.6.5 So sánh đo lường lặp lại đơn vị - so sánh trung vị 98 4.6.6 So sánh đo lường lặp lại đơn vị - tỷ lệ 101 4.6.7 So sánh trung vị hai nhóm 105 4.6.8 So sánh trung vị ba hay nhiều ba nhóm 109 4.6.9 Không nhóm - tất biến mối liên hệ liên tục chuẩn 112 4.6.10 Không nhóm –Khi hai biến mối quan hệ liên tục có phân bố chuẩn 115 4.6.11 Không phân nhóm- hai biến liên tục phân bố chuẩn 118 http://www.ebook.edu.vn 4.6.12 So sánh tỷ lệ mẫu với tỷ lệ quần thể hay tỷ lệ lý thuyết 121 4.6.13 So sánh tỷ lệ hai nhóm 124 4.6.14 So sánh tỷ lệ ba hay nhiều ba nhóm 129 4.6.15 Mối liên quan kết phân loại với biến liên tục 131 4.7 Trình bày kết phân tích suy luận 131 4.8 Giả định 133 4.8.1 Sự độc lập đơn vị quan sát 134 4.8.2 Phân bố chuẩn 134 4.8.3 Tính đồng phương sai nhóm so sánh 137 4.8.4 Cộng tuyến 140 4.8.5 Giá trị kỳ vọng đủ lớn 141 4.8.5 Kết luận 145 CHƯƠNG 5: TÍNH CỠ MẪU 146 5.1 Mục tiêu 146 5.2 Các yếu tố ảnh hưởng đến tính tin cậy kết 146 5.2.1 Ý nghĩa thống kê ý nghĩa ngữ cảnh 146 5.2.2 Sự biến thiên đo lường 147 5.2.3 Sai lầm loại I sai lầm loại II 148 5.2.4 Các mối quan hệ tương hỗ 149 5.3 Những điều kiện cần thiết để tính cỡ mẫu 149 5.4 Tính cỡ mẫu 150 5.4.1 Những ví dụ sử dụng SSize 151 5.4.2 Ảnh hưởng thiết kế nghiên cứu đến cỡ mẫu 163 CHƯƠNG 6: NHIỄU VÀ SỰ ĐIỀU CHỈNH 169 6.1 Giới thiệu 169 6.2 Mục tiêu 169 6.3 Nhiễu 169 6.3.1 Định nghĩa nhiễu 169 6.3.2 Khống chế nhiễu thiết kế nghiên cứu 170 6.3.3 Khống chế nhiễu phân tích số liệu 171 6.3.4 Bài tập ví dụ 171 6.4 Kết luận 176 http://www.ebook.edu.vn Chào mừng bạn đến với Thống kê y tế II_ Phân tích số liệu Cũng tiêu đề khoá học đề cập, khoá học tổng kết lại thống kê mà bạn học Thống Kê y tế II, khoá học cung cấp cho bạn cách để ứng dụng loại kiểm định thống kê khác vào số liệu điều tra thực Bạn học cách để thực phân tích số liệu phần mềm SPSS cách mà bạn phiên giải số liệu viêt báo cáo phân tích số liệu điểm khoá học phát triển kỹ thống kê thực hành Giáo trình tóm tắt nội dung giảng cung cấp cho bạn ví dụ tham khảo Mặc dù khoá học chi làm phần riêng biệt bản, bạn học liên kết lại với nhau, khái niệm chương trước cần thết để hiểu khái niệm chương sau Mỗi học bắt đầu với dnah sách yêu cầu học, mô tả mà bạn cần mong muốn hoàn thành Bạn nên tham khảo đạt mục tiêu bạn hoàn thành học MỤC TIÊU CỦA KHOÁ HỌC Sau kết thúc khoá học, sinh viên có khả áp dụng kỹ phân tích số liệu phù hợp với cách thiết kế nghiên cứu trình phân tích số liệu: Chọn kiểm định thống kê phù hợp cho loại câu hỏi nghiên cứu nghiên cứu khác Phiên giải kết đầu phần mềm thống kê chuẩn bị viết báo cáo cho kết phân tích số liệu Sử dụng phần mềm SPSS để thực phân tích số liệu Sử dụng phần mềm SSize để tính cỡ mẫu cho loại câu hỏi nghiên cứu khác http://www.ebook.edu.vn CHƯƠNG GIỚI THIỆU CÁC PHƯƠNG PHÁP NGHIÊN CỨU ĐỊNH LƯỢNG 1.1 Mục tiêu Để phân tích tốt số liệu bạn cần hiểu thiết kế nghiên cứu Thông điệp xuyên suốt toàn môn học Bạn có kết phân tích số liệu bạn không hiểu rõ câu hỏi nghiên cứu, không nắm số liệu thu thập Những chiến lược dùng để có số liệu cần thiết gọi thiết kế nghiên cứu, phân tích thống kê đắn thực bạn không nắm thiết kế nghiên cứu tiến hành Chương cung cấp cho bạn cách tóm tắt khái niệm quan trọng cần thiết cho việc phân tích số liệu sau này, là: • • • • • Các giả thuyết xác (định nghĩa biến độc lập, biến phụ thuộc đo lường biến đó) Loại thiết kế (đó nghiên cứu thực nghiệm hay nghiên cứu quan sát) Định nghĩa đơn vị quan sát quan sát (vd phụ thuộc liệu) Xác định nguồn sai số (nhiễu, sai số chọn mẫu) Ai người sử dụng báo cáo bạn (báo cáo khoa học hay báo cáo dành cho đối tượng người đọc khác) 1.2 Các bước tiến hành nghiên cứu Nghiên cứu thường tiến hành nhận thức có (hoặc mức độ hiểu biết chúng ta) vấn đề (đôi gọi “sự thực”) cho không chưa đầy đủ Một nhà nghiên cứu thường đưa giả thuyết có quan điểm dường coi đắn mục đích cho việc thu thập số liệu để chứng minh giả thuyết Nếu số liệu thu thập ăn nhập với giả thuyết nhà nghiên cứu đưa có nghĩa nhà nghiên cứu nghi ngờ “sự thực” trước Vậy nghiên cứu trình thu thập chứng để ủng hộ bác bỏ quan điểm Quan điểm nhà nghiên cứu đối thuyết (alternative hypothesis) “sự thực” biết giả thuyết không (thường gọi tắt giả thuyết null hypothesis) Bằng chứng liệu, việc khẳng định hay bác bỏ “sự thực” kiểm định thống kê Bác bỏ “sự thực” thời có nghĩa chấp nhận “sự thực” nhà nghiên cứu đưa (chính đối thuyết) Mục đính nghiên cứu thu thập thông tin xác với nguồn lực có, với mục tiêu cung cấp chứng xác để trả lời câu hỏi nhà nghiên cứu Thiết kế nghiên cứu giống tập quản lý, bao gồm việc lập kế hoạch cho trình thu thập thông tin cho tiết kiệm nguồn lực (thời gian, tài nhân lực) Quá trình nghiên cứu bao gồm ba bước chính: Thiết kế nghiên cứu http://www.ebook.edu.vn Thu thập số liệu Phân tích phiên giải số liệu Giáo trình tập trung vào giai đoạn số 3, nhiên việc phân tích thống kê tiến hành thiếu kiến thức hai giai đoạn đầu Phần lớn câu hỏi nghiên cứu tập trung vào đánh giá khác biệt nhóm khác qua thời gian nhóm Chúng ta quan tâm đến biến thiên nhóm qua giai đoạn thời gian Càng nhiều nguồn biến thiên khác thông tin thu thập có nhiều cách giải thích kết nghiên cứu Một phương pháp nghiên cứu tốt liên quan đến việc kiểm soát nguồn biến thiên có Hai nguồn biến thiên số liệu biến thiên cá thể biến thiên việc đo lường Do kiểm soát hoàn toàn thực tế tiến hành nghiên cứu việc có sai sót (trong việc chọn sai đối tượng nghiên cứu, việc đo lường số cần thiết, v.v.) Bất kỳ lỗi mắc phải ảnh hưởng đến mức độ sai lệch kết nghiên cứu Ngoài ra, kết nghiên cứu có ngày hôm khác với kết nghiên cứu ngày khác việc đối tượng nghiên cứu đưa câu trả lời khác thời điểm khác với câu hỏi Mục đích nghiên cứu tốt cố gắng giảm tối đa nguồn gây sai số Biện pháp kiểm soát nhiều nguồn sai số (ngoài biến thiên cá thể mà khó kiểm soát được) Có hai loại sai số: sai số ngẫu nhiên (random error) sai số hệ thống (systematic error, hay bias) Sai số ngẫu nhiên định nghĩa thành phần dự đoán Sai số hệ thống sai số đo lường dẫn tới kết nghiên cứu có sai lệch cách có hệ thống Thông thường, đo lường đặc tính hay tính chất, không gặp sai số hệ thống cách tổng thể lại có sai số ngẫu nhiên khác nhóm nhỏ, số đối tượng nghiên cứu định Sai số đo lường cách hệ thống coi nghiêm trọng sai số ngẫu nhiên Sai số ngẫu nhiên dẫn tới thiếu xác, thông thường có nghĩa khác biệt nhóm bị mờ nhạt biến Sai số hệ thống nghiêm trọng, trái lại, làm cho khác biệt nhóm bị lệch lạc kết luận nghiên cứu hoàn toàn bị sai lệch Do vậy, kết không xác (inaccurate) giá trị (invalid) Sau vài nguồn sai số hệ thống nghiên cứu, đặc biệt số nguồn biến thiên quan trọng (sai số tiềm tàng) ảnh hưởng đến nghiên cứu sức khỏe : Sai số lựa chọn (selection bias): sai số dẫn đến việc nhóm chọn lựa không đại diện cho nhóm người mà nghiên cứu Điều làm lệch lạc phiên giải kết (tính khái quát hoá – generalisability) Nhiễu (confounding): sai số xuất so sánh nhóm với đặc tính khác Một biến nhiễu điển hình thường nhắc đến tuổi Nghiên cứu thực nghiệm thường phân đối tượng cách ngẫu nhiên vào nhóm khác nhau, tránh nhiễu (vì đặc tính tương đồng tất nhóm) Sai số thông tin (information bias): Khi độ đo dùng khác nhóm so sánh Ví dụ: điều tra viên hỏi câu hỏi cách kỹ lượng có chủ định người bị nhiễm HIV với người không bị nhiễm HIV họ biết tình trạng nhiễm HIV đối tượng http://www.ebook.edu.vn Có nhiều nguồn sai số khác nghiên cứu, nhiên loại sai số cần biết đến phiên giải kết nghiên cứu bạn Là người phân tích số liệu, công việc bạn xác định có thể, độ lớn nguồn sai số nhiều tốt phạm vi số liệu cho phép 1.3 Câu hỏi nghiên cứu Các câu hỏi nghiên cứu thông thường phát biểu cách khái quát, khó tiến hành phân tích thống kê phân tách thành giả thuyết khoa học kiểm định Chủ đề nghiên cứu rộng, chẳng hạn “sức khoẻ công nhân nhà máy đóng gạch”, từ hàng trăm câu hỏi nghiên cứu đặt (ví dụ “có khác sức khoẻ đường hô hấp nhóm thợ làm mỏ đá nhóm thợ làm phận lò hay không?”) Đây câu hỏi nghiên cứu chi tiết, xem xét vấn đề cụ thể tình trạng hệ hô hấp công nhân nhà máy đóng gạch - vấn đề sức khoẻ tâm thần (sang chấn tinh thần, trầm cảm) hay vấn đề khác như: tim mạch…? Việc chọn câu hỏi nghiên cứu khuôn khổ vấn đề lớn hoàn toàn phụ thuộc vào ưu tiên nhà nghiên cứu Định nghĩa câu hỏi nghiên cứu cần tiến hành cẩn thận trước thiết kế nghiên cứu xác định cụ thể Câu hỏi nghiên cứu cần chuyển sang dạng giả thuyết khoa học Nó bao gồm việc xác định biến độc lập biến phụ thuộc đo lường nào? Và làm để phiên giải mối quan hệ chúng Trong ví dụ trên, biến phụ thuộc tình trạng hệ hô hấp Như rộng, liệu dung tích thở gắng sức đo lít (FEV1) tiền sử cuả bệnh viêm phế quản (có mắc hay không mắc), vấn đề khác Như vậy, có nhiều cách để chọn nhà nghiên cứu phải định phù hợp nội dung nghiên cứu (chẳng hạn FEV1 - biến liên tục) Mặc dù vậy, liệu lần đo FEV1 đủ người công nhân phải theo dõi vài ngày năm? Kiến thức biến phụ thuộc độ tin cậy phép đo thực tế, hiểu biết sinh lý học nguy gây bệnh đường hô hấp, giúp đưa câu trả lời cho vấn đề Biến độc lập loại công nhân (làm việc mỏ lò nung) - trường hợp biến phân loại rõ ràng Phần lớn nghiên cứu định lượng thường có so sánh, hai hay nhiều nhóm so sánh qua thời gian nhóm hay kết hợp nhiều so sánh Trong trường hợp chọn so sánh FEV1 hai nhóm thời điểm Giả thuyết khoa học, theo thông lệ, thường viết thành hai mệnh đề, giả thuyết không đối thuyết Đối thuyết mà nhà nghiên cứu thực tin hay mong đợi đúng, dựa kết nghiên cứu tìm ra, giả thuyết thể trung trung tính kết đối lập Trong ví dụ trên: Giả thuyết: (còn gọi H0): FEV1 hai nhóm công nhân đốt lò công nhân làm mỏ giống Đối thuyết: (còn gọi H1): FEV1 khác hai nhóm công nhân Đây gọi kiểm định hai phía Tuy nhiên, giả thuyết khoa học đặt theo cách khác, nhà nghiên cứu tin người công nhân làm việc lò http://www.ebook.edu.vn nung có nhiều nguy bị mắc bệnh đường hô hấp so với công nhân làm công việc khai thác, vận chuyển đá mỏ: H0: FEV1 nhóm công nhân lò nung tốt so với công nhân mỏ H1: FEV1 nhóm thợ lò so với nhóm thợ mỏ Đây gọi kiểm định phía Tuy nhiên, thông thường người ta hay dùng kiểm định hai phía nghi nghờ “hướng” phép so sánh Kiểm định hai phía thường “an toàn hơn” cho phép nhà nghiên cứu đưa kết thống kê theo hai hướng (kể thu kết không mong đợi) Tất nghiên cứu định lượng tập trung vào việc thu thập đủ thông tin để bác bỏ H0 (mặc dù làm nghiên cứu cho H1 đúng) Kết luận cuối thường viết cho thể rõ điều này, ví dụ Không đủ chứng để bác bỏ H0, vậy, nghiên cứu kết luận bệnh hô hấp không liên quan đến loại công việc công nhân nhà máy gạch Hoặc Có đủ chứng để bác bỏ H0, kết luận nghiên cứu cho thấy vấn đề bệnh đường hô hấp có liên quan đến khu vực làm việc công nhân nhà máy gạch Những công nhân làm việc khu lò có nguy suy giảm chức hô hấp nhiều công nhân làm việc khu mỏ khai thác 1.4 Các thiết kế nghiên cứu định lượng Có hàng loạt thiết kế nghiên cứu cho phép làm giảm thiểu nguồn sai số ngẫu nhiên hệ thống nghiên cứu Hai loại thiết kế định lượng thực nghiệm quan sát (không thực nghiệm) Thiết kế nghiên cứu thực nghiệm dạng thiết kế có đối chứng coi lý tưởng Loại thiết kế có nguy xảy sai lệch kết Tuy nhiên, số lượng đối chứng cần thiết qui trình kiểm soát nghiên cứu, loại thiết kế thường tạo bối cảnh nghiên cứu mang tính “nhân tạo” rõ rệt, phản ánh thực Điều làm cho dạng nghiên cứu hoàn toàn không phù hợp, chí vi phạm qui định đạo đức với số dạng câu hỏi nghiên cứu cụ thể Có đặc tính phân biệt thiết kế nghiên cứu thực nghiệm, là: • Có “can thiệp”, đối tượng nghiên cứu yêu cầu tham gia thực kiểm tra/hành vi/các hoạt động mà điều kiện thực tế sống họ chưa phải làm • Có nhóm đối chứng, nhóm đối tượng nghiên cứu không nhận can thiệp nói • Có phân bổ ngẫu nhiên: đối tượng phân vào nhóm khác nhau: nhóm can thiệp hay nhóm đối chứng Hay nói cách khác, đối tượng có hội để chọn vào hai nhóm Ba đặc điểm làm tăng tối đa khả tất đặc tính đối tượng (ví dụ tuổi, đặc điểm dân số, tiền sử bệnh, v.v.) tương đương nhóm, giảm thiểu sai số biến nhiễu http://www.ebook.edu.vn Các nghiên cứu thực nghiệm khả thi loại thiết kế khác loại thiết kế nghiên cứu “ít chặt chẽ hơn” thường lựa chọn “Ít” chặt chẽ đồng nghĩa với việc khả dẫn tới sai số lớn Dưới liệt kê loại thiết kế nghiên cứu từ loại kiểm soát tốt (nghiên cứu thực nghiệm) kiểm soát (nghiên cứu mô tả) thường sử dụng nghiên cứu y tế công cộng: THỰC NGHIỆM GIẢ THỰC NGHIỆM (còn gọi “bán thực nghiệm” – quasi-experimental) Nghiên cứu đánh giá sau can thiệp (Post test) Nghiên cứu đánh giá trước / sau can thiệp (Pre-Post test) TƯƠNG QUAN Thuần tập (Cohort) Bệnh - Chứng (Case-Control) Cắt ngang (Cross-sectional) MÔ TẢ Mô tả nhiều trường hợp (Case-series) Mô tả trường hợp (Case-study) Trên thực tế, thiết kế nghiên cứu có can thiệp lại phân bổ ngẫu nhiên nhóm chứng gọi thiết kế nghiên cứu giả thực nghiệm (hoặc bán thực nghiệm) Tất nhiên, chất lượng nghiên cứu bị giảm thiếu đặc điểm thiết kế thực nghiệm, chủ yếu nguy xuất sai số không cân đặc tính nhóm Việc thiếu nhóm chứng làm giảm khả phân tích mối quan hệ nhân quả, khả xác định hiệu can thiệp hay khẳng định kết vượt khỏi phạm vi thay đổi tự nhiên xảy Tuy nhiên việc giảm kiểm soát chặt chẽ thiết kế, thiết kế giả thực nghiệm linh hoạt thường sử dụng nhiều thực tế Chúng ta cần lưu ý phiên giải kết nghiên cứu giả thực nghiệm, đặc biệt chúng dùng phổ biến nghiên cứu sức khoẻ Tiếp theo danh sách phân loại chất lượng thiết kế nghiên cứu không thực nghiệm Các thiết kế không thực can thiệp hay phân bổ ngẫu nhiên đối tượng nghiên cứu vào nhóm, chúng dựa sở quan sát hay xảy Trong số tình huống, số thiết kế kiểu có nhóm chứng không cho phép thực can thiệp Những nghiên cứu thuộc dạng kiểm soát chặt chẽ, thường có khuynh hướng dễ mắc sai số Các thiết kế nghiên cứu quan sát gồm hai dạng tương quan mô tả Nghiên cứu mô tả thiết kế để mô tả tóm tắt vật tượng, thông thường mối quan hệ biến số dạng nghiên cứu nhấn mạnh Ví dụ, người ta thiết kế nghiên cứu để xác định tỷ lệ người cộng đồng sử dụng châm cứu để chữa đau Nghiên cứu mô tả thông thường thiết kế để cung cấp thông tin dạng thiết kế dễ sinh sai số (chủ yếu sai số chọn nhiễu) Nghiên cứu tương quan đưa mối liên quan biến độc lập biến phụ thuộc, thông thường, để sinh giả thuyết Ví dụ, đặc điểm nghề nghiệp có ảnh hưởng đến việc hài lòng với nghề nghiệp? để làm điều thu thập số liệu liên quan đến nghề nghiệp, số làm việc, lương, môi trường làm việc… xem xét mối liên hệ chúng với thang điểm hài lòng nghề nghiệp Chúng ta không thu nhận http://www.ebook.edu.vn định xác liệu lương môi trường làm việc định mức độ hài lòng công việc nghiên cứu tương quan xác định đặc tính nghề nghiệp liên quan đến hài lòng nghề nghiệp tạo tiền đề cho nghiên cứu thực nghiệm vấn đề (chẳng hạn, liệu người chọn ngẫu nhiên vào nhóm nhận can thiệp nâng cao kỹ làm việc nhóm có điểm hài lòng cao người làm nhóm công việc khác hay không?) Nghiên cứu thực nghiệm có can thiệp cung cấp chứng nguyên nhân trực tiếp cho hài lòng công việc nghiên cứu tương quan Tuy nhiên, nghiên cứu thực nghiệm tiến hành với hay số bối cảnh nơi làm việc, đòi hỏi phải có kiểm soát chặt chẽ, nghiên cứu tương quan - đơn nghiên cứu quan sát - xem xét nhiều yếu tố lúc Có số dạng thiết kế nghiên cứu quan sát cụ thể loại nghiên cứu tương quan hay nghiên cứu mô tả Sau thiết kế nghiên cứu thông thường nhất: Nghiên cứu tương quan y tế công cộng bao gồm điều tra cắt ngang, nghiên cứu bệnh chứng nghiên cứu tập Nghiên cứu cắt ngang điển hình thường thực dạng điều tra đưa tranh thời điểm số vấn đề sức khoẻ hay yếu tố nguy liên quan đến vấn đề Tổng điều tra dân số ví dụ nghiên cứu cắt ngang Nghiên cứu tập nghiên cứu thành viên theo dõi qua thời gian người ta đếm xuất số kiện (thông thường trường hợp bệnh mới) Các đối tượng nghiên cứu tập chọn từ phận cá thể có đặc điểm chung (ví dụ tất người sống vùng địa lý thời điểm bắt đầu nghiên cứu, học trường, làm khu công nghiệp) Nghiên cứu tập nghiên cứu dọc, liên quan đến việc tiến hành phép đo lường lặp lặp lại theo thời gian Một thiết kế nghiên cứu bệnh chứng thu thập số liệu theo phương pháp hồi cứu, ngược với nghiên cứu tập Trong nghiên cứu bệnh chứng, xác định trường hợp bệnh trước tiên, thu thập số liệu liên quan tới đặc tính đối tượng khoảng thời gian trước bệnh xảy Chúng ta làm tương tự với nhóm đối chứng, người không bị bệnh có đặc điểm định tương tự trường hợp bệnh Vì vậy, có hai nhóm chọn vào nghiên cứu Thiết kế nghiên cứu thông dụng cần nghiên cứu kiện hay bệnh (trong làm nghiên cứu tập phải tiến hành nhiều năm có chí số nhỏ kiện) Đó ba loại thiết kế nghiên cứu thường dùng nghiên cứu YTCC, nhiên có nhiều thiết kế nghiên cứu định lượng khác Khái niệm quan trọng mà cần nhớ với thiết kế nghiên cứu khác khả gặp phải sai số khác nhau, điều cần lưu ý tới phân tích 1.5 Các thành phần thiết kế có ảnh hưởng tới việc phân tích kết Với quan điểm người phân tích số liệu, số vấn đề thiết kế đóng vai trò quan trọng khâu phân tích Dưới số vấn đề bạn cần xem xét tới tiến hành phân tích thống kê, việc phân tích đơn giản tới mức Phần 1.5.4 tóm tắt thành bảng kiểm cần thiết phân tích http://www.ebook.edu.vn 10 trước chấn thương hay sau chấn thương (điểm thay đổi biến khác) Các nhà nghiên cứu cần có vài ý tưởng độ lệch chuẩn điểm thay đổi Điều thường khó dự đoán, thường phải dựa tài liệu nghiên cứu có sẵn Trong trường hợp nghiên cứu NTIS, không tìm nghiên cứu/tài liệu giúp họ định giá trị này, thời gian để thực nghiên cứu thí điểm nên họ đưa giả định cá nhân quần thể mà thay đổi lại lớn 20 điểm chí trường hợp chấn thương trầm trọng Sử dụng giả định điểm thay đổi chạy từ -20 đến +20 có phân bố chuẩn, độ lệch chuẩn điểm thay đổi ước lượng chia cho (40/6) = 6.71 (iv) Sự khác nhỏ quan tâm - điểm thay đổi tìm điểm (v) Mức sai lầm loại I mắc phải thường xác định 5% Đó kiểm định phía nhà nghiên cứu quan tâm đến thây đổi làm giảm chất lượng sống Sai lầm loại II đựoc xác định 10%, lực kiểm định 90% Xác định cỡ mẫu cần thiết cho giả thuyết sau: Từ hình phần, chọn 7.2a, nháp chuột vào nút Estimate Hiển thị sau Với giả định phân bố chuẩn, có gần toàn giá trị quan sát nằm khoảng TB+3SD, khoảng từ giá trị bé tới lớn độ lệch chuẩn http://www.ebook.edu.vn 162 Nhập số trung bình quần thể ước lượng trước (sự khác tối thiểu mong đợi tìm ra) 5, giá trị kiểm định, 0, độ lệch chuẩn quần thể 6.7 Các ô khác điền (phương sai cỡ mẫu) Cỡ mẫu cần thiết 16 người để tìm thay đổi điểm chất lượng sống (trước- sau chấn thương) điểm Hãy nhớ chọn độ lệch chuẩn 6.7 suy đoán Tăng độ lệch chuẩn lên 10.0 cỡ mẫu tăng lên 35 Vì với giả thuyết đặc biệt nghiên cứu NTIS cần nguồn lực lớn 5.4.2 Ảnh hưởng thiết kế nghiên cứu đến cỡ mẫu Những lựa chọn bạn để tìm khác nhỏ nhất, độ lệch chuẩn, sai lầm loại I sai lầm loại II tác động lớn đến cỡ mẫu cuối Tuy nhiên bạn cần nhớ rằng, cỡ mẫu thể số lượng người mà bạn cần thiết phải thu thập số liệu được, thực tế lúc đối tượng điều tra sẵn sàng trả lời câu hỏi bạn theo dõi đối tượng suốt thời gian nghiên cứu Vì tính cỡ mẫu bạn nên tính đếm đến trường hợp đối tượng không đáp ứng tỷ lệ đối tượng bỏ Với cách chọn mẫu phức tạp mẫu cụm nhu cầu điều chỉnh yếu tố nhiễu phân tích thống kê mức độ cao yêu cầu cỡ mẫu lớn nghiên cứu thực nghiệm chọn mẫu ngẫu nhiên đơn Những ảnh hưởng thiết kế nghiên cứu trình bày tóm tắt 5.4.2.1 Tác dụng đường cong lực mẫu Nếu bạn xây dựng kế hoạch thực nghiên cứu, bạn cần chứng minh cỡ mẫu bạn phù hợp Thường giá trị bạn chọn cho tính toán cỡ mẫu ước đoán Để chắn bạn chọn cỡ mẫu phù hợp, bạn nên tính toán cho nhiều trường hợp sử dụng nhiều giá trị cho khác biệt tối thiểu tìm thấy độ lệch chuẩn Bạn thể cỡ mẫu tính đồ thị, gọi đường cong lực http://www.ebook.edu.vn 163 mẫu, dựa vào biểu đồ bạn đội nghiên cứu có định chọn cỡ mẫu có tính khả thi Ví dụ, sử dụng số liệu nghiên cứu NTIS, ta có điểm trung bình chất lượng sống 50 độ lệch chuẩn 5, đường cong khả cho so sánh hai số trung bình có dạng: Sample size per group Power curves for QOL differences between males and females (mean group = 50, sd=10) 140 130 120 110 100 90 80 70 60 50 40 30 20 10 80% 90% 38 40 42 44 46 52 54 56 58 60 62 Mean in group Đường cong cho thấy cỡ mẫu tối thiểu cần thiết cho nhóm giá trị trung bình độ lệch chuẩn điểm chất lượng sống tương ứng 55 10 nhóm Có thể thấy trung bình khác tìm 10 (trung bình nhóm 55 so với nhóm 65) cần 21 người nhóm để lực kiểm định 90% cao So sánh điều với cỡ mẫu 84 người nhóm cho khác điểm QoL nhỏ (55 đến 60) • • • Lực kiểm định mạnh cỡ mẫu tăng Sự khác tối thiểu thấy nhỏ hơn, cỡ mẫu lớn Độ lệch chuẩn lớn hơn, cỡ mẫu lớn Hãy xem xét đường cong lực mẫu 90% trên, độ lệch chuẩn điểm QoL 15 10 http://www.ebook.edu.vn 164 Sample size per group Power curves for QOL differences between males and females (mean group = 50, power 90%) 325 300 275 250 225 200 175 150 125 100 75 50 25 sd=10 sd=15 38 40 42 44 46 52 54 56 58 60 62 Mean in group Cỡ mẫu lớn khoảng hai lần bạn lấy độ lệch chuẩn 15 so với độ lệch chuẩn 10 Các tính toán cỡ mẫu nhạy cảm với việc lựa chọn độ lệch chuẩn, điều quan trọng bạn phải có sở tốt cho lựa chọn Nếu bạn ước lượng độ lệch chuẩn thấp thực tế, bạn làm giảm khả kiểm định thống kê bạn (nghĩa kết luận so sánh bạn có nguy âm tính giả lớn hơn) Các đường cong lực mẫu cho so sánh tỷ lệ khác với đường cong so sánh số trung bình tỷ lệ kiểm định lớn nhỏ Khi tỷ lệ gần 50%, đường cong khả có hình dạng tương tự so sánh số trung bình Ví dụ, xem xét đường cong khả cỡ mẫu cho so sánh người bị chấn thương đầu/cột sống với người xe http://www.ebook.edu.vn 165 Power curves for prevalence of head & spinal injury in pedestrian versus vehicle accidents (proportion group = 35%, power=90%, one-tailed) Sample size per group 1800 1600 1400 1200 1000 800 600 400 200 0 0.1 0.2 0.3 0.4 0.5 0.6 Proportion in group Những điểm cần lưu ý: • • • Cỡ mẫu cần thiết để đưa khác biệt tỷ lệ lớn phân tích khác biệt trung bình Cỡ mẫu tăng tìm kiếm khác biệt nhỏ Không đường cong lực mẫu so sánh giá trị trung bình, đường cong không đối xứng - Cỡ mẫu cần thiết để phát tỷ lệ tăng (35% lên 40% = +5%, màu hồng) không giống với cỡ mẫu phát tỷ lệ giảm với mức tương tự (35% xuống 30% = -5%, màu xanh) Biểu đồ sau trình bày đường cong lực mẫu tượng quan tâm thông dụng hơn, khoảng 10% Tính không đối xứng thể rõ trường hợp http://www.ebook.edu.vn 166 Sample size per group Power curves for prevalence of head & spinal injury in pedestrian versus vehicle accidents (proportion group = 10%, power=90%, one-tailed) 2500 2000 1500 1000 500 0 0.05 0.1 0.15 0.2 0.25 Proportion in group 5.4.2.2 Các yếu tố điều chỉnh ảnh hưởng thiết kế Với việc sử dụng thiết kế phức tạp hơn, cỡ mẫu cần phải lớn để đạt lực kiểm định tìm khác cần thiết Bất kỳ thiết kế phức tạp thử nghiệm ngẫu nghiên sử dụng phương pháp chọn mẫu ngẫu nghiên đơn cần đến vài giá trị để điều chỉnh cỡ mẫu sử dụng phần mềm SSize Giá trị mẫu tối thiểu cần phải cộng thêm giá trị để điều chỉnh vấn đề: (i) Nếu cách lấy mẫu cụm mẫu nhiều giai đoạn sử dụng, tăng cỡ mẫu lên từ 1.6 – 3.0 lần phụ thuộc vào tính tương đồng mà bạn mong đợi (cho biến phụ thuộc) cụm Ví dụ, sức khoẻ tâm thần hai đứa trẻ trường học dường mối tương quan nhiều hai đứa trẻ từ hai trường khác Trường học biến cụm, sức khoẻ tâm thần trẻ chịu ảnh hưởng nhiều yếu tố bên yếu tố trường học Nguợc lại, biến phụ thuộc kết học tập môn toán điểm toán hai đứa trẻ trường lại có tương quan lớn điểm hai đứa trẻ hai trường khác (nếu việc giảng dạy yếu tố định việc học tập) Yếu tố hiệu chỉnh co cụm biết đến giá trị hiệu lực thiết kế, giá trị khác xem xét biến độc lập khác Hiệu lực thiết kế cho biến phụ thuộc bạn công bố nghiên cứu tương tự trước nhìn chung khó tìm hầu hết trường hợp bạn phải tự ước đoán giá trị Bạn chắn hiệu lực thiết kế mạnh bạn hoàn thành nghiên cứu, thực tế thiếu thông tin hiệu http://www.ebook.edu.vn 167 thiết kế nhà nghiên cứu dùng giá trị ngầm định 2.0 (ii) Hãy cân nhắc tỷ lệ đối tượng mẫu bạn bỏ (nếu bạn có thiết kế nghiên cứu dọc) Ví dụ, tăng cỡ mẫu bạn lên 1.2 bạn nghĩ có 20% người bỏ nghiên cứu bạn (iii) Nếu thiết kế nghiên cứu bạn nghiên cứu thực nghiệm, bạn phải điều chỉnh nhiễu cách dùng phương pháp thống kê phức tạp (chương 6) Tăng mẫu lên 1.2 để đáp ứng yêu cầu (iv) Cuối cùng, cân nhắc đến tỷ lệ người tham gia/đáp ứng bạn đạt Ví dụ, bạn mong muốn đạt 70% tham gia, bạn cần tăng mẫu lên 1.4 (= 100%/70%) Bạn thấy cỡ mẫu tối thiểu 50 cho nhóm nhanh chóng trở thành 202 cho mối nhóm tất yếu tố phù hợp!!! Cân nhắc cẩn thận thiết kế có tác động lên cỡ mẫu, từ giả định bạn sử dụng với công thức tới vấn đề phát sinh mà cần phải quan tâm đến Những gợi ý cho bạn số ý tưởng cỡ mẫu cần cho nghiên cứu bạn, nhiên nên tham khảo ý kiến chuyên gia thống kê bạn tính cỡ mẫu trường hợp thiết kế nghiên cứu phức tạp http://www.ebook.edu.vn 168 CHƯƠNG 6: NHIỄU VÀ SỰ ĐIỀU CHỈNH 6.1 Giới thiệu Hầu hết nghiên cứu sức khoẻ liên quan đến lượng giá quan sát người môi trường sống tự do, có tác động vào Điều dẫn đến khả lớn khác biệt cá nhân che lấp khác biệt can thiệp khác biệt thật nhóm Các phân tích thống kê cần phải tính đếm đến khác biệt nhiều tốt trước tìm kiếm khác biệt thật mà quan tâm Những khác biệt phiền phức biết đến tác động nhiễu 6.2 Mục tiêu Chỉnh sửa khái niệm nhiễu phân nhánh phiên giải kết Trình bày kiến thức báo cáo khác phân tích thô phân tích hiệu chỉnh Hiểu nguyên tắc hiệu chỉnh giá trị thống kê 6.3 Nhiễu 6.3.1 Định nghĩa nhiễu Nhiễu nghiên cứu y tế công cộng có nghĩa có giải thích khác xen vào kết nghiên cứu Điều có nghĩa mối liên quan biến phụ thuộc biến độc lập thật có vài mối liên quan khác nguyên nhân kết Sự có mặt nhiễu dẫn đến kết luận nghiên cứu sai, nhiễu cần phải khống chế Ví dụ, kết trình độ học vấn có liên quan đến chất lượng sống sau chấn thương, thực tế tuổi thực ảnh hưởng đến chất lượng sống Vì có mối liên quan tuổi với trình độ học vấn, nên có mối liên quan số tuổi người với điểm QoL dường có mối liên quan trình độ học vấn QoL Mối liên quan trình độ học vấn QoL xem bị nhiễu biến tuổi Những định nghĩa dịch tễ nhiễu có cân đặc tính nhóm so sánh, ví dụ nhóm có biểu đặc tính đặc thù người so sánh với người khác nhóm nhóm khác http://www.ebook.edu.vn 169 Định nghĩa thống kê nhiễu biến thứ ba có tương quan với biến phụ thuộc biến độc lập mà chúng mối quan tâm hàng đầu kiểm định giả thuyết Trong nghiên cứu y tế công cộng, tuổi biến nhiễu cổ điển, tất điều kiện sức khoẻ chịu ảnh hưởng tuổi tác, nhiều biến độc lập thay đổi với tuổi 6.3.2 Khống chế nhiễu thiết kế nghiên cứu Các tác động nhiễu khống chế khâu thiết kế nghiên cứu phân tích số liệu Thiết kế nghiên cứu cẩn thận cân nhắc cách tiếp cận khả thực Phân bổ ngẫu nhiên ghép cặp hai cách thường dùng để khống chế nhiễu cách tối đa thiết kế nghiên cứu 6.3.2.1 Phân bổ ngẫu nhiên Như trình bày phần 1, thiết kế nghiên cứu thực nghiệm sử dụng khống chế hầu hết trả lời câu hỏi nghiên cứu Với phân bổ ngẫu nhiên, nhà nghiên cứu làm tối đa hội để phân bổ đặc tính vào nhóm so sánh Chỉ có điều khác biệt nhóm có hay nhiều can thiệp tiến hành cho nhóm Bất kỳ khác biệt kết phân tích can thiệp tác động nhiễu 6.3.2.2 Ghép cặp Có nhiều câu hỏi nghiên cứu thực tế trả lời sử dụng thiết kế nghiên cứu thực nghiệm, cần phải sử dụng đến thiết kế nghiên cứu quan sát Trong hầu hết đề tài nghiên cứu, danh sách biến nhiễu dự kiến thường đưa từ trước làm nghiên cứu; qua việc xem xét nghiên cứu tiến hành trước thực địa kiến thức chuyên môn nhóm nghiên cứu Nếu biết hai biến có ảnh hưởng đến mối liên quan nghiên cứu, thiết kế nghiên cứu sử dụng phương pháp ghép cặp với biến nhiễu Ghép cặp bao gồm bắt buộc nhóm so sánh có đặc tính tương tự nhóm khác Ví dụ, biến tuổi cho biến nhiễu với mối liên quan trình độ học vấn chất lượng sống, thiết kế nghiên cứu cho phân bố tuổi tất nhóm trình độ học vấn Nếu lấy mẫu theo phương pháp ngẫu nhiên đơn từ quần thể, số người trẻ tuổi nhóm trình độ học vấn THCS nhiều nhóm trình độ học vấn từ THCS trở lên Nếu ghép cặp nhóm so sánh, nên nhóm theo phân bố tuổi nhóm có trình độ học vấn từ THCS trở lên với nhóm THCS với mẫu người trẻ trước Điều biết đến ghép cặp theo tần suất, đặc tính nhóm bắt buộc phải tương tự Ghép cặp thực mức độ cá thể, thường thấy thiết kế nghiên cứu bệnh-chứng Ví dụ, bệnh ung thư vòm họng có khuynh hướng gặp quần thể người lớn tuổi thường gặp nam giới Để đảm bảo phân bố giới tính tuổi nhau, ghép cặp cá thể chọn ngẫu nhiên chứng cho trường hợp ung thư từ tập hợp quần thể chứng với tuổi giới tính tương tự trường hợp bệnh nghiên cứu Bằng ghép cặp, tần suất cá thể, ảnh hưởng biến nhiễu khống chế, mối liên quan chúng với biến phụ thuộc loại bỏ (cả nhóm http://www.ebook.edu.vn 170 chứng nhóm bệnh có phân bố biến nhiễu nên nhiễu khái niệm trên) 6.3.3 Khống chế nhiễu phân tích số liệu Trong phân tích, có hai cách để khống chế tác động biến nhiễu: phân tích phân tầng mô hình hồi quy đa biến 6.3.3.1 Phân tích phân tầng Phân tích phân tầng giai đoạn phân tích cho ta kết tương đương với ghép cặp thiết kế nghiên cứu Phân tầng có nghĩa tiến hành phân tích hai biến phụ thuộc biến độc lập theo phân nhóm biến nhiễu Bằng cách phân tầng xem xét phân nhóm biến nhiễu bạn làm cho đối tượng phân nhóm có mối liên quan với biến nhiễu tương tự nhau, biến không biến nhiễu theo định nghĩa phần 6.3.1 6.3.3.2 Mô hình hồi quy đa biến Với phân tích đơn giản, phân tích phân tầng thích hợp việc thăm dò nhiễu Tuy nhiên, thường có nhiều biến nhiễu cần phải khống chế, phân tích phân tầng nhanh chóng trở nên đơn điệu - phải lặp lại phân tích hai biến rất, nhiều phân nhóm Một cách nâng cao để khống chế đa nhiễu sử dụng mô hình hồi quy đa bíên Mô hình dạng mở rộng hồi qui tuyến tính đơn giản, mô hình sử dụng nhiều biến độc lập để giải thích thay đổi biến phụ thuộc Mặc dù mô hình đa biến làm điều tương tự (điều chỉnh đa nhiễu), thực tế có nhiều dạng khác mô hình đa biến Giống lựa chọn kiểm định thống kê phần 4, lựa chọn mô hình đa biến dựa độ đo biến phụ thuộc Trong phần đề cập đến dạng mô hình đa biến (hồi qui đa tuyến tính), nguyên lý khái quát hoá cho tất mô hình khác Giống phân tích phương sai bản, chúng phân chia biến thiên biến phụ thuộc thành biến thiên thành phần: ảnh hưởng nhóm (biến độc lập), biến nhiễu 1, biến nhiễu 2, v v Kiểm soát ảnh hưởng nhiễu cho phép có lượng giá “tinh” ảnh hưởng biến độc lập, ảnh hưởng coi ước lượng có hiệu chỉnh Ước lượng mà hay dùng trước thường gọi ước lượng hay ước lượng không hiệu chỉnh “ước lượng ” thuật ngữ thông thường cho giá trị thống kê rút từ phân tích như– trung bình, tỷ lệ, tỷ suất chênh, tương quan 6.3.4 Bài tập ví dụ Hãy xem xét mối liên quan ví dụ phần 6.3.1 trên, mối liên quan QoL sau chấn thương trình độ học vấn nghi ngờ bị nhiễu biến tuổi Để đơn giản, chũng ta xem xét trình độ học vấn theo hai nhóm (“dưới THCS” “bằng THCS”), nhóm tuổi theo nhóm (0-14, 15-49, 50-100 tuổi) Câu hỏi nghiên cứu ‘Có mối liên quan QoL sau chấn thương trình độ học vấn?” Câu hỏi đưa dạng giả thuyết khoa học H0: Điểm trung bình QoL sau chấn thương không kiên quan đến trình độ học vấn 6.3.4.1 Phân tích không hiệu chỉnh http://www.ebook.edu.vn 171 Phân tích trình bày kiểm định t so sánh hai số trung bình điểm QoL hai nhóm trình độ học vấn Group Statistics general quality of life after injury Education group less than secondary secondary or more N Mean 51.6214 56.1402 552 1141 Std Deviation 9.52386 9.89327 Std Error Mean 40536 29288 Independent Samples Test Levene's Test for Equality of Variances F general quality of life after injury Equal variances assumed Equal variances not assumed 729 t-test for Equality of Means Sig t 393 df Sig (2-tailed) Mean Difference Std Error Difference 95% Confidence Interval of the Difference Lower Upper -8.917 1691 000 -4.5189 50677 -5.51281 -3.52490 -9.036 1127.888 000 -4.5189 50010 -5.50008 -3.53762 100 711 694 1631 general quality of life after injury 80 60 40 933 794 725 441 20 887 N= 552 1141 less than secondary secondary or more Education group Từ kết mô tả phân tích, cho thấy khác biệt có ý nghĩa thống kê điểm trung bình QoL theo trình độ học vấn (p < 0.001) Điểm trung bình QoL nhóm có trình độ học vấn từ THCS trở lên cao nhóm THCS 4.5 điểm (95% khoảng tin cậy 3.5 đến 5.5) 6.3.4.2 Tuổi có phải biến nhiễu không? Định nghĩa thống kê biến nhiễu chứng minh có mối liên quan biến phụ thuộc biến độc lập với biến nhiễu tiềm tàng Vì cần tìm xem biến tuổi (nhiễu tiềm tàng) có liên quan với (i) điểm QoL sau chấn thương (biến phụ thuộc) (ii) trình độ học vấn (biến độc lập) (i) Điểm QoL sau chấn thương nhóm tuổi http://www.ebook.edu.vn 172 QoL biến liên tục tuổi biến phân nhóm ví dụ Vì tính trung bình điểm QoL nhóm tuổi Report general quality of life after injury Age-group 0-14 15-49 50-100 Total Mean 49.6981 55.2278 57.8191 54.6669 N 265 1229 199 1693 Std Deviation 9.56751 9.88559 9.01051 9.99864 100 711 1631 832 660 80 694 641 1065 664 general quality of life after injury 1176 60 40 795 429 1456 794 1382 725 441 20 887 N= 265 1229 199 0-14 15-49 50-100 Age-group Có khuynh hướng tăng điểm QoL tuổi tăng Vì tuổi QoL có liên quan với Lưu ý: Không thích hợp để sử dụng ý nghĩa thống kê để đưa kết luận biến có nhiễu hay không Sử dụng ý nghĩa ngữ cảnh trường hợp (ii) Trình độ học vấn nhóm tuổi Cả hai biến phân loại, bảng ngẫu nhiên sử dụng Education group * Age-group Crosstabulation Education group less than secondary secondary or more Total http://www.ebook.edu.vn Count % within Age-group Count % within Age-group Count % within Age-group 0-14 201 75.6% 65 24.4% 266 100.0% Age-group 15-49 271 21.9% 966 78.1% 1237 100.0% 50-100 85 42.7% 114 57.3% 199 100.0% Total 557 32.7% 1145 67.3% 1702 100.0% 173 Tỷ lệ đối tượng có trình độ học vấn từ THCS trở lên nhóm tuổi 15-49 tuổi cao so với hai nhóm tuổi lại, mong đợi, tỷ lệ nhóm tuổi 15 thấp hởn nhóm tuổi 50-100 Từ (i) (ii), xác minh biến tuổi có liên quan đến biến phụ thuộc biến độc lập, biến tuổi cần phải xem biến nhiễu mối liên quan phải điều chỉnh 6.3.4.3 Thăm dò nhiễu biến tuổi sử dụng phân tích phân tầng Phân tích phân tầng giúp thăm dò biến tuổi gây nhiễu đến mối liên quan giưa điểm QoL trình độ học vấn Như phân tích lập lại mối liên quan hai biến phân nhóm biến nhiễu Loại phân tích thực với biến nhiễu dạng biến liên tục (vì phải dùng nhóm tuổi ví dụ) Report general quality of life after injury Age-group 0-14 15-49 50-100 Total Education group less than secondary secondary or more Total less than secondary secondary or more Total less than secondary secondary or more Total less than secondary secondary or more Total Mean 49.0249 51.8125 49.6981 52.4023 56.0083 55.2278 55.3176 59.6842 57.8191 51.6214 56.1402 54.6669 N 201 64 265 266 963 1229 85 114 199 552 1141 1693 Std Deviation 9.74651 8.71939 9.56751 9.26506 9.91376 9.88559 8.13021 9.21457 9.01051 9.52386 9.89327 9.99864 Nhìn vào tất dòng tổng bảng trên, thấy mối liên quan không thích ứng phần 6.3.4.1; khác điểm trung bình QoL nhóm trình độ học vấn “dưới THCS” nhóm “từ THCS” 4.5 điểm Hãy xem khác tương tự nhóm tuổi khác nhau; khác 2.8 điểm cho nhóm tuổi đến 14, 3.6 điểm cho nhóm tuổi 15 đến 49, 4.3 điểm cho nhóm tuổi 50 đến 100 Đây tất xếp tương tự, khác biệt cao thấp trường hợp, với phần lớn mẫu thấp ước lượng không thích ứng 4.5 Vì ước lượng không hiệu chỉnh ước lượng với khác thực Bằng phân tích phân tầng, khống chế ảnh hưởng biến tuổi (ít với mức độ nhóm tuổi) ước lượng có giá trị khác trung bình hai nhóm trình độ học vấn khác dựa trọng số khác trung bình tầng theo tuổi, trọng số theo tỷ lệ tầng tuổi Điều mang lại điểm trung bình 3.6, nhỏ giá trị không hiệu chỉnh 4.5 bạn thấy có nhiều biến nhiễu đáng quan tâm, nhanh chóng trở nên tẻ nhạt thực phân tích phân tầng riêng biệt số liệu bảng nhiều hàng nhiều cột (phức tạp) trở lên thưa thớt Phân tích phân tầng quan http://www.ebook.edu.vn 174 trọng suy xét hai ba biến nhiễu nghiên cứu Các phân tích cho bạn thấy điều xảy với mối liên quan mà lo lắng đến phức tạp toán học giả định kết hợp mô hình đa biến Tuy nhiên, hầu hết phân tích nghiên cứu quan sát cần kết hợp vài mô hình đa biến để tính toán cách đầy đủ ảnh hưởng biến nhiễu 6.3.4.4 Khống chế nhiễu mô hình đa biến ‘Khống chế’ biến thường có nghĩa mối liên quan xem xét giả định biến thứ ba (biến bị khống chế) có giá trị cho người tất nhóm so sánh khống chế biến tuổi cách phân tích người nhóm tuổi 0-14 riêng rẽ với người nhóm tuổi 15-49 riêng rẽ với người nhóm tuổi 49-100 Có nhiều phương pháp dùng để khống chế điều chỉnh ảnh hưởng biến thứ ba đến mối liên quan hai biến khác Có số tính toán dễ dàng đợc thực máy tính Một số khác lại yêu cầu tính toán máy vi tính Cách thông dụng mạnh thống kê khống chế ảnh hưởng nhiều biến nhiễu hợp với mô hình đa biến (như biết, không hầu hết trường hợp, mô hình đa biến vài sách tài liệu nghiên cứu) Trong hầu hết phiên giải nghiên cứu sức khoẻ, thường có nhiều biến nhiễu tiềm năng, tất biến có hai ba phân loại Ví dụ, nghiên cứu quan tâm đến mối liên quan trình trạng suy dinh dưỡng trẻ thực hành đồng ruộng khu vực sông Mê Kông, nơi mà có giả thuyết cho thực hành tưới tiêu lọc bỏ số chất dinh dưỡng quan trọng từ đất trồng thiếu sắt, đặc biệt cần cho phát triển trẻ Tuy nhiên, gần phát triển trẻ thực hành đồng ruộng vùng tương quan với thu nhập, trình độ học vấn cha me, tiếp cận với sở y tế nhiều biến khác Hãy hình dung số lượng tính toán liên quan phân tích phân tầng cho tất biến nhiễu tiềm tàng này! Mô hình đa biến khống chế tất biến nhiễu tiềm tàng lần Các dạng mô hình đa biến đa dạng, phụ thuộc, tương tự kiểm định thống kê đơn giản bạn học, cho dạng biến kết Tuy nhiên tất mô hình có chung mục đích - cung cấp ước lượng không bị nhiễu mói liên quan hai biến Mô hình dựa kết trình bày theo cách giống kết không hiệu chỉnh, hai biến đơn giản Ví dụ, bạn trích dẫn giá trị trung bình kế hoạch phân tích hai biến mô hình bạn chọn cho mô hình đa biến nên đưa gí trị trung bình hiệu chỉnh Mô hình đa biến điều chỉnh nhiễu: Cho giá trị trung bình hiệu chỉnh sử dụng mô hình hồi qui đa tuyến tính, mở rộng hồi qui tuyến tính phần 4.6.15 Cho tỷ lệ/tỷ suất hiệu chỉnh dùng môhình hồi qui Logistic Với ví dụ trên, mô hình hồi qui đa tuyến tính cân nhắc phù hợp với phân bố rời rạc trình độ học vấn tuổi với điểm QoL sau chấn thương Vì phân bố biến rời rạc nên có giá trị trung bình điểm QoL phân nhóm trình độ học vấn, khống chế theo tuổi http://www.ebook.edu.vn 175 Bảng : Điểm trung bình QoL sau chấn thương nhóm trình độ học vấn, hiệu chỉnh theo tuổi Dưới THCS Từ THCS trở lên Khác biệt Trung bình hiệu chỉnh (se) 51.6 (0.4) 56.1 (0.3) 4.5 (0.5) Trung bình chưa hiệu chỉnh (se) 52.1 (0.4) 55.9 (0.3) 3.8 (0.5) Chú ý khác biệt hiệu chỉnh cho biến nhiễu ước lượng mà có Giá trị trung bình khác giảm từ 4.5 xuống 3.8 Nhìn chung, kết hiệu chỉnh khác với ước lượng không hiệu chỉnh (cho 10% hơn), kết hiệu chỉnh gần với mối liên quan thật Ở khác giá trị trung bình hiệu chỉnh không hiệu chỉnh 10% khác biệt, nên hiểu có nhiễu thực biến tuổi Vì thế, phân tích với nhiễu không khống chế tạo ước lượng bị sai số Khi kết hiệu chỉnh tương tự kết thô vấn đề cần nói kết Đôi khống chế biến mà chúng trở thành biến nhiễu không làm thay đổi ước lượng không hiệu chỉnh (không có nhiễu) Nhiễu tác động theo hai hướng: (i) khác hiệu chỉnh lại thấp chưa hiệu chỉnh (nhiễu dương tính) (ii) khác hiệu chỉnh lại cao chưa hiệu chỉnh (nhiễu âm tính) 6.4 Kết luận Bạn học xong thống kê sinh học II phần phần tích số liệu Bây bạn nên có kỹ cần thiết để mô tả phân tích số liệu nghiên cứu với trình độ Phần cuối cho bạn thêm nhận biết cần thiết có kỹ thuật thống kê tinh vi số liệu bạn có từ thiết kế nghiên cứu quan sát có nhiễu Các phần trước cho bạn thấy thiết kế nghiên cứu phức tạp (như liên quan đến mẫu cụm) nên phân tích với kỹ thuật mô tả sách Tham khảo thêm nhà thống kê câu hỏi nghiên cứu kế hoạch phân tích số liệu bạn cần sách http://www.ebook.edu.vn 176 [...]... phải nghỉ học hoặc nghỉ 1 Bộ số liệu sử dụng trong chương trình giảng d y được rút ra từ nghiên cứu chấn thương trên toàn quốc do ĐH Y tế công cộng phối hợp cùng 8 trường ĐH và Viện Y tiến hành Bộ số liệu dùng để giảng d y ở đ y đã được chỉnh sửa một phần so với bộ số liệu gốc với mục đích để phù hợp với nội dung của bài học http://www.ebook.edu.vn 14 việc ít nhất là một ng y Nghiên cứu n y thu thập... 2 Anh/chị là nam hay nữ (khoanh vào lựa chọn phù hợp)? Nam Nữ 3 Anh/chị sống ở đâu? (Khoanh vào lựa chọn phù hợp) Thành phố Nông thôn 4 Anh/chị đã học đến lớp m y (Khoanh vào lựa chọn phù hợp)? Không đi học Tiểu học Dưới THCS Trên THCS Học nghề Đại học Trên đại học Trẻ nhỏ 5 Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)? Làm ruộng CBCNVC Buôn bán nhỏ Làm chủ Học sinh Nghề thủ công Nghỉ hưu Mất sức... Tuy nhiên điều n y thường là không thể thực hiện được 2.4.1 Sử dụng SPSS để làm sạch số liệu 2.4.1.1 Thực đơn hay Syntax? SPSS là một phần mềm rất thuận tiện cho người sử dụng Có hai cách để sử dụng phần mềm n y; cách thứ nhất là dùng thực đơn có trong Data Window Chương 3 và 4 cho bạn th y làm thế nào để SPSS đưa ra những thống kê mô tả và suy luận từ thực đơn Hầu hết các lệnh thống kê mô tả và suy... trên Các bài học tiếp theo sẽ cung cấp các công cụ thống kê hoặc những cách tiếp cận để phân tích tính toán cho các tình huống khác nhau Mục đích của chương trình n y hướng dẫn bạn là nhận ra sự khác nhau, lựa chọn và áp dụng các kỹ thuật thống kê cơ bản phù hợp để phiên giải các kết quả phân tích http://www.ebook.edu.vn 13 CHƯƠNG 2: QUẢN LÝ SỐ LIỆU 2.1 Mục tiêu Sau khi học xong bài n y học viên có... miền Trung 6 = Cao Nguyên trung bộ 7 = Đông Nam 8 = Lưu vực sông Mê Kông ageround Tuổi tính theo năm 0 – 65 sex Giới tính 1 = Nam 2 = Nữ u_r Nơi cư trú 0 = Thành phố 1 = Nông thôn educatio Cấp học cao nhất 1 = Mù chữ 2 = Tiểu học 3 = Cấp II 4 = Cấp III 5 = Học nghề http://www.ebook.edu.vn 18 6 = Đại học 7 = Sau đại học 8 = Trẻ nhỏ 99 = Không trả lời occupati Nghề nghiệp trantype Loại phương tiện giao... hỏi nghiên cứu thành giả thuyết khoa học có thể kiểm định được (giả thuyết không và đối thuyết) Các bước sau đ y sẽ giúp bạn làm điều đó: 2 Đó là thiết kế nghiên cứu thực nghiệm hay quan sát ? 3 Đơn vị quan sát là gì? 4 Các đơn vị quan sát được l y mẫu theo phương pháp ngẫu nhiên đơn hay các phương pháp mẫu phức tạp hơn? 5 Các phép đo lường có được lặp lại (theo thời gian) hay có liên quan với nhau (chẳng... xuất hiện trong Syntax Window như hình dưới đ y 4 Bôi đen của cú pháp n y và nhấp chuột lên mũi tên ở thanh công cụ để thực hiện cú pháp Kết quả sẽ xuất hiện trong các cửa sổ riêng rẽ - Output Window Bạn có thể sửa lại câu lệnh n y và thay h_id bằng bất kỳ tên biến nào biểu thị bằng số xác định và trực tiếp viết trên Syntax Window Kết quả Đ y là kết quả của cú pháp trên Như bạn th y có một số con số... thành Tính không nhất quán có thể là do các lỗi mã hoá số liệu hoặc đánh m y mà đã không bị phát hiện trong hai lần kiểm tra (nếu điều n y x y ra), hoặc đối tượng phỏng vấn trên thực tế đã đưa ra những câu trả lời không nhất quán Nguyên nhân cuối cùng n y yêu cầu phải liên lạc với đối tượng phỏng vấn để xác định lại nhưng điều n y thường là không thể thực hiện được 2.4 Các ví dụ về làm sạch số liệu Trong... ở đ y bao gồm các biến liên tục thực sự và biến sự dụng thang đo khoảng (interval) Trong khi đó biến phân loại bao gồm biến nhị thức (dichotomous), định danh (nominal), và biến thứ bậc (ordinal) Biến số sử dụng là liên tục hay phân loại sẽ quyết định cách chúng ta tóm tắt số liệu (trung bình hay tỷ lệ phần trăm), hoặc cách chúng ta lựa chọn kiểm định thống kê Trong các phần sau đ y, bạn sẽ th y rõ... mẫu phiếu được thiết kế cho m y tính tự quét, phần nhập số liệu y u cầu con người dùng tay và mắt để chuyển những thông tin, vì thế có thể x y ra các lỗi đánh m y Có nhiều cách nhập số liệu mà có thể hạn chế đến mức thấp nhất các lỗi đánh m y Cách tốt nhất là tạo một chương trình nhập số liệu sử dụng một phần mềm quản lý số liệu ví dụ như Microsoft Access, chương trình n y có những chức năng để kiểm