Xử lý nhiễu thống kê

32 472 0
Xử lý nhiễu thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nhiễu kiểm soát nhiễu mô hình Mục tiêu học tập Khái niệm Nhiễu gì? • Nhiễu (confounder): Một biến số (yếu tố) thứ làm ảnh hưởng tới mối liên quan phơi nhiễm bệnh • Điều kiện để biến ngoại lai nhiễu: – Có mối liên hệ với phơi nhiễm NC – Có mối liên hệ với tình trạng SK NC – Không phải yếu tố trung gian mối quan hệ nhân phơi nhiễm – bệnh Sơ đồ thể nhiễu Phơi nhiễm (Exposure) Bệnh (Disease) Nhiễu (Confounder) Ví dụ • Một nghiên cứu tìm thấy mối liên hệ tình trạng mang bật lửa nguy mắc bệnh ung thư phổi nam giới Phơi nhiễm (Mang bật lửa) Bệnh (Mắc ung thư phổi) Nhiễu (Tình trạng hút thuốc lá) Ví dụ • Một nghiên cứu tìm hiểu ảnh hưởng hormone testosterone đến nguy gãy xương đàn ông; yếu tố nhiễu tiềm tàng: độ tuổi Phơi nhiễm (Lượng hormon testosterone) Bệnh (Nguy gãy xương nam giới) Nhiễu (Độ tuổi) Các loại nhiễu thường gặp • Nhiễu toàn phần: mối liên hệ phơi nhiễm tình trạng sức khỏe giải thích toàn yếu tố ngoại lai (yếu tố nhiễu) Ví dụ • Nhiễu phần: mối liên hệ phơi nhiễm tình trạng sức khỏe giải thích phần yếu tố ngoại lai Ví dụ 2 Các phương pháp kiểm soát nhiễu thường gặp Các phương pháp kiểm soát nhiễu • Có thể kiểm soát nhiễu giai đoạn thiết kế nghiên cứu hay giai đoạn phân tích kết • Các phương pháp kiểm soát – Phân bổ ngẫu nhiên – Giới hạn – Ghép cặp – Phân tầng – Hồi quy đa biến Giai đoạn thiết kế NC Giai đoạn phân tích số liệu Ví dụ • Bộ số liệu: nhieu_linear.sav • Mối liên hệ chiều cao, giới tính, nồng độ hemoglobin Analyze Regression Linear Tìm mối liên quan nồng độ hemoglobin chiều cao đối tượng Kết (1) Analyze Regression Linear Đưa biến “Giới tính” vào mối liên quan để xác định yếu tố nhiễu hay không Kết (2) Nhận xét • Hệ số hồi qui thô mối liên hệ chiều cao- nồng độ HB: 0.114 (0.4; 0.19) với p0.05 • Khi thêm biến giới tính vào phương trình, mối liên hệ chiều cao- nồng độ HB trở thành ý nghĩa thống kê => diện NHIỄU TOÀN PHẦN (mối liên hệ chiều cao- nồng độ HB giải thích hoàn toàn diện giới tính) Kết luận kiểm định nhiễu mô hình hồi qui tuyến tính So sánh Hệ số hồi qui B thô với hệ số hồi qui hiệu chỉnh Nếu sau quản lý cho nhiều yếu tố nhiễu tiềm tàng, hệ số hồi hiệu chỉnh trở nên ý nghĩa thống kê hệ số hồi qui hiệu chỉnh thay đổi 10% so với hệ số hồi qui thô có diện yếu tố nhiễu Kiểm soát nhiễu mô hình hồi quy logistics Ví dụ • Bộ số liệu: nhieu_logistics.sav • Mối liên hệ uống cà phê, hút thuốc bệnh mạch vành Analyze Regression Binary Logistics Tìm mối liên quan cà phê bệnh mạch vành Kết (1) Analyze Regression Binary Logistics Đưa vào biến “Hút thuốc” để xác định xem có yếu tố nhiễu hay không? Kết (2) Nhận xét • OR thô mối liên hệ café-mạch vành = 7.11 (p0.05) • Khi thêm biến smoking vào phương trình, mối liên hệ café-mạch vành trở thành ý nghĩa thống kê => Đây diện NHIỄU TOÀN PHẦN (mối liên hệ uống café nguy bệnh mạch vành giải thích hoàn toàn diện tình trạng hút thuốc lá) Kết luận kiểm định nhiễu mô hình hồi qui logistics So sánh OR thô với OR hiệu chỉnh Nếu sau quản lý cho nhiều yếu tố nhiễu tiềm tàng, OR hiệu chỉnh trở nên ý nghĩa thống kê OR hiệu chỉnh thay đổi 10% so với OR thô => có diện yếu tố nhiễu [...]... giới tính) Kết luận về kiểm định nhiễu trong mô hình hồi qui tuyến tính So sánh Hệ số hồi qui B thô với hệ số hồi qui hiệu chỉnh Nếu sau khi quản lý cho một hoặc nhiều yếu tố nhiễu tiềm tàng, hệ số hồi hiệu chỉnh trở nên không có ý nghĩa thống kê hoặc hệ số hồi qui hiệu chỉnh thay đổi trên 10% so với hệ số hồi qui thô có sự hiện diện của yếu tố nhiễu 5 Kiểm soát nhiễu trong mô hình hồi quy logistics... bằng sự hiện diện của tình trạng hút thuốc lá) Kết luận về kiểm định nhiễu trong mô hình hồi qui logistics So sánh OR thô với OR hiệu chỉnh Nếu sau khi quản lý cho một hoặc nhiều yếu tố nhiễu tiềm tàng, OR hiệu chỉnh trở nên không có ý nghĩa thống kê hoặc OR hiệu chỉnh thay đổi trên 10% so với OR thô => có sự hiện diện của yếu tố nhiễu ... xác định là yếu tố nhiễu hay không Kết quả (2) Nhận xét • Hệ số hồi qui thô của mối liên hệ chiều cao- nồng độ HB: 0.114 (0.4; 0.19) với p0.05 • Khi thêm biến giới tính vào phương trình, mối liên hệ giữa chiều cao- nồng độ HB trở thành không có ý nghĩa thống kê => đây là sự hiện diện của NHIỄU TOÀN PHẦN (mối... nhược điểm là hạn chế cỡ mẫu và không kiểm soát được đồng thời nhiều yếu tố nhiễu tiềm tàng • Hồi qui đa biến: • Lưu ý: khi kiểm soát nhiễu trong giai đoạn phân tích số liệu, cần có giả thuyết về các yếu tố nhiễm tiềm tàng từ giai đoạn viết đề cương, thiết kế nghiên cứu và thu thập thông tin về các yếu tố nhiễu tiềm tàng 3 Kiểm soát nhiễu trong mô hình hồi quy đa biến Mô hình hồi quy đa biến • Bản chất:... biến “Hút thuốc” để xác định xem đó có là yếu tố nhiễu hay không? Kết quả (2) Nhận xét • OR thô của mối liên hệ café-mạch vành = 7.11 (p0.05) • Khi thêm biến smoking vào phương trình, mối liên hệ giữa café-mạch vành trở thành không có ý nghĩa thống kê => Đây là sự hiện diện của NHIỄU TOÀN PHẦN (mối liên hệ giữa uống café và... => không cần xem xét tiếp • p1 xét p2 của hệ số B1 – Nếu p2>0.05 => Biến “Tuổi” là yếu tố nhiễu toàn phần – Nếu p2 Cần so sánh B1 và B • Nếu B1 thay đổi so với B >10% => biến “Tuổi” là yếu tố nhiễu một phần • Nếu B1 thay đổi so với B biến “Tuổi” không là yếu tố nhiễu 4 Kiểm soát nhiễu trong mô hình hồi quy tuyến tính Ví dụ • Bộ số liệu: nhieu_linear.sav • Mối liên hệ giữa chiều... biến (mối liên hệ hiệu chỉnh) • Ưu điểm: – Không làm giảm cỡ mẫu – Kiểm soát đồng thời các yếu tố nhiễu tiềm tàng – Dễ thực hiện • Yêu cầu – Cần có số liệu đầy đủ về các yếu tố nhiễu tiềm tàng Ví dụ • Nghiên cứu mối liên quan giữa hormone testosterone và nguy cơ gãy xương, bản chất của kiểm soát tác động nhiễu của độ tuổi là xây dựng hai phương trình: (1): Nguy cơ gãy xương= A+ B * Hormone Testosterone... bổ ngẫu nhiên nhằm đảm bảo các biến nhiễu tiềm tàng được phân bố đồng đều vào các nhóm được so sánh với nhau => tránh được mối quan hệ giữa biến nhiễu tiềm tàng và yếu tố phơi nhiễm đang nghiên cứu • Giới hạn: được sử dụng để hạn chế nghiên cứu ở những người có những đặc tính cụ thể • Ghép cặp: Lựa chọn những người tham gia nghiên cứu nhằm đảm bảo rằng các biến nhiễu được phân bố đồng đều vào 2 nhóm

Ngày đăng: 16/11/2016, 15:42

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan