1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - HỒI QUI logistic CHO BIẾN SỐ NHỊ PHÂN

45 1,1K 7

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 45
Dung lượng 3,75 MB

Nội dung

Tài liệu hướng dẫn thống kê y học sử dụng SPSS SPSS Hồi quy logistic cho biến số nhị phân BS Lê Đông Nhật Nam Lời nói đầu Có thể bạn không tin, số phận người giống mô hình hồi quy… Năm 1999 tất học sinh lớp 12 khác, phải đối diện với thử thách quan trọng kì thi tuyển sinh vào đại học Kết đậu hay rớt thường phụ thuộc vào biến số môn học ,tùy theo ngành nghề bạn chọn Vào thời gian Bộ Giáo Dục lại có quy định tuyển thẳng vào đại học học sinh giỏi toàn diện năm lớp 12 Mùa hè năm 1998 nghe tin nữ sinh hệ bán công (trình độ nhiều so với hệ quy) tuyển thẳng vào đại học, đàn anh đàn chị lớp chuyên, trường chuyên thi rớt hàng loạt, thực bị sốc Sau nhiều đêm suy nghĩ định phải chọn đường an toàn cho Tôi xin khỏi lớp chuyên vào cuối hè chuyển sang học lớp trung bình Trong 90 ngày sau lập kế hoạch vừa luyện thi khối A bên ngoài, vừa thỏa mãn giáo viên tất môn học lớp , kể môn mà chán ghét Tôi nhận tham vọng đưa nhiều tham số vào phương trình « tuyển thẳng đại học » lại tạo áp lực cao so với người luyện thi đơn giản Nhiều lúc gần phát khùng phải theo dõi bảng điểm ngày để mô bốn năm giả thuyết khác trước định tập trung chữa cháy điểm số môn học A hy sinh thi môn học B cháy rụi Cuối cùng, cân tất biến số kết tuyển thẳng, giá phải trả ước mơ trở thành giáo viên môn Vật Lý tan thành mây khói phải chiều lòng gia đình chọn học Y khoa năm sau người ta hủy bỏ mô hình tuyển sinh hoàn toàn sai lầm, nghiên cứu cho biết đa số học sinh tuyển thẳng có kết trung bình giảng đường Mỗi năm họ lại thay đổi mô hình mới, học sinh buộc phải tự thích nghi với mô hình Trong tài liệu bàn vấn đề tương tự, phải dự báo liệu biến cố xảy hay không, dựa quan sát nhiều yếu tố khác Phương pháp hồi quy logistic có nguyên tắc đơn giản, khó thực cụ thể ; tác giả ưa chuộng, áp dụng nghiên cứu Nhiều người phải tính Odds-ratio cho yếu tố nguy cơ, dựa vào test χ2 cho biến số riêng lẻ Khi đối diện biến định lượng họ lái sang định tính để theo lối mòn bảng 2x2 Tôi hy vọng tài liệu hướng dẫn hỗ trợ cho bạn công cụ khác mạnh xác Điều thú vị khái niệm hồi quy logistic thống kê kì lạ, lâm sàng bác sĩ sử dụng ngày quy trình đầu mà không hay biết, phải dựa vào sinh lý bệnh, triệu chứng học,kết xét nghiệm để xác định chẩn đoán, dự báo tiên lượng cho bệnh nhân Làm hồi quy logistic đơn giản vẽ lại quy trình giấy số Tôi cố gắng đơn giản thứ đến mức tối đa để bạn thấy thoải mái, dễ chịu bắt tay vào thực hiện, tự làm thú vị dễ học lý thuyết Chúc bạn thành công Quy ước trình bày Trong tài liệu làm quen với nhân vật Bác sĩ Nguyễn Văn Thái Bác sĩ Thái cao thủ thống kê y học giang hồ Anh ta xuất trước vấn đề khó khăn, nhằm đưa câu trả lời xác ôn lại cho bạn kiến thức chuyên sâu lý thuyết thống kê Tuy nhiên BS Thái lại bận rộn nên không đủ thời gian vào cách thực chi tiết Anh ta hay trình bày lý thuyết túy sử dụng nhiều công thức toán học nên không gần gũi với sinh viên gây không trở ngại cho bạn vốn dị ứng với thống kê … Bác sĩ Lê Ngọc Khả Nhi Khả Nhi nữ bác sĩ trẻ dễ thương sử dụng thành thạo SPSS Như tên gọi mình, BS Nhi có tính cách hồn nhiên sống ngây thơ trẻ con, cô có khuynh hướng đơn giản hóa tối đa vấn đề Cô hướng dẫn bạn sử dụng SPSS bước cụ thể, chia sẻ mẹo vặt, thủ thuật để giúp bạn đến kết nhanh dễ dàng Sinh viên Trần Quốc Bảo Bảo sinh viên y khoa năm thứ sáu bắt đầu làm quen với nghiên cứu khoa học Đây cậu sinh viên tò mò đặt nhiều câu hỏi liên quan đến thống kê Mặc dù đế tài Bảo thực đơn giản, đồng hành với cậu ta, bạn có hội tích lũy cho nhiều kinh nghiệm công việc phân tích số liệu thiết kế nghiên cứu 1.1 Tình thí dụ Xuất huyết não loại tai biến nguy hiểm tỉ lệ tử vong cao không cấp cứu kịp thời Một bác sĩ thực đề tài khảo sát nguy tử vong bệnh nhân xuất huyết não, nghiên cứu phức tạp với 20 biến số định tính định lượng thu thập 109 trường hợp xuất huyết não nhiều nguyên nhân Câu hỏi nghiên cứu đặt dựa vào yếu tố dịch tễ, triệu chứng lâm sàng bệnh lý để dự báo biến cố tử vong thời gian nằm viện Biến số định lượng liên tục Biến số định tính (nhị phân) Tuổi Biến thứ hạng : Thể tích xuất huyết (1= ; 2= trung bình ; 3=Nhiều) HA tâm thu Giới tính Cao huyết áp HA tâm trương Điểm Glasgow Tiểu đường Rối loạn đông máu Bác sĩ phải sử dụng phương pháp thống kê ? Làm thực SPSS ? Thuốc Rượu Đau đầu Buồn nôn, nôn Co giật Rối loạn tri giác Vị trí hạch Vị trí não thùy Vị trí thân não Vị trí đồi thị Vị trí não thất Vị trí tiểu não Lệch đường Phẫu thuật Phương pháp đầu lúc này, Hồi quy logistic Đây mô hình hồi quy đặc biệt cho phép dự báo xác suất xảy kiện đó, ví dụ tử vong dựa vào nhiều yếu tố dự báo Phương pháp cho phép ta đánh giá vai trò, mức độ ảnh hưởng yếu tố dự báo nhờ vào tỉ số Odds-ratio Tuy nhiên cần cảnh báo trước: Hồi quy logistic phương pháp khó ! 1.2 Giới thiệu phương pháp Thưa thầy, biết hồi quy logistic phức tạp, ta dùng test χ2 hay test xác Fisher dựa vào bảng 2x2 để khảo sát yếu tố nguy ? Những phương pháp dễ tính Odd-ratios mà ? Bảo thân mến, em có toàn biến định tính, ta cân nhắc dùng test χ2 hay test Fisher em nói Tuy nhiên ta lại có nhiều loại biến số, định tính, định lượng liên tục thứ hạng; nên test χ2 hay test xác Fisher không hữu dụng Ta không nên lạm dụng hồi quy Logistic để tính Odds-ratio cho biến số đơn lẻ Mục đích thực mô hình hồi quy để dự báo Chỉ dùng công cụ phức tạp cho vấn đề thực phức tạp, thí dụ Công dụng mô hình hồi quy dùng để dự báo Vì việc tìm mô hình có ý nghĩa thống kê, phù hợp với kiện quan sát chưa đủ, phải dự báo xác quần thể chung, tức có giá trị phổ quát Mô hình hiệu phải cho phép dự báo cho trường hợp tương lai Mô hình hồi quy logistic Giá trị X1,X2,X3 X1 X2 Giá trị Y (0 hay 1) X3 Dùng để phân loại Bệnh nhân tử vong Tuy nhiên, mô hình hồi quy logistic thường tác giả áp dụng với mục đích diễn dịch quy nạp, ta dùng túy để dự báo, mà để nhận diện vai trò yếu tố X (nguy cơ) góp phần hình thành kiện Y Sự kiện khảo sát thường có dạng biến số nhị phân (có/không), ví dụ : chẩn đoán có bệnh, tiên lượng xuất biến chứng, tử vong… Tài liệu giới hạn việc áp dụng cho biến số nhị phân Dĩ nhiên mô hình logistic áp dụng cho biến số nhiều giá trị (ví dụ bảng xếp loại, thang điểm) Tại mô hình hồi quy logistic mạnh test χ2 test xác Fisher ? Những test cho phép khảo sát biến số riêng lẻ, áp dụng cho biến số định tính, thứ hạng Trong đó, hồi quy logistic cho phép khảo sát lúc nhiều biến số, bao gồm biến số định lượng liên tục, thứ hạng, biến nhị phân, tương tác chúng với Bệnh nhân X Bệnh nhân X Xác suất tử vong bệnh nhân 80 % Dùng để dự báo xác suất xảy kiện Mô hình hồi quy logistic đo lường độ mạnh liên hệ chuẩn hóa yếu tố dự báo kiện, vai trò cụ thể biến số, cho phép diễn giải kết dạng tỉ số nguy (odds ratio) Chỉ có hồi quy cho phép tính Odds-ratio cho biến số định lượng liên tục Test χ2 có nguy sai lầm cao, biến số khảo sát chịu ảnh hưởng biến số thứ 3, biến số riêng lẻ có vai trò quan trọng lại cho kết yếu test χ2 , mô hình hồi quy logistic đa biến cho phép ta vô hiệu hóa yếu tố gây nhầm lẫn tìm lại vai trò thực biến số 1.2 Giới thiệu phương pháp Như ta biết, mô hình hồi quy tổng quát có dạng: Giá trị dự báo = số + tham số∗yếu tố dự báo + sai số Nhưng gặp trở ngại qui định giá trị dự báo phải có quan hệ tuyến tính với yếu tố dự báo, điều xảy giá trị dự báo ta có giá trị (0 1) Vì ta phải chuyển dạng giá trị dự báo Y qua thang đo logarit (Ln(Y)), để có biến thiên liên tục Như mô hình hồi quy logistic phải biểu diễn dạng logarit hóa Điểm thứ cần lưu ý, mô hình hồi quy logistic ta dự báo cho thân giá trị biến số Y (0 hay 1), ta dự báo xác suất cho việc Y nhận giá trị 𝑃 𝑌 = 1 + 𝑒 −(𝑏𝑜+𝑏1 𝑥1 +𝑏2 𝑥2 +𝑏3 𝑥3 +ε) P(Y) xác suất xảy kiện Y, P(Y) nhận giá trị từ 0-1 Y giá trị dự báo biến nhị phân, nhận giá trị: =0 hay = e số logarit tự nhiên, hay hàm Exponential Bo số phương trình hồi quy X1,x2,X3 biến số dự báo, biến liên tục, nhị phân hay thứ hạng b1,b2,b3 tham số tương ứng cho biến số dự báo ε sai số Mô hình hồi quy logistic mở rộng, gồm n biến số (bn.xn) Bạn nhận phần màu xanh phương trình hồi quy tuyến tính bình thường ta biết Với trường hợp (cá thể) cho trước, Yi nhận giá trị : (không xảy ra) (có xảy ra) Còn P(Yi) giá trị nằm (tuyệt đối không thể) (chắc chắn xảy ra) P(Yi=1) xác suất xảy kiện Y=1 cho cá thể i, Yi giá trị thực tế quan sát cá thể i Kết dự báo mô hình logistic xác suất, dao động từ 0-1 P(Y) thấp (gần 0) có khả xảy kiện Y Ngược lại P(Y) cao (gần 1) có nhiều khả xảy kiện Y Tham số b xác định cho giá trị Y gần với giá trị quan sát 1.2 Giới thiệu phương pháp Phương pháp khảo sát cho nhóm: Kết dự báo (outcome) biến số nhị phân Y Test χ2 Định tính nhị phân hệ số tau Kendall So sánh phi tham số Hệ số tương quan Spearman Khảo sát lúc Mô hình hồi quy logistic đa biến Thứ hạng Tập hợp yếu tố dự báo (predictors) So sánh Test t Định lượng liên tục Mô hình hồi quy logistic cho phép khảo sát lúc nhiều biến số dự báo, chứa tất loại biến số : Định tính nhị phân, định lượng liên tục thứ hạng Hiện tượng A Triệu chứng B Tập hợp yếu tố dự báo (predictors) Tuyển chọn yếu tố dự báo tối ưu cho nhóm phương pháp hồi quy thăm dò (Stepwise) dựa vào phương pháp thăm dò tiến triển (forward) thoái triển (Backward) Đặc điểm C (1) (2) Chỉ số D (3) Định tính nhị phân Định lượng liên tục Thứ hạng (1) Có thể chuyển biến định lượng thành thứ hạng cách đặt nhiều ngưỡng giá trị (2) Có thể chuyển biến định lượng thành biến định tính nhị phân cách ấn định ngưỡng giá trị (3) Có thể chuyển từ biến thứ hạng sang biến định tính nhị phân cách cắt nhỏ thành nhiều dummy variable (biến số giả) 1.1 Tạo bảng số liệu Trong công đoạn đầu tiên, bạn tạo bảng số liệu, bao gồm khai báo biến số, dán nhãn ý nghĩa, quy định giá trị mã hóa, sau nhập số liệu Trong thí dụ này, có tới 26 biến số Việc xếp, khai báo lập quy tắc mã hóa giá trị cho chúng quan trọng Một bảng số liệu rõ ràng, trật tự đồng giúp cho công đoạn thăm dò xây dựng mô hình dễ dàng nhiều Về cấu trúc: bạn nên phân bố biến số độc lập theo nhóm, ví dụ: Dịch tễ, triệu chứng thực thể, dấu hiệu hình ảnh học, xét nghiệm sinh hóa… Mỗi nhóm chứa nhiều biến số Cùng đại lượng khảo sát nhiều loại biến số: Định lượng, định tính, thứ hạng Về quy tắc mã hóa: Các biến định tính nhị phân nên mã hóa theo quy tắc thống nhất, ví dụ: 0=Không, 1=Có Lý tưởng cho nhóm chứng = 0, nhóm cần quan tâm = Ví dụ: Bình thường = 0; Có triệu chứng = Bạn thấy việc ích lợi xây dựng mô hình hồi quy Tuổi : định lượng liên tục Yếu tố dịch tễ Cao huyết áp: Định tính nhị phân Mã hóa giá trị: 0= không /1= có Điểm Glasgow: Định lượng liên tục Dấu hiệu lâm sàng Rối loạn tri giác: Định tính nhị phân Mã hóa giá trị: 0= không /1= có Tập hợp yếu tố dự báo (predictors) Định tính nhị phân Định lượng liên tục Thứ hạng Dấu hiệu hình ảnh học Lệch đường giữa: Định tính nhị phân Mã hóa giá trị: 0= không /1= có Thể tích xuất huyết: Thứ hạng Mã hóa: 1= Thấp/2= Trung bình/3= Cao Vị trí xuất huyết: biến số giả vị trí 1.1 Tạo bảng số liệu Biến định tính nhị phân Tử vong Cao huyết áp Tiểu đường Rối loạn đông máu Tất biến số định tính nhị phân gán giá trị theo quy tắc: 0= Không, = Có Thuốc Rượu Đau đầu Buồn nôn, nôn Co giật Rối loạn tri giác Vị trí hạch Vị trí não thùy Vị trí thân não Vị trí đồi thị Vị trí não thất Vị trí tiểu não Lệch đường Biến số thứ hạng mã hóa theo thứ tự từ thấp tới cao : 1,2,3… Sau khai báo xong biến số, bạn nhập liệu hay cắt dán từ bảng Excel qua SPSS Trong hình ví dụ cho 24 trường hợp số liệu khảo sát trạng xuất huyết não BV Chợ Rẫy 1.1 Tạo bảng số liệu Để chuyển biến định lượng thành định tính, ta sử dụng chức Transform trogn SPSS; Chọn Transform > Recode into different variables Hộp thoại Recode mở ra, cho phép bạn gán giá trị cho biến Trước hết, bạn kéo biến số định lượng cần chuyển dạng vào ô Numeric variables > Output variable Thí dụ, ta muốn chuyển dạng biến số Tuổi thành biến định tính nhị phân tên Tuoi cao Sau ta nhấn Old and New variable để mở hộp thoại gán giá trị Trong thí dụ này, ta muốn đặt ngưỡng giá trị để chia mẫu khảo sát thành phân nhóm; Tuổi cao > 60 < 60 Đầu tiên, chọn Range, nhập giá trị, ví dụ : 60 Sau gán giá trị : Nhấn Add để xác nhận quy tắc mã hóa Sau lại chọn: All Other values, nhập giá trị =0 nhấn Add để xác nhận Cuối nhấn Continue Trở hộp thoại Recode, ta nhấn Change để lưu biến số tuoicao với giá trị Sau nhấn OK để thi hành lệnh Recode Ngay sau nhấn OK, ta thấy data editor có biến số : Tuoicao với giá trị = hay =1 Bước lại khai báo định dạng cho biến số quy định nhãn giá trị : 0=không, =Có; để sử dụng biến định tính nhị phân trình phân tích 10 Tiêu chuẩn so sánh, đánh giá mô hình Đánh giá vai trò yếu tố dự báo: Kiểm định Wald Phương pháp có mục tiêu tương tự kiểm định t nhằm đánh giá sai số (SE) tham số b mô hình hồi quy tuyến tính thường, khác hồi quy logistic ta tính trị số Z, nhằm kiểm tra giả thuyết liệu tham số b có khác biệt ý nghĩa so với 0: H0: b=0 (đồng nghĩa biến số dự báo X vô dụng : b =0 dù X có thay đổi không can hệ tới xác suất dự báo Y, b=0 hóa giải tồn X, xem X không tồn mô hình) Ta muốn chứng minh điều ngược lại: b khác 0, cho thấy X có vai trò việc dự báo xác suất Y W 𝒁= 𝒃 𝑺𝑬𝒃 Trị số Z sau bình phương có phân phối χ2 từ cho phép kiểm tra giả thuyết H0: b=0 Với p80 Lệch đường Hằng số B Bias Std Error Sig (2-tailed) Lower Upper -,596 -,067 ,201 ,001 -1,080 -,416 3,511 1,250 4,188 ,001 2,121 22,631 1,929 ,209 1,213 ,001 ,558 4,332 3,400 ,412 1,901 ,001 1,598 7,153 a Unless otherwise noted, bootstrap results are based on 1000 bootstrap samples Kết bootstrap đẹp: biến số có ý nghĩa thống kê (p=0,001) Ta tính CI95% cho Odds-ratio theo công thức Oddsratio = Exp(B) Đây kết sau ta dùng để báo cáo Nhưng trước ta tới bước cuối này, ta cần phải kiểm tra lần cuối mô hình tối ưu để phát sai sót số liệu vi phạm giả định (nếu có) Kiểm tra mô hình lần cuối Sau có mô hình tối ưu, ta kiểm tra lại lần cuối (bước làm trước chạy Bootstrap) Bước thứ 1, ta chạy lại hồi quy logistic lần với thành phần biến số mô hình tối ưu, lần ta kích hoạt chức lưu : Chức lưu kết dự báo kiểm tra sai số : Bạn sử dụng chức vào bước sau cùng, có mô hình tối ưu Nhấn nút Save để mở hộp thoại Save, bạn việc chọn tất số cần lưu SPSS tạo thêm biến số (cột) tương ứng cho số, hiển thị kết cho MỖI trường hợp mẫu khảo sát Ý nghĩa số tóm tắt sau: Predicted values: Giá trị dự báo dựa vào mô hình tối ưu; đó: Probabilities : giá trị xác suất dự báo xảy kiện biến số Y=1 Group membership: giá trị dự báo cho Y: Y=1 hay =0 ? Influence : số dùng để kiểm tra trường hợp có nguy ảnh hưởng xấu tới mô hình dự báo, bao gồm Cook’s distance, Leverage (hat) values, Dfbeta cho biến số dự báo Residuals : Giá trị thặng dư, dùng để đánh giá độ xác dự báo, nôm na sai biệt giá trị dự báo giá trị thực tế quan sátr Giá trị thặng dư gồm nhiều loại: không chuẩn hóa, dạng Logit, Chuẩn hóa, Deviance… Trong số hữu dụng RSD (Standardized residual) Ghi nhớ : Chỉ sử dụng chức Save lần nhất, cho mô hình tối ưu Kết lệnh Save thể bảng số liệu dạng biến số mới, Output, bạn phải thao tác thêm vài bước để khai thác biến số Bạn chạy Save Bootstrap lúc, nên trước hết chạy Save, chạy Bootstrap sau A Kiểm tra mô hình lần cuối Kiểm tra giá trị thặng dư : Residuals Residual cho phép kiểm tra mức độ phù hợp liệu mô hình Lưu ý mô hình có ý nghĩa, không phù hợp liệu thực tế vô dụng, sử dụng thực tế Mục đích kiểm tra : (1) (2) Phân lập trường hợp không phù hợp với mô hình dự báo Phát điểm giá trị có nguy gây ảnh hưởng xấu mô hình Phương pháp: Đọc giá trị thặng dư chuẩn hóa (standardized residual) deviance statistic: Cook’s distance, DFbeta leverage Tiêu chuẩn an toàn Không có giá trị cá biệt gây ảnh hưởng xấu lên mô hình khi: + Đa số Dfbeta có giá trị < ( Và ≤1% số trường hợp có giá trị tuyệt đối RSD ≥ 2.5 Không có trường hợp RSD > (giá trị ngoại lai) 1) Cook’s distance : trường hợp > có ảnh hưởng model 2) Tính leverage trung bình : 𝐴𝑣𝑒𝑟𝑎𝑔𝑒 𝑙𝑒𝑣𝑒𝑟𝑎𝑔𝑒 = 3) Tính giá trị tuyệt đối DFbeta, giá trị phải > 𝑘+1 𝑁 dùng làm tiêu chuẩn, Tìm giá trị > hay lần giá trị trung bình Nhận diện biến số sau lưu : Cook’s distance Leverage RSD Deviance Các giá trị dfBeta Cách kiểm tra đơn giản sử dụng lệnh thống kê mô tả tần số SPSS cho biến số Kiểm tra mô hình lần cuối Đây bảng mô tả tần số giá trị thặng dư chuẩn hóa (RSD) Chỉ có 2/109 trường hợp ( Không có trường hợp có giá trị tuyệt đối RSD > 2,5 Không có trường hợp có giá trị tuyệt đối RSD > 2,5 ta kết luận : Dựa vào tiêu chuẩn RSD, không phát thấy trường hợp nghi ngờ có khả ảnh hưởng xấu lên mô hình Leverage value Valid Valid Cumulative Frequency Percent Percent Percent ,10556 ,9 ,9 91,7 ,10662 ,9 ,9 92,7 ,11156 ,9 ,9 93,6 ,11281 1,8 1,8 95,4 ,13761 ,9 ,9 96,3 ,17236 ,9 ,9 97,2 ,19515 ,9 ,9 98,2 ,21328 ,9 ,9 99,1 ,21775 ,9 ,9 100,0 Total 109 100,0 100,0 Đây bảng phân phối tần số giá trị Leverage Ta có: Levrage trung bình mẫu khảo sát = (K+1)/n = (4+1)/109 = 0,0458 Đây bảng mô tả tần số Cook’s distance Kết cho thấy tất giá trị Cook’s distance < Kết luận: Dựa vào Cook’s distance, không phát thấy trường hợp nghi ngờ có ảnh hưởng xấu lên mô hình (Cook’s distance >1) Với k = số biến số dự báo (kể số), n = cỡ mẫu (109 trường hợp) Ta tìm 10/109 (9%) trường hợp có Leverage cao cách có ý nghĩa so với Levrage trung bình (0,04), có 5/109 trường hợp cao lần (> 0,0916 ) 5/109 cao lần (> 0,1374) B Kiểm tra mô hình lần cuối Kiểm tra tính chất cộng tuyến (collinearity) Khi có tượng cộng tuyến (collinearity), ý nghĩa mô hình bị sai lệch Để kiểm tra tính chất này, ta làm sau: 1) Chạy mô hình hồi quy tuyến tính thường (linear regression model), với cấu trúc biến số mô hình logistict 2) Dựa vào giá trị tolerance VIF: Trong hộp thoại Statistic, chọn: collinearity diagnostic, chọn tất cq” nhấn OK Quy ước: Tolerance < 0.1 (Menard 1995) VIF > 10 (Myers 1990) gợi ý có vấn đề cộng tuyến Kiểm tra mô hình lần cuối Coefficientsa Collinearity Statistics Model Tolerance VIF Trên 80 tuổi ,990 1,010 Điểm Glasgow ,839 1,191 ,835 1,197 Đây bảng kết kiểm tra Collinearity: Giá trị Tolerance > 0,1 cho tất yếu tố dự báo Giá trị VIF < 10 cho tất yếu tố dự báo Như không đặt nghi ngờ Collinearity (cộng tuyến) Lệch đường a Dependent Variable: Tử vong Cách giải phát có vấn đề collinearity: + Loại bỏ bớt yếu tố dự báo kiểm tra lại + Thay biến dự báo = biến khác + Thu thập thêm số liệu để làm giảm hiệu ứng collinearity + Chạy PCA biến số dự báo dùng kết component score biến số dự báo + An toàn (nhưng không hay lắm: giữ nguyên mô hình báo cáo, ghi nhận thêm mức độ xác tín mô hình bị hạn chế vấn đề collinearity; cần cẩn trọng sử dụng) C Kiểm tra mô hình lần cuối Kiểm tra vấn đề tương tác biến số dự báo Logarit Để chắn 100% ý nghĩa biến số liên tục mô hình logistic, ta cần kiểm tra nguy có tương tác biến số dự báo logarit Để làm việc này, ta chạy lại mô hình hồi quy logistic chứa tương tác biến số định lượng logarit (Ln) Đầu tiên ta dùng chức compute variate để tạo biến số LOGX1= Ln(X1) Ví dụ biến số X1 định lượng liên tục, ta tính Ln(X1) Rồi đưa vào mô hình logistic biến số: X1, Ln(X1) tương tác: X1*Ln(X1) Tạo mô hình hồi quy, sau đọc giá trị p (kiểm định Wald) cho biến số tương tác Xi*Ln(Xi), p0.05 tốt Đây bảng kết mô hình chứa biến Glasgow, Logarit tương tác biến số này: Chú ý vào hàng Glasgow * Ln(Glasgow): giá trị p >0,05 Kết luận: tương tác ý nghĩa Glasgow Log Diễn đạt văn khoa học Phương pháp thống kê Dữ liệu phân tích phần mềm IBM-SPSS 22 Phương pháp hồi quy logistic đơn biến áp dụng để khảo sát tỉ số nguy biến số độc lập biến cố tử vong Chúng đưa mô hình hồi quy logistic tối ưu nhằm dự báo biến cố tử vong bệnh nhân xuất huyết não Kết Bảng tóm tắt kết phân tích hồi quy logistic đơn biến tỉ số nguy biến số dự báo có ý nghĩa cao Trong số đó, bật là: điểm Glasgow (p[...]... về thống kê Chỉ có bạn hiểu rõ lý thuyết sinh lý bệnh học của đề tài mình đang nghiên cứu, từ đó dùng trực giác để lựa chọn những biến số độc lập tối ưu, nhận ra quan hệ tương tác và đưa ra tiêu chuẩn của riêng bạn 3 3.1 Kích hoạt chức năng phân tích hồi quy logistic 1 2 Để kích hoạt phân tích hồi quy logistic cho biến số nhị phân, ta chọn Analyze > Regression, Chọn: Binary logistic Hộp thoại logistic. .. Regression sẽ mở ra như bên dưới 3 Biến số phụ thuộc (giá trị cần dự báo: Y) 4 Danh sách tất cả biến số hiện có Các t y chỉnh thống kê Các biến số độc lập (y u tố dự báo) Hộp thoại t y chỉnh phương pháp hồi quy Vì Phân tích hồi quy logistic không có quy trình nào cụ thể, nó có thể thiên biến vạn hóa t y vào hoàn cảnh và mục đích, nên Nhi sẽ không đi theo quy trình như những tài liệu trước Trước hết, Nhi sẽ... giải Odd-ratio: Tỉ số n y đo sự thay đổi của xác suất dự báo (nguy cơ x y ra Y) khi thay đổi 1 đơn vị của biến số X Nó có thể được hiểu như: Mỗi đơn vị thay đổi của X tương ứng với nguy cơ (khả năng) x y ra Y tăng/giảm Exp(b) lần Quy tắc thứ 1: ý nghĩa của Odds-ratio t y thuộc vào dấu của hệ số b Cho 1 biến định lượng, nếu b 1: X biến thiên cùng chiều với xác suất, X tăng làm tăng nguy cơ x y ra Y Odds-ratio < 1: X tăng làm giảm nguy cơ x y ra Y và ngược... theo -SPSS chỉ cho phép thực hiện tối đa 9 Blocktrong một lần phân tích, tuy nhiên mỗi Block lại có thể chứa 1 hay nhiều biến số - Phương pháp mặc định cho từng Block là Enter khi phân tích nhiều Bloc, tuy nhiên bạn có thể kết hợp thủ công và tự động, khi bạn quy định cho SPSS làm Foward hay Backward riêng cho 1 block nào đó chứa nhiều biến số Lời khuyên của Nhi: 1) Phân tích thủ công đáng tin c y hơn... nhau giữa 1 biến số mới và tập hợp biến số cũ Cách làm n y còn giúp ta lựa chọn 1 biến số tối ưu trong số nhiều biến có vai trò tương tự nhau, giữa biến định tính và biến định lượng mô tả cùng 1 hiện tượng, đại lượng (Ví dụ: Biến « Cao huyết áp » và biến « số đo Huyết áp » cùng khảo sát một vấn đề Phương pháp thoái triển sẽ loại bỏ giùm cho ta biến số kém hiệu quả hơn 3 3.2 Các quy trình phân tích tự... n y, Nhi sẽ giải thích cách x y dựng mô hình hồi quy logistic tối ưu từ danh sách 26 biến số ban đầu Bước đầu tiên, ta dùng phân tích hồi quy logistic đơn biến để khảo sát « chất lượng » của tất cả biến số dự báo Sau đ y là bảng tóm tắt kết quả thu được: Biến số Nagelkerke R2 Độ chính xác (%) Wald statistic Giá trị p Odds-ratio CI95% của Odds-ratio Quyết định Tuổi Glasgow HA TThu HATTrương Cao huyết... diễn giải trực tiếp giá trị của hệ số b mà lại thích sử dụng giá trị Exp(b) với ý nghĩa như một tỉ số nguy cơ (Oddsratio) cho biến số mà đang xét Như ta từng biết: 𝑶𝒅𝒅𝒔 = 𝑷(𝒙ả𝒚 𝒓𝒂 𝒔ự 𝒌𝒊ệ𝒏) 𝑷(𝒌𝒉ô𝒏𝒈 𝒙ả𝒚 𝒓𝒂 𝒔ự 𝒌𝒊ệ𝒏) Odds-ratio = 𝑛𝑔𝑢𝑦 𝑐ơ 𝑥ả𝑦 𝑟𝑎 𝑠ự 𝑘𝑖ệ𝑛 𝑌 = Trong mô hình hồi quy logistic ta lại có: 𝑷 𝒔ự 𝒌𝒊ệ𝒏 𝒙ả𝒚 𝒓𝒂 = P(không x y ra) = 1- P(x y ra) hay P (Y= 0) = 1- P (Y= 1) Như v y: 𝒐𝒅𝒅𝒔 − 𝒓𝒂𝒕𝒊𝒐 = 𝑷(𝒀=𝟏) 𝑷(𝒀=𝟎) ... phân tích hồi quy logistic, cho phép thực tự động nhiều quy trình so sánh, thăm dò… Tuy nhiên có tin buồn, khác với lần trước, tài liệu hồi quy logistic ta theo quy trình cố định; quy trình cụ... hồi quy logistic cho phép dự báo xác suất xảy kiện xác định tỉ số nguy cho nhiều biến số độc lập Hồi quy logistic mạnh test χ2 phức tạp hơn, không nên lạm dụng Quy trình phân tích hồi quy logistic. .. Kích hoạt chức phân tích hồi quy logistic Để kích hoạt phân tích hồi quy logistic cho biến số nhị phân, ta chọn Analyze > Regression, Chọn: Binary logistic Hộp thoại logistic Regression mở bên

Ngày đăng: 22/03/2016, 22:36

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w