HIỆU ỨNG TƯƠNG TÁC TRONG PHÂN TÍCH SỐ LIỆU THỐNG KÊ Khi phân tích thống kê trước khi xét đến các biến gây nhiễu confounders cần lưu ý hiệu ứng tương tác interaction effects giữa các biến
Trang 1HIỆU ỨNG TƯƠNG TÁC TRONG PHÂN TÍCH SỐ LIỆU THỐNG KÊ
Khi phân tích thống kê trước khi xét đến các biến gây nhiễu (confounders)
cần lưu ý hiệu ứng tương tác (interaction effects) giữa các biến độc lập có thể
dẫn đến sự sai lệch trong diễn dịch kết quả nghiên cứu
Phân biệt giữa biến gây nhiễu và sự tương tác
Biến gây nhiễu là 1 biến độc lập vừa liên hệ với 1 biến độc lập khác và
cùng gây ảnh hưởng trên biến phụ thuộc (kết cục)
Biến độc lập
Ví dụ: Một nghiên cứu tìm sự liên quan giữa uống rượu (YT phơi nhiễm hoặc
biến độc lập) và Ung thư phổi (biến phụ thuộc hoặc biến kết cục) Hút thuốc lá
là 1 biến gây nhiễu vì có sự liên hệ giữa với rượu (người uống rượu thường
hay hút thuốc) đồng thời thuốc lá cũng là yếu tố nguy cơ gây ung thư phổi
Như vậy khi tìm sự liên hệ giữa rượu và ung thư phổi cần phải hiệu chỉnh yếu
tố gây nhiễu là thuốc lá
Tương tác là sự ảnh hưởng của 1 biến độc lập này trên 1 biến độc lập
khác làm ảnh hưởng trên biến phụ thuộc (kết cục), tuy nhiên biến độc lập này
không ảnh hưởng trục tiếp trên biến kết cục
Rượu
Thuốc lá
K phổi
Biến phụ thuộc (kết cục)
Trang 2Ví dụ: Một nghiên cứu về sự liên quan giữa thuốc ngừa thai (YT phơi nhiễm)
và bệnh tim mạch (biến kết cục) Một biến độc lập có tương tác với uống thuốc
ngừa thai là thuốc lá Trong nghiên cứu này thuốc lá được gọi là biến tương
tác vì hút thuốc làm tăng nguy cơ thuyên tắc mạch ở phụ nữ dùng thuốc ngừa
thai và gây bệnh tim mạch Hút thuốc lá trong nghiên cứu này không là yếu tố
gây nhiễu vì không tác động trực tiếp gây bệnh tim mạch Như vậy bệnh tim
mạch chỉ xảy ra khi cần có sự hiệp đồng của cả 2 yếu tố (thuốc lá+thuốc ngừa
thai) Một ví dụ dễ hiểu hơn, ly café ngọt thì phải cẩn đủ cả 2 điều kiện (bỏ
đường vào ly+khuấy); khuấy chỉ là yếu tố tương tác vì khuấy không làm ly café
ngọt nếu không có đường
Vì vậy trong phân tích kết quả nghiên cứu cần phát hiện sự tương tác giữa
2 biến độc lập nếu không sự diễn dịch kết quả sẽ bị sai lệch
Ví dụ Một nghiên cứu số lượng tiểu cầu ở trẻ em mắc Sốt xuất huyết (SXH) và
Nhiễm siêu vi (NSV), mỗi nhóm gồm 20 em Số liệu được trình bày như sau
Nhom Tieucau Ngaythu Nhom Tieucau Ngaythu
Tương tác
Thuốc lá
Trang 31 190 0 2 130 1
Nhom: Nhóm 1: “SXH” Nhóm 2: “NSV”
Tieucau: Số lượng tiểu cầu x1000/mm3
Ngaythu: -Thử máu sớm (Sau sốt 1-2 ngày) mã=0
- Thử máu trễ (Sau sốt 3 ngày) mã=1
Nhập số liệu vào phần mềm SPSS:
Dùng phép kiểm T so sánh trung bình tiểu cầu giữa 2 nhóm SXH và NSV
Trang 4Số lượng tiểu cầu trung bình và độ lệch chuẩn của 2 nhóm: SHX: 137 ± 51 và NSV 150 ± 22 ; với t=1.003 và p=0.325: sự khác biệt tiểu cầu 2 nhóm không có
ý nghĩa thống kê
Như vậy nếu không để ý đến yếu tố tương tác (ngày thử máu) thì kết quả nghiên cứu kết thúc tại đây với kết luận là không có sự khác biệt về lượng tiểu cầu giảm giữa 2 nhóm SXH và NSV
Bây giờ nếu xét đến một biến tương tác trên nhóm bệnh đó là ngày thử máu sớm hoặc trễ, kết quả giữa 2 nhóm có sự khac biệt?
Dùng phân tích đơn biến trong mô hình tuyến tính tổng quát trong SPSS
Vào menu: Analyze> General Linear Model> Univariate
Vào màn hình Univariate
Nhắp chọn biến tieucau từ ô bên tay trái vào ô Dependent Variable
Nhắp chọn 2 biến độc lập Nhom và Ngaythu chuyển vào ô Fixed Factors(s)
Trang 5Muốn vẽ biểu đồ tương tác giữa 2 biến, nhắp vào Plots…sẽ xuất hiện màn hình sau:
Trang 6Nhắp chọn Ngaythu chuyển vào ô Horizontal Axis và Nhom vào ô Sepatate Lines Nhắp vào Add 2 biến Ngaythu*Nhom sẽ xuất hiện vào ô Plots
Nhắp Continue
Nhắp vào Options để mở màn hình sau đây:
Chuyển các biến và tương tác của biến từ ô Factor(s) and Factor Interactions bên trái vào ô Display means for bên tay phải Đánh dấu nháy vào 3 ô: Compare main effects, Descriptive statistics và ô Homogeneity tests Nhắp continue để trở về hộp thoại chính, nhắp OK để xem kết quả phân tích như sau:
Trang 7Kết quả trung bình lượng tiểu cầu và độ lệch chuẩn SD của 2 nhóm (SXH, NSV) theo ngày thử (Sớm hoặc trể) được trình bày ở bảng trên
Kết quả Levene’s test với p=0.621>0.05, cho thấy có sự đồng nhất phương sai giữa 2 nhóm (homogeneity of variances)
Trang 8Nhìn kết quả tests ảnh hưởng giữa các đối tượng cho thấy;
- Không có sự khác biệt trị số tiểu cầu giữa 2 nhóm SXH và NSV(F=2.698; p=0.109) (hàng 3: Nhom)
- Có sự khác biệt tiểu cầu theo ngày thử (F=47.590; p=0.000) (hàng 4:
Ngaythu)
- Có sự tương tác rõ giữa Nhom*Ngaythu (F=18.283; p=0.000) (hàng 5)
Muốn thấy rõ sự tương tác này ta xem kết quả biểu đồ sau:
Hai đường thẳng của nhóm SXH và NSV không song song mà bắt chéo nhau chứng tỏ có sự tương tác giữa nhóm bệnh và ngảy thử máu Khi thử máu sớm thì trị số tiểu cầu giữa 2 nhóm gần như không có khác biệt (SXH là 180000 ± 34000/mm3 và NSV là 160000 ± 18000/mm3 (Ghi chú: hai biến độc lập không
có tương tác khi 2 đường thẳng song song nhau)
Trang 9Khi thử máu trễ sau sốt 3 ngày thì sự chênh lệch về lượng tiểu cầu rất cao và khác biệt có nghĩa thống kê (SXH: 95000 ± 17000/mm3 và NSV là 140000 ± 21000/mm3
Sau khi phân tích ta thấy có sự tương tác giữa nhóm bệnh và ngày thử máu Như vậy để đánh giá đúng kết quả của nghiên cứu cần phải phân tích riêng thành 2 nhóm
Cách thực hiện trong SPSS:
Trước hết chọn ngày thử=0, dùng phép kiểm t-student trong SPSS sẽ cho
thấy không có sự khac biệt số lượng tiểu cầu giữa 2 nhóm bệnh
Sau đó chọn ngày thử=1 như sau:
Vào Data> Select Cases
Trang 10Nhắp chọn If condition is satisfied (điều kiện được thỏa mãn)
Chọn if Ngaythu=1 (thử máu trễ) lúc này số ca thử sớm sẽ bị loại bỏ
Trang 11Vào phép kiểm T với 2 mẫu độc lập (Independent-Samples T test), kết quả như
sau:
Phép kiểm t Student cho thấy có sự khác biệt trị tiểu cầu giữa 2 nhóm SXH và
NSV khi thử máu trễ: (t=-5.156; p=0.000)
Trang 12Kết luận:
Nếu không xét đến ảnh hưởng tương tác giữa 2 biến độc lập (Nhóm và Ngày thử) chúng ta sẽ không thấy sự khác biệt mức giảm tiểu cầu giữa 2 bệnh
lý SXH và NSV Thực ra, nếu thử máu sớm (ngày 1-2 của bệnh) sẽ không phát hiện nhưng khi thử máu trễ (sau ngày 3 của bệnh) sự giảm tiểu cầu trong bệnh SXH rất rõ ràng
TS Nguyễn Ngọc Rạng, bsrang.blogspot.com
Tham khảo:
1 Field A.P Two-way independent ANOVA using SPSS in Research method in Psychology 2008
2 Matthias Egger,c,d Pippa Scott,c Mirjam I Geerlings,a and Jan P
Vandenbrouckee When One Depends on the Other Reporting of Interaction in Case-Control and Cohort Studies, Epidemiology • Volume 20, Number 2,
March 2009
3 Stratified Analysis: Introduction to Confounding and Interaction, website:
www.sjsu.edu/faculty/gerstman/StatPrimer/stratified.PDF, truy cập ngày
15/06/09