Chương 2 : ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.7. Xử lý và phân tích số liệu
Số liệu sau khi thu thập được làm sạch, kiểm tra, nhập số liệu và quản lý bằng phần mềm Epidata. Các phần mềm WHO Anthro plus 2007, SPSS 16.0 và R statistics version 4.2.1 được sử dụng để xử lý số liệu. Các đối tượng sử dụng đủ số sản phNm quy định được đưa vào phân tích số liệu (>70% số sản phNm).
Kiểm tra phân bố chuNn của các biến liên tục trước khi phân tích thống kê. Số liệu được trình bày ở dạng số: Tần suất, trung bình (mean), trung vị (median), độ lệch chuNn (SD), sai số chuNn (SE) khoảng tin cậy 95% (CI 95%) và tỷ lệ%.
- Phân tích số liệu với các biến số sau:
+ Chỉ số nhân trắc, giá trị Z-score, tình trạng dinh dưỡng; + Giá trị trung bình về nồng độ Hb và tỷ lệ thiếu máu;
+ Giá trị trung bình về nồng độ IgG, IgM;
+ Tình trạng tiêu chảy và nhiễm khuNn hơ hấp: Thời gian từ khi can thiệp đến khi mắc bệnh lần đầu; Số ngày mắc bệnh/đợt có nghĩa là số ngày từ khi mắc đến khi khỏi bệnh (thời gian hồi phục khi bị bệnh); Số ngày mắc bệnh/trẻ; Số đợt mắc bệnh/trẻ
trong 6 tháng; Tỷ lệ mới mắc tích lũy theo thời gian. - Các test thống kê được áp dụng:
+ Test t ghép cặp: Để so sánh hai giá trị trung bình của hai nhóm nghiên cứu trước và sau can thiệp. Chỉ so sánh ghép cặp với những giá trị đủ số liệu trước và sau nghiên cứu. Các chỉ số dùng để so sánh ghép cặp trước-sau là chiều cao, cân nặng, Z-scores, nồng độ Hb máu, IgG, IgM trung bình tại thời điểm trước và sau can thiệp.
+ Test t test độc lập: Để so sánh giá trị trung bình giữa hai nhóm nghiên cứu tại cùng thời điểm (trước can thiệp hoặc sau can thiệp). Các chỉ số dùng để so sánh giữa 2 nhóm can thiệp là chiều cao, cân nặng, Z-scores, hàm lượng Hb, nồng độ IgG, IgM tại cùng thời điểm.
+ Test 2 để so sánh sự thay đổi các tỷ lệ giữa các nhóm can thiệp.
+ Test Wincoxson rank sum test để so sánh giá trị trung vị của khNu phần, hàm lượng IgG, IgM giữa 2 nhóm nghiên cứu.
- Phân tích phương sai 1 yếu tố (One-way ANOVA) được thực hiện để so sánh các biến định lượng phân phối chuNn giữa 3 nhóm. Khi có sự khác biệt thì sử dụng kiểm định Posthoc test để tìm ra sự khác biệt giữa các nhóm.
- Để đánh giá hiệu quả can thiệp, chúng tôi sử dụng các chỉ số [159]:
+ Chỉ số ARR (absolute risk reduction - giảm nguy cơ tuyệt đối): Là khác biệt nguy cơ giữa hai nhóm biểu diễn bằng tỷ lệ phần trăm và khoảng tin cậy 95%CI.
ARR% = p0 – p1
p0 là nguy cơ mắc bệnh trong nhóm chứng. p0 được tính bằng số đối
tượng mắc bệnh ở thời điểm sau can thiệp chia cho tổng đối tượng mắc bệnh ở thời
điểm trước can thiệp nhân 100% (ở nhóm chứng).
p1 là nguy cơ mắc bệnh trong nhóm can thiệp. p1 được tính bằng số đối tượng mắc bệnh ở thời điểm sau can thiệp chia cho tổng đối tượng mắc bệnh ở thời
Giá trị ARR > 0 khi kết thúc can thiệp tỷ lệ mắc bệnh ở nhóm can thiệp thấp hơn nhóm đối chứng.
+ Chỉ số N NT: (number needed to treat – số bệnh nhân cần được điều trị để giảm một ca bệnh), N N T được tính khi giá trị p<0,05.
N NT = 1 p0 – p1
Trong đó: p0 là nguy cơ mắc bệnh trong nhóm chứng, p1 là nguy cơ mắc bệnh trong nhóm can thiệp, p0, p1 được tính như trong chỉ số ARR%.
+ Chỉ số RR (relative risk hoặc risk ratio - nguy cơ tương đối hoặc tỷ số nguy cơ) được sử dụng đánh giá hiệu quả can thiệp của các biến định tính giữa nhóm can thiệp và nhóm chứng. RR được thể hiện bằng tỷ số giữa tỷ lệ mắc mới ở nhóm can thiệp so với tỷ lệ mắc mới của nhóm chứng. RR = p1/p0.
- Sử dụng mơ hình đơn biến để phân tích sự thay đổi các chỉ số trước - sau can thiệp, so sánh giữa nhóm chứng - nhóm can thiệp, hiệu quả phòng bệnh và điều trị RR (95%Cl).
- Sử dụng mơ hình tuyến tính tổng qt (Generalized Linear Models) để phân tích hiệu quả can thiệp sau khi điều chỉnh một số yếu tố nhiễu gồm: Đặc điểm giữa hai nhóm trẻ trước can thiệp (tuổi, giới tính, WAZ, HAZ, Hb, năng lượng khNu phần),
điều kiện kinh tế gia đình, đặc điểm của bà mẹ (tuổi, học vấn, nghề, số con). Kết quả điều chỉnh được tính là RR (95%CI) cho các biến định tính và trung bình (± SEM,
sai số chuNn) cho các biến định lượng.
- Sử dụng phân tích sự kiện (phân tích sống cịn) [160] để xác định các yếu tố
ảnh hưởng đến tình trạng nhiễm khuNn (tiêu chảy và nhiễm khuNn hơ hấp) theo thời
gian nghiên cứu.
+ Sử dụng biểu đồ Kaplan-Meier để ước tính xác suất khơng mắc nhiễm khuNn tích lũy (survival) theo 2 nhóm nghiên cứu.
+ Sử dụng kiểm định log-rank để so sánh xác suất khơng mắc nhiễm khuNn giữa 2 nhóm nghiên cứu.
+ Sử dụng mơ hình Cox để phân tích về ảnh hưởng của can thiệp đối với số lần mắc tiêu chảy và NKHH trong 6 tháng sau khi điều chỉnh dựa vào số đợt nhiễm khuNn hoặc một số yếu tố nhiễu, gồm: Đặc điểm giữa hai nhóm trẻ trước can thiệp (tuổi, giới tính, WAZ, HAZ, Hb, năng lượng khNu phần), điều kiện kinh tế hộ gia đình, đặc điểm của bà mẹ (tuổi, học vấn, nghề nghiệp, số con).
Chỉ số HR (Harzard ratio - tỷ số rủi ro) được sử dụng để đánh giá ảnh hưởng của một can thiệp đối với một kết quả được quan tâm theo thời gian. Kết quả ở đây là thời gian từ khi theo dõi cho đến khi trẻ mắc tiêu chảy/nhiễm khuNn hô hấp hoặc thời gian bắt đầu từ khi bắt đầu mắc tiêu chảy/nhiễm khuNn hô hấp cho đến khi kết thúc đợt mắc bệnh. HR = p1/p0.