Các bước phân tích số liệu• Mở tập tin – File :: Open • Liệt kê các biến số và xác định số bản ghi số đối tượng bằng F3 • Xác định mục tiêu nghiên cứu, các biến số và phân loại biến số,
Trang 1Các bước phân tích số liệu với
Stata 8.0
Chương: Chiến lược phân tích số liệu
Trang 84
Trang 2Các bước phân tích số liệu
• Mở tập tin
– File :: Open
• Liệt kê các biến số và xác định số bản ghi (số đối tượng) bằng F3
• Xác định mục tiêu nghiên cứu, các biến số và phân loại biến số, kế hoạch phân tích
Trang 3Các bước phân tích số liệu
• Mục tiêu:
Đánh giá tác động của cao huyết áp trong thai kì
và tuổi thai lên trọng lượng thai
• Biến số
Biến số phụ thuộc: trọng lượng thai
Biến số độc lập: tuổi thai và cao huyết áp
Biến số gây nhiễu: tuổi mẹ, giới tính
• Thống kê: kiểm định t và hồi quy
Trang 4Các bước phân tích số liệu
• Biên tập số liệu
• Mô tả số liệu
Trang 51 Biên tập số liệu (data processing):
– Phát hiện sai sót bằng
• Sum: tìm số liệu khuyết và giá trị bất thường
• bảng tần suất của biến số định tính trung bình, ĐLC hay tổ chức đồ của biến số định lượng (xem N, số tối đa, tối thiểu, trung bình, độ lệch chuẩn)
• Kiểm tra tính phù hợp: giới tính và số lần mang thai, trọng lượng và chiều cao
– Sai sót phát hiện được kiểm tra số liệu gốc
• Lưu (Save) số liệu với một tên mới
Trang 6TG truoc dieu tri
Trang 767
223
120
295
326
28 275
218
228
247 229
337
246 15
35 31
118 207
161
306 47 249
121
119 260 151
134
302
130
239 267
195 226
36
231
200 204
199
325 329
165
41
220 154
272
266
122 113
280
311
323
32
156 232
44 163 238
254
101153
203 328
192 235
336
26
115
252 100
255
316
324 339
340
114
234
129
75
124
276 244
62
116
211
131 240
219
117 251 331
202
208
277 196
74
68 242
274
152
273
264 46
160 253
103
42
61 96
233 270
39
322
38
320 237
66
206
321
342 263
217 81 194 34222 330
205 80 102
71
214 213
70
72
333
341 335
45 230
225
166
216
127
73 257 91
215
250
64 212
245
12340
43
261
33
279
8
29
278
TC truoc dieu tri
Trang 8cao
Trang 9• Kiểm tra
– ID: 368, 375, 401
– ID: 15, 130, 134, 246, 263, 206
– ID: 253, 252
– ID: 266 (SGPT tăng cao sau điều trị)
Trang 10Mô tả số liệu
• Đảm bảo số liệu đầy đủ và đại điện cho dân số mục tiêu
• Có cảm giác về số liệu
• Cần biên tập số liệu riêng cho từng nhóm
– Nhóm can thiệp và không can thiệp hoặc
– Nhóm bệnh và nhóm chứng
• Nếu số liệu không phải nhập từ Epi-data cần phải dán nhãn cho số liệu để dễ dọc
Trang 13Các bước phân tích số liệu
• (Cần sử dụng log và cmdlog)
• Phân tích số liệu: thống kê mô tả
– bảng tần suất của biến số định tính
– trung bình, ĐLC của biến số định lượng
– Vẽ biểu đồ, đồ thị
Trang 14Phân loại biến số
• Biến phụ thuộc (biến kết cuộc – outcome)
• Biến độc lập (biến phơi nhiễm hay biến giải
thích – exposure )
• Biến gây nhiễu (biến có khả năng tác động đến biến kết cuộc nhưng tác động này không phải
là mục tiêu của nghiên cứu)
• Nếu nghiên cứu có 2 biến số độc lập thì biến số độc lập này là biến số gây nhiễu cho biến số độc lập còn lại
Trang 15Rút gọn số liệu
• Cần rút gọn cho các biến số định lượng hay
biến số định tính có nhiều nhóm
• Với biến phụ thuộc (outcome):
– Nên chia làm 2 nhóm
• Với biến độc lập (biến giải thích)
– Nên chia làm 4-5 nhóm để đánh giá mối quan hệ liều lượng đáp ứng
• Với biến gây nhiễu:
– Nên chia làm 2 hay 3 nhóm (trừ khi đây là biến gây nhiễu mạnh)
Trang 16Đo lường tác động
• Biến kết cuộc là định lượng: (hiệu số, mức độ thay đổi)
– Huyết áp
– Cholesterol toàn phần
• Biến kết cuộc là định tính (nhồi máu, tử vong)
– nghiên cứu đoàn hệ (RR hay IRR)
– nghiên cứu bệnh chứng (OR)
– Nghiên cứu cắt ngang (RR hay OR)
Trang 17Phân tích đơn biến
• Biến kết cuộc là định lượng:
– Nếu có 2 nhóm:
• T-test không bắt cặp (nếu thiết kế song song)
• T-test bắt cặp (nếu thiết kế bắt chéo, trước sau)
– So sánh nhiều nhóm: oneway ANOVA
• Biến kết cuộc là định tính (nhồi máu, tử vong)
– So sánh 2 nhóm
• nghiên cứu đoàn hệ: lệnh cs
• nghiên cứu bệnh chứng : lệnh cc
• Nghiên cứu cắt ngang: lệnh cs hay cc
– So sánh nhiều nhóm
• Chi bình phương
• Chi bình phương khuynh hướng
Trang 18Kiểm soát yếu tố gây nhiễu
• Biến kết cuộc là định lượng:
– Hồi quy tuyến tính:
Biến phụ thuộc ~ biến độc lập + biến gây nhiễu
• Biến kết cuộc là định tính (nhồi máu, tử vong)
– Hồi quy logistic:
Biến phụ thuộc ~ biến độc lập + biến gây nhiễu
Trang 191 Có 2 Không
1 Có 2 Không
1 Có 2 Không
1 Có 2 Không
Trang 20• gen hcch=(( c31==1) + (c32==1) + (c33==1) + (c34==1)+ (c35==1))>=3
• sdtest hq1a, by( hcch )
• ttest hq1a, by(hcch)
• gen giamtc= hq1b- hq1a
• ttest giamtc == 0
• ttest giamtc, by(hcch)
• drop if c1>=3
• ttest giamtc, by(c1)