1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Thống kê với phần mềm STATA ứng dụng trong nghiên cứu khoa học

324 3,9K 80

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 324
Dung lượng 8,99 MB

Nội dung

ÐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH KHOA Y TẾ CÔNG CỘNG THÀNH PHỒ HỒ CHÍ MINH Tháng 03-2012 THỐNG KÊ VỚI PHẦN MỀM STATA ỨNG DỤNG TRONG NGHIÊN CỨU KHOA HỌC TS Ðỗ Văn Dũng WEBSITE: http://www.fphhcm.edu.vn Email: dovandzung@fphhcm.edu.vn dovandzung@gmail.com Bộ môn Dân số - Thống Kê Y học và Tin học Khoa Y tế Công cộng ii MỤC LỤC Biến số 1 Mục tiêu 1 Biến số 1 Biến số định tính và biến số định lượng 2 Đo lường biến số 3 Ðịnh nghĩa cụ thể 3 Phân loại biến số theo quan hệ giữa các biến số 3 Kiểm soát yếu tố gây nhiễu 4 Biến số nền (background variables) 4 Bài tập: 5 Ðại cương về thống kê và thống kê mô tả 7 Giới thiệu về thống kê 7 Số liệu 7 Phương pháp mô tả tóm tắt và trình bày số liệu 7 Các số thống kê mô tả cho biến số định lượng 8 Thống kê khuynh hướng tập trung 8 Thống kê mô tả tính phân tán: 10 Biểu đồ và đồ thị 11 Biểu đồ và đồ thị cho biến định lượng: Tổ chức đồ, đa giác tần suất, biểu đồ hình hộp.12 Biểu đồ cho biến số định tính: Biểu đồ bánh và biểu đồ hình thanh 14 Trình bày số liệu và thống kê với bảng 17 Trình bày số liệu với bảng 17 Phân phối tần suất của biến số định tính 17 Phân phối tần suất của biến số định lượng 17 Trình bày thống kê với bảng 19 Ðại cương về phân tích số liệu 21 Phép ước lượng 21 Dân số và mẫu 21 Ước lượng khoảng tin cậy của trung bình 21 Ước lượng khoảng tin cậy của tỉ lệ 22 Suy luận thống kê 23 Kiểm định ý nghĩa 23 Kiểm định giả thuyết 24 Các bước kiểm định 25 Chọn lựa kiểm định phù hợp 26 Một số phép kiểm thống kê thường sử dụng 28 Phép kiểm z hai nhóm khi biết phương sai dân số của 2 mẫu 28 Sử dụng khi nào: 28 Giả định 28 Công thức thống kê: 28 Khoảng tin cậy của hiệu số trung bình 28 Ghi chú 28 Phép kiểm t hai nhóm phương sai không bằng nhau 28 Sử dụng khi nào: 28 Giả định 28 3 Công thức thống kê: 29 Khoảng tin cậy của hiệu số trung bình 29 Phép kiểm t hai nhóm phương sai bằng nhau 29 Sử dụng khi nào: 29 Giả định 29 Công thức thống kê: 29 Khoảng tin cậy của hiệu số trung bình 30 Phép kiểm t so sánh trung bình số liệu bắt cặp (phép kiểm t bắt cặp) 30 Sử dụng khi nào: 30 Giả định 30 Công thức thống kê: 30 Khoảng tin cậy của trung bình hiệu số 30 Phép kiểm t một mẫu 31 Sử dụng khi nào: 31 Giả định 31 Công thức thống kê: 31 Khoảng tin cậy của sự khác biệt giữa trung bình của biến x và tham số 31 Phép kiểm ANOVA một chiều so sánh trung bình các nhóm có phương sai bằng nhau 31 Sử dụng khi nào: 31 Giả định 31 Công thức thống kê: 31 Khoảng tin cậy của hiệu số trung bình 32 Phép kiểm chi bình phương so sánh tỉ lệ 2 nhóm 32 Sử dụng khi nào: 32 Giả định 32 Công thức thống kê: 32 Khoảng tin cậy của nguy cơ tương đối 33 Khoảng tin cậy của tỉ số số chênh 33 Phép kiểm chi bình phương so sánh tỉ lệ nhiều nhóm 33 Sử dụng khi nào: 33 Giả định 33 Công thức thống kê: 33 Phép kiểm phi tham số tổng sắp hạng Wilcoxon 34 Sử dụng khi nào: 34 Giả định 34 Công thức thống kê: 34 Phép kiểm phi tham số Kruskal-Wallis 34 Sử dụng khi nào: 34 Giả định 35 Công thức thống kê: 35 Hệ số tương quan Pearson 35 Sử dụng khi nào: 35 Giả định 35 Công thức thống kê: 35 Ý nghĩa của hệ số tương quan: 35 Phương trình hồi quy tuyến tính 36 Sử dụng khi nào: 36 Giả định 36 Công thức thống kê: 36 Ý nghĩa của hệ số của biến số: 36 Một số thí dụ về phép kiểm thống kê 36 4 Phép kiểm t bắt cặp 36 Phép kiểm t (không bắt cặp) 37 Phân tích phương sai 38 Phép kiểm chi bình phương 40 Sự tương quan của hai biến số định tính 41 So sánh tỉ lệ của biến số nhị giá : Kiểm định chi-bình phương 41 Quan hệ giữa hai biến số định lượng 42 Tương quan 42 Hồi quy 43 Số đo hậu quả và số đo tác động 45 I. Nhắc lại về số đo sự xuất hiện của bệnh: tỉ suất, nguy cơ và số chênh 45 II. Số đo sự kết hợp - số đo hậu quả 45 III. Số đo tỉ số 45 IV. Số đo hiệu số 47 V. Biện luận thêm về tỉ số nguy cơ và hiệu số nguy cơ 48 VI. Số đo tác động 49 VII. Bàn luận thêm về phân số nguy cơ quy trách dân số 51 Chiến lược phân tích số liệu 52 Giới thiệu 52 1. Phân loại biến số 52 2. Biên tập số liệu 52 3. Rút gọn số liệu 53 4. Mô tả số liệu 53 5. Đo lường tác động 53 6. Phân tích đơn biến 54 8. Kiểm soát các yếu tố gây nhiễu 54 9. Cách đưa vào biến số gây nhiễu 55 10. Phân tích tương tác 56 11. Nghiên cứu bệnh chứng bắt cặp 56 12. Những trở ngại trong phân tích và lí giải số liệu 57 Cài đặt chương trình Stata 10.0, số liệu mẫu và các chương trình có liên quan 58 1. Cài đặt chương trình Stata và số liệu mẫu 58 2. Cài đặt tập tin số liệu mẫu 61 3. Cài đặt chương trình chuyển đổi số liệu 63 Khởi động và kết thúc Stata 66 1. Khởi động Stata 66 2. Kiểm tra tính hợp lệ của Stata 67 3. Thoát khỏi Stata 67 4. Các loại hình của Stata 68 5. Stata nhỏ, Intercooled Stata và Stata bản đặc biệt (Stata SE) 68 Mô tả ngắn gọn về Stata 70 Lệnh more 72 1. Mô tả 72 Thông báo lỗi và mã phản hồi 73 1. Lỗi 73 2. Bỏ qua lỗi lầm trong lập trình 73 3. Mã trả về để biết thời gian tính toán 73 5 Thí dụ nếu bạn gõ sum mpg, bạn sẽ thấy 73 Phím break 75 1. Làm Stata ngưng thực hiện việc đang làm 75 2. Điểm cần lưu ý trong lập trình 75 Sử dụng bàn phím trong Stata 76 1. Bàn phím 76 2. Phím chức năng 76 3. Phím hiệu chỉnh 77 Khởi động Stata 78 1. Khởi động Stata 78 2. Mô tả giao diện của chương trình Stata 78 3. Cách cách để thực hiện lệnh trong chương trình Stata 79 4. Lưu lại kết quả phân tích 80 Một vài phân tích đơn giản với Stata với gõ lệnh 82 Giới thiệu về Stata 82 1. Khởi động Stata 82 2. Các cửa sổ của phần mềm Stata 83 1. Cửa sổ Variables (cửa sổ Biến số) 83 2. Cửa sổ Command (cửa sổ lệnh) 83 3. Cửa sổ Result (cửa sổ Kết quả) 83 4. Cửa sổ Review (cửa sổ Xem lại) 84 3. Biểu thức đại số: 84 4. Biểu thức luận lí 84 Nhập liệu và thực hiện thống kê mô tả đơn giản với Stata 84 1. Giới thiệu một bộ số liệu mẫu 84 2. Nhập liệu với lệnh edit 85 3. Log để ghi kết quả phân tích 95 4. Thống kê mô tả cho biến định tính với lệnh tab1 96 5. Thống kê mô tả cho biến định lượng với lệnh sum 97 6. Thống kê phân tầng theo nhóm 97 7. Tạo biến số mới 98 8. Hiển thị lại kết quả phân tích 98 9. Trọng số 98 Mô tả số liệu với Stata sử dụng menu 100 Phân tích số liệu cho một thử nghiệm lâm sàng 134 Thống kê phân tích biến số định lượng với Stata 154 Phân tích phương sai hai chiều 175 Tài liệu tham khảo 183 Thống kê phân tích biến số định tính: nghiên cứu bệnh chứng 184 Mục tiêu: 184 Bài tập thống kê (Chilumba) 184 Câu 9. Làm thế nào để khử đồng thời 2 biến số gây nhiễu agegrp và school 198 Thống kê phân tích biến số định tính: nghiên cứu bệnh chứng 203 Mục tiêu: 203 Bài tập thống kê mwanza 203 Hướng dẫn: Cách sử dụng lệnh mhodds trong trường hợp này là 209 6 Thống kê phân tích biến số định tính: nghiên cứu đoàn hệ 212 Mục tiêu: 212 Bài tập thống kê wh1 212 Ta có thể tính được   2.120 91.145 )93.384484( 2 2        i ii MH Var EA  218 Thực hiện 220 Hồi quy logistic 223 Đại cương về hồi quy logistic 223 Nguy cơ r có miền giá trị từ 0 đến 1 223 Bài tập phân tích số liệu chilumba sử dụng hồi quy logistic 224 Hồi quy logistic trong đánh giá chẩn đoán test 240 Nhắc lại về các số đo tính giá trị chẩn đoán 240 Xét nghiệm định lượng để chẩn đoán bệnh 240 Một thí dụ ứng dụng phương pháp hồi quy logistic trong xác định giá trị của xét nghiệm 241 Phân tích sống còn Kaplan-Meier 248 Những nghiên cứu cần sử dụng phân tích sống còn 248 Các biến số trong phân tích sống còn 248 Cá nhân 248 Thực hành 249 Tài liệu tham khảo 257 EpiData 259 Giới thiệu 259 Giao diện của chương trình Epi Data 259 Các loại tập tin của EpiData 260 Các tùy chọn của EpiData 260 Làm việc với EpiData 262 Bài tập 262 Bài tập 2 267 Những điểm cần chú ý trong bài tập: 267 Các công cụ khác 268 Phân tích 268 Các phím tắt sử dụng trong EpiData 269 Biên soạn bộ câu hỏi 269 Bổ sung check 269 Nhập liệu 270 Phụ lục 271 Bình luận 271 Tai tiếng của những nghiên cứu y khoa kém 271 Bài báo 274 Misoprostol uống trong dự phòng băng huyết sau sanh ở những cộng đồng dân cư nghèo: một thử nghiệm lâm sàng ngẫu nhiên 274 Bài báo 285 Tăng trưởng trước sinh, tình trạng hôn nhân sau này và tử vong: một nghiên cứu dọc. 285 Phương pháp và kết quả 285 Bàn luận 286 7 Cảm tạ 286 Chú thích 286 Tài liệu tham khảo 286 Bài báo 288 Tăng trưởng trước sinh và nguy cơ bị đột quỵ do tắc nghẽn và xuất huyết ở đàn ông và đàn bà Thuỵ điển sinh 1915-29: nghiên cứu đoàn hệ lịch sử 288 Đối tượng, phương pháp và kết quả 288 Bình luận 289 Cảm tạ 290 Chú thích 290 Tài liệu tham khảo 290 Bài báo 291 Bú sữa mẹ và béo phì: Một nghiên cứu cắt ngang 291 Tóm tắt 291 Mở đầu 292 Đối tượng và phương pháp 292 Kết quả 293 Bàn luận 296 Tài liệu tham khảo 297 Bài báo 299 Chương trình tiêm chủng đẩy mạnh Anh quốc và đột tử bất ngờ ở trẻ nhũ nhi: một nghiên cứu bệnh chứng 299 Tóm tắt 299 Giới thiệu 299 Phương pháp 300 Kết quả 301 Bàn luận 304 Ý nghĩa 304 Cảm tạ 304 Ghi chú 305 Tài liệu tham khảo 305 Hiệu lực vaccine sởi ở trẻ em TP Hồ Chí Minh 307 Tóm tắt 307 Abstract 307 Mở đầu 307 Đối tượng và phương pháp nghiên cứu 308 Cách chọn mẫu và cỡ mẫu 308 Các biến số nghiên cứu 308 Xử lý số liệu 309 Kết quả 309 Mô tả dân số nghiên cứu 309 Hiệu lực vaccine 311 Phân tích nhạy cảm hiệu lực vaccine 312 8 So sánh hiệu lực vaccine sởi ở 2 nhóm tuổi dưới 5 và từ 5 đến 15 312 Bàn luận 313 Kiến nghị 314 Tài liệu tham khảo 314 Các lệnh stata cần nhớ 315 1. Thao tác số liệu 315 2. Thống kê mô tả 315 3. Thống kê phân tích 315 1 Biến số Mục tiêu 1. Xác định biến số là gì và tại sao việc chọn lựa biến số là quan trọng 2. Phân biệt được biến số định tính (categorical) và biến số định lượng (numerical) 3. Phân biệt được sự khác biệt giữa biến số độc lập, biến số phụ thuộc, biến gây nhiễu và chúng được sử dụng trong nghiên cứu như thế nào 4. Xác định được các biến số được đo lường trong dự án nghiên cứu đang được thiết kế và cho biết: - Biến số nào có thể đo lường trực tiếp - Biến số nào không thể đo lường trực tiệp và phải sử dụng định nghĩa cụ thể(operation definition) - Biến số nào không thể đo lường được vào thời điểm hiện tại. Biến số Khi quan tâm đến một cá nhân, chúng ta quan tâm đến những đặc tính và đại lượng của cá nhân đó. Biến số chính là những đại lượng hay những đặc tính của cá nhân có thể thay đổi từ người này sang người khác hay từ thời điểm này sang thời điểm khác. Tuy theo đại lượng hay đặc tính được quan tâm chúng ta có biến số định lượng hay định tính. - Nếu biến số thể hiện một đại lượng nó được gọi là biến số định lượng (quantitative variable). Biến số định lượng nhằm thể hiện một đại lượng và do đó có giá trị là những con số. Biến số định lượng luôn luôn phải gắn liền với đơn vị đo lường cụ thể Thí dụ: tuổi là biến số định lượng bởi vì ta có thể nói người này 20 tuổi, người kia 32 tuổi, v.v. Những thí dụ khác là đường huyết, hemoglobin, hematocrite, chiều cao, cân nặng, thu nhập, v.v Thang đo của biến định lượng được cho là có giá trị zero tuyệt đối nếu thang đo đó có chứa giá trị âm. Thí dụ thang đo của khối lượng là thang đo có giá trị zero tuyệt đối vì không có trường hợp nào khối lượng có giá trị. Thang đo của nhiệt độ C không có giá trị zero tuyệt đối vì thang đo nhiệt độ có thể có giá trị -10 o C; -100 o C. Tùy theo thang đo của biến số định lượng có giá trị zero tuyệt đối hay không biến số định lượng được chia làm 2 loại: - Biến số tỉ số (ratio variable) khi thang đo của biến số có giá trị zero tuyệt đối. Với biến số tỉ số có thể so sánh các giá trị bằng phép chia. Thí dụ có thể kết luận trọng lượng 80 kg lớn gấp hai lần trọng lượng 40 kg. - biến số khoảng (interval variable) không có giá trị không tuyệt đối. Khi không có giá trị không tuyệt đối chỉ có thể so sánh các giá trị bằng phép trừ. Thí dụ nhiệt độ 40 o C cao hơn 30 o C so với nhiệt độ 10 o C. - Nếu biến số nhằm thể hiện một đặc tính, biến số được gọi là biến số định tính. Tùy theo số giá trị có thể có của biến số định tính, biến số định tính được chia làm 3 loại - Biến số nhị giá (binary variable) khi biến số chỉ có 2 giá trị Biến số nhị giá là biến số chỉ có 2 giá trị. Biến số giới tính là biến số nhị giá bởi vì nó chỉ có 2 giá trị Nam và Nữ. Nếu chúng ta quan tâm đến bệnh nhân có đái tháo đường hay không thì biến số đái tháo đường cũng là biến số nhị giá. - Biến số danh định là biến số có 3 hoặc nhiều giá trị các giá trị và các giá trị này không thể sắp đặt theo một trật tự từ thấp đến cao. Thí dụ: Biến số dân tộc với các giá trị: Kinh, Khmer, Hoa, Chăm,… là biến số định tính vì chúng ta không thể sắp xếp các giá trị này từ theo một trật tự từ thấp đến cao hay ngược lại. Một số thí dụ khác của biến số danh định là tình trạng hôn nhân (có 4 giá trị: độc thân, có gia đình, li dị, góa) nhóm máu (A, B, AB và O). 2 - Biến số thứ tự (ordinal variable) khi biến số có 3 hay nhiều hơn các giá trị và các bản thân các giá trị có tính chất thứ tự Thí dụ: tình trạng kinh tế xã hội (giàu, khá, trung bình, nghèo, rất nghèo) là biến số thứ tự bởi vì người giàu có điều kiện kinh tế tốt hơn người khá, người khá hơn người trung bình, trung bình hơn nghèo, v.v Những thí dụ khác là học lực của học sinh (giỏi, khá, trung bình, kém), tiên lượng (tốt, khá, xấu, tử vong). Theo phân loại tăng huyết áp của Tổ chức Y tế Thế giới được trình bày như sau, thì phân loại huyết áp với các giá trị huyết áp bình thường, huyết áp cao nhẹ, vừa và nặng là biến số thứ tự. Huyết áp bình thường: HA tâm thu ≤ 139 và HA tâm trương ≤ 89 Tăng huyết áp nhẹ: HA không bình thường và HA tâm thu ≤ 179 hay HA tâm trương ≤ 104 Tăng huyết áp vừa: HA không bình thường và HA tâm thu ≤ 180 hay HA tâm trương ≤114 Tăng huyết áp nặng: HA tâm thu ≥180 và HA tâm trương ≥ 115 mmHg - Ngoài ra trong nghiên cứu khoa học có khi người ta sử dụng một phân loại biến số đặc biệt gọi là biến số sống còn (survival variable) khi nghiên cứu quan tâm đến kết cuộc là biến cố (event) có xảy ra hay không và thời điểm xảy ra biến cố (hoặc thời điểm không xảy ra biến cố trễ nhất quan sát được). Loại biến số này thường được sử dụng trong nghiên cứu ung thư. Khi điều trị bệnh nhân ung thư người ta không chỉ quan tâm đến bệnh nhân có tử vong hay không mà còn quan tâm đến thời điểm tử vong (hay thời gian còn sống còn) của bệnh nhân. Biến số sống còn cũng được sử dụng trong các lãnh vực khác ngoài ung thư. Thí dụ nếu một nhà nghiên cứu quan tâm đến việc sau khi bệnh nhân được phẫu thuật vòi trứng, kết cuộc cần quan tâm là bệnh nhân có thể có thai tự nhiên hay không và nếu có thì việc thụ thai tự nhiên xảy ra bao lâu sau phẫu thuật. Bởi vì biến số sống còn quan tâm đến biến cố (event) có xảy ra hay không và thời điểm xảy ra biến cố nên về bản chất biến số sống còn bao gồm biến nhị giá (cho biết biến cố có xảy ra hay không) và biến định lượng thời gian (cho biết biến cố xảy ra vào thời điểm nào) Biến số định tính và biến số định lượng Như vậy biến số có thể thể hiện đại lượng hay đặc tính. Nếu nó thể hiện một đại lượng nó được gọi là biến số định lượng. Nếu nó nhằm thể hiện một đặc tính nó được gọi là biến số định tính. Biến số định tính còn được chia làm 3 loại: biến số nhị giá, biến số danh định và biến số thứ tự. Biến số nhị giá là biến số chỉ có 2 giá trị. Biến số giới tính là biến số nhị giá bởi vì nó chỉ có 2 giá trị Nam và Nữ. Nếu chúng ta quan tâm đến bệnh nhân có đái tháo đường hay không thì biến số đái tháo đường cũng là biến số nhị giá. Biến số danh định là biến số có nhiều giá trị của nó không thể biểu thị bằng số mà phải biểu diễn bằng một tên gọi (danh: tên) và các giá trị này không thể sắp đặt theo một trật tự từ thấp đến cao. Thí dụ: Biến số dân tộc với các giá trị: Kinh, Khmer, Hoa, Chăm,… là biến số định tính vì chúng ta không thể sắp xếp các giá trị này từ theo một trật tự từ thấp đến cao hay ngược lại. Một số thí dụ khác của biến số danh định là tình trạng hôn nhân (có 4 giá trị: độc thân, có gia đình, li dị, góa) nhóm máu (A, B, AB và O). Biến số thứ tự là biến số danh định nhưng có thể sắp xếp thứ tự được. Trong phân tích thống kê, để tiện việc nhập số liệu hay lí giải kết quả, người ta có thể ánh xạ (mapping) các giá trị của biến định tính vào các con số. Việc này được gọi là mã hóa và cần hiểu rằng việc mã hóa này hoàn toàn có tính chất áp đặt và các con số được dùng trong mã hóa không phản ánh bản chất của biến số danh định. Giới tính là biến số nhị giá và có hai giá trị là nam và nữ. Chúng ta có thể mã hóa giới tính và quy ước Nam là 1 và Nữ là 2. Tuy nhiên việc mã hóa này là áp đặt và chúng ta hoàn toàn có thể quy ước Nam là 1 và Nữ là 0. Việc mã hóa chỉ nhằm giúp việc nhập số liệu và xử lí số liệu trở nên dễ dàng hơn chứ không nhằm phản ánh bản chất của biến số đó. Cần phân biệt sự khác biệt giữa biến số và giá trị của biến số (còn gọi là yếu tố): Giới tính là biến số nhưng Nữ không phải là biến số mà là một giá trị của biến số (hay còn gọi là yếu tố). [...]... bác bỏ nghĩa là thống kê T nằm trong vùng bác bỏ và chúng ta có thể bác bỏ giả thuyết Ho Giá trị p được kí hiệu khác nhau trên các phần mềm thống kê Thí dụ ở phần mềm Epi-Info, giá trị p được kí hiệu là p-value, ở phần mềm SPSS, giá trị p được kí hiệu là Sig Ở phần mềm Stata, các giá trị p thường được kí hiệu khác nhau tùy theo thống kê được sử dụng là thống kê gì Cụ thể, trong phần mềm Stata, giá trị... thuyết H0 trong khi giả thuyết H0 sai 24 Thực hiện nghiên cứu với cỡ mẫu lớn hơn Trong nghiên cứu thống kê người ta khơng bao giờ có thể chắc chắn Do vậy, khi nhà nghiên cứu đi đến kết luận bác bỏ giả thuyết H0, người nghiên cứu có thể bị sai lầm (sai lầm loại một với một xác suất nào đó) Khi nhà nghiên cứu khơng bác bỏ giả thuyết H0, nhà nghiên cứu cũng có thể bị sai lầm (sai lầm loại hai - cũng với một... thể nghiên cứu tồn bộ dân số mà chúng ta quan tâm Chúng ta thường chỉ có thể nghiên cứu chỉ một phần dân số đó, phần này được gọi là mẫu (sample) và từ đó ước đốn về những đặc tính của dân số Trong nghiên cứu khoa học, chúng ta đi từ đặc trưng của cá thể (biến số - variable) để có được đặc trưng của mẫu (được gọi là thống kê - statistics) và từ đặc trưng của mẫu chúng ta sử dụng phương pháp suy luận thống. .. người ta cũng sử dụng các lập luận tương tự Để kiểm định một giả thuyết thống kê (được gọi là giả thuyết Ho) cần phải xác định miền xảy ra phổ biến của các con số thống kê (như trung bình, tỉ lệ, thống kê t, thống kê z, thống kê chi bình phương, v.v.) và nếu con số thống kê này nằm ngồi miền xảy ra phổ biến thì chúng ta sẽ bác bỏ giả thuyết Ho Miền nằm ngồi miền xảy ra phổ biến của số thống kê được gọi... cuộc và biến độc lập - Bước 2: Xây dựng giả thuyết Ho - Bước 3: Tính giá trị thống kê như thống kê t, thống kê χ2, thống kê F và độ tự do của thống kê Trong một số trường hợp chúng ta khơng thể xem xét tồn bộ giả định của phép kiểm thống kê thì ở bước ba chúng ta lập lại việc xem xét giả định này - Bước 4: Từ giá trị thống kê chúng ta tính được giá trị p - Bước 5: Nếu giá trị p nhỏ (thường được gọi... liệt kê 2 giá trị này ở một cột Ở cột thứ nhì ta ghi tần suất tương ứng của các giá trị này và ở cột thứ ba chúng ta ghi tỉ lệ phần trăm xuất hiện của giá trị Khi tỉ lệ phần trăm, thơng thường chỉ phần phần phần ngun của con số phần trăm (xem bảng 1) mà khơng lấy phần số lẻ thập phân của số phần trăm Trong trường hợp cỡ mẫu lớn (thí dụ như trên cỡ mẫu trên 1000) thì có thể trình bày tỉ lệ phần trăm với. .. bảo vệ và có nguy cơ bị sốt rét thấp hơn so với khỉ đực Một nhà nghiên cứu quan tâm đến đề tài này và thực hiện một nghiên cứu bệnh chứng để xác định mối liên hệ giữa giới tính và sốt rét Nhà nghiên cứu này tìm được 150 trường hợp bệnh (trong đó có 88 nam) và 150 chứng (trong đó có 68 nam) Tỉ số số chênh thơ tính được là 1,71 Nhà nghiên cứu này cũng biết chút ít về dịch tễ và cho rằng những hoạt động... được gọi là thống kê Phương pháp để từ số liệu (là các tập hợp các giá trị đặc trưng của cá nhân) để rút ra được con số thống kê được gọi là phương pháp thống kê Khi chúng ta chỉ khám cho từng cá nhân bệnh nhân mà khơng cần phát triển một kiến thức mới điều chúng ta quan tâm hàng đầu là đặc trưng của từng bệnh nhân và khơng cần quan tâm đến thống kê Nếu chúng ta muốn thực hiện nghiên cứu khoa học có mục... bằng kiểm định thống kê người ta có thể xác định được xác suất sai lầm loại một nhưng khơng thể tính được xác suất sai lầm loại hai mà chỉ có thể tính được dựa vào đối thuyết Ha và cỡ mẫu của nghiên cứu Ðơi khi người ta còn sử dụng khái niệm năng lực (power) của kiểm định thống kê Năng lực của kiểm định thống kê = 1 - xác suất sai lầm loại 2 Khái niệm năng lực của thống kê hay được dùng trong tính cỡ... phổ biến nhất là phương pháp thống kê mơ tả) Thống kê mơ tả là phương pháp trình bày cơ đọng đặc trưng của quần thể (thống kê) từ số liệu gồm các đặc trưng của cá thể (biến số) Như vậy phương pháp thống kê được sử dụng phải phụ thuộc vào biến số Tóm tắt các phương pháp trình bày đặc trưng của quần thể có thể bằng biểu đồ hay bằng con số thống kê tóm tắt được trình bày trong Bảng 1 Nhìn chung, để tóm

Ngày đăng: 11/09/2014, 22:31