1. Trang chủ
  2. » Giáo án - Bài giảng

Chiến lược phân tích số liệu định lượng

15 480 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Bài giảng Dịch tễ-Thống kê Nâng cao BM Dịch tễ Thống kê - Trường ĐH YTCC CHIẾN LƯỢC PHÂN TÍCH SỐ LIỆU Mục tiêu Sau học xong này, học viên có thể: Xây dựng sơ đồ phân tích dự kiến kết nghiên cứu Hiểu bước tiếp cận phân tích số liệu Lựa chọn kiểm định mô hình thống kê phù hợp với kết nghiên cứu Giới thiệu Chúng ta biết có kĩ thuật thống kê chuyên biệt cho nghiên cứu dịch tễ định Trong bối cảnh nghiên cứu dịch tễ thực bao gồm số liệu nhiều biến số, khó định thao tác áp dụng áp dụng theo trình tự Trong phần này, trình bày số nguyên tắc chiến lược để phân tích số liệu từ nghiên cứu dịch tễ Xây dựng sơ đồ phân tích dự kiến 1.1 Phân tích theo mục tiêu nghiên cứu Trong nghiên cứu, việc thu thập phân tích số liệu đóng vai trò quan trọng dẫn đường mục tiêu nghiên cứu Điều đảm bảo số liệu thu thập phân tích đáp ứng trả lời tất thông tin mục tiêu nghiên cứu yêu cầu Do vậy, cần phải có hiểu biết công cụ kỹ thuật phân tích số liệu Phân tích số liệu trình việc thực nghiên cứu Nhìn chung, nghiên cứu có giai đoạn: o Xác định vấn đề nghiên cứu o Xác định câu hỏi mục tiêu nghiên cứu o Hình thành phương pháp nghiên cứu (bao gồm vấn đề đối tượng nghiên cứu, mẫu nghiên cứu, phương pháp thu thập số liệu v.v…) o Thu thập số liệu o Phân tích số liệu o Phiên giải trình bày kết Trong việc phân tích số liệu, nội dung phân tích gắn liền cách chặt chẽ với mục tiêu nghiên cứu để đảm bảo kết phân tích đáp ứng mục tiêu đề 1.2 Câu hỏi phân tích dự kiến Dựa mục tiêu nghiên cứu, trước phân tích, nhà nghiên cứu thường đặt câu hỏi để xây dựng kế hoạch phân tích/sơ đồ phân tích dự kiến Do đó, công thức chung cho việc xây dựng sơ đồ phân tích dự kiến cho tất nghiên cứu Ví dụ sau giúp cách tiếp cận để xây dựng sơ đồ phân tích phù hợp Bài giảng Dịch tễ-Thống kê Nâng cao BM Dịch tễ Thống kê - Trường ĐH YTCC Ví dụ 1: Nghiên cứu Thực trạng bệnh lây truyền qua đường tình dục gái mại dâm Trung tâm Chữa bệnh- Giáo dục- Lao động xã hội tỉnh Hoà Bình năm 2009 Mục tiêu nghiên cứu: i) Mô tả thực trạng bệnh lây truyền qua đường tình dục gái mại dâm Trung tâm Chữa bệnh-Giáo dục-Lao động xã hội tỉnh Hoà Bình năm 2009 ii) Mô tả số yếu tố liên quan đến bệnh lây truyền qua đường tình dục gái mại dâm Trung tâm Chữa bệnh-Giáo dục-Lao động xã hội tỉnh Hoà Bình năm 2009 Để phân tích, nhà nghiên cứu đặt câu hỏi sau: Đặc điểm GMD NC nào? Ví dụ đặc điểm tuổi, trình độ học vấn, tình trạng hôn nhân, nơi hành nghề, dân tộc… Tỷ lệ bệnh lây truyền qua đường tình dục GMD nào? Ví dụ bệnh: giang mai, lậu, chlamydia, trichomonas, nấm, sùi mào gà, herpes sinh dục, HIV… Bệnh lây truyền qua đường tình dục phân bố nhóm GMD có đặc điểm khác nhau? Ví dụ đặc điểm: tuổi, tình trạng hôn nhân, dân tộc, thời gian hành nghề, nơi hành nghề, trình độ học vấn… Các yếu tố nguy nhóm GMD có đặc điểm nào? Ví dụ yếu tố: tuổi, thời gian hành nghề, nơi hành nghề, số lượng bạn tình, số lượt bạn tình tuần, đặc điểm khách hàng thường xuyên (khách lạ/khách quen), sử dụng bao cao su, kiến thức phòng ngừa bệnh lây truyền qua đường tình dục… Mối liên quan yếu tố nguy với việc mắc bệnh (có mắc/không mắc) lây truyền qua đường tình dục nhóm GMD nào? Nói cách khác, người có yếu tố nguy có nguy mắc bệnh cao người yếu tố nguy hay không? Thực tế là, câu hỏi xuất phát từ mục tiêu nghiên cứu Mục tiêu i) đáp ứng câu hỏi phân tích 3, mục tiêu ii) đáp ứng câu hỏi phân tích Câu hỏi phân tích luôn đưa để mô tả giới thiệu đối tượng nghiên cứu, trước vào phân tích cho mục tiêu Thêm vào đó, câu hỏi xuất phát từ khung lý thuyết nghiên cứu Điều hiển nhiên khung lý thuyết nhằm định hướng thể mục tiêu nghiên cứu, định hướng cho việc phân tích số liệu Bài giảng Dịch tễ-Thống kê Nâng cao BM Dịch tễ Thống kê - Trường ĐH YTCC Các yếu tố nguy cơ: - Thời gian hành nghề - Số lượng bạn tình - Số lượt bạn tình/tuần - Đặc điểm khách hàng - Sử dụng bao cao su - Kiến thức phòng ngừa Đặc điểm nhân học: - Tuổi - Dân tộc - Trình độ học vấn - Tình trạng hôn nhân - Địa sinh sống - Thu nhập - Địa bàn hành nghề Bệnh LTQĐTD: - Giang mai - Lậu - Chlamydia - Herpes sinh dục - Trichomonas - Nấm - Sùi mào gà - Viêm âm đạo - Viêm cổ tử cung - HIV Hình Khung lý thuyết ví dụ Như vậy, khung lý thuyết thể cấu phần cần phân tích để đảm bảo mục tiêu nghiên cứu Tuy nhiên, số nghiên cứu phức tạp hơn, khung lý thuyết mang tính chất khái quát hóa khái niệm, vấn đề nghiên cứu, liệt kê đầy đủ biến số nhóm hình Khi đó, nhà nghiên cứu cần dựa vào khung lý thuyết, câu hỏi phân tích để xây dựng sơ đồ phân tích cụ thể 1.3 Xây dựng sơ đồ phân tích dự kiến Sau tham khảo mục tiêu nghiên cứu, khung lý thuyết liệt kê câu hỏi phân tích dự kiến, nhà nghiên cứu phân nhóm câu hỏi nghiên cứu theo định hướng phân tích: phân tích mô tả hay phân tích suy luận Phân tích mô tả nhằm mục đích mô tả đối tượng nghiên cứu yếu tố nguy liên quan đến vấn đề nghiên cứu Việc mô tả cách rõ ràng xác thông tin đối tượng nghiên cứu giúp cho người đọc báo cáo kết nghiên cứu hiểu rõ đặc điểm nghiên cứu dân số nghiên cứu Các thông tin chọn để đưa thống kê mô tả liên quan chặt chẽ đến thông tin thống kê suy luận Trong phân tích mô tả nhằm mục đích mô tả đặc tính đối tượng nghiên cứu, phân bố tình trạng phơi nhiễm bệnh tật, thống kê suy luận sử dụng kiểm định thống kê để chứng minh có hay mối liên quan phơi nhiễm kết quan tâm Lưu ý, kết phân tích từ thống kê suy luận chưa đủ để kết luận mối liên quan nhân quả, việc kết luận mối liên quan nhân phơi nhiễm bệnh phải dựa vào yếu tố khác đề cập nhiều dịch tễ học Bài giảng Dịch tễ-Thống kê Nâng cao BM Dịch tễ Thống kê - Trường ĐH YTCC Ví dụ: Trong ví dụ 1: Câu hỏi phân tích 1, 2, thuộc phân tích mô tả Câu hỏi thuộc phân tích suy luận Như vậy, dựa câu hỏi phân tích, nhà nghiên cứu khái quát thành sơ đồ phân tích sau: Mục tiêu NC Câu hỏi phân tích Câu hỏi phân tích Câu hỏi phân tích Mục tiêu NC Mô tả biến số Thống kê mô tả Mô tả biến số Câu hỏi phân tích Câu hỏi phân tích Mô tả biến số Thống kê phân tích Lựa chọn kiểm định Hình Sơ đồ phân tích dự kiến Tóm lại, để xây dựng sơ đồ phân tích dự kiến (hoặc câu hỏi phân tích dự kiến), nhà nghiên cứu cần tiếp cận theo trình tự hình 2 Lựa chọn kỹ thuật phân tích 2.1 Phân tích mô tả 2.1.1 Mô tả biến số: Một vấn đề quan trọng phân tích mô tả chọn đại lượng thống kê để mô tả Điều tuỳ thuộc vào loại biến số: biến phân loại hay biến định lượng - Biến số phân loại: sử dụng tỷ lệ (%) - Biến số định lượng (liên tục): sử dụng đại lượng đo lường độ tập trung biến thiên/sự phân tán o Đo lường độ tập trung: trung bình, trung bị, mode o Đo lường biến thiên/sự phân tán: phương sai, độ lệch chuẩn, khoảng phân vị, khoảng Lưu ý: Đối với biến số định lượng, việc lựa chọn đại lượng để mô tả phụ thuộc vào phân bố biến Nếu biến có phân bố chuẩn, giá trị trung bình độ lệch chuẩn dùng để mô tả đại lượng thể biến Nhưng biến phân bố chuẩn giá trị trung vị, khoảng (giá trị nhỏ nhất; giá trị lớn nhất) dùng để mô tả cho biến Bài giảng Dịch tễ-Thống kê Nâng cao BM Dịch tễ Thống kê - Trường ĐH YTCC Bảng Lựa chọn đại lượng mô tả biến số Biến số Định lượng Thứ bậc Danh định Phân nhóm số liệu Bảng phân phối tần Bảng phân phối tần Trình bày số liệu Bảng phân phối tần suất (sắp xếp theo suất (sắp xếp theo suất thứ tự) tần suất) Có thể dùng % tích Có thể dùng % tích Không dùng % tích luỹ luỹ luỹ Histograms Biểu đồ cột rời Biểu đồ cột rời Đồ thị, biểu đồ Box-and-Whisker Biểu đồ bánh Biểu đồ bánh Không cần thiết Thống kê tóm tắt Trung bình (phân phối bình Độ lệch chuẩn thường) Phân phối không Trung vị Phạm vi (min, max, bình thường phân vị) 2.1.2 Mô tả biến số Khi mô tả hai biến số, cần chọn lựa kỹ thuật mô tả bảng Bảng Lựa chọn đại lượng mô tả mối liên quan hai biến số Biến số Định lượng Phân loại Định lượng Phân tán đồ (biểu đồ chấm Boxplot điểm) Case summaries Hệ số tương quan Phân loại Boxplot Bảng chéo (Crosstabs) Case summaries Giả định Các quan sát độc lập Biến định lượng có phân phối chuẩn 2.2 Phân tích suy luận 2.2.1 Lựa chọn kiểm định Về nguyên tắc, việc lựa chọn kiểm định thường dựa vào biến số câu hỏi nghiên cứu Bước thực kiểm định phân tích câu hỏi nghiên cứu để xem xét biến số câu hỏi, từ giúp lựa chọn kiểm định phù hợp Có hai nhóm kiểm định: kiểm định tham số kiểm định phi tham số Kiểm định tham số thường sử dụng biến số phụ thuộc biến định lượng có phân phối chuẩn • Nếu biến độc lập biến nhị phân (ví dụ giới tính, có hai giá trị nam, nữ) Æ kiểm định sử dụng so sánh khác trung bình biến số phụ thuộc hai nhóm giá trị biến số độc lập t-test không bắt cặp Ví dụ: so sánh lượng calories trung bình hai nhóm có không béo phì • Nếu biến độc lập biến phân loại có từ giá trị trở lên (ví dụ: bệnh nặng, bệnh trung bình, bệnh nhẹ) Æ kiểm định sử dụng để so sánh khác trung bình biến số phụ thuộc nhóm giá trị biến số độc lập phân tích phương sai (ANOVA) Bài giảng Dịch tễ-Thống kê Nâng cao BM Dịch tễ Thống kê - Trường ĐH YTCC Ví dụ: so sánh lượng calories trung binh nhóm đối tượng thiếu cân, bình thường thừa cân Kiểm định phi tham số thường sử dụng biến số phụ thuộc biến định lượng biến định lượng phân phối chuẩn Kiểm định phi tham số thường sử dụng nhiều nghiên cứu kiểm định Khi bình phương (chi-square) Kiểm định sử dụng biến phụ thuộc biến độc lập biến phân loại Bảng mô tả nguyên tắc chọn lựa kiểm định phù hợp Nguyên tắc bao gồm: • Dựa vào thang đo (đặc điểm đo lường) biến số độc lập biến số phụ thuộc - loại biến số (định lượng hay phân loại…) • Dựa vào giả định (các yêu cầu) kiểm định: phân phối biến số định lượng, giống phương sai nhóm Bảng 3: Lựa chọn kiểm định Biến số phụ thuộc (loại biến số) Loại biến số độc lập Nhị phân Danh định So sánh trước – sau (trên đối tượng) Hai nhóm đối tượng gồm cá nhân khác Ba hay nhiều nhóm đối tượng gồm cá nhân khác Trước sau nghiên cứu đối tượng Liên hệ hai biến số ≥ can thiệp đối tượng tích t-test ghép Phân tích Hồi qui tuyến Liên tục t-test không Phân phương sai cặp phương sai tính tương (phân phối ghép cặp đo lường quan pearson chuẩn) lặp lại Danh định χ2 bảng x n χ2 bảng x test McNemar n Cochrance Q Hệ số bảng nxm (OR, RR…) Kiểm định KruskalLiên tục hạng – Wallis (không có tổng Mannphân phối Whitney chuẩn) Thứ tự Kiểm định Friedman hạng có dấu Wilcoxon Hệ số tương quan Spearman 2.2.2 Quy trình lựa chọn kiểm định – ví dụ Để lựa chọn kiểm định thống kê trở nên dễ dàng với nhà nghiên cứu, việc phân tích lựa chọn có quy trình khởi đầu từ biến phụ thuộc Bài giảng Dịch tễ-Thống kê Nâng cao BM Dịch tễ Thống kê - Trường ĐH YTCC Hộp Có khác biệt hay không? Biến phụ thuộc biến số định lượng, đo lường độc lập với (không lặp lại) So sánh hai nhóm t-test không ghép cặp So sánh nhiều hai nhóm Phân tích phương sai ANOVA So sánh hai nhóm Kiểm định MannWhitney So sánh nhiều nhóm Kiểm định KruskalWallis Có phân phối chuẩn Biến định lượng Không có phân phối chuẩn Hộp Có khác biệt hay không? Biến phụ thuộc biến số phân loại, đo lường độc lập với (không lặp lại) Biến phân loại So sánh nhóm Có ≥25% ô có giá trị kỳ vọng [...]... tập (không có số Nguy cơ liệu người thời gian) Số chênh Cắt ngang để đo lường Tỉ lệ hiện mắc hiện mắc Số chênh Bệnh chứng Đo lường tác động Tỉ số tỉ suất Hiệu số tỉ suất Tỉ số nguy cơ Hiệu số nguy cơ Tỉ số số chênh Tỉ số nguy cơ (hiện mắc) Hiệu số nguy cơ Tỉ số số chênh Tỉ số số chênh Đối với nghiên cứu thuần tập, nếu có số liệu về người thời gian phơi nhiễm, tỉ suất mới mắc thường là số đo tần suất... Trường ĐH YTCC Việc phân nhóm cũng cần thiết cho biến số phân loại hay biến số rời rạc nếu các biến số này có chứa một số lớn các nhóm (thí dụ như học vấn, nghề nghiệp, số lần mang thai) Số nhóm được phân chia phụ thuộc vào từng loại biến số: đối với biến số phơi nhiễm cần phân chia thành nhiều nhóm hơn đối với biến số gây nhiễu hay biến số thay đổi tác động Lưu ý: Đối với biến số phơi nhiễm, khi chúng... cho kết quả hằng định với kết quả của phân tích hồi quy logistic Trong nghiên cứu bệnh chứng, tỉ số số chênh thưòng được dung để đo lường tác động mặc dù nó có thể ước lượng cho tỉ số nguy cơ hay tỉ số tỉ suất, phụ thuộc vào phương pháp chọn lựa nhóm chứng 3.6 Phân tích đơn biến Sau khi đã xác định các đo lường cần phân tích, thông thường nhà nghiên cứu sẽ đặt câu hỏi: Quy trình phân tích sẽ như thế... xem xét từng yếu tố tương tác một để tránh những mô hình quá phức tạp với nhiều tham số Kết luận Chiến lược phân tích số liệu đóng vai trò quan trọng trong phân tích số liệu nghiên cứu Nhà nghiên cứu cần lưu ý, mọi phân tích đều đi từ mục tiêu nghiên cứu Nói cách khác, mục tiêu nghiên cứu phải dẫn đường cho các phân tích về sau 15 ... với phân tích thô đơn biến, sử dụng các phương pháp cổ điển để xem xét sự liên quan giữa kết cuộc và các yếu tố phơi nhiễm quan tâm và bỏ qua các biến số khác Mặc dù phân tích này sẽ bị thay thế bởi các phân tích phức tạp hơn và có xem xét đến tác động của các biến số khác, phân tích đơn biến vẫn có ích lợi vì: i) Xem xét các bảng phân tích đơn Æ cho người nghiên cứu những thông tin hữu ích về bộ số liệu; ... đưa vào biến số gây nhiễu Khi phân tích với nhiều biến số, nhà nghiên cứu sẽ đặt câu hỏi: nên đưa các biến số nào vào phân tích để kiểm soát các gây nhiễu? Một số quy tắc có thể áp dụng được gợi ý sau đây: i) Thông thường sẽ có hai hay ba biến số được cho là các biến số gây nhiễu quan trọng (những biến số này đuợc gọi là biến số gây nhiễu trù định - a priori confounders, hoặc là biến số gây nhiễu tiềm... nhiễu làm thay đổi ước lượng tác động Khi đó phân tích cuối cùng thưc hiện việc kiểm soát các biến số gây nhiễu trù định với các biến số gây nhiễu bổ sung có tác động Không cần thiết phải đưa tất cả các biến số gây nhiễu vào phân tích cuối cùng bởi vì một số biến số gây nhiễu không làm thay đổi ước lượng tác động của biến số phơi nhiễm quan tâm nếu đã được kiểm soát cho các biến số gây nhiễu khác Lưu... chọn lựa và tỉ số tỉ suất là số đo tác động được chọn lựa Đối với nghiên cứu thuần tập dựa trên nguy cơ và để nghiên cứu bệnh hiện mắc, tỉ số nguy cơ sẽ được xem là dễ lí giải hơn tỉ số số chênh Tuy nhiên tỉ số số chênh thường được sử dụng do tính chất thống kê của các thao tác dựa trên tỉ số số chênh là tốt hơn Bởi vì hồi quy logistic thường được sử dụng để ước lượng tỉ số số chênh, tỉ số số chênh cũng... có 3 hay ít hơn các biến số gây nhiễu thì chỉ cần sử dụng phương pháp cổ điển là đủ Trong trường hợp này, lần lượt phân tầng cho từng biến số và sau đó phân tầng cho đồng thời các biến số để xem các ước lượng tác động thay đổi như thế nào Chiến lược này đủ để loại bỏ hầu hết các ảnh hưởng gây nhiễu Khi số các biến số gây nhiễu là quá lớn và không thể kiểm soát bằng phương pháp phân tầng đơn thuần, phương... phương trình hồi quy (giả định không có hay chỉ có ít tương tác giữa các biến số gây nhiễu) sẽ có giá trị Phân tích hồi quy: Bước 1: Bước đầu tiên của phương pháp mô hình là lập lại những phân tích đơn giản và kiểm tra xem kết quả có phù hợp với phân tích phân tầng đơn giản hay không Bước 2: Sau đó có thể xây dựng các mô hình phức tạp hơn bao gồm: - Biến số phơi nhiễm hoặc các biến số phơi nhiễm quan tâm;

Ngày đăng: 16/11/2016, 15:41

Xem thêm: Chiến lược phân tích số liệu định lượng

TỪ KHÓA LIÊN QUAN

Mục lục

    CHIẾN LƯỢC PHÂN TÍCH SỐ LIỆU

    Hình 1. Khung lý thuyết ví dụ

    2. Lựa chọn các kỹ thuật phân tích

    3.1. Biên tập số liệu

    3.2. Mô tả số liệu

    3.3. Phân loại biến số

    3.4. Rút gọn số liệu

    3.5. Đo lường tác động

    3.6. Phân tích đơn biến

    3.7. Kiểm soát các yếu tố gây nhiễu

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w